来源
kaggle数据网;
数据集信息
数据量:290行;属性数量:23;领域:教育;
背景
自2012年以来,该报告提供了edX平台上290项哈佛和麻省理工学院在线课程,25万份认证,450万参与者和2800万参与者小时的数据;
数据字段
Institution:机构;文本数据;
Course Number:课程编号;文本数据;
Launch Date:开课日期;日期变量;
Course Title:课程标题;文本数据;
Instructors:课程讲师;文本数据;
Course Subject:课程主题;文本数据;
Year:一年开课次数;连续变量;
Honor Code Certificates:有无荣誉代码证书(1=有,0=没有);分类变量;
Participants (Course Content Accessed):参加课程的学员人数;连续变量;
Audited (> 50% Course Content Accessed):审核课程总数超过50%的参与者人数;连续变量;
Certified:获得认证的参与者人数;连续变量;
% Audited:经审计的百分比;连续变量;
% Certified:认证百分比;连续变量;
% Certified of > 50% Course Content Accessed:获得课程认证的百分比超过50%;连续变量;
% Played Video:播放视频的百分比;连续变量;
% Posted in Forum:在论坛中发布的百分比;连续变量;
% Grade Higher Than Zero:分数高于零的百分比;连续变量;
Total Course Hours (Thousands):总课程时数(每1000);连续变量;
Median Hours for Certification:认证时间中位数;连续变量;
Median Age:参与者的中位年龄;连续变量;
% Male:男性的百分比;连续变量;
% Female:女性的百分比;连续变量;
% Bachelor's Degree or Higher:本科以上学历的百分比;连续变量;
业务理解
分析哪门课程最受学习者的欢迎;
引用调用
无
这家伙很懒,还没有设置简介