来源
kaggle数据网;
数据集信息
数据量:396行;属性数量:33;领域:教育;
背景
如今高校学生的饮酒现象越发普遍,某些高校曾出台规定禁止高校学生饮酒,以避免因学生酗酒所造成的不良后果。
数据字段
school:学校;文本数据;
sex:性别;分类变量;“ F”-女性或“ M”-男性;
age:年龄;连续变量;
address:地址;文本数据;“ U”-城市或“ R”-农村;
famsize:家庭人数;连续变量;:“ LE3”-小于或等于3或“ GT3”-大于3;
Pstatus:是否与父母同居;分类变量;T”-一起生活或“ A”-分开生活;
Medu:母亲的教育程度;分类变量;0-无,1--初等教育(四年级),2-5至9年级,3-中等教育或4-高等教育;
Fedu:父亲的教育;分类变量;0-无,1--初等教育(四年级),2-5至9年级,3-中等教育或4-高等教育;
Mjob:母亲的工作;分类变量;
Fjob:父亲的工作;分类变量;
reason:选择这所学校的理由;分类变量;
guardian:学生的监护人;分类变量;
traveltime:上学回家的时间;连续变量;
studytime:每周学习时间;连续变量;
failures:过去类失败的次数;连续变量;
schoolsup:额外的教育支持;分类变量;
famsup:家庭教育支持;分类变量;
paid:课程主题内的额外付费课程;分类变量;
activities:课外活动;分类变量;
nursery:上过托儿所;分类变量;
higher:想要接受高等教育;分类变量;
internet:在家上网;分类变量;
romantic:具有浪漫关系;分类变量;
famrel:家庭关系的质量;分类变量;数字:从1-非常低到5-非常高;
freetime:放学后的空闲时间;分类变量;数字:从1-非常低到5-非常高;
goout:与朋友外出;分类变量;数字:从1-非常低到5-非常高;
Dalc:上学喝酒量;分类变量;数字:从1-非常低到5-非常高;
Walc:周末喝酒量;分类变量;数字:从1-非常低到5-非常高;
health:健康状况;分类变量;数字:从1-非常低到5-非常高;
absences:缺勤数;连续变量;
G1:第一期成绩;连续变量;
G2:第二阶段成绩;连续变量;
G3:最终成绩;连续变量;
业务理解
分析学生饮酒量与哪些因素相关;
引用调用
无
这家伙很懒,还没有设置简介