来源
kaggle数据网;
数据集信息
数据量:32562行;属性数量:15;领域:社会科学、就业;
背景
该数据从美国1994年人口普查数据库抽取而来,可以用来预测居民收入是否超过50K/年;
数据字段
age:年龄;连续变量;
workclass:工作类型;分类变量;
fnlwgt:公司编号;文本数据;
education:教育;分类变量;
education.num:教育编号;分类变量;
marital.status:婚姻情况;分类变量;
occupation:专业;文本数据;
relationship:关系;分类变量;
race:种族;分类变量;
sex:性别;分类变量;
capital.gain:资本收益;连续变量;
capital.loss:资本损失;连续变量;
hours.per.week:每周工作时长;连续变量;
native.country:祖国;分类变量;
income:收入;连续变量;
业务理解
分析不同婚姻状况工作人数分布;分析不同种族工作人数分布;
引用调用
无
这家伙很懒,还没有设置简介