商业数据分析与应用训练营(一期)第2天作业练习

制作【医生招聘中间表】
1.将【工作经验字段】拆分为工作经验上限&工作经验下限
2.【职业类别】字段中不需要‘其他’这个列中值,不需要分析,删除行
3.【公司名称】字段存在空值,需要删除整行
4.添加【平均薪资】列
5.【地址】列,不需要精确到区县(例如杭州-上城区转为杭州)。然后在列中值后加上‘市’这个字符(例如杭州转为杭州市)

已邀请:

姓名:李杰
实验目标:将“医生招聘”进行数据处理,并保存为新的数据集
实验过程:
1,拆分工作经验上下限,拆分地址为城和区,把职业为其他转为空值,并筛选删除空值的职业类型和公司名称,建立中间表
/uploads/answer/20210527/74c6e5bda649ae82675e78d7c4057c18.jpg
2,给工作经验下限加年,求平均值,给城加“市”(因为地址里面出现了无城市只有区的情况,需给无城市只有区的情况不加“市”),完成表和公式的截图如下
/uploads/answer/20210527/87fd339ddef901eba43f116a155c2cae.jpg
/uploads/answer/20210527/5fd6578ec11869edc8cb29a4d949569d.jpg
实验小结:拆分的数据项无法被公式直接调取,所以拆分后处理的情况要分两步进行,拆分后新建中间表,然后再处理
今日学习心得:有点累

姓名:刘丽丽
实验目标:1.将【工作经验字段】拆分为工作经验上限&工作经验下限
2.【职业类别】字段中不需要‘其他’这个列中值,不需要分析,删除行
3.【公司名称】字段存在空值,需要删除整行
4.添加【平均薪资】列
5.【地址】列,不需要精确到区县(例如杭州-上城区转为杭州)。然后在列中值后加上‘市’这个字符(例如杭州转为杭州市)

实验过程:


1、将【工作经验字段】拆分为工作经验上限&工作经验下限
/uploads/answer/20210531/cf817b7ae72932aea3b3307949b5bfd5.png
/uploads/answer/20210531/c11debcb9f2d3505756f565b72ac2c33.png
/uploads/answer/20210531/bedd250520990c251047a7a7781b1b2d.png

2.【职业类别】字段中不需要‘其他’这个列中值,不需要分析,删除行
3.【公司名称】字段存在空值,需要删除整行
/uploads/answer/20210531/559169a10ca7e2c328ca1dc7ee511bd3.png

通过问答形式输入职位类别不包含其他,公司不为空实现
4.添加【平均薪资】列
/uploads/answer/20210531/053ed66e10134f7deef574875acd10f0.png
通过公式计算出均值

5.【地址】列,不需要精确到区县(例如杭州-上城区转为杭州)。然后在列中值后加上‘市’这个字符(例如杭州转为杭州市)


/uploads/answer/20210531/0e506ccac30dcfccc39d146af83d0b1f.png

思路是判断地址中是否含有-,如果有截取从开始到-前一个字符和市关联,如果没有直接和市关联 公式:
if contains(地址,”-“ ) then concat(substr(地址,1,strpos(地址,”-“ )-1),”市”) else concat(地址,”市”)

中间表截图如下:
/uploads/answer/20210531/1f5bfaac3af48211ae24698db523c1c7.png

实验小结:
1、在写公式时对于应该concat应该放到if中还是拿到外面试了好久
2、关于平均薪资字段要平均什么有点不太理解

今日学习心得:增加了字段拆分、过滤、公式编写的技能点

姓名:高元恺
实验目标:将“医生招聘”进行数据处理,并保存为新的中间表
1、导入本地EXCEL文件

/uploads/answer/20210603/c440ad4b95444f19fc849b6d25603be9.png

2、选择数据表

/uploads/answer/20210603/6de3fb42a4ffccdf0614a4747b17de79.png

3、将工作年限列拆分为两列

/uploads/answer/20210603/6ab6e61ed6bb3a70650eb1ade0ab6fc9.png

4、将职业类别为其他的排除在外

/uploads/answer/20210603/ea05bd9be9d0dc8f7d0df902d8a36fe4.png


5、点击公司名称列头右侧齿轮,排除空值

/uploads/answer/20210603/5eeb2c8e42454481d6a354d3691e6474.png

6、经观察,城市名都是两个字,截取地址列头两个字,拼接上“市”这个字

/uploads/answer/20210603/e168d8c6c9d0da7ab3c2aa41dd904b01.png

7、将结果保存为中间表成功

/uploads/answer/20210603/5b3e2e10e4c92ab6af9ff300f2432140.png

补充:平均薪资计为最高最低月薪的平均值

/uploads/answer/20210603/8240811b2cc39dab4223941d3863cba6.png

要回复问题请先登录注册