来源
kaggle数据网;
数据集信息
数据量:6348行;属性数量:37;领域:体育、博彩;
背景
赛马在香港是一项巨大的业务,而且赌注数量巨大,这是一份香港赛马的数据;
数据字段
race_id:种族的唯一标识;文本数据;
date:比赛日期;日期变量;
venue:场地;文本数据;
race_no:当天的比赛中的比赛编号;文本数据;
config:跑道配置;分类变量;
surface:表示跑道表面类型;分类变量;1 =污垢,0 =草皮;
distance:比赛距离;连续变量;
going:跟踪情况;文本数据;
horse_ratings:可能参加这场比赛的马匹等级范围;文本数据;
prize:奖金;连续变量;
race_class:代表比赛类别的数字;分类变量;
sec_time1:比赛负责人到达第一个截面点终点的时间(秒);连续变量;
sec_time2:比赛负责人到达第二个断点终点的时间(秒);连续变量;
sec_time3:比赛负责人到达第3截点终点的时间(秒);连续变量;
sec_time4:比赛负责人到达第4截点终点的时间(如果有)(秒);连续变量;
sec_time5:比赛负责人到达第4截点终点的时间(如果有)(秒);连续变量;
sec_time6:比赛负责人到达第四部分终点的时间(如果有)(秒);连续变量;
sec_time7:比赛负责人到达第四部分终点的时间(如果有)(秒);连续变量;
time1:比赛负责人仅在第一部分花费的时间(秒);连续变量;
time2:比赛负责人仅在第二部分花费的时间(秒);连续变量;
time3:比赛领队仅在第三部分花费的时间(秒;连续变量;)
time4:比赛负责人仅在第四部分花费的时间(如果有)(秒);连续变量;
time5:比赛负责人仅在第五部分花费的时间(如果有)(秒);连续变量;
time6:比赛负责人仅在第六部分花费的时间(如果有)(秒);连续变量;
time7:比赛负责人仅在第七部分花费的时间(如果有)(秒);连续变量;
place_combination1:放置马匹(第1个);文本数据;
place_combination2:放置马匹(第2个);文本数据;
place_combination3:放置马匹(第3个);文本数据;
place_combination4:放置马匹(第4个);文本数据;
place_dividend1:已支付的位置红利(针对位置组合1);连续变量;
place_dividend2:已支付的位置红利(用于位置组合2);连续变量;
place_dividend3:已支付的位置红利(用于位置组合2);连续变量;
place_dividend4:已支付的位置红利(用于位置组合2);连续变量;
win_combination1:胜利马;文本数据;
win_dividend1:支付的获胜股息(用于wincombination1);连续变量;
win_combination2:联合胜马;文本数据;
win_dividend2:支付的获胜股息(对于wincombination2);连续变量;
业务理解
分析每次赛马比赛的获胜的几率;
引用调用
无
资源
赛马数据.csv
这家伙很懒,还没有设置简介