来源
kaggle数据网;
数据集信息
数据量:2279行;属性数量:21;领域:彩票;
背景
彩票,也称奖券,以抽签给奖方式进行筹款,并非是赌博。彩票的英文名为“lottery ticket”。《辞海》(1999年版)对彩票是这样解释的:“俗称‘白鸽票’。以抽签给奖方式进行筹款或敛财所发行的凭证”;
数据字段
Id:序号;文本数据;
Data Sorteio:开奖日期;日期变量;
1ªDezena:第一个开奖号码;分类变量;
2ªDezena:第二个开奖号码;分类变量;
3ªDezena:第三个开奖号码;分类变量;
4ªDezena:第四个开奖号码;分类变量;
5ªDezena:第五开奖号码;分类变量;
6ªDezena:第六开奖号码;分类变量;
Arrecadacao_Total:本轮彩票从所有投注者收集的总数;连续变量;
Ganhadores_Sena:在这一轮中至少击中六个数字的获胜者数量;连续变量;
Cidade:获胜者所在的城市;文本数据;
UF:获胜者的状态;分类变量;
Rateio_Sena:为获胜者分配的价值;连续变量;
Ganhadores_Quina:赢得五个数字的获胜者数量;连续变量;
Rateio_Quina:为五个数字的获胜者分配的价值;连续变量;
Ganhadores_Quadra:赢得四个数字的获胜者数量;连续变量;
Rateio_Quadra:为四个数字的获胜者分配的价值;连续变量;
Acumulado:“是/否”字段,用于告知本轮是否具有下轮累积的值;连续变量;
Valor_Acumulado:如果没有人赢得本轮比赛,则累积到下一轮的货币价值;连续变量;
Estimativa_Prêmio:总奖金的估算;连续变量;
Acumulado Mega da_Virada:一种用于彩票的特殊形式的累积价值连续变量;
业务理解
分析数字的出现概率以预测下期开奖号码;
引用调用
无
这家伙很懒,还没有设置简介