来源
kaggle数据网;
数据集信息
数据量:12142行;属性数量:20;领域:生物学;
背景
遗传也称为继承或生物遗传,是指亲代表达相应性状的基因通过无性繁殖或有性繁殖传递给后代,从而使后代获得其父母遗传信息的现象;
数据字段
female_id:每位女性都有一个唯一的ID;文本数据;
male_id:每个男性都有一个唯一的ID;文本数据;
cycle_id:分配给每个女性发情周期组合的唯一编号;文本数据;
consort:如果有机会,雌雄配对是否为(1)(0);分类变量;
conceptive:发情周期是否导致构想(1)(0);分类变量;
female_hybridscore:代表阿努比斯狒狒血统的女性基因组比例的估计值;连续变量;
male_hybridscore:代表阿努比斯狒狒血统的男性基因组比例的估计值;连续变量;
female_gendiv:对女性遗传多样性的估计;连续变量;
male_gendiv:估计男性的遗传多样性;连续变量;
gen_distance:可能配对的男性和女性之间的遗传距离的估计;连续变量;
female_age:可能配对中的女性年龄;连续变量;
male_rank:潜在配对中男性的序数等级;连续变量;
female_rank:潜在配对中女性的序数等级;连续变量;
males_present:可能配对的组中存在的成年男性的数量;连续变量;
females_present:可能配对的组中存在的成年女性的数量;连续变量;
male_rank_transform:按顺序转换的男性等级,以反映对访问优先权模型的适合度(给定的男性数量);连续变量;
gen distance:遗传距离估计变换,以检验配偶概率是否随遗传距离和遗传相似性而降低;连续变量;
rank_interact:潜在配偶对中男性等级和女性等级的乘法相互作用;连续变量;
assort_index:配对交配指数,根据可能配对的雄性和雌性的杂种分数计算得出;连续变量;
female_age_transform:转换女性年龄以测试最大生育能力(中年)女性的配偶行为的可能性更高;连续变量;
业务理解
分析遗传距离会影响交配概率吗;
引用调用
无
这家伙很懒,还没有设置简介