来源
kaggle数据网;
数据集信息
数据量:6666行;属性数量:20;领域:新闻媒体;
背景
该数据集包含了热门话题的真实性信息;
数据字段
uuid:编码;文本数据;
ord_in_thread:线程;文本数据;
author:作者;文本数据;
published:发表日期时间;文本数据;
title:标题;文本数据;
text:文本;文本数据;
language:语言;文本数据;
crawled:日期时间;文本数据;
site_url:网址;文本数据;
country:国家;文本数据;
domain_rank:域名排名;连续变量;
thread_title:线程标题;文本数据;
spam_score:垃圾邮件评分;连续变量;
main_img_url:主图像网站;文本数据;
replies_count:计数;连续变量;
participants_count:参与者人数;连续变量;
likes:喜欢人数;连续变量;
comments:注释次数;连续变量;
shares:分享人数;连续变量;
type:类型;分类变量;
业务理解
分析哪种类型的话题虚假性最高;
引用调用
无
这家伙很懒,还没有设置简介