1 answer
首先介绍几个我比较常用的数据收集的网站。
1、国家数据
和国家统计局一样,是一个收集全国整个年度的一些基础指标数据的网址,里面的数据内容类似于统计年鉴,里面的数据可以下载,也可以复制到本地的Excel文件中。但由于是国家统计局收集的数据,更加偏向国家基础指标,若要进行数据分析,可能需要进行丰富以及数据清洗。
2、Kaggle
准确来说,其实这是一个专注于竞赛的网站,里面的数据集含量异常丰富,几乎可以找到各种类型的数据集。而且这个网站中的数据集不仅仅只有数据,还包括了上传该数据文件的作者对该数据集进行的一系列分析。如果你想要上手尝试数据分析,又不知道去哪儿找数据,也不知道该做什么分析,可以去这个网站逛一逛。
3、UCI机器学习
这里的数据集都非常适合进行机器学习,一般需要进行深度的数据挖掘的数据集就可以来这个网站上寻找,著名的鸢尾花案例就可以从这个网站找到数据集。现在可能是需要爬墙才能进入看到数据,我也不太确定~
有了数据集之后的工作就是进行数据处理和分析了,这时候就需要介绍一些实用的可视化工具了。
1、Tableau
Tableau的可视化效果做的非常好,有些图表做出来有特效的既视感,可以说是很戳我的心了。但是这款软件并不免费,而且这个收费有点高,若是作为一款日常使用的BI产品,贫穷学生党表示负担不起。而且这款软件的可视化效果很强,但是实际上手操作还是有一定的难度的,需要要比较多的时间去仔细学习。
2、帆软
帆软旗下的FineBI也是一款很优秀的BI产品,是一家有很多年研究经验的网络公司。现在市面上也有很多的合作伙伴。FineBI的图表可视化能力处于中等,并不算特别突出且帆软的要价确实是偏高,感觉并没有非常实惠。
3、DataFocus
DataFocus是一款致力于中文自然语言搜索的BI产品。我最喜欢这款产品的地方在于,它没有上面两个产品那么多的分不清功能的版本,可供试用的就是标准版或mini版,不用区分数据分析的版本、驾驶舱版本、移动端版本等等。安装步骤十分明确,同时后续的操作界面非常简洁,大部分的功能都可以一目了然;主推的搜索式分析也是很有特色,容易上手;数据权限部分分配的非常细致,完全不用担心数据安全问题。这款BI是我最推荐的,毕竟性价比很高、可视化效果强且操作简单,是一款很实用的BI产品了~~~
This guy is lazy,Introduction has not been set