在数据可视化的过程中,如果需要用可视化图表来展示数据结果,那么我们必定会借助一款可视化工具来实现。这里我们以DataFocus工具为例,介绍一下如何制作有趣好看的数据可视化图表,来满足我们日常工作中可能遇到的实际场景。
首先介绍一下,DataFocus中包含了非常丰富的图表类型,能够满足日常分析的绝大部分可视化需求,并且具有超强的个性化设置。用户根据需求字段进行搜索,系统会自适应出图,用户也可以对系统选择的图表类型进行切换,以满足美观、新鲜等特点。
举一个简单的例子:
词云图适用于一个属性列和一个数据列的二维数据结构,属性列作为类别进行比较,数值列显示为词云图中字符的大小。词云图一般用于显示词汇出现的频率,词汇较大的就是出现频率较高的,词汇较小的就是出现频率较低的,这样可以使用户一目了然,直接看到词频最高的几个类目,比较适用于分类变量数据。
还有:
位置图适用于一个属性列(必须是省份数据)和一个数据列的二维数据结构。位置图适用于有空间位置的数据分析,因为涉及行政区域,最好在特殊状况下使用。当原始数据中存在地理省份信息的数据时,就可以利用位置图来更加形象地表示。若数据中还存在省份下各城市数据的话,可以利用DataFocus系统的下钻功能,观察某省份下的各城市具体情况。
数据可视化图形除了可以好看有趣之外,最主要的还是需要符合简单的统计学逻辑,这里可以给大家简单讲解一下。比如,柱状图适用于一个属性列和一个(或数个)数据列的二维数据结构,利用图形高度反映数据的差异,效果直观。当变量数目较少时,可以选用柱状图,在变量有多个时,可以将每一类别由一根柱变成多根柱。柱状图一般排序后使用,效果更佳,同时适合基于分类或时间类型的数据。
折线图适用于一个属性列和一个(或数个,数个时通过图例选中不同的显示效果)数据列的二维数据结构,适用于基于时间的数据,也就是我们常说的时序数据,最好是连续型的数据类型,这时候可以非常明显的看出变量随时间的走势变化,举个简单的例子,比如股票数据,基本都是用折线图表示。
饼图适用于一个属性列和一个(或数个,有多个数据列时生成多环饼图)数据列的二维数据结构,多用来展示不同类别的占比情况和比例,显示各项的大小与占总体的比例,能够明确直观地显示比例情况,多适用于用户群体倾向和渠道来源等场景。说到分布构成,都会不由自主的想到饼图,饼图适用于数据差异较明显的情况下,可以用饼图来展示简单的占比关系,可以显示饼图中各元素占整个元素总和的比例。
散点图适用于一个属性列和一个(或数个,数个时通过图例选中不同的显示效果)数据列的二维数据结构,多用来观察各个数据点之间的关系以及分析变量之间的联系,还可以直观的看出数据的分布情况以及特殊的离群值。
散点图也经常被称为“相关图”,是由两个数值变量在x、y轴上的交叉点绘制而成的图表,一般是针对离散型的数据,可以观察数据集中情况,也可以将这些散点进行大致连接,拟合辅助离散数据的线性回归。
诸如此类的图形还有很多,感兴趣的小伙伴可以直接千万DataFocus官网进行试用,尝试一下自行制作这些图表。
这家伙很懒,还没有设置简介