大数据分析中,有哪些常见的大数据分析模型?
最近经常看到有很多人都在推荐DataFocus,我就也去官方网站学习、研究了DataFocus的八大分析模型。这八大分析模型分别是留存分析、粘性分析、全行为分析、漏斗分析、事件分析、用户分群画像等,所有的视频都是免费的,而且画面很清晰,看得出来还是花了心思的。视频内容质量还是不错的,但是这些都是偏基础的数据分析,一般是主要用于日常公司运营,如果需要进阶的话,还需要了解一些别的更专业的数据分析模型。
接下来的篇幅,就主要和大家介绍一下比基础的八大分析模型更高阶的数据分析模型。
1、相关分析
相关分析,顾名思义,主要是研究两个或两个以上的变量之间的相关关系的统计分析模型。相关分析可以按照相关程度,简单分为完全相关、不完全相关和不相关,可以借助散点图和直接坐标系进行分析,将收集到的成对数据“点”在直角坐标系上,然后观察散点的分布情况,进而得出相关关系。
2、离群值检验
由于数据可能存在非常极端的情况,也可能是因为记录失误、观测有误等等情况,造成数据出现偏差,与其他值相差甚远,这种情况下出现的个别数据,我们可以称之为离群值。离群值的出现可能会造成数据误差,针对离群值数据应该及时发现并进行修改或舍弃。
3、聚类分析
聚类分析其实就是将收集的数据进行分组,按照特定的分类规则聚集到一起。现在最常用的聚类分析的分类规则主要有K-均值聚类分析、K-中心点聚类分析等。
4、回归分析
回归分析包含的内容非常复杂,有线性回归、逻辑回归、多元线性回归、岭回归等等,当然其中用处最广的就是线性回归了。回归分析是一种非常实用的数据建模分析技术,通常是广泛应用于预测未来数据,研究时间序列数据中自变量和因变量的因果关系。
5、方差分析
方差分析其实就是用于多个样本均数之间区分其差异的显著性检验。简单来说,方差分析就是查验一列离群值数据之间的波动情况的,检测该列数据与其均值之间的偏差情况。当然这里说到的方差分析就是最简单的单因素方差分析,还有更负责的多因素方差分析、协方差分析等等,其中还设计到假设检验、F检验、均值检验等等。
除了上面提及的各种检验,统计学还包括抽样、T分布、正态分布、参数检验等等,感兴趣的小伙伴可以自己去进行系统的学习。
暂无评论