一般来说,日常监控的数据指标都有其固定的波动周期,周期内的数据变化相对趋于稳定,如果某个时间的数据不再符合预期的稳定变化,数据异常就出现了。数据异常的分析是必要的,往往能够通过异常分析发现未知的机遇和风险。 数据分析中的异常值分析通常使用箱型图分析。箱型图包含六个数据节点,包括上边缘、上四分位书、中位数,下四分位数,下边缘和异常值。箱型图很形象的分为中心、延伸及分布状态的全部范围。箱型图依靠实际数据,不需要假定数据服从特定的分布形式,判断异常值的标准以四分位数和四分位距为基础,识别异常值的结果比较客观。 箱型图除了可以识别数据异常值,还可以粗略估计数据的分布偏态和尾重的部分信息。在几批数据并行排列时,可以比较集中数据的形状。 在DataFocus中选择目标信息列,转换图形为箱型图就可以查看信息列的异常值情况。从下图中可以看到有两个离群点,这两个月的销售数量极其高,后续可以进行进一步分析为什么会发生这种情况。
这家伙很懒,还没有设置简介