如何对原始数据进行规范化处理?

Cynthia
Cynthia 这家伙很懒,还没有设置简介

0 人点赞了该文章 · 1812 浏览

提问:

例如,将下图中,原始数据有年龄和工资两列数据,现需要将数据按照最小-最大规范化以及Z-得分标准化的方式缩放到制定范围内,如何进行实现?



实现方式:

一、最小-最大规范化

利用最小最大规范化将数据转换至一个范围内,例如01之间,最小值转换为0,最大值转换为1

这里要借助DataFocus公式中的group_mingroup_max公式;

如下图所示,工资为列名,使用公式group_min求出工资列的最小值,使用公式group_max求出工资列的最大值,然后按照最小-最大规范化的方法进行四则运算;

X_NORM(工资-group_min(工资))/(group_max(工资)-group_min(工资))


效果如图所示:



二、Z-得分标准化(标准化)

Z-得分标准化是基于平均值和标准偏差的尺度数据,也就是利用数据减去平均值的差异除以标准偏差;

这里要借助DataFocus公式中的group_averagegroup_stddv公式;

如下图所示,年龄为列名,使用公式group_average求出年龄列的平均值,使用公式group_stddv求出年龄列的标准差,然后按照Z-得分标准化的方法进行四则运算;

Z_SCORE(年龄-group_average(年龄))/group_stddev (年龄)


效果如图所示。



发布于 2021-03-15 16:57

免责声明:

本文由 Cynthia 原创发布于 DataFocus ,著作权归作者所有。

登录一下,更多精彩内容等你发现,贡献精彩回答,参与评论互动

登录! 还没有账号?去注册

暂无评论

推荐内容

站点公告

DataFocus V6产品升级发布会:大模型的杀手级应用,来了!
北京时间,2024年1月26日 - 在这个数据驱动的时代,高效、准确的数据分析工具对于企业决策的重要性不言而喻。作为中国领先的AI搜索式数据分析平台,DataFocus一直致力于为用户提供更智能、更敏捷的数据分析解决方案。今天,DataFocus在杭州隆重举办了V6产品升级发布会,向全球用户展示了其...

热门话题

全局配置

搜索式

数据仓库

数据搜索

新人报道

热门专栏

数据分析模型探讨研究