2
关注
4955
浏览

datafocus中有哪几种数据清洗的方式?

您还未登录!暂时最多只可查看 1 条回答

登录! 还没有账号?去注册

DataFocus 初级会员 用户来自于: 浙江省杭州市
2020-05-29 13:33

 清洗分为两种,一种是由计算机遵循一定的规则对数据进行校验,自动对数据进行一致性检查和无效值、缺失值的处理,还有一类就是需要筛选过滤掉那些不符合要求的数据,因为这一部分可能会影响分析结果的准确性,需要人工依据数据和场景进行筛选过滤了。数据分析系统中所说的数据清洗大多是指第一种,后一种更倾向为成为ETL模块(DataFocus支持两种清洗方式)。 一般来说,数据清理是将数据精简以除去重复记录,并使剩余部分转换成标准可接收格式的过程。数据清理标准模型是在数据导入过程中,通过一系列步骤“ 清理”数据,然后以期望的格式输出清理过的数据。数据清理从数据的准确性、完整性、一致性、惟一性、适时性、有效性几个方面来处理数据的丢失值、越界值、不一致代码、重复数据等问题。

关于作者

问题动态

发布时间
2020-04-16 14:57
更新时间
2020-05-29 13:33
关注人数
2 人关注

相关问题

如何打通企业内部的数据孤岛?
Datafocus如何保存历史问答?
在处理财务报表数据时,需要对当前表单的部分数据计算后再体现到原来的表中,datafocus可以实现吗?
支持在datafocus中更新数据然后回写到业务数据库中吗?
枪击数据集
DataFocus的内存计算引擎有何特点?
数据看板能够自动更新数据吗?还是需要手动刷新页面?
怎样在图表中显示所有的数据值?
搜索页面可以将数值表以csv的格式进行导出,那么导出的数据是全部数据么?
气候数据分析

热门话题

柱状图

项目

数据看板

搜索功能

新人报道第一次使用

热门专栏

数据分析模型探讨研究

热门用户

datafocusdf8ccc6b4f389bdacbb316

Y2020

camille

DataFocus

datafocus8414cae6c6eedd998c7582