2
follow
4054
views

datafocus中有哪几种数据清洗的方式?

You haven't logged in yet! only 1 answers can be viewed temporarily

go Sign in! No accountgoregister

DataFocus 初级会员 User from: 浙江省杭州市
2020-05-29 13:33

 清洗分为两种,一种是由计算机遵循一定的规则对数据进行校验,自动对数据进行一致性检查和无效值、缺失值的处理,还有一类就是需要筛选过滤掉那些不符合要求的数据,因为这一部分可能会影响分析结果的准确性,需要人工依据数据和场景进行筛选过滤了。数据分析系统中所说的数据清洗大多是指第一种,后一种更倾向为成为ETL模块(DataFocus支持两种清洗方式)。 一般来说,数据清理是将数据精简以除去重复记录,并使剩余部分转换成标准可接收格式的过程。数据清理标准模型是在数据导入过程中,通过一系列步骤“ 清理”数据,然后以期望的格式输出清理过的数据。数据清理从数据的准确性、完整性、一致性、惟一性、适时性、有效性几个方面来处理数据的丢失值、越界值、不一致代码、重复数据等问题。

About the author

Problem dynamics

Release time
2020-04-16 14:57
Update time
2020-05-29 13:33
Focused
2 people pay attention to

Related issues

什么是层次数据可视化?
某市Wifi热点数据
每年失踪数据集
datafocus中的历史问答可以显示温度的单位吗?
苹果股票数据集
datafocus可以实现数据的自动采集吗,例如对考勤数据进行自动采集,并在系统生成考勤异常数据?
每小时SMPS测量数据集
学大数据应该怎么入门?
对数据表进行了关联,但是在进行搜索时,其中一个数据表的数据没有查询出来,需要如何排查出错原因?
在用关键词进行搜索分析时,如何看到某数据在每月之间的对比情况或规律?

Site announcement

DataFocus V6产品升级发布会:大模型的杀手级应用,来了!
北京时间,2024年1月26日 - 在这个数据驱动的时代,高效、准确的数据分析工具对于企业决策的重要性不言而喻。作为中国领先的AI搜索式数据分析平台,DataFocus一直致力于为用户提供更智能、更敏捷的数据分析解决方案。今天,DataFocus在杭州隆重举办了V6产品升级发布会,向全球用户展示了其...

hot topic

项目

柱状图

DFCloudKit小工具

BI

数据仓库

Popular column

数据分析模型探讨研究