2
关注
4230
浏览

什么是数据清理?

为什么被折叠? 0 个回复被折叠
lwx 注册会员 用户来自于: 浙江省杭州市
2020-09-16 09:56

数据清理是将数据库精简以除去重复记录,并使剩余部分转换成标准可接收格式的过程。数据清理标准模型是将数据输入到数据清理处理器,通过一系列步骤“ 清理”数据,然后以期望的格式输出清理过的数据(如上图所示)。数据清理从数据的准确性、完整性、一致性、惟一性、适时性、有效性几个方面来处理数据的丢失值、越界值、不一致代码、重复数据等问题。

关于作者

问题动态

发布时间
2020-09-16 09:53
更新时间
2020-09-16 09:56
关注人数
2 人关注

推荐内容

怎么查看哪些表之前做过关联关系?
智能洞察怎么使用?
为什么有些表有智能洞察,有些表没有?
智能洞察一般可以分析出哪些结果?其算法可以自定义吗?
如何实现对数据的批量筛选?
能否更改员工的部门(用户组)?
datafocus通过什么方式进行数据清洗啊,有etl工具吗?
有些数据列不需要了,可以删除这些列吗?
创建中间表时,添加关联关系和不添加有什么区别?
柱形图的Y轴10000要改成1万,2万这样怎么设置?

站点公告

DataFocus V6产品升级发布会:大模型的杀手级应用,来了!
北京时间,2024年1月26日 - 在这个数据驱动的时代,高效、准确的数据分析工具对于企业决策的重要性不言而喻。作为中国领先的AI搜索式数据分析平台,DataFocus一直致力于为用户提供更智能、更敏捷的数据分析解决方案。今天,DataFocus在杭州隆重举办了V6产品升级发布会,向全球用户展示了其...

热门话题

搜索功能

可视化大屏

DFCloudKit小工具

新人报道第一次使用

柱状图

热门专栏

数据分析模型探讨研究