就是为什么要进行数据预处理
实际应用中原始数据通常存在哪几个方面的问题
答案:1 悬赏:70 手机版
解决时间 2021-04-30 16:23
- 提问者网友:留有余香
- 2021-04-29 16:30
最佳答案
- 五星知识达人网友:一叶十三刺
- 2021-04-29 17:50
1,杂乱性
原始数据是从各个实际应用系统中获取的(多种数据库、多种文件系统),由于各应用系统的数据缺乏统一标准和定义,数据结构也有较大的差异,因此各系统间的数据存在较大的不一致性,往往不能直接拿来使用。
2.重复性
重复性是指对于同一个客观事物在数据库中存在其两个或两个以上完全相同的物理描述。由于应用系统实际使用中存在的一些问题,几乎所有应用系统中都存在数据的重复和信息的冗余现象。
3.不完整性
由于实际系统设计时存在的缺陷以及一些使用过程中人为因素所造成的影响,数据记录中可能会出现数据属性的值丢失或不确定的情况,还可能缺少必须的数据而造成数据不完整。实际使用的系统中,存在大量的模糊信息,有些数据设置还具有一定的随机性质。
原始数据是从各个实际应用系统中获取的(多种数据库、多种文件系统),由于各应用系统的数据缺乏统一标准和定义,数据结构也有较大的差异,因此各系统间的数据存在较大的不一致性,往往不能直接拿来使用。
2.重复性
重复性是指对于同一个客观事物在数据库中存在其两个或两个以上完全相同的物理描述。由于应用系统实际使用中存在的一些问题,几乎所有应用系统中都存在数据的重复和信息的冗余现象。
3.不完整性
由于实际系统设计时存在的缺陷以及一些使用过程中人为因素所造成的影响,数据记录中可能会出现数据属性的值丢失或不确定的情况,还可能缺少必须的数据而造成数据不完整。实际使用的系统中,存在大量的模糊信息,有些数据设置还具有一定的随机性质。
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯