数据预处理是指在主要的分析、运算之前对数据进行的一些处理。这些预处理包括填写空缺值、去掉数据之间的不一致性等。之所以要进行这些预处理,是因为现实世界中的数据很多都是不完整、不一致的脏数据,即存在数据质量问题。
刘伟江: 吉林长春人,经济学博士。吉林大学商学院副教授,硕士生导师。目前主要研究领域为电子商务、数据挖掘等。2007年8月至2008年8月在美国得克萨斯大学商学院做访问学者。曾参与吉林省委组织部经济干部处领导干部综合素质考评、榆树市医院管理信息系统、长春某企业数据挖掘等项目的研制工作。在国内外有影响的核心刊物上发表论文10余篇。