聚类技术是在没有或不用样本所属类别信息的情况下,依据样本集数据的内在结构,在样本之间相似性度量的基础上对样本进行分类的方法,其目标是簇内的样本相互之间是相似的,即簇内样本之间的距离小;不同簇中的样本是不同的,即簇间样本之间的距离大。这样,聚类技术就可以把大数据集合中相似度较高的对象聚集在一起,而把相似度较低的对象区分开来。
刘伟江: 吉林长春人,经济学博士。吉林大学商学院副教授,硕士生导师。目前主要研究领域为电子商务、数据挖掘等。2007年8月至2008年8月在美国得克萨斯大学商学院做访问学者。曾参与吉林省委组织部经济干部处领导干部综合素质考评、榆树市医院管理信息系统、长春某企业数据挖掘等项目的研制工作。在国内外有影响的核心刊物上发表论文10余篇。