聚类技术是在没有或不用样本所属类别信息的情况下,依据样本集数据的内在结构,在样本之间相似性度量的基础上对样本进行分类的方法,其目标是簇内的样本相互之间是相似的,即簇内样本之间的距离小;不同簇中的样本是不同的,即簇间样本之间的距离大。这样,聚类技术就可以把大数据集合中相似度较高的对象聚集在一起,而把相似度较低的对象区分开来。
电子商务,数据仓库,数据挖掘
刘伟江: 女,吉林大学数量经济研究中心教授、博士生导师,研究方向为区域创新与微观经济计量分析。