您好,欢迎来到皮书数据库! | 皮书网首页
登录|注册 |无障碍阅读
国家知识资源服务中心 CARSI
图表库
图片名称: 黄河流域碳达峰聚类的指标特征  | 
出版时间: 2022年10月

黄河流域碳达峰的聚类分析

黄河流域横跨东中西,黄河流经九个省区,不同省区的经济发展、生态保护存在显著差异,即使在同一省区内,各城市的发展水平和生态禀赋也明显不同。在2030年前碳达峰目标的指引下,有必要采取分类的思路,对黄河流域碳达峰进行聚类分析。

一 聚类分析的原理与方法

对于纷繁复杂的对象,人们往往会通过同种属性的划分来加以区分认识。聚类分析是一种较为常用的方法,旨在通过分析样本或指标的相似程度,将相似程度较大的聚合为同类。聚类方法包括层次聚类、K均值聚类、模糊聚类、图论聚类等,常用的为层次聚类和K均值聚类。[1]

(一)聚类分析的基本原理

聚类分析的基本思路在于通过研究样本或指标的相似程度或亲疏关系,按照相似性进行分类,其中按照样本的分类叫作Q型聚类,按照指标的分类叫作R型聚类。通常,用相似系数或距离来度量相似性。

假设有m个样本,每个样本有n个指标,那么就可以形成m×n的矩阵,可以通过举例来度量样本的亲疏程度。距离可以表达为:

其中,xik表示第i个样本的第k个指标,dij表示第i个样本和第j个样本之间的距离,这个距离也称为明考斯基(Minkowski)距离。q为变换系数,当其取不同值时,这个距离也会有所差异,比如当q=1时,就变成了绝对值距离,当q=2时,就变成了欧氏距离,当q=∞时,就变成了切比雪夫距离。

不过,由于多个指标的单位存在差异,而且没有考虑指标的关联性,明考斯基距离仍然存在一些缺陷。一个改进方法是