文章详细页面

如何进行倾向值匹配?——以大陆城市居民的教育回报为例
在线阅读 收藏

在第2章中,我们在鲁宾的反事实框架下详细介绍了倾向值匹配方法的基本原理。倾向值匹配方法通过模型预测个体接受某种处理变量影响的概率,然后按照倾向值相近的原则将实际生活中接受了某种处理变量影响的个体和没有接受这个处理变量影响的个体进行匹配。在得到一个匹配样本之后,研究者可以通过各种统计方法(例如回归模型、方差分析等)来探索处理变量和因变量之间的关系。此时,我们可以认为这种关系是在一种类似于随机实验的环境下建立起来的,从而代表了某种因果关系。

因果推断原理的掌握不应当仅仅停留在统计理论层面上,而是应当应用于社会学具体的研究问题中,这就涉及倾向值方法的实施过程。在这一章中,我们试图通过分析中国综合社会调查(CGSS)2005年的数据来展示如何通过倾向值匹配的方法来分析高等教育对于个体收入的影响,以此和第2章中的原理论述部分形成对照。与第2章相比,本章侧重于介绍操作层面上如何对不同的个体进行匹配,以及在得到匹配样本后的统计分析。具体而言,本章分为四个部分:第一部分从高等教育经济回报的角度简要地回顾倾向值匹配的基本原理。第二部分利用中国综合社会调查(CGSS)2005年的数据展示如何采用不同的匹配方法估计教育的收入回报。第三部分用最小二乘多元线性回归模型(OLS)分析同样的问题,以求将倾向值匹配方法和常用的多元线性回归方法进行对比。最后一部分为小结。

帮助中心电脑版