养老保险再分配效应数据、变量与测算方法
回顾已有的养老保险再分配效应的实证研究,定量分析所使用的数据基本源于两种类型:微观的个人调查数据和宏观的汇总数据。根据数据来源的不同特征,研究者使用数据的方法和变量的操作定义也不尽相同。本书使用微观个人调查数据,根据需要,可以利用此数据作出个人的工资预测值,以此为缴费工资,计算个人终生养老金缴费总额,并与终生养老金领取总额相比,来考察养老金的收益和转移状况。
第一节 数据来源和变量定义
本书使用国家统计局2009年城市住户调查数据。从全国31个省、直辖市、自治区(不包括港、澳、台,下同)中随机抽取了一万户记账户,经过加权和一些数据处理,最后形成39382个样本的数据库。根据研究需要,把缴纳了社会保险费的人认定为参与社会养老保险的人,因此在个人样本数据库中只选取缴纳了养老社会保险费的人,也就是参加社会养老保险的人,共有9134人,然后再除去军人和已经退休的人。我们假定男性60岁退休,女性55岁退休[1],所以只选取男性为20~59岁,女性为20~54岁的就业人口,最后得到8414人的个人数据库,其中男性为4825人,女性为3589人。由于行政机关单位和某些事业单位人员不缴纳社会养老保险费,因此样本中不包括党政机关行政单位人员和不缴纳社会养老保险费的事业单位人员。
年龄按照调查定义的被调查人的公历出生年月计算。为统计需要,本书又将年龄每5岁分为一组,共分成8组。由于年龄20~24岁组和25~30岁组的人数较少,所以将这两组合并,同样,也将50~54岁组和55~59岁组合