随着经济的发展,上海市作为特大城市,吸引了大量的外来人口,是全国最主要的外来人口聚集城市之一。根据上海市人口管理办公室(以下简称上海市人口办)的统计,截至2014年6月30日,上海市来沪人员总数达1100.1万人,占上海市总人口的42.8%;与2010年第六次全国人口普查时的346.5万人相比,共增加了753.6万人,增长了2.17倍;平均每年增加53.8万人,年平均增长率15.5%。如此大规模的外来人口给上海市的社会经济发展带来了巨大的影响,也对城市的社会管理和社会服务提出了新的要求,了解和掌握上海市外来人口的现状和特点对于制定城市发展规划和加强城市管理具有十分重要的意义。
上海市人口办对外来人口有详细的登记记录,对于了解外来人口现状具有重要作用。但是,外来人口本身的特点给登记数据的准确性带来了一定影响。外来人口是一个变化迅速的群体,他们由于工作原因,早出晚归,频繁更换住地,行踪很难掌握;同时,他们普遍存在三怕(怕麻烦、怕处罚、怕交费)心理,有意躲避、瞒报,使得登记难度很高;外来人口的登记还常常受到管理部门政策偏好的影响,“多登”“漏登”情况普遍存在。以上原因使外来人口数据普遍存在很大的偏差,尤其是不同部门登记口径差别很大,不同部门提供的资料往往相互矛盾,现行的外来人口登记系统难以及时准确地反映外来人口的变动情况。
为了准确了解上海市外来人口的最新特点和发展变动趋势,对上海市人口办的外来人口登记数据进行比较准确的校正意义重大。上海大学数据科学与都市研究中心依托“上海都市社区调查”(Shanghai Urban Neighborhood Survey,SUNS),对上海市外来人口现状进行深入的调查研究,为上海市人口办的外来人口数据校正提供了很好的参考。
“上海都市社区调查”是以特大城市为对象的大型问卷调查和数据库建设项目,它采用隐分层的多阶段概率与规模成比例(PPS)的随机抽样方法,以街道、居(家、村)委会及家庭户分别作为初级、二级、三级抽样单元。由于上海各街道、乡、镇所处的地理位置、人口密度、社会经济发展状况各不相同,他们所接纳的外来人口在数量上和构成上也各不相同,为使调查样本具有代表性,我们按照市中心区、新市区、郊县,以及各街道社会经济发展水平以及外来人口比重,对上海所有街道、乡、镇进行排序,形成隐分层,第一期调查从中抽取10%,共540个村居进行村居组织层面的调查,并对其中60个街道120个居(家、村)委会中的3500户家庭进行家庭和个人层面的调查。
“上海都市社区调查”的抽样利用的是上海市人口办提供的基础数据,因此我们对于样本村居在总体中的代表性可以做很好的估计。同时,对于这些村居和家庭成员登记的人口信息,上海市人口办也可以进行很好的统计。而在“上海都市社区调查”的调查问卷设计中,我们对于所调查家庭户的同住成员信息以及家庭成员直系亲属关系亦有所涉及。通过3张调查表(同住家庭成员表、家庭成员直系亲属关系表、不同住家庭成员表),被调查家庭被要求填写过去6个月内累计一起居住的时间达3个月及以上,或者未来6个月内打算一起住3个月及以上的所有人(包括家庭成员与非家庭成员)的年龄、性别、婚姻状况、受教育程度、经济活动身份、户籍所在地等信息,以及所有同住者的直系亲属(父母、配偶、子女,包括同住与不同住的)的信息。这3个调查表的信息可以完整地构建被调查家庭户的家庭规模、家庭组成、居住安排、常住外来人口情况以及家庭成员外出情况等信息。这些信息将能够比较全面地反映被调查对象的人口信息。
通过这个调查,我们可以做以下两件事情。
第一,通过对120个村居中的3500个家庭的调查信息与登记信息的比照分析,对登记信息的误差进行估计,从而对上海市人口登记信息的准确性做一个评估。
第二,利用调查信息,对上海市外来人口的总体状况进行准确的分析和预测。
在实际的调查中,我们经常会遇到样本结构与总体结构有较大差异的情况。在这种情况下,要想准确地推断出总体的有关信息,一个必要的前提就是对调查的样本进行加权,使得加权后的样本结构尽量接近总体的结构。
加权调整是通过调整样本比重达到解决样本代表性不足和过度问题的方法。调查中的每一个被访者都被赋予一个权重,以使加权后的数据尽可能地代表所研究的总体。加权调整主要包括三个方面,一是对不等抽样概率的调整;二是对调查中由于非抽样误差带来的数据偏差的调整;三是调整样本,使得估计值与已知的总体数值一致。
广义回归估计(GREG)加权法是从调查数据的标准回归分析模型中衍生出来的。该方法通过在回归方程中融合多个辅助变量的已知信息来调整样本权重。每一个被访者都被赋予一个基础权重,这个基础权重跟样本各自的抽样概率有关。基于该基础权重,同时融合各个样本在一些辅助变量的特征定义回归模型,根据回归模型的结果来修改基础权重,获得最终调整后的权重。最终权重的获取主要考虑估计量与外部已知的总体分布一致,同时还需要弥补某种程度上的非覆盖误差。
我们对“上海都市社区调查”数据采用广义回归估计(GREG)加权法进行加权处理。上海市人口办的统计数据作为我们加权的外部已知辅助信息,其他可靠的外部已知总体分布也被收集用于权重调整模型中。
通过“上海都市社区调查”的3张有关同住家庭成员、家庭关系信息的调查表,以及对所获得数据的加权处理,我们可以比较全面地了解上海常住人口包括外来常住人口的现状。
2013年以来,上海市加大了对外来人口的控制与管理力度,并把人口控制的指标逐级分解下达到了区县、街镇和村居,这一方面会对外来人口的控制产生一定的效果,另一方面也会对政府主导的外来人口信息采集工作产生影响,造成信息失真。本研究利用“上海都市社区调查”的数据,通过对调查数据与人口管理部门登记信息进行比对,可以更好地对外来人口的总体变动情况进行准确的估计,从而对上海市外来人口管理政策的效果进行准确的评估,为下一步制定更加科学有效的外来人口服务与管理政策提供依据。