文章详细页面

民意调查的方法、要素和品质
在线阅读

张荣显

张荣显,澳门互联网研究学会会长、澳门民意调查研究学会会长,易研方案(澳门)有限公司总监、易研网络研究实验室研究总监,澳门大学社会科学及人文学院传播系助理教授、澳门大学调查研究实验室创立人、澳门互联网研究计划主持人、世界互联网项目成员、世界民意机构(澳门)执行统筹、亚太地区互联网研究联盟副主席。研究范畴涵盖民意调查、公众咨询、网络挖掘、满意度与消费者分析等。

张荣显:各位同学,大家好。今天我演讲的题目是《民意调查的方法、要素和品质》,这个课题跟我的教学内容是相关的,所以今天我也想借此机会跟大家分享一下我在教学和业务方面的一些研究和收获。

首先我简单地介绍一下我所在的机构的情况。我在澳门的两个研究学会工作,一个是澳门互联网研究学会,一个是澳门民意调查研究学会。澳门民意调查研究学会是亚太区民意调查研究联盟的理事成员,是一个由大中华区的专家学者组成的非营利性质的学会,主要是组织一些专业的研讨会,引荐一些外来的研究,意在推动澳门社会调查和民意调查的科学发展。我们现在在澳门、香港、珠海、台湾都设立有分部,建立了信息技术、网络挖掘舆情分析系统等,主要从事民情追踪、政策研究、企业研究、市场研究和数据处理等方面的研究,采用的研究方法也是多种多样,包括大数据挖掘,还有各种社会科学研究方法等。这些都跟我的研究息息相关,我在大学里教授的是研究方法和民意学,我们采用的研究方法有包括定量研究和定性研究在内的多种科学研究方法。另外,我们还自行研发了一些产品,比如用手机来进行面访调查等,也拥有自己的面访调查实验室。除此之外,我们也帮助客户建立自己的实验室,建立社会调查中心,为他们提供咨询和维护服务。

接下来我们谈谈民意。在社会上,每个人都有说话的权利,民意是无处不在的。无论是在商业领域还是社会层面进行的民意调查,其背后的理念也都是一致的。现在的民意调查是很广泛的,比如,大家经常在商场或是街头被拦截填一份问卷,或者是接到电话推销,或者是应同学要求在网站上填问卷。每个人都可以做出一份调查问卷,你可以用Google,设计一份简单的调查问卷挂网上去,也可以通过微信,在微信群里做一些简单的调查。现在,做民意调查的门槛降低了,大家都可以做,由此也就产生了一些问题,民意调查的专业化水平很容易被忽视,调查水平难以提高。民众可能觉得民意调查做起来很简单,但是,当调查结果跟民众想法不一致时,民众就会对调查结果产生怀疑,进而怀疑研究方法是不是出了问题,最终上升到公信力问题。如果你做了一项民意调查,这项调查非常有新闻价值,那么你自己不用做广告,媒体都会争相进行报道。在港澳地区,通常一项民意调查做出来后,都会被登在很重要的版面。媒体记者、编辑不会关注你的数据是怎么来的,你的调查问卷是怎么设计的,只是认为这项调查易于吸引读者的注意力,有新闻价值,所以纷纷对其进行报道。

人可以分为三种:乌合之众、大众和公众。“乌合之众”是情绪上的反映;“大众”是有共同的愿景;“公众”对各类事物的关注是比较明智的,也是比较分散的一类人。每个人都有自己不同的想法,我们在了解民众意见时,应该征求公众的意见,而不是乌合之众的意见,因为他们的意见受情绪的影响比较大。所以,要真正了解一个社会,真正了解民众对事物的真实看法,我们需要多倾听、调查公众的意见。

有很多民意叫“哈哈镜的民意”,就是说你所看到的民意都是变了形的,带有特殊的目的。比如在港澳地区有一家经营生发水的公司,为了推销它们的产品,做了一项调查,得出的结果是90%的女性不喜欢光头的男士。为什么会出现这一调查结果?因为受调查对象都是从这家公司的会员中选取的,为的就是通过这一调查结果告诉秃发男士,90%的女士都不喜欢他们,以此来吸引消费者购买产品。

那么,究竟什么是民意?在国内也叫舆情,就是公众对共同关心的事物所表达出来的意见。简单来说,就是在一个时间节点,人们对于同一个议题的看法。总的来说,民意调查就是通过系统、客观的分析来调查民众对于时事的态度、意见。民意的概念是广义的。

民意调查的特征包括以下几点。第一个是分度和方向。任何调查得出来的结果都有分度或是方向,比如说百分之多少是赞同的,百分之多少是反对的,这就是一个分度。第二个是强度。有人赞同,有人反对,有人稍微赞同,有人强烈反对,是有不同强度之分的,强度在了解民意程度方面是非常重要的。

在进行民意调查时,需要考虑以下一些影响因素。首先是民意的稳定性问题。有句话说“民意如流水”,那些有争议性的话题更容易会随着某些意见或是事件而改变,而有些就会很稳定,比如价值观等;其次,民意所具有的潜伏性要求民意调查要透明化、模式化,通常很多民意调查不是针对一些具体的微观议题,而是关于宏观发展、政策导向的评估。我们经常提到的一个典型案例就是,1996年美国总统大选,克林顿击败老布什,就是因为选民们感觉克林顿带领美国朝着一个正确的方向前进,尽管克林顿本人有一些丑闻,但是民众考虑到他总体的领导方向是正确的,就忽略了他的丑闻。最后,还有议题的重要程度。议题的重要性也会影响到民意调查的分度和强度。

那么,民意调查到底有什么作用呢?看起来好像每个人都能做,真的是这样吗?有些人说,不就是做一个电话调查访问吗?不就是做一个选举预测吗?问一些问题就行了。其实,做民意调查远没有想的那么简单。教科书上也都有讲到,一个调查可以通过面访、电话或是邮寄的方式进行,但是主要的是做什么?是要去访问一些有代表性的少数人或者团体。一般的调查是针对知识、态度、行为的研究,目的是重现研究母体的结果。其实,我们做民意调查就是通过对具有代表性的少数人进行调查研究,来推测对应的母体是什么样的情况,这才是民意调查最核心的部分。

人们会质疑街头访问、网络调研的可信度,通过网上问卷系统做的调查,能保证受调查者是少数具有代表性的人吗?能保证调查结果反映母体的情况吗?大家可以思考一下这个问题。少数具有代表性的人群叫作样本,如果你的调查结果仅仅是反映你所调查的那些人的情况,整个社会又是另一种情况,那么,你的受调查者就不具有代表性,你的调查结果也就不能反映母体的情况。

至于调研方法的选择,定量研究可以通过面访、录入、定点拦截、电脑辅助面访和传统电话访问形式进行调查。所谓传统电话访问,就是调查者把抽出来的电话号码用各自的电话打出去进行调查,现在一般没有人用这种方式进行调查了。现在研究者一般都通过计算机辅助电话调查系统(CATI)进行调查,借助这一系统提高整个流程管理的方便性。自填问卷法包括现场向受调查者派发问卷以及网络调查等。

调查首先要做好前期准备,包括问卷设计、人员培训管理、资源设备的准备、问题数据的处理和抽样等。关于抽样,有一个经典的案例。1936年美国总统大选期间,《文学文摘》杂志通过电话调查对总统大选进行预测,调查样本包括100多万选民,它预测兰登会击败罗斯福,但是最终结果是罗斯福赢了。大选结束不久,这家机构就倒闭了。之前这家杂志做过好多次预测都成功了,为什么这次失败了呢?因为1936年正值美国经济大萧条时期,订阅《文学文摘》杂志的人大部分都支持共和党,而且一般都是有钱人,兰登是共和党的候选人,杂志所做的调查抽样偏向它的受众,所以得出的结果就有偏差。而当时,有一个被称为“民意调查之父”的人,他的调查样本只有几千人,但是是通过随机抽样的方式选取的,受调查者既包括支持共和党的,也包括其他类人群,就成功地对大选结果进行了预测。现在随着抽样的完善,我们用的这些方法都是从当时演变过来的。

什么叫抽样?抽样就是在总体里面抽取出一小部分样本进行调查。但是,在这个过程中肯定会有误差出现,你通过抽取一小部分人来推测另一部分人,这叫抽样误差。我们用少数样本来推测母体情况的时候,会存在几方面误差,所以在解读任何数字的时候都不能给出一个绝对值,只能给一个参考界限。当然,这些误差是很难具体量化的,所以一般是用抽样误差来代表这个界限有多大。它有一个参考点,比如说有65%的受调查者赞成,误差如果是5%的话,应该解读为赞成的民众占60%~70%,有可能是60%,也可能是70%。

理论上抽样跟实际抽样是有很大差别的,因为没办法做到绝对理论化、精确化。比如,现在我们这里有300位同学,我抽50位同学出来,那么,无论是从实际上还是从理论上,结果都是一致的,因为不会漏掉这里的每一个人。但是,在进行社会调查的时候就不能保证了,所以只能采用各种各样的方法使实际情况尽量接近理论。你怎么喝一杯鸡尾酒?不可能服务员一端上来就喝吧,那样的话,可能喝到的是最表层或者是最底层的蜂蜜,你要先搅均匀了,才能喝到真正的味道。同样的道理,在抽样时,做随机抽样,不是随便、随意,而是随机,所谓随机,就是说要均匀。举一个关于六合彩的经典例子。现在有49个号码,每一期拿出6个号码,那么,按照随机抽样原则,每个号码被抽中的概率是相同的,这就是随机抽样。在街头进行拦截式调查可能做到随机抽样吗?不可能。所以,我们一般不将街头拦截式调查作为一种严格的、科学的、代表民众的方法。这里说明一下,母体的组合量很大,样本是从母体中抽出来的成员;每个样本抽到的个案数不一定一样,样本是个案的集合;抽样框从母体而来,可能一致,也可能不一致。抽样就是这么一个过程。

通过计算机辅助电话调查系统进行电话调查时,有些被访者会很纳闷:我家的电话并没有印到电话簿上,为什么能打到我这里来,你们是怎么找到电话号码的?其实,在做电话调查时,拨出去的电话号码是由系统随机生成的。包括通过身份证号码选取样本进行调查时,最好都是采用随机抽样的方法。

在进行民意调查时,经常会陷入一些误区。比如,受调查者是怎么选出来的?是通过街头拦截,还是人们自愿接受调查,还是通过研究者的筛选?这中间会出现很大的差异。即便是在街头进行拦截式访问,即便是做一个相对随机的调查,比如做旅客调查,你能找到母体吗?但是,现在很大政府部门都在这样做,因为不做就无法知道旅客的消费行为习惯。那就不得不采用拦截式访问方式,采用系统抽样,每隔几个人抽一个出来。但是,最后获得的样本结构会产生问题。随机主要是讲在统计上可以计算概率的问题。我们之所以做随机抽样,按照中央极限理论,在抽样的情况下,通过计算每一个样本落在哪一个区间里,就可以做一个推测,按照被抽中的概率算抽样误差,这个误差在我们最后推测母体的时候会被作为一个很重要的条件。如果没有这个的话,你在无穷无尽地重复一件事情的时候,如铜板被无穷无尽掷出来以后,正、反面出现的概率基本上是一半一半。抽样原理也是这么来的。因为母体跟我们的抽样框、样本之间有误差,所以最后样本的组成理论上应该跟母体一致,但绝大部分是有偏差的。这个偏差怎么解决,学术界有很多争论,依照国际惯例,提倡做加权处理,计算的偏差跟母体之间有一个权重,这个权重放到样本里,让总体分布跟母体一致,就是加权处理。

上面说的是第一个误区。第二个误区,在进行民意调查时,样本数量越大,访问的人数越多,调查的准确率越高吗?很简单的道理,你到医院里抽血需要把全身的血都抽出来吗?不需要,抽一小部分就可以了。小到什么程度呢?这里有三个影响因素:第一是可容忍的误差;第二是调查人员对结果的信心有多大;第三是你拥有的资源有多少。这三个因素决定了调查样本的大小。另外,投入调查的花费越多越好吗?钱多就多用一点,作为一个执行机构是很乐意这样做的。但是,我们作为一个负责任的执行单位,不会建议客户这么做。我会跟他们解释,有个信息水准,也就是置信度,社会科学研究里经常是95%,意思是说用同样的方法来做,100次里有95次在误差范围之内。如果是99%,就是100次里有99次在误差范围之内。一般我们选择95%,这是用公式计算得出的。在置信度不变的情况下,样本数据越大,抽样误差越小,需要用的资源就越多。但是如果我需要很精确,比如在选举期间进行调查,那就需要加大样本量,同时提高置信度,这时需要的花费也就更多。所以,可容忍的误差跟资源的利用、金钱的投放有关系。不是说我有钱我就尽量多调查些样本,有时候是没有必要的。我们是针对一个总体进行调查的,即便是1亿人口、14亿人口,有代表性的样本,一般来说,1000个就够了。

还有就是回应率问题。我经常听说,在国内进行调查,回应率是一个很令调查者苦恼的问题。电话调查拒访的比例很高,如果是进行面访调查,现在城市社区管理得都比较严格,很多小区不让其他人随便进去,所以拒访情况也是越来越严重。我们在国际研讨会上讨论到这一问题时,大家也都是摇头,表示没有办法,这也影响了民意调查的发展。所以,一些商业调查机构在互联网上建立了一个固定的网民样本库,每次从样本库里抽出一部分人作为样本进行调查,但是这个样本库的维护成本是非常高的,就像会员制一样,有些是职业回答者,所以这中间也会存在很多问题。

关于回应率,美国舆论研究协会(AAPOR)给出了详细的计算回应率的方法。所谓的回应率,就是平时讲的合作率,就是由接受访问的人和拒访的人形成的母体做分母,用接受访问的人做分子,分子除以分母,得到的就是回应率。但是,在实际调查中通常用合作率来代替回应率,将不符合资格的、没有机会接受访问的人也算进去。那么,回应率和调查结果有什么关系?回应率是一个很值得注意的问题,如果回应率太低,对于调查结果是有影响的,高低不同的回应率和没有回应率都会影响调查结果的准确度。

在设计问题时要考虑很多因素。例如,通常,在对公众进行调查时,如果问他知不知道政府目前在做的一件事或正在推行的一项政策,很多人都会回答说“知道”,因为如果回答“不知道”的话会显得他很无知。所以,我们在做调查时,如果受调查者回答“知道”,我们会再追问一个知识性问题,比如这项议题有哪些明显的特征等。如果他能回答出来,就是真的知道;如果回答不出来,就是他迫于社会压力进行的调查。

我举一个澳门的案例。有一篇新闻报道说,很多居民都表示听过《残疾人权利国际公约》,证明政府的政策宣传是有效的。这个结论不知道是如何得出的,但是,大部分人都不了解这项公约的内容,以至于不能有效配合政府推行相关措施和理念。你只是知道,但是并不了解具体内容、措施有什么用?所以,后续调查就要继续追问受访者是否了解应该做些什么,对政策或事件了解到什么程度。

再举一个我在《澳门日报》上看到的例子。“你支不支持‘2+2+100’方案去推动民主政治的发展”和“你支不支持‘2+2+100’方案”,这两种问法之间有什么区别?第一种问法是存在误导性的,问题设计者在问题中加入了一个价值判断,问的时候就已经表明了这个方案可以体现民主。这样的问法就完全扭曲了问题的中立性,也就是所说的带有引导性的问法。

除了“2+2+100”方案这个例子,还有问“立法会直选和间选议员是否应该同时增加两席”的,这个问得就比较具体,相对于上一个案例来说,这种问法问得更清楚,没有偏向性。

问卷的问题设计还有很多值得探讨、注意的地方。例如,问题排列的顺序也可能会对调查结果产生影响。比如调查你属于哪个政党以及你的父母属于哪个政党时,对问题设置的先后次序进行调整,得出的结果会有12个百分点的差异。比如先问你属于哪个政党,再问你的父母属于哪个政党,这就是从受访者的角度出发,没有干扰的情况。如果倒过来,先问你的父母属于哪个政党,再问你属于哪个政党,就可能会使受访者产生个体意识问题,就是说你调查我父母和我的情况,我就偏不让你知道我和我的父母所属的政党是一样的,可能会给出相反的结果。在商业调查中,为了得到偏向研究者的答案,是可以通过调整问题设置的顺序去影响结果的。但是,在进行调查时也要注意,要多加小心,因为都是些私人问题,会牵涉受访者的隐私。

统计调查是常用的分析方法,频数百分比的分析是看分布,均值交叉分析看差异,因素分析看影响因素之间的关系,还有聚类分析、联合分析、对应分析、线性回归分析等,大致就是这些,都是比较常用的分析方法,所以大家平时使用时也不用害怕。

给大家介绍一个我们在澳门做过的案例,是协商式民意调查。从分析方法的角度来看,这是一种大规模的、崭新的、结合了定量研究和定性研究的调研方法。这个案例是关于澳门传媒法律问题这个议题的。先是通过随机抽样抽取2000个澳门市民,对其进行电话访问,然后随机抽取几百个市民,约他们在某日某时某地见面,将其随机分成几个组来讨论这个议题,在受访者来到现场时先让他填一份问卷,在他完成讨论后再给他一份问卷,最后比较这三次调查结果有没有明显差异。整个过程是几百个人同一天同一个时间到同一个会场,先填一份问卷,我们会提前向受访者提供充足的背景资料,让他了解这个议题,在讨论的时候有主持人站在中立的角度引领他们讨论社会问题。讨论完了之后,几百个人来到另一个会场,台上有专家、学者、政府官员等会回答每个小组提出的问题。听完之后,他们再回到讨论的会场填一份问卷,这样一来,离开时他们所填的第二份问卷就是他们最终表达的态度。这个调查过程从研究方法的角度来讲,既有定量的,又有定性的,又有随机抽样,这是一种研究方法。

另一种定性的研究方法叫“世界咖啡馆”,也是一种讨论会式的研究方法,前提也是随机抽样,即随机邀请一些市民到一个地方讨论事情。为什么叫“咖啡馆”?是有咖啡、饮料喝的,给水果、糕饼吃,然后讨论事情。每个组的成员都是随机抽取的,每个小组也都安排有主持人,讨论的过程中给受访者提供机会表达他们的意见。但是,这个讨论最大的特点是,第一回合讨论结束后,会将所有人都打乱,再进行随机分组,进行第二回合的讨论。经过两个回合的讨论,每个组都提炼出小组成员的意见,由每个组的组长分享各自组得出来的结果,然后将所有的意见综合处理,让受访者做最终议题的选择。最后再让每位受访者填一份问卷。这是我们在社会调查之外,为了弥补社会调查无法深入探讨问题和民众意见的不足所做的补充调查,所以是定量和定性方法相结合的调查。“世界咖啡馆”调查法比传统小组讨论更有效,因为每一组形成意见以后,就把这一组的意见带给另一组,每一组参与的成员都是打散后随机分配的,在现场由受访者和主持人共同提炼出意见。而在传统小组讨论中,则是研究人员负责提炼意见,但研究人员并不是直接参与小组讨论,所以在提炼意见时也可能产生偏差。所以,上面说的这种方法是很不错的。

好的,谢谢大家!

');" class="a2">收藏

时间:2014年7月15日

地点:上海交通大学闵行校区光彪楼1楼多功能厅

主讲人:张荣显

张荣显

张荣显,澳门互联网研究学会会长、澳门民意调查研究学会会长,易研方案(澳门)有限公司总监、易研网络研究实验室研究总监,澳门大学社会科学及人文学院传播系助理教授、澳门大学调查研究实验室创立人、澳门互联网研究计划主持人、世界互联网项目成员、世界民意机构(澳门)执行统筹、亚太地区互联网研究联盟副主席。研究范畴涵盖民意调查、公众咨询、网络挖掘、满意度与消费者分析等。

张荣显:各位同学,大家好。今天我演讲的题目是《民意调查的方法、要素和品质》,这个课题跟我的教学内容是相关的,所以今天我也想借此机会跟大家分享一下我在教学和业务方面的一些研究和收获。

首先我简单地介绍一下我所在的机构的情况。我在澳门的两个研究学会工作,一个是澳门互联网研究学会,一个是澳门民意调查研究学会。澳门民意调查研究学会是亚太区民意调查研究联盟的理事成员,是一个由大中华区的专家学者组成的非营利性质的学会,主要是组织一些专业的研讨会,引荐一些外来的研究,意在推动澳门社会调查和民意调查的科学发展。我们现在在澳门、香港、珠海、台湾都设立有分部,建立了信息技术、网络挖掘舆情分析系统等,主要从事民情追踪、政策研究、企业研究、市场研究和数据处理等方面的研究,采用的研究方法也是多种多样,包括大数据挖掘,还有各种社会科学研究方法等。这些都跟我的研究息息相关,我在大学里教授的是研究方法和民意学,我们采用的研究方法有包括定量研究和定性研究在内的多种科学研究方法。另外,我们还自行研发了一些产品,比如用手机来进行面访调查等,也拥有自己的面访调查实验室。除此之外,我们也帮助客户建立自己的实验室,建立社会调查中心,为他们提供咨询和维护服务。

接下来我们谈谈民意。在社会上,每个人都有说话的权利,民意是无处不在的。无论是在商业领域还是社会层面进行的民意调查,其背后的理念也都是一致的。现在的民意调查是很广泛的,比如,大家经常在商场或是街头被拦截填一份问卷,或者是接到电话推销,或者是应同学要求在网站上填问卷。每个人都可以做出一份调查问卷,你可以用Google,设计一份简单的调查问卷挂网上去,也可以通过微信,在微信群里做一些简单的调查。现在,做民意调查的门槛降低了,大家都可以做,由此也就产生了一些问题,民意调查的专业化水平很容易被忽视,调查水平难以提高。民众可能觉得民意调查做起来很简单,但是,当调查结果跟民众想法不一致时,民众就会对调查结果产生怀疑,进而怀疑研究方法是不是出了问题,最终上升到公信力问题。如果你做了一项民意调查,这项调查非常有新闻价值,那么你自己不用做广告,媒体都会争相进行报道。在港澳地区,通常一项民意调查做出来后,都会被登在很重要的版面。媒体记者、编辑不会关注你的数据是怎么来的,你的调查问卷是怎么设计的,只是认为这项调查易于吸引读者的注意力,有新闻价值,所以纷纷对其进行报道。

人可以分为三种:乌合之众、大众和公众。“乌合之众”是情绪上的反映;“大众”是有共同的愿景;“公众”对各类事物的关注是比较明智的,也是比较分散的一类人。每个人都有自己不同的想法,我们在了解民众意见时,应该征求公众的意见,而不是乌合之众的意见,因为他们的意见受情绪的影响比较大。所以,要真正了解一个社会,真正了解民众对事物的真实看法,我们需要多倾听、调查公众的意见。

有很多民意叫“哈哈镜的民意”,就是说你所看到的民意都是变了形的,带有特殊的目的。比如在港澳地区有一家经营生发水的公司,为了推销它们的产品,做了一项调查,得出的结果是90%的女性不喜欢光头的男士。为什么会出现这一调查结果?因为受调查对象都是从这家公司的会员中选取的,为的就是通过这一调查结果告诉秃发男士,90%的女士都不喜欢他们,以此来吸引消费者购买产品。

那么,究竟什么是民意?在国内也叫舆情,就是公众对共同关心的事物所表达出来的意见。简单来说,就是在一个时间节点,人们对于同一个议题的看法。总的来说,民意调查就是通过系统、客观的分析来调查民众对于时事的态度、意见。民意的概念是广义的。

民意调查的特征包括以下几点。第一个是分度和方向。任何调查得出来的结果都有分度或是方向,比如说百分之多少是赞同的,百分之多少是反对的,这就是一个分度。第二个是强度。有人赞同,有人反对,有人稍微赞同,有人强烈反对,是有不同强度之分的,强度在了解民意程度方面是非常重要的。

在进行民意调查时,需要考虑以下一些影响因素。首先是民意的稳定性问题。有句话说“民意如流水”,那些有争议性的话题更容易会随着某些意见或是事件而改变,而有些就会很稳定,比如价值观等;其次,民意所具有的潜伏性要求民意调查要透明化、模式化,通常很多民意调查不是针对一些具体的微观议题,而是关于宏观发展、政策导向的评估。我们经常提到的一个典型案例就是,1996年美国总统大选,克林顿击败老布什,就是因为选民们感觉克林顿带领美国朝着一个正确的方向前进,尽管克林顿本人有一些丑闻,但是民众考虑到他总体的领导方向是正确的,就忽略了他的丑闻。最后,还有议题的重要程度。议题的重要性也会影响到民意调查的分度和强度。

那么,民意调查到底有什么作用呢?看起来好像每个人都能做,真的是这样吗?有些人说,不就是做一个电话调查访问吗?不就是做一个选举预测吗?问一些问题就行了。其实,做民意调查远没有想的那么简单。教科书上也都有讲到,一个调查可以通过面访、电话或是邮寄的方式进行,但是主要的是做什么?是要去访问一些有代表性的少数人或者团体。一般的调查是针对知识、态度、行为的研究,目的是重现研究母体的结果。其实,我们做民意调查就是通过对具有代表性的少数人进行调查研究,来推测对应的母体是什么样的情况,这才是民意调查最核心的部分。

人们会质疑街头访问、网络调研的可信度,通过网上问卷系统做的调查,能保证受调查者是少数具有代表性的人吗?能保证调查结果反映母体的情况吗?大家可以思考一下这个问题。少数具有代表性的人群叫作样本,如果你的调查结果仅仅是反映你所调查的那些人的情况,整个社会又是另一种情况,那么,你的受调查者就不具有代表性,你的调查结果也就不能反映母体的情况。

至于调研方法的选择,定量研究可以通过面访、录入、定点拦截、电脑辅助面访和传统电话访问形式进行调查。所谓传统电话访问,就是调查者把抽出来的电话号码用各自的电话打出去进行调查,现在一般没有人用这种方式进行调查了。现在研究者一般都通过计算机辅助电话调查系统(CATI)进行调查,借助这一系统提高整个流程管理的方便性。自填问卷法包括现场向受调查者派发问卷以及网络调查等。

调查首先要做好前期准备,包括问卷设计、人员培训管理、资源设备的准备、问题数据的处理和抽样等。关于抽样,有一个经典的案例。1936年美国总统大选期间,《文学文摘》杂志通过电话调查对总统大选进行预测,调查样本包括100多万选民,它预测兰登会击败罗斯福,但是最终结果是罗斯福赢了。大选结束不久,这家机构就倒闭了。之前这家杂志做过好多次预测都成功了,为什么这次失败了呢?因为1936年正值美国经济大萧条时期,订阅《文学文摘》杂志的人大部分都支持共和党,而且一般都是有钱人,兰登是共和党的候选人,杂志所做的调查抽样偏向它的受众,所以得出的结果就有偏差。而当时,有一个被称为“民意调查之父”的人,他的调查样本只有几千人,但是是通过随机抽样的方式选取的,受调查者既包括支持共和党的,也包括其他类人群,就成功地对大选结果进行了预测。现在随着抽样的完善,我们用的这些方法都是从当时演变过来的。

什么叫抽样?抽样就是在总体里面抽取出一小部分样本进行调查。但是,在这个过程中肯定会有误差出现,你通过抽取一小部分人来推测另一部分人,这叫抽样误差。我们用少数样本来推测母体情况的时候,会存在几方面误差,所以在解读任何数字的时候都不能给出一个绝对值,只能给一个参考界限。当然,这些误差是很难具体量化的,所以一般是用抽样误差来代表这个界限有多大。它有一个参考点,比如说有65%的受调查者赞成,误差如果是5%的话,应该解读为赞成的民众占60%~70%,有可能是60%,也可能是70%。

理论上抽样跟实际抽样是有很大差别的,因为没办法做到绝对理论化、精确化。比如,现在我们这里有300位同学,我抽50位同学出来,那么,无论是从实际上还是从理论上,结果都是一致的,因为不会漏掉这里的每一个人。但是,在进行社会调查的时候就不能保证了,所以只能采用各种各样的方法使实际情况尽量接近理论。你怎么喝一杯鸡尾酒?不可能服务员一端上来就喝吧,那样的话,可能喝到的是最表层或者是最底层的蜂蜜,你要先搅均匀了,才能喝到真正的味道。同样的道理,在抽样时,做随机抽样,不是随便、随意,而是随机,所谓随机,就是说要均匀。举一个关于六合彩的经典例子。现在有49个号码,每一期拿出6个号码,那么,按照随机抽样原则,每个号码被抽中的概率是相同的,这就是随机抽样。在街头进行拦截式调查可能做到随机抽样吗?不可能。所以,我们一般不将街头拦截式调查作为一种严格的、科学的、代表民众的方法。这里说明一下,母体的组合量很大,样本是从母体中抽出来的成员;每个样本抽到的个案数不一定一样,样本是个案的集合;抽样框从母体而来,可能一致,也可能不一致。抽样就是这么一个过程。

通过计算机辅助电话调查系统进行电话调查时,有些被访者会很纳闷:我家的电话并没有印到电话簿上,为什么能打到我这里来,你们是怎么找到电话号码的?其实,在做电话调查时,拨出去的电话号码是由系统随机生成的。包括通过身份证号码选取样本进行调查时,最好都是采用随机抽样的方法。

在进行民意调查时,经常会陷入一些误区。比如,受调查者是怎么选出来的?是通过街头拦截,还是人们自愿接受调查,还是通过研究者的筛选?这中间会出现很大的差异。即便是在街头进行拦截式访问,即便是做一个相对随机的调查,比如做旅客调查,你能找到母体吗?但是,现在很大政府部门都在这样做,因为不做就无法知道旅客的消费行为习惯。那就不得不采用拦截式访问方式,采用系统抽样,每隔几个人抽一个出来。但是,最后获得的样本结构会产生问题。随机主要是讲在统计上可以计算概率的问题。我们之所以做随机抽样,按照中央极限理论,在抽样的情况下,通过计算每一个样本落在哪一个区间里,就可以做一个推测,按照被抽中的概率算抽样误差,这个误差在我们最后推测母体的时候会被作为一个很重要的条件。如果没有这个的话,你在无穷无尽地重复一件事情的时候,如铜板被无穷无尽掷出来以后,正、反面出现的概率基本上是一半一半。抽样原理也是这么来的。因为母体跟我们的抽样框、样本之间有误差,所以最后样本的组成理论上应该跟母体一致,但绝大部分是有偏差的。这个偏差怎么解决,学术界有很多争论,依照国际惯例,提倡做加权处理,计算的偏差跟母体之间有一个权重,这个权重放到样本里,让总体分布跟母体一致,就是加权处理。

上面说的是第一个误区。第二个误区,在进行民意调查时,样本数量越大,访问的人数越多,调查的准确率越高吗?很简单的道理,你到医院里抽血需要把全身的血都抽出来吗?不需要,抽一小部分就可以了。小到什么程度呢?这里有三个影响因素:第一是可容忍的误差;第二是调查人员对结果的信心有多大;第三是你拥有的资源有多少。这三个因素决定了调查样本的大小。另外,投入调查的花费越多越好吗?钱多就多用一点,作为一个执行机构是很乐意这样做的。但是,我们作为一个负责任的执行单位,不会建议客户这么做。我会跟他们解释,有个信息水准,也就是置信度,社会科学研究里经常是95%,意思是说用同样的方法来做,100次里有95次在误差范围之内。如果是99%,就是100次里有99次在误差范围之内。一般我们选择95%,这是用公式计算得出的。在置信度不变的情况下,样本数据越大,抽样误差越小,需要用的资源就越多。但是如果我需要很精确,比如在选举期间进行调查,那就需要加大样本量,同时提高置信度,这时需要的花费也就更多。所以,可容忍的误差跟资源的利用、金钱的投放有关系。不是说我有钱我就尽量多调查些样本,有时候是没有必要的。我们是针对一个总体进行调查的,即便是1亿人口、14亿人口,有代表性的样本,一般来说,1000个就够了。

还有就是回应率问题。我经常听说,在国内进行调查,回应率是一个很令调查者苦恼的问题。电话调查拒访的比例很高,如果是进行面访调查,现在城市社区管理得都比较严格,很多小区不让其他人随便进去,所以拒访情况也是越来越严重。我们在国际研讨会上讨论到这一问题时,大家也都是摇头,表示没有办法,这也影响了民意调查的发展。所以,一些商业调查机构在互联网上建立了一个固定的网民样本库,每次从样本库里抽出一部分人作为样本进行调查,但是这个样本库的维护成本是非常高的,就像会员制一样,有些是职业回答者,所以这中间也会存在很多问题。

关于回应率,美国舆论研究协会(AAPOR)给出了详细的计算回应率的方法。所谓的回应率,就是平时讲的合作率,就是由接受访问的人和拒访的人形成的母体做分母,用接受访问的人做分子,分子除以分母,得到的就是回应率。但是,在实际调查中通常用合作率来代替回应率,将不符合资格的、没有机会接受访问的人也算进去。那么,回应率和调查结果有什么关系?回应率是一个很值得注意的问题,如果回应率太低,对于调查结果是有影响的,高低不同的回应率和没有回应率都会影响调查结果的准确度。

在设计问题时要考虑很多因素。例如,通常,在对公众进行调查时,如果问他知不知道政府目前在做的一件事或正在推行的一项政策,很多人都会回答说“知道”,因为如果回答“不知道”的话会显得他很无知。所以,我们在做调查时,如果受调查者回答“知道”,我们会再追问一个知识性问题,比如这项议题有哪些明显的特征等。如果他能回答出来,就是真的知道;如果回答不出来,就是他迫于社会压力进行的调查。

我举一个澳门的案例。有一篇新闻报道说,很多居民都表示听过《残疾人权利国际公约》,证明政府的政策宣传是有效的。这个结论不知道是如何得出的,但是,大部分人都不了解这项公约的内容,以至于不能有效配合政府推行相关措施和理念。你只是知道,但是并不了解具体内容、措施有什么用?所以,后续调查就要继续追问受访者是否了解应该做些什么,对政策或事件了解到什么程度。

再举一个我在《澳门日报》上看到的例子。“你支不支持‘2+2+100’方案去推动民主政治的发展”和“你支不支持‘2+2+100’方案”,这两种问法之间有什么区别?第一种问法是存在误导性的,问题设计者在问题中加入了一个价值判断,问的时候就已经表明了这个方案可以体现民主。这样的问法就完全扭曲了问题的中立性,也就是所说的带有引导性的问法。

除了“2+2+100”方案这个例子,还有问“立法会直选和间选议员是否应该同时增加两席”的,这个问得就比较具体,相对于上一个案例来说,这种问法问得更清楚,没有偏向性。

问卷的问题设计还有很多值得探讨、注意的地方。例如,问题排列的顺序也可能会对调查结果产生影响。比如调查你属于哪个政党以及你的父母属于哪个政党时,对问题设置的先后次序进行调整,得出的结果会有12个百分点的差异。比如先问你属于哪个政党,再问你的父母属于哪个政党,这就是从受访者的角度出发,没有干扰的情况。如果倒过来,先问你的父母属于哪个政党,再问你属于哪个政党,就可能会使受访者产生个体意识问题,就是说你调查我父母和我的情况,我就偏不让你知道我和我的父母所属的政党是一样的,可能会给出相反的结果。在商业调查中,为了得到偏向研究者的答案,是可以通过调整问题设置的顺序去影响结果的。但是,在进行调查时也要注意,要多加小心,因为都是些私人问题,会牵涉受访者的隐私。

统计调查是常用的分析方法,频数百分比的分析是看分布,均值交叉分析看差异,因素分析看影响因素之间的关系,还有聚类分析、联合分析、对应分析、线性回归分析等,大致就是这些,都是比较常用的分析方法,所以大家平时使用时也不用害怕。

给大家介绍一个我们在澳门做过的案例,是协商式民意调查。从分析方法的角度来看,这是一种大规模的、崭新的、结合了定量研究和定性研究的调研方法。这个案例是关于澳门传媒法律问题这个议题的。先是通过随机抽样抽取2000个澳门市民,对其进行电话访问,然后随机抽取几百个市民,约他们在某日某时某地见面,将其随机分成几个组来讨论这个议题,在受访者来到现场时先让他填一份问卷,在他完成讨论后再给他一份问卷,最后比较这三次调查结果有没有明显差异。整个过程是几百个人同一天同一个时间到同一个会场,先填一份问卷,我们会提前向受访者提供充足的背景资料,让他了解这个议题,在讨论的时候有主持人站在中立的角度引领他们讨论社会问题。讨论完了之后,几百个人来到另一个会场,台上有专家、学者、政府官员等会回答每个小组提出的问题。听完之后,他们再回到讨论的会场填一份问卷,这样一来,离开时他们所填的第二份问卷就是他们最终表达的态度。这个调查过程从研究方法的角度来讲,既有定量的,又有定性的,又有随机抽样,这是一种研究方法。

另一种定性的研究方法叫“世界咖啡馆”,也是一种讨论会式的研究方法,前提也是随机抽样,即随机邀请一些市民到一个地方讨论事情。为什么叫“咖啡馆”?是有咖啡、饮料喝的,给水果、糕饼吃,然后讨论事情。每个组的成员都是随机抽取的,每个小组也都安排有主持人,讨论的过程中给受访者提供机会表达他们的意见。但是,这个讨论最大的特点是,第一回合讨论结束后,会将所有人都打乱,再进行随机分组,进行第二回合的讨论。经过两个回合的讨论,每个组都提炼出小组成员的意见,由每个组的组长分享各自组得出来的结果,然后将所有的意见综合处理,让受访者做最终议题的选择。最后再让每位受访者填一份问卷。这是我们在社会调查之外,为了弥补社会调查无法深入探讨问题和民众意见的不足所做的补充调查,所以是定量和定性方法相结合的调查。“世界咖啡馆”调查法比传统小组讨论更有效,因为每一组形成意见以后,就把这一组的意见带给另一组,每一组参与的成员都是打散后随机分配的,在现场由受访者和主持人共同提炼出意见。而在传统小组讨论中,则是研究人员负责提炼意见,但研究人员并不是直接参与小组讨论,所以在提炼意见时也可能产生偏差。所以,上面说的这种方法是很不错的。

好的,谢谢大家!

帮助中心电脑版