正在阅读: 【深度】美国大选民调再遭“滑铁卢”?事情没那么简单

扫一扫下载界面新闻APP

【深度】美国大选民调再遭“滑铁卢”?事情没那么简单

对于民调,不应神化,也不应污名化。

纽约的一间投票站。来源:视觉中国

记者 | 王磬

编辑 | 崔宇

尽管美国大选的点票尚未完全结束,对于民调的讨伐声却已此起彼伏。

“这个阶段要求进行民调‘尸检’,有点类似于当尸体还在犯罪现场时就要求验尸官提供死因。”在一篇反思民调的文章中,《纽约时报》的民调记者Nate Cohn略带无奈地写道,“但可以确定,这次民调出现了失误——它系统性地低估了特朗普总统的支持率——这与四年前的民调失误非常相似,甚至可能比四年前还要糟糕。”

众所周知,民调界曾在2016年美国大选时经历“滑铁卢”:选前多个主要民调都预期希拉里将会轻松取胜,但结果却是对几个关键摇摆州的特朗普支持率出现了致命低估。借助“选举人团”制带来的比分差,特朗普在一片惊讶声之中开启了他的总统任期。

从结果上看,2020年的民调失误或许没有那么“致命”——拜登如预期一样拿下了多数普选票和胜选所需的选举人票,但仍无法掩盖民调的问题:许多选前预估拜登会大幅领先的地方,最后都只是涉险过关、甚至被特朗普逆转,局部的误差程度甚至超过2016年。预期中的民主党大胜“蓝潮”(blue wave)没有出现,取而代之的是极其胶着的局面,以至于要到投票结束三天之后,主流媒体才敢宣布拜登胜出。

四年之后,民调为何再次“跌倒”?民调公司和政治学者已经开始反思,并提出了一些可能的解释;但或许只有等到开票结束、对完整数据进行分析调查之后,才能给出这一问题的准确回答。

哪里出了错?

四年之后,民调公司几乎是在同一个地方跌倒——当年低估了特朗普得票率的地方四年之后仍然在低估,误差幅度甚至更大。

民调是一种社会科学工具,通过对一小部分合乎统计学标准的人群做调查,以推论全体国民意向。一项民调是否准确,最重要的决定因素是抽样的质量。

这主要包括:第一,样本量是否足够。从统计学上来说,要在95%的置信水平下达到3%的抽样误差,每州需要抽选600-2000人不等,通常在1000人左右。第二,样本是否具有代表性。抽选的样本既要有一定的随机性、又要能够反映一定的人口特征,包括性别、年龄、宗教、族裔等。美国民调一个常被诟病的问题是由于依赖特定的抽样路径而导致样本的代表性不够。

例如,传统的民调公司通常喜欢用固定电话做选民采访,导致应答者里有较多的中老年白人,这就会出现样本偏差:没有固定住所和固定电话的人就没法参与、还有些少数族裔不喜欢接听英语电话。因此,好的民调公司通常不仅会公布结果,也会公布误差区间和抽样设计。

如果民调公司已经预知到抽样可能失真,通常会通过数据加权来矫正。一个常被提起的反例是2016年大选时,民调对受访者教育程度的忽视。蓝领白人转投特朗普,让研究者发现是否拥有大学学历会显著地影响到投票意向,但选前民调并未针对学历进行加权。《纽约时报》当时的分析发现,没有按教育程度加权,使特朗普的民调支持率损失了4个百分点,这足以弥补2016年的大部分民调误差。这在后来得到了修正:到了2020年,给教育水平加权已经成了主流选举民调的标配。

在美国,选举民调主要分为国家级和州级。复旦大学社会科学高等研究院讲师王中原告诉界面新闻,传统上是国家层面的民调更受关注,民调公司的调查经验和样本结构也更成熟。但由于2016年出现了总统赢下选举人团票、但输了普选票的情况,让几个摇摆州变得格外关键,因此在2020年有大量的民调资源被放置到了州层面,特别是摇摆州。

但开票结果显示,2020年的民调在国家级和州级都出现了误差,州级更为明显。失误主要表现在:低估了特朗普的支持率、高估了拜登的受欢迎程度。

《纽约时报》民调记者Nate Cohn指出,全国性的民调误差比四年前更大。2016年民调认为希拉里将领先4个百分点,最终结果为领先2.1个百分点。到了今年,在投票前的一个月里,几乎所有全国性的主流民调都显示拜登的领先优势将高于8个百分点,但就目前的开票情况来看,领先优势仅在5个百分点。

州一级的误差更引人关注。在特朗普强、拜登弱的地方,民调公司更倾向低估特朗普、高估拜登,以关键摇摆州佛罗里达为例,选前民调平均预估拜登将以50.8%vs48.4%击败特朗普,但结果却是特朗普以51.2%vs47.8%击败了拜登,来回误差接近5个百分点。在爱荷华州,选前民调平均预估特朗普将小胜拜登1个百分点,结果是大胜8个百分点。

但相同的状况却没有发生在拜登强、特朗普弱的地方。例如深蓝的华盛顿特区,民调预估拜登与特朗普的得票率就与最终结果几乎没有差别。

[图:关键州的民调结果与开票结果的对比。来源:《纽约时报》]

内华达大学拉斯维加斯分校政治系助理教授王宏恩在给端传媒的撰文里提到了他的分析:将538网站的各州民调结果与各州开票结果(截至美国时间上周五早上)对比会发现,在50个州加上华盛顿特区中,拜登在48个选区被民调高估,而特朗普在45个选区被低估。他指出,四年之后,民调公司几乎是在同一个地方跌倒——当年低估了特朗普得票率的地方四年之后仍然在低估,误差幅度甚至更大:四年之前,有41个选区低估特朗普、38个选区高估希拉里。也就是说,2020年民调公司在更多的选区里低估了特朗普、高估了拜登。

特朗普被低估的主要影响体现在几个关键摇摆州。在南部,尽管事先普遍有预期,拜登在拉丁裔中的支持率不会太高,但佛罗里达与德克萨斯两州的结果仍让媒体大跌眼镜。在北部,中西部几州的民调虽然猜对了拜登的赢面,但大幅度地错估了特朗普的具体得票率。在引人注目的“锈带三州”均出现了高于4个百分点的误差,其中威斯康辛误差最大:选前民调认为拜登将以10个百分点的优势领先,但最终只赢了不到1个百分点。

为什么会出错?

关于今年民调失误的解释主要有两种。一种是,新冠疫情和超高投票率等特殊条件,让民调无法建立起一个可靠的模型。另一种则围绕着“害羞的特朗普支持者”假说而展开。

旅美政治学者王浩岚告诉界面新闻,关于今年民调失误的解释主要有两种。一种是,新冠疫情和超高投票率等特殊条件,让民调无法建立起一个可靠的模型。另一种则围绕着“害羞的特朗普支持者”(shy trump voter)假说而展开,即,特朗普的选民可能因为种种原因不愿参加民调、或是在受访时掩饰了真实的投票倾向,从而导致了民调的失真。

针对第一种解释,Nate Cohn指出,新冠疫情对民调的影响首先体现在采访的应答率显著提升了。民调机构当时发现,拜登在疫情严重的地区支持率有所提升,这似乎证实了疫情会损害特朗普的假设。但事实上,这可能只是因为许多拜登支持者开始居家工作、有更多机会接听到民调公司的电话。也就是说,是拜登支持者受访的比例发生了转变,却不代表特朗普在疫区的民意支持发生了转变。与之相反,迄今为止许多县的调查显示,特朗普在疫情更严重的地区反而表现更好。这一点在威斯康辛州最为明显——该州是当前疫情最严重的地区之一,也是民调严重低估特朗普的战场州。

Nate Cohn还指出,特朗普任期内激发的左派抵抗(resistance)情绪可能也在一定程度上带偏了民调。数百万人参与了女性权利和Black Lives Matter的大游行,进步活动家也捐出了巨额资金,这类政治参与的激增可能也意味着,抵抗者们更容易回应民调的采访,制造了一种“蓝潮”的幻觉。

此次大选也创下了投票率的历史最高纪录,最终估计在67%至72%之间。复旦大学社会科学高等研究院讲师王中原指出,投票率也是选前民调无法准确测量的问题。一些人在受访时声称自己支持拜登,但最后可能没有出来投票。同时,民调是按照注册选民(registered voters)还是按照意向选民(likely voters)进行抽样,结果会有差异。

这也是为何“出口民调”(exit poll)——也即在投票站门口进行的民调——比选前民调通常要准确得多。不过今年由于大量邮寄选票的存在,出口民调也失去了往年的风向标意义。这次的开票结果还打破了关于高投票率的一个假设:通常认为,高投票率将有利于民主党,现在看来可能并非如此,因为共和党支持者的投票率要比预测的高更多。

针对第二种解释也已有不少争论。“害羞的特朗普支持者”并不是2020大选才出现的新现象。

2016年的民调“滑铁卢”之后,美国民意研究协会(AAPOR)曾总结过当时出现误差的两个主要原因:第一是民调对受访者教育程度的忽视,没有进行加权。第二是,许多选前未表态的选⺠在最后阶段急剧转向支持特朗普。

为了解释这群人的投票行为,学界将其称为“害羞的特朗普支持者”现象:认为可能存在这样一群选民,或者出于社群压力及别的原因,在受访时不愿承认自己支持特朗普;或者是出于对民调等机构的不信任,完全不愿意参与到民调之中。

但这种假说在过去几年遭遇了许多批判,主流学界认为,没有证据显示“害羞的特朗普支持者”的真实存在。其中一种反驳的论调是,假如真的有人因为社群压力没说实话,理论上应该是拜登支持者越多的地方、特朗普支持者越不愿意表态,比如加州。但实际结果却是摇摆州和红州测不准,假说似乎不太合理。

但2020年的开票结果或许表明,这个人群不仅存在,可能还扩大了。

Nate Cohn指出,多年以来,由于特朗普不遗余力地攻击新闻机构和民调机构,会让其支持者对民调的怀疑情绪更重,可能会变得更加不回应民调。尽管民调本身在2016年时已经失去了不少可信度,但现在的情况可能更糟。

“我们现在必须认真对待某些版本的’害羞的特朗普支持者’了。”甚至连共和党民调专家Patrick Ruffini都如此表示。他认为,如果民调完全无法触及这部分重要的特朗普阵营支持者,将会导致共和党全面被低估。

王浩岚对界面新闻表示,尽管民调在2016年和2020年总统大选时都出现了较大失误,但在2018年中期选举时却是比较准确的——那是一场特朗普没有参加的选举。因此民调界有些看法认为,特朗普参选时可能会有一些独特性,让民调失真(Trump Effect)。他认为学界可能需要改进对于特朗普选民的认知:“害羞的特朗普支持者”真实存在并且不容小视,尽管现在的规模尚未构成“沉默的大多数”。

美国有何特殊性?

选举人团制会对民调误差有放大效应,往往几个摇摆县市的误差就能影响全国。从统计学上来看,把样本放得越小,噪音就会越大。

受到选举人团制的影响,美国的民调又有其特殊之处。

选举人团制是一种间接选举制度。现行制度下,除了缅因州与内布拉斯州,其余州全部采取“赢者通吃”的制度——赢下了一个州,就能拿走该州全部的选举人票。因此会出现“赢了大选、但输了普选票”的结果,同时也会对民调形成挑战。

耶鲁大学法学院博士候选人林垚告诉界面新闻,选举人团制会对民调误差有放大效应,往往几个摇摆县市的误差就能影响全国。从统计学上来看,把样本放得越小,噪音就会越大。如果是全国一盘棋、只看普选票,那在某几个州多几万张票也不会影响大局。但如果要凭一两个摇摆州来定胜负,这几万张票的作用就会格外明显。2016年大选中希拉里痛失的“锈带三州”,与特朗普的票差均小于1%。但就是这每州多出来的几万张票成为特朗普胜出的关键。

州一级的民调因此变得格外重要,但是成本很高。黎班为端传媒撰写的一篇分析指出,要达到同样的误差水准,在州民调所需要的样本数,与国家级所需的样本数是一样的。也就是说,如果民调变成一州一州地做,那耗费的成本将是全国民调的50倍。因此国家级的民调公司通常只会愿意在摇摆州投入成本做精细的民调。

民调是件很费钱的事。王中原告诉界面新闻,每州抽样1000人虽然看上去很少,但实施起来已经很不容易,受到时间、金钱成本的制约。最理想的民调是能在一天之内完成1000个抽样,时间跨度不能太长。如果变成一周,可能会有很多新闻发生,受访者面对的客观条件就不一样了。民调在当前的平均应答率并不高,“好一点的可以到20%、一般都在百分之十几”,因为大多数人都不接电话或是接上之后就挂了。要完成1000个有效的抽样,取样时可能需要一天之内打上10000个电话,做一次可能会花费几十万美元。

据王中原介绍,传统上来说,州一级的民调主要由本州的州立大学或是州级媒体来主刀,但质量容易参差不齐。大多数州内机构都受到预算限制,数据相对粗糙;但做得好的会特别有本土优势,例如可以通过登门、而非打电话或发邮件的方式,民调质量会更高。2020年的新情况是,有不少全国性的媒体和民调公司来做州一级的民调。它们虽然经验丰富,但由于各州的州情变化很快,它们未必能很快捕捉到这些变化。

今年大选中的爱荷华州就是一个例子。爱荷华是偏红的摇摆州,选前几乎所有主流民调公司都认为,特朗普与拜登的差距将不会超过1个百分点,但结果是领先了8个百分点。只有一间本土民调公司准确地做出了预测,它的创始人Ann Selzer几十年专注爱荷华州,采用非常本土的调研方法,被538网站认为是“最好的政治民调专家”

近年来也开始兴起对民调公司进行评级,根据过往准确率、调查方法、金主等信息对其评分。而有更多民调公司活跃的好处是,国家级民调机构能与州一级的机构形成互动关系,民调数据的发布越来越频繁,在做民调综合时,准确性也会提高。

民调该如何被解读?

从统计学意义上来说,一项调查有6、7个百分点的误差是很合理的。但在大选时,人们没办法接受这么大的误差,特别是在摇摆州。

更重要的问题或许并不是民调是否准确,而是媒体和公众怎么解读。

林垚表示,这次尽管存在民调误差,但并不算重大失误,可能是媒体报道和公众讨论放大了这种失误效应。他以佛州民调失误为例:最后相差的5个百分点其实是在误差范围内的。因为拉丁裔一直“讲不太准”。他们不用固定电话、也不喜欢接英语电话,可能导致了选前民调并未很好地覆盖这个群体。做民调的人自己也清楚这一点。

“从统计学意义上来说,考虑测量误差和覆盖误差,一项调查有6、7个百分点的误差是很正常的。但在大选时,人们没办法接受这么大的误差,特别是在摇摆州。”王中原表示,媒体通常引用的误差其实是双边误差,“相差N个百分点”其实是指一来一回的距离,这也会对误差有放大效应。

据王中原介绍,民调其实只是选举预测的一种方式,但还有很多别的方式。民调是抽样的访问,通过样本去推测总体;而科学预测是综合各类信息来研判到底谁会当选。选举预测并不总是依赖民调。

复旦大学复杂决策分析中心就曾在选前发布过一个基于计算机模拟、而非民调的选举预测,研究团队由唐世平教授领衔。这项预测是基于ABM模型(Agent-Based Modeling)的仿真模拟,在计算机里生成作为agent的虚拟选民,赋予他们相应州的宗教、性别、族裔特征,再输入该州当前的经济发展、就业率、犯罪率等参数,在给定规则下让这些数量的选民完成投票的决策 ,通过多次模拟得到最终得票率分布和输赢情况。

王中原也参与到了研究团队中,他结合今年的选情谈到ABM模型的优势。

例如,拉丁裔今年会出现的民调误差,部分原因是做民调机构没有在抽样时对拉丁裔进行细分,比如从古巴来的和从墨西哥来的投票倾向可能很不一样,但都被算作拉丁裔。对民调公司来说,以后可能就要更关注这些次分群体,但技术上来说很难。并不是分得越细越好,民调的有限样本不可能覆盖所有的细分群体,预算和时间成本也都有约束,以及民调者没法提前预测:在哪一年、哪一个细分群体突然会变得很重要。他进一步指出,ABM的优势之一就在于,可以在计算机里模拟不同排列组合的选民群体,甚至能够覆盖到所有可能的排列组合。

尽管民调存在各式各样的问题,美国目前的选举预测仍然以民调为核心。

“归根结底,选举是离不开民调的。如果哪一届选举完全没有了民调,候选人、选民、媒体,通通都会lost(迷失)。”王中原表示,“不应该神化民调,但也不应该污名化它。”

(编者注:由于开票尚在进行,本文的数据分析截至美东时间11月10日下午)

未经正式授权严禁转载本文,侵权必究。
表情
您至少需输入5个字

评论 0

暂无评论哦,快来评价一下吧!

为你推荐

下载界面新闻

微信公众号

微博