2020年11月4日星期三

通过美国大选聊聊什么叫预测

这两天进行的大选真的是如火如荼,从一开始民调极度偏向拜登到选举日晚上全国一片红色,再到现在只要拜登赢下已经胜券在握的内华达就可以成功当选,这一路也是几经波折,像过山车一样。

在这个过程中,很多人质疑了民调,发现它又一次误导了大众,对于预测大家也更担忧了。不得不承认的是,美国的选举人制度确实给民调带来的很多问题,每个州都有自己的特点,部分人不能表征整体的民意,而一旦数个州出现民调不准确的情况,整个选举就有可能被左右。

其实在2016年,我们已经见识到了结局与民调大相径庭的情况。当年,希拉里的普选比例的预测值与实际值都再48.5%左右,相差不大;但是川普的普选比例被预测为不到45%,却达到了46%。也正是因为发生在各州的这一点点“奇迹”,在加上它们的积累(奇迹中的奇迹),川普赢得了最终的胜利。

很多人会因此来批判民调的准确性甚至怀疑其真实性。这里面究竟如何,谁都不好说,毕竟美国在民调方面已经发展了近一百年了,学者专家的不懈努力也很大程度上提高了民调的水准,但是也很难确保整个过程没有一点系统性误差。我们今天抛开民调的表现不谈,而是来聊一聊民调 “调”的是什么。

基于大部分人都没有概率学的认识观点或者概率、统计基础,预测很多时候会误导大众,民调也是一样。

事实上,民调就是在全国选民中随机(不能完全保证)地抽出一些选民进行调查,就像是我们常说的产品检验,我们直到我们不可能把每个出产的产品都进行严格的审查检验,但是只要我们抽取一定比例,并证明这些样品大部分都合格,我们就能从统计上说明大部分产品都合格,但是至于是不是真的大部分产品都合格,我们其实不得而知。但是如果我们统计上的结论向我们保证了,只要不发生意外,所有产品都合格;只要这个意外不那么容易发生,我们就会选择相信 所有产品都合格的结论。

听起来比较绕,但是有一个信息很重要,就是通过统计得到的结论没有百分之百的,或者说不可能有。统计通过部分样本推断总体,而这一部分样本是总体的随机的一部分,那么总是有一定可能:这个样本质量很差。而基于这样的可能,我们的推断就可能有问题。

我们回到大选,看看我们的民调是如何反映总体的。事实上,真实的普选结果我们是看不到的,因此我们借助民调大概了解真实情况;而只要民调的提取过程没有问题,我们得到的结果理论上说是能反应真实情况的,这个理论基础是统计学的基本定理——大数定律保证的。

但是,除去系统性误差,这里面还是会有一点随机性,而这一点随机性有时候会深远地影响预测的准确性。

那我们说说预测。如果全村有100人,两个人竞选村长,获得多数票的人获胜。但是今天我们随机调查了20个人,发现12个人支持A,8个人支持B。我们会说大概60%的选民支持A。因此大家会断定A将会获得竞选的胜利。

然而大家都忽略了一个问题,民调得到的60%如果不对会怎么办?可能现实是这样,全村100个人,支持AB的各有五十个,而我们调查的这20个人不是均匀来自两派,而是随机的;所以有很大概率,这20个人中支持A B的人数并不相同,但只要这样,通过民调得到的预测结果都是某一个人必然获胜。这已经与现实大相径庭了。

问题就出在,我们的预测做的太绝对了,我们需要考虑没发生的结果,虽然我们只做了一次民调,但是我们应该意识到,这个民调不一定代表大众的平均认识。因此,统计上,我们会做一些处理,使得我们得到的预测不再是A毕竟获胜,而是A有75%的概率获胜,B有25%.

一旦到了这一步,我们把取样时避免不了的随机性全部转移到了预测的随机性上,但是实际上两个人谁会获胜已经写在100个人的心中了,这个预测只不过是我们外人希望尝试理解或认识这次村长竞选的情况而强加的。而最终的结果无论是什么,这一套逻辑都是合理的,也是科学的。

但是有些机构或个人,它们往往并不给出两人获胜的概率,而是直接说出他们心中预测的赢家。这个时候,预测成功与否带来的就是两个极端。 有一些机构常年预测成功,我们可以想见,他们不可能了解每个人的意向,他们也进行了民调,并且通过这些民调进行推测、预测。那么他们的研究就一定就随机性,给去言之凿凿的结论就有不合理之处。有些机构并不研究民调,而是关注政策与候选人的表现;这个时候,我们就不能用统计学的角度去理解了,因此他们的预测合理与否就要深入理解他们给出的理由了。

但是对于势均力敌的两位候选人,质化的,没有数据支持的预测必定不够有说服力;因此在这时我们一般需要借助统计方法进行量化分析,在大数据时代,这一切都变得越来越容易,我们的传统的认知世界的方式也将慢慢被改变。





没有评论:

发表评论

河南游记

 用了将近一周的时间,走过了河南的几个大城市。开封、郑州、登封、洛阳以及途径的三门峡市等。一路上看到了一众人文景观,感受了千年古都残留下的古代文化。