夏春:“以钱投票”比“以口投票”的预测准确度更高吗?
就在这两天,相信很多人在微信群看到下面这样一个截图,来自于美国的政治预测网站RealClearPolitics(简称RCP)。图中似乎显示,特朗普一改之前的颓势,支持率节节上升,而拜登的则是节节下降,两者的差距已经缩小到3.7个百分点。
相反,我平时打开RCP网站看到的两人平均支持率是下面这张图。图里两人支持率的波动率更高,但拜登的平均支持率要比特朗普高出6.2个百分点。
博彩(押注)预测vs.民调预测
仔细观察两张图,就会发现前者是“博彩平均”(Betting Average),是通过不同博彩市场的押注金额变化导致的期货价格变动来推算特朗普和拜登的平均赢率。后者是“民调平均”(Polling Average),也就是我们通常理解的通过不同媒介进行的民意调查所显示的(合理调整加权)平均支持率。
我迅速查询了其他知名民调网站的最新数据和图表,他们或者采取和RCP类似的方法,或者更合理地以最终决定大选投票结果的方法,分别计算特朗普和拜登在美国不同州可能取得的选举团票数。
两种方法给我的印象都是目前两人对垒的局势更接近第二张图显示的支持差距,特别是在选举团票数上,拜登的优势目前看来更大,一些计算显示特朗普甚至要拿下全部摇摆州的选举团票才能够翻盘。
如果我们把博彩市场的押注称为“以钱投票”,把民调市场的支持称为“以口投票”,那么相对于最终结果,也就是“以手投票”,到底哪一个的准确度更高? 很多人都认为前者的预测力要高于后者,这种想法自然有其道理,英语里有所谓的Money Talk和Cheap Talk的说法,前者就是“金钱说了算”,后者则是“空口白话太廉价\吹牛不上税”。
还有一句更直接的表达,将两种意思合二为一:Put your money where your mouth is,即不要老是吹牛,与其空口白话,不如拿钱和实际行动来证实。
学界曾经对这个问题产生浓厚的兴趣,在我总结这些发现之前,还是先来回顾一下大家记忆犹新的一些有趣结果。
2008年以来最重要的几场投票,谁的准确度更高?
我们先来看下RCP网站统计的2016年美国大选前特朗普和克林顿的“博彩平均”(见下图),克林顿的押注赢率平均保持在75%的水平,在10月明显上升到85%。特别是在11月8日投票前,赢率从3日的76%上到7日的88%。相反,特朗普在博彩市场上一直是输家,愿意为他押注的资金不多。
相反,在RCP的“民调平均”上克林顿一直领先,虽然最终预测错误,但误差要比“博彩平均”要小得多(见下图)。毕竟,克林顿只获得531张选举团票中的227票,输给特朗普77票,但她赢了选民票数,在全美获得的选票比特朗普多出286万张。
再来看看在2016年的民主党和共和党的党内初选预测上,民调和博彩哪一个更加准确。克林顿优势明显,在两个市场的支持率都更高,预测难分高下。但是特朗普则不一样,他在党内面临很多竞争对手,特立独行的风格和极端的言论,都让最后的胜出出其不意。
有意思的是,特朗普早在2015年7月就在民调上超出所有对手,但在博彩市场,虽然他的赢率在2015年10月开始上升,但直到2016年2月在他身上押注的资金才超过其他人,距离特朗普在4月锁定党内胜局并不遥远。
2016年英国脱欧公投也为“以口投票”的准确度更高提供了另外一个证据。民调市场上,“脱欧”支持率虽然一直低于“留欧”,但两者高度接近,离6月24日投票日越近,差距越小。但在博彩市场上,“留欧”的赢率不仅高出一大截,而且优势越来越大,直到投票当天才被逆袭。最终的“脱欧”结果出人意料,但也只比“留欧”票数多了3.78个百分点。
上面这些案例都给人“以口投票”更准确的印象,但反例并不难找。以2012年共和党的党内初选为例,最终获得提名的罗姆尼在2011年9月就在博彩市场上提前锁定了胜局,而在民调市场上他大部分时间都在第二位徘徊。至于民主党,由于奥巴马寻求连任,党内初选并没有什么人出来竞争。
接下来的总统大选,奥巴马和罗姆尼在民调上打得难解难分,在10月竞争白热化阶段,罗姆尼的支持度反超,把悬念留到了最后一刻。但有意思的是,在博彩市场上,奥巴马却一直是明显领先的(见下图)。最终,奥巴马在538张选举团票中获得了332票,超过罗姆尼126票,在全美选民票数上也赢了对手498万票,堪称压倒性胜利。
2008年,在总统大选上,民调和博彩市场的准确度难分高下,都提前预判了奥巴马将战胜麦凯恩。但在党内初选上,克林顿在两种预测上都领先奥巴马,直到最后被逆袭。民调市场提前锁定了麦凯恩赢得初选。
因此,尽管2016年的英国脱欧和美国大选令大家对民调大失所望,并以各种理由批评,但综合来说,在2008年以来最重要的几场选举和一次公投上,“以口投票”表现相比“以钱投票”或者平分秋色,或者准确的次数更多。
合理的解释认为民调覆盖人群的范围更广,调查过程更接近实际投票的情形,可以看出不同背景族群的偏好,为竞选人提供反馈信息。虽然民调结果随着事件进展议而变化,显得有些情绪化,但受访者很少受到博彩市场的影响。
相反,博彩市场的参与者人数较少,同质性较高,考虑金钱多于其他因素。虽然他们可以参考民调来调整押注金额,但实际行为常给人“孤注一掷”的感觉,而非冷静计算后的选择。
大数据研究发现了什么?
上面的这几个案例虽然有趣,但放在大数据下就未必能得出同样的结论了。就我所知,下面是专家们的一些重要的研究发现:
1、对总统的押注从华盛顿当选前就已经出现,林肯任职期间出现有组织的博彩市场,纽约最为活跃。大选期间,10月上旬开始报纸每天更新博彩赢率,但科学的民调直到1936年才开始出现。1884-1940年的15次总统大选,每次平均押注金额达到3700万美元(以2002年价格),时常出现博彩交易量超过股票和债券的情形。研究显示,除1916年预测完全错误外,其余11次都在10月中旬准确预测到大选结果,剩下3次打成平手。主张“以钱投票”更准的专家特别喜欢讲述这段博彩史。但10月中旬离投票日仅有2周,这样的准确度似乎并不特别出奇;
2、由于政府对博彩的打击,这个政治预测市场在1940年之后基本消失,被后起的科学民调市场取代,直到1988年政府允许爱荷华大学电子政治预测市场运作。2008年该大学发表研究,认为在1988-2004年的5次大选预测上,相比964个民调,博彩预测更准确的百分比高达74%。如果以大选前100天的预测结果来比较,则博彩预测全部好于民调。这个结果被媒体广泛报道,给很多人留下深刻印象。不过,如果以此为基础,加上2008年和2012年两次博彩预测结果准确,从而押注克林顿在2016年胜选,则会大失所望;
3、随后两位专家质疑了爱荷华大学的研究方法,指出博彩市场预测的是大选日的结果,而民调只是给出调查当天的支持偏好。如果采取合理方法将其转换成大选日的支持度,那么在1998-2004年的大选预测上,“以口投票”的民调准确度其实更高;即使不做这样的调整,爱荷华电子预测市场在2004-2016年大选预测上的表现都输给了民调;
4、这两位专家还发现,虽然1940-1988年,政治博彩市场在美国消失,但在欧洲仍然大规模存在(现在,欧洲对美国政治博彩的押注仍然远远超过美国,因为美国对押注金额有限制而欧洲没有)。有意思的是,当民调和博彩市场同时存在时,一方面,两者的预测准确度达成平局,另外一方面,有民调时期的博彩准确度反而明显低于没有民调的年代,可能是时代进步后,社会噪音也更多了。
现在我们可以得到一个大致结论,就是专家们对于“以钱投票”还是“以口投票”谁的预测准确度更高存在分歧(新的研究已经覆盖许多国家、总统以下的政治竞选、公投、以及非政治领域的竞赛)。
更加好玩的一件事情是,就我阅读所及,这些专家明显分成两个阵营,如同民主党和共和党一样,即使新的数据和他们的结论不同,他们依然不愿意改变自己的观点。
即使有了这样的认知,这篇文章本身依然没法对特朗普和拜登谁家最终胜出做出客观的判断,我只希望以第一张图引出的这篇文章可以给大家另外一个看待该图的角度。
警惕利用“大数据”概念新设特殊事件博彩预测
美国曾经有记者提议建立一个“恐怖袭击”的博彩市场。事缘“911事件”之后,调查发现就在事发前一两天,期权市场出现了大量买入两大航空公司看跌期权的合同,成交金额远远超出平时的交易量。恐怖袭击之后这些航空公司股价大跌,合同持有人获利巨大,但事后却无人认领(007系列电影《皇家赌场》就有恐怖份子提前卖空航空公司股票的情节)。该记者认为,博彩市场对政治事件的预测准确度很高,可以新设一个关于恐怖袭击的博彩市场,鼓励知情者“以钱投票”,一旦押注出现异常,情报机关就可以提前行动,阻止恶性事件发生。显然,这样的预测用民调是无法完成的。
我是在2002年看完科幻电影《少数派报告》之后不久读到这个想法的,当时第一反应就是假如真有这样一个市场,如果预测非常准确,那么就非常可能会被有恶念的人或者追求利润的企业用来为自己谋利,对社会造成破坏。有报道说CIA和FBI认真考虑过该记者的提议,但并无下文,今天也没有这样一个细分的博彩市场。以此来看,博彩预测不够准确反而是一件好事。
事实上,今天“大数据”、“机器学习”、“人工智能”备受欢迎,但对其弊端的反思早就体现在《少数派报告》这部电影里,科技公司利用这些技术,推送迎合选民偏好的信息,操纵投票和选举结果,并非科幻,而是既成事实。《脱欧:无理之战》这部电影只不过揭开这类行为的序幕而已。
同样让人担心的是,即使不采取高科技手段,仅以传统的电话访问或者街头问卷,通过议题和选项设置,受访人控制,操纵民意为小团体谋私利,损害全社会的所谓“科学民调”比比皆是。
最后,我们在欢迎真正客观、中立、科学的民调之外,告诉大家股市作为规模最大的博彩市场(区别在于前者并非凭空博弈,而是基于实体经济和政策等众多因素),为我们提供了一个准确度很高的预测方法:大选投票日前3个月,股价上涨则有利于在任党派的候选人,下跌则反之。1928-2016年23次总统大选,这一方法预测对了20次,包括民调错得最离谱的两次:杜鲁门的连任和特朗普的当选。1984-2016年,这一方法预测全对!
刚过去的8月,标普上涨7%,创下逾30年来最大8月涨幅,是不是有利特朗普连任呢?其实还不够,如果回到1928年,如果股市在8月上涨5%或者更多,6-8月的收益率又超过25%,那么9月和10月通常会表现不佳。当标普从8月底下跌到大选投票日之前,6次这样的情形都是现任党派输掉大选。
到底鹿死谁手,让我们拭目以待!