扫一扫下载界面新闻APP

“抢报”全球确诊500万,这个统计网站是怎么运作的?

只增不减,从不修订。

图片来源:pexels

记者 | 肖恩

新冠肺炎的全球数字统计,让世人在一个知名学府之外,又认识了一个原本名不见经传的统计网站。

据美国数据统计网站worldometer的实时数据,截至北京时间5月20日22:32,全球新冠肺炎确诊达5018667,早已突破500万的关口。但美国约翰斯·霍普金斯大学(JHU)同一时间点的统计显示,这一数字为4929455例,距前者有近9万的差距。

图片来源:worldometer
图片来源:JHU

其中西班牙的情况则更令人困惑。据JHU的数据,截至5月20日下午21时,该国累计确诊232037例,居全球第5,与该国卫生部的数字一致。但同一时间worldometer的数据为278803,列各国第3,仅次于美国和俄罗斯。

各网站统计的数据因为实时更新,且来源有差异,略高于官方一天一次发布的数据是正常现象。但在西班牙的数据上,worldometer比官方和JHU高出了46766,而该国前一日新增病例仅615例,不足以填补误差。

4月中旬,西班牙卫生部因增加了血清检测手段,加上部分地区在死亡人数统计中包括了并未确诊的病例,导致混乱。随后中央政府发布新文件,要求各大自治区以统一标准报送每日统计数据,包括死亡病例统计标准、对有症状和无症状感染者分类等内容。

目前西班牙卫生部通报的数据仅包括经聚合酶链式反应(PCR)检测后确诊的病例。而西班牙此前对3万个家庭仅5万人进行血清抗体检测后,有35408人的结果呈阳性。

worldometer的500万例中无疑就包括了西班牙近5万的“水分”,这一部分是否就是通过血清检测确诊的人数?这个原本鲜为人知的网站又是什么来头?

数据来源成谜

最早因实时发布疫情数据成为“网红”的是JHU,worldometer则是它的数据来源之一。随着疫情不断发酵,worldometer也从幕后走向台前,甚至得到英国、泰国、巴基斯坦、越南、斯里兰卡等国政府的信任。

英国政府就曾频繁在例行发布会上引用其数据,但从4月15日起就把数据来源改为JHU,理由是JHU数据来源大多是官方数据,更权威、可靠。

AXIOS新闻网援引的统计数据报道,仅4月份worldometer的浏览量就超过10亿次,高于职场社交网络LinkedIn,较2019年4月上涨了36928%。

但随着知名度提升,worldometer的数据准确性也不断被质疑。

JHU的统计数据以国家政府的官方数据为主,其他辅助来源包括地方政府、媒体以及数据统计网站,例如中国部分就来自医学社会化网络丁香园的数据库。JHU未透露其使用了worldometer的哪些内容。

根据医学期刊《柳叶刀》2月发布的文章,1月疫情刚开始时,JHU是通过人工收集更新数据。病例数量开始爆发式增长后,他们开始采用半自动的数据更新流程,部分数据是从政府部门和统计网站上自动抓取,但会进行标记,以便随时检查;超过设定阈值的数据则会在人工审核后发布。

worldometer的数据来源则更复杂。任何人都可以通过其官方网站上报,只需提供数字来源链接和相应的验证链接,无需提供上报者身份。网站称,由分析师和研究人员组成的团队会对数据进行核实,运行方式与维基百科类似。

worldometer数据上报页面

JHU的疫情数据统计也曾出现错误。4月13日他们把全球确诊数从200万下调至190万,原因是来自美国佛罗里达州的统计出现乌龙,多算了10万例。而worldometer似乎从不修正数据。

维基百科的编辑戈麦斯(Mario Gómez)称,worldometer取材没有固定标准,总是取最高值,数字来源和可靠性都不在他们的首要考虑范围内。已经有数名维基百科编辑表示,不会使用worldometer作为疫情数据来源。

美国耶鲁大学流行病学教授皮策(Virginia Pitzer)则称,worldometer的数据大部分来源都是政府数据,看上去似乎比较可信,但也存在错误和矛盾,尤其是现存病例数的问题挺大,因为网站的治愈数并不是实时更新,进而及时修订现存病例数。她还留意到,4月24日这一天,worldometer上西班牙的治愈为18000,但该国政府当时报的仅为3105。

西班牙首相办公室的发言人称,worldometer同时纳入了该国PCR检测和血清抗体检测两项结果,并把叠加数值公布。鉴于并不是所有国家都会通报抗体检测数据,这种计算方法本身就不科学,还导致全球确诊数“提前”突破了500万例。

神秘“团队”

综合多家美国媒体报道,worldometer创建于2004年,创建人是一名当时刚移民到纽约的俄罗斯程序员阿利梅托夫(Andrey Alimetov)。因为经营困难,不到两年后,阿利梅托夫以2000美元把它卖给了一个名叫达里奥(Dario)的人。

随后网站又被多次易手,数据内容也越来越丰富。2011年worldometer被美国图书馆协会评选为最佳免费参考网站之一。

在本次疫情发生之前,worldometer就提供各领域多种统计数据,从全球人口和新生儿,每年汽车产量,到美军在伊拉克死亡人数,并有34种使用语言。每一项数据被称为“计数器”(Counter),其他网站可以购买其使用权,将该“计数器”复制到自己网站上。

如果按年购买使用许可,worldometer一个“计数器”每月的费用为35美元。如果是单次使用,一个计数器的价格为210美元,期限为90天。顾客主要是企业以及各种组织。

worldmeter网站的自我介绍称,他们的研究团队从最可靠的来源获取数据,并持续追踪。每个“计数器”都设有高级算法,从中央服务器的算法中下载相关数据,并随着实时更新而在前端显示现行估值。

如今网站的所有者是一家名为Dadax的美国公司。美国有线电视新闻网(CNN)称,该公司旗下的网站有超过20个,其中几个也是实时数据统计网站,还有部分已停用。

worldometer自称由“开发者、研究人员和志愿者组成的国际化团队”运营,但CNN查阅了公开数据后指出,没有证据表明该公司组建了这样一支队伍,也不确定是否有固定的工作人员审核数据准确性。从去年10月至今,该公司没有发布招聘信息,但其官网上有一个招募开发志愿者的通告,目前仍然有效。

根据官网上的资料,worldometer专门组建了一个多语种团队持续监控各国发布会直播,以及其他数据源,实时更新疫情数据。与维基百科不同,worldometer的运营团队全部匿名,网站上也没有任何互动栏目。

worldometer神秘的团队和操作方式,让本就错综复杂的疫情面貌变得更模糊。

牛津大学数据统计小组Our World in Data创始人罗塞(Max Roser)就抱怨称,总是有读者质疑,为什么他们的数据与worldometer不同,但他们自己查看后却发现这些数据没有确切来源,或者存在差错。

未经正式授权严禁转载本文,侵权必究。
表情
您至少需输入5个字

评论 0

相关文章

推荐阅读