品玩

科技创新者的每日必读

打开APP
关闭
预测模型

疫情是否在好转?看Instagram创始人打造的新冠传播预测模型怎么说

​了解 Rt 数值,就能预测新冠在你所在州是否正在继续扩散。

光谱

发布于 2020年4月22日

虽然中国已经很大程度上结束了紧急状态,但新冠肺炎疫情在全球并没有好转的迹象:截至4月20日,确诊人数达240万,死亡人数超过16.5万,且仍在持续增长中。

疫情到底什么时候能够结束?这已经成为悬在所有人心头的问题。遗憾的是,许多流行病学专家都对病情能够彻底结束持悲观态度,认为新冠最终可能演化为常态存在的地方性流行病。

在流行病学上有一个指标,可以指出病情在一定区域内的传播情况。

这个数值就是 R,全称实时有效传染数 (effective reproduction number)。简单来说,它就是感染某流行病的一个患者,在任意时间能够传染的人数。

昨天,Instagram 联合创始人 Kevin Systrom 发布了一个新冠病毒的 Rt 预测模型(Rt = R 值加上时间变化)。

他还和另一位联合创始人 Mike Krieger 一起,做了一个网站 Rt.live,能够实时追踪美国50个州各自的 Rt 数值。通过观察这个数值,人们能够一眼看出 Covid-19 在各州的扩散增幅如何,抑或正在逐渐得到控制。

但是在看这个网站之前,我们首先需要理解 Rt 的具体含义。

有效传染数 Rt 是什么?

你可能听说过 R0(读作 R-naught)这个概念,中文名叫做基本传染数。它指的是在一个给定的环境下,不考虑时间等其他因素,一个病人平均能够感染的人数。数值越高,疾病的传染能力越强。

此前美国 CDC 计算的新冠病毒 R0 在2.2-2.7之间,如果不加控制的话每2-3天感染者数量翻倍一次。

但是考虑到疾控措施的存在,以及不断变化的情况,R 数值每天都有可能发生浮动。Rt 就是 R 值加上时间变化。

观察这个数值很有意义。如果 R 值大于1,说明疾病将会继续扩散;如果小于1,说明一个确诊病人的感染能力被限制了,疾病的传染会自行消退,直至最终消失。

“R0 是大家都知道的数值,就是 t=0 的数值。但是,R0 只是一个单一指标,对人们行为和疾控措施的适应性不够强。” Kevin Systrom 在他的 GitHub 页面上写道,随着疫情发展,增加和减少疾控措施都会对 Rt 带来变化,因此了解当前的 Rt 数值是很重要的。

观察 Rt 数值有很强的指导意义。它可以帮助人们理解目前的疾控措施是否有效,还可以辅佐人们作出决定,是否需要继续增加或者减少疾控方面的限制措施。

不过 Systrom 指出,目前世界上采用这个思路的国家和地区并不多,只有港大公共卫生学院在追踪香港的 Rt 数值。

而且,他还认为追踪一个国家的 Rt 意义不大,粒度必须要细化到当地,比如州、县和城市级别。

所以他从美国各州和地方的卫生部门的报告当中提取的新冠检测和确诊数据,制作了这个网站。从这些数据中,我们可以看出美国新冠疫情控制的情况。

美国新冠疫情控制的如何?

前面我们提到,R 值越低,疾病的传染能力越低。而 Rt.live 网站就是以 Rt=1 为分水岭,列出了各州的数据:

从网站首页的这张互动图表中可以看出,左侧绿色的州在4月18日的 Rt<1:

  1. 佛罗里达=0.99
  2. 俄勒冈州=0.89
  3. 密歇根州=0.88
  4. 康涅狄格州=0.42

靠右侧红色的州的 Rt 数值高于1:

  1. 纽约州=1.0
  2. 北卡罗来纳州:1.1
  3. 马萨诸塞州=1.2
  4. 得克萨斯州=1.2
  5. 加利福尼亚州=1.3
  6. 华盛顿州=1.4
  7. 俄亥俄州=1.6
  8. 北达科他州=1.7

同时,网站也提供了各州的 Rt 数值在过去一个月里变化的曲线。

可以看出加州在4月6日到11日期间短暂跌落到1以下,近日又有所回升。

纽约州在3月中旬经历了高峰。好在,可能是由于强有力的疾控措施,包括居家隔离的倡议等等,病毒传播在当月下旬有了很好的控制。

所有州的曲线图,在最近几天似乎都有小幅回升。看起来康涅狄格州控制的最好,虽然有波动,但总体呈下降的趋势,显示出该州境内疾控措施的有效性。

如何预测 Rt?

首先需要指出的是,这是一个预测模型,基于是过去几天内报告的核酸检测和确诊患者等数据,并不是绝对真实的 Rt 数值。

Systrom 采用的方法,基础是2008年 Luís Bettencourt 和 Ruy Ribeiro 等人发表的一篇论文,基于贝叶斯方法,加入高斯噪声预测随时间变化的 R 值。

基础公式如下:在 Rt 时间发现 k 数量的新增病例的可能性,乘以 Rt 时间的可能性,除以发现 k 数量新增病例的可能性,就能得到 Rt 分布的区间。

随着时间变化,再用前一天的数值预测今天的数值。

同时,预测模型还需要一个在某天新增某数量患者 λ 的可能性函数:

那么,根据已有的新增病例数值,可以预测出在未来几天内的 Rt 可能分布的区间:

在还未引入真实世界数据的前提下,Systrom 对算法进行了一些优化,你可以在他的 GitHub 页面上看到具体的算法设计思路。

接下来就是加入美国各州汇报的病例数据进行验证和进一步优化。你可以在 The Covid Tracking Project 的网站 covidtracking.com 上找到这些数据。

这些数据的可靠性没问题,因为直接来自公共卫生部门,但是真实性需要打些折扣,因为核酸检测能力不足,理论上当日新增的病患中的一部分可能来自前一天积压。所以 Systrom 针对此情况对时序数据进行了高斯滤波。

最后,运行算法,根据之前的公式就可以计算出 Rt。然后剩下的就只是把所有州的预测数值跑出来、制图。本文只是对 Systrom 所采用的思路做一个简单的介绍,如果对算法有兴趣或者问题,可以访问 GitHub 页面(点击阅读原文,网站上有入口)。

Systrom 也指出,目前的这个模型有几个已知的问题。比如,如果真实世界里的核酸检测能力激增或者锐减,都会对数值准确度产生影响;检测阳性和症状出现之间有延迟,无法通过这个模型体现;以及,作为一个纯数学的预测模型,它的结果无法完美预言真实世界的情况。

其它预测

此前,Kevin Systrom 就对美国疫情有过一些基于数学模型的预测。

比如,根据3月底当时纽约市的数据,据他计算,如果任意挑出250人,所有人都未感染的几率只有56%。250人差不多是纽约市一个普通人所认识的其他人的数量,这意味着整个纽约市有44%的市民至少认识一位感染者。

再比如,如果在纽约市开一间星巴克,按照每天1000位客人计算,每天不会有感染者进门的几率有多少?

答案如下图,可以看出从3月15日开始,几率越来越低。有趣的是,星巴克也在那一天宣布了关闭纽约市所有的门店。

他还做过一个有趣的计算:如果不听劝,非要出门在自己的城市里活动,而且有90%的信心不会碰到感染者——要满足你的舒适度底线,城市最大的人口数量是多少?

他算出来,在3月初,美国人还没意识到疫情有多严重的时候,城市人口最多可以有不到100万人;如果95%不会碰到感染者是你的舒适度底线,那么城市人口大约40多万人;97%对应25万人左右;99%=大约10万。

但是随着疫情逐渐升级,能够满足舒适度的人口极限数量快速下降。在这个推导模型中,到了3月底,无论你认为自己的运气有多好,出门都几乎一定会碰见感染者。

由此他希望说明,在这样的一个危机时刻,居家隔离是人们保护自己的最佳方式,而出入公共场合是十分危险的。

Kevin Systrom 其人

Kevin Systrom 和 Mike Krieger 在2018年突然宣布离开 Facebook 以及他们所创立的 Instagram。

Instagram 是美国在移动互联网时代的第一个现象级产品。Systrom 从小热爱编程,曾经是 AOL 旗下 AIM 软件商的黑客,开发了能够发送大量垃圾信息导致对方账号掉线的插件。

本科毕业后,Systrom 先后加入 Twitter、Google 等众多公司,虽然并非计算机科学专业,但是一直在保持自学编程,斯坦福在读期间和 Krieger 都参加过斯坦福享誉盛名的 Mayfield Fellow Program 创业培训课程。

二人的第一次创业做的是一个名叫 Burbn 的签到软件,但是后来发现用户很喜欢用里面的照片滤镜功能,经过一番争论,最终他们作出了 Instagram,Systrom 担任 CEO,受过正规计算机训练的 Krieger 担任工程负责人。新产品上线当天用户量突破2.5万,一周突破10万,第二个月100万,到了第二年月活跃用户突破5,000万。

被 Facebook 收购后,Instagram 想过继续小而独立,但是最终未能幸免附庸于 Facebook 这个社交庞然巨兽。两位联合创始人对扎克伯格事无巨细的管理和对产品设计风格的侵犯,感到十分厌烦,甚至遭到了扎克伯格撤回对 Instagram 产品增长支持的威胁。最终,二人离开了公司。

Rt.live 是二人在从 Instagram 离职之后首次携手开发的一个新产品。Systrom 主要负责数据分析和算法设计,Krieger 负责产品和网站设计。

下载品玩App,比99.9%的人更先知道关于「预测模型」的新故事

下载品玩App

比99.9%的人更先知道关于「预测模型」的新故事

iOS版本 Android版本
立即下载
光谱

品驾 高级主笔,关注汽车相关前沿技术和产业链。原品玩硅谷主笔。欢迎联系我交流行业信息,分享新闻线索

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测