引言
背景
目前,我们的日常生活深受 2019 冠状病毒病(COVID-19)爆发的深远影响,确诊病例在过去几周内迅速增加。从 3 月中旬开始,各国、各大公司、企业、学校开始采取行动应对疫情。各国积极推动居民居家隔离,公司推行远程办公,企业开始暂停营业,学校开始转型为在线学习(E-Learning)。所有这些都是保持社会疏离的一部分。研究表明,保持社会疏离可以极大地减少传染病的感染。一个模型显示,如果 25% 的居民减少 50% 的日常社交互动,主要感染人数可减少 81%(Maharaj)。
核心材料
a. 使用二次最小二乘多项式(Quadratic Least Squares polynomial)来找出 COVID-19 在一段时间内新增病例的公式。
b. 使用理查森外推至 3 点中点公式(Richardson’s Extrapolation to the 3-point midpoint formula)来计算 COVID-19 新增病例的增长率。
c. 生成从 1 月 21 日开始、每 7 天为一个周期的时间段报告。
论点
即使有些人认为新型冠状病毒不严重,居家隔离也没有效果。本报告的目的是引起更多人对新型冠状病毒的关注,并鼓励人们居家隔离,因为与之前相比,人们开始关注新型冠状病毒的严重性。而且许多人开始自我隔离,新患者的比例也显著下降。
分析
数据收集
a. 我们的数据收集自约翰斯·霍普金斯大学 CSSE 的 2019 年新型冠状病毒 COVID-19 数据仓库(2019 Novel Coronavirus COVID-19 (2019-nCoV) Data Repository),其数据源自世界卫生组织(WHO)、美国疾病控制与预防中心(CDC)、欧洲疾病预防控制中心(ECDC)、国家卫生健康委员会(NHC)、丁香园(DXY)、1point3acres、Worldometers.info、BNO、COVID 追踪项目(the COVID Tracking Project)、各州和国家政府卫生部门以及地方媒体报告(Dong)。他们也承诺数据将频繁更新。提供的数据包含联邦信息处理标准代码(Dong);县名;省、州或依赖项名称;更新时间;地理编码;确诊病例数;死亡病例数;康复人数;现存病例数。总之,该数据源是可信且可用的。
b. 数据表
| 周次 | 开始日期 | 结束日期 | 新增病例 | 累计病例 |
| 第 1 周 | 01-21-20 | 01-27-20 | 5 | 5 |
| 第 2 周 | 01-28-20 | 02-03-20 | 6 | 11 |
| 第 3 周 | 02-04-20 | 02-10-20 | 1 | 12 |
| 第 4 周 | 02-11-20 | 02-17-20 | 0 | 12 |
| 第 5 周 | 02-18-20 | 02-24-20 | 2 | 14 |
| 第 6 周 | 02-25-20 | 03-02-20 | 43 | 57 |
| 第 7 周 | 03-03-20 | 03-09-20 | 588 | 645 |
| 第 8 周 | 03-10-20 | 03-16-20 | 3728 | 4373 |
| 第 9 周 | 03-17-20 | 03-23-20 | 38378 | 42751 |
| 第 10 周 | 03-24-20 | 03-30-20 | 117935 | 160686 |
| 第 11 周 | 03-31-20 | 04-06-20 | 202357 | 362952 |
| 第 12 周 | 04-07-20 | 04-13-20 | 215226 | 578178 |
| 第 13 周 | 04-14-20 | 04-20-20 | 197672 | 775850 |
| 第 14 周 | 04-21-20 | 04-27-20 | 206800 | 982650 |
^下载每日/每月数据表
c. 数据图
二次最小二乘多项式
1 | %% Quadratic least squares polynomial |
^下载二次最小二乘多项式的 Matlab 代码
^下载三次最小二乘多项式的 Matlab 代码
模型公式: $$f(x)=(-25.91048)(x)^2+(4572.54925)x-171258.00999$$
尽管我们拥有的数据某种程度上存在噪声,我们仍然可以通过二次最小二乘多项式生成一个合理的模型公式。我们可以使用生成的多项式,并将其应用于理查森外推至 3 点中点公式。
理查森外推至 3 点中点公式
一旦我们使用二次最小二乘多项式得到了一个公式,我们就可以使用理查森外推至 3 点中点公式来得到它的一阶导数。在数值分析中,理查森外推法可以提高序列的收敛效率。而且理查森外推法在使用低阶公式时可以产生高精度的结果(Burden, 185)。
我们拥有的公式是 $f(x)=(-25.91048)(x)^2+(4572.54925)x-171258.00999$
1 | import java.util.Scanner; |
^下载理查森外推至 3 点中点公式的 Python 代码
输入天数 = 60,h = 4:
结果: 1463.2916425999992
结果: 1463.2916499999992
结果: 1463.2916500000138
$N_1 (4)=1463.2916425999992$
$N_1 (2)=1463.2916499999992$
$N_1 (1)=1463.2916500000138$
$N_2 (2)=N_1 (1)+\frac{1}{3} [N_1 (1)-N_1 (2)]=1463.29165+\frac{1}{3} [1463.29165-1463.29165]=1463.29165$
$N_2 (4)=N_1 (2)+\frac{1}{3} [N_1 (2)-N_1 (4)]=1463.29165+\frac{1}{3} [1463.29165-1463.29164]=1463.29165$
$N_3 (4)=N_2 (2)+\frac{1}{5} [N_2 (2)-N_2 (4)]=1463.29165+\frac{1}{5} [1463.29165-1463.29165]=1463.29165$
输入天数 = 70,h = 4:
$N_1 (4)=945.0820499999973$
$N_1 (2)=945.0820499999973$
$N_1 (1)=945.0820499999973$
$N_2 (2)=N_1 (1)+\frac{1}{3} [N_1 (1)-N_1 (2)]=945.08205+\frac{1}{3} [945.08205-945.08205]=945.08205$
$N_2 (4)=N_1 (2)+\frac{1}{3} [N_1 (2)-N_1 (4)]=945.08205+\frac{1}{3} [945.08205-945.08205]=945.08205$
$N_3 (4)=N_2 (2)+\frac{1 }{5} [N_2 (2)-N_2 (4)]=945.08205+\frac{1}{5} [945.08205-945.08205]=945.08205$
输入天数 = 80,h = 4:
$N_1 (4)=426.8724499999953$
$N_1 (2)=426.87245000000985$
$N_1 (1)=426.87244999998074$
$N_2 (2)=N_1 (1)+\frac{1}{3} [N_1 (1)-N_1 (2)]=426.87245+\frac{1}{3} [426.87245-426.87245]=426.87245$
$N_2 (4)=N_1 (2)+\frac{1}{3} [N_1 (2)-N_1 (4)]=426.87245+\frac{1}{3} [426.87245-426.87245]=426.87245$
$N_3 (4)=N_2 (2)+\frac{1}{5} [N_2 (2)-N_2 (4)]=426.87245+\frac{1}{5} [426.87245-426.87245]=426.87245$
输入天数 = 90,h = 4:
$N_1 (4)=-91.33715000000302$
$N_1 (2)=-91.33715000000666$
$N_1 (1)=-91.33715000000666$
$N_2 (2)=N_1 (1)+\frac{1}{3} [N_1 (1)-N_1 (2)]=-91.33715+\frac{1}{3} [-91.33715+91.33715]=-91.33715$
$N_2 (4)=N_1 (2)+\frac{1}{3} [N_1 (2)-N_1 (4)]=-91.33715+\frac{1}{3} [-91.33715+91.33715]=-91.33715$
$N_3 (4)=N_2 (2)+\frac{1}{5} [N_2 (2)-N_2 (4)]=-91.33715+\frac{1}{5} [-91.33715+91.33715]=-91.33715$
结论
总结
本项目应用了两种方法:二次最小二乘多项式和理查森外推至 3 点中点公式。二次最小二乘多项式用于发现公式,理查森外推至 3 点中点公式用于发现病例增长率。在 Matlab 中计算二次最小二乘多项式时生成了一个图形,清晰地显示了 COVID-19 爆发随时间的多项式趋势。
准确性
通过分析数据,我们可以很容易地发现数据存在极大的噪声,这限制了数值分析方法的使用。然而,多项式最小二乘法可以解决这个问题;它可以生成一个低次多项式,用于估计潜在的多项式(Kalman)。
我们将理查森外推法用于数据分析,我们可以看到结果越来越收敛于真实解。
结论
从上面的分析结果来看,即使存在噪声数据,二次最小二乘多项式也能给我们提供最佳拟合线。由于许多组织和学校鼓励人们自我隔离,而且第 60 天、第 70 天、第 80 天和第 90 天的结果给出了公式的导数(即增长率),所有这些数据都表明新增病例在持续减少。我们可以很容易地得出结论,随着社会疏离措施的努力,包括政府官员、医务工作者和美国所有居民的辛勤工作,感染率将下降到一个稳定的阶段,并将逐渐消失。
参考文献
- Burden, Richard L., and J. Douglas. Faires. Numerical Analysis. Brooks/Cole, Cengage Learning, 2011.
- Dong, Ensheng, et al. “An Interactive Web-Based Dashboard to Track COVID-19 in Real Time.” The Lancet Infectious Diseases, 19 Feb. 2020, www.thelancet.com/journals/laninf/article/PIIS1473-3099(20)30120-1.
- Kalman, R. E. “A New Approach to Linear Filtering and Prediction Problems.” Journal of Basic Engineering, American Society of Mechanical Engineers Digital Collection, 1 Mar. 1960, https://asmedigitalcollection.asme.org/fluidsengineering/article-abstract/82/1/35/397706/A-New-Approach-to-Linear-Filtering-and-Prediction.
- Maharaj, Savi, and Adam Kleczkowski . “Controlling Epidemic Spread by Social Distancing: Do It Well or Not at All.” BMC Public Health, 20 Aug. 2012, https://bmcpublichealth.biomedcentral.com/articles/10.1186/1471-2458-12-679.