引言

背景

目前,我们的日常生活深受 2019 冠状病毒病(COVID-19)爆发的深远影响,确诊病例在过去几周内迅速增加。从 3 月中旬开始,各国、各大公司、企业、学校开始采取行动应对疫情。各国积极推动居民居家隔离,公司推行远程办公,企业开始暂停营业,学校开始转型为在线学习(E-Learning)。所有这些都是保持社会疏离的一部分。研究表明,保持社会疏离可以极大地减少传染病的感染。一个模型显示,如果 25% 的居民减少 50% 的日常社交互动,主要感染人数可减少 81%(Maharaj)。

核心材料

a. 使用二次最小二乘多项式(Quadratic Least Squares polynomial)来找出 COVID-19 在一段时间内新增病例的公式。
b. 使用理查森外推至 3 点中点公式(Richardson’s Extrapolation to the 3-point midpoint formula)来计算 COVID-19 新增病例的增长率。
c. 生成从 1 月 21 日开始、每 7 天为一个周期的时间段报告。

论点

即使有些人认为新型冠状病毒不严重,居家隔离也没有效果。本报告的目的是引起更多人对新型冠状病毒的关注,并鼓励人们居家隔离,因为与之前相比,人们开始关注新型冠状病毒的严重性。而且许多人开始自我隔离,新患者的比例也显著下降。

分析

数据收集

a. 我们的数据收集自约翰斯·霍普金斯大学 CSSE 的 2019 年新型冠状病毒 COVID-19 数据仓库(2019 Novel Coronavirus COVID-19 (2019-nCoV) Data Repository),其数据源自世界卫生组织(WHO)、美国疾病控制与预防中心(CDC)、欧洲疾病预防控制中心(ECDC)、国家卫生健康委员会(NHC)、丁香园(DXY)、1point3acres、Worldometers.info、BNO、COVID 追踪项目(the COVID Tracking Project)、各州和国家政府卫生部门以及地方媒体报告(Dong)。他们也承诺数据将频繁更新。提供的数据包含联邦信息处理标准代码(Dong);县名;省、州或依赖项名称;更新时间;地理编码;确诊病例数;死亡病例数;康复人数;现存病例数。总之,该数据源是可信且可用的。
b. 数据表


周次 开始日期 结束日期 新增病例 累计病例
第 1 周 01-21-20 01-27-20 5 5
第 2 周 01-28-20 02-03-20 6 11
第 3 周 02-04-20 02-10-20 1 12
第 4 周 02-11-20 02-17-20 0 12
第 5 周 02-18-20 02-24-20 2 14
第 6 周 02-25-20 03-02-20 43 57
第 7 周 03-03-20 03-09-20 588 645
第 8 周 03-10-20 03-16-20 3728 4373
第 9 周 03-17-20 03-23-20 38378 42751
第 10 周 03-24-20 03-30-20 117935 160686
第 11 周 03-31-20 04-06-20 202357 362952
第 12 周 04-07-20 04-13-20 215226 578178
第 13 周 04-14-20 04-20-20 197672 775850
第 14 周 04-21-20 04-27-20 206800 982650

^下载每日/每月数据表
c. 数据图
每周数据图

二次最小二乘多项式

Quadratic_least_squares_polynomial.m
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
%% Quadratic least squares polynomial
close all
clear
clc

x = [50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 ]';
y = [291 269 393 565 662 676 872 1291 2410 3948 5417 6271 8631 10410 9939 12226 17050 19046 20093 19118 20463 25396 26756 28879 32525 33725 25717 29359 30512 32282 34243 33578 31869 28057 24685 25987 29465 32076 30915 28084 26013 25132 25178 29246 32331 36137 34956 26929 22023]';

A = [x.^2 x ones(size(x))];
d = ((A'*A)^(-1)) * A' * y;
a = d(1); b = d(2); c = d(3);
fprintf('Model: f(x) = (%.5f)*x^2 + (%.5f)*x + (%.5f)\n', a, b, c)

hold on
plot(x,y,'r*')
pp=@(t) a.*t.^2+b.*t+c;
plot(x,pp(x))
xlabel('x')
ylabel('y')
title('天数对新增确诊病例')
legend('实际数据','二次最小二乘拟合','location','best')
box on; grid on;

^下载二次最小二乘多项式的 Matlab 代码
^下载三次最小二乘多项式的 Matlab 代码

模型公式: $$f(x)=(-25.91048)(x)^2+(4572.54925)x-171258.00999$$
模型图
尽管我们拥有的数据某种程度上存在噪声,我们仍然可以通过二次最小二乘多项式生成一个合理的模型公式。我们可以使用生成的多项式,并将其应用于理查森外推至 3 点中点公式。

理查森外推至 3 点中点公式

一旦我们使用二次最小二乘多项式得到了一个公式,我们就可以使用理查森外推至 3 点中点公式来得到它的一阶导数。在数值分析中,理查森外推法可以提高序列的收敛效率。而且理查森外推法在使用低阶公式时可以产生高精度的结果(Burden, 185)。
我们拥有的公式是 $f(x)=(-25.91048)(x)^2+(4572.54925)x-171258.00999$

Richardson_3_point_midpoint.java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
import java.util.Scanner;

class threePoint {
static double f(double x) {
return (-25.91048)*Math.pow(x,2)+(4572.54925)*x-171258.00999;
}

public static void main(String[] args){
double h;
double first;
double inputDay;
Scanner scnr = new Scanner(System.in);
System.out.println("请输入您的 h 值:");
h = scnr.nextDouble();
System.out.println("请输入您的天数 (Day):");
inputDay = scnr.nextDouble();
for(int i = 0; i < 3; i++){
double a = 0.5 / h;
first = a * (f((inputDay + h)) - f((inputDay - h)));
System.out.println("结果: " + first);
h = h / 2;
}
}
}

^下载理查森外推至 3 点中点公式的 Python 代码
输入天数 = 60,h = 4:

结果: 1463.2916425999992
结果: 1463.2916499999992
结果: 1463.2916500000138

$N_1 (4)=1463.2916425999992$
$N_1 (2)=1463.2916499999992$
$N_1 (1)=1463.2916500000138$
$N_2 (2)=N_1 (1)+\frac{1}{3} [N_1 (1)-N_1 (2)]=1463.29165+\frac{1}{3} [1463.29165-1463.29165]=1463.29165$
$N_2 (4)=N_1 (2)+\frac{1}{3} [N_1 (2)-N_1 (4)]=1463.29165+\frac{1}{3} [1463.29165-1463.29164]=1463.29165$
$N_3 (4)=N_2 (2)+\frac{1}{5} [N_2 (2)-N_2 (4)]=1463.29165+\frac{1}{5} [1463.29165-1463.29165]=1463.29165$

输入天数 = 70,h = 4:
$N_1 (4)=945.0820499999973$
$N_1 (2)=945.0820499999973$
$N_1 (1)=945.0820499999973$
$N_2 (2)=N_1 (1)+\frac{1}{3} [N_1 (1)-N_1 (2)]=945.08205+\frac{1}{3} [945.08205-945.08205]=945.08205$
$N_2 (4)=N_1 (2)+\frac{1}{3} [N_1 (2)-N_1 (4)]=945.08205+\frac{1}{3} [945.08205-945.08205]=945.08205$
$N_3 (4)=N_2 (2)+\frac{1 }{5} [N_2 (2)-N_2 (4)]=945.08205+\frac{1}{5} [945.08205-945.08205]=945.08205$

输入天数 = 80,h = 4:
$N_1 (4)=426.8724499999953$
$N_1 (2)=426.87245000000985$
$N_1 (1)=426.87244999998074$
$N_2 (2)=N_1 (1)+\frac{1}{3} [N_1 (1)-N_1 (2)]=426.87245+\frac{1}{3} [426.87245-426.87245]=426.87245$
$N_2 (4)=N_1 (2)+\frac{1}{3} [N_1 (2)-N_1 (4)]=426.87245+\frac{1}{3} [426.87245-426.87245]=426.87245$
$N_3 (4)=N_2 (2)+\frac{1}{5} [N_2 (2)-N_2 (4)]=426.87245+\frac{1}{5} [426.87245-426.87245]=426.87245$

输入天数 = 90,h = 4:
$N_1 (4)=-91.33715000000302$
$N_1 (2)=-91.33715000000666$
$N_1 (1)=-91.33715000000666$
$N_2 (2)=N_1 (1)+\frac{1}{3} [N_1 (1)-N_1 (2)]=-91.33715+\frac{1}{3} [-91.33715+91.33715]=-91.33715$
$N_2 (4)=N_1 (2)+\frac{1}{3} [N_1 (2)-N_1 (4)]=-91.33715+\frac{1}{3} [-91.33715+91.33715]=-91.33715$
$N_3 (4)=N_2 (2)+\frac{1}{5} [N_2 (2)-N_2 (4)]=-91.33715+\frac{1}{5} [-91.33715+91.33715]=-91.33715$

结论

总结

本项目应用了两种方法:二次最小二乘多项式和理查森外推至 3 点中点公式。二次最小二乘多项式用于发现公式,理查森外推至 3 点中点公式用于发现病例增长率。在 Matlab 中计算二次最小二乘多项式时生成了一个图形,清晰地显示了 COVID-19 爆发随时间的多项式趋势。

准确性

通过分析数据,我们可以很容易地发现数据存在极大的噪声,这限制了数值分析方法的使用。然而,多项式最小二乘法可以解决这个问题;它可以生成一个低次多项式,用于估计潜在的多项式(Kalman)。
我们将理查森外推法用于数据分析,我们可以看到结果越来越收敛于真实解。

结论

从上面的分析结果来看,即使存在噪声数据,二次最小二乘多项式也能给我们提供最佳拟合线。由于许多组织和学校鼓励人们自我隔离,而且第 60 天、第 70 天、第 80 天和第 90 天的结果给出了公式的导数(即增长率),所有这些数据都表明新增病例在持续减少。我们可以很容易地得出结论,随着社会疏离措施的努力,包括政府官员、医务工作者和美国所有居民的辛勤工作,感染率将下降到一个稳定的阶段,并将逐渐消失。

参考文献

  1. Burden, Richard L., and J. Douglas. Faires. Numerical Analysis. Brooks/Cole, Cengage Learning, 2011.
  2. Dong, Ensheng, et al. “An Interactive Web-Based Dashboard to Track COVID-19 in Real Time.” The Lancet Infectious Diseases, 19 Feb. 2020, www.thelancet.com/journals/laninf/article/PIIS1473-3099(20)30120-1.
  3. Kalman, R. E. “A New Approach to Linear Filtering and Prediction Problems.” Journal of Basic Engineering, American Society of Mechanical Engineers Digital Collection, 1 Mar. 1960, https://asmedigitalcollection.asme.org/fluidsengineering/article-abstract/82/1/35/397706/A-New-Approach-to-Linear-Filtering-and-Prediction.
  4. Maharaj, Savi, and Adam Kleczkowski . “Controlling Epidemic Spread by Social Distancing: Do It Well or Not at All.” BMC Public Health, 20 Aug. 2012, https://bmcpublichealth.biomedcentral.com/articles/10.1186/1471-2458-12-679.