同城医药问答网

 找回密码
 立即注册
查看: 134|回复: 20

基于院士样本的新冠疫情分析

[复制链接]

2

主题

3

帖子

7

积分

新手上路

Rank: 1

积分
7
发表于 2023-1-7 18:06:02 | 显示全部楼层 |阅读模式
1,背景

在下面这个2022年12月23日的回答中:
Gemfield首次基于院士离世的数据进行了新冠病毒—奥密克戎的致病性分析。本文基于这一想法,新增了所有去世院士的数据,并扩展了几个新的维度,使得结果更加详实可靠。这些维度有:

  • 去世人数变化;
  • 平均去世年龄变化;
  • 搜索指数交叉验证。
并最后给出量化后的新冠病毒之奥密克戎的破坏力。
阅读本文前,请注意以下事项:

  • 院士每两年(奇数年)增选一次,增选名额基数为60名(增加不到10%);
  • 院士主要居住在北京,北京市2022年12月6日起公共场所不再查验核酸;
  • 奥密克戎感染一般会在9天到12天左右发展成重症,意味着2022年12月18日前后是一个重要节点;
  • 2020年1月20日开始宣布戴口罩措施,因此2020年2月1日是一个重要节点;
  • 截至到2023年1月1日,科学院去世666人,平均年龄84.2岁;工程院去世院士293人,平均年龄84.9岁。基于平均年龄相差不大的事实,本文将合并两院院士的数据进行分析。工程院院士去世年龄大一点,是因为早年没有工程院。
2,去世人数变化

从以下方面来分析:

  • 每年去世人数;
  • 每年12月去世人数;
  • 滑动窗口内去世人数;
  • 每个月份上各年去世人数之和。
2.1,每年去世人数




每年死亡人数

可以看到2022年出现了大幅增长。
2.2,每年12月去世人数




每年12月死亡人数

可以看到2022年12月份出现了异乎寻常的增长。

  • 观察1:12月份去世院士数量是过往三年12月份平均值的6.5倍;
  • 猜想1:奥密克戎病毒的快速传播造成了12月份去世数据的飙涨;
  • 猜想2:疫情期间封控、口罩等新的环境变化,使得去世院士数量在2020年、2021年12月份出现下降。
2.3,滑动窗口内去世人数

滑动窗口长度为2个月,步长为两例之间的间隔:



设置长度为2个月的窗口,从57年滑动到现在

图中标出了从57年滑动到现在出现的异常窗口(死亡人数显著突破此前历史记录),从左到右的窗口时间依次为:

  • 62.06.09 ~ 62.08.02
  • 68.10.16 ~ 68.12.05
  • 72.01.01 ~ 72.02.21
  • 92.11.04 ~ 92.12.28
  • 02.11.01 ~ 03.01.01
  • 05.08.08 ~ 05.10.06 ~ 05.11.04
  • 07.12.02 ~ 08.02.02
  • 12.05.31 ~ 12.07.21
  • 14.11.10 ~ 15.01.10
  • 22.11.02 ~ 23.01.01
可以看到,10个异常窗口,有7个在冬季。其它三个窗口中,1个在62年夏天、1个在05年夏天/秋天、1个在12年夏天,不知道有什么特别的原因。此外,2015年之后到2022年12月之间没再出现异常窗口。

  • 观察2:14.11.10 ~ 15.01.10是距离现在最近的一个异常窗口,而22.11.02 ~ 23.01.01异常窗口的去世人数已经达到14.11.10 ~ 15.01.10窗口的2倍,并且随着时间推移,这一数字有可能达到4倍;
  • 猜想3:冬季容易造成去世人数创新高;
  • 猜想4:对身体比较友好的季节分别是春天、秋天、夏天、冬天;
  • 猜想5:2015年春天到2022年12月之前,长达近8年的时间内再无异常窗口出现(尤其在人口老龄化的背景下),猜测在医疗技术、环境、气候、空气等某些方面出现了巨大变化;
  • 猜想6:每个创新高的时间窗口背后,必定和某种事物有因果关系(如气候、疾病或其它灾害),而不是简单的随机事件。
2.4,每个月份上各年去世人数之和

由于2020年1月是特殊节点,因此我分三阶段统计:

  • 最早 ~ 2020.01.24;
  • 2020.02.14 ~ 2022.02.14;
  • 2022.03.01 ~ 2023.01.01。



最早 ~ 2020.01.24

观察3:2020年之前,每年11月到次年1月去世人数略高于每年5月/7月,略高于每年其它月份。



2020.02.14 ~ 2022.02.14

猜想7:2020年2月开始的两年时间,由于防控、口罩等原因,11月到次年1月去世人数明显下降。


受奥密克戎快速传播的影响,12月去世人数显著增加。这一点佐证了【猜想1】。
3,寿命变化

从以下方面来分析:

  • 每年去世平均年龄;
  • 滑动窗口内平均年龄。
3.1,每年去世平均年龄




  • 观察4:院士去世平均年龄从上世纪50年代的60岁,稳步增长到如今的91岁;
  • 观察5:2021年全国人均预期寿命为78.2岁、北京户籍居民人均预期寿命为82岁、今年院士去世平均年龄为91.3岁;
  • 猜想8:导致寿命差距的本质原因在于经济收入、工作环境、居住环境、休假、医疗资源。假使我们发展经济,提升产业链、医疗资源、工作环境、居住环境,使得未来某年全国人均的收入、休假、医疗、工作居住环境水平能达到2022年院士的水平,那就能使得平均每年1千万~2千万人免于提前13年离世
3.2,滑动窗口内平均年龄

先后去世的12个人组成一个窗口,去掉max和min以平滑曲线,如果窗口周期横跨超过3个月则不予标注(相当于样本密度小,失去了平均意义)。从1957年滑动到现在,如下所示:


Gemfield在图中一共标了4个箭头,从左到右分别是:

  • 2014.11.11 ~2015.01.10,这个点有着非比寻常的含义,创下了平均寿命下降9岁的记录;
  • 2022.03.16 ~ 2022.06.12,该窗口的平均年龄首次突破95岁大关;
  • 2022.10.22 ~ 2022.12.21,最后一个高点;
  • 此刻,窗口平均年龄开始下降,快速下滑3岁。
那么

  • 观察6:奥密克戎快速传播后,窗口平均年龄开始下降;但是这个波动仍在正常范围以内,几乎是历次波动的平均水平(注意:仍需继续观察1个月);
  • 猜想9:2014.11.11 ~2015.01.10这个窗口在创下平均寿命下降9岁的同时,在2.3章节中,2014.11.11 ~2015.01.10窗口也是创下去世人数历史新高的窗口。这意味着这个期间一定发生了严重传染病流行;
  • 猜想10:疫情封控、口罩、人员流动减少、活动减少等原因,使得2022.03.16 ~ 2022.06.12窗口平均年龄突破95岁大关,是非正常的不可持续的一种情况。
4,搜索指数的交叉验证

我们可以使用百度搜索指数,看看在那段时间,“发烧”关键词的搜索量发生了什么变化。但是为了确保“发烧”一词的搜索数据的准确无误(比如没有篡改、污染之类的),我使用下面三个关键词进行交叉验证:感冒、咳嗽、体温。
4.1,谷歌趋势

先用谷歌趋势先进行一次模拟,以对这种想法进行验证。我使用了fever、thermometer、cough、headache四个关键词进行验证:



美国2014~2022

从图中可以得到如下信息:

  • 每个小波峰基本都是冬季;
  • 两个大的波峰分别是2020年3月、2022年1月;
  • 关键词之间是正相关的
我们对2020年3月出现的大波峰进行放大,如下图所示:



美国2020年上半年放大

从图中可以得到如下信息:

  • 2020年3月11日开始病例明显增多;
  • 2020年3月16到3月18达到峰值。
从谷歌趋势中我们可以看出,观察一个个的波峰,主要是观察它的三个维度:

  • 波峰的宽度:代表传染病持续的时长;
  • 波峰的高度:代表同时感染的最多人数;
  • 波峰的斜率:代表传染速度。波峰陡峭,代表传染速度快。
4.2,百度指数

Gemfield选取了“发烧”、“咳嗽”、“感冒”、“体温”四个词进行验证和交叉验证(同时也可以防止搜索被污染的情况),时间段为2013年8月到2022年12月5日。如下图所示:


从左到右依次标出了9个异常时间窗口:
时间窗口发烧咳嗽感冒体温备注
2013-12-16
2014-02-02
类型1
2014-11-24
2015-01-25
类型1
2015-12-07
2016-02-07
类型1
2016-04-25
2016-05-22
类型2
2016-11-21
2017-03-05
类型3
2017-12-11
2018-02-11
类型4
2018-12-24
2019-02-03
类型4
2020-01-13
2020-03-15
类型5
2022-11-28
2022-12-05
类型6


  • 观察7:搜索指数中,从2014年到2020年,每年冬季都有波峰(佐证了【猜想3】);2016年5月份的类型2是唯一不在冬季的传染病;
  • 观察8:搜索指数中,2020年1月份、2022年12月份,波峰要陡峭的多(传染性高);
  • 观察9:搜索指数中,2020~2021、2021~2022 这两个冬季,原本会出现的传染病波峰明显被削平(佐证了【猜想7】);
  • 观察10:搜索指数中观察到了6种症状的传染病类型;
  • 观察11:搜索指数中的2014.11.24~2015.01.25窗口佐证了【观察2】;
  • 观察12:搜索指数中,2022-11-28 ~ 2022-12-05 窗口已经显示了感染情况的飙升(早于12月6日的调整防控措施),从这个角度看,与其说是放开导致了人群快速感染,不如说是人群快速感染导致防控措施被迫调整,反过来再次加快了人群快速感染。
5,总结

从上文所列数据中观察到了11点:

  • 观察1:12月份去世院士数量是过往三年12月份平均值的6.5倍;
  • 观察2:14.11.10 ~ 15.01.10是距离现在最近的一个异常窗口,而22.11.02 ~ 23.01.01异常窗口的去世人数已经达到14.11.10 ~ 15.01.10窗口的2倍,并且随着时间推移,这一数字有可能达到4倍;
  • 观察3:2020年之前,每年11月到次年1月去世人数略高于每年5月/7月,略高于每年其它月份;
  • 观察4:院士去世平均年龄从上世纪50年代的60岁,稳步增长到如今的91岁;
  • 观察5:2021年全国人均预期寿命为78.2岁、北京户籍居民人均预期寿命为82岁、今年院士去世平均年龄为91.3岁;
  • 观察6:奥密克戎快速传播后,窗口平均年龄开始下降;但是这个波动仍在正常范围以内,几乎是历次波动的平均水平(注意:仍需观察到2023年2月20日);
  • 观察7:搜索指数中,从2014年到2020年,每年冬季都有波峰(佐证了【猜想3】);2016年5月份的类型2是唯一不在冬季的传染病;
  • 观察8:搜索指数中,2020年1月份、2022年12月份,波峰要陡峭的多(传染性高);
  • 观察9:搜索指数中,2020~2021、2021~2022 这两个冬季,原本会出现的传染病波峰明显被削平(佐证了【猜想7】);
  • 观察10:搜索指数中观察到了6种症状的传染病类型;
  • 观察11:搜索指数中的2014.11.24~2015.01.25窗口佐证了【观察2】;
  • 观察12:搜索指数中,2022-11-28 ~ 2022-12-05 窗口已经显示了感染情况的飙升(早于12月6日的调整防控措施),从这个角度看,与其说是放开导致了人群快速感染,不如说是人群快速感染导致防控措施被迫调整,反过来再次加快了人群快速感染。
并引发了10个猜想:

  • 猜想1:奥密克戎病毒的快速传播造成了12月份去世数据的飙涨;
  • 猜想2:疫情期间封控、口罩等新的环境变化,使得去世院士数量在2020年、2021年12月份出现下降;
  • 猜想3:冬季容易造成去世人数创新高;
  • 猜想4:对身体比较友好的季节分别是春天、秋天、夏天、冬天;
  • 猜想5:2015年春天到2022年12月之前,长达近8年的时间内再无异常窗口出现(尤其在人口老龄化的背景下),猜测在医疗技术、环境、气候、空气等某些方面出现了巨大变化;
  • 猜想6:每个创新高的时间窗口背后,必定和某种事物有因果关系(如气候、疾病或其它灾害),而不是简单的随机事件;
  • 猜想7:2020年2月开始的两年时间,由于防控、口罩等原因,11月到次年1月去世人数明显下降;
  • 猜想8:导致寿命差距的本质原因在于经济收入、工作环境、居住环境、休假、医疗资源。假使我们发展经济,提升产业链、医疗资源、工作环境、居住环境,使得未来某年全国人均的收入、休假、医疗、工作居住环境水平能达到2022年院士的水平,那就能使得平均每年1千万~2千万人免于提前13年离世;
  • 猜想9:2014.11.11 ~2015.01.10这个窗口在创下平均寿命下降9岁的同时,在2.3章节中,2014.11.11 ~2015.01.10窗口也是创下去世人数历史新高的窗口。这意味着这个期间一定发生了严重传染病流行;
  • 猜想10:疫情封控、口罩、人员流动减少、活动减少等原因,使得2022.03.16 ~ 2022.06.12窗口平均年龄突破95岁大关,是非正常的不可持续的一种情况。
和2014.11.11 ~2015.01.10期间的传染病进行比较:

  • 奥密克戎造成的去世人数是其的4倍(需要观察到2023年2月底);
  • 奥密克戎造成的寿命丢失是其三分之一(需要观察到2023年2月底)。
2023年2月底,Gemfield将对本文数据、观察、猜想进行更新。
回复

使用道具 举报

0

主题

6

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-1-7 18:06:25 | 显示全部楼层
钦佩
回复

使用道具 举报

0

主题

1

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-1-7 18:06:55 | 显示全部楼层
猜想太多,结论少。
也许应该到了3月份结论明了再写比较好?
回复

使用道具 举报

1

主题

4

帖子

4

积分

新手上路

Rank: 1

积分
4
发表于 2023-1-7 18:07:41 | 显示全部楼层
这些猜想,最终也只会是猜想
回复

使用道具 举报

0

主题

1

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-1-7 18:08:32 | 显示全部楼层
2020和2021其实少死了不少人,当然也付出相应代价,但是少死的人有可能后面会补回来。
回复

使用道具 举报

1

主题

2

帖子

4

积分

新手上路

Rank: 1

积分
4
发表于 2023-1-7 18:08:53 | 显示全部楼层
院士们普遍身体平均强度(底子)比一般人群平均要高一点。这部分和工作条件,医疗条件等无关。因为这个行业从业问题的原因,身体好精力充沛首先是大多数人可以成为院士的一个基本条件。
回复

使用道具 举报

0

主题

4

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2023-1-7 18:09:36 | 显示全部楼层
我看很多猜想很有意义,如果阐述因果关系得出结论很有说服力,并且可以指导我们做好防疫,挽救不少人的生命。
回复

使用道具 举报

1

主题

3

帖子

3

积分

新手上路

Rank: 1

积分
3
发表于 2023-1-7 18:10:12 | 显示全部楼层
写作猜想,实际[大笑][大笑]
回复

使用道具 举报

1

主题

5

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2023-1-7 18:10:54 | 显示全部楼层
这才是知乎该有的样子
回复

使用道具 举报

3

主题

8

帖子

18

积分

新手上路

Rank: 1

积分
18
发表于 2023-1-7 18:11:51 | 显示全部楼层
因为猜想全靠现有数据推理出来的,只要官方不公布真实数据,那么这些都不是实锤。。。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|同城医药问答网

GMT+8, 2025-7-8 00:53 , Processed in 0.364434 second(s), 22 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表