朋友圈流传的“全国感染进度表”准不准?我们找专家聊了聊

很多人都想知道关于朋友圈流传的“全国感染进度表”准不准?我们找专家聊了聊和影响疫情信息获取的因素的话题,下面让小编来为大家讲解一下关于朋友圈流传的“全国感染进度表”准不准?我们找专家聊了聊的题吧!

阅读本文之前,请点击“关注”,这不仅方便您的讨论和分享,还可以给您不一样的参与感。感谢您的支持!

随着越来越多的人被感染,关于本轮疫情“进展”、何时能恢复正常生活的讨论很多。

其中,“大数据”尤其受到公众关注。

12月15日左右,一组预测各城市第一轮感染高峰期的截图在朋友圈和微信群中广泛流传。

图中显示了全国不同省份和地区主要城市的疫情进展情况以及最终高峰的预测时间表,并且这些数据在不断更新。

以石家庄、北京、郑州为例,最早的版本是,截至12月10日,石家庄已完成第一波群体性感染高峰77例,北京29例,郑州11例。

12月12日,该厂家开发的小程序更新了数据石家庄为84,北京为38,郑州为15。

最后一个版本已于12月16日停产。石家庄完成100个,北京完成87个,郑州完成46个。

此时,三个城市的累计感染人数分别占总人口的49人、35人、19人。

这组数据的原作者是知乎大Vchenqin。“数据皇帝”、“2021新知识解大师”是他的标签。

预计,截至12月16日,石家庄、保定、邢台等地的“峰值进度”已达100个。

北京于2023年1月22日结束第一轮感染高峰,上海于2023年1月18日结束第一轮感染高峰,郑州于2023年1月14日结束第一轮感染高峰。

那么,这个预测方案的依据是什么,可靠吗?

大河新闻视频《看见》编辑/张晶晶

编辑/刘永恒

协调人/尤晓鹏

当你在网上搜索“发烧”时

刚刚贡献了一份数据?

12月15日以来,大河新闻于视频《看见》编辑多次联系陈勤本人,询算法和数据方面的题,但一直没有得到回复。

不过,陈勤在发表的文章中介绍了他的初衷和方法。

“我还分析了台湾、香港特别行政区和日本的感染情况和‘发烧’搜索指数,找到了一种可以帮助预测感染高峰期的方法。”

他的方法是根据百度搜索数据按地区统计关键词“发烧”的搜索数据,减去非疫情期间的常数,最后根据香港、台湾、海外等地区的样本进行趋势比较。统计了各地区疫情进展情况。

总之,当某个城市有人在百度搜索“发烧”时,就为他判断该城市的疫情情况提供了参考数据。在谈到这样做的初衷时,陈勤表示,疫情高峰时间的计算最初只是为了搜索索引。不断更新,让这些原始数据帮助您度过最初的震惊。”

截至12月17日,晨勤发布了《各城市第一轮感染高峰期预测》,包括各城市感染高峰日期、进展情况、第一波疫情结束时间、累计感染人数比例等,并在知乎上获得了11000点赞,其数据被媒体广泛引用并登上热搜。

有网友点赞这个案,表示这个方法虽然“简单粗暴”,但逻辑是正确的。已经发表了许多关于通过搜索引擎数据预测流感流行趋势的论文。

有网友表示,该数据与自己对这座城市的感受不符,“保守”。

一些网友更愿意相信事实,帖子主题围绕着可以与数据“严重性”相比较的疫情知识。

专家有一定参考价值

但仍有优化空间

利用搜索引擎数据建立模型来预测流行趋势。预测数据有什么参考价值?

“仅通过搜索数据建立的预测模型的准确性通常不高。”天使投资人、资深人工智能专家郭涛告诉大河新闻鱼视频主编《看》。

郭涛表示,疫情传播速度受感染人数及其运动轨迹、人口流动信息、市民生活方式、交通状况、医疗条件、天气状况等综合因素影响。因素有多少,以及它们如何相互作用,仅仅通过搜索数据是不够的。

“早些年,美国利用搜索量进行相关预测,这在一定程度上可能反映了疫情的整体传播速度和爆发量。”北京社科院研究员、大数据商业分析师王鹏教授接受了小编采访。他表示,基于大数据搜索来预测COVID-19感染高峰,国外实际上已经有了应用。

对于不同的城市,预测感染何时达到高峰、消退以及第一波疫情的进展,在一定程度上对于公共政策制定者、政府和公众有一定的参考价值,有助于大家了解疫情的情况。流行。流行趋势。

但从实际角度来看,王鹏觉得目前使用的搜索引擎,尤其是仅基于百度数据的搜索引擎,可能会失真。

移动互联网时代和PC时代是有区别的。首先,并不总是有很多人在手机上进行搜索。即使是移动搜索引擎也有很多来源,不一定是百度,也有很多其他国内搜索引擎。另外,很多人可能不会在搜索引擎上搜索,但也可能会在社交或短视频上搜索,所以相关搜索的数量和数据本身都存在一些题。其次,在这个自媒体时代,当人们搜索某个关键词时,他们不一定有症状,但他们的家人或朋友可能有症状。在某种程度上,我们被困在信息茧中。换句话说,我们在互联网搜索引擎上搜索最多的人可能是收入水平、年龄和对互联网熟悉程度相似的特定人群。其余绝大多数人较少或根本不使用互联网。他们是“沉默的大多数”。因此,仅仅根据搜索数据来推测疫情的情况肯定不是特别准确。

王鹏还建议,PC端和移动端数据都要考虑。数据来源不仅应该是搜索引擎,还包括社交媒体和短视频数据。同时算法也不宜过于简单。应多次优化重组,以便进一步训练,得出更准确的结论。

关于朋友圈流传的“全国感染进度表”准不准?我们找专家聊了聊和影响疫情信息获取的因素的相关热议话题今天就聊到这里,希望对诸位网友有所帮助,也请大家关注订阅本站。

除非特别注明,本站所有文字均为原创文章,作者:admin