中国开源软件网

当前位置: 首页 > 科学 >

下内容为孙晔然在本次研讨会上的主,识别推文的聚类是否是人群的聚集造成的

时间:2020-06-30 20:00来源:互联网 作者:小狐

2020年6月17日晚,中国人民大学国家发展与战略研究院举办了第七期线上研讨会,主题为 “大数据疫情防控:创新实践与政策启示”。本次研讨会由人大国发院院长助理马亮教授主持,来自中国人民大学、清华大学、浙江大学、南开大学、英国剑桥大学、英国格拉斯哥大学、英国斯旺西大学的7位国内外数字科技、电子政务、公共政策等研究领域的专家,围绕大数据在疫情防控中的应用及其引发的问题进行了多角度的深入研讨。

下内容为孙晔然在本次研讨会上的主旨发言 ,由巫霞整理,经本人审阅。

孙晔然

英国斯旺西大学地理系讲师(助理教授)

下内容为孙晔然在本次研讨会上的主,识别推文的聚类是否是人群的聚集造成的(图1)

我的研究背景主要是针对以英国为主的欧美国家,从统计数据来说,英国的防疫做的不是很成功,甚至某些方面是比较失败的。和其他欧洲国家一样,英国也颁布了一些防疫措施,比如居家禁足、保持社交距离等,但从数字上来说,它在整个欧洲范围内,无论是病例数还是死亡数都位居第一。而且相当长一段时间内,位居世界第二,仅次于美国,这是具体数字上面体现的结果。以媒体上看到的情况以及平时民众观察的情况来看,虽然政府制定了相对有效的措施,但实际上执行效果并不理想,有些防疫措施难以严格执行。

首先,从城市设计的角度来说,英国并不像国内的很多城市,是以严格的小区为单位进行的。国内的小区有完整的围墙,通过围墙的出入口,就可以居民的进出状况。但是在英国,房屋的结构和街道的设计不存在这种情况,很多的社区是没有墙的,没有办法像中国的城市,以小区为单位或者农村的行政村为单位,进行有效的。英国的国情、文化原因以及长期对自由的追求导致民众不会严格遵守居家隔离或者保持社交距离的防疫措施。即使到现在,英国民众仍然对是否应该佩戴口罩存在较大争论。

因此,在中国或者亚洲国家比较有效的方法,比如非常严格的出入境制度,健康码以及韩国等国家使用的手机追踪技术等在英国均无法实施。由此会出现各种问题,一是无法严格制止民众的外出,二是如果使用某些追踪技术可能会侵犯隐私。所以英国政府采取了比较软性的政策,允许大家以购买必需品的名义外出,实际上很多人外出的目的并不是为了购买必需品,而是参加聚会。英国政府为了避免疫情的再次传播,通常会动用警力,通过巡警的方式进行干预。从法律的角度而言,英国没有对违反者进行处罚或者拘留,所以很多人并没有很好地遵守防疫措施。

针对英国的国情而言,既没有办法完全居家隔离,也没有办法进行24小时位置追踪。条件有限的情况下,我们是否能利用大数据或者一些技术方法追踪人群聚集活动。比如我们可以通过社交网络数据、热点图或者移动轨迹进行追踪,研究主要涉及由手机产生的数据,因为这些数据是非常实时的信息,我们必须要及时地分析这些信息,发现和识别出可能的人群聚集。所以我们需要一些实时的监测工具,比如实时数据可视化和数据分析工具,去定位可能的人群聚集。

对研究来说,人员聚集规模是5人以上20人以内,通常来说。如果人数达到50人以上,政府可以通过其他的方式发现,比如、大规模的体育运动等聚集等,不需要额外透过大数据技术识别。所以本研究针对的人群聚集规模是指5人以上20人以内。

我研究的基本思路是利用带有地理标志数据的Twitter推文,比如不同的用户,在空间上发布推文,如果实时连接,这个推文就会自动带有GPS的空间位置,利用这个空间位置,可以把这部手机或者手机的持有者,在某个时间,定位在某个特定的空间位置上。是通过3D的表示方法,可以更加直观的理解Twitter数量在空间上的分布情况。

我们通过实时显示地理标志的推文的空间分布情况,识别出这个推文的时空聚类,这是基于社交网络用于识别社会活动的基本方法。人群聚集通常来说是与社会活动有关系的,如果在一个小的空间范围内、短的时间范围内存在人群聚集,如果其中一部分或者全部人会发送推文,这些推文在特定的时间和相对小的空间范围内就会形成一个聚类。所以,我们可以在观测时间往前推半个小时之内,观测比较典型的聚类在这个空间的出现频率,可能表示这个地方出现了人群聚集。

我们可以通过一些方法,比如进一步分析这些推文的语义特征(关键词是否与社交活动、体育活动相关)以及局部环境特征等。根据推文语义特征、局部环境特征作为输入变量,通过机器学习方法建立分类模型,识别推文的聚类是否是人群的聚集造成的。如果我们能够快速的识别出这些可能存在的人群聚集,就可以相关的部门或者附近的巡警进行干预。

这是初步的想法,如果延伸下去还可以附带其他的工作。比如在警力有限的情况下,同一个时间,同一个城市,同时发现了好几个可能存在的人群聚类。可以通过无人机技术排查,确认哪些可能是人群聚集,对于真实的人群聚集再附近的巡警干预,这样可以提高搜寻的效率。通过Twitter数据反映出的人群在户外或者某些特定地方可能发生聚类的概率,可以对于警力和侦查设备的部署指导意见。

本文相关词条概念解析:

推文

《推文》是夏至线子写的网络小说连载于晋江文学城。

聚集

聚集(Aggregation)是一种特殊形式的关联。聚集表示类之间的关系是整体与部分的关系。

网友评论

相关文章