通过情感分析和自然语言处理探索社交媒体与COVID-19疫苗犹豫之间的关系
对COVID-19疫苗的看法,无论是积极的还是消极的,都可以预测随后的疫苗接种率,并发现一项有关Twitter帖子的研究。这些结果为社交媒体对公共卫生措施的影响提供了新的见解。
这项研究是由纽约大学库朗数学科学研究所和纽约大学格罗斯曼医学院的研究人员进行的,研究显示,在推特上对疫苗接种表达的积极情绪之后,一周后同一地理区域的疫苗接种率上升,而负面情绪紧随其后,在同一地区,疫苗接种率在接下来的一周下降。
该研究部署了一个使用情感分析和自然语言处理(NLp)算法的实时大数据分析框架。该系统接收实时推文,并识别与疫苗相关的推文,并根据特定主题对这些推文进行分类,并提供情绪分析,将推文分类为积极、消极或中立。
“我们需要了解对疫苗的犹豫,以及社交媒体对制造和传播疫苗的影响,”医学博士梅根·科菲说,她是纽约大学格罗斯曼医学院感染疾病和免疫学部门的临床助理教授,也是发表在《临床传染病》杂志上的这篇论文的作者之一。“这是创造一个晴雨表,跟踪与疫苗犹豫有关的情绪和主题的第一步。”
“随着新冠肺炎疫情让我们更多的人面对电脑,而对疫苗的犹豫决定了疫情的发展,我们需要像这样的工具来跟踪和了解社交媒体对这场疫情以及未来疫情的疫苗犹豫的影响。”纽约大学Courant数学科学研究所计算机科学临床副教授、该论文的作者之一Anasse Bari补充道。
研究人员指出,疫苗接种可以帮助结束COVID大流行的持续激增和新的变种。但他们观察到,对疫苗的犹豫削弱了单独和集体接种疫苗的影响。使这一问题更加复杂的是社交媒体的作用,它日益放大了有关疫苗接种的信息和错误信息,引发了关于这些平台具体如何影响疫苗接种率的问题。
为了解决这一问题,本文作者开发了一个基于自然语言处理(NLp)、情感分析(SA)和亚马逊网络服务(AWS)的大数据分析应用程序。
这个工具允许研究人员跟踪几个与疫苗相关的主题,因为它们出现在几十个短语中。主题包括:阴谋、恐惧、健康自由、天然替代品、副作用、安全性、信任/不信任、疫苗公司、现有来源和犹豫等。这些主题和相关短语允许他们将“情绪得分”与疫苗接种的积极、消极或中立联系起来。
他们还使用了一个常用的数据集,即电气和电子工程师协会(IEEE)的Dataport数据集,该数据集根据美国的地理位置标记了推特上与冠状病毒相关的情绪得分。分析的数据集包括2021年3月20日至2021年7月20日期间2.3万多条与疫苗相关的推文。研究人员还逐州检查了美国COVID疫苗接种的每日数据。
总体而言,数据显示,一旦所有成年人都能接种疫苗——大约在2021年4月中旬——美国某些地区的积极情绪上升,一周后疫苗接种率就会上升。相反,在情绪下降的地区,疫苗接种率在一周后下降。
值得注意的是,大数据分析框架显示,在大流行的头几个月,以及2020年底开始推出疫苗之前,对疫苗的积极情绪和消极情绪相似,积极情绪略高。相比之下,在疫苗推出后,负面情绪的推文超过了正面情绪。
“由于疫苗接种率被发现与Twitter的疫苗情绪进行区域跟踪,一个更先进的分析工具可能会预测疫苗接种的变化,或指导有针对性的社交媒体活动和疫苗接种战略的发展,”巴里说,他领导着Courant研究所的预测分析和人工智能研究实验室。
Coffee补充说:“这种方法使我们能够开始识别随着时间和地点变化的疫苗犹豫模式。”“但是,它只能监测而不能影响不断变化的疫苗耐药性。需要开展更多工作,以建立对救命疫苗的信任,消除疫苗的负面影响。”
该论文的其他作者是纽约大学格罗斯曼医学院的Madeline DiLorenzo,以及库朗研究所预测分析和人工智能研究实验室的研究人员Matthias Heymann、Ryan Cohen、Robin Zhao、Levente Szabo、Shailesh Apas Vasandani、Aashish Khubchandani和Alankrith krishnan。
这项工作得到了亚马逊人工智能研究基金的部分支持。
# # #
杂志
临床感染疾病
方法的研究数据/统计分析
研究的主题人
文章标题通过推特的情感分析和自然语言处理探索COVID-19大流行期间的疫苗犹豫