Twitter可以用于花粉热监测目的吗?用于相关知识提取的深度学习应用

社交媒体平台主要用于网络交流,同时也是各种话题的宝贵知识来源,包括人口的健康.如果采用适当的技术来处理在线用户生成的高容量、高速度、高多样性且往往准确性有待商榷的内容,医疗保健专业人员和决策者就可以有效地利用这些知识。在一个研究文章,本月出版医学信息学和决策,作者旨在调查Twitter数据用于花粉热监测的潜力,并验证其有效性有关使用最先进的深度学习模型进行内容管理。

为什么要使用社交媒体进行健康监控?

大量研究已经证明Twitter用户在其网络上公开分享与健康有关的信息(如症状、治疗)。迄今为止,对传染病(例如:流感)在文献中得到了广泛的研究,而过敏情况在很大程度上仍未被研究.与此同时,2014- 2015年,五分之一的澳大利亚人患有花粉热,成为最常见的慢性呼吸道疾病之一。由于环境的变化和污染的增加,花粉过敏是危险的上升,不仅在澳大利亚,而且在澳大利亚在世界范围内

目前对花粉症的估计包括官方统计或市场调查。最近,使用了来自全科医生处方、住院人数、花粉率和抗组胺药销售的数据。现有的方法既耗时又成本高,并且只提供关于条件的高级细节(通常回答预先指定的问题)。考虑到这些限制,Social Media以不引人注目的方式自动提取实时数据,成为了一个有吸引力的选择。

与用户生成内容相关的挑战

尽管社交媒体平台上有丰富的知识,但原始形式的用户生成内容被证明是非常具有挑战性的有关内容提取(即。实际因为大量的广告,新闻,警告等(尽管仍然与花粉热相关)。更重要的是,用户写的帖子经常出现语法错误、歧义的短语、创造性的表达等等.例如,如何自动识别那条推文“我没有哭,这是我的花粉热发作了”是指花粉症最常见的症状(流眼泪)?或者如何训练系统来识别这一点Telfast流行的花粉热药物的商业名称是否没有广泛的清单所有有哪些潜在的药物提供了先验?

深度学习作为具有挑战性的内容管理的有前途的解决方案

机器学习的最新进展,尤其是它的子领域深度学习,在极具挑战性的用户生成内容管理方面显示了巨大的前景。为系统提供甚至是相对较小的类正和类负示例样本(在自然语言中),并让模型识别两个类之间最显著的特征,已经证明是成功的医疗保健领域除了

此外,采用最先进的自然语言处理技术将单词嵌入到模型训练中,进一步提高了该方法的准确性和鲁棒性。也就是说,单词到向量表示(单词嵌入)允许说明单词之间的语法和语义联系(类似的字出现在类似的上下文)。这是由于在投影向量空间中与概念相关的术语(例如。蜜蜂蜂蜜更接近花粉孢子化石).作为一个结果,眼泪可以链接到水汪汪的眼睛,抽噎流鼻涕没有明确的规则定义。

来自澳大利亚Twitter的花粉热监测案例研究

在澳大利亚进行的这项研究旨在调查Twitter数据用于花粉热监测的潜力,并验证其有效性有关使用最先进的深度学习模型进行内容管理(在卫生信息学领域仍处于起步阶段)。原始数据是在6个月的时间内提取的,覆盖了花粉季节。Twitter用户自我报告的Hay Fever人数在10月和11月达到顶峰,正如预期的那样。对于表现最佳的模型(GRU)和预先训练的词嵌入(GloVe),相关贴子检测(如症状、治疗)的准确率高达88%。我们的工作的主要贡献包括隐性症状和新出现的治疗,自动检测,没有预定义的规则规范。该结果证明,从其他来源(如社交媒体来源)进行实时健康监测很有希望,并作为目前有限的花粉过敏流行和严重程度估计方法的一个有吸引力的补充。

在BMC系列博客首页查看最新的文章bob娱乐真人

评论