空间采样和机器学习方法改进血吸虫病控制

控制和消灭血吸虫病是一项庞大的工程,已获得越来越多的人力和财力。一项新的研究探讨了改进血吸虫病控制的机器学习方法。

血吸虫病,一种由吸虫属吸虫引起的严重寄生虫病裂体吸虫属,不仅有害健康,而且阻碍了疫区经济和社会的发展。据世界卫生组织(世卫组织)称,该病在全世界78个热带和亚热带国家流行,影响到流行地区7亿多人的生活,实际感染人数至少为2.4亿。因此,血吸虫病仍然是中低收入国家的一大公共卫生危害。

控制疾病

血吸虫病的传播依赖于水蜗牛的存在。日本血吸虫病,曾在中国长江流域流行,与该物种的分布密切相关钉螺hupensis蜗牛. 经过70年的持续努力,主要是基于蜗牛控制和吡喹酮药物治疗,在以前流行的12个省份中有9个省份实现了传播中断,这是有史以来最低的流行水平。

现在,中国正在通过专门监测钉螺控制来努力消灭血吸虫病。每年春季和秋季进行全国蜗牛调查,这是控制血吸虫病的主要努力。全国蜗牛调查既需要劳力,又需要资金。

有效空间的重新评估

钉螺调查的目的是确定钉螺存活的地点,并预测血吸虫病的高传播区域。由于这些蜗牛调查的规模很大,而且从试点获得了信息,因此,庞大的蜗牛数据库可用于预测长江流域的蜗牛存活概率。

我们从一个简单的想法开始:更多的调查点是否意味着对蜗牛概率的预测更准确?

我们假设原始的蜗牛分布数据可以通过重采样方法获得新的分布点,然后,利用这些新数据我们可以预测研究区域之间的蜗牛存活概率。最后,可以比较预测性能以选择最佳重采样数据。

本研究最初开发了空间重新评估过程,定义了生态网格单元。这些细胞具有与蜗牛相同的生存环境。如果这个网格单元中存在两个或多个蜗牛点,我们只拾取一个点。

通过这种空间再评估过程,我们可以获得新的蜗牛数据样本,然后对血吸虫病传播区域进行模型预测。

2018年在长江流域共抽样2369个监测点,其中活螺1061个(检出率0.448)。我们设置网格单元距离为5公里、10公里、50公里、100公里、150公里。钉螺点的再采样次数分别为1747、1421、209、98、44次。钉螺检出率分别为0.462、0.471、0.449、0469、0477。

随着网格细胞的增大,生态区域变大,钉螺重采样点减少,但钉螺检出率保持稳定,如下图所示。

用不同的网格按生态区重新取样。从https://idpjournal.biomedcentral.com/articles/10.1186/s40249 - 021 - 00852 - 1

机器学习应用

在对钉螺数据集进行重新采样后,我们尝试将数据与环境和生态变量、海拔、水距离、温度和降雨量相结合来预测钉螺生存区域的适宜性。

这些预测是基于机器学习的随机森林算法。这可以做出更精确的预测,也可以比较对蜗牛表现的不同空间重新评估。

我们发现,当网格单元距离设置为5 km时,模型性能与原始的钉螺调查地点相同(见下图)。

用机器学习模型预测钉螺存活面积。从…起https://idpjournal.biomedcentral.com/articles/10.1186/s40249-021-00852-1

未来的进展

血吸虫病常规工作监测工具建设取得进展。通过设置5公里的生态钉螺调查区,可以得到与之前预测相同的结果,即钉螺调查点从2369个减少到1747个。机器学习是预测血吸虫病传播风险的一种有用的建模技术。机器学习和空间重采样的优点是方便了调查工作量,完善了公共卫生领域的疾病监测系统。

在BugBitten的主页上查看最新的帖子

评论