基因组流行病学的新工具

在本期问答中,迈克尔·井上和凯瑟琳·霍尔特软件的文章最近发表在基因组医学,请介绍SRST2软件的开发情况。SRST2是一种基于阅读图谱的计算工具,可以快速准确地检测全基因组短序列阅读中的基因、等位基因和多位点序列类型。

Generic-pink-bacteria-cropped-e1418906299578 18.12

为什么需要开发SRST2 ?

“基因组监测正在被世界各地的诊断和公共卫生实验室采用,作为常规分型和疫情调查的替代或补充。正如世界卫生组织最近的报告所述,这被认为是应对抗生素耐药性全球威胁的关键部分白宫世界卫生组织”。

“尽管测序成本正在下降,但除非你是生物信息学专家,否则很难从基因组数据中提取重要信息。以一种可靠的、可重复的方式来做这件事尤其困难,而这对诊断和参考实验室非常重要,因为这些信息被用于对单个患者、感染控制和公共卫生做出决定。”

“我们谈论的信息类型是(i)检测特定的细菌菌株,包括那些臭名昭著的导致医院爆发的细菌——比如耐甲氧西林金黄色葡萄球菌, vancomycin-resistant肠球菌和"生产克雷伯氏菌-和(ii)检测抗生素耐药性基因,这对预测治疗失败和跟踪耐药性的传播都很重要。同样的方法可以用来识别毒性基因和质粒。”

你是如何进行软件开发的?

“SRST2项目始于一个名叫哈里特·达什诺(Harriet Dashnow)的暑期实习生,她的任务是研究如何扩展我们之前的项目SRST(用于从Illumina reads中提取多位点序列分型信息),用于检测和分型抗性基因。然而,很明显,要想可靠地工作,我们需要对评分系统进行彻底改革,让它变得更快、更强大。”

迈克Inouye从头设计了一种新的评分方法,Harriet和Bernie Pope用优化的Python代码重新实现了这种方法。我们称这个新工具为SRST2。然后,我们对公共数据进行了大量测试,并请当地参考实验室——微生物诊断单位的同事们自己用一些数据进行测试单核细胞增多性李斯特氏菌他们最近在Illumina MiSeq上进行了测序。”

你可以阅读更多关于这个故事的内容在这里

在这个过程中你遇到了什么挑战?

”在这种情况下,它是一种分析探索数以百计的细菌基因组从不同的指定来确定最合适的对齐算法(在这种情况下,Bowtie2),然后设计一个评分系统,可以容纳对准器以及基因的行为/等位基因的内容中我们观察到的基因。”

“一旦完成了这些工作,就需要坐下来,花一周左右的时间编写源代码并进行初步测试。随后又进行了进一步的测试,以评估SRST2应对更广泛挑战的能力,包括医院和公共卫生环境中现实生活和可能需要时间的情况。在这个过程中,每个阶段都是一个挑战,当它们都满足时,你就会得到一个很棒的工具。”

结果中有什么让你惊讶的地方吗?

“我们对SRST2最初的表现感到有点惊讶,无论是在速度还是准确性方面。这确实让我们相信,SRST2在现实生活中可能会产生重大影响,在现实生活中,基因组类型和毒性预测以及抗菌素耐药性等场景对于尽快获得准确答案至关重要。”

你认为这个软件对微生物诊断有什么影响?

“SRST2可以直接从原始序列读取和单个命令中为许多临床重要问题提供快速答案。它也非常健壮,因为它对数据质量或数量的下降相当不敏感。我认为基于这些原因,它有可能成为所有从事细菌基因组学的实验室的一个非常重要的工具。”

“它作为第一个筛选非常有效:一旦你得到SRST2的结果,并知道你要处理的是什么,你就可以决定是否需要进一步分析,比如跟踪传播的全基因组系统发育,还是努力构建高质量的组装。”

这项研究作为联合研究的一部分发表特殊的问题基因组生物学乔治·温斯托克和莎伦·皮科克客座编辑《传染病基因组学》。

在“医学”网站上可以看到最新的文章

评论