Symbiont-Screener:长读长宏基因组测序中宿主与共生体序列的高效分离工具

Symbiont-Screener:长读长宏基因组测序中宿主与共生体序列的高效分离工具

共生现象在自然界中广泛存在,生物样本往往包含来自多个物种的数据。在这种情况下,测序结果经常混杂着非目标物种的数据,我们通常称之为“污染”。去除这些污染以隔离宿主特异性序列,对于高质量的基因组研究至关重要。为了应对这一挑战,我们最新的研究推出了 Symbiont-Screener——这是一款无需参考基因组的计算工具,旨在根据序列独特的特征,高效区分并分离不同来源的序列。

主要发现

  • 无需参考基因组的宿主-共生体分离方法: Symbiont-Screener 的运行不依赖于预先存在的参考基因组,从而能够有效识别混合样本中的宿主序列。它利用 Trio-binning(三元组分箱)技术strobemers(容错基因组标记),根据亲本来源、GC 含量和序列组成对长读长序列进行分类。这确保了宿主基因组重建的更高精度,并改进了相关微生物组的宏基因组谱分析。

  • 在模拟和真实数据集中的表现: 通过使用模拟数据集和真实样本(如藻类-细菌共生系统),Symbiont-Screener 证明了其在提升宿主基因组组装质量方面的显著作用。借助 PacBio HiFi 和 Oxford Nanopore 等长读长测序技术,纯化后的宿主组装结果达到了染色体级连续性,同时有效减少了污染。剩余的共生体序列也促进了相关微生物基因组更准确的谱分析和组装。

  • 对共生研究的意义: 除了分离宿主和共生体序列外,该工具还是探索共生关系生物学意义的基础步骤。通过实现序列的精确划分,Symbiont-Screener 为深入研究驱动共生的生态和进化机制奠定了基础。

研究感悟

该项目由徐梦阳领导,他不仅是本研究的主要执行者,还是华大基因青岛分院(BGI-Qingdao)软件开发团队的负责人。Symbiont-Screener 提出的创新方法解决了基因组测序中的一个普遍难题,即样本通常包含多个物种的数据。梦阳在开发和测试这一方法论过程中的投入,是项目取得成功的关键。

从个人角度来看,作为共生相关项目的参与者,我认为思考这些相互交织的关系背后的更广泛生物学意义是非常迷人的。虽然 Symbiont-Screener 专注于分离宿主和共生体序列,但这种分离仅仅是研究共生现象背后原因和机制的开始。理解这一现象需要进一步探索共生系统为何在自然界中产生并持续存在——这也是我们未来渴望攻克的挑战。

结论

Symbiont-Screener 展示了生物信息学在解决宏基因组学和共生研究中复杂挑战的强大力量。它高效分离宿主序列与共生体及污染物序列的能力,不仅促进了高质量的基因组组装,也为调查共生关系提供了全新的视角。随着研究的深入,我们期待揭示更多关于共生物种协同进化和功能动态的见解。

研究全文可通过 iScience 或相关学术平台在线访问。