上期,我们提到三代宏基因组在组装高质量、完整的MAG上有着显著的优势(NM趋势!子刊三代宏基因组cMAGs研究),那么除了组装高质量MAG,基于三代宏基因组技术,还可以在哪些研究内容上有所突破呢?
全球热点耐药基因研究
纳米孔长读长宏基因组测序的组装序列N50达20-70 kbp,相较而言,Illumina短读长宏基因组测序的组装序列N50仅为1-2 kbp。长序列的获取显著提升了分析性能:不仅能准确鉴定耐药基因亚型、精细注释遗传环境,还可预测耐药基因在质粒或染色体上的定位、水平转移潜力及宿主菌信息。
基于三代纳米孔宏基因组和二代宏基因组技术,从研究样本中斯里兰卡医院污水中共检出25种ARG type[1],其中多药耐药、氨基糖苷类、β-内酰胺类、多粘菌素类和四环素类这五种类型在所有样本中占比最高,变形菌门、厚壁菌门和拟杆菌门是携带抗性基因的主要菌门。
对马肠道样本的研究中[2],借助三代纳米孔宏基因组技术,在242份马肠道样本的2272份高质量MAG中检测了ARG的分布,在25个耐药类别中共鉴定出266种独特类型的ARG,其中,氨基糖苷抗性基因最为丰富。
图1 基于纳米孔宏基因组测序数据的分类树,显示Pol-WWTP (a)、Kan-WWTP (b)和Mor-WWTP (c)中假定病原体携带的宿主范围和ARGs[1]。
图2 马肠道抗生素耐药基因的分布[2]。
生物合成基因簇(BGC)挖掘
除抗性基因(如ARG)外,生物合成基因簇(biosynthetic gene cluster,BGC)作为另一类重要的基因集合类型,近年来也受到研究者广泛关注。然而,受限于短读长测序技术,此前难以从未培养细菌中获取完整的BGC序列,导致其多样性无法准确解析。三代宏基因组技术的应用成功突破了这一技术瓶颈。
在Nature Biotechnology的一项研究中[3],研究团队开发了一种新型土壤微生物分离与DNA提取技术,耦合优化后的纳米孔长读长测序平台,成功完成土壤宏基因组的高质量测序与组装,并从中分离鉴定出具有全新作用机制的BGCs。通过生物信息学手段,对MAGs在分类学科水平开展了生物合成基因簇(BGC)的识别与定量分析。结果显示,数据集平均每个科每百万碱基对(Mbp)携带1.3±0.7个BGC;其中UBA5704、假诺卡氏菌科、链霉菌科及UBA11063四个科的BGC密度尤为突出,均超过3个/Mbp。值得注意的是,数据集中的Aquella物种展现出极高的BGC丰度,且这些基因簇绝大多数为非核糖体肽合成酶(NRPS)型BGC。
图3 a图:基于图1d(左)构建的高质量连续组装序列系统发育树,右侧显示每兆碱基对(Mbp)对应的细菌基因簇(BGCs)数量。b图:代表性组装结果展示未充分覆盖的分类群扩展情况[3]。
操纵子、防御系统
三代宏基因组使得组装的连续性得到了显著的提升,这就意味着复杂基因组区域的组装效果得到改善。长读长测序获得的MAGs具有一项优势:其大多包含核糖体RNA(rRNA)操纵子,可直接与数千个已有的16S rRNA数据集及大型数据库进行比对。在陆地复杂生境研究中[4],借助三代纳米孔宏基因组测序,完整操纵子形式的rRNA基因获取效率大幅提高(下图),同时防御基因岛(尤其是CRISPR-Cas簇)的完整性也更高。而且,在该研究中也获得了更完整的生物合成基因簇(BGCs),与其他短读长获得的结果相比,该研究中的得到的完整的BGCs的数量中位数是其的6.1倍。
图4 大规模陆地环境研究中MAG组装结果比较。在MAGs中预测的rRNA操纵子(c)、防御岛(d)和BGCs (e)的基因簇总数[4]。
挖掘细胞外遗传元素Inocle
质粒等染色体外遗传元件能赋予宿主细菌环境应激抵抗能力(包括抗生素耐药性)。然而,这些元件的遗传多样性及其在适应性中的功能作用,由于二代测序的局限性,目前还很不完善。
25年新发表在NC上研究口腔微生物的文章中[5],借助三代宏基因组技术发现了一种名为“Inocle”的巨大细胞外遗传元素,其可能在口腔微生物适应性进化中扮演着重要角色,甚至有望成为某些癌症的新型生物标志物。三代纳米孔宏基因组分析,85个因携带大量未知功能基因被特别认定为潜在新型遗传元件,将该新型遗传元件命名为“Inocle”,其代表人类口腔微生物组中新型ECEs。研究利用InoC,深入探究Inocle家族重叠群的全球流行情况,鉴定出29个完整的环状Inocle contigs,同时利用公共数据唾液宏基因组比较Inocle地理分布、流行率。
图5 四种Inocle分类群的鉴定与特征描述[5]。
综上,三代宏基因组技术可突破长复杂区域组装瓶颈,显著提升单菌基因组组装质量,大量获取高质量宏基因组组装基因组(MAGs)。同时,在多个研究领域均有显著的优势,其能深入挖掘抗性基因/功能基因,系统解析质粒组(Plasmidome)和移动组(Mobileome)的遗传特征,为微生态领域的高水平研究提供关键支撑。
参考文献
[1] Short- and long-read metagenomics uncover the mobile extended spectrum β-lactamase (ESBL) and carbapenemase genes in hospital wastewater in Sri Lanka. Water Research, 2025.
[2] Expanded catalogue of metagenome-assembled genomes reveals resistome characteristics and athletic performance-associated microbes in horse. Microbiome, 2023.
[3] Bioactive molecules unearthed by terabase-scale long-read sequencing of a soil metagenome. Nature Biotechnology, 2025.
[4] Genome-resolved long-read sequencing expands known microbial diversity across terrestrial habitats. Nature Microbiology, 2025.
[5] Giant extrachromosomal element “Inocle”potentially expands the adaptive capacity of the human oral microbiome. Nature Communications, 2025.