news 2026/6/13 9:16:48

核糖体操纵子、生物合成基因簇(BGCs)...三代宏基因组全搞定!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
核糖体操纵子、生物合成基因簇(BGCs)...三代宏基因组全搞定!

上期,我们提到三代宏基因组在组装高质量、完整的MAG上有着显著的优势(NM趋势!子刊三代宏基因组cMAGs研究),那么除了组装高质量MAG,基于三代宏基因组技术,还可以在哪些研究内容上有所突破呢?

全球热点耐药基因研究

纳米孔长读长宏基因组测序的组装序列N50达20-70 kbp,相较而言,Illumina短读长宏基因组测序的组装序列N50仅为1-2 kbp。长序列的获取显著提升了分析性能:不仅能准确鉴定耐药基因亚型、精细注释遗传环境,还可预测耐药基因在质粒或染色体上的定位、水平转移潜力及宿主菌信息。

基于三代纳米孔宏基因组和二代宏基因组技术,从研究样本中斯里兰卡医院污水中共检出25种ARG type[1],其中多药耐药、氨基糖苷类、β-内酰胺类、多粘菌素类和四环素类这五种类型在所有样本中占比最高,变形菌门、厚壁菌门和拟杆菌门是携带抗性基因的主要菌门。

对马肠道样本的研究中[2],借助三代纳米孔宏基因组技术,在242份马肠道样本的2272份高质量MAG中检测了ARG的分布,在25个耐药类别中共鉴定出266种独特类型的ARG,其中,氨基糖苷抗性基因最为丰富。

图1 基于纳米孔宏基因组测序数据的分类树,显示Pol-WWTP (a)、Kan-WWTP (b)和Mor-WWTP (c)中假定病原体携带的宿主范围和ARGs[1]。

图2 马肠道抗生素耐药基因的分布[2]。

生物合成基因簇(BGC)挖掘

除抗性基因(如ARG)外,生物合成基因簇(biosynthetic gene cluster,BGC)作为另一类重要的基因集合类型,近年来也受到研究者广泛关注。然而,受限于短读长测序技术,此前难以从未培养细菌中获取完整的BGC序列,导致其多样性无法准确解析。三代宏基因组技术的应用成功突破了这一技术瓶颈

在Nature Biotechnology的一项研究中[3],研究团队开发了一种新型土壤微生物分离与DNA提取技术,耦合优化后的纳米孔长读长测序平台,成功完成土壤宏基因组的高质量测序与组装,并从中分离鉴定出具有全新作用机制的BGCs。通过生物信息学手段,对MAGs在分类学科水平开展了生物合成基因簇(BGC)的识别与定量分析。结果显示,数据集平均每个科每百万碱基对(Mbp)携带1.3±0.7个BGC;其中UBA5704、假诺卡氏菌科、链霉菌科及UBA11063四个科的BGC密度尤为突出,均超过3个/Mbp。值得注意的是,数据集中的Aquella物种展现出极高的BGC丰度,且这些基因簇绝大多数为非核糖体肽合成酶(NRPS)型BGC。

图3 a图:基于图1d(左)构建的高质量连续组装序列系统发育树,右侧显示每兆碱基对(Mbp)对应的细菌基因簇(BGCs)数量。b图:代表性组装结果展示未充分覆盖的分类群扩展情况[3]。

操纵子、防御系统

三代宏基因组使得组装的连续性得到了显著的提升,这就意味着复杂基因组区域的组装效果得到改善。长读长测序获得的MAGs具有一项优势:其大多包含核糖体RNA(rRNA)操纵子,可直接与数千个已有的16S rRNA数据集及大型数据库进行比对。在陆地复杂生境研究中[4],借助三代纳米孔宏基因组测序,完整操纵子形式的rRNA基因获取效率大幅提高(下图),同时防御基因岛(尤其是CRISPR-Cas簇)的完整性也更高。而且,在该研究中也获得了更完整的生物合成基因簇(BGCs),与其他短读长获得的结果相比,该研究中的得到的完整的BGCs的数量中位数是其的6.1倍。

图4 大规模陆地环境研究中MAG组装结果比较。在MAGs中预测的rRNA操纵子(c)、防御岛(d)和BGCs (e)的基因簇总数[4]。

挖掘细胞外遗传元素Inocle

质粒等染色体外遗传元件能赋予宿主细菌环境应激抵抗能力(包括抗生素耐药性)。然而,这些元件的遗传多样性及其在适应性中的功能作用,由于二代测序的局限性,目前还很不完善。

25年新发表在NC上研究口腔微生物的文章中[5],借助三代宏基因组技术发现了一种名为“Inocle”的巨大细胞外遗传元素,其可能在口腔微生物适应性进化中扮演着重要角色,甚至有望成为某些癌症的新型生物标志物。三代纳米孔宏基因组分析,85个因携带大量未知功能基因被特别认定为潜在新型遗传元件,将该新型遗传元件命名为“Inocle”,其代表人类口腔微生物组中新型ECEs。研究利用InoC,深入探究Inocle家族重叠群的全球流行情况,鉴定出29个完整的环状Inocle contigs,同时利用公共数据唾液宏基因组比较Inocle地理分布、流行率。

图5 四种Inocle分类群的鉴定与特征描述[5]。

综上,三代宏基因组技术可突破长复杂区域组装瓶颈,显著提升单菌基因组组装质量,大量获取高质量宏基因组组装基因组(MAGs)。同时,在多个研究领域均有显著的优势,其能深入挖掘抗性基因/功能基因,系统解析质粒组(Plasmidome)和移动组(Mobileome)的遗传特征,为微生态领域的高水平研究提供关键支撑。

参考文献

[1] Short- and long-read metagenomics uncover the mobile extended spectrum β-lactamase (ESBL) and carbapenemase genes in hospital wastewater in Sri Lanka. Water Research, 2025.

[2] Expanded catalogue of metagenome-assembled genomes reveals resistome characteristics and athletic performance-associated microbes in horse. Microbiome, 2023.

[3] Bioactive molecules unearthed by terabase-scale long-read sequencing of a soil metagenome. Nature Biotechnology, 2025.

[4] Genome-resolved long-read sequencing expands known microbial diversity across terrestrial habitats. Nature Microbiology, 2025.

[5] Giant extrachromosomal element “Inocle”potentially expands the adaptive capacity of the human oral microbiome. Nature Communications, 2025.

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/13 9:16:38

新手必看:在嘉立创EDA上画STM32F103C8T6核心板的保姆级避坑指南

从零到一:嘉立创EDA设计STM32F103C8T6核心板的实战避坑手册 第一次用嘉立创EDA设计STM32核心板就像拼装精密钟表——每个零件的位置和连接方式都影响最终能否走时准确。本文将手把手带你避开那些让新手反复打样的典型陷阱,从电源设计到调试接口&#xff…

作者头像 李华
网站建设 2026/4/14 9:39:51

STM32CubeIDE标准库开发环境配置全攻略

1. STM32CubeIDE开发环境入门指南 第一次接触STM32CubeIDE的开发者可能会被这个集成开发环境的强大功能所震撼。作为ST官方推出的免费工具,它集成了STM32CubeMX配置工具和基于Eclipse的IDE环境,特别适合从零开始学习STM32开发的工程师。我刚开始使用时也…

作者头像 李华
网站建设 2026/4/14 9:35:45

如何用KeymouseGo实现零编程鼠标键盘自动化:完整指南 [特殊字符]

如何用KeymouseGo实现零编程鼠标键盘自动化:完整指南 🚀 【免费下载链接】KeymouseGo 类似按键精灵的鼠标键盘录制和自动化操作 模拟点击和键入 | automate mouse clicks and keyboard input 项目地址: https://gitcode.com/gh_mirrors/ke/KeymouseGo …

作者头像 李华
网站建设 2026/4/14 9:36:00

NAVIGATION及NAVIGATOR的使用2

7. 一个物联网Navigation应用实例 完整代码 (Index.ets) 请直接清空您的 Index.ets 并粘贴以下代码: //Index.ets // ========================================== // 1. 定义详情页组件 (这是一个子组件,不是 Entry) // ========================================= @Compon…

作者头像 李华
网站建设 2026/4/14 9:35:37

棉花叶子病虫害检测数据集 叶片病虫害识别图像数据集 棉花蚜虫识别 植物灰霉病与卷叶病识别

棉花计算机视觉数据集 README一、数据集核心信息项目详情类别数量及中文名称8 类(蚜虫、粘虫、细菌性枯萎病、枯萎镰刀菌、灰霉病、健康、卷叶病、叶斑病)数据数量(向下取整)5400 张图片数据集格式YOLO 格式核心应用价值1. 支撑棉…

作者头像 李华