Nature | 北美河流的功能微生物组目录
2026/6/8 17:17:10 网站建设 项目流程

点击蓝字 关注我们

源自北美河流的众包功能微生物组目录

研究论文

● 原文:Nature(IF 48.5 )

●原文链接:https://www.nature.com/articles/s41586-024-08240-z

● DOI: https://doi.org/10.1038/s41586-024-08240-z

● 第一作者:Mikayla A. Borton

● 通讯作者:Kelly C. Wrighton(wrighton@colostate.edu)

● 主要单位:科罗拉多州立大学、昆士兰科技大学、科罗拉多大学丹佛分校、俄勒冈州立大学、太平洋西北国家实验室、阿贡国家实验室、劳伦斯伯克利国家实验室、俄亥俄州立大学、华盛顿州立大学

摘 要

在日益增加的人类活动影响下,预测元素循环和维持水质需要了解河流微生物组的空间驱动因素。然而,由于缺乏基因组解析的功能见解以及跨多条河流的采样,我们对控制河流生物地球化学的核心微生物过程的理解受到了阻碍。在此,我们利用一项社区科学(众包)项目来加速河流微生物组的采样、测序和基因组解析分析,从而创建了“基因组解析开放流域数据库”(GROWdb)。GROWdb剖析了覆盖美国 90% 流域的河流地表水中微生物基因组物种、分布、功能和表达。具体而言,GROWdb涵盖了来自27个门的微生物谱系,包括来自10个科和128个属的新成员,并在基因组水平上定义了核心河流微生物组。将GROWdb分析与广泛的地理空间信息相结合,揭示了微生物群落结构的局部和区域驱动因素,同时也提出了关于生态系统功能的基础假设。基于先前构想的“河流连续体”概念,我们叠加了微生物功能性状的表达,这表明河流微生物组的结构和功能是可预测的。我们通过各种协作网络基础设施提供GROWdb,使其能够被跨学科广泛访问,用于流域预测建模和基于微生物组的管理实践。

结 果

GROWdb的构建

为了建立GROWdb,我们通过众包形式动员了100多个团队,根据野外站点的地理位置,在美国河流的 106个地点收集了163个样本(见方法部分)。这种方法产生了约3.8太碱基(Tb)的宏基因组和宏转录组测序数据,以及每个地点广泛的(多达287个)地球化学和地理空间测量数据(图1a,b 和补充数据1)。地理空间参数是利用采样位置的经纬度作为查询条件获得的,包括土地利用和其他流域特征(例如,河流级序、流域大小),而地球化学信息则是在采样的同时收集的(见方法部分)。通过这一过程,我们旨在在跨越美国的地理和环境梯度背景下,捕捉群落水平上、基因组解析后的微生物组在分类学、功能和基因表达方面的变异。

这项工作实现了覆盖美国90%流域(n=21,按2级水文单元划分)(图1c)的地表水采样,并跨越了不同的生态区、河流级序和流域大小(扩展数据 图 1)。总之,GROWdb0(reads)和宏基因组组装基因组(MAGs)都公开托管在国家生物技术信息中心(NCBI),使得这些内容能够被提取并整合到其他资源中。构成 GROWdb基础的数据集可通过国家微生物组数据协作(NMDC)数据门户免费获取和检索,并链接到其他数据类型(例如代谢组),以便在现有情况下进行更广泛的综合分析。

图1. 河流的分布式采样和测序促成了GROWdb的构建

a. 工作流程图,标示了样本数量以及由此产生的由地理空间和微生物组(宏基因组学、宏转录组学)数据组成的数据集。GROWdb数据可通过 KBase、NMDC和GROWdb Explorer 进行访问。

b. 具有配对数据类型的样本数量(下方用黑色实心圆表示),按水文单元着色,以及每次分析的样本数量。

c. 遍布美国的GROW采样分布。图中的点标记了采样位置。颜色编码代表所进行的微生物组分析类型(红色为宏基因组学;黄色为宏转录组学;蓝色为宏基因组学与宏转录组学配对)。方框中的数字和相应的河流颜色指示水文单元(HUC-2。

GROWdb 的MAGs作为一个经过注释的基因组集合,可在免费访问的KBase网络基础设施中获取。在这里,用户可以通过点击式界面访问样本信息、基因和MAG水平的注释,查看功能概况和基因组尺度的模型。

最后,为了帮助数据探索,我们将来自GROWdb的分类学和功能见解提炼成一种名为GROWdb Explorer的网络可访问格式,使得能够快速剖析整个数据集的分类学和功能分布。GROWdb第 1 版可以跨平台访问(图1a),使这一微生物组内容成为一个不断扩展的存储库,以便在未来整合和统一全球河流多组学数据。

获得超过3,000个地表水MAGs

为了识别河流地表水微生物组中的关键微生物参与者和功能,我们构建了一个由宏基因组组装基因组(MAGs)组成的基因组数据库。与已发表的河流宏基因组研究相比,我们的测序数据平均每个样本的测序量增加了三倍,从而提高了检测这些系统中编码的广泛微生物功能的灵敏度(扩展数据图2)。从这些测序数据中,我们组装并重建了3,825个中高质量的MAGs,并在99%的同一性水平上将其去冗余为 2,093个MAGs(扩展数据图3和补充数据2)。基于读长比对(read mapping),大多数(平均52%)宏基因组读长能够回贴到这个源自地表水的MAG数据库,这表明基因组数据库很好地代表了底层的测序数据。

去冗余后的MAG数据库(n = 2,093)包含来自27个门的基因组,其中许多代表了河流中最丰富和最广布的谱系。除了为这些生态上已知的类群提供基因组资源外,GROWdb的MAGs还为许多知之甚少的类群提供了基因组资源。我们基因组的一个子集代表了新的谱系,包括跨越16个门的10个科和128个属的新成员(扩展数据图2和3)。此外,很大一部分MAGs属于仅由字母数字名称定义的谱系(例如,未培养细菌和古菌基因组,UBA),包括在门(n = 1)、纲(n = 17)、目(n = 121)和科(n = 196)水平上的分类(扩展数据图2)。值得注意的是,MAG累积分析表明,我们对河流地表水微生物群落进行了全面的采样(扩展数据图3。

为了比较本研究中源自美国流域的GROWdb MAGs,我们汇编了来自其他生物地理学研究的淡水MAGs,以及来自美国境外站点的23个GROW宏基因组(补充说明1)。这项元分析揭示了湖泊和河流之间在基因组成员组成上的巨大差异,以及河流相对于湖泊的采样不足(扩展数据图4)。这些发现共同强调了跨越不同地理和环境梯度分析河流宏基因组的重要性,以恢复河流细菌多样性的广度。

为了突出GROWdb的相关性,我们分析了序列读取档案(SRA)中的266,764 个公共宏基因组数据集,结果显示GROWdb的MAGs在90%被归类为河流的宏基因组中被检测到,在46%被归类为淡水、水生或河流的宏基因组中被检测到。我们证实,GROWdb中最普遍的门和属在公开可用的宏基因组中具有平行的代表性(扩展数据图2)。此外,GROWdb的成员还在其他环境中被检测到,包括废水、湖水、沉积物、海洋、河口、活性污泥和土壤,这支持了河流包含跨越不同栖息地的多样化群落并充当跨景观整合者的观点(扩展数据图3)。同样,与其他研究一致,GROWdb的MAGs与沉积物宏基因组的重叠极小,只有16%的MAGs在这个相互连接但独特的河流隔室中被检测到。这证实了地表水和沉积物微生物群落之间日益明显的区别,进一步阐明了悬浮的地表水微生物可能源自多样化的非本地来源。

与公开可用数据的比较也强调了这项基于河流的微生物组研究的必要性,因为在SRA中,与土壤和海洋对应的宏基因组相比,淡水相关的宏基因组分别只有它们的一半和三分之一。此外,这项分析强调了标准化元数据实践对于数据重用的重要性,因为在公开可用的数据集中,超过10%的宏基因组具有模糊的分类,如“宏基因组”或“细菌”,导致数据无法使用。GROWdb遵循标准化的协议和元数据实践,使互操作性成为该资源的标志,并允许与其他研究进行元分析,随着我们快速扩展多组学方法的能力不断增强,这一点至关重要。

图2.河流微生物组的核心谱系和功能

a. 各样本中门水平的宏基因组相对丰度,每个样本在y轴上按从上到下最优势的门进行排列 。样本在x轴上按优势门进行分组。放线菌门 (Actinobacteriota)、变形菌门 (Proteobacteria)、拟杆菌门 (Bacteroidota) 和疣微菌门 (Verrucomicrobiota,图中缩写为 Verruc.) 是所有样本中最主要的优势门。

b. 宏基因组相对丰度与宏基因组占有率(即该属存在的宏基因组样本百分比)的关系图;图中的点代表GROWdb中的每个属,并按门进行着色 。在超过 50% 的样本中检测到的属(由红色虚线标示)已列出名称。

c. 箱线图展示了转录最活跃(宏转录组表达量最高)的前25个属,每个点代表一个宏转录组样本(n=57个宏转录组)。箱体的上下边缘分别延伸至第一四分位数和第三四分位数,中心线代表中位数,须(whiskers)代表1.5倍的四分位距;超出此范围的点代表离群值。箱线图上方的堆叠条形图表示GROWdb中该属内的MAG数量,并按是否在宏转录组中检测到进行着色(黑色表示表达;灰色表示未表达)。条形图上方的红色圆圈表示该属中的某个基因组在所有宏转录组中都是核心成员,即定义为在每个样本中都有基因表达。对于前 25 个表达最活跃的属,(中间的)黑色方框表示那些在 100% 的宏转录组(核心属)和超过 50% 的宏基因组中均被检测到的属。下方指示了每个属推断的基因组潜力,包括有氧呼吸(蓝色)、光驱动能量代谢(橙色)、氮代谢(绿色)和其他代谢(甲烷氧化和硫氧化,黑色)。DNRA:异化硝酸盐还原为铵。

核心河流微生物组特征

我们识别了跨河流的宏基因组和宏转录组的核心及优势特征。就微生物组中的相对丰度而言,通过宏基因组学测定,放线菌门(Actinobacteria)、变形菌门(Proteobacteria)、拟杆菌门(Bacteroidota)和疣微菌门(Verrucomicrobiota)的成员在所有样本中占主导地位(图2a)。在这些门中,跨样本分布最广(高占有率)的属也是这些群落中最丰富的成员(图2b。对于隶属于 Planktophila属(一种著名的淡水微生物)的MAGs来说尤其如此,它们存在于70%的GROW宏基因组中,并且在样本中的平均相对丰度最高,达到12%。其他五个属,包括 Limnohabitans A、Polynucleobacter、Methylopumilus、Nanopelagicus 和 Sediminibacterium,也存在于超过50%的宏基因组中。

对于具有配对宏转录组的样本子集,我们评估了转录最活跃的微生物 。为了聚焦最相关的谱系,我们将分析限制在至少在10%的样本中表达基因的MAGs上 。这导致2,093个MAGs中有四分之一被认为是活跃的,其中包括来自GROWdb27个门中19个门的至少一个代表。通过宏基因组学识别出的六个最相关的属(图2b)也属于平均基因表达最高的前25个属(图2c),表明普遍性、优势度和活性是一致的。

此外,这些相关谱系中的三个(Methylopumilus、Polynucleobacter、Planktophila),以及Pirellula B的成员,和伯克氏菌科的两个字母数字属(UBA3064、UBA954),在每个宏转录组中都具有转录活性,在此被称为核心活跃属 。值得注意的是,这不是一个属水平的聚合效应,因为除了Polynucleobacter之外,这些属中的每一个都有一个单一的MAG代表在每个宏转录组中表达,表明某些微生物菌株在跨河流中具有广泛的代谢活性 。在这里,我们展示了GROWdb的分析如何使我们将数千个微生物基因组缩减为一组在每个转录组中都检测到基因的六个属,揭示了可能代表诊断性或代谢目标的谱系和代谢途径,这些目标需要在未来的生物地球化学模型中得到准确的表征 。

为了理解这些核心、转录活跃的属在调节河流生物地球化学中的作用,我们利用基因组内容为每个MAG分配代谢性状,清查了利用氧气、光、氮、硫和其他关键能量产生系统的能力(扩展数据 图5和补充数据3)。我们发现,核心和表达最高的属具有有氧呼吸和利用光作为能源的能力,通过高产量的产氧或不产氧光系统或简单的低产量光视紫红质来捕获能量。事实上,在活跃度最高的前25个属中,超过90%能够进行有氧呼吸或光驱动代谢,其中许多编码了多种光捕获机制(图2c和扩展数据图6)。

除了异养和自养之外,许多这些核心活跃谱系还具有有氧氧化无机电子供体(如硫和可能的甲烷)的能力,后者是通过一种发散的颗粒甲烷单加氧酶实现的(见方法部分)。最后,这些最活跃的属中有一半具有通过呼吸作用或通过异化硝酸盐还原为铵来进行氮还原的能力(见方法部分)。总之,在许多核心活跃类群中同时编码有氧和厌氧能量系统以及光驱动代谢,突显了河流地表水中包含的代谢冗余性。

一些关键的河流生物地球化学过程(如硝化作用)由GROWdb的MAGs所代表,但未出现在前25个最活跃的属中。在地表水中,硝化作用似乎由细菌催化,这一发现与我们未组装读长的分类学概况一致,其中古菌在跨样本的相对丰度中占比不到3%(扩展数据 图 7)。我们在细菌Nitrosomonas属中鉴定出一个编码氨氧化(硝化作用的第一步)基因的MAG。我们注意到该基因组还包含产生温室气体氧化亚氮(N₂O)的基因,这一发现与其他氨氧化细菌一致。

另外两个GROWdb MAGs包含亚硝酸盐氧化(硝化作用的第二步)的基因,其分类归属为Nitrospira_D属和Nitrospiraceae科Palsa-1315属内的一个未分类物种(补充说明 2)。由于这些基因组的完整度高达95%,我们推断完全氨氧化(comammox)是不太可能的,因为这些MAGs包含亚硝酸盐氧化基因但缺乏氨氧化基因。这两个亚硝酸盐氧化菌在14–88%的宏转录组样本中被检测到,包括检测到亚硝酸盐氧化关键蛋白的转录本。这三个硝化菌MAGs中的每一个都包含对抗活性氧物种(超氧化物歧化酶、过氧化氢酶和/或过氧化物酶)的基因,以及一个参与修复紫外线照射损伤的光裂合酶基因,这些都是在地表水中可能很重要的适应性。总体而言,我们的发现揭示了河流中硝化菌的代谢潜力和表达,与来自土壤和海洋栖息地的硝化菌相比,它们在基因组数据库中的代表性不足。

虽然不是核心成员,但在该门采样的总共48个MAGs中,我们也检测到了17个具有转录活性的Patescibacteria MAGs。这些基因组都缺乏有氧或无氧呼吸的能力,推测为厌氧、专性发酵菌,这与该门之前的基因组报告一致,该门迄今为止缺乏任何纯培养、特征明确的代表。鉴于地表水是有氧的,我们验证了这里报告的丰度模式与其他河流宏基因组和基于扩增子的研究一致,在这些研究中,这些谱系在河流地表水群落中的相对丰度占比高达7%。这些专性厌氧成员可能作为共生体存在,或者在与悬浮颗粒上的生物膜相关的低氧生态位中繁衍生息,或者在溶解有机物分解过程中氧气可能耗尽的潜流带环境中繁衍生息。为了支持后者,我们观察到Patescibacteria的相对丰度和表达随着河流大小显著降低(扩展数据图7),这表明当水体与河床之间的交换更大时,这些专性发酵菌在浅水中更为活跃。

新兴污染物

鉴于新兴污染物(例如药物、杀虫剂和塑料)对环境和人类健康的威胁,我们假设GROWdb的MAGs会编码并表达与转化这些化合物相关的基因,而河流微生物持续暴露在这些化合物中 。具体来说,基于它们与河流系统的相关性,我们识别了与抗生素、消毒副产物、含氟化合物、化肥和微塑料相关的微生物基因。

总共,我们将来自GROWdb MAGs的261种与新兴污染物相关的基因类型归类为11个类别(扩展数据图8和补充数据4)。结果回收了与抗生素抗性(n=1,587)、对苯二甲酸和邻苯二甲酸酯代谢(n=405)以及含氟化合物(n=1,194)相关的基因,而磷(n=10,717)和有机氮(n=149,676)代谢的基因则作为化肥转化的指标。这为河流微生物在整个河流生态系统中与新兴污染物相互作用的能力提供了广泛的证据,因为它们最终负责河流中的净化和营养物质去除。

由于河流流动时带有沉重的抗生素负担,抗生素抗性迅速发展并扩散到各种环境隔室中。抗生素的产生也是这些复杂群落中自然竞争的一部分。我们编录了从GROWdb的1,135个(54.3%)MAGs中回收的1,587个抗生素抗性基因(ARGs),代表了25个不同的门(补充数据 4)。由于我们的分析侧重于MAG,这些数字可能代表河流中ARG流行率的下限,因为它们不包括质粒编码的ARGs。这些候选ARGs代表了综合抗生素抗性数据库(CARD)定义的 25 个广泛的抗菌素抗性基因家族。单个MAG有时编码来自多个基因家族并针对多种药物类别的 ARGs。大多数(n=1,219)候选 ARGs 是糖肽类抗性(van)基因簇编码的蛋白质的同源物,这些基因出现在 955 个不同的MAGs中。

然而,绝大多数这些基因并没有出现在典型的van基因簇中,也没有像已知的革兰氏阳性放线菌生产者那样出现在明显的生物合成基因簇附近。尽管单个van基因已被证明足以赋予对糖肽类抗生素的抗性,但这批巨大的新候选van同源物的功能仍有待确定。30%的ARGs在一个或多个样本的宏转录组中有表达证据,其中抗生素靶点改变和抗生素外排泵表达最广泛。ARGs的表达在样本间存在差异,有11个样本具有至少20个有表达证据的ARGs。

鉴于污水处理厂(WWTPs)已被证明是抗菌素抗性的聚集点,我们假设ARGs的存在和表达与流域内WWTPs的密度有关。我们的发现表明,流域内WWTPs的存在导致了更多的ARG表达,且这种相关性对于外排泵也具体成立(图3a 和 扩展数据图8)。

除抗生素外,河流微生物组还编码了转化其他新兴污染物的能力,包括源自化肥(磷和有机氮)、微塑料(乙烯、聚对苯二甲酸乙二醇酯和对苯二甲酸)、消毒副产物(亚氯酸盐)和阻燃剂(含氟化合物)的污染物 。用于有机氮转化的胞外肽酶和用于释放磷的C-P裂解酶是编码和表达最广泛的(扩展数据图8)。这些基因在河流生物中的普遍存在可能是由于氮和磷化合物通常是微生物生命所必需的。

我们还发现了与其他新兴污染物转化相关的基因,包括含氟化合物,以及乙烯和邻苯二甲酸酯代谢。脱氟基因(脱卤酶)在许多河流微生物中都有编码,并在Limnohabitans和Limnohabitans_A属的成员以及核心成员 Polynucleobacter 中表达(扩展数据图8)。值得注意的是,聚对苯二甲酸乙二醇酯(PET)降解为原儿茶酸的完整途径是在多个生物体中共同编码的,其中途径的下游部分在Limnohabitans A中表达。由于这些新兴污染物源于人类活动的影响,我们推测这些基因的表达可能与土地利用相关,并发现城市化影响驱动了这些基因在河流微生物组中的表达(扩展数据图8)。河流地表水微生物组表现出转化各种新兴污染物的巨大能力,而城市化影响驱动了这些基因的表达,揭示了微生物生态学与环境污染之间有趣的交集。

大陆尺度模式

我们采样设计的优势之一是伴随微生物组采样的空间、化学和物理变量,这使我们能够在大陆尺度上将驱动微生物生物地理学的因素情境化。之前的研究仅利用分类学做到了这一点,但据我们所知,这些分析并未整合功能基因-性状信息。我们假设河流微生物群落在大陆尺度的调查中表现出空间模式,并且这些模式可以通过水文生物地球化学、地理和土地管理因素进行预测。

每个样本都有一套配对的超过250个物理、化学和空间变量(例如,河流大小、纬度、总氮),我们利用这些变量来识别微生物组结构和表达功能的潜在驱动因素。在检查的所有河流站点变量中(图3b),河流级序(Stream order)——一种相对河流大小的数字排名,涵盖了小的源头溪流(低级序1-3)到较大的河流如密西西比河部分河段(高级序8-12)——是微生物组组成最重要的控制因素。河流大小比纬度位置或总碳更重要,而后者通常被认为是其他栖息地微生物组的控制因素。宏基因组和宏转录组都受到河流级序的结构化影响(图3b,c),为下文描述的河流连续体概念(RCC)提供了支持证据。

继河流级序之后,表达的微生物功能谱也受到流域气温(均值和最大值,源自地理空间数据而非采样时测量)、流域面积和总径流的影响(图3)。

鉴于与气温的这种关系,我们试图了解哪些功能性状和微生物对这些群落水平的观察结果贡献最大。基于回归的建模表明,光驱动代谢,其次是有氧过程,是最重要的变量,可预测平均和最大流域气温(扩展数据图7)。流域最高温度最重要的生物预测因子是核心活跃谱系,如 Methylopumilus、UBA954、Polynucleobacter 和 Limnohabitans,它们正在积极转录光捕获代谢的基因(图2c 和 扩展数据图7)。我们的发现表明,光捕获代谢对河流能量生成至关重要,并表明气候对水温的影响可能在这些微生物的生态位中起决定性作用。然而,光照的影响不容忽视,它在河流系统中通常随温度变化,并影响微生物资源的可用性。这些发现与海洋系统的报告一致,暗示了水生微生物组之间共享的一套新兴规则。

除了环境因素外,我们还观察到地理位置在构建河流微生物组中也起作用。例如,微生物群落基因组成员结构跨越了由Omernik II级生态区定义的生态区——这是一种基于相似环境特征划分不同生态区域的分类系统,为理解跨景观的生态模式和过程提供了标准化框架。值得注意的是,干燥气候、混合草地河流微生物组共享相似的微生物群落,这些群落与源自湿润到亚热带地区的群落截然不同(扩展数据图7)。同样,水文单元代码(HUC,美国流域分类系统,如图 1c 所示)识别出了来自大陆次区域的独特微生物群落(扩展数据图7)。这些发现支持了早期的工作,表明河流微生物群落是从景观中接种的(inoculated),这种陆地影响在下游群落组装过程中起着重要作用。需要注意的是,在表达的功能水平上未观察到这种空间结构化,这表明在这个大陆尺度上,微生物的变化被功能等效性所补偿。这一发现表明,分类学信息可能并不最适合将微生物组内容转化为管理指标,除非像土壤健康指标所建议的那样纳入生态区域框架中。

为了利用微生物群信息作为监测河流系统人类和环境健康的哨兵,需要更深入地了解流水系统(lotic systems)中的细菌群落结构、功能和变异性。虽然这些土地利用和流域变量中的每一个都独立地与地表水微生物群落组成和表达表现出显著关系(图3b),但我们的关注点超越了它们的单独影响。我们旨在了解已识别出的最具影响力的因素在解释微生物群落结构和表达变异方面的综合贡献。此外,基于温度等因素作为微生物群落功能的显著驱动因素(扩展数据图7),我们假设一年中的时间(季节和月份)可能起作用。我们发现,河流级序类别、月份、纬度、土地利用和最大流域温度及其相互作用解释了宏基因组水平上微生物群落组成变异的显著比例(R² = 0.69;扩展数据图7c)。值得注意的是,相对于其他变量和所有相互作用,河流级序和月份解释了最多的变异。当使用相同的变量集测试宏转录组组成时,并未显示相同的结果,因为只有河流级序和空间位置(考虑到纬度和经度)是显著的驱动因素(R² = 0.41)。总体而言,结果表明多种环境因素,包括地理和土地利用变量,在塑造微生物群落组成和表达方面起着重要作用。利用 GROWdb 的分析为塑造河流群落的环境因素和决定性机制提供了一个框架。

3.河流微生物组组成和功能的模式与驱动因素

a. 在没有或有污水处理厂 (WWTP) 影响的站点表达的外排泵(上图)和抗生素抗性基因 (ARGs)(下图)的数量,数值已针对每个样本的宏转录组测序量(以 Gb 为单位)进行了归一化处理(n = 43 个宏转录组)。

b. 利用 Mantel 检验将宏基因组和宏转录组的组成、功能及多样性与 36 个选定的站点、土地利用或流域变量相关联(顶部两行)。随后利用 Pearson 相关性进行成对比较(b 中的热图),仅显示显著值,显著性由 R 语言中的双侧 cor.test 确定 。变量按类别着色,包括微生物指标(紫色)、站点或局部指标(浅蓝色)、土地利用指标(橙色)和流域指标(深蓝色)。对于微生物数据的成对比较,使用宏转录组指标进行多样性和功能丰度的计算 。

c. 微生物群落多样性与河流级序 (Stream order) 显著相关,左图为基于基因组解析的宏基因组 Bray-Curtis 距离的非度量多维尺度分析 (NMDS) 展示的 β-多样性,右图为物种丰富度与河流级序的 Pearson 相关性展示的 α-多样性,图中的点 (n = 105) 按河流级序着色 。对于箱线图,箱体的上下边缘分别延伸至第一和第三四分位数,中心线代表中位数,须 (whiskers) 代表 1.5 倍的四分位距;超出此范围的点代表离群值 。

河流连续体概念

RCC提供了一个框架,用于整合流水系统中可预测和可观察的生物学特征,并进一步表征生物多样性如何沿着河流系统发生变化。具体而言,RCC假设随着河流规模的增加,陆源输入的影响将减少。它还假设,由于与景观的接触面最大,生物丰富度最初会随着河流级序复杂性的增加而增加,但随后会随着河流宽度和流量的增加而减少。在泰晤士河、密西西比河和亚马逊河的河流级序梯度上观察到微生物16S rRNA基因丰富度降低,这为RCC适用于微生物群落提供了支持。鉴于我们的数据集从单条河流扩展而来,并增加了功能解析的过程,我们假设RCC将扩展到大陆尺度上的功能潜力和表达模式。

首先,我们感兴趣的是宏基因组和宏转录组水平上的微生物丰富度如何在河流级序梯度上变化,以及这些变化是否遵循像单条河流中基于16S rRNA丰富度那样的规则。在宏基因组水平上,整体基因组丰富度在河流级序为6时达到峰值。在宏转录组水平上,丰富度随河流级序增加,并在河流级序为8时达到峰值,这是通过宏转录组学分析的最高河流级序。宏基因组结果与之前关于RCC的报告一致,即物种丰富度在中型河流中达到峰值。据我们所知,这是首次跨河流进行基因组解析的宏转录组学报告,表明在大陆尺度上,基因组推断的转录丰富度可能受控于一套与基因存在不同的环境控制因素。

RCC描述的生物多样性的一个主要控制因素是阳光照射的变异性。低级序河流通常以茂密的岸边植被或悬垂的树木为特征,限制了阳光穿透,从而限制了浮游植物和底栖微藻的初级生产力。与这一观点一致,我们观察到当从低级序河流向高级序河流移动时,光驱动的微生物代谢在统计学上显著增加。此外,RCC提出光合作用与呼吸作用的比率 (P/R) 在中型河流中增加,但在最小和最大的河流中由于河岸植被遮挡和浑浊度(分别导致的光限制)而降低。利用微生物基因表达结合基因组解析的生活方式信息,我们估算了P/R比率,揭示了该比率在 6-8 级河流中最高,为这一概念提供了初步支持。然而,这一P/R指标的稳健性需要在更高级序的河流(如9-12级)中进一步评估,这些河流在此宏转录组数据集中的采样不足。

RCC描述的另一个生态控制因素是陆源碳输入的重要性向下游递减。我们假设基因表达将显示微生物的碳利用反映了陆源输入影响随河流大小而减小。为了解析跨河流级序梯度的微生物代谢变化,我们基于GROWdb MAGs中的微生物基因表达定义了碳利用模式。我们的发现表明,表达的微生物碳利用在河流级序梯度上存在显著差异。具体而言,针对聚合物、芳香族化合物和糖类的基因转录本在低级序河流中上调,而主要来自甲醇氧化的甲基营养基因转录本在高级序河流中增加。在这些系统中,甲醇可能是自源性的(autochthonous),源自河流浮游植物生物量或芳香族外源性(allochthonous)植物凋落物的微生物代谢。我们的发现表明,推断出的与碳利用相关的微生物代谢遵循RCC提出的陆源输入影响预期下降的规律,但我们承认需要更多的研究来验证这些见解,特别是来自更高级序河流的研究。

总之,河流系统曾被认为是将被动的管道,将水从陆地输送到海洋系统。因此,人们曾认为河流仅仅是导管,缺乏实质性的生物地球化学活性,且几乎不具备预测能力。相反,我们表明河流微生物组及其编码的功能并非随机分布,而是受河流大小、生态区域和土地管理制度的结构化影响。这项研究也支持将RCC应用于微生物群落,并提供了证据表明河流微生物组的景观模式基于基因组功能的机制性变化。我们表明,无论是在基因组潜力还是表达方面的微生物丰富度,以及表达的功能属性,都遵循RCC的原则,并由物理-地貌环境塑造。GROWdb在RCC上的这一应用增加了一个关于微生物代谢如何跨河流变化的视角。

图4.微生物生活方式和碳利用沿着河流级序梯度呈现结构化分布

a. 微生物生活方式(定义见方法部分)在河流级序梯度上的相对表达。

b. 对应于a中数据的一维箱线图,每个点 (n = 53) 代表一个样本,河流按小型 (1–3)、中型 (4–6) 和大型 (7–8) 级序分组。对于箱线图,箱体的上下边缘分别延伸至第一和第三四分位数,中心线代表中位数,须 (whiskers) 代表1.5倍的四分位距;超出此范围的点代表离群值。小型、中型和大型河流之间的表达显著差异通过Kruskal–Wallis检验确定,并用每个图下方的红色横条表示 (P < 0.01)。具体的P值报告在补充数据4中。

c. 河流级序模型突出了从小型(左)到大型(右)河流微生物表达的变化 。

作者简介

Kelly C. Wrighton (通讯作者)

Kelly C. Wrighton是科罗拉多州立大学(Colorado State University)土壤与作物科学系的教授。她的实验室致力于利用基因组学、转录组学和代谢组学等系统生物学工具,研究微生物在河流、土壤、深层地下页岩以及人类肠道等不同生态系统中的群落结构,揭示其在生物地球化学循环和宿主健康中的关键作用,旨在为环境和健康挑战寻找基于微生物的解决方案。Kelly在加州理工州立大学圣路易斯奥比斯波分校(California Polytechnic State University, San Luis Obispo)接受了本科及硕士教育,分别获得了微生物学学士学位和生物科学(生态学)硕士学位。随后,她在加州大学伯克利分校获得了微生物学博士学位,并在该校地球与行星科学系完成了博士后研究(师从Jill Banfield教授)。在加入科罗拉多州立大学之前,她曾在俄亥俄州立大学微生物学系担任助理教授。她的工作获得了诸多认可,包括美国总统科学家与工程师早期职业奖(PECASE)、国际微生物生态学会(ISME)青年研究员奖、美国地球物理联合会(AGU)Thomas Hilker生物地球科学卓越早期职业奖和James B. Macelwane奖章,以及美国国家科学基金会(NSF)CAREER奖。相关学术成果发表在Science、Nature、Nature Microbiology 和Cell等顶级期刊上,累计发表论文 80 余篇,被引用数千次。

宏基因组推荐


  • 9月12-14日,高级转录组分析和R语言数据可视化

  • 10月18-19日,微生物组-扩增子16S分析

  • 11月15-16日,微生物组-宏基因组分析

本公众号现全面开放投稿,希望文章作者讲出自己的科研故事,分享论文的精华与亮点。投稿请联系小编(微信号:yongxinliu 或 meta-genomics)

iMeta高引 fastp PhyloSuite ImageGP2 iNAP2 ggClusterNet2
iMeta工具 SangerBox2 美吉2024 OmicStudio Wekemo OmicShare
iMeta综述 高脂饮食菌群 发酵中药 口腔菌群 微塑料 癌症 宿主代谢

10000+:扩增子EasyAmplicon 比较基因组JCVI 序列分析SeqKit2 维恩图EVenn

iMetaOmics高引 猪微生物组 16S扩增子综述 易扩增子(EasyAmplicon)

系列教程:微生物组入门 Biostar 微生物组 宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

点击阅读原文

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询