电脑装配网

从16S到宏基因组,文章提升不止一个level

 人阅读 | 作者yiyi | 时间:2023-10-28 13:50

|原创:小鱼儿

以16S为代表的meta 扩增子测序分析,由于极高的性价比而在微生物领域广泛应用。

相对于其他微生物群落分析,扩增子成本又低,可以开展的分析内容还非常多,比如我们的Omicsmart平台上,就已经有100多分析点。

因此,meta 扩增子测序分析是大家入门微生物群落分析、初步开展微生物作用机制的首选组学方法。

但是,一个微生物基因组的大小可能有几Mb,甚至几百Mb,仅仅基于400bp左右的片段进行分析,其研究局限性可想而知。那么16S和宏基因组二者到底有何具体的异同,我们如何选择,才能获得更好的结果呢?

今天,我们通过两组学的深入对比,为大家汇总关于16S和宏基因组的微生物群落分析策略。

1.组学初步对比

初步来看(图1),像α/β多样性、物种等的基础分析,二者是相近的。但是扩增子的分析更为基础通用,而宏基因组可挖掘探索的分析空间更大,因而分析难度、复杂度更高,对应的,收获更高水平文章的概率也会更高。从图1 也可以看出,16S和宏基因组都涉及了微生物最核心的两类要素——物种和功能。我们以同时进行了16S和宏基因组测序的15个水体样本为例,对比讨论两组学结果的差异特征。

图1 组学初步对比

2.组学基础分析对比

2.1物种篇

第一回合:物种数量对比

首先,我们对比两组学物种(仅考虑细菌和古菌)的数量情况。“属”作为最接近生态功能分类的水平,在物种分析中有着极高的关注度。在不考虑丰度的情况下,如图2,两组学都检测到的物种有180个,16S特有的仅有75个,宏基因组特有的2994个。而这一差距在“种”水平上更大。可见,由于引物扩增、序列太短等大大限制了物种的鉴定范围。

而宏基因组未检测到的部分,可能是由测序深度影响,但影响极其有限。

图2 “属”水平对比

如果仅考虑丰度高于1%的各水平物种,如图3。

总体来看,共有物种(蓝色区域)29个。宏基因组特有29个,16S特有16个。其中共有层级主要集中在近圆心端,特有物种主要分布于分枝末端。结果表明,两组学各自的局限性仍然存在,且研究层级越精细(如属、种水平),16S的局限性越大。而由于测序成本的下降,测序量对宏基因组的限制也会逐渐减小。

图3 高丰度物种对比

第二回合:物种丰度对比(pearson)

如果说物种数量上的差异,主要影响我们研究的精细度(物种分类层级),那么物种丰度上的差异,则主要影响我们对样本规律的探讨,因为我们需要通过物种的丰度变化,找到分组间的差异,进而揭示微生物的驱动响应机制。

如图4,考虑所有物种,在门水平,两组学的一致性可达0.7。但在属水平,考虑所有物种时,相关性仅为0.2,虽然增加丰度过滤的阈值会提高相关性,但整体差异依然较大。

图4 组学pearson相关性(所有物种)

(图中点表示一个样本中的一个物种,点颜色表示物种,相同颜色的不同点是某物种在所有样本中的分布)

由此说明,在大的物种分类上,或者对于高丰度的物种(靠近图4右上角的物种),两组学对规律的呈现比较一致,同时也从侧面说明两组学分析的科学性和可靠性。

但在更精细的物种层级,结果会存在一定的差异。

第三回合:样本间规律呈现

那么综合物种多样性和物种丰度两个层面,即菌群结构层面(beta多样性),两组学反应的规律一致性如何呢?我们以Bray距离的Mantel test为例,即使在属水平,两组学依然有很高的显著相关性,达0.688(图5)。这就说明,虽然在精细的分类上,两组学物种数量和丰度存在较大差异,但最终反映出的样本规律是一致的,即由各自组学获得的菌群结构差异一致,比如都可以说明分组(时空差异、实验处理)对群落结构造成的影响。

图5 两组学mantel test相关性分析

2.2 功能篇

因为16S基于Tax4Run或者PICRUSt也可以获得功能分析结果,我们以PICRUSt2软件的Pathway结果为例,对比其与宏基因组结果的特征。如图6,与物种数量的规律相反,16S鉴定到的功能分类反而更多,不过数量上的差异程度远小于物种。

但整体分布规律上,二者还是比较接近,pearson相关性达0.63。除去宏基因组测序量偏低的影响,更主要的原因在于16S的功能预测可能存在一定的高估,对于更为精细的功能研究来说,准确度不够。

图6 两组学功能对比(pathway)

3.应用策略

基于以上对比分析,我们发现,16S属于“麻雀虽小,五脏俱全”型,虽然测序分析的片段短,但是多样性分析、物种、功能分析都不耽搁。

宏基因组属于“博而可以精”型(即假定测序深度满足基本需求),对物种和功能都有比较丰富的反映。

此外,宏基因组测序真实获得了各类型物种/功能的序列,所以可以基于海量序列开展专属于宏基因组的分析,比如binning分析、CAG分析、基因序列进化树分析等。这些高级复杂分析点对提升文章深度也有重要推进作用。

那么,对于这两种组学,我们如何抉择呢?

综合分析结果和成本差异,如果是初步接触微生物群落或者经费有限,可以先分析16S,然后基于16S的参考和指导,精挑样本,再把宏基因组当作跳板,将研究深度扩展到更精细的物种(种)和功能层面。既提高的了文章深度,又更为经济可行。比如基于大批量的16S测序分析,挑选关键样本开展宏基因组的深入分析,进而提升研究深度,如链接中自闭症文章的应用(文章链接)。

如果已经有微生物分析经验,则可以进入宏基因组领域,在海量数据上进行更复杂深入的探讨。同时,由于宏基因组的分析准确度会受测序量的影响,因此我们可以结合16S数据作为宏基因组组学分析可靠性的验证,即对所有样本同时开展16S与宏基因组的测序分析。关于16S与宏基因组互相验证的思路和示例,我们将在后续文章中继续分享。


文章标签:

本文链接:『转载请注明出处』