您的位置 首页 > 腾讯云社区

不要合并OTU表!---生物信息知识分享

今天有人问我,自己在两个公司对一批样本分别测了序得到OTU表,要怎么合并OTU表做后续的分析。

这个问题之前也有几个人问过,现在看来遇到这个问题的人也不少,本文简单回答一下,并给出我的建议。

首先,不管是不是同一测序公司,事实上任何两个OTU表不可以直接合并!原因很简单,两个OTU表中的每个OTU都不一定对应的是一个物种。这里面又包含几个因素:

1. 嵌合体的识别与去除,每次运行会有微小的差别。

2. 由于Uparse 算法本身比较宽松,每次运行得到的OTU表本身也会有微小的差异。其余的算法类似。

3. 每个OTU代表序列的选择可能也会有差别。

参考:

OTU or zOTU or sOTU or seq table, Which will rule microecology?

《OTU or zOTU or sOTU or seq table…》文章的一点更正

三类OTU聚类算法

MER: 不同聚类阈值对群落结构影响不大

这就导致了同一个fasta文件跑两次Uparse,结果不会完全相同,而且数据量越大差异也会越大。

因此OTU表直接合并是没有意义的,必须跟公司要两次的fasta文件合并,之后再得到OTU。

建议

可能一批数据在公司测了好几次,我的建议是不要合并fasta文件得到OTU之后就进行分析。

首先应该做的是考察一下不同批次之间是否已经存在了较大的差异。

可以将不同批次之间进行分组先做一下PCA或DCA,看批次之间是否明显的分开。

如果分开的很明显,那就说明样本本身可能已经发生了变化;或者是公司的建库、测序平台等因素对结果影响很大。测序结果一定要慎用!

建议再测一次~

参考:

MiSeq In-Run Forecast——评价Miseq测序仪测序质量的工具

Rob Knight: PCR不需要做三个平行再混合!

测序得到的Singletons都是artifacts么?

END

---来自腾讯云社区的---生物信息知识分享

关于作者: 瞎采新闻

这里可以显示个人介绍!这里可以显示个人介绍!

热门文章

留言与评论(共有 0 条评论)
   
验证码: