在微生物分析中,经常使用稀释性曲线来评估测序量是否足够;可以使用mothur 这个软件来完成
rarefaction.single 命令用来做稀释性曲线,既可以对单个样本单独分析,也可以一次对多个样本进行分析
对多个样本进行分析:以shannon 指数为例
需要准备一个shared 文件,shared 文件格式可以参考mothur官方文档
https://www.mothur.org/wiki/Shared_file
示例shared 文件如下:
label Group numOtus OTU1 OTU2 OTU3 OTU4usearch A0 792 10125 1572 23 4210usearch A1 792 2949 1759 6268 2368usearch A2 792 16895 3861 5576 326usearch A3 792 1114 3895 2945 1180usearch A4 792 770 1506 108 450usearch A5 792 4420 4657 109 265usearch A6 792 3538 3430 3898 643
mothur 运行的命令如下:
mothur "#rarefaction.single(shared = sample.shared,label = userach,calc = shannon, groupmode = f, processors = 20)"
运行完成之后,在sample.shared 所处的目录下,会生成一系列文件:
1)每个样本对应的 r_abund 文件
示例如下:
usearch 414 10125 4644 4217 4210 4110 3241
其实这个文件就是从sample.shared 中把每个样本单独抽出来
2) 每个样本对应的 r_shannon 文件
示例文件如下:
numsampled usearch lci hci1 0.0000 -0.0000 -0.0000100 3.4685 3.2035 3.6901200 3.6593 3.4758 3.7967300 3.7319 3.6156 3.8696400 3.7684 3.6695 3.8807500 3.8004 3.6914 3.8794600 3.8228 3.7240 3.9017
第一列是抽样的次数,第二列数对应的shannon 指数的值,lci 和 hci 分别代表95%置信区间的左右边界;
基于抽样的次数和每次抽样计算得到的shannon 指数的值就可以画香浓曲线了: