分类: PAML, 分子进化

「PAML」分子进化程序包PAML使用入门3-branch model

原文发布日期:20131026

之前介绍过用PAML程序包里的Codeml计算一组序列的site selection:

「PAML」分子进化程序包PAML使用入门—codeml] 。以及如何用LRT检验结果的可靠性:「PAML」分子进化程序包PAML使用入门——Vol2. LRT检验

这次介绍Codeml里的branch model。

先简单介绍点背景知识,要看一组序列受到的选择,首先会从整组序列来考虑,看这组序列的的非同义突变/同义突变(Nonsynonymous substitution/ Synonymous, ω, dN/dS),ω>1,说明这组序列受到正向选择(positive selection),ω=1为中性选择(natural selection),ω<1为纯化选择(purifying selection)。

但这里就会有问题,因为如果拿整组基因来看,大部分情况会得到ω<1的结果,因为大部分有功能的基因不会所有位点都受到强烈的positive selection,这样从整组数据来看,正向选择就被中和掉了。

而PAML的优势就是通过Branch model和Site model,仅仅考察在一个进化树某一个枝所收到的选择压力,或者序列中哪些位点遭受到正想选择。Branch Model可以用于分析物种分化时间;而Site model对于基因功能的研究非常有帮助,比如可以找到基因的关键结构,然后通过定点突变来看是否会影响到功能。

接下来拿PAML自带的Example作为例子来说说Branch model。

PAML版本4.4
所用数据集为Example中的lysozymeSmall

Step1

为了进行比较我们先来看看整组数据的ω, lysozymeSmall.ctl文件里设置

Model=0 (假设所有枝的ω是一样的)
NSite=0

打开mcl文件,结果如下

Step2

因为假设所有枝收到的选择压力是相同的,所以ω全部一样,这时候我们标记一下tree文件,假设3,4这个枝的ω和其他不同

然后改一下ctl文件

Model=2 (假设枝的ω是不一样的)
NSite=0

打开mcl文件,结果如下

注意上面的红框,标记树枝的ω值已经变了。

下面的红框是树文件,可以吧这个文件拷贝到文本编辑器里。然后用Treeview或者Figtree打开,之后就可以将不同数值的ω标记到树图里了。

参考资料

PAML manual(http://abacus.gene.ucl.ac.uk/software/pamlDOC.pdf)

lysozymesmall.readme

Modifying a Tree File for PAML(https://molevol.mbl.edu/wiki/images/5/5b/PAMLtreetutorialmolevol2012.pdf)