最大简约法(Maximum Parsimony)最早是基于形态特征分类的需要而发展起来的,具体的算法有许多版本,其中有些已被广泛地用于分子进化研究中,根据离散特征数据构建系统发生树.最大简约法的目标是构造一棵反映分类单元之间最小变化的系统发生树.最大简约法利用的只是对简约分析能提供信息的特征,如在DNA序列数据中,利用的只是存在于核苷酸序列差异(至少有两种不同类型的核苷酸)的位点,这些位点称为简约信息位点(parsimony informative site).具体来说,信息位点就是指能由位点产生的突变数目把一棵树与其它树区分开来的位点.如果对于某个位点,所有序列都有同样的字符,则这个位点称为不变位点(invariant).显然不变位点是非信息位点(uninformative site).如果一个位点是信息位点,那么它至少有两种不同的核苷酸,并且这些核苷酸至少出现两次.所有的简约法程序在开始时都将这条简单的规则应用于输入数据集.显然,表6.5中位点6 是非信息位点,该位点将被舍弃,在简约法分析中不再被考虑.但是,非信息位点对基于距离的方法中两两相似度的得分有贡献,仅这一点差别就可能使这两类方法产生的结果有很大的不同.
信息位点是指那些至少存在2个不同核苷酸且每个不同核苷酸至少出现两次的位点.
假定有四条序列 i,j,k,l(当然也可能是更多的序列比对)
i : AGGGTAACTG
j : ACGATTATTA
k: ATAATTGTCT
l : AATGTTGTCG
序号:12345 678910
4,7,9位点即为信息位点,只有序列中有信息位点才可以用最大简约法建树.
1位点全为A,5位点全为T,核苷酸没有发生变异,而除1,5位点外均为核苷酸变异位点.
上www.***.com看看