生物系统发育计算方法与分析软件
如果我们拥有关于人类的完整的谱系,那末人种的系统的排列就会对于现在全世界所用的各种不同语言提供最好的分类。C. Darwin——(1859)
如果没有进化论,生物学的一切便毫无意义。——T. Dobzhansky(1973)
树
树枝
节点:内部节点,外部节点/叶子节点
内部节点代表进化事件发生的位置或进化过程中的共同祖先。
外部节点代表不同物种或分类单元
树枝:树枝是连接各节点的边,树枝长度代表进化的时间或进化距离
根据拓扑结构的不同,系统发育树分为有根树和无根树。有根树有一个根节点,代表所有节点的共同祖先。无根树只表明节点之间的关系,没有进化方向。
构建系统发育树常用算法中的邻接法(neighbor-joining, NJ):
Kidd & Sgaramelh-Zonta(1971)最早提出基于距离数据的系统发育树重构算法,从所有可能的进化树中选择进化分支长度总和最小的那棵树……又提出了启发式搜索算法:从一个距离矩阵开始,采用一定的准则,递归地合并矩阵中距离最短的节点,并重构新的距离矩阵,直到只剩下最后一个分类单元为止。其中最常用的是邻接法(Saitou & Nei1986)。
更复杂的进化关系,网状进化事件
树状模型只考虑纵向遗传,而忽视横向传递
从树状进化关系 → 网状进化关系(基因横向转移、杂交、基因重组)
可以在没有亲缘关系的物种之间进行
生物父代不只一个
系统发生网络是一个无环图,图中有些节点的父节点个数大于2个(这种节点也称为网络节点)
系统发生网络根据拓扑结构分为无根(unrooted)网络和有根(rooted)网络,根据功能分为隐式(implicit)和显式(explicit)网络
隐式网络可用来表示冲突信息
无根系统发生网络都是隐式网络
Bryant & Moulton(2004)提出邻接网法(Neighbornet),这是一种基于距离的计算方法,可用于复杂性状冲突的表达;且随着性状复杂性的增加而分析效果变得更好。该方法是分析复杂进化模式非常好的选择。
枝条长,语言之间的距离更大
盒装结构是语言接触的表现
盒装结构越大,表明语言特征蕴含的冲突信息越大,语言之间横向交流越多
常用的生物进化分析软件可以参见下面的网页:
http://www.bio-soft.net/tree.html
http://evolution.genetics.washington.edu/phylip/software.html
BEASTS2软件:http://www.beast2.org/
参考文献:
张丽娜、荣昌鹤、何远、关琼、何彬、朱兴文、刘佳妮、陈红菊(2013)常用系统发育树构建算法和软件鸟瞰,《动物学研究》34(6):640-650.
程春花、黄原(2008)系统发育网络的构建与应用,《昆虫分类学报》30(3):215-220.
王娟、郭茂祖(2014)系统发生网络构建算法综述,《智能计算机与应用》4(1):32-34,37.
邓晓华、杨晓霞、高天俊(2015)试论语言演化网络——以藏缅语为例,《语言研究》35(3):12-19.