基于词汇距离的中国境内语言计算研究

2018-12-23

基于词汇距离的中国境内语言计算分类

冉启斌 Soeren Wichmann


    数据库涵盖277个中国境内语档(doculects。也有极少数跨境或周边语档),每个语档收录40个基本核心词的语音形式。通过软件程序计算所有语言各40个核心词的归一化莱文斯坦编辑距离商(LDND)。使用分子进化遗传学分析软件MEGA制作系统发育树图;Splitstree软件制作系统发育网络图。