基于汉维映射关系构建维吾尔语依存树库
吐尔洪·吾司曼1,2,3 杨雅婷1,2,3 王磊1,2,3 周喜1,2,3 程力1,2,3
1.中国科学院新疆理化技术研究所;2.中国科学院大学3.新疆民族语音语言信息处理实验室
摘要: 该文提出一种基于汉语依存句法信息来构建维维吾尔语依存句法树库的方法。首先对维吾尔语进行形态分析,之后进行汉维词对齐、中文依存分析,然后根据词对齐信息以及汉语依存信息得到维吾尔语依存信息,最终对结果进行优化,获得维吾尔语依存句法库。在此基础上训练得到的依存句法分析器在CoNLL 2017Shared Task测试集上进行实验,带标记依存正确率LAS(Labeled Attachment Score)和无标记依存正确率UAS(Unlabeled Attachment Score)分别为34.38%和52.53%。
关键词:
维吾尔语;依存句法;映射;
维吾尔语;依存句法;映射