基于词性约束的藏文分词策略与算法
1.青海师范大学计算机学院;2.青海省藏文信息处理与机器翻译重点实验室;3.藏文信息处理教育部重点实验室
摘要: 自动分词作为自然语言处理基础性的研究课题,一直被学术界所关注,随着藏语自然语言处理技术研究的不断深入,藏文分词也面临越来越多的挑战。该文通过分析藏文自动分词研究现状,提出基于词性约束的藏文分词策略与算法。相对于传统方法,该方法不仅能有效地预防和处理各类歧义现象,而且在藏文未登录词处理方面有较好表现。
关键词:
分词;词性;未登录词;歧义;
分词;词性;未登录词;歧义