PDF下载
藏文音节拼写检查的CNN模型

色差甲1,2 贡保才让1,2 才让加1,2

藏文音节;音节矩阵;CNN模型;拼写检查

摘要: 藏文音节拼写检查是藏语自然语言处理的基本任务,在藏文文字处理、文字识别、文本生成等领域具有广泛的应用。该文首先针对藏文音节的结构提出了音节向量化的方法,即音节矩阵。然后构建了适合于藏文音节拼写检查的CNN模型,使用1 364 880个藏文音节进行训练。最后对68 244个藏文音节进行测试。实验结果显示,藏文音节拼写检查CNN模型的结果优于规则、RNN和LSTM等模型,不仅对符合藏文文法的音节能正确识别外,而且对梵音藏文音节也能有效识别,正确率、召回率以及F值分别为99.52%、99.30%和99.41%。
关键词: 1.青海师范大学藏文信息处理教育部重点实验室;2.青海师范大学藏文信息处理与机器翻译省级重点实验室
DOI:
基金资助:
文章地址: