一种新的朝鲜语词性标注方法
DOI: , PDF, 下载: 45  浏览: 369 
作者: 金国哲 崔荣一
作者单位: 延边大学计算机科学与技术学院
关键词: 朝鲜语;词性标注;seq2seq;LSTM-CRF
摘要: 朝鲜语词性标注是朝鲜语信息处理的基础,其结果直接影响后续朝鲜语自然语言处理的效果。首先为了解决朝鲜语词性标注中遇到的形态素实际写法与原形不一致的问题,该文提出了一种在seq2seq模型的基础上融合朝鲜语字母信息的朝鲜语形态素原形恢复方法;其次,在恢复形态素原形的基础上,利用LSTM-CRF模型完成朝鲜语分写及词性标注。实验结果表明,该文提出的方法词性标注F1值为94.75%,优于其他方法。