PDF下载
印尼语、马来语自然语言处理研究综述

蒋盛益1,2 李珊珊1,2 符斯慧1 林楠铠1,2

1.广东外语外贸大学信息科学与技术学院;2.广东外语外贸大学广州市非通用语种智能处理重点实验室

摘要: 随着印尼语、马来语互联网普及率的上升,对海量印尼语、马来语文本进行信息处理存在重大需求.虽然研究人员对印尼语、马来语展开较广泛的研究,但是作为低资源语言,受到的关注远不及通用语,未能较好利用前沿的深度学习方法.文中梳理总结包括词法分析、句法分析、机器翻译、拼写检查等印尼语、马来语相关的自然语言处理技术.对比分析相关的研究成果发现,大多数研究因语料规模及评测标准不同难以客观对比各种算法的差异.最后结合印尼语、马来语现有的各领域语言资源开放情况,指出印尼语、马来语的自然语言处理研究面临的问题,并展望未来发展趋势.
关键词: 印尼语;马来语;黏着语;低资源语言;自然语言处理
DOI:
基金资助:
文章地址: