:19:34:52

世纪中文出版社 ——“建设顶级中文期刊”为使命!期待与您同行......
请输入您想了解的内容!
截图后在输入框直接粘贴

请您为我的服务评分:

发送提交
基于稳健词素序列和LSTM的维吾尔语短文本分类
沙尔旦尔·帕尔哈提米吉提·阿不里米提艾斯卡尔·艾木都拉

复制成功

导出题录

参考文献( GB/T 7714-2015 ) 复制

沙尔旦尔·帕尔哈提米吉提·阿不里米提艾斯卡尔·艾木都拉,. 基于稳健词素序列和LSTM的维吾尔语短文本分类[J]. 当代中文学刊,2020.2. DOI:.
摘要:
维吾尔语是一种派生类语言,其词是由词干和词缀连接而成的。其中,词干是有实际意义的词汇单元,词缀提供语法功能。该文提出了基于词干单元和长短期记忆(LSTM)网络的维吾尔语短文本分类技术。用基于词-词素平行训练语料的稳健词素切分和词干提取方法,从互联网下载的文本中提取其词干,以此构建词干序列文本语料库,并通过Word2Vec算法映射到实数向量空间。然后用LSTM网络作为特征选择和文本分类算法进行维吾尔语短文本分类实验,并得到95.48%的分类准确率。从实验结果看,对于维吾尔语等派生类语言而言,特别是对于带噪声的文本,基于词干的分类方法有更多优异的性能。
关键词: 维吾尔语文本分类LSTM形态学
DOI:
基金资助:

》在线投稿系统

*文章题目:
*作者姓名:
*电子邮箱:
*通讯地址:
*联系方式:

  备      注:

*上传稿件:

支持上传.doc,.docx,.pdf,.txt,.wps文件

投稿须知:

1、审稿结果将于1~7个工作日以邮件告知,请注意查收(包含录用通知书、审稿意见、知网CNKI查重报告)。

2、提交投稿后,若7个工作日之内未接到录用通知,则说明该文章未被录用,请另投他刊。

3、凡投寄本刊稿件,如在内容上有侵权行为或不妥之处,均应文责自负。本刊有权对来稿进行文字编辑、加工和修改,如不同意,请附说明,以便妥善处理。

4、多作者文稿署名时须征得其他作者同意,排好先后次序,通知用稿后不再改动。

5、凡投往本刊稿件一经录用发表,其版权归本刊所有。

6、本刊已全文录入中国知网、万方、维普等数据库,如作者不同意被收录,请提前申明,未申明者,本刊一律视为同意被收录。

7、请勿一稿多投。