检 索
学术期刊
切换导航
首页
文章
期刊
投稿
首发
学术会议
图书中心
新闻
新闻动态
科学前沿
合作
我们
一封信
按学科分类
Journals by Subject
按期刊分类
Journals by Title
医药卫生
Medicine & Health
工程技术
Engineering & Technology
数学与物理
Math & Physics
经济与管理
Economics & Management
人文社科
Humanities & Social Sciences
化学与材料
Chemistry & Materials
信息通讯
Information & Communication
地球与环境
Earth & Environment
生命科学
Life Sciences
我要投稿
查看投稿进度
学术期刊
按学科分类
Journals by Subject
按期刊分类
Journals by Title
医药卫生
Medicine & Health
工程技术
Engineering & Technology
数学与物理
Math & Physics
经济与管理
Economics & Management
人文社科
Humanities & Social Sciences
化学与材料
Chemistry & Materials
信息通讯
Information & Communication
地球与环境
Earth & Environment
生命科学
Life Sciences
在线客服
客服电话:
400-188-5008
客服邮箱:
service@ccnpub.com
投诉举报:
feedback@ccnpub.com
人工客服
工作时间(9:00-18:00)
官方公众号
科技成果·全球共享
请选择
目标期刊
首页
期刊
文章
结合特殊领域实体识别的远监督话语领域分类
下载:
39
浏览:
313
何宇虹
黄沛杰
杜泽峰
刘威
朱建恺
章锦川
《当代中文学刊》
2020年9期
摘要:
近年来,基于注意力(attention)机制的循环神经网络在文本分类中表现出显著的性能。然而,当训练集数据有限时,测试集数据中许多领域实体指称项在训练集中处于低频,甚至从未出现,如中文话语领域分类任务。该文提出结合特殊领域实体识别的远监督话语分类模型。首先,通过远监督(distant supervision)的方式获取数据集中的领域知识,显著地减少了人工操作;其次,利用特殊领域实体识别和本地构建的补充性知识库去补全远监督获取的领域知识,旨在为模型提供更加全面的领域知识;最后,对基于上下文的语义特征和知识特征这两种异构信息提出了细粒度拼接机制,在词级上融合了预训练词汇语义表达和领域知识表达,有效提升了分类模型的性能。通过与研究进展的文本分类模型的对比实验表明,该文模型在中文话语领域分类基准数据集的实验上取得了较高的正确率,特别是在知识敏感型领域,较研究进展方法具有显著优势。
[1/1]
|<
<
1
>
>|
在线客服::
点击联系客服
联系电话::
400-188-5008
客服邮箱::
service@ccnpub.com
投诉举报::
feedback@ccnpub.com
人工客服
工作时间(9:00-18:00)
官方公众号
科技成果·全球共享