请选择 目标期刊

结合特殊领域实体识别的远监督话语领域分类 下载:39 浏览:321

何宇虹 黄沛杰 杜泽峰 刘威 朱建恺 章锦川 《当代中文学刊》 2020年9期

摘要:
近年来,基于注意力(attention)机制的循环神经网络在文本分类中表现出显著的性能。然而,当训练集数据有限时,测试集数据中许多领域实体指称项在训练集中处于低频,甚至从未出现,如中文话语领域分类任务。该文提出结合特殊领域实体识别的远监督话语分类模型。首先,通过远监督(distant supervision)的方式获取数据集中的领域知识,显著地减少了人工操作;其次,利用特殊领域实体识别和本地构建的补充性知识库去补全远监督获取的领域知识,旨在为模型提供更加全面的领域知识;最后,对基于上下文的语义特征和知识特征这两种异构信息提出了细粒度拼接机制,在词级上融合了预训练词汇语义表达和领域知识表达,有效提升了分类模型的性能。通过与研究进展的文本分类模型的对比实验表明,该文模型在中文话语领域分类基准数据集的实验上取得了较高的正确率,特别是在知识敏感型领域,较研究进展方法具有显著优势。

基于隐含主题协同注意力网络的领域分类方法 下载:37 浏览:359

黄培松 黄沛杰 丁健德 艾文程 章锦川 《当代中文学刊》 2020年4期

摘要:
基于注意力机制的神经网络模型在文本分类任务中显示出了很好的效果。然而当训练数据的规模有限,或者测试数据与训练数据的分布有较大差异时,一些有价值的信息词很难在训练中被模型捕捉到。为此,该文提出了一种新的基于协同注意力(co-attention)网络的领域分类方法。该文利用隐含主题模型学习隐含主题注意力,并将其引入到文本分类常用的双向长短时记忆网络(BiLSTM)中,与软或硬注意力(soft-or hard-attention)机制一起构成协同注意力。在中文话语领域分类基准语料SMP-ECDT上的实验结果表明,隐含主题协同注意力网络取得了显著优于注意力机制的领域分类效果,比基线注意力机制Soft att、Hard att以及单独的隐含主题注意力机制BTM att分别提高了2.85%、1.86%和1.74%的分类正确率。此外,实验结果还验证了,在额外的未标记数据上训练隐含主题,可以进一步提高该文方法的领域分类性能。

基于可靠词汇语义约束的词语向量表达修正研究 全文替换 下载:43 浏览:458

梁泳诗 黄沛杰 黄培松 杜泽峰 《当代中文学刊》 2019年2期

摘要:
词语向量表达(word vector representation)是众多自然语言处理(natural language processing,NLP)下游应用的基础。已有研究采用各种词汇分类体系提供的词汇语义约束,对海量语料训练得到的词向量进行修正,改善了词向量的语义表达能力。然而,人工编制或者半自动构建的词汇分类体系普遍存在语义约束可靠性不稳定的问题。该文基于词汇分类体系与词向量之间、以及异构词汇分类体系之间的交互确认,研究适用于词语向量表达修正的可靠词汇语义约束提炼方法。具体上,对于词汇分类体系提供的同义词语类,基于词语向量计算和评估类内词语的可靠性。在其基础上,通过剔除不可靠语义约束机制避免词语类划分潜在不够准确的词语的错误修正;通过不同词汇分类体系的交互确认恢复了部分误剔除的语义约束;并通过核心词约束传递机制避免原始词向量不够可靠的词语在词向量修正中的不良影响。该文采用NLPCC-ICCPOL 2016词语相似度测评比赛中的PKU 500数据集进行测评。在该数据集上,将该文提出的方法提炼的可靠词汇语义约束应用到两个轻量级后修正的研究进展方法,修正后的词向量都获得更好的词语相似度计算性能,取得了0.649 7的Spearman等级相关系数,比NLPCC-ICCPOL 2016词语相似度测评比赛第一名的方法的结果提高25.4%。

基于平衡光学互相关方法的超短脉冲激光相干合成技术 下载:47 浏览:350

黄沛1,2,3 方少波2 黄杭东2 侯洵1 魏志义2,3 《现代物理学报》 2018年3期

摘要:
相干合成技术是超快光学领域的重要研究方向之一.当单路脉冲激光的连续谱超过一个倍频程时,精确控制其光谱相位(色散管理)是获得亚周期超短脉冲激光的关键.由于常见的脉冲压缩系统存在光谱带宽限制,因此多通道相干合成技术受到了广泛的关注.本文将充气空心光纤展宽后的超倍频程连续光谱分波段独立压缩,并利用平衡光学互相关方法锁定子脉冲之间的相位延迟,获得了4.1 fs的合成脉冲.实验结果表明相干合成技术在高能量亚周期超快光场调控中存在优势.

基于平衡光学互相关方法的超短脉冲激光相干合成技术 下载:46 浏览:412

黄沛1,2,3 方少波2 黄杭东2 侯洵1 魏志义2,3 《现代物理学报》 2018年2期

摘要:
相干合成技术是超快光学领域的重要研究方向之一.当单路脉冲激光的连续谱超过一个倍频程时,精确控制其光谱相位(色散管理)是获得亚周期超短脉冲激光的关键.由于常见的脉冲压缩系统存在光谱带宽限制,因此多通道相干合成技术受到了广泛的关注.本文将充气空心光纤展宽后的超倍频程连续光谱分波段独立压缩,并利用平衡光学互相关方法锁定子脉冲之间的相位延迟,获得了4.1 fs的合成脉冲.实验结果表明相干合成技术在高能量亚周期超快光场调控中存在优势.

基于核心素养的小学数学教学策略研究 下载:250 浏览:2164

黄沛 《数学教学与研究》 2022年6期

摘要:
在新课改背景下的小学数学教学中,教师应该将培养学生的数学核心素养列为首要任务,分析、明确数学核心素养培养过程中面临的难点,采取针对性措施将其攻克,从而提高数学教学效率,促进学生数学核心素养与综合能力的稳步发展。下面,我们就针对这一目标展开简单教学探索。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享