基于句内注意力机制多路CNN的汉语复句关系识别方法
1.华中师范大学计算机学院;2.华中师范大学语言与语言教育研究中心
摘要: 复句的关系识别是对分句间语义关系的甄别,是复句语义分析的关键,旨在从文本中识别句间的关系类型。非充盈态汉语复句存在隐式关系的特点给语义关系识别造成了困难。为了深度挖掘复句中隐含的语义信息,正确地实现关系分类,该文提出了一种基于句内注意力机制的多路CNN网络结构Inatt-MCNN。其中句内注意力机制模型是基于Bi-LSTM的,使其能够学习到句子的双向语义特征以及分句间的关联特征。同时,为了充分利用文本特征,联合使用卷积神经网络(CNN)对复句表示再次建模获得句子局部特征。与其他基于汉语复句语料库(CCCS)和清华汉语树库(TCT)的实验结果相比,该文方法的宏平均F1值为85.61%,提升约6.08%,平均召回率为84.87%,提升约3.05%。
关键词:
关系识别;非充盈态汉语复句;双向长短期记忆网络(Bi-LSTM);句内注意力机制;卷积神经网络;
关系识别;非充盈态汉语复句;双向长短期记忆网络(Bi-LSTM);句内注意力机制;卷积神经网络