PDF下载
基于BiLSTM-CRF模型的汉语否定信息识别

陈世梅1 伍星1 唐凡2

1.重庆大学计算机学院;2.上海拍拍贷金融信息服务有限公司

摘要: 否定信息识别是将自然语言中的肯定信息与否定信息分离,它对信息检索、文本挖掘、情感分析等都有重要作用。该文主要对汉语否定信息中的触发词识别和覆盖域识别进行研究,采用双向长短期记忆网络结合条件随机场(BiLSTM-CRF)为模型,预训练的词向量为输入特征对触发词进行识别,在此基础上添加已知触发词特征对覆盖域进行识别。中文否定与不确定信息语料上,触发词识别取得F1值为91.03%,覆盖域识别在该语料的子语料财经新闻上取得F1值最高为73.91%。实验结果表明,这一模型在汉语否定触发词识别和覆盖域识别上取得的效果优于CRF模型和BiLSTM模型。
关键词: BiLSTM-CRF;否定触发词;否定覆盖域
DOI:
基金资助:
文章地址: