PDF下载
大规模中文实体情感知识的自动获取

卢奇1,2 陈文亮1,2

1.苏州大学计算机科学与技术学院;2.软件新技术与产业化协同创新中心

摘要: 目前中文情感分析的主要资源以情感词典为主,缺乏针对实体或属性的情感知识资源。该文主要研究如何从大规模文本语料中自动获取实体情感知识。在该文方法中,用情感表达组合来表示实体情感知识。首先,基于二部图排序算法对情感表达组合候选集合进行排序。然后,提出了一种基于语义相似的提炼算法对于排序靠后的表达组合进行选择。在提炼选择过程中,充分考虑实体之间和情感词之间的约束。最后,该文在三种大规模不同领域的语料上进行实验,并进行人工评价。评价结果表明,从三个领域数据集上获取的实体情感表达组合正确率均高于90%。最终我们获得了一个大规模情感知识词典,包括约30万对的情感表达组合。
关键词: 情感分析;情感词典;情感挖掘;信息抽取
DOI:
基金资助:
文章地址: