基于描述约束的词表示学习
冶忠林1,2,3 赵海兴1,4,2,3 张科4,2,3 朱宇4,2,3
1.陕西师范大学计算机科学学院;2.青海师范大学藏文信息处理与机器翻译省级重点实验室;3.青海师范大学藏文信息处理教育部重点实验室;4.青海师范大学计算机学院
摘要: 词语作为语言模型中的基本语义单元,在整个语义空间中与其上下文词语具有很强的关联性。同样,在语言模型中,通过上下文词可判断出当前词的含义。词表示学习是通过一类浅层的神经网络模型将词语和上下文词之间的关联关系映射到低维度的向量空间中。然而,现有的词表示学习方法往往仅考虑了词语与上下文词之间的结构关联,词语本身所蕴含的内在语义信息却被忽略。因此,该文提出了DEWE词表示学习算法,该算法可在词表示学习的过程中不仅考量词语与上下文之间的结构关联,同时也将词语本身的语义信息融入词表示学习模型,使得训练得到的词表示既有结构共性也有语义共性。实验结果表明,DEWE算法是一种切实可行的词表示学习方法,相较于该文使用的对比算法,DEWE在6类相似度评测数据集上具有优异的词表示学习性能。
关键词:
词表示学习;语义嵌入;词表示联合模型;词嵌入;词语结构矩阵;
词表示学习;语义嵌入;词表示联合模型;词嵌入;词语结构矩阵