基于新HSK词汇大纲的词汇等级类推分析
张引兵1,2 宋继华1 彭炜明1 郭冬冬1 张金1
1.北京师范大学信息科学与技术学院;2.淮北师范大学数学科学学院
摘要: HSK是一项国际汉语能力标准化考试。新HSK大纲中附表所列650个"默认词"多依据专家知识人工列举式的扩充。该文在《现代汉语词典》《现代汉语语法信息词典》等资源的基础上,利用知识工程的方法,迭代使用减字默认、组合默认等词汇等级类推规则,力争实现类推过程中隐性知识的显性化、分散知识的系统化,使得词汇等级类推的每一个环节都有章可循、有据可依,完成了基于新HSK大纲词汇等级的系统类推工作。接着,结合所构建的汉语词法知识库对类推结果进行了筛选,最终得到了23 762个词语的类推等级。最后,通过对类推结果的统计分析,表明该文的研究工作可以更好地发挥新HSK词汇大纲在汉语词汇定级、文本难度分级中的指导作用,也可为其他领域教学词汇大纲的制定提供一定的借鉴。
关键词:
新HSK大纲;等级类推;词法知识库;相对熵;
新HSK大纲;等级类推;词法知识库;相对熵