请选择 目标期刊

基于改进Apriori算法的问题模板无监督抽取方法 下载:34 浏览:393

柯文俊1,2,3 高金华1 沈华伟1,2 刘悦1 程学旗4 《中文研究》 2020年3期

摘要:
在面向限定领域的事实型问答系统中,基于模板匹配的问答是一种有效且稳定的方法。然而,现有的问题模板构建方法通常是在有监督场景下进行的,导致其严重依赖于人工标注数据,同时领域间可扩展性较差。因此,该文提出了一种改进Apriori算法的无监督模板抽取方法。对于限定领域问题样本,加入短语有序特征来挖掘频繁项集,将频繁项作为问题模板的框架词;同时,使用TF-IDF来度量模板的信息量,去除信息量小的模板;特别地,为了获取项数较长的模板,为Apriori算法引入了支持度自适应更新机制;最终,借助命名实体识别进行槽位识别,并组合框架词和槽,得到问题模板。实验表明,该方法可以在限定领域的问答数据集上有效挖掘问题模板,并取得了比基线模型更好的抽取效果。

基于Apriori算法的城市关键路段识别 下载:49 浏览:372

孙家骏 高超 杨波 《交通技术研究》 2020年5期

摘要:
为提高城市交通精细化管理,方便居民出行,采集车辆出行过程中的射频识别(RFID)数据,利用大数据算法实现城市路网中关键路段的识别,提出了一种基于Apriori算法的城市关键路段识别方法。该方法通过计算支持度,计算出1 d内城市道路的频繁程度以确定城市路网中的关键路段。本文对判定城市路网中的关键路段提供了新思路,为制定关键路段交通拥堵管理措施、引导部分交通流出行路径或通行权提供了重要依据。并对关键路段的交通流来源进行分析,回溯每条关键路段交通流的产生源头,进而指导城市交通规划和基础设施建设。

一种基于邻接矩阵的频繁项集挖掘算法 下载:74 浏览:336

廖纪勇 吴晟 刘爱莲 《数据与科学》 2020年12期

摘要:
针对Apriori算法存在反复扫描数据库、内存消耗大、运行效率低效等固有缺陷,提出了一种基于邻接矩阵的频繁项集挖掘算法。在该算法中,将事务数据集转换为邻接矩阵,通过遍历邻接矩阵,可以直接从矩阵中挖掘得出频繁1-项集和频繁2-项集,并且该过程不会生成候选项集,从而减少了遍历的空间规模。最后使用标准数据集进行验证测试,实验结果表明,改进后的算法比传统的Apriori算法具有更好的性能,在保证挖掘结果的同时还有效地提高了频繁项集的挖掘效率。

关联规则Apriori算法在中考成绩分析中的应用研究 下载:77 浏览:299

孙菲1 任福栋2 时圣永2 陈佳1 邹璐璐2 《航空航天学报》 2020年6期

摘要:
按照中考成绩分析中良好的等级划分标准对中考各学科成绩进行分段划分,并将分段后的考生成绩数据离散化布尔型数据转换处理后,利用关联规则Apriori算法进行学科关联性分析,按照设定的支持度、置信度参数得出关联前项与关联后项的关联规则,确定学科各段的关联影响情况,为初中学校根据关联关系改进和提高学科教学提供参考与借鉴。
[1/1]
在线客服::点击联系客服
联系电话::400-188-5008
客服邮箱::service@ccnpub.com
投诉举报::feedback@ccnpub.com
人工客服

工作时间(9:00-18:00)
官方公众号

科技成果·全球共享