PDF下载
基于HBase的RDF数据的存储与查询系统研究

王益尧

宁波大学信息科学与工程学院

摘要: Web语义网技术在近几年快速发展,用来描述语义网信息资源的知识描述框架RDF(Resource Description Framework)的数据量在快速增长,传统的集中式管理方法已经不能解决大数据量的挑战。对此提出一种基于Hadoop/HBase的分布式存储管理与查询计算系统方案,将RDF数据以图邻接表的形式表达,构建以实体、边属性标签为Row Key的两张表,同时进行基于深度搜索和跳数的数据划分策略,并基于Hadoop集群对LUBM标准数据集进行SPARQL查询,以系统查询执行时间作为衡量标准,通过实验验证该模型是有效可行的。
关键词: 语义网;RDF;HBase;SPARQL;Hadoop
DOI:
基金资助:
文章地址: