大规模图数据的正则路径查询

张雨 曾立 邹磊†

ACTA Scientiarum Naturalium Universitatis Pekinensis - - Contents -

北京大学信息科学技术学院, 北京 100871; † 通信作者, E-mail: zoulei@pku.edu.cn

摘要 提出一种基于大规模 RDF 查询引擎 gstore 的分而治之方法, 对查询的正则表达式进行划分。在对定长字符串预处理的基础上, 再处理带有通配符的即时路径查询。该方法能够在开始阶段对搜索空间进行大量剪枝, 可以提高查询性能, 还能很好地解决正则表达式在RDF图中的路径匹配问题, 保证了对大规模图数据的支持。在Dbpedia 和 LUBM上 的实验表明, 该方法能够平均在秒级时间内返回路径查询结果。关键词 属性路径; 正则表达式; SPARQL; RDF; gstore中图分类号 TP391

Newspapers in Chinese (Simplified)

Newspapers from China

© PressReader. All rights reserved.