基于倒排索引的XML文档全文检索技术研究

作者:青巴图 刊名: 上传者:区惠红

【摘要】 随着信息技术的不断发展,XML规范已经得到普遍接受和应用,如何更高效地查询XML文档中的信息也已成为学术界和工业界的研究热点。目前的几种XML文档查询技术中,基于索引的全文检索技术具有很高的技术背景和广阔的应用前景。 本文在研究和分析基于倒排索引的全文检索技术的基础上,设计了一组支持XML文档倒排索引和全文检索的存储模型及算法。上述结构和算法已经在本论文研究期间完成的原型系统中得到了应用,并与Xpath、XQuery两种查询语言的查询效率进行了对比。 考虑到全文检索技术是一种I/O密集型的技术,尤其对大规模文档集合进行全文检索时需要频繁地访问外存设备,因此本文给出了利用交叉缓冲队列对倒排文件进行缓冲处理的思想。另外,为了能够支持文档集合的更新需要,本文还研究了基于可扩展位示图的倒排文件存储结构,并对相关算法进行了描述。

参考文献

引证文献

问答

我要提问