倒排索引压缩及在RDBMS全文检索中的实现

资源类型: 资源大小: 文档分类:工业技术 上传者:戴国芳

文档信息

【作者】 朱虹  吴林 

【关键词】全文检索 倒排索引 索引压缩 编码 

【出版日期】2005-04-30

【摘要】提出了一种对倒排索引进行压缩的方法,在保证较高压缩率的前提下,对压缩后的数据提供了随机访问的能力.这种方法将压缩后的数据分为两部分,第一部分用来表示单词在子区间的出现次数,第二部分用来表示单词在子区间的具体出现位置,详细描述了检索过程,通过第一部分的信息可以直接对第二部分的任意位置进行解压缩,体现了其随机访问能力,并分析了压缩比和检索效率,讨论了该压缩方法在RDBMS全文检索中的实现,以及如何用表格形式对其进行存储,针对多关键字的检索对算法进行了优化.该实现方法一方面充分利用了数据系统的优点,获得了良好的动态性能,另一方面节省了倒排索引对空间的需求,并提高了检索效率.

【刊名】华中科技大学学报(自然科学版)

引证文献

问答

我要提问