主题模型在论文推荐系统中的应用研究

作者:孟京朝 刊名: 上传者:薛珊

【摘要】随着科技的快速发展,科技论文的规模在快速增长,为科研工作者带来了丰富的文献资料。据统计,高校论文数量以每年6%-8%的速度在增长,规模已达千万级,用户搜索感兴趣论文的时间也与日俱增。 在此背景下,论文推荐系统应运而生,传统的论文推荐系统基于论文元数据或向量空间模型进行,存在无法解决语义和效率低下的问题,推荐效果不理想。为了解决该问题,本文将主题模型应用于论文推荐系统中,并给出改进的用户兴趣模型算法。本文的主要工作如下: 1.对主题模型和论文推荐系统的相关理论和研究现状进行了分析,研究分析了主题模型应用在论文推荐系统中的可行性。 2.给出了一种新的用户兴趣模型算法TV-IPF,该算法增加了在用户兴趣论文列表中出现次数少、权值大的主题在用户兴趣模型中的权值,同时不会降低出现在较多兴趣论文中的主题的权值。与传统的均值方法相比,基于改进算法得出的用户兴趣模型和相应的推荐结果更符合用户的真实需求。 3.设计并实现了基于主题模型的推荐系统,检验了主题模型解决语义问题的能力,研究了在新的用户模型算法下稀疏度、推荐数量对推荐性能的影响。此外,分析了主题模型和协同过滤算法的优缺点,给出了两者的混合推荐系统,依据稀疏度来决定两者在推荐结果中的比例。该混合推荐系统在评分矩阵稀疏时也能够给出准确推荐,同时能够适当的提高推荐系统的多样性。 实验表明,本文给出的论文推荐方法提高了推荐系统的召回率和多样性。

全文阅读

主题模型在论文推荐系统中的应用研究 孟京朝 袁方计算机应用技术 二一四年五月 TheApplicationandResearchofTopic ModelonPaperRecommendation 河北大学 学位论文独创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下进行的研究工作 及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写的研究成果,也不包含为获得河北大学或其他教 育机构的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示了致谢。 作者签名絲:表]日期:讀年C月円 学位论文使用授权声明 本人完全了解河北大学有关保留、使用学位论文的规定,即:学校有权保留 并向国家有关部门或机构送交论文的复印件和电子版,允许论文被査阅和借阅。 学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存 论文。 本学位论文属于 1、保密口,在月円适用本授权声明年解密后。 2、不保密“。 (请在以上相应方格内打“V”) 保护知识产权声明 本人为申请河北大学学位所提交的题目为( 的学位论文,是我个人在导师指导并与导师合作下取得的研究成果,研 究工作及取得的研究成果是在河北大学所提供的研究经费及导师的研究经费资 助下完成的。本人完全了解并严格遵守中华人民共和国为保护知识产权所制定的 各项法律、行政法规以及河北大学的相关规定。 本人声明如下:本论文的成果归河北大学所有,未经征得指导教师和河北大 学的书面同意和授权,本人保证不以任何形式公开和传播科研成果和科研工作内 容。如果违反本声明,本人愿意承担相应法律责任。 声明人:蓋糸匆日期…年/月~円 :>3岸、 作者签名:^tn曰期:…年吝月/P日 导师签名:H日期円 :年/月?随着科技的快速发展,科技论文的规模在快速增长,为科研工作者带来了丰富的文 献资料。据统计,高校论文数量以每年6%-8%的速度在增长,规模已达千万级,用户搜 索感兴趣论文的时间也与日俱增。 在此背景下,论文推荐系统应运而生,传统的论文推荐系统基于论文元数据或向量 空间模型进行,存在无法解决语义和效率低下的问题,推荐效果不理想。为了解决该问 题,本文将主题模型应用于论文推荐系统中,并给出改进的用户兴趣模型算法。本文的 主要工作如下: 1.对主题模型和论文推荐系统的相关理论和研究现状进行了分析,研究分析了主题 模型应用在论文推荐系统中的可行性。 2.给出了一种新的用户兴趣模型算法TV-IPF,该算法增加了在用户兴趣论文列表 中出现次数少、权值大的主题在用户兴趣模型中的权值,同时不会降低出现在较多兴趣 论文中的主题的权值。与传统的均值方法相比,基于改进算法得出的用户兴趣模型和相 应的推荐结果更符合用户的真实需求。 3.设计并实现了基于主题模型的推荐系统,检验了主题模型解决语义问题的能力, 研究了在新的用户模型算法下稀疏度、推荐数量对推荐性能的影响。此外,分析了主题 模型和协同过滤算法的优缺点,给出了两者的混合推荐系统,依据稀疏度来决定两者在 推荐结果中的比例。该混合推荐系统在评分矩阵稀疏时也能够给出准确推荐,同时能够 适当的提高推荐系统的多样性。 实验表明,本文给出的论文推荐方法提高了推荐系统的召回率和多样性。 主题模型;;论文推荐;;改进用户模型算法;;用户主题兴趣模型;;LDAWiththerapiddevelopmentoftechnology,scientificpapersareincreasingwithrapid speed

参考文献

引证文献

问答

我要提问