融合网络图模型和排序模型的论文个性化推荐算法

作者:刘伟;刘柏嵩;王洋洋; 刊名:数据通信 上传者:刘英乔

【摘要】研究学术论文的质量和用户身份在推荐过程中影响个性化推荐结果的准确率和质量的问题,在研究网络图模型和排序模型的基础上,提出一种融合网络图模型和排序模型的论文推荐算法,将论文质量融入用户-论文二部图,利用重启随机游走生成与用户兴趣相关的学术论文,最后利用排序模型对相关学术论文进行排序生成Top-N推荐列表。通过实验对比,结合论文的质量进行推荐相对于其他方法平均召回率提高了3. 62%,排序模型能够生成满足不同身份用户需求的推荐列表。

全文阅读

数据通信 2019.2 技术交流 Technology Discussion 42 融合网络图模型和排序模型的论文个性化推荐算法 刘 伟1 刘柏嵩1 王洋洋2 (1. 宁波大学 信息科学与工程学院 浙江宁波315211; 2. 宁波大学 图书馆与信息中心 浙江宁波315211) 摘 要: 研究学术论文的质量和用户身份在推荐过程中影响个性化推荐结果的准确率和质量的问题,在研究网络图模型和排序模型的基础上,提出一种融合网络图模型和排序模型的论文推荐算法,将论文质量融入用户 -论文二部图,利用重启随机游走生成与用户兴趣相关的学术论文,最后利用排序模型对相关学术论文进行排序生成 Top - N 推荐列表。通过实验对比,结合论文的质量进行推荐相对于其他方法平均召回率提高了 3. 62%,排序模型能够生成满足不同身份用户需求的推荐列表。 关键词: 网络结构; 重启随机游走; 排序; 个性化推荐 1 引言 随着互联网上学术论文的爆炸式增长,为用户推荐需要的论文变得非常重要。然而,传统的论文推荐方法只是根据用户的兴趣特征和行为特征等用户信息对候选的论文集进行筛选,以候选论文与用户兴趣的相关程度进行推荐。这样对论文本身的理解存在偏差,无法满足用户因自身因素产生的需求。推荐结果 存在质量一般和用户满意度低的问题。 在学术领域进行推荐,不同身份的用户对不同类型论文的需求是不同的。例如,对于初学者而言,“经典文献”更能够帮助他们理解研究领域; 对于一般用户而言,应该为他们推荐与兴趣和研究方向类似的高质量的论文或前沿进展; 对于专家而言,为他们推荐的学术资源需要更注重该领域的前沿进展,或者推荐其他相关领域的高质量的科研成果。但是传统的研究都将用户的身份等同处理了,这也是目前学术推荐领域的一个缺陷。因此,研究如何利用用户身份信息和论文外部信息对推荐结果进行排序能够提高推荐结果的质量,以更好地满足用户的需求。 L 等人[1]提出将一种基于通用的 Boosting 方法的排序模型 ( GBRank) 应用到新闻推荐,取得了很 好的效果。GBRank 模型从新闻的内容相关性和新颖性、主题相关度以及内容连贯性等 4 个方面进行衡量,这样有效提高了新闻的推荐质量。 本文基于 GBRank 模型模型针对推荐列表的质量进行相应的研究,主要包括以下 3 个方面的工作: ( 1) 将论文质量作为论文顶点权重改进传统的用户论文二部关系图,提出了结合论文质量的用户 -论文图模型 ( User - Article Model with Quality of the article ( UAMQ) ) ,该模型不仅能清晰的反映出用户与论文之间的关系,还能从论文的质量因素来计算论文的相关度。为了适应 UAMQ,改进了重启随机游走算法的转移概率计算方式,使得重启随机游走算法能够结合论文顶点权重进行游走; ( 2) 提出了需求排序模型( Need -Rank,NRank) ,从相似度、质量和主题热度等三个维度对相关论文进行排序,为不同身份的用户提供不同类型的推荐列表; ( 3) 在 CiteULike 公开数据集上测试了算法推荐结果的召回率,UAMQ 模型利用论文的质量能够有效提高推荐的准确度,NRank 排序模型能够生产不同类型的推荐列表。 2 融合网络图模型和排序模型的论文推荐 本节首先介绍 UAMQ 模型构建,然后介绍如何 2019.2 数据通信 技术交流 Technology Discussion 43 采用重启随机游走算法推荐相关论文,最后介绍如何利用相关信息对相关论文进行排序生成 Top -

参考文献

引证文献

问答

我要提问