VRE中基于内容过滤的论文推荐算法

作者:李永;徐德智;张勇;邢春晓 刊名:计算机应用研究 上传者:张守信

【摘要】针对虚拟研究环境中的重要资源论文,提出了基于内容过滤的推荐算法,即根据研究者兴趣实现个性化服务,推荐所需论文。该算法采用矢量空间模型作为用户兴趣和资源描述模型,使用余弦相似度计算资源推荐度;基于效率考虑,利用朴素贝叶斯分类算法减小搜索空间。实验表明,推荐效果和效率得到了明显改善。

全文阅读

随着我国国家科技创新体系计划川的实施,科研机构的发展拥有了更多的机遇,也遇到了严峻的挑战)未来国家创新体系建设要着重发挥科研机构和大学在科技创新与人才培养方面的核心作用。因此,如何利用计算机技术在各个科研机构中以及科研机构之间建立一个可以更好地实现研究谬垂源(包括设备、材料、数据、人力等)共享、加强研究人员的科研协作、培养科技创新人才的研究环境,是有效促进国家科技创新体系计划实施必须解决的重要问题。英国的JISC(JointInformationSystemsCommitte。)’是支持科研和教育的一个基金组织。为了帮助科学家进行研究,加强科研机构之间的合作,JISC提出了虚拟研究环境(VRE)的概念生’):‘vRE的概念不仅仅是某个研究领域的一个VRE,而是要定义相关的标准并建立一个通用的框架,让其他人使用这个框架并在上面逐渐加人具体领域的VRE应用。”JISC支持的众多项目中有巧个是关于vRE的,如GRowL{‘1、sakai一’!以及文献[6,7介绍了一些建立VRE使用的Webserviee。、邵id和工作流等技术。我国以网络为基础的科学活动环境综合试验平台eRowN{8(ehinareseareh。nddevelopn,ent。nvironnle,Itoverw记er一areanetwork)就是面向国内各个领域的科学家的一个典型虚拟研究环境。VRE中,随着用户数量不断增多,研究资源日益增长,研究人员查找和发现自己感兴趣的资源成为一件非常耗时、耗力的事情,会出现信息过载和信息迷向问题。因此,需要在VRE中引人个性化服务,通过研究不同用户兴趣,主动为用户推荐最需要的研究资源,从而更好地解决VRE中资源日益庞大与用户寻找有用资源费时费力之间的矛盾。VRE中的每个研究者都会阅读大量论文,论文资源无疑是一种重要的研究资源。所以,需要在VRE中进行论文的推荐。近年来,应用到各种个性化推荐系统的推荐算法主要基于内容过滤和协同过滤”一’2。协同过滤算法的基本思想是根据用户兴趣的相似性来推荐资源,把与当前用户相似的其他用户意见提供给当前用户。但是协作过滤依赖于大量用户对大量资源的打分数据,而且在推荐用户没有评价的资源与新资源方面存在局限性。VRE中允许任意数量的用户建立任意大小规模的研究项目,往往会出现很多新建立的项目无法获得大量的用户打分数据。对于论文,可以获得其完整的内容描述,这样更能从内容本质上推荐给用户真正感兴趣的资源。现阶段,国内外的各种会议、期刊不断刊登出大量新的论文,研究者必须要在其领域跟踪前沿技术,而基于内容过滤同样可以推荐新资源给用户。文献仁13中提到的图书推荐系统也正是使用基于内容过滤的推荐算法来推荐图书。因此,基于内容过滤的推荐算法更加适合在VRE推荐论文资源。基于内容过滤的推荐算法,.1用户兴趣和论文资源的模型表达VRE中的沦文资源本质_L是一种文档。文档的表示模型中最典型的是vsML’‘1。对于论文资源,直接用vsM把每篇第9期李永,等:VRE中基于内容过滤的论文推荐算法59论文表示成一个向量:城=。讥记录了论文中每个关键词w和单词出现的频率f(为了保证后面向量余弦计算的精度,不进行特征选取,直接用单词作为关键词)。对于用户兴趣,主要通过用户填写的记录兴趣的文件、用户自己上传的论文资源以及用户要求推荐论文资源时给出的查询词组三种途径获得能反映用户兴趣的关键词。同样用VSM把每个用户的兴趣表示成一个向量:丫‘=。K记录了能反映用户兴趣的关键词‘以及关键词的权重:。。=k,关+kZfZ+k3石(1)其中沂表示二在该用户记录兴趣的文件

参考文献

引证文献

问答

我要提问