智能问答技术在图书馆领域的应用建议

作者:杨青飏;顾恒轩; 刊名:计算机产品与流通 上传者:江琳

【摘要】随着信息资源的爆炸式增长,图书馆的数字化转型已成必然之势。然而相对应的用户操作难度也随之增加,现存图书馆问答系统无法满足用户的需求。本文通过介绍智能问答的发展现状论证了其应用于图书馆领域的可行性,并针对目前图书馆智能问答系统建设存在的问题提出建议,对其未来发展作出展望。

全文阅读

随着信息时代的发展,知识的共享性和传播性得到极大程度的开发。而作为公众重要基础设施之一的图书馆,在越来越多的实体资源和电子资源面前,需要提供更加简单、高效、快捷、全面的功能,最大限度地为单个用户或用户群提供个性化信息服务,才能充分为大众提供便利。馆藏数字化资源的增加提高了用户需求的满足度,但与此同时,用户操作的难度也在提升:当用户没有明确的书目需求,或是提出过于专业详细的学术需求时,图书馆往往没有相应的问答系统为其提供引导和服务;部分现行图书馆具有相应的参考解答系统也只包含固定的FAQ问答,无法达到精细化、个人化的服务目标。由于用户在问答情境下能更好地明确自己的需求,因此图书馆行业智能问答系统的研究是必要的。一、智能问答的发展现状早期的智能问答(Question Answering,QA)技术以传统机器学习模型为基础,根据文本特征及算法实现基本的文本词句分解。由于这种方法往往依赖特征提取的质量高低,缺乏对数据深层语义信息的学习能力,无法挖掘大量数据中的隐含特征,因此存在着处理稀疏数据不好、回答准确率较低的问题,需要进一步改善。目前的QA技术主要是结合知识库或深度学习,实现对自然语言深度逻辑关系的理解。基于知识库的QA技术能通过知识库丰富的存储对自然语言进行更深入的语义关联,提高自然语言处理的准确率。知识库问答(Knowledge Base Question Answering,KB-QA)一般分为三部分:知识推理、知识获取和知识表示,知识获取是目前研究的热点,包括命名实体识别和实体关系抽取两方面。基于深度学习的QA技术通过在多层神经网络训练效率的提高,不仅能在语义角度实现自然语言的准确匹配,还在情感分析等领域取得了重大发展,将自然语言从浅层特征解析变为通过更加复杂的深度学习网络结构。利用卷积神经网络(CNN)算法,Kim进一步改善了问答系统中的语义分析与句子分类;基于双向长短时记忆(Bi-LSTM),Tan等认为结合注意力机制的深度学习模型结构,能更好地优化答案筛选任务。神经网络的引入让基于深度学习的QA系统可以进一步探索语句内部逻辑联系和情感含义,实现贴近人类思维的自然语言处理,进而提供更准确的问答对匹配。综上所述,智能问答系统在自然语言处理方面的成熟发展能帮助图书馆问答系统更有效地处理自然语言查询表达式、识别用户意图,从而运用对应的检索策略在语料库中为用户提供更准确的检索结果,帮助完成当前图书馆提供个性化服务的目标。二、智能问答在图书馆领域的应用建议在图书馆这一特定领域实现智能问答系统,关键难点在于:(一)语料库的建设和完善,具体包括(1)如何全面、高效地实现语料库初始真实数据的收集存储,提高返回用户提问问题答案的全面性。(2)如何针对语料库真实数据进行有效问题的筛选,提高返回用户提问问题答案的价值性。(3)如何进行用户研究、探索用户提问模式,从而实现语料库问题的精选。(二)限定领域机器学习模型的选择针对以上问题,作者提出以下建议:1.人工处理语料库内容首先应保证图书馆系统内问答数据的不断更新和补充,缓解语料库容量不足带来的压力。其次可以进行人工语料筛选,剔除对改善图书馆咨询服务没有价值意义的用户问题,并且针对为用户提供的答案进行二次审阅,纠正错误、完善正确信息、调整格式,形成一套完整的问题-答案对语料库体系。在语料库建设趋向完善时,可以考虑与更多的问答类网站进行对接,建立大型语料知识库,以便在满足用户基本咨询需求外,还能为用户尚未明确表现的潜在需求提供相应的咨询引导。2.进行以用户为中心的研究可以通过卡片分类法等进行用户提问模式的探索,实现

参考文献

引证文献

问答

我要提问