高校科研论文文本数据挖掘可视化分析

作者:赖思银; 刊名:广东石油化工学院学报 上传者:高锦雄

【摘要】以2013—2017年CNKI数据库收录的、来源单位为广东石油化工学院的核心论文数据为研究对象,利用VOSviewer和CiteSpace软件对论文进行可视化文本数据探究,主要挖掘了科研论文的发文数量趋势、发文基金来源、研究热点聚类、研究前沿预测几个主题,并绘制出这些主题的数据知识图谱,分析其中蕴含的意义。结果表明学校总体科研论文发文量呈下降趋势;发文驱动力主要来源于各个层次的科学基金研究项目;强势学科则主要集中在环境工程、化学工艺、控制理论与控制工程等学科上;科研热点及研究前沿则主要集中在故障诊断、正交试验、无量纲指标、旋转机械、功率转换效率、光纤拉曼放大器、滚动轴承、数值模拟等方面。

全文阅读

第 29 卷 第 1 期 广东石油化工学院学报 Vol. 29 No. 1 2019 年 2 月 Journal of Guangdong University of Petrochemical Technology  February 2019 高校科研论文文本数据挖掘可视化分析? 赖思银 ( 广东石油化工学院理学院,广东 茂名 525000) 摘要:以2013—2017 年 CNKI 数据库收录的、来源单位为广东石油化工学院的核心论文数据为研究对象,利用 VOSviewer 和CiteSpace 软件对论文进行可视化文本数据探究,主要挖掘了科研论文的发文数量趋势、发文基金来源、研究热点聚类、研究前沿预测几个主题,并绘制出这些主题的数据知识图谱,分析其中蕴含的意义。结果表明学校总体科研论文发文量呈下降趋势; 发文驱动力主要来源于各个层次的科学基金研究项目; 强势学科则主要集中在环境工程、化学工艺、控制理论与控制工程等学科上; 科研热点及研究前沿则主要集中在故障诊断、正交试验、无量纲指标、旋转机械、功率转换效率、光纤拉曼放 大器、滚动轴承、数值模拟等方面。 关键词:文本挖掘; 知识可视化; 高校科研论文; VOSviewer; CiteSpace 中图分类号: TP391 文献标识码: A 文章编号:2095 -2562( 2019) 01 -0090 -05 高校是人类思想智慧激荡碰撞的聚集地,科研是国家科技创新的源泉[1]。高校科研还承担着培养人才的功能[2]。高校科研成果最普遍的表现形式之一就是发表学术论文,论文质量从一定程度上反映出高校的科研产出能力和学术水平[3,4]。研究高校教师发表的学术论文,应用文本数据挖掘方法,从非结构化或半结构化的语言文本中提取出有价值的知识,将内隐的知识外显化,外显知识生动化,抽象的知识具体化[5]。知识图谱可以将这些知识通过数据挖掘、信息处理、知识计量和图形绘制等方式显示出来,揭示知识领域的动态发展规律,为学科研究提供有价值的参考。因此,本研究基于知识可视化图谱对广东石油化工学院的科研论文的总体发展趋势、发文基金来源、研究热点及研究前沿等进行可视化分析,并进行知识图谱的构建,旨在全面把握该校科研发展的动态趋势及特点,为高校科研的发展提供参考依据。 1 研究方法 用中国知网进行搜索,以广东石油化工学院为作者单位,时间跨度取 2013 年 1 月 1 日至 2017 年 12 月31 日之间,以 SCI 来源期刊、EI 来源期刊、核心期刊、CSSCI、CSCD 为数据库来源进行检索,语言类型为中文。在经过人工对比分析,去除无关结果等操作后,共检索到文献数据898 条。 对检索到的文献进行数据去重、格式转换等数据预处理后,定性与定量分析并用,结合科学知识图谱绘制软件 VOSviewer 和 CiteSpace,研究了上述收集的论文。从整体学科发文趋势、发文基金来源、关键词聚类分析、研究热点及研究前沿几个方面进行可视化分析,分别绘制了发文趋势曲线、关键词聚类、突变词列表等图谱,直观地展现知识的关键特征,实现对数据集的深入洞察,清晰有效地传达信息。 2 数据分析 2. 1 基本数据分析 截至 2017 年 12 月 31 日,中国知网收录的广东石油化工学院近 5 年符合条件的论文898 篇,中文发 ? 收稿日期:2018 -12 -07; 修回日期:2018 -12 -20 基金项目: 茂名市科技计划项目( 20150350)

参考文献

引证文献

问答

我要提问