科学知识图谱在学科评价中的应用研究[开题报告]

科学知识图谱在学科评价中的应用研究[开题报告]
科学知识图谱在学科评价中的应用研究[开题报告]

(2011届)

本科毕业论文(设计)

开题报告

题目:科学知识图谱在学科评价中的应用研究学院:商学院

专业:信息管理与信息系统

班级:

学号:

姓名:

指导教师:

开题日期:

一、选题的背景、意义

1.该选题的历史背景及国内外现状

科学知识图谱,是将传统的文献计量方法与现代的文本挖掘和复杂网络、数学、统计学、计算机科学方法以及可视化技术等有机地整合在一起的一种综合分析科学发展的知识发现方法。从20世纪 50年代至今,科学知识图谱的研究已经有几十年的历史。

(1)引文分析理论的发展促进了科学知识图谱的兴起。20世纪60年代,加菲尔德(Eugene Garfield)创办科学引文索引 (SCI)。1965年,普赖斯以SCI为数据来源,发表了一篇科学计量学的杰作《科学论文的网络》。在这篇论文中,普赖斯第一次提出并界定了“研究前沿”的概念。到了20世纪70、80年代,匈牙利的三位学者T.布劳温 (Tibur Braun)、W.格伦采尔 (Wolfgang Glanze1)和A.舒伯特 (Andres Schubert)以SCI数据库为基础,出版了《科学计量学指标》,这实际上是世界科学地图和科学知识图谱的雏形。

(2)复杂网络系统和社会网络分析的兴起丰富了引文分析理论与方法。美国社会心理学家斯坦利·米尔格兰姆(Stanley Milligram)于1967年通过社会网络人际关系的“六度分隔”试验发现了著名的“小世界”现象。90年代中期,比利时情报计量学专家埃格赫 (Leo Egghe)和鲁索 (Ronald Rousseau)合作出版了《情报计量学引论》,促进了科学知识图谱的产生。进入21世纪,社会网络分析的探索与应用向纵深发展,风靡全球。

(3)信息可视化为科学知识图谱提供了强大的技术支持。1999年陈超美出版了该领域的第一部学术专著《信息可视化与虚拟环境》,R.斯宾塞 (Robert Spence)2000年出版了《信息可视化》之后相关研究如雨后春笋般涌现。

总体来讲,无论是企业还是科研领域,我国对知识图谱的关注滞后于国外。相比国外知识图谱的研究状况,我国起步稍晚,但是也取得了一些成绩。国内在知识图谱的应用方面缺少理论上的实证分析,主要是将知识图谱作为一个工具,应用于各个领域,而且相对于国外,应用研究还比较薄弱。目前而言,国内知识图谱研究中存在主要困难和问题如下:

(1)研究手段和方法的严重滞后

国内近几年有关知识图谱的研究也有一些,如大连理工大学的刘则渊教授带领的团队进行了科学计量学、管理学人机工程学学科以及国内所有工程领域研究前沿的知识图谱构建;武汉大学的马费成、刘青林、社科院的蒋颖等也对国内外知识管理、数字资源管理、战略管理、文献计量学等领域进行了共词图谱的绘制;南京大学的邓三鸿、浙江大学的潘有能等初步建立了图书情报学科的学科知识地图;金莹以CSSCI 数据粗略构建了我国社会科学的学

科知识地图;中科院、中信所的研究人员也进行了研究。但几乎所有的研究都是采用传统的多元统计分析方法(因子分析、多维尺度分析和聚类分析),最先进的就是使用了Pajek软件。截止2008年5月,国内文献分别仅有一篇使用了PFNET算法另一篇运用了最新的商用软件Thomson Data Analyzer对人类基因组领域进行共词图谱绘制的实例。

(2)研究层次低

对一些比较先进的技术(算法、软件)更多的都是理论上的探讨和介绍,国内对HistCite、CitespaceII、PFNET、SOM、潜在语义分析和最小生成树算法都有零星的介绍,但很少进行实际的试验研究。这可能与相关软件获取比较困难、有些是商用软件,研究经费缺乏等有关。

(3)研究对象范围过窄

目前国内知识图谱构建研究的领域都是范围很窄的某一学科方向的国际化研究,数据来源一般都选自SCI、SSCI等大型英文引文数据库,很少一部分选自中国的引文数据,而文献报道国内开发成功的两个共现系统却没有任何实证研究的报道,这些都阻碍了知识图谱这一先进方法在国内的发展。这一现象产生的原因是中国目前已有的引文数据库系统提供的检索入口和数据套录功能很有限,用户很难获取大量的原始数据,从而影响了研究的积极性。2.国内外应用技术及发展趋势

科学知识图谱有极为广泛的应用,在科技决策、技术预见及关键技术选择中的应用可概括为以下方面:①应用于识别学科研究前沿,分析学科进展及发展趋势;②确定研究的热点课题、技术方法、学科分布和应用领域及发展趋势;③考察特定领域内科学研究主题的变迁,预测技术发展趋势,实现技术跟踪的可视化;④分析学科或领域内不同研究者的相互关系,以及学科或领域之间的交互关系;⑤测度当前研究的影响,提供突发技术的早期预警,对技术发展的优先性进行排序;⑥分析学科或领域内的核心作者群,分析某国或某机构的科研水平与地位。另外,科学知识图谱用作科学管理的工具,可以被用来评价期刊、科学家、机构或社团在研究中的角色;确定期刊与期刊之间、期刊和研究领域之间的关系;测度当前研究的影响;向社会提供有关重要的、新的交叉学科关系的早期预警;认定进展突然加速的研究领域以及确定导致重大科学进步的进展次序。可见,科学知识图谱具有很强的预见性和前瞻性,这与技术预见的理念和假设不谋而合,将科学知识图谱的方法与技术预见相结合有其理论依据。

科学知识图谱的应用离不开引文分析和可视化技术。近年来,随着计算机技术的迅猛发展及应用,引文分析和可视化领域都取得了长足的进步,许多新的技术被广泛应用于文献、

专利、基因图和其他信息类型的可视化分析,产生了许多新的研究成果,为科学知识图谱的绘制提供了新的、可靠的理论、方法和技术支持。其中最引人注目的是数据可视化、信息可视化和引文分析可视化及其应用研究。将引文分析可视化和科学知识图谱的重要应用前景展现在人们眼前,倍受信息管理界、科学界和科研管理界的关注和青睐。

二、研究的基本内容与拟解决的主要问题

1.主要内容:

(1)科学知识图谱的起源及发展:通过网络调查、文献分析,了解科学知识图谱的有关概念、工作原理,所使用的基本参数及含义,以及科学知识图谱的起源、当前的发展。

(2)当前科学知识图谱的主要研究内容:分析国内外经典的科学知识图谱资料,对科学知识图谱的研究内容、数据格式要求、研究角度、研究工具、不同角度所揭示的不同含义等进行研究。

(3)科学知识图谱应用于学科评价的实例分析:查找中文文献,特别是具体的案例分析,研究在中文领域内科学知识图谱在学科评价中的应用与发展。

(4)总结:对前期的研究进行分析总结,提出当前国内研究中科学知识图谱用于学科评价时的优点与不足,提出进一步研究应注意的事项等。

2.拟解决的主要问题:

了解科学知识图谱基本定义、工作原理、应用情况,对科学知识图谱的研究内容、研究角度、研究工具、不同角度所揭示的不同含义等进行研究,并能将科学知识图谱应用于学科评价的实例进行分析。

三、研究的方法与技术路线、研究难点,预期达到的目标

1.研究方法及技术路线

科学知识图谱是可视化显示知识资源及其关联的一种图形,可以绘制、挖掘、分析和显示知识间的相互关系,在组织内创造知识共享的环境,从而最终达到促进知识交流和研究深入的目的。研究发现,科学引文与被引文之间往往有着学科内容上的联系。通过引文聚类分析,特别是从引文间的网状关系进行研究,能够探明有关学科之间的亲缘关系和结构,划定某学科的作者集体,分析推测学科间的交叉、渗透和衍生趋势,还能对某一学科的产生背景、发展概貌、突破性成就、相互渗透和今后发展方向进行分析,从而揭示科学的动态结构

和某些发展规律。本次毕业论文主要将科学知识图谱的方法应用于学科评价。由于科技论文都具备篇名、作者、机构、邮编、关键词、参考文献等基本要素,因此通过对每个学科的研究论文进行上述各基本要素的词频统计、共现统计及关联分析,就可以获知该领域的研究主题、主要研究机构、重要学者、地区分布、高影响力的著作、作者合作网、机构合作网以及学科知识的来源等情况,并通过比较分析,获得上述各种研究结果随时间变化的演化情况,或者是各学科间各种研究结果的异同情况等。具体的研究流程如下:

(1)数据收集。即在明确研究目标的基础上,选取最合适的数据库获得数据。

(2)数据预处理。主要工作是将收集到的数据进行规范化的整理,便于下一步的统计分析。如进行数据格式的转换,剔除多余或不合格的数据等。

(3)数据计算。核心是围绕研究目标,对数据进行排序、求和、聚类、共现等计算。

(4)绘制图谱。将获得的计算结果整理为可以用来可视化表达的数据,并且运用合适的可视化工具绘制成图形以有利于研究者和用户的理和分析需要。

(5)研究报告形成。根据研究目的,在对数据计算结果和可视化图形的分析基础上形成研究报告。

目前,可视化的图形主要有两种:一种是借助于统计分析软件SPSS等软件的图示功能而生成的聚类分析图、多维尺度分析图,这种图的不足是直观性不够好,而且能表现的节点数量也非常有限,往往只能包括几十个;第二种是借助Ucinet和Pajek等为代表的社会网络分析软件生成的图,这种图的基本特点是以实心圆或方框代表节点,以线的粗细代表合作强度,直观性较好。

2.本文的研究难点

就数据方面而言:绘制知识图谱时,需要选取合适的数据进行分析。目标期刊的选择有一定的标准,样本要适中。样本过大会导致数据分散、不易解释,样本太小又不足以完整解释一个学科和知识领域的全貌。另外,图谱的解读无疑是绘制知识图谱的最终目的和最重要的环节,只有对图谱进行深入的定性分析,才能够保证图谱解读的深度,尤其是对关键节点的定性分析更为重要,但在实际分析时,可能会由于对学科评价领域了解的广度和深度不够,致使我们无从下手。

3.预期达到的目标

科学知识图谱在学科评价中的应用研究[开题报告]

(2011届) 本科毕业论文(设计) 开题报告 题目:科学知识图谱在学科评价中的应用研究学院:商学院 专业:信息管理与信息系统 班级: 学号: 姓名: 指导教师: 开题日期:

一、选题的背景、意义 1.该选题的历史背景及国内外现状 科学知识图谱,是将传统的文献计量方法与现代的文本挖掘和复杂网络、数学、统计学、计算机科学方法以及可视化技术等有机地整合在一起的一种综合分析科学发展的知识发现方法。从20世纪 50年代至今,科学知识图谱的研究已经有几十年的历史。 (1)引文分析理论的发展促进了科学知识图谱的兴起。20世纪60年代,加菲尔德(Eugene Garfield)创办科学引文索引 (SCI)。1965年,普赖斯以SCI为数据来源,发表了一篇科学计量学的杰作《科学论文的网络》。在这篇论文中,普赖斯第一次提出并界定了“研究前沿”的概念。到了20世纪70、80年代,匈牙利的三位学者T.布劳温 (Tibur Braun)、W.格伦采尔 (Wolfgang Glanze1)和A.舒伯特 (Andres Schubert)以SCI数据库为基础,出版了《科学计量学指标》,这实际上是世界科学地图和科学知识图谱的雏形。 (2)复杂网络系统和社会网络分析的兴起丰富了引文分析理论与方法。美国社会心理学家斯坦利·米尔格兰姆(Stanley Milligram)于1967年通过社会网络人际关系的“六度分隔”试验发现了著名的“小世界”现象。90年代中期,比利时情报计量学专家埃格赫 (Leo Egghe)和鲁索 (Ronald Rousseau)合作出版了《情报计量学引论》,促进了科学知识图谱的产生。进入21世纪,社会网络分析的探索与应用向纵深发展,风靡全球。 (3)信息可视化为科学知识图谱提供了强大的技术支持。1999年陈超美出版了该领域的第一部学术专著《信息可视化与虚拟环境》,R.斯宾塞 (Robert Spence)2000年出版了《信息可视化》之后相关研究如雨后春笋般涌现。 总体来讲,无论是企业还是科研领域,我国对知识图谱的关注滞后于国外。相比国外知识图谱的研究状况,我国起步稍晚,但是也取得了一些成绩。国内在知识图谱的应用方面缺少理论上的实证分析,主要是将知识图谱作为一个工具,应用于各个领域,而且相对于国外,应用研究还比较薄弱。目前而言,国内知识图谱研究中存在主要困难和问题如下: (1)研究手段和方法的严重滞后 国内近几年有关知识图谱的研究也有一些,如大连理工大学的刘则渊教授带领的团队进行了科学计量学、管理学人机工程学学科以及国内所有工程领域研究前沿的知识图谱构建;武汉大学的马费成、刘青林、社科院的蒋颖等也对国内外知识管理、数字资源管理、战略管理、文献计量学等领域进行了共词图谱的绘制;南京大学的邓三鸿、浙江大学的潘有能等初步建立了图书情报学科的学科知识地图;金莹以CSSCI 数据粗略构建了我国社会科学的学

第13章++知识图谱与知识推理

第13章知识图谱与知识推理 王泉 中国科学院大学网络空间安全学院 2016年11月

?13.1概述 ?13.2知识图谱构建 ?13.3 知识图谱中的知识推理–13.3.1 表示学习技术 –13.3.2 张量分解技术 –13.3.3 路经排序算法?13.4 本章小结

?13.1概述 ?13.2知识图谱构建 ?13.3 知识图谱中的知识推理–13.3.1 表示学习技术 –13.3.2 张量分解技术 –13.3.3 路经排序算法?13.4 本章小结

实体和关系 ?实体 (entity):现实世界中可区分、可识别的事物或概念–客观对象:人物、地点、机构 –抽象事件:电影、奖项、赛事 ?关系 (relation):实体和实体之间的语义关联 –BornInCity, IsParentOf, AthletePlaysForTeam

?知识图谱 (knowledge graph):实体和关系所构成的异质、有向图,是表征实体间语义关联的语义网络 ?节点代表实体 ?边代表不同类型的关系 (异质) ?两个节点之间有边相连表明它们之间存在相应关系 ?边是有向的表明关系是非对称的

?三元组 (triple/triplet):也称事实 (fact),是最基本的知识存储方式,表现为(主语, 谓词, 宾语)形式 (Tom, BornInCity, Paris) (Tom, LivedInCity, Lyon) (Tom, Nationality, France) (Tom, ClassMates, Bob) (Paris, CityLocatedInCountry, France) (Lyon, CityLocatedInCountry, France) (Bob, BornInCity, Paris)

科学知识图谱研究综述

?新技术应用? 科学知识图谱研究综述 梁秀娟 (湘潭大学公共管理学院 湖南湘潭411105) 文 摘 随着可视化技术的发展,将其与引文分析技术相结合,可以直观、形象地向人们揭示学科以及学科之间的联系。本文结合国内外在引文分析和可视化方面的最新研究,从起源、概念、绘制方法、应用及研究展望等方面对科学知识图谱进行了较为详细的分析。 关键词 引文分析 可视化 科学知识图谱 Rev i ew of M app i n g Knowledge D o ma i n s L i a ng X i ujuan (Public Manage ment School of Xiang Tan University,XiangTan HuNan,411105) Abstract:W ith the devel opment of visual technol ogy which co mbined with citati on analysis technol2 ogy,it can reveal the link bet w een subjects intuitively and vividly.I n this paper,combined with the latest research on citati on analysis and visualizati on,we make a detailed intr oducti on in the areas of mapp ing knowledge domains fr om the origin,concep ts,techniques,app licati ons and the latest p r o2 gress. Key words:Citati on analysis,V isualizati on,Mapp ing knowledge domains 随着信息技术、可视化技术和科学计量学、文献计量学理论的发展,以图形的方式来揭示学科间的联系已不再是一件难事。而近年来科学计量学、文献计量学研究领域兴起的热点之一,就是如何在准确、翔实地传达知识的基础上以可视化的图像直观、形象地向人们揭示学科以及学科之间的联系。科学知识图谱(Mapp ing Knowledge Domains)正是在这一研究领域中出现的一个新的热点。 1 科学知识图谱的起源 科学知识图谱是引文分析与数据、信息可视化相结合的产物。引文分析是指利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以揭示其数量特征和内在规律的一种文献计量分析方法[1]。正式的引文分析始于上个世纪50年代初,1964年美国的尤金?加菲尔德(Eugene Garfield)创立引文数据库S C I(Science Citati on I ndex,科学引文索引),为学者们利用引文分析法分析学科领域知识结构提供了强有力的工具。S C I不仅为引文分析奠定了数据平台,而且使得规范化、高质量的引文分析成为可能。60年代早期,加菲尔德等人开始了基于引文数据的开拓性研究,他们在《应用引文数据撰写科学历史》(The use of citati on data in writing the hist ory of science)中绘制了DNA研究领域的历史发展图谱;不久之后,普赖斯用相同的数据在其一系列经典著作———《巴比伦以来的科学》《小科学,大科学》《科学文献的网络》中,进行了知识图谱绘制的开创性工作。尽管当时并没有使用“知识图谱”这一概念,但是,实际上以引文分析为基础的“知识图谱”理论与方法己经应运而生了[2]。国内自上个世纪80年代引入S C I,很快引起了广大学者的极大兴趣,被越来越多的科学研究者所认同和使用,主要用于揭示科学结构、研究科学史的发展规律、评价科研绩效、预测研究领域热点等方面。 与此同时,计算机技术的快速发展及其在科学计算领域的应用,为数据和信息处理提供了有力的

信息抽取层、知识融合层、知识加工层

《知识图谱构建技术综述》—— 笔记 刘峤李杨段宏刘瑶秦志光《计算机研究与发展》, 2016, 53 (3):582-600 一、摘要 说明知识图谱的定义和内涵 将知识图谱分成信息抽取层、知识融合层、知识加工层 分类说明三个层次涉及的关键技术的研究现状 面临的挑战和关键问题 二、知识图谱的定义与架构 2.1 定义 知识图谱:是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系。其基本组成单位是。“实体-关系-实体”三元组,以及实体及其相关属性-值对,实体间通过关系相互联,构成网状的知识结构。 知识图谱本身是一个具有属性的实体通过关系链接而成的网状知识库。(从图的角度看,图中节点表示实体(概念),节点之间的边表示实体与实体之间的关系) 2.2 架构 知识图谱自身的逻辑结构 数据层:知识以事实(fact)为单位存储在图数据库。 模式层:模式层在数据层之上,是知识图谱的核心。储存提炼过的知识,采用本体库进行管理模 式层。 知识图谱所采用的技术(体系)架构(本文的重点) 知识图谱的构建过程是从原始数据出发,采用一系列自动或半自动的技术手段,从原始数据中提取出知识要素(即事实),并将其存入知识库的数据层和模式层的过程.这是一个迭代更新的过程,根据知识获取的逻辑,每一轮迭代包含3个阶段:信息抽取、知识融合以及知识加工。

2.3 构建方式 自顶向下:从高质量数据中提取本体和模式信息,加入到知识库中。 自底向上:从公开采集的数据中提取出资源模式,选择其中置信度较高的新模式,加入到知识库中。 三、知识图谱的构建技术

3.1 信息抽取 信息抽取是一种自动化地从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息的技术。关键技术包括:实体抽取、关系抽取和属性抽取。 实体抽取(命名实体识别NER) 指从文本数据集中自动识别出命名实体。(最关键最基础) 关系抽取 1. 实体抽取得到的是离散的命名实体,还需从相关预料中提取出实体之间的关系。 2. 关系抽取就是解决如何从文本语料中抽取式体检关系这一问题。 属性抽取 1. 属性抽取的目标是从不同信息源中采集特定实体的属性信息。由于可以将实体的属性视为实体与 属性值之间的一种名词性关系,因此也可以将属性抽取问题视为关系抽取问题。 2. 属性抽取一般是从百科类网站上的半结构化数据中抽取,或者是采用数据挖掘的办法直接从文本 中挖掘实体属性与属性值之间的关系模式。据此发现对属性名和属性值在文本中的定位。

知识图谱概述与应用

导读:知识图谱 (Knowledge Graph) 是当前的研究热点。自从2012年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。各大互联网企业在之后的短短一年纷纷推出了自己的知识图谱产品以作为回应。比如在国,互联网巨头百度和搜狗分别推出”知心“和”知立方”来改进其搜索质量。那么与这些传统的互联网公司相比,对处于当今风口浪尖上的行业 - 互联网金融,知识图谱可以有哪方面的应用呢? 目录: 1. 什么是知识图谱? 2. 知识图谱的表示 3. 知识图谱的存储 4. 应用 5. 挑战 6. 结语 1.什么是知识图谱? 知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里

输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。 另外,对于稍微复杂的搜索语句比如”Who is the wife of Bill Gates“,Google能准确返回他的妻子Melinda Gates。这就说明搜索引擎通过知识图谱真正理解了用户的意图。 上面提到的知识图谱都是属于比较宽泛的畴,在通用领域里解决搜索引擎优化和问答系统(Question-Answering)等方面的问题。接下来我们看一下特定领域里的 (Domain-Specific) 知识图谱表示方式和应用,这也是工业界比较关心的话题。 2.知识图谱的表示 假设我们用知识图谱来描述一个事实(Fact) - “三是四的父亲”。这里的实体是三和四,关系是“父亲”(is_father_of)。当然,三和四也可能会跟其他人存在着某种类型的关系(暂时不考虑)。当我们把也作为节点加入到

科学知识图谱研究综述

#新技术应用# 科学知识图谱研究综述 梁秀娟 (湘潭大学公共管理学院湖南湘潭411105) 文摘随着可视化技术的发展,将其与引文分析技术相结合,可以直观、形象地向人们揭示学科以及学科之间的联系。本文结合国内外在引文分析和可视化方面的最新研究,从起源、概念、绘制方法、应用及研究展望等方面对科学知识图谱进行了较为详细的分析。 关键词引文分析可视化科学知识图谱 R evie w of M apping Know ledge Dom ains L iang X i u j uan (Pub lic M anage m en t School of X iang Tan Un iversity,X iangTan H uN an,411105) Abst ract:W it h the develop m ent o f v isual techno logy w hich co mb i n ed w ith citation analysi s techno-l ogy,it can reveal the link bet w een subjects int u iti v e l y and v ividly.I n t h is paper,co mb i n ed w it h the latest research on citation ana l y sis and v isua lizati o n,w e m ake a de tailed introducti o n i n t h e areas o f m apping kno w ledge do m a i n s fro m the or i g i n,concepts,techniques,applications and the latest pr o-gress. K ey w ords:C itati o n analysis,V isualization,M app i n g kno w ledge do m ains 随着信息技术、可视化技术和科学计量学、文献计量学理论的发展,以图形的方式来揭示学科间的联系已不再是一件难事。而近年来科学计量学、文献计量学研究领域兴起的热点之一,就是如何在准确、翔实地传达知识的基础上以可视化的图像直观、形象地向人们揭示学科以及学科之间的联系。科学知识图谱(M app i ng K now l edge Dom ains)正是在这一研究领域中出现的一个新的热点。 1科学知识图谱的起源 科学知识图谱是引文分析与数据、信息可视化相结合的产物。引文分析是指利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以揭示其数量特征和内在规律的一种文献计量分析方法[1]。正式的引文分析始于上个世纪50年代初,1964年美国的尤金#加菲尔德(Eugene G arfield)创立引文数据库SCI(Science C itati on Index,科学引文索引),为学者们利用引文分析法分析学科领域知识结构提供了强有力的工具。SCI不仅为引文分析奠定了数据平台,而且使得规范化、高质量的引文分析成为可能。60年代早期,加菲尔德等人开始了基于引文数据的开拓性研究,他们在5应用引文数据撰写科学历史6(T he use of c itati on data i n w riti ng the hist o ry o f sc i ence)中绘制了DNA研究领域的历史发展图谱;不久之后,普赖斯用相同的数据在其一系列经典著作)))5巴比伦以来的科学65小科学,大科学65科学文献的网络6中,进行了知识图谱绘制的开创性工作。尽管当时并没有使用/知识图谱0这一概念,但是,实际上以引文分析为基础的/知识图谱0理论与方法己经应运而生了[2]。国内自上个世纪80年代引入SCI,很快引起了广大学者的极大兴趣,被越来越多的科学研究者所认同和使用,主要用于揭示科学结构、研究科学史的发展规律、评价科研绩效、预测研究领域热点等方面。 与此同时,计算机技术的快速发展及其在科学计算领域的应用,为数据和信息处理提供了有力的

知识图谱概述及应用

导读:知识图谱(Knowledge Graph) 是当前的研究热点。自从2012年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。各大互联网企业在之后的短短一年内纷纷推出了自己的知识图谱产品以作为回应。比如在国内,互联网巨头百度和搜狗分别推出”知心“和”知立方”来改进其搜索质量。那么与这些传统的互联网公司相比,对处于当今风口浪尖上的行业- 互联网金融,知识图谱可以有哪方面的应用呢? 目录: 1. 什么是知识图谱? 2. 知识图谱的表示 3. 知识图谱的存储 4. 应用 5. 挑战 6. 结语 1.什么是知识图谱? 知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。

知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。 另外,对于稍微复杂的搜索语句比如”Who is the wife of Bill Gates“,Google能准确返回他的妻子Melinda Gates。这就说明搜索引擎通过知识图谱真正理解了用户的意图。

基于知识图谱和人工智能技术的数据关系智能辨识及可视化应用

XXX公司科学技术项目可行性研究报告 项目名称:基于知识图谱和人工智能技术的数据关系智能辨识及可视化管理研究 申请单位: 起止时间:2020年1月1日-2020年12月31日项目负责人: 通信地址: 邮政编码: 联系电话:

传真: 申请日期:2019.09

一、目的和意义 XXX公司(以下简称“公司”)正在大力推进泛在电力物联网及坚强智能电网建设,对电网及电网企业的信息化水平提出了更高的要求,尤其是对于数据资产的深入挖掘利用、全业务流程的协同贯通,有着迫切的需求。因此,全面建设了全业务统一数据中心,实现了源端全业务融合、后端大数据分析。 随着全业务统一数据中心的全面建设,数据的价值发现及使用越来越受重视。为追求企业数据价值最大化,历史数据贯通以及基于业务规则的数据异常发现势在必行。目前虽然通过主数据管理,统一编码管理等方式进行了数据贯通和数据管理,但是对于历史数据的梳理和贯通却收效胜微。主要存在以下问题: (1)对于历史数据的贯通多采用人工的方式,质量难以得到保证。 (2)需要对原业务系统进行改造,返工工作量及配合成本巨大。 (3)缺乏有效的保障措施,难以确保数据贯通的持续有效。 (4)缺乏知识提取技术,尤其是对于半结构化和非结构化数据知识提取存在盲区,丢失了很多有价值数据,缺乏覆盖电网全业务的知识图谱。 (5)缺少统一的知识库,数据搜索需在多个数据库或应用中分别实现,缺乏关联性,搜索体验差,缺乏智能推荐等功能。 (6)数据资源缺乏全生命周期管控,数据处理各个环节不能有效监管。 因此,亟需在全业务统一数据中心的数据仓库与数据集市之间通过语义标准构建业务数据知识图谱,引入数据化决策模型和监控体系,建立公司信息全息画像,实现业务数据的跨业务贯通,并提供网格化的高速检索和深度挖掘功能,提升企业管理的规范化、标准化、精益化水平。

第14章 知识图谱的落地与实践

《知识图谱: 概念与技术》 第14 讲 知识图谱落地与实践 肖仰华 复旦大学 shawyh@https://www.360docs.net/doc/088044868.html,

概述

知识图谱产业概览 产业化概览 KW 构建大规模通用知识图谱和领域图谱, 为机器认知提供背景知识 百科图谱 商情图谱 垂直图谱 知识图谱数据与服务 提供领域知识图谱构建与应用咨询 服务或落地解决方案,给华为、电 信、移动、阿里巴巴、滴滴等数十 家应用单位提供了知识图谱解决方 案。 知识图谱咨询与方案 1)支撑知识图谱运作的混合型系 统,提供高效稳定的查询; 2)领域知识图谱构建的工具集成 系统,提供知识图谱构建能力 智能数据获取系统 图数据库系统 知识库构建工具集 底层支撑系统与产品

系统 技术体系 智能信息获取 图数据管理 数据 商情图谱 工商、产品、投融资、诉讼、专利软著、商标 百科图谱 人物、字词、地理、经济、军事、科学、社会 其他图谱 影视、音乐法律、食物 服务 百科问答 知识库验证码 实体链接 信息抽取 智能水军

支构建 应用 知识图谱能力体系 文本理解 工商百度百科 中文维基音乐图管图嵌入 图划分查询分发关联查询 图缓存 社团查询 基于mongo 数据的管理 分布式爬虫 智能爬虫 移动端支持优先级调度 多语言支 持 屏蔽检测验证码智能枚举抽取 概念识别概念抽取 实体链接 中文OpenIE 纯文本事实抽取 关系分类体系构建 关系抽取 实体识别融合 冲突消解属性值归一化 属性融合 属性值分割标注 众包 样本优化远程监督 实体理解 文本相似性文本提问 文档标签化 文档摘要搜索推荐 AVP 检索Type 检索描述检索 领域数据标注 关系标注 概念标注 垂直领域 开放领域 半结构化数据抽取 清洗 补全 类别补全属性补全 三元组补全 纠错 众包反馈版本更迭 错误检测外链 DBpedia 类别链接中英文跨语言链接 SameAs 外链 更新 主动更新基于日志的更新 周期更新 局点同步意图理解 对答 知识库对话 知识库问答 实体同义词 同义实体识别 图片实体化 文本实体化推理 众包反馈版本更迭 传递性推理

2020-2021年中国知识图谱行业研究报告

中国知识图谱行业研究报告 2019-2020年

场中以金融领域和公安领域应用份额占比最大。 摘要 人工智能本质是解决生产力升级的问题,人类生产力可以归类为知识生产力和劳动生产力,人工智能走入产业后,可以分为感知智能、认知智能和行为智能,后两者更与生产力相对应,NLP 和知识图谱是发展认知智能的基础。 原始数据通过知识抽取或数据整合的方式转换为三元组形式,然后三元组数据再经过实体对齐,加入数据模型,形成标准的知识表示,过程中如产生新的关系组合, 通过知识推理形成新的知识形态,与原有知识共同经过质量评估,完成知识融合, 最终形成完整形态上的知识图谱。 在面对数据多样、复杂,孤岛化,且单一数据价值不高的应用场景时,存在关系深度搜索、规范业务流程、规则和经验性预测等需求,使用知识图谱解决方案将带来最佳的应用价值。 2019年涵盖大数据分析预测、领域知识图谱及NLP 应用的大数据智能市场规模约为 106.6亿元,预计2023年将突破300亿元,年复合增长率为30.8%,其中2019年市 随着整体市场数据基础的完善和需求唤醒,大数据智能领域规模持续走高,但在行业可落地性和理性建设的限制下,预计市场增速将呈现下降趋势,期间咨询性需求将会大量出现,从整体发展来看增速处于良性区间,对真正有价值的公司和产品有正向意义。 4 5 1 3 2

1知识图谱技术概述 中国知识图谱市场概述2中国知识图谱细分市场分析3中国数据智能代表企业案例展示4

人工智能技术分类和趋势 三种流派的融合应用,使人工智能向想象更进一步 人工智能是对一类能够实现机器模拟智慧生命某些特征的技术统称,从学术上可以分为,对人类已有知识进行组织编辑的 符号主义、通过数学理论公式推导聚类和预测问题的连接主义,以及利用机器模仿生物活体行为的行为主义三个流派,分 别以知识工程、机器学习和仿生机器人为时代代表,而知识图谱就是新一代知识工程的具体体现。2012年,深度学习在计算机视觉和智能语音上产生重大突破,打开了人工智能商业化的大门,使得连接主义一度成为人工智能的代名词,但随着 应用落地成为主旋律,缺位行业逻辑和理论概念的连接主义,往往找不到最佳的应用场景而止步于浅层尝试,在此背景下, 人工智能技术应当走向融合,符号主义需要连接主义提供强大的计算支撑,连接主义需要符号主义的逻辑指导,二者又共 同作用于行为主义,充当机器人的大脑和“记忆宫殿”,在多种技术综合利用下的垂直领域智能解决方案才是当今最符合 市场期待的方向。 人工智能三大流派分类与融合趋势 机器学习 控制论 知识图谱 智能机器人系统 信息理论 控制理论 知识工程 深度学习 神经系统 智 能 语 音计算机视觉 自然语言理解 …… 专家系统 控制逻辑 计算机 智能控制系统 生物控制论 启发式算法 自组织系统 工程 控制论 行为主义 符号主义 连接主义

国内知识图谱研究综述与评估20042010年

国内知识图谱研究综述与评估:2004-2010年 * 汤建民/余丰民 2012-9-21 10:11:12 来源:《情报资料工作》2012年01期【英文标题】Review and Evaluation of Knowledge Mapping Research in China: 2004-2010 【作者简介】汤建民,男,1967年生,浙江树人大学科学计量学研究中心主任、教授,杭州310015;余丰民,1976年生,浙江树人大学图书馆副研究馆员,杭州310015 【内容提要】文章综合运用词频统计、共词分析及可视化技术等文献计量方法,分析了国内知识图谱研究的整体现状,包括论文的总量分布、发表期刊分布、作者分布、机构分布、基金资助分布及论文研究热点等,并综合归纳了论文研究的主要内容。在此基础上,对该研究领域的现状和存在的问题进行了综述和评估,并提出了相应的对策。 This paper combines word frequency analysis, co-word analysis and visualization to demonstrate the general situation of knowledge mapping study in China. The authors discuss the distribution of papers, published journals, authors, organizations and funds as well as the focus of the existing papers and sum up main contents of the study. On this basis, the paper reviews and evaluates the status of the research and its existing problems, puts forward relevant counter-measures.

基于文献计量的科学知识图谱发展研究

收稿日期:2009-05-16 修回日期:2009-07-23 作者简介:任红娟(1979-),女,博士研究生,研究方向为情报分析、文献计量和战略情报;张志强(1964-),男,教授,博士生导师,研究方向为战略情报、地球科学、生态经济学。 基于文献计量的科学知识图谱发展研究 The Evolution of Mapping K now ledge Domains B ased on the Bibliometrical Method 任红娟1,2 张志强1 (1.中国科学院国家科学图书馆兰州分馆 兰州 730000;2.中国科学院研究生院 北京 100090) 摘 要 利用文献计量方法综合研究科学知识图谱领域发展状况的研究相对比较少的问题,从构建种子数据集,并利用一级引用在进行数据集扩展的基础上,采用作者共被引和共词分析方法对科学知识图谱研究领域的知识结构进行了划分,并利用逐年演化的高频词共现关系分析了该领域的演化趋势和研究重点,从定量和定性结合的角度对科学知识图谱研究领域进行了全面的描述。关键词 作者共被引 共词分析 科学知识图谱 中图分类号 G 310 文献标识码 A 文章编号 1002-1965(2009)12-0086-05 0 引 言 科学知识图谱[1],是将传统的文献计量方法与现代的文本挖掘和复杂网络、数学、统计学、计算机科学方法以及可视化技术等有机地整合在一起的一种综合分析科学发展的知识发现方法。它利用一定的方式把抽象数据映射在2D 或3D 的图形中,从宏观、中观、微观各个层面来揭示一个领域或者学科、主题发展的概貌,使得人们能够从各个角度全面地审视一个学科的结构和研究热点、重点等信息。由于图形展示方式,非常符合人的认知习惯,而且比起文本信息,人的大脑能够处理更多的图形信息,因此科学知识图谱的方法越来越受到各个领域研究者的关注。 虽然自文献计量学出现以来就有了科学知识图谱发展的雏形[2-4],但其真正的发展是在20世纪90年代末。十多年来科学知识图谱方法体系在不断的发展和扩充,如今处在一个什么样的发展阶段?主要研究哪些内容?领域的主要领军人物是谁?领域的研究结构如何?这些信息到目前都还不十分明了。虽然国内外的学者对于科学知识图谱的发展都进行了综合的研究[5-7],但主要还是从描述和内容总结的角度出发的。从定量的角度来研究科学知识。 图谱领域的发展,尤其是领域的演化趋势还很少有人涉及。因此,本文主要从计量学的角度对科学知识图谱研究领域的主要参与主体和研究的内容以及研究的动态进行了深入的研究。 1 科学知识图谱主要代表人物和主要研究内容分析 1.1 种子数据集的构建和基础分析 选取汤姆森科技的SCI 和SSCI 数据库,利用“science mapping ”or “mapping science ”or “visualiz 3knowledge domain 3”or “knowledge domain 3visualiz 3”or “mapping knowledge domain 3”为检索词进行主题检索,选取数据库收录的 所有年限的数据,检索结果共得到70篇文献。去除与该领域不相关的遥感和地理学领域的文献并经过去重处理,共得到50篇文献,是该领域的研究成果的集中代表。从这些文献的来源期刊的学科分布来看,主要集中在信息科学和图书馆科学、计算机科学和信息系统学科领域。 从学科的产出分布来看,德莱克斯大学的陈超美是这个领域最高产的作者,论文数量达到了8篇,可以说是科学知识图谱领域的领军人物。他不但比较早就开始关注和研究科学知识图谱方法,而且还自行研发了CITESPACE 一代和二代可视化软件[8],主要用于分析文献、期刊和作者之间的共被引关系。利用 PFNETs 、期望值最大化、时间序列等算法,把基于文献 的数据转化为多彩的可视化图谱。目前这个软件已经在知识图谱和文献计量领域被广泛采用。 排在第二位的是Small ,他是科学计量和文献计量领域的重要代表人物之一。从Small 的几个代表作品来看,在知识图谱领域他主要关注大科学的图谱,而不是学科专业知识的展示和揭示,着重宏观知识图谱方 第28卷 第12期2009年12月 情 报 杂 志JOURNAL OF IN TELL IGENCE Vol.28 No.12Dec. 2009

大数据在商业中的研究态势与前沿热点--基于科学知识图谱的文献计量分析

基金项目:国家自然科学基金项目 互联网+ 平台型企业创新生态系统的治理二协同效应与生态优势研究 (项目编号:71772163?项目负责人:谢洪明)成果之一?浙江省自然科学基金项目 浙江省自然科学基金项目 互联网+ 背景下平台生态系统的竞争力及其动态竞争 (项目编号:LY16G020009?项目负责人:谢洪明)成果之一? 作者简介:谢洪明?管理科学与工程博士?浙江工业大学管理学院教授二博士生导师?研究方向:企业战略管理?杨浩(通信作者)?浙江工业大学管理学院硕士研究生?研究方向:创新创业二战略管理? 大数据在商业中的研究态势与前沿热点 基于科学知识图谱的文献计量分析 谢洪明一杨一浩 (浙江工业大学管理学院?杭州310023) 摘一要:基于WOS数据库文献来源?运用文献计量方法?对2011 2018年和商业相关联的大数据研究文献数据进行文献统计分析以及关键词共现分析?绘制研究热点知识图谱?研究发现:基于商业的大数据研究呈现多科学交叉趋势?涉及管理二经济二信息技术等多个学科?信息技术二大数据与商业管理和经济的渗透发展二新时代背景下的大数据和商业深度融合应用是当下研究热点?社交网络二企业组织二知识管理是近几年来的前沿趋势?关键词:商业领域?大数据?知识图谱?研究热点 一一随着信息技术的发展?人类进入数字信息时代?互联网二云计算二物联网二GPS等新兴技术的涌现催生了海量数据?2011年?麦肯锡在题为?海量数据? 创新二竞争和提高生产率的下一个新领域?的研究报告中指出?数据已经渗透到每一个行业和业务职能领域?逐渐成为重要的生产因素?而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来?人二机二物三元世界的高度融合?带来数据规模的爆炸式增长?促进当今社会进入大数据时代?2008年9月世界顶级学术期刊?Nature?出版 BigData 专刊? 大数据 逐渐在学术界得到越来越多的关注?大数据在商业和消费者创造价值方面具有巨大的潜力?其所蕴含的潜在价值将被释放?引起新一波的创业方向二创造价值和投资机会 [1] ? 1一数据来源与研究方法 本文选择国际公认社会科学领域中最好的核心期刊数据库 ISIWebofKnowledge中的SCI ̄EX ̄ PANDED和SSCI数据库作为文献来源?主题词选择 bigdata ?将文献类型限制为论文和综述?年限为 2011 2018年?将学科类别限制在管理二商业二经济二商业与金融4个相关领域?通过对搜索结果进行精炼?最后得到739篇文献?筛除搜索结果中的新闻报道和无关联文献?最后确定726篇文献作为数据来源?科学知识图谱把知识域作为对象?以图像形式显示科学知识的发展进程与结构关系[2]?通 过对文献信息可视化分析?使研究者能够直观捕捉相关研究领域的作者和研究机构二关键词二参引文献二被引作者等?从而把握某一学科或知识域在一定时期发展的趋势与动向[3 ̄4]?本文使用CiteSpace可视化分析软件绘制可视化知识图谱?梳理和总结商业层面上大数据研究的热点与态势?并在此基础上提出未来该领域的研究展望?以提供理论价值和实践意义? 2一论文数据统计分析 2.1一文献增长趋势分析 通过对文献数量变化及时序规律的统计分析?可以把握某一领域的总体发展速度及研究水平?图1显示了近8年来商业领域大数据研究的时间特 征?该领域大数据研究文献从2011 2018年间呈现总体上升趋势?从检索到的726篇文献中可以发现?虽然大数据研究至今已经有十余年?但在2011年之前商业领域的大数据研究论文依旧是空白状态?直到2011年Lavalle二Steve等人在?MITSLOANMANAGEMENTREVIEW?上发表了题为?BigData? 2 4

知识图谱概述及应用

导读:知识图谱(Knowledge Graph) 就是当前的研究热点。自从2012年Google推出自己第一版知识图谱以来,它在学术界与工业界掀起了一股热潮。各大互联网企业在之后的短短一年内纷纷推出了自己的知识图谱产品以作为回应。比如在国内,互联网巨头百度与搜狗分别推出”知心“与”知立方”来改进其搜索质量。那么与这些传统的互联网公司相比,对处于当今风口浪尖上的行业- 互联网金融, 知识图谱可以有哪方面的应用呢? 目录: 1、什么就是知识图谱? 2、知识图谱的表示 3、知识图谱的存储 4、应用 5、挑战 6、结语 1、什么就是知识图谱? 知识图谱本质上就是语义网络,就是一种基于图的数据结构,由节点(Point)与边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱就是关系的最有效的表示方式。通俗地讲,知识图谱就就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。

知识图谱这个概念最早由Google提出,主要就是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。 另外,对于稍微复杂的搜索语句比如”Who is the wife of Bill Gates“,Google 能准确返回她的妻子Melinda Gates。这就说明搜索引擎通过知识图谱真正理解了用户的意图。

科学知识图谱

科学知识图谱应用研究概述 廖胜姣肖仙桃 知识图谱是可视化显示知识资源及其关联的一种图形,可以绘制、挖掘、分析和显示知识间的相互关系,在组织内创造知识共享的环境,从而最终达到促进知识交流和研究深入的目的。从20世纪50年代至今,科学知识图谱的研究已经有几十年的历史。科学知识图谱出现之前,科学计量学家们一直努力在寻找一种同传统方法相比,具有更大的客观性、科学性、数据的有效性和高效率的新方法来研究科学学科的结构与进展。科学知识图谱出现之后,其相关的理论与应用研究不断涌现。本文试图从应用的角度对科学知识图谱的研究与发展状况进行一个系统的梳理,具体从应用领域、研究机构与网站以及绘图软件方面着手。 1应用研究现状 从20世纪50年代开始兴起的各种文献计量方法为科学知识图谱的出现奠定了坚实的理论基础,是科学知识图谱理论与方法的“根”。如今,知识图谱已经成为计量学领域的一个新兴分支,活跃在各个领域的研究中。笔者将从应用领域、研究机构和软件方面阐述科学知识图谱的应用研究状况。

1.1应用领域方面 科学知识图谱的应用领域很广,从科研到教学到社会问题的解决等,无不渗透。 1.1.1应用于科研领域 笔者认为,知识图谱最早是在科研领域活跃起来的。在知识图谱中,学科前沿之间的交互关系是以空间的形式展现出来的。研究发现,科学引文与被引文之间往往有着学科内容上的联系。通过引文聚类分析,特别是从引文间的网状关系进行研究,能够探明有关学科之间的亲缘关系和结构,划定某学科的作者集体,分析推测学科间的交叉、渗透和衍生趋势,还能对某一学科的产生背景、发展概貌、突破性成就、相互渗透和今后发展方向进行分析,从而揭示科学的动态结构和某些发展规律。这里仅列举近些年知识图谱的一些应用研究情况。White,McCain,Garfield,Boyack,Huang等对知识图谱的用途进行了不断的扩充,得出知识图谱的主要应用有:文献、专利的结构分析;学科动态、社会网络、领域发展分析等;Shiffrin等认为,涉及到展开的学科间科学区域的知识图谱旨在绘制图形、挖掘、分析、分类、导航以及显现知识等等。 将知识图谱方法应用于构建学科知识图谱的研究人员

科学知识图谱效能评估可视化分析

系统效能是系统的实际行为表现与系统目标的匹配程度,其度量和评估往往牵涉系统科学、管理科学和行为科学等多个领域[1]。目前,国内效能评估研究成果多集中在武器装备[2]、火控雷达[3]、电子对抗[4]等领域,研究内容包括评估指标体系及模型构建、评估方法及模拟仿真。但是,这些研究主要是效能评估领域某一知识点的微观聚焦,缺乏对该领域研究现状整体格局的宏观可视化分析。科学知识图谱(MappingKnowledgeDomains)是用于显示科学知识发展进程和结构关系的图形,既是具有时间序列化的知识谱系,又是可视化的知识图形;可对知识或研究群体所构成的复杂网络进行聚类分析和共引分析,将海量数据以图形、图像等可视化集中表现形式,挖掘数据之间的潜在关联,实现数据可视化信息处理,以协助人们做出科学合理的决策[5-6]。科学知识图谱分析技术在大数据时代背景下发展迅速[7],目前被广泛应用于管理科学[8]、安全科学[9-10]、科技管理[11]等领域。笔者基于华裔学者陈超美开发的科学知识图谱可视化软件CiteSpaceV[12],以中国知网CNKI上的核心期刊为数据源,检索效能评估领域近20年所载论文,分析研究成果产出时序、研究力量分布、作者合作、机构合作、关键词及其文献共引、突变词分析;通过科学知识图谱的可视化分析呈现效能评估研究领域的知识结构、规律和分布情况,实现科学知识从微观聚焦到宏观可视化分析的突破,进而对效能评估领域研究动态的总体把握。 1效能评估研究成果可视化分析 1.1数据来源及方法。以“主题=效能评估”在中国知网(CNKI)上检索最近20年(1998年~2017年)的文献,共得到3089条数据;根据布拉德福定律可知,少数核心期刊集中了该研究领域的大量重要文献,于是在高级检索中将期刊来源类别选择为核心期刊和EI源期刊,检索条件:精确,经过筛选去除不相关的声明、通知、公告等,可得该领域的有效文献1248篇。将检索结果导出为Refworks文本文件,导入CiteSpaceV中进行格式转换,“TimeSlicing”选择1998年-2017年,“YearsPerSlice”设置1年为一个时间分区,“TOPNPerSlice”选择阈值50,即每个时区选择高频出现的前50个节点,采用网络裁剪运算策略(pruningslicednetwork),绘制作者、机构合作网络知识图谱,有效地完成效能评估领域科学研究进行可视化分析。1.2论文产出时间图谱。论文产出是衡量研究领域已有知识的累积量以及成熟程度的重要指标,笔者将效能评估研究近20年的核心期刊论文进行时间图谱分析如图1所示:效能评估领域研究论文产出曲线基本符合科学文献的指数增长规律———普赖斯逻辑增长曲线。1998年-2000年,国内效能评估研究还处于初级阶段,论文年平均不超过10篇,是普赖斯曲线缓慢增长的初级阶段;2001年-2003年,国内效能评估

相关文档
最新文档