引文分析法

引文分析法.txt人永远不知道谁哪次不经意的跟你说了再见之后就真的再也不见了。一分钟有多长?这要看你是蹲在厕所里面,还是等在厕所外面……引文分析法
除了前面两节介绍的内容分析法,内容相关分析涉及到的另外两个主要的领域是情报检索和引文分析。本节在扼要阐述和比较这两者之后,集中介绍引用相关分析的方法—引文分析法如何进行内容相关分析。
一、检索相关
检索相关是指以情报检索为目的的内容相关分析。可以说,各种情报检索理论和方法都围绕着准确、高效地显示、识别和判断检索对象内容或概念上的相关关系。例如,任何一种检索语言在编制技巧上的一个最重要而又最困难的问题就是如何显示概念之间的相互关系。不能充分显示或未显示概念之间真正的相关关系,就会影响检索语言的缩检扩检功能,发生漏检误检。从相关分析的角度上,可以将查全率理解为相关内容的菠盖程度,将查准率理解为内容真正相关的显示程度。又如,在数据库检索中,发展出了详尽显示概念或内容相关关系的词典,这种词典可以帮助用户揭示相关的主题词从而提高检索效果。美国能源部的一个能源数据库配有约1000页及2.5万个表的词典,能显示出相关的代替词或不同层次的相关词项,如词典在“蒸馏”之下列出的拓宽词为“分离处理”,而缩小词为“干馏”和“真空蒸馏”,还显示出约12个相关的代替词,包括“共沸混合物”、“蒸发”等。
情报检索的相关分析在方法上的特征是:
(1)以标引和标识为基础。由此发展出了多种情报检索语言和查找途径。概念内容是通过标识来显示的;
(2)以标识是否一致或符合作为判断是否相关的判据。我们将这种相关分析称之为“符合相关”,即标识相符时才被看作是相关的,否则为不相关。
二、引用相关
引用相关是指通过科学活动中的引用行为来揭示文献内容之间的相关关系。由于在科学活动中,任何一个人的劳动及其知识产品都不是孤立存在的,而是以前人的劳动为前提和条件的,因此,知识劳动的主要形式一一科技文献在内容上存在必然的相关联系。通过引用行为来显示这种内容上的相关联系并进而作出种种推论,是一种独特的途径。尽管关于引用能否从本质上真正揭示出相关,以及引用行为的复杂性等间题,尚有种种的讨论,但在统计的意义上,通过引用分析来反映相关,的确是一种有特色、有价值的方法,其有效性已经被大量实例所证明和肯定。
引用分析的方法主要分为两种,一种是引文检索方法,另一种是引文分析方法。引文索引与主题索引不同,它

利用引用关系追溯发现相关文献,有其独到的效果,使引文检索这一新的检索途径成为一种重要的方法,特别是在科学研究中倍受科学家的重视。引文分析法(Citation Analysis)通过广泛分析、统计各种引用现象,运用某些特定的概念(如“引文耦合”、“同被引”等)多角度、多途径地揭示出科学活动中多种多样的相关关系和相关结构,是一种重要的多功能的分析工具。
引文分析法的特点是:
(1)建立在文献的引用和被引用这一基础上;
(2)一般以某一阀值作为判别相关的尺度,或取某一门限作为相关聚类的控制条件。显然,这种判别相关的尺度与前述检索相关中采用的“符合即相关”的尺度有所不同,我们将这种相关分析称之为“门限相关”。
可以看出,上述检索相关和引用相关两者各有其对象和不同的特点,但两者之间有共同之处,主要表现在:
(1)检索相关和引用相关都是以内容的相关联系为前提和基础的;
(2)检索相关一般涉及到大数量的文献,要从大量文献中找出特定相关的文献;引用相关为了保证具有统计意义的结果,也尽可能以大量的文献为对象。面对数量大、关系交叉错综的分析对象。两者都趋于利用计算机处理。在引文分析法中,建立引文数据库和利用计算机引文分析已成为发展的主流。
检索相关对应的检索理论和方法构成了内容丰富的专门领域,有许多专门书籍介绍,而且具体的检索理论和方法并不属于信息分析方法的范畴。本节不再赘述。引月相关对应的引文分析法则是信息分析中的一种重要方法,因此,下面具体介绍引文分析法如何发挥分析工具的作用。
三、引文分析法的主要应用
引文分析法作为一种有效的、专门的分析工具。其应用范围及发展前景都是很广阔的,从信息分析方法的角度,主要有以下一些方面:
l、学术评估
以被引用统计作为学术水平或价值的评估测度,其对象是广泛的,可以是对某一国家、某一学术机构、某一院校或系的科学能力的评估,也可以是对某一份学术期刊、某一位作者或某一论著的学术水平评估。由此可进行学术水平的分析比较、学科重要性的比较、情报源分析、核心期刊的确定和人才评价等等多方面的具体评估。与其他的评估方法相比较,引文分析法评估的优点是具有量化的形式和结果,客观性较强,说服力较大。但在这种评估分析工作中,要注意引用行为中各种人为因素造成的影响,并且应保证统计样本的容量。
(2)科学结构和模式分析
在现代科学技术条件下,把握科学技术活动的结构已不是一件容易的事,它也是科研管理和科学学关

心的主要问题之一。引文分析法以其独特的分析途径,能够较客观而深入地揭示出科学活动中的多种结构关系,包括科学进展的时序结构、科学交流的网络结构、学科之间的相关结构、研究领域之间的影响结构等等。英国著名情报学家B.C.布鲁克斯认为,引文分析法提供了科学中的“认识地图”,其意义是很大的。
从方法上讲,运用引文分析法进行学术评估比较简单,其中心是统计被引用的频数或次数来反映相对重要程度或水平。科学结构的分析则相对复杂一些,它建立在“引文耦合”、“同被引”等专用概念的基础之上,迸行某种聚类而显示出相应的结构。聚类的结果往往采用图形表达,一般有关联网络图、平面区域图、等高线图等。关联网络图用结点、联线和数字反映结构;平面区域图在二维空间中显示相关构成的小区域;等高线图用等高线表示被引文献的影响范围及其变化。
为此,我们先简要介绍“文献耦合”和“同被引”这两个概念。
文献耦合这一概念首先由美国学者M.M.克斯勒(Kessler)在1963年提出,是指两篇文章在参考文献中都引用了一篇或多篇相同的文献,即它们有共同的引文,因而有时也称之为“同引”。共同的引文起着一种媒介的作用,反映出其之间的相互联系或相关关系。假定文献A和文献B具有某些共同的引文,则它们之间有某种耦合相关关系,并且用共同的引文篇数来表示其拥合相关的程度,称之为引文耦。若A和B有n篇相同的引文一,就有n个引文耦。引文耦越多,说明耦合强度越大。
广义的引文耦合是在以引用作为相关媒介的基础上,将文献耦合的概念加以推广,如将耦合的对象从文献拓展到学科、专业、期刊、著者、机构、语种、国家、时间……等特定的目标上,就可以反映出学科之间、领域之间、期刊之间、学术团体或个人之间、不同时期的文献之间……等不同情况下耦合相关的关系。
同被引这是1973年由美国情报学家H.斯莫尔和前苏联女情报学家I.V.玛莎柯娃分别同时提出的,又称为“同引”,是指两篇(或多篇)文献同时被别的论文所引用,则这两篇(或多篇)文献具有“同被引”的关系,并且以引用它们的论文数量即被引次数表示其相关的程度,称为同被引强度或同被引频率。
将“同被引”的概念推广到文献以外的特定对象上,以同被引作为相关的媒介,可以在学科之间、期刊之间、著者之间……等多方面建立起揭示其复杂关系的结构。
由此可知,运用“引文耦合”、“同被引”等概念进行聚类,能客观地反映科学活动中许多隐蔽的或深层的相关信息,显示出有用的结构,从方法

发展的角度来讲,引文耦合分析进行得早一些,同被引分析应用得晚一些。史密斯在80年代初曾评论说,引文系统和参考书目耦合是60年代引文分析法的技术特征;而同被引分析是70年代引文分析法中许多研究的焦点。
通过科学结构分析,可以深入了解学科发展的历史脉络、科学交流中的特征和规律以及学科间的内在联系,还可以对学科或领域的发展方向和趋势、带头学科和交叉学科的动向、学术团体或个人的学术潜力作出推论和预测,即对科学发展进行动态的预测分析。下面列举数例说明引文分析法的应用。


相关文档
最新文档