引文分析法

引文分析法
引文分析法

引文分析法

除了前面两节介绍的内容分析法,内容相关分析涉及到的另外两个主要的领域是情报检索和引文分析。本节在扼要阐述和比较这两者之后,集中介绍引用相关分析的方法—引文分析法如何进行内容相关分析。

一、检索相关

检索相关是指以情报检索为目的的内容相关分析。可以说,各种情报检索理论和方法都围绕着准确、高效地显示、识别和判断检索对象内容或概念上的相关关系。例如,任何一种检索语言在编制技巧上的一个最重要而又最困难的问题就是如何显示概念之间的相互关系。不能充分显示或未显示概念之间真正的相关关系,就会影响检索语言的缩检扩检功能,发生漏检误检。从相关分析的角度上,可以将查全率理解为相关内容的菠盖程度,将查准率理解为内容真正相关的显示程度。又如,在数据库检索中,发展出了详尽显示概念或内容相关关系的词典,这种词典可以帮助用户揭示相关的主题词从而提高检索效果。美国能源部的一个能源数据库配有约1000页及2.5万个表的词典,能显示出相关的代替词或不同层次的相关词项,如词典在“蒸馏”之下列出的拓宽词为“分离处理”,而缩小词为“干馏”和“真空蒸馏”,还显示出约12个相关的代替词,包括“共沸混合物”、“蒸发”等。

情报检索的相关分析在方法上的特征是:

(1)以标引和标识为基础。由此发展出了多种情报检索语言和查找途径。概念内容是通过标识来显示的;

(2)以标识是否一致或符合作为判断是否相关的判据。我们将这种相关分析称之为“符合相关”,即标识相符时才被看作是相关的,否则为不相关。

二、引用相关

引用相关是指通过科学活动中的引用行为来揭示文献内容之间的相关关系。由于在科学活动中,任何一个人的劳动及其知识产品都不是孤立存在的,而是以前人的劳动为前提和条件的,因此,知识劳动的主要形式一一科技文献在内容上存在必然的相关联系。通过引用行为来显示这种内容上的相关联系并进而作出种种推论,是一种独特的途径。尽管关于引用能否从本质上真正揭示出相关,以及引用行为的复杂性等间题,尚有种种的讨论,但在统计的意义上,通过引用分析来反映相关,的确是一种有特色、有价值的方法,其有效性已经被大量实例所证明和肯定。

引用分析的方法主要分为两种,一种是引文检索方法,另一种是引文分析方法。引文索引与主题索引不同,它利用引用关系追溯发现相关文献,有其独到的效果,使引文检索这一新的检索途径成为一种重要的方法,特别是在科学研究中倍受科学家的重视。引文分析法(Citation Analysis)通过广泛分析、统计各种引用现象,运用某些特定的概念(如“引文耦合”、“同被引”等)多角度、多途径地揭示出科学活动中多种多样的相关关系和相关结构,是一种重要的多功能的分析工具。

引文分析法的特点是:

(1)建立在文献的引用和被引用这一基础上;

(2)一般以某一阀值作为判别相关的尺度,或取某一门限作为相关聚类的控制条件。显然,这种判别相关的尺度与前述检索相关中采用的“符合即相关”的尺度有所不同,我们将这种相关分析称之为“门限相关”。

可以看出,上述检索相关和引用相关两者各有其对象和不同的特点,但两者之间有共同之处,主要表现在:

(1)检索相关和引用相关都是以内容的相关联系为前提和基础的;

(2)检索相关一般涉及到大数量的文献,要从大量文献中找出特定相关的文献;引用相关为了保证具有统计意义的结果,也尽可能以大量的文献为对象。面对数量大、关系交叉错综

的分析对象。两者都趋于利用计算机处理。在引文分析法中,建立引文数据库和利用计算机引文分析已成为发展的主流。

检索相关对应的检索理论和方法构成了内容丰富的专门领域,有许多专门书籍介绍,而且具体的检索理论和方法并不属于信息分析方法的范畴。本节不再赘述。引月相关对应的引文分析法则是信息分析中的一种重要方法,因此,下面具体介绍引文分析法如何发挥分析工具的作用。

三、引文分析法的主要应用

引文分析法作为一种有效的、专门的分析工具。其应用范围及发展前景都是很广阔的,从信息分析方法的角度,主要有以下一些方面:

l、学术评估

以被引用统计作为学术水平或价值的评估测度,其对象是广泛的,可以是对某一国家、某一学术机构、某一院校或系的科学能力的评估,也可以是对某一份学术期刊、某一位作者或某一论著的学术水平评估。由此可进行学术水平的分析比较、学科重要性的比较、情报源分析、核心期刊的确定和人才评价等等多方面的具体评估。与其他的评估方法相比较,引文分析法评估的优点是具有量化的形式和结果,客观性较强,说服力较大。但在这种评估分析工作中,要注意引用行为中各种人为因素造成的影响,并且应保证统计样本的容量。

(2)科学结构和模式分析

在现代科学技术条件下,把握科学技术活动的结构已不是一件容易的事,它也是科研管理和科学学关心的主要问题之一。引文分析法以其独特的分析途径,能够较客观而深入地揭示出科学活动中的多种结构关系,包括科学进展的时序结构、科学交流的网络结构、学科之间的相关结构、研究领域之间的影响结构等等。英国著名情报学家B.C.布鲁克斯认为,引文分析法提供了科学中的“认识地图”,其意义是很大的。

从方法上讲,运用引文分析法进行学术评估比较简单,其中心是统计被引用的频数或次数来反映相对重要程度或水平。科学结构的分析则相对复杂一些,它建立在“引文耦合”、“同被引”等专用概念的基础之上,迸行某种聚类而显示出相应的结构。聚类的结果往往采用图形表达,一般有关联网络图、平面区域图、等高线图等。关联网络图用结点、联线和数字反映结构;平面区域图在二维空间中显示相关构成的小区域;等高线图用等高线表示被引文献的影响范围及其变化。

为此,我们先简要介绍“文献耦合”和“同被引”这两个概念。

文献耦合这一概念首先由美国学者M.M.克斯勒(Kessler)在1963年提出,是指两篇文章在参考文献中都引用了一篇或多篇相同的文献,即它们有共同的引文,因而有时也称之为“同引”。共同的引文起着一种媒介的作用,反映出其之间的相互联系或相关关系。假定文献A 和文献B具有某些共同的引文,则它们之间有某种耦合相关关系,并且用共同的引文篇数来表示其拥合相关的程度,称之为引文耦。若A和B有n篇相同的引文一,就有n个引文耦。引文耦越多,说明耦合强度越大。

广义的引文耦合是在以引用作为相关媒介的基础上,将文献耦合的概念加以推广,如将耦合的对象从文献拓展到学科、专业、期刊、著者、机构、语种、国家、时间……等特定的目标上,就可以反映出学科之间、领域之间、期刊之间、学术团体或个人之间、不同时期的文献之间……等不同情况下耦合相关的关系。

同被引这是1973年由美国情报学家H.斯莫尔和前苏联女情报学家I.V.玛莎柯娃分别同时提出的,又称为“同引”,是指两篇(或多篇)文献同时被别的论文所引用,则这两篇(或多篇)文献具有“同被引”的关系,并且以引用它们的论文数量即被引次数表示其相关的程度,称为同被引强度或同被引频率。

将“同被引”的概念推广到文献以外的特定对象上,以同被引作为相关的媒介,可以在

资料分析的方法

资料分析的方法 一、社会科学的研究步骤 在每一个环节都需要理论的指导。其中,在检验研究假设结束之后,需要与现有的文献对话,再次发现新问题,开始新一轮的研究过程。在这个环节之中,资料分析作为重要一环,对于社会科学的研究极为重要。 二、资料分析的方式分类 教育研究包含多样化的研究方法及分类。一般情况下,按照认识论基础,研究方法可以分为定量研究、定性研究和混合研究。 也有部分学者按照研究目的、手段等对研究方法进行分类。比如别敦荣和彭阳红将研究方法分为:理论思辨、经验总结、历史研究、调查研究、比较研究、数学分析、质的研究和个案研究; 在国内,根据刘良华对研究方法的分类大体上有三个基本类型:实证研究(量化的、质化的)、思辨研究(又称理论研究)、实践研究(常以教育对策、教育反思、教育改革形式显现)。实证研究是基于“事实”的方式进行论证并有规范的研究设计和研究报告。 陈向明指出,“研究方法”一般包含三个层面:第一,方法论,即指导研究的思想体系,其中包括基本的理论假定、原则、研究逻辑和思路等;第二,研究方法或方式,即贯穿于研究全过程的程序与操作方式;第三,具体的技术和技巧,即在研究的某一阶段使用的具体工具、手段和技巧等。 文中所采取的分类是按照陈向明定义中的第三个层面为标准进行的分类。在实际的研究过程中大多数时候是以一种研究方法为主,其他为辅,交叉使用的。以下内容是介绍每一种具体的方式。 那么资料搜集上来了?该如何分析呢? 三、具体的资料分析方式 1思辨分析 (1)历史研究方法 历史研究法是运用历史资料,按照历史发展的顺序对过去事件进行研究的方法。亦称纵向研究法,是比较研究法的一种形式。在政治学领域中,它着重对以往的政治制度、政治思想、政治文化等的研究。 历史研究的目的在于解决政治制度的现状及其演变趋向。但不是断章取义地分析政治制度的现状,而是系统地研究它们以往的发展及其变迁的原因。历史研究法主要是研究政治制度的发展历史,从各种事件的关系中找到因果线索,演绎出造成制度现状的原因,推测该制度未来的变化。

引文分析法

引文分析法 除了前面两节介绍的内容分析法,内容相关分析涉及到的另外两个主要的领域是情报检索和引文分析。本节在扼要阐述和比较这两者之后,集中介绍引用相关分析的方法—引文分析法如何进行内容相关分析。 一、检索相关 检索相关是指以情报检索为目的的内容相关分析。可以说,各种情报检索理论和方法都围绕着准确、高效地显示、识别和判断检索对象内容或概念上的相关关系。例如,任何一种检索语言在编制技巧上的一个最重要而又最困难的问题就是如何显示概念之间的相互关系。不能充分显示或未显示概念之间真正的相关关系,就会影响检索语言的缩检扩检功能,发生漏检误检。从相关分析的角度上,可以将查全率理解为相关内容的菠盖程度,将查准率理解为内容真正相关的显示程度。又如,在数据库检索中,发展出了详尽显示概念或内容相关关系的词典,这种词典可以帮助用户揭示相关的主题词从而提高检索效果。美国能源部的一个能源数据库配有约1000页及2.5万个表的词典,能显示出相关的代替词或不同层次的相关词项,如词典在“蒸馏”之下列出的拓宽词为“分离处理”,而缩小词为“干馏”和“真空蒸馏”,还显示出约12个相关的代替词,包括“共沸混合物”、“蒸发”等。 情报检索的相关分析在方法上的特征是: (1)以标引和标识为基础。由此发展出了多种情报检索语言和查找途径。概念内容是通过标识来显示的; (2)以标识是否一致或符合作为判断是否相关的判据。我们将这种相关分析称之为“符合相关”,即标识相符时才被看作是相关的,否则为不相关。 二、引用相关 引用相关是指通过科学活动中的引用行为来揭示文献内容之间的相关关系。由于在科学活动中,任何一个人的劳动及其知识产品都不是孤立存在的,而是以前人的劳动为前提和条件的,因此,知识劳动的主要形式一一科技文献在内容上存在必然的相关联系。通过引用行为来显示这种内容上的相关联系并进而作出种种推论,是一种独特的途径。尽管关于引用能否从本质上真正揭示出相关,以及引用行为的复杂性等间题,尚有种种的讨论,但在统计的意义上,通过引用分析来反映相关,的确是一种有特色、有价值的方法,其有效性已经被大量实例所证明和肯定。 引用分析的方法主要分为两种,一种是引文检索方法,另一种是引文分析方法。引文索引与主题索引不同,它利用引用关系追溯发现相关文献,有其独到的效果,使引文检索这一新的检索途径成为一种重要的方法,特别是在科学研究中倍受科学家的重视。引文分析法(Citation Analysis)通过广泛分析、统计各种引用现象,运用某些特定的概念(如“引文耦合”、“同被引”等)多角度、多途径地揭示出科学活动中多种多样的相关关系和相关结构,是一种重要的多功能的分析工具。 引文分析法的特点是: (1)建立在文献的引用和被引用这一基础上; (2)一般以某一阀值作为判别相关的尺度,或取某一门限作为相关聚类的控制条件。显然,这种判别相关的尺度与前述检索相关中采用的“符合即相关”的尺度有所不同,我们将这种相关分析称之为“门限相关”。 可以看出,上述检索相关和引用相关两者各有其对象和不同的特点,但两者之间有共同之处,主要表现在: (1)检索相关和引用相关都是以内容的相关联系为前提和基础的; (2)检索相关一般涉及到大数量的文献,要从大量文献中找出特定相关的文献;引用相关为了保证具有统计意义的结果,也尽可能以大量的文献为对象。面对数量大、关系交叉错综

医学统计学分析基本思路指南

医学统计学分析基本思路指南 医学统计学的学习一定要以理解为主。对于初学者,不必强记一大堆的公式,也不要死钻牛角尖,非要弄明白为什么这种方法叫“t检验”、“F检验”,为什么这个残差叫做“学生化残差”等等。这些都是历史遗留问题,感兴趣的读者可以查阅统计学史。对于只想应用的人来讲,你只要了解在什么情况下应该用什么方法,什么指标应该用于什么情形。尽管多数统计教材都说了数据分析应该先做假设检验,然后选定统计量,然后怎么怎么。但实际中我们拿到一堆数据的时候,不会坐在桌上先列出零假设和备择假设,也不会满座子地计算统计量。 更实际的分析思路是: (1)先确定研究目的,根据研究目的选择方法。不同研究目的采用的统计方法不同,常见的研究目的主要有三类:一是差异性研究,即比较组间均数、率等的差异,可用的方法有t检验、方差分析、χ2检验、非参数检验等。二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析。三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、Cox回归等。 (2)明确数据您身边的论文好秘书:您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表,扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书类型,根据数据类型进一步确定方法。不同数据类型采用的统计方法也不同。定量资料可用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。 (3)选定统计方法后,需要利用统计软件具体实现统计分析过程。SAS中,不同的统计方法对应不同的命令,只要方法选定,便可通过对应的命令辅之以相应的选项实现统计结果的输出。 (4)统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果,需要从中选择自己需要的部分,并做出统计学结论。但统计学结论不同于专业结论,最终还需要结合实际做出合理专业结论。下面是本人简单总结的常用方法的选择,可供读者参考。

网络分析方法在引文分析中的整合研究

网络分析方法在引文分析中的整合研究 宋歌 摘要随着社会网络分析在各学科领域的不断渗透,复杂网络理论的兴起和可视化技术的进步,引文分析面临着研究范式从个体主义到整体主义的转变,研究方法从统计分析到网络分析的融合。本文通过对引文网络形成过程和本质属性的探究,以及对网络分析方法理论前提和分析原理的考察,探索网络分析方法在引文分析中的整合途径。具体包括测度引文网络整体结构特性,探究网络结构的形成机制和演化过程,分析引文网络的细分结构、可视化引文分析过程与结果等方面的整合。图1。表2。参考文献28。 关键词网络分析方法社会网络分析复杂网络理论引文分析整合研究 分类号G350 ABSTRACT With the penetrating of social network analysis into more and more disciplines,the rising of complex network theory and the development of visualization,citation analysis is undergoing tremendous changes,including research paradigm change from methodological individualism to holism,research method change from statistical analysis to network analysis.By detecting the forming mechanism and the essential attributes of citation network and by investigating the theoretical premises and principles of network analysis,the paper explores the ways to integrating the network analysis methods for citation analysis,such as measuring the whole structure properties of citation network,inquiring the formation mechanism and evolution process of network structure,analyzing the subdivision structure of citation network,visualizing the procedure and results of citation analysis and etc.1fig.2tabs.28refs. KEY WORDS Network analysis methods.Social network analysis.Complex network theory.Citation analysis.Integration research. CLASS NUMBER G350 1引言 网络分析方法指主要以图论为数理基础的一种结构主义视角下的量化分析,包括社会网络分析(Social network analysis)和复杂网络理论(Complex network theory)。这两种理论与方法都源自社会学领域,然而因论证小世界理论而引爆物理学界复杂网络研究热潮的邓肯·瓦茨(Duncan J.Watts)却钟情于社会网络分析[1],物理学界则另起炉灶,与社会网络研究分道扬镳。随着两种理论的日臻完善和对自然与社会现象的深入揭示,同根共源的两种理论势必在一些研究领域不期而遇。笔者发现,它们由于研究对象不同所形成的各具特色的研究方法,正好可以融合于对引文网络的研究中。持此观点的还有大连理工大学的WISE实验室,他们认为:“把引文分析、复杂网络和社会网络三种理论与方法统一起来,将可能把科学知识图谱理论与方法提高到一个新的水平。”[2]其中,对于社会网络分析,我国文献计量学界已经作出了积极响应。陈定权[3]认为,我国同被引研究应该引入社会网络分析理论,与国外对比进行改进。岳洪江[4]提到“引文分析只是为分析学科发展提供了一种基础数据,而社会网络分析可以利用这种引文数据揭示引文网络的结构特征,二者的结合可以成为一种有力的分析工具”。韩毅[5]也认为“社会网络分析技术提供的结构划分方法为引文网络分析提供了在簇水平上研究网络结构的可能性”。 理念上的共识基于实践中的探索。从1984年加特雷尔[6](Gattrell)以社会网络分析视角对 106

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

内容分析方法文献研究方法及其比较

内容分析法、文献研究法、文本分析法 内容分析 (1)从字面意义上看,可以是指对研究对象的内容本身进行分析研究,既可以是定量研究,也可以是定性研究。 (2)一般意义上讲,或者是从狭义上讲,主要是指定量分析方法中,对内容和信息的分析。 内容分析方法是一种对文献内容作客观系统的定量分析的专门方法,其目的是弄清或测验文献中本质性的事实和趋势,揭示文献所含有的隐性情报内容,对事物发展做情报预测。它实际上是一种半定量研究方法,其基本做法是把媒介上的文字、非量化的有交流价值的信息转化为定量的数据,建立有意义的类目分解交流内容,并以此来分析信息的某些特征。 内容分析方法原为社会科学家借用自然科学的定量分析的科学方法,对历史文献内容进行内容分析而发展起来的。后来,美国的一些传播学研究者利用这种方法去分析报纸的内容,了解信息发展的倾向,随后,内容分析渐渐扩大到对各类语文传播,如报纸、电视、电影、广播、杂志、书刊、信件、演讲、传单、日记、谈话等等的分析,以及对各类的非语文传播,如音乐、手势、姿势地图、艺术作品等的分析,成为传播学的一种重要的传播手段。 内容能够分析方法的特点: 1、明显的传播内容。被分析的对象应该是以任何形态被记录和保存下来,并具有传播价值的内容。任何形态包括文字记录形态(如报纸、杂志),非文字记录形态(广播、唱片)和影像记录形态(电影)等。同时,明显的传播内容是指它所表现的直接意义,而不是指其包含的潜在动机。内容分析就是通过对直接显示的内容的量化处理来判断其间接的、潜在的动机和成果。 2、客观性。在内容分析的过程中,按照预先制定的分析类目表格进行判断和记录内容出现的客观事实。并根据客观事实再做出分析描述。 3、系统性。这是指内容的判断、记录、分析过程是以特定的表格形式、按一定的程序进行的。 4、量化。指内容分析的结果可以用数字表达,并能用某种数学关系来表示,如用次数分配、各种百分率获比例、相关系数等方法进行描述。 由此可见,内容分析实际上是以预先设计的类目表格为依据,以系统、客观、量化的方式,对信息内容加以归类统计,并根据类别项目的统计数字做出叙述性的说明,它不仅是资料的收集方法,也是一种独立、完整的专门研究方法。 文献研究方法 文献分类: 一次文献:包括图书、期刊、论文、调查报告、会议记录、实验报告,是实践的记录和总结,具有原创性; 二次文献:是由一次文献提炼出来的,如目录、索引、文摘等,在二次文献中,我们不能获得作者的观点,只是为了研究者提供检索的方便,使我们更快的找到想要的东西。 三次文献:在二次文献的基础上检索、筛选、综合分析而成的,如综述与述评。 文献研究的定义:指根据一定的目的,通过搜集和分析文献资料而进行的研究。 文献研究的两种情形: 一、某些课题主要就是通过文献研究来完成的,如中国动漫与日本动漫的比较研究。 二、文献研究在真个课题研究中是作为辅助性的研究方法之一,如实验研究法、调查研究法中的文献研究法。

专利引用分析方法研究

内容摘要:本文研究了专利情报分析中引用分析的理论和方法。并论述了引用 指标、引用关联分析、高被引分析等目前比较重要的新型专利分析方法。在此 基础上,以美国专利数据库为数据源,加密技术作为研究对象,进行了实证研究,得出了对电子商务有用的技术情报信息,为企业的创新和发展提供了决策 支持作用。 关键词:专利情报专利分析引用分析加密技术 目前,随着国际专利案件的增加,专利分析越来越受到人们的重视。专利 分析是对专利情报的合理利用和开发。它的主要工作大都会涉及到所有权问题,因此不太容易在公开的文献中获得。这些分析常常都是在内部进行或者通过合 约约束的方式委托专业公司进行分析服务。此外,在国外的一些专业公司也会 提供有偿的对某一行业的专利分析。虽然专利具有这些所有权问题,但是依然 能够通过有限的专利数据信息分析出潜在的规律和趋势。 长期以来,对于专利的研究多采用的是一些数量指标,然而随着时代的发 展及新技术的出现,专利数量指标在解决一些问题时碰到了困难,因此对专利 质量的研究逐渐兴起。专利质量研究旨在通过内在和外在的质量特征,对于专 利个体进行差异化分析。在研究的过程中,专利引用分析逐渐成为其中最具发 展潜力的研究领域,成为更广意义上的技术和竞争力指标。专利之间的相互引 用与文献之间相互引用非常相似,通过对前后专利之间的引用与被引用关系为 基础,结合适当的方法,对专利间的相互引用现象和规律进行分析,以挖掘出 某一企业或某一行业潜在的趋势和规律的一种专利定量分析方法。 专利引用分析的研究现状 国外的专利分析研究已经比较成熟。首先,随着计算机技术的不断发展, 我们可以通过在线的网络搜寻获得专利信息,也可以通过购买多种多样的数据 库获取。其他的更加具体的专利分析大都是基于某些指标的定量分析方法,如 专利的数量,专利引用数量等等。在这些指标的基础上,根据专利所有人,专 利分类和申报日期等的分割来展示专利地位和趋势。这种专利分析研究已被用 于展示全球发展趋势、某一特定学科的发展趋势或者是对政策分析提供信息。 近些年来,部分研究者开始采用了关联引用的分析以将大量分散的专利进行聚 类处理。某些商业分析工具还能进行基于文本的专利聚类分析。 我国在专利研究方面取得了较大的进展。我国有关单位已提出和开展了 “中国专利引文数据库”的课题。但是相对国外的研究应用而言,我国的研究 还相对比较滞后,研究比较集中于专利文献的分析和理论研究方面,在专利分 析工具方面还未形成一个系统研究,这需要在今后的工作中加以提高。 专利引用分析流程和方法研究 (一)引用分析流程 根据需要,我们将专利引用分析主要分为三个层面:即数据层、分析层和 应用层,见图1。

基于引用内容的引文评价分析

基于引用内容的引文评价分析1) 刘盛博丁堃 (大连理工大学 WISELab,大连 116023) 摘要:本文提出一种基于引文内容的引文评价分析方法,引文的引用内容可以提供一篇引文被引用的详细 信息,包括了这篇引文为什么被引用,在哪些方面被引用以及具体的引用价值,同时,一篇引文在一篇文 献中被引次数可以体现出这篇引文的被引质量,这些引用内容信息在引文评价分析中具有重要意义。本文 从引用性质和引文质量两个角度介绍引用内容在引文评价中的应用。 关键词:引用内容分析;引文评价;引用质量;引用性质 中图分类号:G353 文献标识码:A Citation Evaluation Analysis based on Citation Context Liu Shengbo, Ding Kun (WISELab, Dalian University of Technology, Dalian 116023) Abstract We propose a citation evaluation analysis method based on citation context. Citation context of a reference may provide the detailed cited information about a citation, including cited reasons, cited aspects and cited values. Meanwhile, the citation frequency of a reference in one paper could reflect the citation quality of the reference. These citation contexts could provide important information for citation evaluation. In this paper, we introduce the application of the citation context from two angles, the quality of the citation and the nature of the citation. Keywords Citation context analysis ,Citation evaluation,Citation quality, Citation nature 1 引言 科学计量学家Zunde在1971年指出,引文分析主要有三方面的应用,1)对科学家、出版物和科研机构进行定性与定量评价;2)探析科学技术演化历程;3)情报信息查找与检索[1]。但使用引文分析对论文进行评价时,人们通常只从论文的被引频次角度来分析,最简单的方法是采用论文的总被引频次来评价,而影响因子[2]和H指数[3]方法也是基于文献的被引次数来评价。在引文评价研究中,我国较多学者都对引用频次评价方法进行了改进,纪雪梅等人[4]采用社会网络分析方法中的Bonacich权力指数来对引文进行评价,通过这个指标来判定同一期刊发表文献的质量和影响力。宋歌[5]也提出将社会网络分析方法应用于引文评价,从引文网络的构成、性质、内涵和元认识的角度论证社会网络分析方法在引文分析中的适用性,进而改进传统的引文评价方法,补充评价指标。王向阳和马军[6]借鉴了PageRank 作者简介:刘盛博,男,1983年生,大连理工大学科学学与科技管理专业博士研究生,研究方向为:知识计量。E-mail:liushengbo1121@https://www.360docs.net/doc/123085353.html,。 丁堃,女,1962年生,大连理工大学人文社会科学学院教授,研究方向为:学科知识管理与创新管理。 1本文得到国家自然科学基金(61272370),高等学校学科点专项科研基金(博导类)(20110041110034) 的资助。

文献分析方法(1)

文献研究方法 (收集、整理、分析) 一、文献分析的目的与作用 (一)文献分析的意义 文献分析是获取有关现实和学术研究的真实情况的重要途径。分析某个问题的研究现状,人们也可以运用文献分析法,对主要学术期刊发表的论文进行各种要素的统计和分析,从中获取有关研究者和选题的发展变化情况。 此外,通过分析文献中某特定术语的使用情况,也可以得到一些重要信息,诸如人们对某问题的关注情况和研究进展等。 全面的文献资料调研是研究的基础。一般来说,文献资料调研的数量越多越好,但更重要的是精读10-20篇对自己研究工作具有宝贵参考价值文献,同时泛读几十篇次要文献,并有选择地阅读一般文献的摘要和结论部分。只有在大量文献调研的基础上,才能去伪存真、去粗取精、提纲挈领和推陈出新地开展自己有特色的研究。 (二)文献分析的目的 文献综述要针对某个研究主题,就目前学术界的成果加以研究。文献综述旨在整合此研究主题的特定领域中已被思考过和研究过的信息,并将此议题上的权威学者所做的努力进行系统的展现、归纳和评述。 在决定研究目的之前,通常必须关注的问题是:研究所属的领域或其他领域对此问题已知多少;已完成的研究有哪些;以往的建议与

对策是否成功,有无建议新的研究方向和议题。 许多研究者并不考虑这些问题,就直接进行文献探讨,将在短时间内找到的现有文献做简略引述或归纳,也不做批判,甚至与论文研究的可行性、必要性也无关。 张丽华等(2004)认为,文献综述至少可达到的基本目的有①: ●让读者熟悉现有研究主题领域有关研究的进展与困境; ●提供后续研究者的思考; ●未来研究是否可以找到更有意义、更显著的结果; ●对各种理论的立场说明,可以提出不同的概念框架; ●作为新假设提出研究理念的基础,对某现象和行为进行可能 的解释,识别概念间的前提假设; ●改进与批判现有研究的不足,推出另类研究,发掘新的研究 方法和途径,验证其他相关研究。 具体来讲,文献分析的目的在于: 彰显对某一知识体系的熟悉程度,使他人能够对研究者的专业能力与知识背景做出判断,以取得他人的信任,说服读者。 显示过去的研究路线以及正在进行的研究与以往研究工作的关联性,找有价值的主题。 整合并摘要某个领域内已知的研究成果,使人们认识到未来可能出现的研究方向,找“巨人的肩膀”。 向他人学习并刺激新概念的产生,指出盲点。 ①张丽华等:《撰写文献综述的技巧与方法》,《学位与研究生教育》2004年第一期。 (三)文献分析的作用

引文分析

引文分析 引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。引文分析方法的数学基础是概率论与数理统计。 引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。引文分析方法的数学基础是概率论与数理统计。在进行分析比较时,已将其作用排除在测度结果之外了。 科技文献的引证与其被引证现象进行研究的过程。使用的方法有图论、模糊集合、数理统计等数学方法和逻辑思维方法,目的在于揭示文献所蕴含的情报特征和相关关系。 现代科学论文的一个重要特征是,在“参考文献”标志下依序列出所援引文献的著录事项。参考文献 (被引用文献)与正文(引用文献) 的简单逻辑关系就是引文分析的基础和背景。致力于引文分析理论和技术研究的文献学家主要有格罗斯、.布朗等。普赖斯于1956年发表重要著作《科学论文的网络》,为引文分析奠定理论基础,E.加菲尔德于1953年受法律业务工具书《谢泼德引文》的启发,于1961~1963编成《科学引文索引》(SCI),使引文分析具备了实用的工具。 引文分析适于探索科学的微观结构,便于超越时间空间,跨学科组织文献,同传统的分类法和主题法截然不同,使文献有序化,有利于对文献由表及里地深入展开分析,更易于量化。 引文分析中还有一些辅助概念,运用也较普遍:①文献耦合。一篇参考文献被两篇文献引用便构成一个引文偶,引文偶愈多,说明两篇文献关系愈密切。②同被引。两篇论文共同被后来的一篇或多篇论文所引用的现象,其量度是同被引强度,即两篇(或多篇)文献同被后来的文献所引用的频次,显然,同被引频次愈高,两篇论文相关性愈强。③自引。作者引用自己以前发表的独撰与合撰论文的现象,自引还可以扩展到杂志、学科、地区、团体乃至国家对文献的反身自用。 引文分析主要用于指导编制各种新型检索工具,为科学管理提供量化的依据,探讨科学的结构,评价与选择期刊,考察科学著作及科学家

专利引用分析方法研究_1

专利引用分析方法研究 内容摘要:本文研究了专利情报分析中引用分析的理论和方法。并论述 了引用指标、引用关联分析、高被引分析等目前比较重要的新型专利分析方法。在此 基础上,以美国专利数据库为数据源,加密技术作为研究对象,进行了实证研究,得出了对电子商务有用的技术情报信息,为 企业的创新和发展提供了决策支持作用。 关键词:专利情报专利分析引用分析加密技术 目前,随着国际专利案件的增加,专利分析越来越受到人们的重视。专利分析是对专利情报的合理利用和开发。它的主要工作大都会涉及到所有权问题,因此不太容易在公开的文献中获得。这些分析常常都是在内部进行或者通过合约约束的方式委托 专业公司进行分析服务。此外,在国外的一些专业公司也会提供有偿的对某一行业的 专利分析。虽然专利具有这些所有权问题,

但是依然能够通过有限的专利数据信息分 析出潜在的规律和趋势。 长期以来,对于专利的研究多采用的是一些数量指标,然而随着时代的发展及新技术的出现,专利数量指标在解决一些问题时碰到了困难,因此对专利质量的研究逐渐兴起。专利质量研究旨在通过内在和外在的质量特征,对于专利个体进行差异化分析。在研究的过程中,专利引用分析逐渐成为其中最具发展潜力的研究领域,成为更广意义上的技术和竞争力指标。专利之间的相互引用与文献之间相互引用非常相似,通过对前后专利之间的引用与被引用关系为基础,结合适当的方法,对专利间的相互引用现象和规律进行分析,以挖掘出某一企业或某一行业潜在的趋势和规律的一种专利定量分析 方法。 专利引用分析的研究现状 国外的专利分析研究已经比较成熟。首先,随着计算机技术的不断发展,我们可以通过在线的网络搜寻获得专利信息,也可以通过购买多种多样的数据库获取。其他

引文分析法的定义及其作用

龙源期刊网 https://www.360docs.net/doc/123085353.html, 引文分析法的定义及其作用 作者:李凤智 来源:《科技资讯》2015年第10期 摘要:本文在介绍当前发展趋势的基础之上,对引文分析的历史做了简要的回顾,对引 文以及引文分析法的定义做了相关的描述,并从评价核心期刊,研究老化规律,评价人才,评估组织,研究趋势等五个方面对引文分析法的作用作了简要的阐述,从各个方面对引文分析的作用有一个相对清晰的认识。引文分析在图书馆学情报学等各个学科中都有很广泛的运用,本文希望在对引文分析简要介绍的基础上,使读者对引文分析法有一个相对深入的认识,以此来促进引文分析法的发展。 关键词:引文分析评价作用促进发展 中图分类号:G64文献标识码:A 文章编号:1672-3791(2015)04(a)-0000-00 1前言 引文分析法作为信息计量学的一种基本的方法在学术研究的各个方面都进行着广泛的应用,并且随着技术的进步,也得到了更进一步的发展。引文分析法起源与国外。普赖斯于1956 年发表的著作《科学论文的网络》为引文分析奠定了理论基础。 Henry Small 于1973 年提出了以文献为单位的共引分析。 Howard D, White 于 1981 年把同被引概念扩展到著者,对著者进行同被引分析,以此来反映科学的知识结构,研究科学交流的模式。[1]这些都为引文 分析发奠定了基础。随着时代的发展,引文分析法也跟随时代发展的潮流,有了进一步的发展与更广阔的应用。 2引文分析法的相关定义 2.1引文 “引文”通常指文献结尾处的参考文献,不含脚注、间注、夹注等,现有的文献引文分析工具也不提供脚注、间注、夹注的查询。[2] 2.2引文分析法 引文分析(Citation Analysis)就是利用各种数学、统计学以及逻辑方法中的归纳、比较等方法,对科学期刊、论文、著者等分析对象之间的各种关联和相关关系进行分析研究,以便 揭示其数量特征和对象间内在的规律的一种文献计量分析方法。[3] 引文分析法是科学评价中的定量分析的方法,通过建立科学计量学指标体系来实现对论文质量和学术影响力的评价。[4]引文分析就是这样一种基于文献之间引用与被引用的线性关系

医学统计方法小结

统计方法小结 首次分享者:yanyan已被分享22次评论(0)复制链接分享转载删除 一、两组或多组计量资料的比较 1.两组资料: 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性,则作成组t检验 (2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料: 1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。 2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。 二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料: (1)小样本时:用二项分布进行确切概率法检验; (2)大样本时:用U检验。 2)多分类资料:用Pearson c2检验(又称拟合优度检验)。 2. 四格表资料 1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数<1,则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2 (2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4. R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量,

引文分析可视化现状

收稿日期:2010-08-10 修回日期:2010-09-02 作者简介:鲁 超(1987-),女,硕士研究生,研究方向为学科情报;刘 清(1969-),男,研究员,硕士生导师,研究方向为情报学理论与方法。 引文分析可视化现状 Current Sit uation of C itation Analysis V is ualization 鲁 超 刘 清 (中国科学院武汉文献情报中心 武汉 430071) 摘 要 对可视化技术、引文分析理论进行了介绍,按照引文分析内容将引文分析划分为引文描述性统计分析、引文线性关系分析、引文有向链接分析三种类型。从时间序列和地理信息两个角度对引文分析可视化研究现状进行归纳梳理,总结出引文分析可视化研究中存在着可视化结果判读正确性、中文引文分析可视化研究不足、引文分析可视化结果的质量评价等问题。 关键词 引文分析 可视化 时间序列 地理信息 中图分类号 G 350 文献标识码 A 文章编号 1002-1965(2010)11-0048-05 可视化技术指的是运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术 [1] 。可视化技术包 含了科学计算可视化(V isua li zati on in Sci entific Co m put i ng)、信息可视化(I nfor m ati on V isua lizati on)、知识可视化(K no w ledge V isualization)、数据可视化(D ata V isualization)。可视化技术最早运用于计算科学中,1987年美国国家科学基金会(N SF )的研究报告 科学计算中的可视化 [2] 被视为科学可视化领域诞生的标志。科学可视化是基于物理世界、自然科学中的数据,它把通过测量获得的数据、图像或是计算中产生的数据变为直观的,可以用图像信息表示,将时间或空间上的变化展示在研究者面前。1989年出现了!信息可视化?的概念,并逐步成为与科学可视化并肩的领域。可视化技术尤其是信息可视化技术和知识可视化技术的研究与应用正在逐步扩大。 信息可视化在图书情报领域有着广泛的应用,它的一个重要分支就是引文分析可视化。由于引文分析处理的是大量的抽象数据,使用具有形象、直观等诸多优势的信息可视化方法来进行引文分析,可以使引文分析的内容以一种更加直观的方式表现出现,促进引文分析相关研究的发展。 可视化技术的一系列算法也应用到了引文分析领域,H o ward D.Wh ite 等人用SOM 算法实现了作者共引聚类和概念聚类分析的网络图;Chao m ei Chen 等使用PF NET 算法实现了对作者同被引的分析,生成同被引图 [3] 。1998年,荷兰的诺洋斯(E.C.Noyons)和冯苑 (A .van R aan)开发了一套用于文献计量图谱的算法, 通过对比自组织文献作品的关键词,分析作品间的相似性 [4] 。 1 引文分析概况 科学文献并不是孤立的,而是彼此间有着各种各样的联系,这些联系体现在科学文献间的相互引证方面,从而形成了科学知识的交流 [5] 。科学文献之间的 相互引证关系是引文分析的主要依据和内容。 1.1 引文分析的基本理论 引文分析思想最初开始于法学领域,普赖斯的著作 科学论文的网络 为引文分析奠定了理论基础。引文分析的研究对象是科学期刊、文献、著者及其之间的相互关系,可以从期刊、文献、作者、关键词等多个角度进行研究。把文献作为研究对象和切入点的共引分析 [6] 方法是把科学结构图示 作为一种手段,以此来验证方法的有效性,同时又实现了对学科及其相互关系的猜测和印证。共引(同引)是指当两篇文献被一篇(后来发表的)文献同时参考引用时,这两篇文献之间的关系。H o w ard D ,W hite 把同被引概念扩展到著者,对著者进行同被引分析 [7] , 研究著者间合作与交流情况及著者学科思想、学科领域的相似性。在此之后,共引概念被推广到很多与文献相关的特征对象上,形成各种类型的共引概念,词的共引、文献共引、期刊共引、主题共引和类的共引等 [8] , 以此研究引文分析对象间的相似性,探讨文献、著者、主题、学科领域间的关系。共现分析是以某种研究要素同时出现两个或两个以上为前提进行的分析,以邻近联系法则、知识结构及映射为方法论基础,来发现研究对象之间的亲疏关系,挖掘隐含的或潜在的有用的 第29卷 第11期2010年11月 情 报 杂 志 J OUR NAL OF I NTELL I GENCE V o.l 29 N o .11N ov . 2010

医学统计学各种资料比较_选择方法小结

医学统计学各种资料比较选择方法小结 一、两组或多组计量资料的比较 1.两组资料: 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性,则作成组t检验 (2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料: 1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。 2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。 二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料: (1)小样本时:用二项分布进行确切概率法检验; (2)大样本时:用U检验。

2)多分类资料:用Pearson c2检验(又称拟合优度检验)。 2. 四格表资料 1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验 3)n£40或存在理论数<1,则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2 (2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验 4. R×C表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析

医学统计工作基本步骤(详细)

*医学统计工作的基本步骤 1设计主要指统计设计,是影响研究能否成功的最关键环节,是提高观察或实验质量的重要保证。内容包括对资料搜集,整顿和分析全过程的设想与安排。实验设计的三大原则:随机化,重复,对照。 2搜集资料:目的指应采取措施使能取得准确可靠的原始数据。来源:统计报表,工作记录,专题调查或实验研究,统计年鉴和统计数据专辑。要求:随机性和样本含量足够大 3整顿资料:将原始数据净化,系统化和条理化,为下一步计算和分析打好基础过程。 4分析资料:在表达数据特征的基础上,阐明事物的内在联系和规律性,包括两方面:统计描叙和统计推断 17均数的可信区间与参考值范围的区别?均数的可信区间与参考值范围的区别主要体现在含义,计算公式和用途三个方面的不同。(1)意义:均数的可信区间是按预先给定的概率,确定的未知参数的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:该区间可多大(如当a=0.05时为95%)的可能包含了总体均数。而参考值范围是指‘正常人’的解剖,生理生化某项指标的波动范围。均数的可信区间计算公式(1)σ未知:X±指均数可信区间的用途:估计总体均数,参考值范围是指判断观察对象的某项指标是否正常。 7.假设检验与区间估计的关系:置信区间具有假设检验的主要功能;置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义;假设检验可以报告确切的P值,还可以对检验的功效做出估计。 1.标准差与标准误的区别:标准差是衡量观察值的离散趋势,描述正态分布资料的频数。标准误是样本均数的变异程度,表示抽样误差的大小,用于总体均数区间估计。两者联系:两者都是变异指标。在样本含量一定时,S越大标准误也越大,即在抽取相同例数的前提下,标准差越大,抽到的样本均数的抽样误差也越大。 2.P值和α:P值时从样本求得H0条件下随机抽样得到目前的统计量以及更极端统计量的概率,反映样本信息是否支持H0,也反映做出拒绝或不拒绝H0决定的理由充分程度。α时人为确定的小概率,容许犯第二类错误的概率,用作门槛,称检验水平。在假设检验中,通常时将P与α对比来得到结论,。 3.标准正态分布与t分布有何不同:t分布为抽样分布,标准正态分布为理论分布。t分布比标准正态分布的峰值低,且尾部瞧得更高。随着自由度的增大,t分布逐渐趋于标准正态分布。当自由度趋于无穷大时,t分布趋近于标准正态分布。 4.假设检验中,当P<0.05时,拒绝H0的理论依据。P值是指从H0规定的总体随机抽得等于及大于现有样本获得的检验统计量值的概率。当P<0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小怪绿时间标准的0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现在样本信息不支持H0,所以怀疑原假设H0不成立,拒绝H0。 5.t检验应用的条件:对单样本t检验要求资料服从正态分布;配对t检验要求差值服从正态分布;对两样本t检验则要求数据均服从正太分布,且两样本对应的两总体方差相等。 6.I型错误和Ⅱ型错误得区别与联系:I型错误是指拒绝了实际成立的H0所犯的弃真的错误,其概率大小用α表示,Ⅱ型错误是指接受了实际上不成立的H0所犯的取伪错误,其概率用β表示。当样本含量N确定时,α越小β越大,反之,α越大β越小。了解这两类错误的实际意义在于,若在应用中要重点减少α,则取α=0.05;若要在应用中要重点减少β,则取α=0.10或-。20甚至更高。 7.假设检验和区间估计有何联系:假设检验用于推断质的不同即判断两个或多个总体参数是否不等,而可信区间用于说明量的大小即推断总体参数的范围。两者有联系也有区别,假设检验与区间估计的联系在于可信区间也可以回答假设检验的问题,若算得的可信区间若包含了H0,则按α水准,不拒绝H0,若不包含H0,则按照α水准,拒绝H0,接受H1。也就是说在判断两个总体参数不等时,假设检验和可信区间时完全等价的。 1.方差分析的基本思想和应用条件是什么。方差分析的基本思想时根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的编译可由某个因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。应用条件:各样本是互相独立的随机样本,均服从正态分布;相互比较的各样本的具有方差齐性。

相关文档
最新文档