信息检索复习整理

信息检索复习整理
信息检索复习整理

一、什么是信息(Information)?

在西方英文中information一词有情报、资料、消息、报道之意,我国大陆曾译为情报或信息,后经国家有关部门核准,统一译成“信息”。在我国台湾、香港地区,该词被译为“资讯”。

信息是被反映物的属性再现,信息的属性在于表现它物。也就是说,信息不是事物的本身,而是由事物发出的消息、情报、指令、数据、信号中所包含的内容,是对客观世界中各种事物发出的特征、变化及其相互联系的最新反映。一切事物包括自然界和人类社会都会产生信息。一个完整的信息过程,包括信息的传递、接收、贮存、加工和利用。

2、信息具有以下特征:

1)普遍性

(2)时效性:信息在一定的时间内是有效的信息,在此时间之外就是无效信息。而且任何信息从信源传播到信宿都需要经过一定的时间,都有其时滞性。

(3)传递性

(4)可转换性:信息是可以由一种形态转换成另一种形态。信息一般有4种形态:数据、文本、声音、图像。这4种形态可以相互转化,例如,照片被传送到计算机,就把v图像转化成了数字。

(5)可再生性

(6)共享性:同一信源可以供给多个信宿,因此信息是可以共享的,且不因共享而减少(7)可识别性:信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别。不同的信息源有不同的识别方法。(8)可存储性:信息是可以通过各种方法存储的。

二、信息检索

广义:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程。

狭义:仅仅指信息查找的过程。即取的环节。

三、信息检索的发展

1、第一阶段:完全手工检索阶段

2、第二阶段:半机械检索系统-机电、光电检索系统的发展阶段

3、第三阶段:计算机检索系统的发展阶段

4、第四阶段:基于Internet 的网络化检索系统阶段

信息资源的分类:

1、信息源可分为自然信息源和社会信息源。

2、按信息资源所依附的载体划分(不用全背)

(1)体裁信息资源:以人体为载体并能为他人识别的信息资源。按其表述方式又可分为口语信息源和体语信息源。口语信息源是人类以口头方式表述但未被记录下来的口语信息,如:谈话、讲课、讲演、讨论、唱歌等。体语信息源是以人的体态为载体表述出来的信息资源,如:表情、手势、姿态等方式表述的体语信息。

(2)实物信息资源:以实物为载体的信息资源。又分为自然实物信息源与人工实物信息源。如:化石、产品、样品等。

(3)文献信息资源:以文字、图形、符号、声频、视频等发生记录在各种载体上的知识和信息资源。

(4)网络信息资源:以网络为纽带连接起来的信息资源和以网络为主要交流、传递、存储

的手段与形式的信息资源。

3、按信息资源传递的范围划分:

(1)公开信息资源:又称共享信息资源或白色信息资源(white information),指公开发行、流通和传递的信息资源,其蕴涵的信息人人可以使用。一般来说,公开信息资源的数量最大,而且能够作为信息商品进行流通领域。

(2)半公开信息资源:又称灰色信息资源(grey information),指非公开发行、流通和传递,从常规途径难以获取的信息(内部信息)。这类信息出版量小,发行渠道复杂,流通传递范围有限,不易收集。例如:内部的刊物、技术报告、会议资料等。

(3)非公开信息资源:又称黑色信息资源(black information),指人们未破译或未被识别的,也指处于保密状态的信息。例如:考古发现的古老文字、未解密的政府文件、内部档案、个人日记、私人信件等。

自然信息均属于不可检信息。

超文本型(Hypertext):是用超链结的方法,将各种不同空间的文字信息组织在一起的网状文本。

文献信息资源1、按信息资源所依附的载体的物质形态划分

(1)刻写型:包括手稿、日记、信件、原始档案、碑刻等。

(2)印刷型:主要是指以纸张为载体,以印刷为记录手段,把信息内容固化在纸张上的形式。其优点是便于直接阅读、使用方便,其缺点是较笨重、存储密度低、收藏占用空间大、加工保存等花费人力物力大、识别和提取难以实现机械化和自动化。

(3)缩微型:以感光材料为载体,以缩微照相为记录手段而产生的一种载体形式,如缩微胶卷、缩微胶片等。其优点是存储密度较大、体积小、便于收藏保存和远距离传递。缺点是不能直接阅读、需借助缩微阅读机或阅读复印机才能使用。

缩微型一般针对于数量大、利用率低但又有较大保存和利用价值的信息资源。(4)声像型:以磁性和感光材料为载体,借助特殊的机械装置(如复录机、摄像机、录像机等)直接记录声音、图像信号的信息载体,又称视听资料,如唱片、录音带、录像带、幻灯片、电影片、多媒体资料等。

其优点是可以闻其声、观其形,直观而真切,给人以生动鲜明的印象。其缺点是制造成本较高,且需要借助于一定的设备才能使用。

2、按信息资源的加工深度和结构等级划分

(1)零次文献:指未经过任何加工的原始文献。如:实验记录、手稿、日记、原始录音、原始录像、谈话记录。

(2)一次文献:未经加工或粗略加工的原始信息资源,以本人的研究成果为基本素材而创作的文献,具体、详尽和系统化。如期刊论文、专利文献、科技报告、会议录、学位论文等等。

(3)二次文献:它是将大量分散、零乱、无序的一次文献进行进行加工、整理、标引、著录、浓缩,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。如:目录、题录、索引、文摘。具有报道和检索功能。

(4)三次文献:通过二次信息资源提供的线索,对某一范围内的一次信息资源进行分析、研究、加工而成的信息资源,它包括综述、述评、专题情报研究报告、百科全书、年鉴、

指南、手册、词典等。

特点:

一次文献是最重要的文献,是全部文献的基础。数量庞大、内容分散、无系统性,不便于管理和传播。

二次文献作为寻找一次文献的指南与向导,能提供多种检索途径(分类、主题、著者、团体著者、会议名称等)。

三次文献可以充分利用反映某一领域研究动态的综述类文献信息,在短时间内了解其历史、动态、水平等。

一次文献是二次文献和三次文献的基础,是文献检索的主要对象;二次文献具有浓缩性,是一次文献的简略及有序化,是文献检索的工具;三次文献具有综合性,既是检索对象,又可提供一定的检索途径与检索手段。

总之,文献经过加工、压缩,从零次信息到三次信息,使科技信息由分散到集中,由无序到有序,由无组织到系统化,由博而精的对知识信息进行不同层次的加工的过程。

信息的不同出版类型划分为:

图书期刊科技报告会议文献[C]论题集中、新颖、丰富、专深、学术性强,是了解各国科技发展水平和动向的重要文献来源。

(5)专利文献[P]:(6)技术标准和规范[S]:7)政府出版物(8)学位论文[D]:

(9)产品资料(10)技术档案(11)报纸[N]

3)科技报告[R] (理解)scientific and technical report :报道(记录)研究工作和开发调查工作的成果或进展情况的一种文献类型。又称研究报告、报告文献。出现于20世纪初,第二次世界大战后迅速发展,成为科技文献中的一大门类。大多与政府的研究活动、国防及尖端科技领域有关,发表及时,课题专深,内容新颖、成熟,数据完整,且注重报道进行中的科研工作,是一种重要的信息源。查寻科技报告有专门的检索工具。

特点:①反映新的科研成果迅速。以科技报告形式反映科研成果比这些成果在期刊上发表,一般要早一年左右,有的则不在期刊上发表。②内容多样化。它几乎涉及整个科学、技术领域和社会科学、行为科学以及部分人文科学领域。③保密性。大量科技报告都与政府的研究活动、高新技术有关,使用范围控制较严。④报告质量参差不齐。大部分科技报告是合同研究计划的产物,由工程技术人员编写,由于撰写受时间限制、因保密需要以工作文件形式出现等因素影响,使报告的质量相差很大。⑤每份报告自成一册,装订简单,一般都有连续编号,出版发行不规则。通常载有主持单位、报告撰写者、密级、报告号、研究项目号和合同号等。

附:美国四大科技报告(AD,PB,NASA ,DOE )

按检索对象的内容区分:

(1)文献检索(document retrieval)

(2)数据检索(data retrieval)

(3)事实检索(fact retrieval)

手工检索:以手工操作的方式,利用检索工具书进行信息检索。手工信息检索是信息检索的传统方式,已经历经了一个多世纪的发展历程。

检索效率高;直接性灵活性好,浏览功能差

附:查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度。

查全率=(检出相关文献量/系统中相关文献总量)*100%

查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度。

查准率=(检出相关文献量/检出文献总量)*100%

三、按检索对象区分:

(1)文本检索:查找含有特定信息的文本文献的检索,其结果是以文本形式反映特信息反映的文献。这是一种传统的信息检索类型,在信息检索中至今占据主要地位。

(2)多媒体检索:多媒体是指将声音、图像、通信等在内的多种媒体的功能有机结合在一起,并用某种新媒体代替传统媒体的多种媒体。

多媒体检索是指根据用户的需求,对文字、声音、图像、图形等多种媒体信息进行组织、存储从而识别、查找并获取所需信息的过程。

在因特网上存在着大量的多媒体文献,用户常常需要查找特定的声音、图像、动画等。多媒体文献的信息组织与处理传统文本的处理截然不同,其检索要求和检索途径也别具特色,这是现代信息检索的新课题。

(3)超媒体检索(hyper media retrieval)

如果超文本节点中的信息除文本块以外,还有图形、图像、声音、视频等多媒体信息,则称为超媒体(hyper media )。即存储对象超出了文本范畴,融入了静、动态图像(形)以及声音等多种媒体信息。

(同样具有超文本检索的优点,并且检索内容与形式更为丰富)

(1)强相关检索:

强调检索的准确性,也称作特性检索。这种检索注重查准率。只要检索得到的文献信息能满足用户的需求就行,对于检索结果的数量多少不作要求。

(2)弱相关检索:

强调检索的全面性,向用户提供系统完整的信息的检索。也称族性检索。这种检索注重查全性,要求检索出一段时间期限内有关特定主题的所有信息。为了尽可能避免漏检相关信息,对于检索的准确性相对要求较低。

要注意的是,这是两种检索要求比较极端的检索类型。实际上是介于两者之间,保证一定的查全率和查准率。

按时间跨度

(1)定题检索SDI (selective dissemination of information)查找有关特定主题最新信息的检索。

(2)回溯检索RS (retrospective search)查找一段时期内有关特定主题信息的检索。

文献检索是以文献作为检索对象,查找含有用户所需信息内容的文献,文献是一种相关性检索而非确定性检索,系统不直接解答用户所提出的问题本身,只提供与之相关文献或文

献的属性信息与来源指示供用户参考和取舍。所以其检索对象是包含特定信息的各种文献

七、按检索途径的特点区分

(1) 常用法,工具法,利用检索工具或系统中常设的检索入口查找文献信息的方法。如主题、分类、著者、题名等。其具体操作分为顺查,倒查,抽查

顺查方式是根据有关课题的起始年代利用选定的检索工具由远及近的进行逐年查找。

倒查方式则相反。从最新时间查找起,直到满足检索要求为止。

抽查是针对有关学科的发展特点,抽查某些特定时期的文献信息。通常抓住学科专业发展兴旺的时期,此时的不仅文献发表的数量多,质量也高。

分类语言(大体了解):用分类号和类名来表达信息的内容主题概念,并按知识门类的逻辑次序将信息资源系统地加以划分和组织的语言。其意义在于根据文献信息的内容特征和分类表,把相同内容的文献、信息集中在一起,同时又把不同内容的文献信息区别开来,以实现相关集中的功能。

分类语言的主要特点:按学科、专业集中相关文献信息,从知识分类的角度揭示文献信息之间的区别和联系,提供从学科专业领域检索文献信息的途径。

(大体了解)事实检索是检索关于某些客体(如机构、人物等)的指示性描述,或关于某一事件发生的时间、地点、经过等信息并将其查找出来的检索。如:名词术语、概念、定义、理论、方法、公式、事件等。事实检索属于数据,因为事实也是一种数据,即非数值性数据。

数据检索是将经过选择、整理、鉴定的数值存入数据库中,根据需要查出可回答某一问题的数据的检索。数据检索是一种确定性的检索,即直接提供用户所需要的确切数据。而且检索结果一般也是确定性的,要么是有,要么是没有;要么是对,要么是错。有些数据检索系统不仅能查出数据,还提供一定的运算、推导能力。

信息检索语言(retrieval language)又称为情报语言、情报存储和检索语言、信息组织语言,是用来描述文献特征,表达主题提问的一种专门的人工语言,是由给定领域中的一切可用来描述信息内容和信息需求的词汇或符号,及其使用规则构成的供标引和检索的工具。是沟通信息存储与检索两个过程,标引人员与检索人员的桥梁。

信息检索语言是检索系统的语言基础,主要作用是:表达描述信息内容和信息需求;用于信息的组织和整序;用于对检索系统中索引标识或提问标识的规范和控制。

根据结构原理划分:(大体了解)

1)分类语言

(2)主题语言

(3)分类主题一体化语言

(4)代码语言

(5)引文语言

分类语言主要可分为等级体系型分类语言和分面组配型分类语言两种。

目前我国广泛采用《中国图书馆分类法》(简称《中图法》)进行分类,该分类法由5大部类、22个大类组成

主题语言:以主题词来表达信息主题概念的语言,它按事物对文献信息进行浓缩、描述和整序,借用自然语言的语词,作为文献信息和检索提问的内容标示。

特点:按特定的事物集中文献信息,有较强的直接性。

构成原理:利用自然语言中的名词术语,经过一定程度的规范化处理,作为表达文献和提问内容的主题词;利用参照系统中的各种手段,显示主题标识之间的各种关系,并以此把主题词表中的众多主题词相互联系起来,构成多维的主题词体系;利用主题词的字顺序列,按事物的名称来排列和检索文献信息。

①标题语言:采用规范化了的自然语言,即经过标准化处理的名词术语作为标识,来表达文献所论述或涉及的事物--主题,并将全部标识按字顺排列。

例:一篇文章用“微型计算机”这个术语来叙述它的研究对象,另一篇文章用“微型电脑”这个术语来叙述它的研究对象,第三篇文章用“微机”这个术语来叙述,虽然都表示同一概念,这时就不能直接用“微型电脑”或“微机”来作标题词了,这三篇文章都必须用“微型计算机”作标题词(根据词表决定)。因为这三个术语是等同概念,如果同时用三个术语来标引,便会导致文献被分散。当然,读者若从“微型电脑”或“微机”入手检索时,都可以在标题词表中看到“见:微型计算机”的参照指示。

关键词语言(keyword):以关键词(从文献题名或文摘以及正文中抽取的,能够表达文献主题并具有实质意义的未经规范化处理的自然语言词汇)作为文献内容标识和检索依据的一种信息检索语言。

关键词与其他主题语言的区别在于:前者是没有经过规范处理的自然语言。属于非受控语言。后者是经过规范处理的自然语言,属于受控语言。

③元词语言:④叙词语言

检索途径及其选择

1、内容特征检索途径:内容特征是指表征文献实质意义的特征,如主题词、关键词、分类号、内容摘要等。

(1)分类途径

(2)主题途径

(3)分类主题途径

2、外部特征检索途径:外部特征是指文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书名(题名、篇名)、人名、各种符号标识(专利号、标准号、报告号等)、机构名、文献出处等

(1)责任者途径

(2)题名途径

(3)序号途径

(4)引文途径

西文词典一般都是按本国文字的字母顺序排列,查询时按字顺查找;日文字典大多按五十音顺排列,查找时按音顺查找;中文字典排列方法较多,有部首法、笔画笔顺法、汉语拼音法、四角号码法等。

百科全书可按收录范围分为综合性百科全书(如:《中国百科全书》、专业性百科全书(如:《化工百科全书》;还可按编辑规模分为:大百科全书(20卷以上)、小百科全书(10卷以下)、百科词典(单卷)。

编排方式有三种:按字顺编排、按分类编排和分类与字顺相结合编排。目前,按字顺编排条目已成为百科全书编排方式的主流,也有采用分类与字顺相结合的形式编排的。

百科全书一般都有各种索引,其中最主要的是主题索引

(了解)《中国大百科全书》是中国第一部大型综合性百科全书,也是世界上规模较大的几部百科全书之一。美国百科全书》名为Encyclopedia Americana,简称EA

《不列颠百科全书(Encyclopedia Britannica)》(又称《大英百科全书》,简称EB)

科利尔百科全书(Collier' Encyclopedia)简称EC

世界ABC三大百科全书:美国百科全书、不列颠百科全书、科利尔百科全书

年鉴大体可分为综合性年鉴和专业性年鉴两大类,前者如百科年鉴、统计年鉴等;后者如经济年鉴、历史年鉴、文艺年鉴、出版年鉴等。

名录可分为人名录、地名录和机构名录

文献检索工具是用于报道、存贮和查找文献线索的工具,它通过对文献特征的描述,并按一定的科学方法排列、提供多种检索途径,使我们能从文献的汪洋大海里找到特定的文献。

检索工具必须具备四个条件:

第一,必须详细描述文献的外部特征和内容特征。

第二,每条描述记录都必须具有各种检索标识。(所谓检索标识是指描述文献外部特征和内容特征的专门用于信息检索的词、词组或代码,如主题词、分类号、著者姓名、文献序号等。)

第三,全部描述记录要科学地组织成一个有机的整体

第四,能够提供多种检索途径。

按著录方式分,有目录型、题录型和文摘型。

其中按著录方式划分体现了检索工具对文献内容揭示的深浅程度,体现了检索工具的性质,这是检索工具最主要的划分方法。

目录是以出版物(如一本图书、一种期刊等)为报道对象,揭示出版物外部特征的检索工具。所以目录对文献的描述比较浅显,一般只描述文献的外部特征,有时也通过简单的内容提要介绍文献的内容,但它不涉及文献中的具体章节或具体文献。目录主要用于报道、登记出版物的出版发行情况,揭示其收藏情况,供人们选购、查阅和获取文献时使用。目录的著录项目通常包括出版物名称、责任者(著者、编者或译者)、出版项(出版者、出版地、出版时间、版次等)和稽核项(页数、开本、价格等)。

目录型检索工具主要有图书馆馆藏目录、联合目录、出版社目录、国家书目等。

题录是以单篇文献作为报道单位,揭示文献外部特征的检索工具。由于它是以单篇文献为单位来报道和存储文献的,所以对文献的揭示程度比目录要具体、深入。

但题录与文摘相比,对文献内容的揭示又相对较浅,不过,它也因此具有加工容易、可以缩短报道的时差、文体简短、可以增加检索刊物的容量的优点。题录的著录项目一般包括题录号、文献题目、作者及其工作单位、出处、原文文种、主题词、文中所附图表数及参考文献数等。

文摘(abstract)是指对一份文献或一个文献单元的内容所做的简略、准确的描述,通常不包含对原文的补充、解释和评论。文摘的报道对象与题录相同,但它对文献内容的揭示程度较题录更深入具体,它不仅描述文献的外部特征,还进一步描述文献的主题内容。对内容的介绍主要由其中的“文摘”部分完成。文摘是最常用的文献检索工具。

原文出处。指刊载原文的地方。

(材料题)文摘的主要著录项目为:

(1)文摘号、入藏号(abstract number ,reference number , accession number )。它是在文献处理完以后,为每条文摘编的号码,起排序并帮助读者识别特写文摘的作用。它可以是简单的顺序号,也可以是含有某种情报内容的代码符号。

(2)文献名称(document title)。即文献的题目(篇名),它是读者识别特定文献的重要标志之一。文献名称一般是逐字照录,有时也可以删去某些引导性的词,或对含义不清及不完整的名称加以改写、补充。外文文献一般要同时著录译名和原名。有些英文检索工具对非拉丁文字的文献一般不著录原名,而著录原名的音译名。

(3)著者(author)及其工作单位(affiliation)。是读者迅速鉴别文献的依据之一,著录著者姓名可以用全称,也可以用简称。许多国家的人名表述是名在前,姓在后,一般姓用全称,名可以缩写。但大多数检索工具都采用姓在前、名在后的形式。英文检索工具对非拉丁文姓名用音译法著录。

4)合同号(contract number)或拨款号(grant number)。如果该文献是在某项合同或拨款的支持下进行的,一般都要标明该项合同的编号或拨款文件的编号。科技报告都有这一项目。

(5)原文出处。指刊载原文的地方。原文如果是某种期刊中的论文,出处包括该刊的刊名、出版地、卷期号、出版日期和起讫页码;如果是图书或其中的一部分,出处就是书名、编著者、出版地、出版者、出版时间和起讫页码。科技报告的出处就是入藏号、订购号或原来的报告号。专利说明书的出处就是专利申请书或专利说明书的编号。原文出处的著录是读者顺利找到原文的重要线索。

(6)原文文别和译文来源。原文文别一般用某种语言的简称标明,放在文献出处之后,有的放在文献的译名之后。若所摘录的文献是一篇译文,应给出译文的来源(被译文献的出处),如“译自X刊X卷X期X页”。此项的用处是免得使读者去找他所不能阅读的东西。

(7)主题词或索引词。指用来描述该文献的主题内容的若干个词或词组。该项的用途很多,既可以帮助读者了解原文主题,也可以用以查找其他相关文献,或供计算机识别和进行逻辑组配检索。

(8)文摘正文。对文献内容所做的简略描述。可以有报道性文摘和指示性文摘之分。前者需概述原文的内容要点,特别是创新点,向读者提供原文中的定量信息(如距离、最大值、最小值、公式等)和定性信息(如发现、结果、新方法、新设备、结论等)。它是原文内容的浓缩,基本上能反映原文的技术内容、信息量大,字数也较多。后者则是为了把原文的主

题范围、目的和方法概略地指示给读者的一种文摘,一般不包含具体的数据、方法、设备、结论等内容。它指示读者将在原文中发现什么,帮助读者判断原文是否与自己的需要相关以及是否需要阅读原文,字数也相对较少。

例:《计算机应用文摘》

9609321 ①复杂的混合信号集成电路的参量成品率预测②[刊,英]③/Oleary,M. …④//Int.J.Electron. —1995,78(2)⑤. —267-394⑥

借助图象处理技术能从硅片图象提取……⑦

①文摘号②文献篇名③文献类型、文种④著者姓名⑤文献出处:刊名缩写、年卷期⑥起讫页码⑦文献摘要

索引通常不提供文献内容本身,只指明文献的物理位置,是一种检索文献的系统指南,使读者能准确地找出文献或文献集合体中的特定信息。

最常用的索引有著者索引、主题索引、分类索引、题名索引。

被抽选出来的关键词都可以作为标引词在索引中进行轮排,作为检索词进行检索

主题索引可分为四种:

1、标题索引

2、关键词索引

3、单元词索引

4、叙词索引

1、布尔逻辑组配检索技术(问答)

布尔逻辑组配检索是现行计算机检索的基本技术,它利用布尔逻辑运算符表示两个检索词之间的逻辑关系,将检索提问转换成逻辑表达式。常用的运算符有:

①逻辑“与”—AND

②逻辑“或”—OR

③逻辑“非”—NOT

练习:

头孢菌素钠Ⅴ或磺胺甲恶唑治疗呼吸道感染的引起的副作用研究

检索式:(头孢菌素钠ⅤOR 磺胺甲恶唑) AND 呼吸道感染AND 副作用

美国DIALOG系统是目前世界上最强大的国际联机检索系统,也是目前运作最成功的联机商业数据库系统之一,

截断方式也有后截、中截、前截等

截词检索具有隐含的OR运算特性

(2) (N)算符和(nN)算符

(N)是Near的缩写,它表示:在算符两侧的检索词必须紧密相连,所连接的词间不允许插入任何其他单词或字母,但词序可以颠倒。

(nN)表示允许在连接的两个词之间夹插入至少n个单词,且这两个检索词的词序任意。例如:Railway(2N)Bridge,可以表示

Railway Bridge,

Bridge of Railway,

Bridge of the Railway

(3)(S)算符

在某些情况下,特别是对查全率有较高要求时,可放松词位置检索要求,改用同句检索。所谓同句检索是要求参加检索运算的两个词必须在同一自然句中出现,其先后顺序不受限制。同句检索的位置算符是(S)。S是sentence的缩写。

例如:electronic(S)optical ,可以检索出题名为Cutting and polishing optical and electronic materials的文献。

计算机信息检索的一般步骤为:

1、根据检索课题,选择适用的数据库;

2、确定检索词;

3、编制检索式;

4、显示及判断检索结果;

5、修改检索策略。

6、索取原文

控制词汇来源于特定的受控检索语言,因此在选词时必须使用相应的词表。受控语言主要有规范化的主题语言和分类语言

非控制词汇是极为灵活有效的检索词。对于自由文本检索和全文检索而言,关键词更是最重要的检索词。

用以进行检索效果评价的参数主要有:查全率(recall factor)、查准率(也称适中率,precision factor)、漏检率(omission factor)、误检率(也叫检索噪音,noise factor)以及新颖率、检索速度等。

(1)查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度,可用下面的公式表示:

查全率=(检出相关文献量/系统中相关文献总量)*100%

2)查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度,可用以下公式表示:

查准率=(检出相关文献量/检出文献总量)*100%

查全率和查准率是评价信息检索系统检索效果的主要指标,理想状态是检索系统中的全部相关文献都被检出,并且检出的文献全部是相关文献。然而,由于受许多因素的影响,在实际检索中,查全率和查准率是不可能达到100%,而是存在着一种互逆关系,即在同一检索系统中提高查全率,查准率就会降低;反之,提高查准率,查全率则会下降。

信息检索与利用期末复习

《信息检索与利用》考试题型说明: 一、判断题(1×10) 二、单选题(1×20) 客观题要涂答题卡。 三、填空题(2×5) 四、简答题(12×3) 五、实践题(12×2) 信息检索与利用客观复习题 一、判断题 1.在构建关键词时,我们尽量不要用自然语言,而要从自然语言中提炼关键词。 (对) 2.在信息检索时查询词表述准确是获得良好搜索结果的必要前提。(对) 3.目前的搜索引擎能很好的处理自然语言。(错) 4.用户可以通过Google图书搜索在线阅读任何一本搜索到的图书。(错) 5.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检 索。(错) 6.解决读者需求的无限性和馆藏的有限性的矛盾,唯一有效的方法就是在图书馆 间建立合作机制,实现资源共享。(对) 7.关键词语言的最大优点是能用计算机进行自动抽词标引,它适合于计算机自动 编制各种类型的词索引。(对) 8.信息素养由信息意识、信息能力、信息道德三个方面内容构成,其中,信息道 德是前提,信息能力是保证,信息意识是准则。(错) 9.搜索引擎与普通网站不同的是提供一个包含搜索框的页面,它不是一个WWW网 站。(错)

10.用搜索引擎google检索专利和期刊的全文比用中国国家知识产权局专利数据 库、《维普中文科技期刊数据库》等数据库的查全率和查准率都要高。(错)11.GB/T 16159-1996,汉语拼音正词法基本规则[S].北京:中国标准出版社, 1996.该文献类型为标准文献。(对) 12.在搜索引擎中输入“项目管理”和输入““项目管理””检索结果是不一样 的。(对) 13.在搜索引擎中常用的截词符是星号“*”,通常使用右截断。如输入comput*, 将检索出computer、computing、computerized等词汇。(对) 14.通用搜索引擎,如google、baidu、bing、yahoo,并不能囊括所有的网页。(对) 15.不同类型的搜索引擎对同一个主题进行搜索会得到不同的结果。(对) 16.一次文献是指原始创作,即作者以本人的研究成果为基本材料而创作(或撰写) 的文献,主要包括期刊论文、专利说明书、会议论文、科技报告和学位论文等。 (对) 17.从一次文献、二次文献到三次文献,是文献从无序到有序、从无组织到系统化 的过程。(错) 18.题录、目录属于一次文献;期刊论文属于二次文献。(错) 19.关键词和主题词都是表征文献实质性内容的词汇,前者是经过词表规范的,后 者是未经过词表规范的自由词。(错) 20.利用某个图书馆的书刊目录查询系统(OPAC),可以了解该图书馆收藏有哪些印 刷型图书和期刊。(对) 21.截词检索相当于用逻辑“或”扩展检索的范围,可以提高检索的查全率。(对) 22.将“红外线”扩展成“远红外线”和“近红外线”运用了上下位概念扩展法。 (对)、

华电信息检索期末考试-单选题库

单选(微软雅黑5号为正确答案,非答案为小5号) 1.下面对图书馆(主馆)在学校所处的位置描述正确的是? A学生宿舍一号楼与二号楼之间 B学生宿舍一号楼与食堂之间 C教二楼与教三楼之间 D主楼和教二楼之间 https://www.360docs.net/doc/a212369622.html,pendex是哪个数据库的网络版? A El B INSPEC C IEL D SIAM 3.我馆外文图书在借阅? A主馆二层前台 B主楼C座308室 C主馆一层基本库 4.图书馆研讨空间于 2014年4月23日开放,单个研讨空间使用者不少于__人,不超过_ A 3, 8 B 6, 8 C 3, 5 D 3, 6 5.世界上最大的图书馆是 _ 一? A英国国会图书馆 B美国国会图书馆 C法国国会图书 6.1958年,美国的大学最先将计算机技术运用到图书馆? A密苏里 B哈佛 C哥伦比亚 D夏威夷 7.以下哪个数据库能下载专利全文? A维普数据资源系统 B读览天下 C万方数据知识服务平台 D读秀知识库 8.使用超星数字图书馆浏览和下载电子图书时,应安装:

A Apabi Reader B SSReader C CAJ Viewer D Adobe Reader 9.以下可以查阅电子图书的数据库是: A维普数据资源系统 B中国知识资源总库 C读览天下 D读秀知识库 10.在中国学术期刊全文数据库中,检索篇名含“图书馆”的文献,最好用:A高级检索 B 一框式检索 C二次检索 D跨库检索 11.我馆购买的中国知识资源总库数据的年限是: A 1988年至今 B 1995年至今 C 1997年至今 D 2000年至今 12.中国知识资源总库下载的期刊论文,浏览全文必须安装: A IE浏览器 B SSreader阅读器 C cajviewer浏览器或PDF阅读器 D书生阅读器 13.查询某数据库中是否收录《自动化学报》,检索途径最好选择: A关键词 B刊名 C分类号 D著者 14.以下数据库中,属于文摘型数据库的是: A CNKI B维普数据库 C中文社会科学引文索引(CSSCI) 15.中文电子资源中,超星数字图书馆属于: A索引型数据库 B文摘型数据库

信息检索心得体会

学习信息检索这门课程后,对其应用有了学习、熟悉的过程,从中得到了很多体会与心得。 通过对信息检索的学习,不仅让我真正懂得了信息检索的深刻涵义,更了解到怎样选择正确的检索词来构成检索策略进行检索。在实际检索过程中,仅需一个检索词就能满足检索要求的情况并不很多。通常我们需要使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂课题的要求。对于文献信息检索的方法,最重要的是关键词的选择,即检索词和检索策略的选择。检索词选的精确,不仅可以节省时间,提高检索速度,而且可以大大提高检索结果的质量,更容易找到自己所需数据或文献资料。 书本检索工具具有查阅方便的特点,但有时受出版时间的限制,往往不能反映最新的资料。期刊式检索工具能反映最新的资料,但由于篇幅的限制,又不能全面反映资料的历史内容。查找学科方面的专题资料,首选的是专业性检索工具,因为它反映的是本学科领域内的文献,专指性强,能节省时间和精力。但同时,也要注意配合使用综合性检索工具。综合性检索工具能反映各个学科的内容,开拓知识面和视野。 现代学科之间的渗透很多,查阅综合性检索工具有时能得到意想不到的收获,尤其是国内的一些检索工具,往往采用分类进行编排,一些跨学科的文献往往分散在不同的类目中,因此更要注意利用综合性检索工具。在检索中要注意将专题书目与综合性书目、专题索引与综合性索引、专业数据库与综合性数据库等配合起来使用。中文检索工具,如中国知网、万方数据资源系统等,只能反映国内的研究成果,要注意充分使用外文的检索工具如EBSCOhost-外文期刊全文数据库、Springer-Verlag,WorldSciNet(WSN)全文电子期刊,获得世界上最新的研究动态。只有了解国内外的研究动态,才能使论文具有较高的水平。 科技文献检索与论文写作这门课程是最实用的课程之一,学习这门课程的目的是学会利用信息检索如何最快最准确的搜索想要的信息。文献检索作为一种工具,能通过他人的知识而对前人研究继承,发展和创新,通过研究思路和方法的学习和借鉴来进一步进行自己的研究,对于我们以后写毕业论文会有很大的帮助。文献信息资料是学习和研究工作的基础,各项学习和研究工作都将根据我们搜集到的文献信息资料来开展。信息资源越丰富,学习和研究工作成功的可能性就越大。面对日益增长的文献资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息?这就需要具备文献检索的基本技能,通过文献检索,可以获取学术动态;通过文献检索可以寻找未知问题的答案;通过文献检索可以培养信息意识、提高自学的能力……可以说,同学们平时的学习及毕业论文的写作等都与文献检索密切相关。 在此次文献检索课程中,通过老师的介绍,我不仅了解到了信息检索方面的基础知识,如文献可以分为期刊,专利,会议资料,学位论文,科技报告等,并

信息检索复习资料

文献的定义 最简明的定义:记录有知识的一切载体。 定义:记录知识的一切载体,即用文字、图形、符号或声频等技术手段记录知识的物质载体,或固化在物质载体上的知识。 二次文献 将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。 特种文献 会议文献、学位论文、专利文献、标准文献、科技报告、政府出版物、产品资料、档案8种类型文献是一种介于图书与期刊之间的文献类型,通常在出版发行方面或获取途径方面比较特殊,因而也被称为特种文献或灰色文献。 文献检索式 或:A or B 或 A + B;用于扩大检索范围,增加命中文献数量,有利于提高检索结果的查全率。 与:A and B 或 A * B; 用于对检索词进行限定,从而缩小检索范围,有利于提高检索结果的查全率。 非:A not B 或 A – B;表示检索记录中凡含有A不含B的记

录被检出。能够缩小命中文献的范围,增强检索的准确性。 网上的文献格式 期刊、专著、论文集、学位论文、报告、专利论文、[国际、国家标准]、报纸文章、电子文献。 文献信息源 用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。文献信息源是信息源的主体部分,是信息搜集、存储、检索和利用的主要对象。 CA美国化学文摘数据库收录文献 期刊论文、会议论文、图书、学位论文、专利、技术报告。 什么数据库能检索会议文献 国外:ISI会议录数据库、会议论文索引数据库、OCLC PapersFirst 与ProceedingsFirst、STN联机系统中的CONF会议论文数据库、美国物理所电子会议录数据库、美国光学工程师学会会议文献数据库、美国航空航天协会电子图书馆。 国内:中国重要会议论文全文数据库、万方数据知识服务平台会议论文数据库、中国国家科技图书文献中心会议论文数据库、中国学术会议文献通报、上海图书馆会议资料数据库。

《信息检索》总复习题库及答案

2011-2012经济学院《文献检索与利用》总复习题库 备注:红色为不确定答案,紫色是为了个人强化记忆。 单选题题库 1.下列属于布尔逻辑算符的是(D )。 A、与 B、或 C、非 D、以上都是 2、信息素养的核心是(C ). A、信息意识; B、信息知识; C、信息能力; D、信息道德 3、20世纪70年代,联合国教科文组织提出:人类要向着( B )发展. A、终身学习; B、学习型社会; C、创新发展; D、信息素质 4.参考文献的标准著录格式是( A )。 A、著者篇名来源出处; B、篇名著者来源出处 5.请标出文献:马品仲. 大型天文望远镜研究. 中国的空间科学技术,1993,13(5)P6-14, 1000-758X 属于哪种文献类型( C )。 A、图书; B、科技报告; C、期刊; D、报纸 6.常用的检索系统有( D )。 A、目录检索系统 B、文摘检索系统 C、全文检索系统 D、以上都是 7、哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?( A )。A.逻辑与()B.逻辑或() C.逻辑非()D.逻辑与和逻辑非 8、根据国家相关标准,文献的定义是指“记录有关( C )的一切载体。”A.情报 B.信息. C.知识 D.数据 9、( D )是指通过文献信息资料的主题内容进行检索的途径。 A.题名检索途径 B.作者检索途径 C.分类检索途径 D.主题检索途径 10、搜索含有“”的文件,正确的检索式为:( A )

A." " B. 11、从文献的( B )角度区分,可将文献分为印刷型、电子型文献。A.内容公开次数 B.载体类型. C.出版类型 D.公开程度 12、按照出版时间的先后,应将各个级别的文献排列成( C ) A.三次文献、二次文献、一次文献B.一次文献、三次文献、二次文献C.一次文献、二次文献、三次文献 D.二次文献、三次文献、一次文献13、利用文献后面所附的参考文献进行检索的方法称为( A )。 A.追溯法 B.直接法. C.抽查法 D.综合法 14、《中国学术期刊全文数据库》给出的检索结果为( D )。 A.仅题录 B.仅文摘. C.仅全文 D.题录、文摘和全文三种 15、以作者本人取得的成果为依据而创作的论文、报告等,并经公开发表或出版的各种文献,称为( B ) A.零次文献 B.一次文献. C.二次文献 D.三次文献 16、学术论文写作的六个步骤的正确顺序是( C ): ①搜集资料②研究资料③执笔撰写④选择课题⑤明确论点⑥修改 定稿 A.①⑤④③②⑥ B.⑤③④②①⑥C.④①②⑤③⑥D.②④ ③①⑤⑥ 17、毕业论文答辩的一般程序是( B D ) ①学生答辩②学生作说明性汇报③毕业答辩小组提问④评定成绩 A.③④②①B.②③①④C.③②①④D.②③①④ 18、下列文献中属于哪类属于一次文献( C )? A.文摘 B.索引C.科技报告D.题录 19、如果检索结果过少,查全率很低,需要调整检索范围,此时调整检索策

(2)--信息检索期末考试A卷答案

武汉大学信息管理学院《信息检索》考试试卷(A)答案 一、名词解释(5x4=20分) 1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 3.China Academic Library and Information System中国高等教育文献保障系统。 4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。 5.搜索引擎(Search Engine)是一种 Web 上应用的软件系统,它以一定的策略在 Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。 二、简答(5x6=30分) 1.电子图书有哪些特点? 存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使用,可无失真地重复使用)。 2.对搜索引擎的选择与比较主要从哪些方面考虑? 收录范围(索引库中内容的数量、地域范围、语言种类、资源类型、资源的深度和广度)、分类(分类方式是否合理多样、类名是否规范、分类的广度与深度是否合适)、检索功能与效果(是否包含浏览检索和关键词检索功能、是否支持布尔检索、截词检索等高级检索功能、是否有检索帮助和提示功能、检索结果和查全率、查准率及响应时间)、结果处理(结果的排序方式是否多样、是否有去重功能、能否按照用户反馈动态调整和显示检索结果)、页面组织(页面组织是否清晰、类目设置是否合理、界面是否友好)、其他功能与服务(能否满足用户多方面的信息需求)、用户评价(是否有用户评价及统计功能)。 3.网络信息选择的标准有哪些? 权威性(网站及其建站机构的权威性和知名度)、内容(内容应当客观、切题、标题清楚、组织规范、逻辑性强、有明确的范围和边界、有足够的深度和广度、有自己的特色)、时效性(网站内容及其链接应当新颖、应明确地说明其创建和更新周期)、网页设计(应以合理的方式综合使用图像、声音和文字、界面的友好性、清晰直观)、适用性(应保证用户能用较短的时间、点击较少的链接找到所需信息)、用户对象(信息的专业化程度应能满足目标用户的特定需求)、访问次数或被链接次数(网络信息的被访问和被其他网页链接的次数)。

信息检索复习题1

信息检索复习题 一、判断题 1.在bing的视频搜索结果中,用户无需点击视频,只需要将鼠标放置在视频上,便可播 放视频的精华片段。 2.在搜索引擎中,为了精确搜索,防止自动分词,可采用“+”来实现。 3.在构建关键词时,我们尽量不要用自然语言,而要从自然语言中提炼关键词。 4.在信息检索时查询词表述准确是获得良好搜索结果的必要前提。 5.目前的搜索引擎能很好的处理自然语言。 6.用户可以通过Google图书搜索在线阅读任何一本搜索到的图书。 7.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检索。 8.在撰写学位论文的时候,为了照顾到论文的新颖性可以不考虑其观点的实际意义。 9.将撰写论文的作者的署名顺序颠倒对作者的署名著作权没有侵害。 10.搜索引擎与普通网站不同的是提供一个包含搜索框的页面,它不是一个WWW网站。 11.搜索引擎的命中率、准确率、查全率都比较高。 12.由于人工干预过少,而且搜索引擎大多采用自然语言标引和检索,搜索引擎检索结果中 会有很多冗余信息。 13.在搜索引擎中输入“项目管理”和输入““项目管理””检索结果是不一样的。 14.在搜索引擎中常用的截词符是星号“*”,通常使用右截断。如输入comput*,将检索 出computer、computing、computerized等词汇。 15.不同类型的搜索引擎对同一个主题进行搜索会得到不同的结果。 二、选择题 1.下面哪种信息以刊载新闻和评论为主的出版周期较短的定期连续性出版物。 A.图书B.报纸C.期刊D.标准 2.下面哪种信息具有一定的法律约束力,需经权威机构批准,在特定范围内必须执行的规 则、规定、技术要求等规范性信息。 A.专利B.标准C.科技报告D.政府出版物 3.学术论文写作的六个步骤的正确顺序是: ①搜集资料②研究资料③执笔撰写④选择课题⑤明确论点⑥修改定稿 A.①⑤④③②⑥ B.⑤③④②①⑥C.④①②⑤③⑥D.②④③①⑤⑥ 4.搜索引擎存在的问题是() A.无法提供搜索框页面 B.冗余信息较多C.无法采用自然语言检索D.信息采集只能采用人工采集 5.在搜索引擎布尔检索中,要求检索结果中只包含所输入的两个关键词中的一个的关系属 于() A.AND B.OR C.NOT D.异或

最新文献检索期末试卷(学生)

《文献检索》期末试卷 姓名学号专业 本试题一共5道大题,共5页,满分100分。 阅卷人题号一二三四五合计 核分人题分30 30 20 10 10 100 总分得分 一、单项选择题(请将正确答案的序号填在括号内,每题1.5分,共30分) 1. 文献是记录有知识的() A 载体 B 纸张 C 光盘 D 磁盘 2. 下列哪种文献属于一次文献( ) A 期刊论文 B 百科全书 C 综述 D 文摘 3. 下列哪种文献属于二次文献( ) A 专利文献 B 学位论文 C 会议文献 D 目录 4. 下列哪种文献属于三次文献( ) A 标准文献 B 学位论文 C 综述 D 文摘 5. 下列选项中属于连续出版物类型的选项有() A 图书 B 学位论文 C 科技期刊 D 会议文献 6. 下列选项中属于特种文献类型的有() A 报纸 B 图书 C 科技期刊 D 标准文献 7. 纸质信息源的载体是() A 光盘 B 缩微平片 C 感光材料 D 纸张 8. 以刊载新闻和评论为主的文献是() A 图书 B 报纸 C 期刊 D 会议文献 9. 使用分类语言对信息进行描述和标引,主要是可以把()的信息集中在一起。 A 同一作者 B 同一学科 C 同一主题 D A+B+C 10.《中国图书馆分类法》(简称《中图法》)将图书分成( ) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 11.《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在()

类目下查找。 A S类目 B Q类目 C T 类目 D R类目 12. 利用文献末尾所附参考文献进行检索的方法是() A 倒查法 B 顺查法 C 引文追溯法 D 抽查法 13. 至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为() A 数据库 B 记录 C 字段 D 文档 14. 广义的信息检索包含两个过程() A 检索与利用 B 存储与检索 C 存储与利用 D 检索与报道 15. 狭义的专利文献是指() A 专利公报 B 专利目录 C 专利说明书 D 专利索引 16. 中国国家标准的代码是() A G B B CB C ZG D CG 17. 我校图书馆所购买的下列数据库中可以检索期刊论文的是() A 万方数据库资源系统 B 超星数字图书馆 C 书生之家数字图书馆 D 方正Apabi数字图书馆 18. 期刊论文记录中的“文献出处”字段是指:() A 论文的作者 B 论文作者的工作单位 C 刊载论文的期刊名称及年卷期、起止页码 D 收录论文的数据库 19. 以下四种信息检索语言中,不受《词表》控制的是() A 标题词语言 B 元词语言 C 叙词语言 D 关键词语言 20. 以下检索出文献最少的检索式是() A a and b B a and b or c C a and b and c D (a or b) and c

信息检索学习的重要性和必要性

信息检索学习的重要性和必要性 随着社会信息化程度的不断提高,现代科技进步和社会经济发展对信息资源、信息技术和信息产业的依赖越来越大,人才被赋予新的内涵。检验人才的标准除具有良好的思想觉悟和道德品质,较宽厚的专业知识、较合理的知识结构外,是否具备较强的信息素质已成为一项不可或缺的重要指标。面对信息社会,只有具备信息素质的人,才能适应信息社会的需要,也只有接受过良好信息素质教育的人,才能在信息社会中表现出极大的潜力和创造力,在社会竞争中处于优势。 德国柏林图书馆门前有这样一段话:“这里是知识的宝库,你若掌握了它的钥匙,这里的全部知识都是属于你的。”这里所说的“钥匙”即是指信息检索的方法。 信息检索顾名思义就是把你想要知道的、了解的信息通过某种途径把它搜索出来。在百度词条中可以查到,信息检索的释义是信息按一定的方式组织起来,并根据信息用户的需要找出相关的信息的过程和技术。 信息检索起源于图书馆的参考咨询和文摘索引工作。而在信息处理技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各个领域高速发展,并得到了广泛的应用。

在现代社会,各种文化和知识不断充斥着我们的大脑,我们对各式信息的需求越来越多,可是有时候面对太过复杂而且繁多的信息量时,我们会感到无所适从。我们要找到符合自己需要的信息时,就必须运用信息检索这一重要的信息查询手段,因而学会信息检索是十分重要且必要的。 学习如何利用信息检索搜索有用信息,有利于培养学生利用信息的习惯,并使其认识到信息检索的重要性,提高信息检索的速度,使用信息检索这一工具也更加熟练。这特别对我们来说,信息检索是我们必须掌握的一门技术,学会之后,有利于增强我们的专业知识,提高我们的文化素养。 信息检索对每一个现代人都是十分必要的,你总会在某些时候需要它,因此它具有很强的实用性。当我们遇到学识上的困难时,以往我们会通过去图书馆翻阅资料来解决问题。但现代社会是一个高科技占主导地位的社会,因此现如今我们经常使用网络上的搜索工具来帮助我们,如谷歌、百度、维基,在未学习信息检索之前,我只知道这些,学习之后,我知道了有比百度之类的更具有专业性的信息检索网站,如中国知网、万方、维普。老师说这些网站对于我们写毕业论文、研究生论文等都具有非常强大的作用的,因为它们这里面有很多书籍是在一般门户网站里找不到的,具有很高的专业性。 我们掌握了信息检索的方法和步骤后,我们可以以最快

文献检索期末复习题

信息、知识、情报三者的相互关系是 A.情报>知识>信息 B.信息>知识>情报 C.知识>信息>情报D.信息是知识的源泉,知识是活化的情报,情报是系统化、理论化的信息 专著属于() A、一次文献 B、二次文献 C、三次文献 D、零次文献 二次文献是指( B ) A.参考或引用他人的著作之后出版的文献. B.对一次文献进行收集、分析、整理并加以编排的文献 C.对知识进行加工之后产生的文献 D.对一次文献阅读分析、归纳整理和推理之后进行概括、论述而成的文献。下列文献类型中不属于三次文献的是 A.百科全书 B.年鉴 C.会议文献 D.词典 目录、索引、文摘都属于: A、一次文献 B、二次文献 C、三次文献 D、零次文献 下列文献类型中属于二次文献的是:(C) A、百科全书 B、综述 C、 D、词典 下列文献类型中属于三次文献的是 A.学位论文 B.期刊论文 C.动态综述 D.文摘 以下文献哪一项是三次文献 A.指南 B.会议录 C.专利说明书 D.目录 文献特征包括外部特征和内部特征,它对应于数据库中的 A.字段 B.记录 C.文档 D.字段值 下列哪种文献属于一次文献 A、期刊论文 B、百科全书 C、综述 D、文摘 下列哪种文献属于二次文献 A、专利文献 B、学位论文 C、会议文献 D、目录 下列哪种文献属于三次文献 A、标准文献 B、学位论文 C、综述 D、文摘 下列选项中属于连续出版物类型的选项有 A、人民日报 B、学位论文 C、词典 D、会议文献 下列选项中属于连续出版物类型的选项有 A. 图书 B.学位论文 C.科技期刊 D、会议文献 人类从改造世界的实践中所获得的认识和经验总结可称为 A. 信息 B. 文献 C .知识 D. 情报 以下属于一次文献的是 A.综述 B.期刊论文 C.百科全书 D.会议记录 书目数据库主要提供的是 A.一次信息 B. 二次信息 C.三次信息 D.零次信息 下列文献中不是一次文献的有()。 A. 专利文献 B. 教科书 C. 科技报告 D. 期刊论文 下面哪一项不是情报的特点: A、保密性 B、传递性 C、公开性 D、时效性 利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止的检索方法

武汉大学《信息检索》试卷及答案(两套)

三.选择填空(4 x 5分=20分)1.C,d,g,I,j 2.a,b,e,g,h3.c,d,e,g, h4.c,d,f,g此题为多项选择题,选错者不倒扣分,但所选答案不得多于5个。 1.下列中不能用于查找期刊论文引用信息的有: a. SSCI b. CSSCI c. Journal Citation Report d. Ulrich’s International Directory of Periodicals e. SCI f. A&HCI g. ProQuest Digital Dissertations h. Web of Knowledge i.VIP Chinese Scientific Journal Database j.Chinese Enterprises and Companies Database 2.检索图书馆学、信息管理学的期刊论文,可用的检索工具有: a. LISA b. ISA c. BA d. CA e. Web of Knowledge f. Ei g. SSCI h. SCI i. ProQuest Digital Dissertations 3.下列中可用于查找机构信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals c.Chinese Enterprises and Companies Database d. Foundation Dire ctory e. Peterson’s Gradline f. Who is Who g. World of Learning h. Encyclopedia of Associations 4.下列中可用于查找期刊论文信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals c. ABI/INFORM d. Elsevier e. Journal Citation Report f. Chinese Academic Journal Fulltext Database g. OCLC Electronic Collections Online 武汉大学信息管理学院2008-2009学年度第二学期 《信息检索》考试试卷(A)答案 一、名词解释(5x4=20分) 1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 3.China Academic Library and Information System中国高等教育文献保障系统。 4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。 5.搜索引擎(Search Engine)是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。 二、简答(5x6=30分) 1.电子图书有哪些特点? 存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使

《信息检索》总复习题

《信息检索》总复习思考题 一、单选题 1.下列属于布尔逻辑算符的是()。 A、与 B、或 C、非 D、以上都是 2、信息素养的核心是( ). A、信息意识; B、信息知识; C、信息能力; D、信息道德 3、20世纪70年代,联合国教科文组织提出:人类要向着( )发展. A、终身学习; B、学习型社会; C、创新发展; D、信息素质 4.参考文献的标准著录格式是()。 A、著者篇名来源出处; B、篇名著者来源出处;C著者来源出处篇名 5、哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?()。 A.逻辑与(AND)B.逻辑或(OR)C.逻辑非(NOT)D.逻辑与和逻辑非 6、根据国家相关标准,文献的定义是指“记录有关()的一切载体。” A.情报B.信息. C.知识D.数据 7、()是指通过文献信息资料的主题内容进行检索的途径。 A.题名检索途径 B.作者检索途径 C.分类检索途径 D.主题检索途径 8、搜索含有“data bank”的PDF文件,正确的检索式为:( ) A."data bank" filetype:pdf B.data and bank and pdf C. “data bank”filetype;pdf D. “data bank ”pdf 9、毕业论文答辩的一般程序是( ) ①学生答辩②学生作说明性汇报③毕业答辩小组提问④评定成绩 A.③④②① B.②③①④ C.③②①④ D.②③①④ 10、下列文献中属于哪类属于一次文献( )? A.文摘 B.索引 C.科技报告 D.题录 11、从文献的( )角度区分,可将文献分为印刷型、电子型文献。 A.内容公开次数B.载体类型. C.出版类型D.公开程度 12、按照出版时间的先后,应将各个级别的文献排列成( ) A.三次文献、二次文献、一次文献B.一次文献、三次文献、二次文献 C.一次文献、二次文献、三次文献D.二次文献、三次文献、一次文献 13、利用文献后面所附的参考文献进行检索的方法称为( )。 A.追溯法B.直接法. C.抽查法D.综合法 14、《中国学术期刊全文数据库》给出的检索结果为( )。 A.仅题录B.仅文摘. C.仅全文D.题录、文摘和全文三种 15、以作者本人取得的成果为依据而创作的论文、报告等,并经公开发表或出版的各种文献,称为( ) A.零次文献B.一次文献. C.二次文献D.三次文献 16、检索语言中,( )是自然语言。 A.标题词B.主题词C.单元词D.关键词 17、国际上评价期刊最有影响力的一个指标是 ( )。 A. 影响因子 B.读者人数 C.引文量 D.价格 18、下列文献中属于哪类属于一次文献( )?

《信息检索与利用》期末复习1

《信息检索与利用》期末复习 试题题型 一、填空题(每空3分,共15分) 二、选择题(每题3分,共30分) 三、判断题(每题3分,共30分) 四、简答题(共25分) 1.(12分) 2.(13分) 复习题 第一章信息资源检索基础知识 一、填空题 1.___________________________是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息 2.___________________________是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。知识 3.___________________________是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。情报 4.___________________________是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。文献 5.___________________________是指在国内外学术或非学术会议上发表的论文或报告。会议文献 6.___________________________是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。学位论文 7.___________________________是对文献内容和形式特征进行选择和记录的过程。著录8.___________________________是指特定的数值型数据为对象的检索。数据检索 9.___________________________是指以特定的事实为目标的检索。事实检索 10.事实与数据检索工具主要依靠各类___________________________完成各种数据或事实的查询。参考工具书 11.按照结构原理,信息检索语言可以分为_____________________、____________________、

文献检索期末复习题

1. 请解释信息、知识、文献的概念,并简述三者之间的关系 信息是客观事物属性和运动状态的外在表现。知识是人们对客观事物存在和运动规律的认识。文献是记录知识的一切载体。 信息是生产知识的原料,知识是被人类系统化后的信息,文献是存储传递知识和信息的载体。信息大于知识,信息可分为正确信息和虚假信息、有用信息和无用信息,而知识是在实践中获取并经过实践检验的正确、有用的信息。信息是起源,是基础;知识是系统化了的信息。在信息时代,源于众多复杂客体的大量信息,只有借助于现代化的信息手段,并通过掌握现代信息科学技术的认知主体,才能真正转化为知识。 2. 在数据库检索中,当检出的文献数量较少时,分析其可能原因,以及采用何种对应措施,才能增大文献信息的检出量?(至少列举5种情况) 原因:检索词拼写错误;遗漏重要同义词或者隐含概念;位置算符和字段算符使用过多;没有使用截词算符;使用过多的逻辑“与”,过于严格。 措施:扩大检索范围,增加文献信息的检出量。(1)减少“与”算符,以OR加入相关检索词(2)在词干相同的单词后使用截词符(?)(3)修正错误的检索词(4)补充足够的同义词(5)去除已有的字段和位置算符限制 3. 试举例说明链入网页、链出网页和锚文本。 在Page1中建立一个指向Page2的链接,需要在Page1的HTML代码中加入“点击打开网页Page2”,用户在Page1中打开这个链接,就可以打开网页Page2。Page1是Page2的链入网页,Page2是Page1的链出网页,而在Page1中的蓝色超文本就是锚文本。 4.信息检索和文献检索是不同的两个概念。区别及联系。 信息检索的实质是将用户的检索提问标识和检索系统中的信息特征标识进行比对,匹配,两者一致或者信息特征标识包含检索提问标识,则具有该标识的信息就从检索系统中输出,输出的信息就是检索命中的信息。 区别:信息检索主要是通过文献检索实现的,文献检索是信息检索一个重要的组成部分。联系:文献是一切情报知识信息的载体,所以情报知识信息不可能超越文献这一载体而存在。因此,信息检索一般也不可能超越作为信息载体的文献。 5.IP地址和域名地址 Internet是基于TCP/IP协议的网络。网络中的每一个节点都必须有一个唯一的地址,用来保障通信的准确无误。它就是网络位置的唯一标识,即IP地址。IP地址一般用十进制数字表

信息检索学习参考资料

第一讲信息检索基础知识 1.信息、知识、情报、文献的概念以及四者之间的关系? 信息是事物的运动状态和方式。 知识是关于事实和思想的有组织有系统的陈述。 情报是作为交流对象的有用知识,是在特定时间、特定状态下对特定的人提供的有用知识,是激活了、活化了的知识,其基本属性是知识性、传递性和效用性。 文献是指“记录有知识的一切载体”,它是存储在一定物质载体上的关于知识信息的记录。 四者的关系:信息包含知识、知识包含情报和文献、情报和文献是交叉关系。 2.什么是信息资源?什么是信息源? 信息资源是经过人类筛选、组织、加工,并可以存取和能够满足人类需求的各种信息的集合。 信息源是人们获取信息的来源。 3.什么是信息素质?信息素质教育的目标是什么?信息素质由哪些方面构成?各方面的具体含义是什么? 信息素质是指利用已掌握的信息工具的知识与技能,对需求的信息进行检索、加工并且有效地利用这些获取的信息解决实际问题的能力。让用户学会学习,获得终身学习的能力是信息素质教育的目标。 信息素质由:信息需求、信息意识、信息知识、信息道德、信息能力五个方面构成。

(1)信息需求是指人们在一个阶段的目标、任务位置中产生的信息需要行为。 (2)信息意识是人们对信息的敏锐意识(由信息需求激发出来,包括人们对信息的感受力,持久的注意力和对信息价值的洞察力,判断力) (3)信息知识是人们有关信息的特点与类型,信息交流和传播的基本规律与方式,信息的功用及效应,信息检索的方法和技能等方面的知识。 (4)信息道德是人们在收集信息,获取信息和使用信息时必须遵守的伦理道德规范。 (5)信息能力是人们在探求与个人兴趣有关的信息活动中,能够精确地、批判性地评价信息,对信息进行创造性表达和知识创新,最佳地收集、分析和使用信息,从而完成解决实际问题和探求知识的能力。 4.信息能力按应用途径及方式可分为哪些方面的内容? 信息能力按应用途径及方式可分为如下八个方面: 运用信息工具的能力;获取信息的能力;处理信息的能力;创新信息的能力;表达信息的能力;发挥信息作用的能力;信息协作意识与能力;信息免疫能力。 5.按文献的物理形态和加工方式可分别将文献分为哪几种类型? 按文献的物理形态和加工方式区分,文献可分为:手写型、印刷型、缩微型、声像型、数字型。 6.按文献的加工深度可将文献分为哪几种类型?它们之间的关系是什么?

信息检索复习题

信息检索复习题 第一部分各章思考题 第一章思考题 1.信息、知识、文献的概念及相互关系是什么? 2.信息环境问题主要体现在哪些方面? 3.信息素质的内涵包括哪些内容? 4.按文献的载体形式、出版形式可分别将文献分为哪几种类型? 5.按文献的加工程度可将文献分为哪几种类型?它们之间的关系是什么? 第二章思考题 1.文献的外部特征和内容特征分别有哪些? 2.检索方法及各自的优缺点有哪些? 3.常用的检索技术有哪些? 4.简述布尔逻辑算符AND、OR和NOT在编制检索提问式中的作用。 5.请为检索课题“航空或航天发动机的设计和制造”编制检索式。 6.在一个具有1000篇文献的检索系统中检索某课题,用一特定检索策略查该课题时输出文献60篇。经分析评估,发现该系统中共有该课题相关文献50篇,检出的文献中实际相关文献只有30篇,求查全率、查准率。 第三章思考题 1. 你是如何认识数字图书馆时代的馆藏资源的? 2. 请做排序:TP3/2;I247.5/123;I247.5/55;TP316/4;O13/5;TM925/44;G252.7/178;TP39/3。 3. 谈谈你对数字图书馆的认识。 4. 请检索你在图书馆近一年的借阅历史。 5. 请检索丁元霖主编的《商品流通企业会计》在中国国家图书馆是否有收藏,收藏在哪些书库? 第四章思考题 1.试比较分析中国知网(CNKI)、万方数据知识服务平台、维普资讯网中“中文期刊数据库”的异同点。 2.查找你所在单位人员撰写的你所学学科专业的硕士论文或博士论文3篇。 3.用检索实例说明中国知网(CNKI)标准检索、高级检索、专业检索、引文检索、学者检索的检索方法。 4.查找洗衣机方面的中国专利2项。简述检索方法和步骤。 5.查找参考文献写作规范的国家标准。 第五章思考题 1.结合你所学专业列出你所熟悉的外文电子图书数据库,并简述其检索方法。 2.简述你所学专业的常用外文电子期刊数据库有哪几种,并以其中一个数据库说明其检索方法。3.简述ProQuest学位论文数据库检索方法。 4.你常用的外文专利数据库有哪些?并简述其检索方法。 5.如何查找国外标准文献,请查找一条和你专业相关的国外标准。

信息检索期末考试题复习资料和题

学号: 姓名: 2012----2013学年第二学期信息检索与利用考查上机试卷 (要求检索结果全部存放在Word文档里,Word文档命名为: 学号+姓名。文档的第一行写上:学号、姓名。) 一、搜索引擎检索:将检索结果存到Word文档中。(30分) 1、文献信息源按照内容的压缩程度,可分为___________ 、__________ 2、霍金曾三次来到中国,时间分别是_____________ 、_____________ 3、元搜索引擎的定义_____________________________________________ ,并列举出6个中文元搜索引擎:_________________________ 、 4、三国时期刘备生于公元161 ______________ 年,死于—公元223 ___________ 年,字玄德_________ , 涿郡涿县(今河北涿州) ________________ 人。 5、信息检索系统由输入系统,存储系统,用户界面,索引器,检索器。 _____________ 、_________ 、_________ 、_________ 和_________ 成。 6、苏州道前街”一名的来历是— .是_由原道前街、府前街、卫前街合并而成 ______ , 五卅路”曾用名王废基_______ ,位于苏州市古城区 ____________ _____________ 。 7、室内空气中臭氧卫生标准_____________________________________ 。

学号: 姓名: &计算机信息检索大体经历了___________________ : _________________ 、

文献检索期末复习完整版

第一章绪论 1.文献检索(information retrieval)是指收集整理文献并按一定方式组织和存储,同时根据用户的信息需求查找出相关信息的过程,又称为“文献存储与检索”。狭义的文献检索是指根据用户信息需求,利用检索工具或检索系统从文献信息集合里找出用户所需文献的过程。 2.文献检索语言是根据文献检索需要而人工规范的语言系统,用来描述文献特征和表达信息检索提问的一种专用语言,供信息标引以及文献检索时使用。 3.文献指以文字、图像、公式、声频、视频、代码等手段将信息、知识记录或描述在一定的物质载体上,并能起到存贮和传播信息情报和知识作用的一切载体。三个基本要素:内容上的知识或信息;揭示和表达知识信息的标识符号;记录信息符号的物质载体。 4. 信息素养 又称为信息素质,是伴随着社会信息化的形成和发展而出现的一个名词术语,指具有检索、分析、评价和利用各种信息源以解决信息需求及制定明智决策的能力,是对个人信息行为能力、独立学习能力以及批判性思维能力等概括性描述。 第二章医学文献信息资源 1.按文献内容的加工深度和内容性质划分 一次文献、二次文献、三次文献、零次文献 (1)零次文献零次文献指未经正式发表或未进入正式交流的最原始的文献。(2)一次文献是指作者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作,如专著、期刊论文、科技报告、学位论文等。(3)二次文献是将大量无序分散的一次文献收集、整理、加工、著录其特征(如著者、篇名、分类、主题、出处等),并按一定的顺序加以编排,形成供读者检索所需一次文献线索的新的文献形式,如索引、文摘、目录以及其相应的数据库等。因其具有检索功能而称为检索工具或检索系统。 (4)三次文献是科技人员围绕某一专题,借助二次文献,在充分研究与利用大量一次文献的基础上,经过阅读、分析、归纳、概括,撰写而成的新的文献。

相关文档
最新文档