信息存储与检索复习资料

信息存储与检索复习资料
信息存储与检索复习资料

一、名词解释

1. 主题标引:是在主题分析的基础上,依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程。

2. INTERNET(因特网):泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。

3.顺查法:就是以课题研究的起始年限为出发点,利用选定的检索工具如书目、索引、文摘又远及近的逐年查找。

4.三次文献: 是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为“情报研究”的成果

5.文献信息资源:文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源。

6. 倒查法:一种逆时间顺序由近而远地查找信息的方法.

7. 一次文献:即原始文献。它是作者以生产或科研为依据而创作的原始文献。如专著、期刊论文、学位论文等。

8. 检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。

9. 手工检索:是由检索者通过卡片式或书本式的目录、题录、文摘、索引等检索工具查找文献线索的过程。

10. 信息检索语言:信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言。

11. 特种文献:特种文献是指出版发行和获取途径都比较特殊的科技文献。特种文献一般包括会议文献、科技报告、专利文献、学位论文、标准文献等。

12.间接检索法:利用一定检索工具进行文献检索

13. 专利:有三层含义:一指受专利法保护的发明,二是指专利权,三指专利说明书等专利文献。这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体体现。

14.搜索引擎:是一种 Web 上应用的软件系统,它以一定的策略在 Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。

15. 技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。

16. 索引:根据标题法的原理,将类目及其注释改成标题形式,按字顺排列,并注明相应的分类号。这样不仅可方便查表,而且还可将分类表中因为按学科分类而被分散的同一事物不同方面的类目集中,使分类法在某种程度上兼有主题法的性能。

17.抽查法:针对研究课题发展的特点,选择有关的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。

18. 回溯检索:又叫追溯法,是以某一篇文献末尾所附的参考文献为依据,由近及远进行逐一追踪的查找方法.

19. 循环检索:先利用检索工具查出一批有用文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找.

20. 追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法。

21. 分类标引:对档案给予分类号标识的过程。

22. 目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。

1.信息——是世界上一切事物的状态和特征的反映,是用文字、数据或信号等形式,通过一定的传递和处理,来表现各种相互联系客观事物在运动变化中所具有特征内容的总称。

2.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。

3.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。

1.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

2.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。

3.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化。1.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识的原始来源和属性的数据库。

1.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。

2.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。

3.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。

1.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。

2.电子报纸——多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。

1.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。

2.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。

3.手册——是汇集某一方面经常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。

4.名录——是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。

1.搜索引擎——就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。

二、填空题

1.信号只是信息的(载体),信息是信号所载荷的(内容)。

2.现实的信息资源依据传递信息的载体和表述方式的不同,可以划分为(口语信息资源),(体语信息资源),(文献信息资源),(实物信息资源),(网络信息资源)。

3.口语信息资源、体语信息资源和实物信息资源,通过计算机技术的转化,成为(网络信息资源),如果有长期开发的价值,往往会转化成(文献信息资源)。

4.(文献)是记录有信息和知识的一切有形载体,是将知识用文字、符号、图像、音频、视频等方式记录在一定的固态物质载体的结合体。

5.期刊按内容和性质划分,可以分为(学术性期刊),(检索性期刊),(其他类型期刊)。

6.(零次文献)是指未经出版发行的或未以公开形式进入社会交流的最原始的文献。

1.信息检索根据检索的目的和对象的不同,可分为(数据检索)、(事实检索)、(文献检索)三种。

2.信息检索工具按存储内容划分有(目录型)、(题录型)、(文摘型)和(全文型)检索工具。

3.信息检索工具按载体划分有(印刷型)、(缩微型)和(电子型)检索工具。

4.主要的布尔逻辑关系符有三种:(逻辑与)、(逻辑或)、(逻辑非)。

5.截词检索的截词符一般用(?)或(* )表示。

1.参考数据库主要包括(书目数据库)、(文摘数据库)和(索引数据库)。

2.SCI是(科学引文索引)的缩写,文献主要来源于(期刊),还有少量的专著、会议录、书评、科技报告和专利文献。

3.EI是(工程索引)的缩写, 90%的文献语种是(英语)。

4.EI收录期刊的三个档次为(全选期刊)、(选收期刊)、(扩充期刊)。

1.(专利文献)是专利制度的产物,反过来说又是专利制度的重要基础。

2.中国专利说明书包括以下几种类型:(发明专利申请公开说明书),(发明专利说明书),(实用新型专利说明书),(外观设计专利说明书)。

3.(国际专利分类法)(IPC)是目前惟一国际通用的专利文献分类和检索工具,为世界各国所必备。

4.会议文献是指通过召开学术会议而产生的文献,包括(会前文献)、(会中文献)和(会后文献)等三种。5.会议文献的出版形式有很多,通常有以下几种:(图书)、(期刊)、(科技报告)、(在线会议)。

6.按照多数国家的学位制度,学位论文包括(学士学位论文)、(硕士学位论文)和(博士学位论文)三种类型。7.(标准)是对工农业产品和工程建设的质量、规格、检验方法、包装方法及贮运方法等方面所制定的技术规格。1.电子图书是(多媒体技术)和(超文本技术)发展的产物。3.目前,我国多家专门从事制作电子图书的商业机构,如(超星图书公司)、(北大方正)、(书生之家)等以及一些专门出版网络电子图书的出版商如博库公司等都算得上是我国电子图书事业的先驱。

4.按制作与出版形式分类,电子图书可分(数据库式)电子图书和(原生)电子图书两类。

5.目前,电子报纸主要有(网络版电子报纸)、(光盘版电子报纸(数据库))、(手机版电子报纸)和(便携式电子报纸)等4种类型。

1.事实和数据的检索是一种能提供具体答案的(确定性检索)。

2.在数据库兴起之前,人们要解决事实与数据的查找问题主要是依靠(参考工具书),而随着计算机技术以及互联网的蓬勃发展,(事实与数值型数据库)以及(网络资源)已经成为人们解决该类问题的首选途径。

3.(词典)是汇集语言里的词语,主要解释词语的概念、意义及其用法,并按照一定的方法编排,以便查阅的工具书。

4.荟萃人类一切知识门类或某一学科知识的完备的工具书称为(百科全书)。

1.(网络信息资源)是通过计算机网络可以利用的各种信息资源的总和。

2.根据信息来源的不同,人们将Internet信息资源分为(政府)、(公众)、(商用)三类信息资源。

3.根据信息资源利用的性质,人们将Internet信息资源分为(开放式信息)、(注册信息)、(交流式信息)三类信息资源。

4.(数据库方式)与(超媒体方式)是网络环境下文献资源组织方式的主流。

5.一般地,人们从(检索策略)和(检索工具)两个方面对Internet信息检索方式进行分类。

6.从广义上讲,搜索引擎应包括两部分:一是(对信息的采集、存储和组织),二是(信息检索)

7.搜索引擎按其工作方式和原理的不同,主要可分为三种,分别是(全文搜索引擎)、(目录索引类搜索引擎)和(元搜索引擎)。1.信息资源搜集的主要方法有(系统检索法)、(科学实验法)、(访问考察法)和(调研法)四种。2.根据内容的不同,文摘可分为以下三大类:(报道性文摘)、(指示性文摘)和(报道指示性文摘)。

3.学位论文的开题一般包括(选题)、(资料搜集)、(撰写开题报告)和(文献综述)几部分内容。

三、简答题

1. 光盘检索与手工检索相比有哪些优势?

使用光盘检索系统,,节省了电讯费和联机系统使用费,还可免除由通信线路传输过程中所造成的失误

光盘系统向用户随盘提供相当于联机信息检索系统功能的软件,并提供菜单驱动与命令驱动两种方式

光盘存贮容量大,耐用,复制费用低

需要大量光盘数据库,受到经费限制

在信息需求的适时性上,光盘检索不如联机检索系统,因为光盘只能定期提供

数据库费用大

手工检索的优势

(1)便于检索者根据文献标引规则查阅相关文献。

(2)手工检索能了解各类检索刊的收录范围、专业覆盖面、特点和编制要点,检索回溯期长,可以提高查全率和查准率。

(3)手工检索灵活性高、费用低。

(4)手工检索也便于检索策略的制定和修改,所得到的文献信息一般能符合检索者的信息要求,并且手工检索过程中发现问题,可以及时地修改和提出。

(5)在载体内容的直观性方面,手工检索也优越于计算机检索。利用手工检索工具,人们无须借助任何转换设备便可一目了然地判读具体文献的描述内容,也能够比较准确地了解其全部。而计算机检索则不然,必须借助于相应的读取工具,如计算机、光盘阅读器等,才能得以判读。

手工检索的缺憾:(1) 检索速度慢 (2 )检索受时空的限制 (3) 检索受馆藏资源的限制 (4) 更新周期长 (5) 检索途径少

2. 信息的特征有哪些?答:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性

3. 简述联机检索的基本原理。

信息用户利用终端设备,通过通讯网络与世界各地的信息检索系统联机,进行人机对话,从检索系统的数据库中查找出用户所需信

息的全过程. 一个典型的计算机信息系统,能完成数据收集,分析,加工处理,存储,传递通信和检索信息的全过程.

4. 信息的概念是什么?信息有哪些特征?

广义的信息概念:即信息是事物运动的状态和方式,也叫本体论信息

狭义的信息概念:即信息是认识主体对事物运动状态和方式的反映,也叫认识论信息信息

具有如下几个特征:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性

5. 检索系统必备四大要素是什么?答:检索文档(数据库)、检索设备(检索硬件及通讯设施)、系统规则、相关人员、。

6. 简述信息检索语言的功能。

信息检索语言是沟通信息存储和信息检索的桥梁;对信息组织人员来说,它是表达信息主题内容,形成标识并赖以组织信息的

依据;对信息检索人员来说,它是表达检索需求的依据。

7. 简述信息检索的作用。答:全面掌握必要信息;提高信息利用效率;提高信息素质;具有一定经济性。

8. 简述信息检索原理(可以用图描述)。

9. 简述网络信息资源的特点。

(1)信息量大,有污染。当我们在检索时,往往会出现许多无关的信息,而信息的真伪是需要鉴别的。

(2)信息共享性好,更新快。Internet上的信息共享性最好,只要在网上的任何一个主机上发表信息,在全世界范围内都能看到。

(3)信息源分散无序。Internet上的信息源是在每个独立的计算机服务器上,使网上的信息源呈现出分散、无政府状态。用户无法判断网上有多少同自己需求有关的信息,给用户的信息检索带来一定的困难。

(4)信息商品化。网上的免费信息多数都是具有一定宣传作用的,真正有用的信息多数是要付费的,可以说Internet上的网络信息具有一定的商品化。

10. 什么是检索策略?

检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等。检索策略考虑得是否周全,直接影响文献的查全率和查准率。优化方法略

11. 简述信息检索的本质。

答:本质就是提问标识语文献标识的对比和匹配。

12. 举例说明什么是一次文献、二次文献、三次文献。

一次文献指以作者本人的研究成果为依据而创作的原始文献,如期刊论文、研究报告、专利说明书、会议论文等。二次文献是对一次文献进行加工整理后产生的一类方面,如书目、题录、简介、文摘等检索工具。三次文献是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为“情报研究”的成果,如综述、专题述评、学科年度总结、进展报告、数据手册等。13.如果要查找有关“转基因生物和细胞及其制备方法”方面的中外文文献,如何查找?请写出具体的检索步骤。

1、分析课题,明确检索要求;

2、选择检索系统:要考虑文献类型

3、选择检索途径

4、选择检索方法

5、查找文献线索

6、获取原始文献

14. 简述文献检索步骤

答:明确信息检索需求、选择检索系统、确定检索词、构造检索表达式、实施检索策略并分析结果、检索策略的修改与完善15. 影响查全率和查准率的因素有哪些?

查全率:R=检出的相关信息量/检索系统中相关信息总量

使用泛指性较强的检索语言(如上位类、上位主题词)能提高查全率,但查准率下降。

使用专指性较强的检索语言(如下位类、下位主题词)能提高查准率,但查全率下降

主要从以下几个方面考虑:选词、选择数据库是否全面;时间,文献类型

16. 信息检索系统都包含哪些子系统?

答:文献信息选择子系统;检索语言和名称规范子系统;标引著录子系统;查询子系统;交互子系统;匹配子系统。

17. 简述信息检索的特征。答:相关性;不确定性;逻辑性。

18. 信息检索智能化主要体现在哪些方面?

答:检索技术智能化;检索结果处理智能化;检索服务智能化。

19. 某同学在检索一个课题时,第一次检索的结果有200条文献,你建议一下她采用何种方式来缩小检索范围?

增加文献的检准率,减少文献的检全率

第一,变逻辑或为逻辑非,增加“and”的检索词

第二,限定文献的类别,(如该文献是医学方面的,就将其限定在医学这个大类下)

第三,或变模糊检索为精确检索

第四,增加其他的限度,这就要看你自己的,如有没有年限现在啊,作者之类

20. 什么是检索策略?计算机检索策略的制定一般经过哪几个步骤?

检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等。检索策略考虑得是否周全,直接影响文献的查全率和查准率。

检索步骤(1)弄清信息需求,明确检索目的(2)选择数据库,确定检索途径(3)确定课题的概念组面和检索标识

21. 简述专利的新颖性、创造性及实用性的含义,并说明中国保护的专利有哪几种类型?

专利的新颖性,是指申请日前没有同样的发明或者实用新型在国内外出版物上公开发表过、在国内公开使用过或者以其他方式为公众所知,也没有同样的发明或者实用新型由他人向国务院专利行政部门提出过申请并且记载在申请日以后公布的专利申请文件中。

专利的创造性:是指在有新颖性的情况下,不同的技术之间实际上是没有产生意想不到的技术效果,简单说,就是两者之间的差异不明显,而且效果无进步.

专利的实用性:指该理论或者观点的提出对实践的知道程度。

中国保护的专利类型有3种类型,分别是:发明专利、实用新型专利和外观设计专利。

22. 什么是信息检索查全率和查准率?两者之间的关系如何?

查全率(Recall Ratio) 当用户要全面检索某一信息库时,检出的成功度可用检出的所有相关信息在信息库所有相关信息中所占的比例来表示。这种对信息库检索全面性的测量指标即为查全率。查全率与系统能够检索出的相关文献能力有关。可定义为:

查全率 =(检出的相关信息数/信息库中相关信息总数)×100%

查准率(Precision Ratio) 当用户要对检索到的结果进行分析时,检出的相关信息数在所有检出信息中所占的比例往往成了较重要的评判指标。这种对检索结果中的相关信息的测量指标即为查准率。也有称为信号噪声比(signal-to-noise ratio)。查准率与检索出的相关信息数有关。可定义为:查准率 =(检出的相关信息数 /检出的信息总数)×100%

查全率和查准率必须结合使用,单独使用两者中的任何一个都不能全面说明检索效果的好坏。若检出 1 篇相关信息,必能达到100% 的查准率,但查全率却会非常低;同样,若检出的信息数等于库中信息的总量 a + b + c + d ,则必能获得 100% 的查全率,但很显然查准率必定也低得可怜。

查全率和查准率是评价检索效果好坏的指标,而漏检率和误检率则是测量检索误差的指标。

23. 影响信息检索效果的因素有哪些?

(1) 影响查全率的因素从文献存储来看,主要有:文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念或用词不当等。此外,从情报检索来看,主要有:检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟练和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等。

(2) 影响查准率的因素主要有:索引词不能准确描述文献主题和检索要求;组配规则不严密;选词及词间关系不正确;标引过于详尽;组配错误;检索时所用检索词(或检索式)专指度不够,检索面宽于检索要求;检索系统不具备逻辑"非"功能和反馈功能;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用逻辑"或"不当等等。

实际上,影响检索效果的因素是非常复杂的。根据国外有关专家所做的实验表明,查全率与查准率是呈互逆关系的。要想做到查全,势必会要对检索范围和限制逐步放宽,则结果是会把很多不相关的文献也带进来,影响了查准率。企图使查全率和查准率都同时提高,不是很容易的。强调一方面,忽视另一方面,也是不妥当的zx。应当根据具体课题的要求,合理调节查全率和查准率,保证检索效果。

24. 信息检索的方法有哪几种?

从检索手段看,信息检索分为: 手工信息检索机械信息检索计算机信息检索

25. 什么是信息检索漏检率和误检率,二者之间的关系如何?

误检率为检出的结果中,不相关信息占检出信息的比例。这种对检索结果中不相关信息数的测定即为误检率。可定义为:误检率 =(检出的非相关信息数/检出的信息总数)× 100%

漏检率为系统未检索出的相关信息占库中相关信息总数的比例。这种对检索结果中不包含系统中存在的相关信息数的测定即为漏检率。可定义为:漏检率 =(未检出的相关信息数/信息库中相关信息总数)× 100%

其实,查全率和漏检率是互补的;而查准率和误检率也是互补关系。即:查全率 + 漏检率 = 1 ;查准率 + 误检率 = 1 。漏检率和误检率则是测量检索误差的指标。

26. 试比较分类语言与主题词语言

分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以及混合分类语言。

主题语言是直接以表达主题内容的语词作为检索标识,以字顺为主要检索途径的标引和检索信息的语言。主题语言是一种描述性语言,它使用自然语言中的词语或规范化的词语来描述文献所论述或研究的事物概念,具有较强的直观性、专指性和灵活性。

信息存储与检索复习资料

一、名词解释 1. 主题标引:是在主题分析的基础上,依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程。 2. INTERNET(因特网):泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。 3.顺查法:就是以课题研究的起始年限为出发点,利用选定的检索工具如书目、索引、文摘又远及近的逐年查找。 4.三次文献: 是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为“情报研究”的成果 5.文献信息资源:文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源。 6. 倒查法:一种逆时间顺序由近而远地查找信息的方法. 7. 一次文献:即原始文献。它是作者以生产或科研为依据而创作的原始文献。如专著、期刊论文、学位论文等。 8. 检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。 9. 手工检索:是由检索者通过卡片式或书本式的目录、题录、文摘、索引等检索工具查找文献线索的过程。 10. 信息检索语言:信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言。 11. 特种文献:特种文献是指出版发行和获取途径都比较特殊的科技文献。特种文献一般包括会议文献、科技报告、专利文献、学位论文、标准文献等。 12.间接检索法:利用一定检索工具进行文献检索 13. 专利:有三层含义:一指受专利法保护的发明,二是指专利权,三指专利说明书等专利文献。这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体体现。 14.搜索引擎:是一种 Web 上应用的软件系统,它以一定的策略在 Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。 15. 技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。 16. 索引:根据标题法的原理,将类目及其注释改成标题形式,按字顺排列,并注明相应的分类号。这样不仅可方便查表,而且还可将分类表中因为按学科分类而被分散的同一事物不同方面的类目集中,使分类法在某种程度上兼有主题法的性能。 17.抽查法:针对研究课题发展的特点,选择有关的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。 18. 回溯检索:又叫追溯法,是以某一篇文献末尾所附的参考文献为依据,由近及远进行逐一追踪的查找方法. 19. 循环检索:先利用检索工具查出一批有用文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找. 20. 追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法。 21. 分类标引:对档案给予分类号标识的过程。 22. 目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。 1.信息——是世界上一切事物的状态和特征的反映,是用文字、数据或信号等形式,通过一定的传递和处理,来表现各种相互联系客观事物在运动变化中所具有特征内容的总称。 2.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。 3.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。 1.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 2.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。 3.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化。1.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识的原始来源和属性的数据库。 1.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。 2.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。 3.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。

信息存储与检索期期末试卷A

淮安信息职业技术学院2007~2008学年度第二学期 《 信息存储与检索 》期末试卷(A 卷) 考试班级:650514 1、模型、碑刻属于哪类信息资源( )。 A .口语信息资源 B. 体语信息资源 C.实物信息资源 D.文献信息资源 2、期刊、报纸属于哪种文献类型( )。 A . 图书 B. 工具书 C.连续出版物 D.特种文献 3、甲乙二人各有一条信息,二人交流后,每人拥有两条信息,说明信息具有( )。 A 客观性 B 相对性 C 依存性 D 共享性 4、查找特定类型的文件的高级搜索语法命令为( )。 A :filetype B :intitle C :site D :inurl 5、手册属于哪类检索工具书的范畴( )。 A.检索性工具书 B.参考性工具书 C.词语性工具书 D.图录性工具书 6、在没有检索工具或检索工具不齐备的情况下,我们可以使用( )。 A . 直接检索法 B. 抽查法 C.回溯检索法 D.循环检索法 7、下列各项属于类书的是( )。 A .《永乐大典》和《资治通鉴》 B. 《永乐大典》和《古今图书集成》 C. 《四库全书》和《古今图书集成》 D. 《天下郡国利病书》和《四库全书》 8、关于全文型(索引型)搜索引擎信息采集和索引机制,错误的说法是( )。 A. 采用网页采集机器人robot ,循着超链接不停采集访问到的页面 B. 网页采集机器人可以采集到所有的页面 C. 自动提取网页中的关键词建立索引 D. 网页的更新有一定的周期,有时候存储的网页信息已经过时 9、分类搜索引擎的典型代表是( ) 。 A .Google B .Baidu C .Yahoo! D .Search 系部 : 班 级: 学 号: 姓名 :

网络信息检索试题及答案(DOC)

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有( C )特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含( B ): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?( A ) A. 文摘 B. 会议文献 C. 辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于( A )。 A. 零次文献 B. 一次文献 C. 二次文献 D. 三次文献 9、下列选项中哪一项属于“国内统一刊号”(C )。 A. ISBN 7-04-014623-1 B. ISSN 0254-4164 C. CN 11-2127/TP D. 0254-4164/TP 10、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( C )参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL] .(2001-12-19) [2002-04- 15]. http:∥www. ….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( B )参考文献的著录条目描述。 昂温G,昂温P S .外国出版史[M]. 陈生铮,译. 北京:中国书籍出版社, 2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

信息存储与检索课堂笔记

第1章信息检索概论 1.信息的定义: 从认识论出发,我国大多数学者认为: 信息具有物质属性,是物质的一种存在形式,它以物质的属性或运动状态为内容,并且总是借助于一定的物质载体传输或存储。 2.信息的特征: (1)传递性 (2)时效性 (3)共享性 (4)客观性 其他的特性还有开发性、存储性、价值的不定性、变换性、可伪性等。 3. 信息检索(Information Retrieval) 定义: 广义概念——是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,故全称:“信息存储与检索(Information Storage and Retrieval ) 。 狭义概念——仅指上述过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。 4.信息检索的基本步骤 课题分析,明确检索范围 选择检索系统和检索工具 确定检索点和检索途径 构造检索式 选定检索方法 索取原始文献 5.计算机检索的发展历程 计算机检索是在计算机技术和通信技术发展的基础上建立起来的。它产生于20世纪50年代,发展于80年代中期,90年代后随着国际互联网技术的发展而进入了一个崭新的时期。发展历程大致可以概括为: 手工信息检索阶段(1954之前) 脱机信息检索阶段(1954/1964) 联机信息检索阶段(1965/1971) 光盘信息检索阶段(1972/1994) 网络信息检索阶段(1995年至今) 6.知识的定义 人们通过实践对客观事物及其运动过程和规律的认识。在这里,知识作广义的理解,包括消息、情况、事实、数据。 知识可分为理性知识和感性知识。理性知识,是对客观事物的本质和规律性的认识,是经过思维、逻辑加工的知识,构成知识体系;感性知识,是对客观事物的描述和对现象、事实的感知,是未经逻辑加工的知识。 知识的分类 知识按不同标准可作如下分类:

信息存储与检索B卷

济南大学继续教育学院信息存储与检索试卷(B) 学年:学期: 年级:专业:学习形式:层次: (本试题满分100分,时间90分钟) 一.选择题(每题2分,共20分) 1.《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是()。 A、G636.33 B、G216.2 C、I247.4 D、H319 2.布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是() A、检索出除了中年教师以外的在职人员的数据 B、中年教师的数据 C、中年和教师的数据 D、在职人员的数据 3.()是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比 率。 A、查全率 B、查准率 C、误检率 D、漏检率 4.布尔逻辑检索中检索符号“OR”的主要作用在于()。 A、提高查准率 B、提高查全率 C、排除不必要信息 D、减少文献输出量 5.根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定 的方法编排,并指明出处,为用户提供文献线索的一种检索工具是()。 A、目录 B、题录 C、索引 D、文摘 6.文献按载体形式可分为:印刷型、缩微型、声像型和() A、甲骨型 B、金石型 C、电脑型 D、机读型 7.信息检索系统的功能为:报道文献信息、存储文献信息和() A、揭示文献信息 B、检索文献信息 C、宣传文献信息 D、介绍文献信息 8.知识是指人类对客观世界的认识。知识可分为() A、有用知识和无用知识 B、基础知识和高级知识 C、感性知识和理性知识 D、理论知识和实践知识 9.检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和() A、目次 B、题录 C、附图 D、正文(主文档) 10.为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的 标识叙述是正确的() A、TI是题名的标识符 B、AB是关键词的标识符 C、AU是摘要的标识符 D、AF是著者的标识符 二.多选题(每题2分,共20分) 1.信息检索的常用途径有:主题词、关键词、顺序号、引文和() A.题录 B.作者 C.全文 D.题名 E.分类 2.工具法查找文献信息资源的方法可分为() A.顺查法 B.调查法 C.抽查法 D.倒查法 E.取样法 3.常见的索引有以下几种() A.分类索引 B.主题索引 C.著者索引 D.编号索引 E.引文索引 4.信息检索效果评价标准为(A、D、E) A.查全率 B.错误率 C.准确率 D.查准率 E.漏检率 5.查找中文会议论文全文资料,可利用下列哪些数据库进行查找。() A.国研网 https://www.360docs.net/doc/0b1704825.html,KI C.维普科技期刊全文数据库 D.人大复印资料 E.万方数据资源 6.用户在超星电子图书馆中可享受的服务为() A.下载图书 B.添加个人书签 C.发表评论 D.讨论 E.标注 7.Elsevier数据库(国外站点)SDOL主页的菜单栏内容:Home,Browse,Search和() A.My Alert B.My settings C.Help D.Tools E.Alert 8.SD数据库的期刊浏览提供的浏览方式为() A.依刊/书名字母顺序浏览 B.依文章的篇名字母顺序浏览 C.依期刊/图书内容所属学科主题分类浏览 D.个人定制内容浏览 第 1 页共2 页

情报检索试题及答案

一、单项选择题(共20题,1分/题,共20分) 1. 刘志强.我国农业生态环境可持续发展评价及对策[J].农业系统科学与综合研究,200l,17(3):24-26该参考文献的17(3):24-26的含义应该是: a.17卷3页24-26行 b. 17卷3页24-26行 c. 17卷3期24-26页 d. 17期3部分24-26页 2. ISSN0023-1231.是_____ a. 国际标准书号 b.国际标准刊号 c.图书分类号 d. 标准号 (国际标准书号:ISBN) 3. 查找某一年的新闻、事件、数据和统计资料,应该用___ __类参考工具书。 a.百科全书 b.手册 c.年鉴 d.统计资料 4. 在以下列出的搜索引擎中哪一种是专门搜索学协会数据库资源的搜索引擎? a. Google scholar b.Google book search c.Scirus d. Scitopia 5. 用google在华中科技大学的网站内进行站内搜索应使用: a. link: b. related: c. site: d. info: 6. 在ELSVIER SCIENCE DIRECT数据库中使用哪个符号表示精确检索: a. “” b.() c.[ ] d.{ } 7.可以检索color或者colour的最常用检索式是: a. 输入:color或者colour b. 输入:color and colour c. 输入:color*colour d.输入:colo?r 8. 我馆购买的下列名称的检索工具中,目前不能用来检索学位论文的是: a. CNKI b. 维普 c. Proquest d. 万方 9. 用维普《中文科技期刊数据库》查询刊物《图书情报知识》的关于数字图书馆的文献,检索式为: a. K=数字图书馆*图书情报知识 b. K=数字图书馆+J=图书情报知识 c. K=数字图书馆*J=图书情报知识 d. K=数字图书馆*A=图书情报知识 10. 某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论 文总数得出的结果是: a.影响因子b.立即影响指数c.H指数d.Eigenfactor 11. 用IEEE检索系统检索computer programming方面的论文,限定computer和programming 词序一定但间隔至多不能超过2个单词,则检索式应该是: https://www.360docs.net/doc/0b1704825.html,puter 2w Programming https://www.360docs.net/doc/0b1704825.html,puter NEAR/2 Programming https://www.360docs.net/doc/0b1704825.html,puter w2 Programming d. .Computer ONEAR/2 Programming 12.下面哪个出版社不是新成立的纯OA出版社?

文献检索复习题(名解-简答)

文献检索复习题(名解-简答)

文献检索复习题 一、名词解释 1.二次文献信息:二次文献也称二级文献,它是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。 2.学科化服务:指图书馆设专人与某一学科专业作为对口单位建立联系,在院系、学科专业与图书馆之间架起一座桥梁,相互沟通,为用户主动地,有针对性的收集和提供文献信息的服务。 3.网络电子图书:以电子图书形式发行,以互联网为流通渠道,以数字内容为流通介质,以网上交易为主要支付手段的图书。 4.专利文献:是实行专利制度的国家、地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。 5.引文分析法:引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。

6.书目数据库:是指存储某些或某一个领域的二次文献书目数据的一类数据库。 7.个性化导读服务:又称阅读指导服务,是图书馆针对各类型读者,采取各种措施主动诱导读者的阅读行为,提高其阅读意识,阅读能力和阅读效益的一种教育活动。 8.双词频控制检索:指对一个检索项中的两检索词分别实行词频控制,也就是一个检索项使用了两次词频控制。是针对单项双词组合检索而设置的。 9.专利法:专利法是确认发明人(或其权利继受人)对其发明享有专有权,规定专利权人的权利和义务的法 10.网络信息资源:网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。具体的说是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。 11.参考数据库:指为用户提供信息线索的数据库,它可以指引用户获取原始信息。参考数据库包括书目数据库(Bibliographic Database)和指南数据库(Referral Database)。

《信息检索与利用》期末复习1

《信息检索与利用》期末复习 试题题型 一、填空题(每空3分,共15分) 二、选择题(每题3分,共30分) 三、判断题(每题3分,共30分) 四、简答题(共25分) 1.(12分) 2.(13分) 复习题 第一章信息资源检索基础知识 一、填空题 1.___________________________是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息 2.___________________________是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。知识 3.___________________________是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。情报 4.___________________________是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。文献 5.___________________________是指在国内外学术或非学术会议上发表的论文或报告。会议文献 6.___________________________是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。学位论文 7.___________________________是对文献内容和形式特征进行选择和记录的过程。著录8.___________________________是指特定的数值型数据为对象的检索。数据检索 9.___________________________是指以特定的事实为目标的检索。事实检索 10.事实与数据检索工具主要依靠各类___________________________完成各种数据或事实的查询。参考工具书 11.按照结构原理,信息检索语言可以分为_____________________、____________________、

信息存储与检索

第一章 1.信息的涵义: 申农(信息论创始人):用于消除随机不确定性的东西(信源、信宿) 广义信息是物质、能量存在和运动状态的表征. 狭义信息是人类社会共享的一切知识、学问以及从客观现象中提炼出来的各种消息的总和,即现代信息 2.资源的涵义 资源是一切被人类开发和利用的客观存在。 3.信息资源的涵义 狭义指文献资源或数据资源,抑或各种媒介和形式的信息的集合,包括文字、声像、印刷品、电子信息、数据库等。这都是限于信息的本身。 广义信息资源是信息活动中各种要素的总称。这既包含了信息本身,也包括了与信息相关的人员、设备、技术和资金等各种资源 (1)原始数据与信息的区别 原始数据经过加工处理变为信息 (2)信息与信息资源的区别 经过加工、可被利用的信息称为信息资源。 information resource为复数时,常指信息及与信息有关的设备、人员等集合,是经过人类选取、组织、序化的有用信息的集合。 (1)信息资源是信息的集体; (2)信息资源是经过人类选择、获取的有用信息的集合; (3)信息资源是经过人类组织序化的信息的集合。 4.信息的基本性质 (1)信息是内容是客观的(2)信息的形式是主观的(3)信息是一切物质的基本属性 5.与信息有关的概念 (1)知识。 是对客观事物规律性认识,是系统化和精炼化的信息 知识的三种存在方式:大脑、实物、文献 知识的七个特征:①不可替代性②不可相加性③不可逆性④不可磨损性⑤不可分性⑥可共享性⑦无限增值性 知识分类:①事实知识(Know What)②原理知识( Know why)③技能知识( Know how)④人力知识( Know who)⑤时间知识( Know When)⑥空间知识( Know Where)⑦数量知识( Know Quantity ) (2)文献。是记录知识的一切载体,即用文字、图形、符号、或声视频等记录方式在一定介质上所生成的物质成果 文献的三要素:记录、知识、载体 文献的功能:①存储功能②传递功能③认识功能 (3)情报。指为一定目的而搜集和传递的有特定效用的知识 情报的基本属性:传递性、效用性 6.信息资源的基本特征 (1)普遍性(2)传递性(3)时效性(4)价值性(5)可转换性(6)可利用性(7)可共享性

信息检索题目(含答案)

2013年(秋)《信息检索》练习 单选题(每题1分,共45题,45分) 1.计算机中使用的0与1的二进制代码是(C) A.自然信息 B.生物信息 C.机器信息 D.人类信息 2.以下(B)不是信息的基本要素。 A.载体 B.数据库 C.信源 D.信宿 3.国际标准书号中地区号为7,代表其是(B)出版的图书。 A.美国 B.中国大陆 C.俄语系国家 D.法语系 4.以下(D)不是信息的特征。 A.共享性 B.价值型 C.时效性 D.不可扩充性 5.(A)使用的是http协议。 A.WWW网络资源 B.FTP信息资源 C.TELNET信息资源 D.用户服务组资源 6.(B)使用的是ftp协议。 A.WWW网络资源 B.FTP信息资源 C.TELNET信息资源 D.用户服务组资源 7.分类法用(A)作为文献容标识和检索标识。 A.分类号 B.词语 C.阿拉伯数字 D.英文字母

8.主题法用(A)做描述文献主题的标识和检索标识。 正确答案:B A.分类号 B.词语 C.阿拉伯数字 D.英文字母 9.关键词语言属于(B) 正确答案:A A.自然语言 B.标题词语言 C.叙词语言 D.分类语言 10.以下族性检索功能最强的是(A) A.分类途径 B.文献名途径 C.著者途径 D.主题途径 11.(D)是从参考文献着手来查找文献的方法。 A.顺查法 B.倒查法 C.抽查法 D.追溯法 12.一个截词符代表多个字符指的是(D) 正确答案:C A.后截词 B.中截词 C.无限截词 D.有限截词 13.在布尔逻辑检索技术中,用(B)表示在检索结果中只需包含A或者B即可。正确答案:D A. A not B B. A and B C. A - B D. A or B 14.(B)之前,必须输入一个空格。 正确答案:C A.与运算 B.或运算

信息存储与检索 考试必看

一、填空 1、信息资源的特征:共享性、时效性、智能性、无限性和有线性并存、增值性及物质、 资源的一般特征。 2、纸质文件按文献加工深度划分:一次文献、二次文献、三次文献、零次文献。 3、索引款目的构成:索引标题、说明语、地址参考项。 4、多媒体存取技术的核心是:媒体数据库技术。 5、网络信息检索工具有:字典型查询工具、索引型查询工具、交互式检索工具。 6、按系统存取的信息特征划分:文献存取系统、事实存取系统、数值存取系统、图像 存取系统。 7、按检索工具划分:关键词检索工具、分类目录、混合型检索工具。 8、纸质文献资源的四个基本要素:信息内容、载体材料、记录符号和记录方式。 9、按检索系统的工作方式划分:脱机存取、联机存取、光盘存取、因特网存取。 10、文献存取系统包括:书目、全本和超文本。 11、存取系统的检索效果指标:检全率、检准率、检新率。 12、多元性检索工具: 13、中文搜索引擎:谷歌、百度、雅虎、中国搜索、搜狗搜索等。(三个可) 14、多媒体信息存取系统的特征:信息载体的多样性、交互性、实时性、集成性。 二、名称解释: 1、电子信息资源是以数字化形式把文字、图像、声音、动画等多种形式的信息存储在 光、磁盘等非印刷型介质上,并以光信号、电信号的形式传输,通过相应的计算机和其他外部设备再现出来的信息资源。 2、索引是存取信息资源“地址”或“出处”的表示系统,是信息存储与检索的基本形 式。其基本功能是指示知识点在正文或文献款目中得位置。 3、标准文献狭义指按规定程序制订,经公认权威机构(主管机关)批准的一整套在特定 范围(领域)内必须执行的规格、规则、技术要求等规范性文献,简称标准。广义指与标准化工作有关的一切文献。 4、网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。具体的说是指 所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。 5、智能检索以文献和检索词的相关度为基础,综合考查文献的重要性等指标,对检索 结果进行排序,以提供更高的检索效率。它是由智能计算机技术与全文检索技术综合发展起来的一种新型检索技术。 6、视频存取技术是近几年来在数字通信、电视和电子计算机技术三者相结合的基础上 发展起来的一种新型的信息存取技术,分为广播式和交互式两种。 7、题名索引是将信息资源的题名特征(书名、刊名、篇名)作为索引标题词所编制的 索引系统。 8、目录是书籍正文前所载的目次,是揭示和报道图书的工具目录是记录图书的书名、 著者、出版与收藏等情况,按照一定的次序编排而成,为反映馆范、指导阅读、检索图书的工具。 9、检索语言是根据信息检索的需要而创制的,能够唯一地表达各种概括文献信息内容 的概念,能够显示概念之间的相互关系,并便于进行系统排列,便于将标引语言和检索用语进行相符性比较的人工语言。 10、信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。一般是通过信息存取系统实现的,通常包括四种

信息存储与检索复习资料答案

信息存储与检索复习资料答案

一、单项选择题 1. 以下哪个数据库提供同名作者检索功能:(D ) A.万方数据库 B.中国期刊全文数据库 C.复印报刊资料全文数据库 D.中文科技期刊全文数据库 2. _______提供一次文献的线索。(B)A.文摘、索引等B.图书C.百科全书D.手册 3. 以下属于特种文献的是( B)。A.图书 B.科技报告 C.报纸D.期刊 4. 用主题词检索只可以检索出对应的() 5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权 6. 利用分类途径进行检索,其检索标识为( C )A.主题词B.关键词C.分类号D.分子式 7. 在一般的著录格式中可以通过_______来判断该文献为会议文献( C ) A.Journal B.Report C.Conference D.Patent 8. 下列选项中,不属于信息能力的有( B ) A.鉴别B.传递 C.评价 D.有效利用 9. 从狭义上说专利文献就是指(专利注明书) 10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这

个按钮的作用是什么?(D) A.测试你当天的手气B.提供最相关的一组检索结果列表 C.提供最相关的一个检索结果的链接 D.直接跳转到系统认为是最相关的页面 11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况(D) A、Citation Index; B、Corporate Index; C、Permuterm Subject Index; D、Source Index; 12. 文献信息检索的全过程包括文献信息的______两个过程( C ) A.存贮和检索 B.存贮和编排 C.标引和编排 D.存贮和标引 13. 利用分类途径进行检索,其检索标识为( C )。A.主题词 B.关键词 C.分类号 D.分子式 14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找?( C. ) A.中文科技期刊全文数据库 B.复印报刊资料全文数据库 C. 超星数字图书馆 D.万方数据资源系统 15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好?(C) A.关键词摘要intitle:知识管理 B.论文知识管理PDF C.学术论文知识管理 D.学术论文intitle:知识管理

(完整版)文献信息检索试题及答案

文献信息检索 一、填空题 1、文献的级次分为零次文献、一次文献、二次文献、三次文献。 2、按内容可将计算机检索系统的数据库类型分为:文献书目型数据库、事实型数据库、数值型数据库和全文型数据库。 4、我国标准可分为国家标准、部标准和企业标准三大类。 5、在实际检索中,文献的检索方法主要有:直查法、追溯法、工具法和综合法。 6、信息检索常用的方法有:引文追溯法、工具法和循环法。 7. 构成文献的三要素是知识、载体和记录。 8. 标准文献的主体是标准。 9. 期刊论文的文献出处包括期刊名称、年卷期和起止页码。 10. 所需信息被检出程度的信息量指标为查全率。 二、选择题 1. 文献是记录有知识的( A ) A 载体 B 纸张 C 光盘 D 磁盘 2. 下列哪种文献属于一次文献( A ) A 期刊论文 B 百科全书 C 综述 D 文摘 3. 下列哪种文献属于二次文献( D ) A 专利文献 B 学位论文 C 会议文献 D 目录 4. 下列哪种文献属于三次文献( C ) A 标准文献 B 学位论文 C 综述 D 文摘 5. 下列选项中属于连续出版物类型的选项有( C ) A 图书 B 学位论文 C 科技期刊 D 会议文献 6. 下列选项中属于特种文献类型的有( D ) A 报纸 B 图书 C 科技期刊 D 标准文献 7. 纸质信息源的载体是( D ) A 光盘 B 缩微平片 C 感光材料 D 纸张

8. 以刊载新闻和评论为主的文献是( B ) A 图书 B 报纸 C 期刊 D 会议文献 9. 使用分类语言对信息进行描述和标引,主要是可以把( B )的信息集中在一起。 A 同一作者 B 同一学科 C 同一主题 D A+B+C 10.《中国图书馆分类法》(简称《中图法》)将图书分成( A ) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 11.《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。 A S类目 B Q类目 C T 类目 D R类目 12. 利用文献末尾所附参考文献进行检索的 方法是( C ) A 倒查法 B 顺查法 C 引文追溯法 D 抽查法 13. 至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为( A ) A 数据库 B 记录 C 字段 D 文档 14. 广义的信息检索包含两个过程( B ) A 检索与利用 B 存储与检索 C 存储与利用 D 检索与报道 15. 狭义的专利文献是指( C ) A 专利公报 B 专利目录 C 专利说明书 D 专利索引 三、判断题 1. 1948年,美国数学家、信息论的创始人维纳在题为《通讯的数学理论》的论文中指出:“信息是用来消除随机不定性的东西”。 ( × ) 2. 从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。(×)----从文献检索的角度来看,一次文献是检索的对象,二次文献是用于检索的主要手段和工具。 3. 《中国图书馆分类法》是按知识门类的学科体系的逻辑次序进行分类。(√)

复习题(有答案)

复习题 一、名词解释及简答 信息的概念及特征 文献及分类 情报、信息、知识、文献的关系 目录 追溯法 文献信息资源 ISBN和ISSN的组成及组成部分的含义 《全国报刊索引》 信息检索的含义及分类(广义的信息检索) 信息检索语言 信息检索的基本原理 布尔逻辑运算中的各种符号的含意 图书馆各种数据库的检索途径 计算机检索系统的构成 计算机信息检索常用的检索技术 四大权威检索数据库是哪些? 专利及分类 试比较分类语言与主题词语言 按信息加工形式分,信息源分为一次文献、二次文献和三次文献,请简述它们及其之间的关系 什么是查全率和查准率?影响查全率和查准率的因素有哪些? 常用的布尔逻辑算符有几种?并简述各自的作用 文献综述 学位论文的含义及分类 参考文献的著录格式 1. 知识: 知识是人们通过实践对客观事物及其运动过程和规律的认识。主观知识、客观知识。

2. 检索工具:检索工具是指用以报导、存贮和查找文献线索的工具。它是附有检索标识的某一围文献条目的集合,是二次文献。 3. 信息检索:广义的,包括信息的存储和检索两个过程,信息存储——指工作人员将大量无序的信息集中起来,根据信息源的外表特征和容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。 信息检索——指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。狭义信息检索:仅指信息的检索过程。从某一信息集合中找出所需的信息的过程,即信息查询。 4. 信息:信息是人们通过感觉器官与外界进行交换的一切容。 1. 知识:知识是人们通过实践对客观事物及其运动过程和规律的认识。主观知识、客观知识 2. 信息:信息是人们通过感觉器官与外界进行交换的一切容。 3. 信息检索:广义的,包括信息的存储和检索两个过程,信息存储——指工作人员将大量无序的信息集中起来,根据信息源的外表特征和容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。 4. 检索工具:检索工具是指用以报导、存贮和查找文献线索的工具。它是附有检索标识的某一围文献条目的集合,是二次文献。 5. 查全率:查全率=[检出相关文献量/文献库相关文献总量]×100% 查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。 5.信息存储:是指通过多种形式记录和排序信息的过程。它包含三层含义:一是将所采集的信息按照一定规则记录在相应的信息载体上;二是将这些载体按照一定的特征和容性质组织成系统有序的、可供自己或者他人检索的集合体;三是应用计算机等先进的技术和手段,提高信息存储的效率和信息利用水平。 6信息检索:是指从以任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法与过程。 7.数据仓库:Data Warehouse,是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。

信息存储与检索练习题

信息存储与检索练习题 二、问答题 1.简述信息、资源的概念。 信息:是生物以及具有自动控制系统的机器通过感觉器官或者细胞组织,或者具有类似功能的设备部件与外界进行交流的一切内容。 资源的涵义:资源可分为两个范畴,一是自然界赋予的自然资源;二是人类社会中人的劳动创造的各种资源。资源是一切可被人类开发和利用的客观存在。 2.简述信息资源的概念及特征。 信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。 共享性这是信息资源区别于物质资源的根本属性之一。一般来说,信息资源可同时为众多的使用者享用,也可被不同时期的使用者使用,同一条信息可以同时为不同领域的人服务、满足不同的需要。而不象物质资源那样具有排他性,即特定的物质资源只能被某些国家、地区或某些群体、甚至个人占有和消耗。当然,一些人可控制或保密的信息,不具有这一特性。 时效性:一般来说,信息资源的时效性,是由事物运动变化的规律决定的。因此,信息资源能否转化为生产力,取决于收集、加工和利用信息是否适时,只有时机适宜,才能发挥最佳效益。 智能性:信息资源是人类按照一定次序开发与组织起来的信息,是人类脑力劳动的产物。 无限性与有限性并存 增值性即对信息资源的投入和使用,不但可以使自然资源、人力资源、资本资源增值,同时信息资源可以一次投入、多次开发利用,并不断产生新的信息使其自身增值。 3.简述电子信息资源含义。 含义:电子信息资源书是以数字化形式(即二进制代码0、1),把文字、图像、声音动画等,多种形式的信息存储在光、磁等非印刷型介质上,以光信号、电信号的形式传输,并通过相应的计算机和其他外部设备再现出来的信息资源。 4.什么是信息检索信息检索的类型有哪些 信息检索的概念:通过一定的方法和手段将用户的提问特征与数据源所采用的特征标志进行对比,然后将二者相一致或比较一致的信息提取出来供用户使用的过程。 类型:文献检索数据检索事实检索 5.简述信息存储与检索原理。 信息检索的全称形式或广义的信息检索,它既包括采用多种形式记录信息、排序信息的信息存储过程,也包括通过一定的设备、采用一定的手段与技巧从信息系统中快速、准确地搜寻所需信息的方法与过程。 信息存储与检索的基本原理:查询语言(检索提问)和系统标识语言所进行的“相符性比较”与“匹配运算”。 6.简述信息存储与检索类型。 一是关于文献的检索;二是关于某事实或事项的知识检索;三是关于数

信息储存与检索考点归纳

1. 信息检索的原理: 从下图可以看出,信息存储和信息检索有两个交汇处:一个是直接的,即表达信息主题内容的词语与表达需求主题内容的词语之间进行对比的交汇;另一个是间接的,即通过检索语言进行沟通,确保把存储用词和检索用词都统一到同一个检索语言体系中(对于自然语言检索系统来说,不存在存储与检索的间接交汇处)。 2.信息检索系统的物理结构一般包括硬件 软件 数据库3个部分。 信息检索系统的逻辑结构 3.信息检索的研究内容包括以下几个方面:(1)信息检索理论研究(2)信息检索方法研究 (3)信息检索技术研究(4)信息检索语言研究(5)信息检索系统研究 (6)信息检索服务研究(7)信息检索评价研究。 4. 任何检索策略都包括3 个部分:文档表示 查询表示 匹配函数。 5..信息检索模型到底是什么?其描述如下: 信息检索模型是一个四元组/D ,Q ,F ,R(qi, dj)/: (1)D 是文档集中的一组文档逻辑视图(表示),称为文档的表示; (2)Q 是一组用户信息需求的逻辑视图(表示),这种视图(表示)称之为查询; 信息资源信息搜集需求分析信息需求信 息用户信息分析信息表达词语 转 换需求表达词语转换数据库 检索结检 索语言 信息存储过 信息检索过 图1-1 广义信息检索的基本 词语子系统 匹配子系统 采选子系统 标引子系统 交互子系统 数据库 用户群 信息源 查询子系统 图1-9 信息检索系统逻辑结构

(3)F 是一种机制,用于构建文档表示,查询及它们之间关系的模型; (4)R(qi, dj)是排序函数,该函数输出一个与查询qi ∈Q 和文档表示dj ∈D 有关的实数,这样就在文档之间根据查询qi 定义了一个顺序。 6经典模型: 布尔模型 向量模型 概率模型。 7对于布尔模型而言,标引词权值变量都是二值的,即wi,j ∈{0, 1},查询q 是一个常规的布尔表达式。用qdnf 表示查询q 的析取范式,qcc 表示qdnf 的任意合取分量。文档dj 和查询q 的相似度可以定义为: . 8.布尔模型优缺点:优点: 一是实现起来比较容易,速度快,计算的代价相对较少; 二是查询语言表达简单,用户可以使用任意复杂的查询表达式,故得到广泛的应用. 缺点;1布尔逻辑式的构造不易全面反映用户的需求。 2匹配标准存在某些不合理的地方。 3检索结果不能按照用户定义的重要性排序输出。 9.( t1 and t2) or ( t3 not t4) 或者qj = ( t1 ∧ t2) ∨ ( t3 t4)。 10.计算机信息检索的基本原理仍是“匹配运算”,但是却不同于手工检索的“匹配运算”方式。 计算机匹配过程中,需要将检索提问式转化成计算机可以识别的形式,并且要使用系统中特定的检索指令、检索词和检索策略,由计算机自动对数据库中各文档记录进行查找。当检索标示、检索策略与数据库中的信息标示关系一致时,即为命中,将结果输出给用户。 11.逻辑提问式即为Q=A*B*C*D. 表展开法是将每个逻辑提问式转换成一个展开表, 如果有N 个提问式就可做N 个展开表。每个检索词对应表中的一行。其一般格式如下: 展开表的生成,根据算法描述的顺序方向划分为两大部分:前处理部分和后处理部分。 前处理部分,也叫正向扫描处理部分。按照逻辑提问式各项因子出现的先后顺序从左到右依次处理。 前处理算法描述: 地址是指该行所在展开表中的地址; 匹配成功时转向地址AFD ,给出一旦在检索词与文献记录中标引词匹配成功时,下一步应该处理的提问检索词在提问表中的地址; 匹配不成功时转向NFD 地址,给出一旦检索词与标引词匹配失败时应该转向展开表中的地址; “层级值” 栏表示当前检索词在提问式中的层次级别;

相关文档
最新文档