信息检索复习重要知识

信息检索复习重要知识
信息检索复习重要知识

一、名词解释(4题,20分)

目录:以一个完整的出版单位或收藏单位作为著录的基本单位,将一批著录款目按照一定的次序编排而成的一种揭示及报道文献的工具。

索引:将某一信息集合中的相关信息按照某中可查顺序排列并系统地指引给读者的一种检索工具。

年鉴:一种按年度出版,概述或反映上一年度有关领域的重大事件、重大进展和重要成果,汇集重要文献、详尽数据很统计资料的连续出版物。

手册:是汇集某一范围内基础知识和基本数据资料,以便于人们在生产、科研、教学等具体工作过程中可以经常查证的实用便览型参考工具。

OPAC:由开放的公共查询目录演化而来,是20世纪70年代末由美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。

CALIS:是经国务院批准的我国高等教育公共服务体系之一,在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来。

信息检索:广义上,信息检索是指信息存储与查找的过程,狭义上,指信息查找的过程,信息查找是指通过查询机制从各种检索系统中查找出用户所需要的特定信息的过程。

搜索引擎:泛指网络上以一定的策略搜集信息,对信息进行组织和处理,并为用户提供信息检索服务的工具和系统,是网络资源检索工具的总称。

百科全书:是指收录了各个知识门类的知识,或者系统而完备地概述了某一知识门类知识的大型参考性工具,是最完备的参考工具,有“工具书之王”的美誉。

学位论文:学位论文是伴随着学位制度的实施而产生的,是高等院校或科研机构的毕业生为获取学位资格而撰写的学术性研究论文。

特种文献:一种介于图书与期刊之间的文献类型,通常在出版发行或获取途径方面比较特殊,因此也被称为灰色文献。

电子图书:是指以数字形式加工,通过计算机网络进行传播,,并借助于计算机或类似设备来阅读的图书,是电子出版物中最常见的文献形式。

参考工具书:是根据一定的社会需要以特定的编排方式和检索方法汇编某学科或特定范围的知识和资料,其目的是为人们解决疑难和提供数据或事实信息,是作为工具使用的专供查考的特定类型的图书。

元搜索引擎:是对搜索引擎进行搜索的搜索引擎,是对多个独立搜索引

擎的整合、调用、控制和优化利用。

信息检索工具:能够让用户通过其检索出特定信息的一个工具,包括印刷型检索工具和网络信息资源检索工具。

二、不定项选择题(10题,20分)

1、信息检索方法的分类

(1)按检索对象的内容划分

A、文献检索

B、数据检索

C、事实检索

(2)按检索方式划分

A、手工信息检索

B、计算机信息检索

(3)按检索要求划分

A、特性检索

B、族性检索

(4)按检索的时间跨度划分

A、定题检索

B、回溯检索

(5)按检索对象的信息表现形式划分

A、文本检索

B、多媒体检索

C、超文本检索

2、检索效果的评价指标

(1)

(2)

(3)

(4)

3、搜索引擎的分类及其代表性引擎名称

(1)目录型搜索引擎:雅虎、搜狐、新浪、Galaxy、Open Directory、Infoseek、The WWW Vitual Library、BUBL LINK、AOL Search、蓝帆(2)索引型搜索引擎:Google、百度、天网搜索、Alta Vista、Excite、Allthe Web、LYCOS、Inktomi、Hotbot、LookSmart

(3)元搜索引擎:Ixquick、Vivisimo、Dogpile、MetaCrawler、WebCrawler、万维搜索

4、了解知名搜索引擎及其检索功能等。

(1)搜狐:分类目录导航检索、简单检索、高级检索、结果显示(2)雅虎:主题分类目录浏览检索、关键词检索、结果显示

(3)Galaxy:分类目录浏览、简单检索、高级检索、结果显示

(3)Google:基本查询、高级搜索、搜索范围限制功能、查询结果、

特色查询功能

(4)百度:简单检索、高级检索、结果显示

(5)Dogpile:简单检索、高级检索、定制偏好、结果显示

(6)万维搜索:简单检索、高级检索、结果显示

5、特种文献的类型。

特种文献主要包括:会议文献、学位论文、专利文献、标准文献、科技

报告、政府出版物、产品样本、产品目录及档案。

6、国内学位论文的查检途径。

我国学位论文一般收藏于本院校的图书馆、国家图书馆、中国科技信息

研究所和中国社会科学院信息所、国内各大学位论文数据库(如:万方

数据知识服务平台中国学位论文数据库、CNKI中国优秀硕博士学位论

文全文数据库、CALIS高校学位论文数据库等)。

7、所学过的检索技巧的应用。

(一)传统的信息资源检索技术

(1)布尔逻辑检索

A、或(+、OR)可以扩大检索范围,增加命中文献数量,有利于提

高检索结果的查全率。

B、与(*、AND)对检索词进行限定,从而缩小检索范围,有利于

提高检索结果的查准率。

C、非(—、NOT)缩小命中文献的范围,增强检索的准确性。

注意事项:

A、执行顺序,NOT、AND、OR

B、非在写关系式时,a – b 错误写

法;a –b正确写法,- 跟b之间不能有空格

(2)截词检索?表示单个字符 *表示多个字符不同检索工具,字符

不一定相同

A、后截断 stu*

B、中截断 stu?ent 中截断只允许有限截断

C、前阶段 *dent

(3)位置检索

A、词位置检索:提高检索的查全和查准率有重要作用,但网络检索中基本只支持

(W)和(N)运算符

W与nW: a(W)b a(nW)b 检索出来的词序不能颠倒

W:所连接的词之间除了可以有一个空格、一个标点符号或一个连

接号外,不得夹有任何其他单词或者字母。

nW:允许连接在两个检索词之间最多夹入n个其他单元词(冠词、

介词、连接词)

N与nN: a(N)b a(nN)b 检索出来的词序可以颠倒

N:所连接的词之间除了可以有一个空格、一个标点符号或一个连接

号外,不得夹有任何其他单词或者字母。

nW:允许连接在两个检索词之间最多夹入n个其他单词

X与nX: a(X)a a(nX)a 检索出来的两侧检索词完全一致,并以指

定顺序相邻

X:所连接的词之间除了可以有一个空格、一个标点符号或一个连接

号外,不得夹有任何其他单词或者字母。

nX:允许连接在两个检索词之间最多夹入n个其他单元词(冠词、介

词、连接词)

B、同句检索

C、同字段检索

(4)限制检索

A、字段限制检索:可以缩小检索范围,提高查准率

基本字段:题名(TI)、文摘(AB)、叙词(DE)等。

辅助字段:作者(AU)、刊名(JN)、语种(LA)、专利号(PN)、年代(PY)等。

B、限制符限制检索

AU(作者)、CS(作者单位)、JN(刊物名称)、PY(出版年份)、LA(语言)等。

(5)加权检索

A、词加权检索

B、词频加权检索

(二)信息资源检索方法

(1)常规法

A、顺查法:由远及近,适合检索理论性或学术性的课题

B、倒查法:由近及远,多用于检索新课题或有新内容的老课题,或对某课题研

究已有一定基础,需要了解其最新研究动态的检索课题

C、抽查法:选择与该课题有关的文献信息最可能出现或最多出现的时间段,话

费较少时间获得较多文献的检索方法

(2)回溯法

回溯法又称引文法,是指在已获得所需文献的基础上,再利用文献末尾所付的参考文献、相关书目、推荐文章和引文注释作为检索入口,

依据文献之间的引证和被引证关系揭示文献之间的某种内在练习,进而

查找到更多的相关文献的方法。

优点:在检索工具不全或检索系统收录内容不完整的情况下,借助此法

非常有效。

缺点:费时、盲目性大,信息查全效果差

(3)综合法

综合法也称交替法或循环法,是将常规法和回溯法结合起使用的检索方法。分阶段、按周期地交替使用两种方法,对检索效率的提高有很大帮助。

三、简答(6题,30分)

1、信息检索的原理

信息检索的实质就是将用户的检索提问标识与存储在信息检索系统中的信息特征标识进行比较、匹配,两者一直或者信息特征标识包含了检索提问标识,则具有该标识的信息就从检索系统中输出,输出的信息就是检索系统命中的信息。

2、文献检索及其内容

文献检索是指以查找某一课题的相关文献为目标的检索。文献检索包含全文信息检索和目录、题录、索引、文摘等二次文献信息检索。

3、手工检索与计算机检索的异同点。

手工检索和计算机检索的本质是相同的,都是从特定的检索系统中查找、匹配、输出所需要信息的过程;二者的区别在仅在于信息的载体形式、存储方式和匹配机制有所不同。

手工检索优点:检索过程灵活,可以随时修改检索策略,检索结果较为准确;缺点:检索速度慢、效率低、更新慢、查全率低。

计算检索优点:与手工信息检索系统相比较,计算机信息检索系统具有检索范围广、信息量大,检索速度快、效率高,检索不受时空限制,数据更新快,可以及时获得最新数据,查全率和查准率高,检索功能强,辅助功能完善,以及使用方便等特点。缺点:费用高,需要较好的检索技术,还有一系列设备,且受网络影响稳定性相对较差。

4、提高信息检全率和检准率的方法

(1)如何提高查全率?

1. 优先使用最简单常用的主题词;

2. 逐渐减少不重要的检索词;

3. 加用多个等同词,用“或”(OR、|)语法;

4. 换用上位词;

5. 增加检索途径;

(2)如何提高查准率?

1. 换用专指性更强的主题词;

2. 逐渐加用主题词;

3. 加用辅助词;

4. 利用词和网页的外部特征限制输出结果;

5. 观察不相关检索结果的特征,使用“减”(-)语法排除;

6. 使用下位词

5、所学过的图书、期刊数据库的简介及特点等。

《中国期刊全文数据库》

是目前国内内容较为丰富的动态更新的中国期刊全文数据库。至2006年3月31日,收录国内公开出版的7600多种重要期刊,其中含1735种核心期刊与专业特色期刊,累计1994年以来的全文文献1750万篇;其中4000多种刊物回溯至创刊,如1915年创刊的《清华大学学报(自然科学版)》、《中华医学杂志》等。产品分为九大专辑:理工A、理工B、理工C、农业、医药卫生、文史哲、经济管理与法律、教育与社会科学综合、电子技术与信息科学。推出网络数据库、专辑光盘数据库和专题数据库等服务。中心网站及数据库交换服务中心每日更新。

《中文科技期刊数据库》

是我国最大的数字期刊数据库,该库受到国内图书情报界的广泛关注和普遍赞誉,目前已拥有包括港澳台地区在内2000余家大型机构用户,是我国数字图书馆建设的核心资源之一,高校图书馆文献保障系统的重要组成部分,也是科研工作者进行科技查证和科技查新的必备数据库。期刊总数:12000 余种

核心期刊:1957 种

文献总量:3000 余万篇

更新周期:中心网站日更新

全文质量:采用国际通用的高清晰PDF全文数据格式

学科范围:社会科学、自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报

检索方式:快速检索、传统检索、分类检索、高级检索、期刊导航

《数字化期刊数据库》

该库是万方数据资源系统的重要组成部分,由万方数据自主建设。基本包括了我国文献计量单位中自然科学类统计源刊和社会科学类核心源期刊的全文资源,成为您了解Internet上中文期刊的重要窗口。该库内容采用国际流行的HTML格式和PDF格式制作上网,整体数字化期刊遵循电子期刊以刊为单位的原则,按理、工、农、医、人文排列,交叉入类、刊名查询,您会发现它非常符合您的阅读习惯,您可以多角度、全方位地进入期刊主页浏览,具备了网上期刊资源门户的特征。

《人大报刊复印资料》

选辑国内公开发表的人文科学和社会科学各学科、专业的重要论文和重要动态资料,分索引、文摘、全文分别出版。该系列数据库是国内最有

影响的社会科学专题文献资料库。

《超星电子图书》

是世界上最大的中文在线数字图书馆,图书馆资源丰富,范围广泛,收录了自然科学和社会科学各个门类的中文图书160万种,使用SSReader 可以对PDF格式图书进行阅浏、下载、打印、版权保护盒下载收费,还提供由全国各大图书馆专家联合开展的图书导航,网上参考咨询服务、最新图书介绍和书评信息服务等。

检索方式:分类检索、快速检索、高级检索

《方正Apabi》

收录了全国400多家出版社最新出版的高质量中文图书,目前已拥有社会科学、文学艺术、语言、历史等2万余种中文图书,并以纸质书同步出版,平均每月增加3000左右,可以阅读CEB、PDF、HTML和XEB格式的电子图书及文件。

检索方式:分类检索、快速检索、高级检索(本库查询、跨库查询)《书生之家》

主要收录了1999年至今的图书、期刊、报纸、论文和CD等各种载体资源,现在又30万种电子图书,并以每年6~7万递增。内容涉及社会科学、人文科学、自然科学和工程技术,使用“书生阅读器”可以浏览2000年以来出版相关类目下的所有书目信息和当月出版的新书信息。

图书:进行图书在线阅读,把图书借阅到本地阅读,进行简单检索和全文检索

期刊:实现期刊检索﹑期刊阅读和借阅的功能

高级检索:即“一站式检索”,实现在其他数字图书馆系统中检索自己所需要的资源

检索方式:图书检索(简单检索、全文检索)、高级检索(一站式检索)、组合检索

《读秀学术搜索》

读秀知识库是由海量图书等文献资源组成的庞大的知识系统,他集成文献搜索、试读、传递为一体,是一个可以对文献资源及其全文内容进行深度检索,并且提供文献传递服务平台。

1、300万种中文图书等文献数据;

2、占1949年以来已出版中文图书的95% 以上;

3、 200万种电子图书原文;

4、 7亿页资料;

5、 3亿条目次;

6、至少10万种/年更新速度;检索方式:快速检索(知识、图书、期刊、报纸、专利、人物、学位论文、会议论文等等)

6、搜索引擎的工作原理

首先在互联中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。即:抓取网页、处理网页、提供检索服务

7、馆际互借与文献传递的区别

馆际互借就是对于本馆没有的文献,在本馆读者需要时,根据馆际互借制度、协议、办法和收费标准,向外馆借入;反之,在外馆向本馆提出馆际互借请求时,借出本馆所拥有的文献,满足外馆的文献需求。

文献传递是将用户所需的文献复制品以有效的方式和合理的费用,直接或间接传递给用户的一种非返还式的文献提供服务,它具有快速、高效、简便的特点。

现代意义的文献传递是在信息技术的支撑下从馆际互借发展而来,但又优于馆际互借的一种服务。

8、参考工具书的类型与特点等

类型:

参考工具书一般包括字典、词(辞)典、百科全书、年鉴、传记资料、手册、名录、指南、表谱、图录、资料汇编等。

特点:

(1)信息内容的专供查考性

(2)条目的简明概述性

(3)编排的特殊易检性

(4)内容的权威可靠性

9、学位论文的特点及其查检方法

特点:

(1)内容专一、具有独创性

(2)出版形式特殊

(3)数量庞大,管理分散

查检方法:

(1)到论文的实体收藏单位索取,如:本院校的图书馆、国家图书馆、中国科技信息研究所和中国社会科学院信息所等。

(2)到网上论文数据库索取,如:PQDT硕博士学位论文数据库(外国)、万方数据知识服务平台中国学位论文数据库、CNKI中国优秀硕博士学位论文全文数据库、CALIS高校学位论文数据库等。

10、特种文献特点及类型。

特种文献特色鲜明、内容广泛、数量庞大、参考价值高,是非常重要的信息源,出版发行和获取途径方面都比较特殊。

特种文献主要包括:会议文献、学位论文、专利文献、标准文献、科技报告、政府出版物、产品样本、产品目录及档案。

四、分析和运用题。(2题,30分)

1、计算机信息检索策略的制定与实施(结合实例)

(1)分析检索课题

A、明确检索课题的主要内容

B、明确检索课题所涉及的学科、专业范围

C、明确所需文献的类型、语种、年代及数量的要求

D、明确用户对查新、查全、查准的指标要求及其侧重

(2)选择检索系统和数据库

A、数据库的内容

B、数据库的覆盖范围

C、数据库的及时性

D、数据库的成本

(3)确定检索词

A、控制词汇

B、非控制词汇

C、人工代码

(4)构造检索提问表达式

A、根据检索系统和数据库的特性和要求编制检索提问表达式

B、应遵守概念组配的原则,避免使组配结果产生多重含义

C、检索提问表达式应尽量简洁、清楚地表达逻辑关系,尽可能地提高

计算机的检索速度和检索效率

2、所学过的信息检索渠道的综合应用。

(1)利用互动问答

(2)利用数据库

(3)利用图书检索

(4)人物访谈、询问

(5)利用搜索引擎

(6)实地考察

复习参考(部分):

常用的中文全文数据库(其它内容见课本80-81表3-2)

(1)CNKI(中国知识资源总库),是综合性的大型数据库,覆盖教育与社会科学、工业技术、农业等学科领域;提供的检索方式有快速检索、初步检索、高级检索和专业检索等。

(2)万方:涵盖期刊,会议纪要,论文,机构,学位论文等资源的大型网络数据库。是国内查检学位论文最为权威的大型全文数据库。(3)维普:是重庆维普资讯有限公司建立的网站。其所依赖的《中文科技期刊数据库》是中国最大的数字期刊数据库之一,涵盖自然科学、工程技术、经济、图书情报等学科的中文期刊数据。全面解决了文摘版收录量巨大但索取原文繁琐的问题。

。。。。

网络基本检索技术

(1)布尔检索。通过“与”、“或”、“非”三个逻辑算符,达到特定的检索目的。

(2)邻近检索。通过检索式中的邻近算符,规定检索词在结果中的相对位置,在网络环境中经常使用的邻近算符有with和Near两种。(了解其具体的含义)

(3)字段检索。网络信息检索系统不支持传统意义上的字段检索,最多只能提供一些准字段检索。

(4)截词检索。通过截词符(如*号和?号)表示检索词的某一部分可以有一定的词形变化,这一部可以是词头、词尾或词的中间部分。(了解其具体的含义)

学位论文检索

学位论文指高等院校或研究机构的毕业生为获取学位资格而撰写的学术性研究论文。特点:第一,出版形式特殊。第二,数量大,难以系统的收集、管理和交流。第三,在尚未发表或出版前,涉及知识产权的问题。(可结合课本)

学位论文的以上特点,可通过以下途径查找:(结合课本,要求给出实体机构和所收录的电子数据库)

文献分类

按生产加工层次,文献可以分为一次文献、二次文献、三次文献。

专著、报纸、期刊、专利文献、标准文献、会议文献、样本等成品文献

属于一次文献,即人们对自然和社会信息进行首次加工(固化)而成的文字记载。目录、书目、索引、文摘等为二次文献。利用二次文献,选择有关的一次文献再加以分析、综合而编写出来的第三个层次的文献形式——专题报告、综述及手册、百科全书、年鉴等工具书。

CNKI 使用案例

例如:“用于电力系统故障” 选取“电力系统”和“故障”作为检索词

检索式为:SU=电力系统*故障

检索一般程序的总体论述:

检索的一般程序大致可分为:分析检索问题,选择检索工具,选择检索词,构造检索式,获取内容,评价结果。

1. 分析检索问题的步骤有:

(1)分析课题涉及的学科范围、主题要求。

(2)课题所需信息的内容及其特征。

(3)课题所需信息的类型,包括文献类型、年代范围、机构等。(4)课题对查新、查准、查全的指标要求。

2. 选择检索工具的步骤为:

(1)确定检索信息内容所涉及的学科范围;

(2)确定信息源,如期刊、学位论文、标准或者专利等;

(3)选用检索系统的功能比较强大的;

(4)选择检索系统更新速度较快的;

(5)使用检索系统的费用较少的。

3. 选择检索词的方法有:

(1)可以采用顺查或者逆查,也可以采用引文回溯;

(2)选用主题词,如标题词法、单元词法、叙词法和关键词法等;(3)选用常用的专业术语;

(4)选用同义词与相关词;

4. 构造检索式的方法有:

(1)使用位置算符、截词符等方法;

(2)使用复合逻辑词非、且、或;

5. 获取内容包括:可以是文摘、书目,全文等

6.评价整个检索流程,选择检索程序是否符合科学性,检索的内容是否符合查准率和查全率这两个指标

信息检索与利用期末复习

《信息检索与利用》考试题型说明: 一、判断题(1×10) 二、单选题(1×20) 客观题要涂答题卡。 三、填空题(2×5) 四、简答题(12×3) 五、实践题(12×2) 信息检索与利用客观复习题 一、判断题 1.在构建关键词时,我们尽量不要用自然语言,而要从自然语言中提炼关键词。 (对) 2.在信息检索时查询词表述准确是获得良好搜索结果的必要前提。(对) 3.目前的搜索引擎能很好的处理自然语言。(错) 4.用户可以通过Google图书搜索在线阅读任何一本搜索到的图书。(错) 5.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检 索。(错) 6.解决读者需求的无限性和馆藏的有限性的矛盾,唯一有效的方法就是在图书馆 间建立合作机制,实现资源共享。(对) 7.关键词语言的最大优点是能用计算机进行自动抽词标引,它适合于计算机自动 编制各种类型的词索引。(对) 8.信息素养由信息意识、信息能力、信息道德三个方面内容构成,其中,信息道 德是前提,信息能力是保证,信息意识是准则。(错) 9.搜索引擎与普通网站不同的是提供一个包含搜索框的页面,它不是一个WWW网 站。(错)

10.用搜索引擎google检索专利和期刊的全文比用中国国家知识产权局专利数据 库、《维普中文科技期刊数据库》等数据库的查全率和查准率都要高。(错)11.GB/T 16159-1996,汉语拼音正词法基本规则[S].北京:中国标准出版社, 1996.该文献类型为标准文献。(对) 12.在搜索引擎中输入“项目管理”和输入““项目管理””检索结果是不一样 的。(对) 13.在搜索引擎中常用的截词符是星号“*”,通常使用右截断。如输入comput*, 将检索出computer、computing、computerized等词汇。(对) 14.通用搜索引擎,如google、baidu、bing、yahoo,并不能囊括所有的网页。(对) 15.不同类型的搜索引擎对同一个主题进行搜索会得到不同的结果。(对) 16.一次文献是指原始创作,即作者以本人的研究成果为基本材料而创作(或撰写) 的文献,主要包括期刊论文、专利说明书、会议论文、科技报告和学位论文等。 (对) 17.从一次文献、二次文献到三次文献,是文献从无序到有序、从无组织到系统化 的过程。(错) 18.题录、目录属于一次文献;期刊论文属于二次文献。(错) 19.关键词和主题词都是表征文献实质性内容的词汇,前者是经过词表规范的,后 者是未经过词表规范的自由词。(错) 20.利用某个图书馆的书刊目录查询系统(OPAC),可以了解该图书馆收藏有哪些印 刷型图书和期刊。(对) 21.截词检索相当于用逻辑“或”扩展检索的范围,可以提高检索的查全率。(对) 22.将“红外线”扩展成“远红外线”和“近红外线”运用了上下位概念扩展法。 (对)、

华电信息检索期末考试-单选题库

单选(微软雅黑5号为正确答案,非答案为小5号) 1.下面对图书馆(主馆)在学校所处的位置描述正确的是? A学生宿舍一号楼与二号楼之间 B学生宿舍一号楼与食堂之间 C教二楼与教三楼之间 D主楼和教二楼之间 https://www.360docs.net/doc/56539099.html,pendex是哪个数据库的网络版? A El B INSPEC C IEL D SIAM 3.我馆外文图书在借阅? A主馆二层前台 B主楼C座308室 C主馆一层基本库 4.图书馆研讨空间于 2014年4月23日开放,单个研讨空间使用者不少于__人,不超过_ A 3, 8 B 6, 8 C 3, 5 D 3, 6 5.世界上最大的图书馆是 _ 一? A英国国会图书馆 B美国国会图书馆 C法国国会图书 6.1958年,美国的大学最先将计算机技术运用到图书馆? A密苏里 B哈佛 C哥伦比亚 D夏威夷 7.以下哪个数据库能下载专利全文? A维普数据资源系统 B读览天下 C万方数据知识服务平台 D读秀知识库 8.使用超星数字图书馆浏览和下载电子图书时,应安装:

A Apabi Reader B SSReader C CAJ Viewer D Adobe Reader 9.以下可以查阅电子图书的数据库是: A维普数据资源系统 B中国知识资源总库 C读览天下 D读秀知识库 10.在中国学术期刊全文数据库中,检索篇名含“图书馆”的文献,最好用:A高级检索 B 一框式检索 C二次检索 D跨库检索 11.我馆购买的中国知识资源总库数据的年限是: A 1988年至今 B 1995年至今 C 1997年至今 D 2000年至今 12.中国知识资源总库下载的期刊论文,浏览全文必须安装: A IE浏览器 B SSreader阅读器 C cajviewer浏览器或PDF阅读器 D书生阅读器 13.查询某数据库中是否收录《自动化学报》,检索途径最好选择: A关键词 B刊名 C分类号 D著者 14.以下数据库中,属于文摘型数据库的是: A CNKI B维普数据库 C中文社会科学引文索引(CSSCI) 15.中文电子资源中,超星数字图书馆属于: A索引型数据库 B文摘型数据库

信息检索与利用复习重点

一、工具书概念:根据一定的查阅需要,系统汇集有关的知识资料,以特定的编排方式和检索方法,为人们迅速提供知识信息或资料线索,专供查阅的图书(文献)。工具书的特点:①信息密集②资料性强③查考为主④方便检索工具书类型:1 检索工具书又称线索性工具书,主要提供查找文献的线索:书目、索引、文摘。2 参考工具书主要向读者提供可资参考的知识内容,如数据、史实、结论、定义、人物简介等数据和事实信息:字典、词典、百科全书、年鉴、手册、名录、数表统计资料、表谱、图录等类型。3 边缘工具书——形式上不是工具书但具有查考检索作用的图书。丛书、总集、汇编、综述、史志、学科史及要籍等。工具书的结构:①序、跋②凡例③目录④正文⑤辅助索引⑥附录、参考文献工具书的鉴别与选择原则:1)看其主流,考察内容材料,看内容是否完备、材料新颖可靠,解释引证准确2)客观、正确,有无立场、观点问题3)了解编制体例,编排方式、检索方法、印刷规则、文体。4)同一种工具书的不同版本。鉴别与选择的方法1)查考编辑者与出版者2)编纂和出版的年代、审察版本3)查考序跋、凡例和目次4)辨别正文——选条试查、定条比较 5)参阅书评二、机器检索及光盘、联机与网

络检索计算机检索:人们在计算机或计算机检索网络终端机上,使用特定检索指令、检索词和检索策略,从计算机检索系统数据库中检索出需要的信息,继而再有终端设备显示或打印的过程。信息检索工具:指用以报道、存储和查找文献线索的工具。它是附有检索标识的某一范围文献条目的集合,是二次文献,如书目数据库、搜索引擎、索引、文摘。检索工具的分类:1)(文献检索工具)提供线索的指示型检索工具(二次文献):书目、馆藏目录;索引;文摘;工具书指南2)(事实与数据检索工具)提供具体信息的参考工具(三次文献):1词典2类书、政书、百科全书3、年鉴4传记资料5表谱、图录6、政府文献7名录、手册8数表、统计集9丛集汇要10地理资料信息检索途径:1)外部特征途径:题名途径,著者途径,序号途径2)文献内容特征途径:分类途径,主题途径,关键词途径,分类主题途径,其他途径。信息检索步骤:1)分析检索课题,明确检索要求(2)制定检索策略:确定检索工具、方法、途径、用词及逻辑关系、位置关系(3)实验性查找,调整检索策略,正式查找;(4)辅助性查找(最新期刊、年鉴);(5)整理答案或索取原文。信息检索步骤:1)分析检索课题,明确检索要求2)制定检索策略:

《信息检索》总复习题库及答案

2011-2012经济学院《文献检索与利用》总复习题库 备注:红色为不确定答案,紫色是为了个人强化记忆。 单选题题库 1.下列属于布尔逻辑算符的是(D )。 A、与 B、或 C、非 D、以上都是 2、信息素养的核心是(C ). A、信息意识; B、信息知识; C、信息能力; D、信息道德 3、20世纪70年代,联合国教科文组织提出:人类要向着( B )发展. A、终身学习; B、学习型社会; C、创新发展; D、信息素质 4.参考文献的标准著录格式是( A )。 A、著者篇名来源出处; B、篇名著者来源出处 5.请标出文献:马品仲. 大型天文望远镜研究. 中国的空间科学技术,1993,13(5)P6-14, 1000-758X 属于哪种文献类型( C )。 A、图书; B、科技报告; C、期刊; D、报纸 6.常用的检索系统有( D )。 A、目录检索系统 B、文摘检索系统 C、全文检索系统 D、以上都是 7、哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?( A )。A.逻辑与()B.逻辑或() C.逻辑非()D.逻辑与和逻辑非 8、根据国家相关标准,文献的定义是指“记录有关( C )的一切载体。”A.情报 B.信息. C.知识 D.数据 9、( D )是指通过文献信息资料的主题内容进行检索的途径。 A.题名检索途径 B.作者检索途径 C.分类检索途径 D.主题检索途径 10、搜索含有“”的文件,正确的检索式为:( A )

A." " B. 11、从文献的( B )角度区分,可将文献分为印刷型、电子型文献。A.内容公开次数 B.载体类型. C.出版类型 D.公开程度 12、按照出版时间的先后,应将各个级别的文献排列成( C ) A.三次文献、二次文献、一次文献B.一次文献、三次文献、二次文献C.一次文献、二次文献、三次文献 D.二次文献、三次文献、一次文献13、利用文献后面所附的参考文献进行检索的方法称为( A )。 A.追溯法 B.直接法. C.抽查法 D.综合法 14、《中国学术期刊全文数据库》给出的检索结果为( D )。 A.仅题录 B.仅文摘. C.仅全文 D.题录、文摘和全文三种 15、以作者本人取得的成果为依据而创作的论文、报告等,并经公开发表或出版的各种文献,称为( B ) A.零次文献 B.一次文献. C.二次文献 D.三次文献 16、学术论文写作的六个步骤的正确顺序是( C ): ①搜集资料②研究资料③执笔撰写④选择课题⑤明确论点⑥修改 定稿 A.①⑤④③②⑥ B.⑤③④②①⑥C.④①②⑤③⑥D.②④ ③①⑤⑥ 17、毕业论文答辩的一般程序是( B D ) ①学生答辩②学生作说明性汇报③毕业答辩小组提问④评定成绩 A.③④②①B.②③①④C.③②①④D.②③①④ 18、下列文献中属于哪类属于一次文献( C )? A.文摘 B.索引C.科技报告D.题录 19、如果检索结果过少,查全率很低,需要调整检索范围,此时调整检索策

(2)--信息检索期末考试A卷答案

武汉大学信息管理学院《信息检索》考试试卷(A)答案 一、名词解释(5x4=20分) 1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 3.China Academic Library and Information System中国高等教育文献保障系统。 4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。 5.搜索引擎(Search Engine)是一种 Web 上应用的软件系统,它以一定的策略在 Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。 二、简答(5x6=30分) 1.电子图书有哪些特点? 存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使用,可无失真地重复使用)。 2.对搜索引擎的选择与比较主要从哪些方面考虑? 收录范围(索引库中内容的数量、地域范围、语言种类、资源类型、资源的深度和广度)、分类(分类方式是否合理多样、类名是否规范、分类的广度与深度是否合适)、检索功能与效果(是否包含浏览检索和关键词检索功能、是否支持布尔检索、截词检索等高级检索功能、是否有检索帮助和提示功能、检索结果和查全率、查准率及响应时间)、结果处理(结果的排序方式是否多样、是否有去重功能、能否按照用户反馈动态调整和显示检索结果)、页面组织(页面组织是否清晰、类目设置是否合理、界面是否友好)、其他功能与服务(能否满足用户多方面的信息需求)、用户评价(是否有用户评价及统计功能)。 3.网络信息选择的标准有哪些? 权威性(网站及其建站机构的权威性和知名度)、内容(内容应当客观、切题、标题清楚、组织规范、逻辑性强、有明确的范围和边界、有足够的深度和广度、有自己的特色)、时效性(网站内容及其链接应当新颖、应明确地说明其创建和更新周期)、网页设计(应以合理的方式综合使用图像、声音和文字、界面的友好性、清晰直观)、适用性(应保证用户能用较短的时间、点击较少的链接找到所需信息)、用户对象(信息的专业化程度应能满足目标用户的特定需求)、访问次数或被链接次数(网络信息的被访问和被其他网页链接的次数)。

信息检索复习重点1

信息检索 第二章信息用户 一、用户信息需求的概念 1、概念:是指人们在实践活动过程为解决遇到的各种问题而产生的信息不足感与求足感 2、主要特点:广泛性、社会性、发展性、多样性、主观性、客观性 二、用户信息需求的基本类型 1、按信息的属性分 自然信息需求:对客观存在的自然物信息的不足感与求足感,强调物质属性 社会信息需求:生活中的信息需求、职业活动中的信息需求、个体社会化的信息需求 2、按信息需求的目标分 主题需求:战略性信息需求、战术性信息需求、工作性(经营性)信息需求 已知资料需求:信息查对需求 3、按信息需求的表现形态分(沃格特) 新信息需要:需要能及时获得、迅速传递的最新信息,强调及时性 片断性信息需求:某一理论、方法、事件等的片断信息,以解决具体问题,强调准确性 完整性信息需求:对特定相关信息的系统把握,强调全面性 三、用户信息需求状态(Mizzaro) 1、客观信息需求(Real Information Need,RIN):用户解决某特定问题所需要的信息 2、意识到的信息需求(Perceived Information Need,PIN):户在问题及外界刺激下所感知到的信息需求 3、表达出来的信息需求(Request):用户在一定条件下对意识到的信息用自然语言表达出来的信息需求 4、信息提问(query):用户用所选择信息检索系统的检索语言相对应的语法形式描述的信息需求 四、用户需求提问 1.需求提问的类型划分 1)、从提问的规定性上分类 明确性提问:问题初始条件与目标状态清楚 不确定性提问:问题初始条件或目标状态不清楚 2)、从功能上分类 认知性提问:咨询提问和评价提问 非认知性提问 2.需求提问的结构分析 主题分析:描述用户信息需求的内容范畴。包括主题概念、学科范围

最新文献检索期末试卷(学生)

《文献检索》期末试卷 姓名学号专业 本试题一共5道大题,共5页,满分100分。 阅卷人题号一二三四五合计 核分人题分30 30 20 10 10 100 总分得分 一、单项选择题(请将正确答案的序号填在括号内,每题1.5分,共30分) 1. 文献是记录有知识的() A 载体 B 纸张 C 光盘 D 磁盘 2. 下列哪种文献属于一次文献( ) A 期刊论文 B 百科全书 C 综述 D 文摘 3. 下列哪种文献属于二次文献( ) A 专利文献 B 学位论文 C 会议文献 D 目录 4. 下列哪种文献属于三次文献( ) A 标准文献 B 学位论文 C 综述 D 文摘 5. 下列选项中属于连续出版物类型的选项有() A 图书 B 学位论文 C 科技期刊 D 会议文献 6. 下列选项中属于特种文献类型的有() A 报纸 B 图书 C 科技期刊 D 标准文献 7. 纸质信息源的载体是() A 光盘 B 缩微平片 C 感光材料 D 纸张 8. 以刊载新闻和评论为主的文献是() A 图书 B 报纸 C 期刊 D 会议文献 9. 使用分类语言对信息进行描述和标引,主要是可以把()的信息集中在一起。 A 同一作者 B 同一学科 C 同一主题 D A+B+C 10.《中国图书馆分类法》(简称《中图法》)将图书分成( ) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 11.《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在()

类目下查找。 A S类目 B Q类目 C T 类目 D R类目 12. 利用文献末尾所附参考文献进行检索的方法是() A 倒查法 B 顺查法 C 引文追溯法 D 抽查法 13. 至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为() A 数据库 B 记录 C 字段 D 文档 14. 广义的信息检索包含两个过程() A 检索与利用 B 存储与检索 C 存储与利用 D 检索与报道 15. 狭义的专利文献是指() A 专利公报 B 专利目录 C 专利说明书 D 专利索引 16. 中国国家标准的代码是() A G B B CB C ZG D CG 17. 我校图书馆所购买的下列数据库中可以检索期刊论文的是() A 万方数据库资源系统 B 超星数字图书馆 C 书生之家数字图书馆 D 方正Apabi数字图书馆 18. 期刊论文记录中的“文献出处”字段是指:() A 论文的作者 B 论文作者的工作单位 C 刊载论文的期刊名称及年卷期、起止页码 D 收录论文的数据库 19. 以下四种信息检索语言中,不受《词表》控制的是() A 标题词语言 B 元词语言 C 叙词语言 D 关键词语言 20. 以下检索出文献最少的检索式是() A a and b B a and b or c C a and b and c D (a or b) and c

计算机信息检索复习资料

计算机信息检索复习知识点 第一章 1、人类生活的3个基本要素是材料、能源和信息。(单选) 2、信息是指应用文字、数据或信号等形式,通过一定的传输和处理,来表达各种相互联系的客观事务在运动中所具有的特征性内容夫人总称。(名词) 3、信息的特征有:客观性、动态性、相对性、依存性、可传递性。(多选) 4、共享性是指同一内容的信息可以在同一时间里被多个信息用户使用。 5、信息的功能有哪些?(简答) (1)信息是感知世界的中介;(2)信息是管理决策的依据;(3)信息是科学研究的必要条件;(4)信息是社会发展的资源; 6、信息的类型有哪些?(论述) (1)按信息的表达形式划分,可以分为 ①文献信息②声像信息③电子信息 (2)按信息的应用范围划分,可分为 ①白色信息②灰色信息③黑色信息 (3)按信息的加工层次划分 ①一次信息②二次信息③三次信息 7、信息需要:所谓信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需要。(名词) 8、信息需求的特征有哪些?广泛性、社会性、发展性、多样性(多选) 9、现代信息技术的基础是微电子技术(单选) 10、数据库是指为满足多个用户的多种应用需要,按一定的数据模型在计算机中组织、存储和使用的相互联系的数据集合。(名词、单选) 11、通信系统的基本组成包括信源和:信宿、变换器、反应器、信道、噪声源 12、信号的接收者称为信宿 13、信息传输的通道称为信道 14、信号在传输过程中受到的干扰称为噪声 15、数据库简称DB 16、数据库的四种基本操作是:检索、更新、删除、插入 17、数据库的特点有哪些?(简答)(1)数据共享;(2)面向全组织的数据结构化;(3)数据独立性;(4)可控数据冗余度;(5)统一数据控制功能。 18、数据结构化有利于实现数据共享 19、数据库管理系统可以提供哪些方面的数据控制功能:安全性、完整性、并发控制、数据恢复 20、构成数据库的三个主要层次是:文档、字段、记录 21、记录的基本单元是:字段 22、文档的基本单元是记录 23、一个文档中你好,认识一下!包含大量的记录 24、检索系统提供的数据库相关文档组成包括的文件数是3个 25、顺排文档:按记录的存取号的大小顺序存入全部记录,它相当于印刷型检索工具的正文部分。 26、倒排文档:把记录中的可检字段抽出,包括单元词、多元词,按某种顺序重新加以组织后得到的一种文档。 27、倒排文档只包括记录的标识、信息的数量及信息存取号。 28、存储了数据库所有记录的特征标识的是倒排文档 29、数据库文档中便于随机存取,实现非顺序存储结构的文件是索引文档 30、传统的检索对象主要是文献型的信息源 31、传统的检索对象的存储介质是纸张 32、对超文本、超媒体信息资源实施的检索是超维检索 第二章 1、计算机信息检索经历了哪几个主要发展阶段?(简答)(1)脱机批处理检索阶段;(2)脱机检索阶段;(3)光盘检索阶段;(4)网络化检索阶段 2、计算机信息检索必备的条件是物质和人员 3、计算机检索的类型有哪些?(论述) 计算机信息检索的类型可以通过检索的内容、信息出版的时间和检索工作的方式加以划分 1根据计算机信息检索的内容划分,检索可以分为 (1)数据检索;(2)事实检索;(3)文献检索 2根据被检索信息出版的时间划分,可分为:(1)定题信息检索;(2)回溯性信息检索 3根据计算机检索工作的方式划分,可分为:脱机检索系统;(2)联机检索系统 4、事实检索的对象是事实 5、检索结果能够满足用户需要的文献线索或文献全文的是文献检索 6、回溯性信息检索:根据用户提供某一段时间范围内的文献信息的检索方法 7、计算机批处理的信息检索系统称为脱机检索系统 8、用户以联机会话方式直接访问系统及其数据库的信息检索系统称为联机检索系统 9、信息检索系统:是指按照某种方式、方法见利起来的供读者检索信息的一种有层次的体系,是表征有序的信息特征的集合体。 10、信息检索系统的职能有:报道职能、存储职能、检索职能 11、信息数据库可以划分为:参考数据库、源数据库、混合型数据库 12、参考数据库:是指用户从中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库 13、源数据库:能够直接为用户提供原始资料或具体数据的一类数据库。 14、信息系统的构成模式是什么?(简答) (1)信息数据的选择、处理、录入和维护子系统;(2)词表和标引子系统;(3)检索子系统;(4)系统----用户接口子系统统 15、信息检索系统的存储结构有:印刷存储、微缩存储、磁存储、半导体存储、光存储 16、信息存储的逻辑结构有:线性结构、非线性结构、树形结构、网形结构 17、数据元素按一定顺序构成一个有限序列的信息存储结构称为:线性结构 18、非线性结构中最常用的的是树形结构和网形结构 19、将信息用二进制表示称为编码 20、计算机处理信息的最小单位是一位二进制数 21、两级存储器是指主存储器和辅助存储器 22、信息检索的概念起源自文献信息检索 23、对信息进行主题分析,提取代表该信息的特征的过程称为标引 24、自动抽词标引:利用计算机直接从信息正文、标题或文摘中抽出能表达信息主题的关键词作为标引词,并自动生成 关键词索引或倒排文档。 25、对一本书或一篇文章所做的扼要摘述称为文摘 26、利用计算机自动编制文摘称为自动文摘 27、在信息检索自动化处理中,常用的运算是排序 28、常用的自动排序的方法有选择排序和快速排序 29、存储区域网简称为SAN 30、目前大多数中小企业见利网络环境的协议基础是 TCP/IP 31、信息检索系统的组织:为了控制信息的流速和流向、数 量和质量等,把传递中的杂乱无序的信息整理为系统有序状 态的活动。 32、信息检索系统的组织目的是什么?(简答) (1)减少社会信息流的混乱程度; (2)提高信息系统的质量和价值; (3)建立信息检索系统与用户的联系; (4)节省社会信息活动的总成本。 33、信息检索系统的组织的要求有哪些 (1)信息内容有序化; (2)信息流向明确化; (3)信息流速适度化; (4)信息质量最优化。 34、信息检索系统组织方法:是指对每一信息的各种外表特 征和内容特征进行描述并确定其标识,然后按一定方式或规 则将其内容组织起来以供检索的方法 35、信息检索系统的传统组织方法有哪些? (1)分类组织法;(2)主题组织法;(3)字顺组织法;(4) 号码组织法;(5)自然组织法 36、进行网络信息资源组织的方式主要有:文件组织方式、 主题树组织方式、超文本组织方式、超媒体组织方式、元数 据组织法 37、以文件为单位共享和传输信息的组织方式称为文件组织 方式; 38、超文本的信息组织方法是非线性; 39、元数据又称描述数据; 40、对初选信息的鉴别、筛选和删除称为优化; 41、优化选择的方法有:比较法、分析法、核查法、引用摘 录法、专家评估法 42、检索语言:检索信息所使用的人工语言; 43、登录在类表、词表中的所有标识称为词汇 44、检索语言的作用有哪些?(简答) (1)对信息内容进行主题分析;(2)便于将标引、检索用 的标识符进行相符性比较,保证检索和标引的一致性;(3) 保证检索结果和检索要求的一致性;(4)保证信息存储集中 化和系统化 45分类语言的基础是科学分类 46主题语言是使用词语标识的一类信息检索语言,称为主题 法 47、把主题词按照一种便于检索的方式编排起来,称为主题 词 48、关键词:从信息的题名、摘要和内容中抽取出来的,能 够表达信息主题内容的具有检索意义的关键性词汇。 49、叙词:是指从自然语言中优选出来并经过规范化处理的 名词术语,属于后组式语言的一种,是采用表示单元概念的 规范化语词的组合来对信息主题或内容进行描述的标识系 统。 50、叙词的特点:专指性、直观性、多维检索、适应性、网 络结构 51、按照学科体系进行系统排列的语言称为分类语言 52、按照主题词的字顺序列排列的语言称为主题语言 53、计算机信息检索是指利用计算机存储信息和检索信息 54、进入检索的入口称为检索途径 55、按学科分类体系查找信息的途径称为分类检索 56、利用信息主题内容进行检索的途径称为主题检索 57、选择实现检索计划的具体方法和手段是选择检索方法 58、利用检索系统查找信息的方法称为工具法 59、信息检索策略:将课题的提问及其检索词与检索系统的 收录内容、编排特点相匹配而确定的检索方案或程序。 60、检索效果:是指信息系统检索信息的有效程度,反映了 信息系统的检索能力 61、查全率:检索出的相关信息量与信息系统中的相关信息 量之比 62、查准率:检索出的相关信息量和检索出的信息总量之比。 63、衡量检索效果的相对合理指标是差准率和查全率 第三章 1、布尔逻辑检索:是指通过标准的布尔逻辑关系词来表达检 索词与检索词之间逻辑关系的检索方法。 2、布尔逻辑运算符有:逻辑与、逻辑或、逻辑非 3、INTERNET上信息出传输的主要方式是FTP 4、检索者将检索词在他认为合适的地方截断称为截词 5、限制检索:在检索系统中,使用缩小和限定检索范围的方 法称为限制检索 6、邻近检索:通过专门符号来规定检索词在结果中的相对位 置 7、中级检索技术包括哪些内容? (1)加权检索技术;(2)自然语言检索技术;(3)相关信 息反馈检索技术;(4)模糊检索技术;(5)概念检索技术。 8、自然语言处理应用领域之一是信息检索 9、概念层次网络简称HNC 10、自然语言处理技术可以分为机器翻译、语义处理以及人 机会话 11、搜索引擎用到的自然语言处理技术是机器翻译与语义处 理 12、实现只能搜获的过程主要分为:语义处理、知识管理、 知识检索 13、从用户角度看,用户可以分为最终用户和职业用户 14、信息检索发展史上的突破是应用了自然语言检索 15、智能代理资源管理器的基本结构是:适配器、引擎、知 识、库、视图 16、智能代理信息检索系统的特点有哪些?(论述) (1)智能代理侧重于面向用户。 (2)智能代理主要借助知识库、数据库,并参考用户需求习 惯和一段时期内的偏好,推断用户提问的真实意图,提高检 索的专指性。 (3)智能代理采用机器学习、用户框架模型、推理机制主动 协助用户查找信息。 (4)智能代理不仅是关键字的匹配,而且是基于概念和知识 的检索。 (5)智能代理能不断了解用户需求的变化,并根据用户的反 馈信息及时修正检索目标策略。 (6)智能代理能分离发送请求和接收结果,使它们异步进行。 (7)智能代理能使用户按照个人的兴趣爱好进行信息分类。 17人们进行信息检索时总是期望获得较高的查全率和查准率 18对信息进行采集、标引、存储、处理,最后形成信息集合 体 19、通过模拟自然进化过程搜索最优解的方法称为遗传算法 20、搜索引擎和挖掘引擎处理的都是字串和文本 21、数据挖掘也称知识发现 22、聚类:按照事物的某些属性,把事物聚集成类,使类间 的相似性尽量小,类内相似性尽量大 23、一种很有效的预测模型技术是神经元网络 第四章 1.INTERNET起源于ARPANET 2、我国的四大互联网络是:中国科技网、中国教育科研网、 中国公用互联网、中国公用经济信息网 3、INTERNET提供的基本信息服务有:电子邮件、文件传输、 远程登陆、电子公告板、网络新闻组 4、可以在异地主机上登陆注册的服务是TELNET 5、通过专用电缆与INTERNET主干网直接连接在一起的称 为专线连接 6、综合业务数字网简称ISDN 7、非对称数字用户环路简称ADSL 8、网络信息资源主要类型是联机检索系信息资源和网络信 息资源 9、联机检索信息资源的主要表现形式是联机数据库 10、文件传输协议是FTP 11、网络信息资源进行组织的主要方式有:文件方式、主题 树方式、超文本方式、数据库方式、超媒体方式、元数据方 式。 12、元数据:就是关于数据的数据,是对数据内容的描述。 13、元数据的作用有哪些?(论述) (1)描述数据的内容、质量和特征,以及数据所适用的范围。 (2)管理和存储大量科学数据 (3)提供一种对数据进行检索、查询的方法 (4)帮助数据的使用者更好的了解和使用数据。 (5)促进数据共享 (6)为数据交换和数据传输提供辅助信息 (7)元数据是数据发挥其作用的一个必要条件 (8)维护科研成果,维护在数据方面的投资。 14、DC的特点有:简易性、通用性、兼容性、灵活的可扩展 性 15、知识产权:是公民和法人对在科学和文学等领域内创造 的精神财富以及智力成果依法享有权利的总称。 16、INTERNET上每位用户都有的帐号称为域名 17、数据库开发主要是开发书目数据库、文摘数据库和全文 数据库 18、开发网络信息资源的一个重要途径是制作知识导航库 19、数字图书馆开发利用网络信息资源的一种主要形式是馆 际互借 20、网络信息资源开发利用中的知识产权保护策略是什么? (简答) (1)加强开发利用网络信息资源的立法工作 (2)加强国际交流,逐步与国际接轨; (3)建立和完善知识产权集体管理制度 (4)使用技术手段防止侵权 (5)重视解决网络信息知识产权保护的两个基本原则,即网 络发表权问题和复制权问题。 第五章 1、中国期刊网全文数据库检索系统是基于INTERNET 2、专业检索的具体步骤是: (1)通过单击页面右上角的状态栏,即可进入专业检索条件 界面; (2)选择检索范围 (3)填写检索条件 3、二次检索:通过简单检索、高级检索及专业检索,在这些 检索结果上还可以继续进行操作。 4、二次检索的操作方式有:并且、或者、不包含 5、保存题录中最大保存记录数为50 6、向导式检索的检索操作顺序是由上到下 7、中共高等教育文献保障体系简称CALIS 8、中文社科报刊数据库检索方法的具体步骤是什么?(论述) (1)系统进入、检索途径的选择和结果的输出 (2)主题词、题名和著者检索途径 (3)分类号检索途径 (4)人名检索途径 (5)刊名检索途径 (6)检索结果的显示、标记、打印和保存 (7)索引词列表的使用方法 (8)历次检索策略的选用 9、最重要的统计工具和学术分析及评价工具是SCI 10、普通检索中检索来源文献的途径可分为:主题词、著者、 来源出版物、著者地址 11、执行检索后命中的记录在屏幕上显示的格式是简单格 式 12、联机公共检索目录简称OPAC 第六章 1、产权主要有哪几种:动产权、不动产权、知识产权 2、著作权:也叫版权,是指文学、艺术、科学作品的作者, 对其创作的作品,依照法律享有的专有权利。 3、以法律的形式保护发明人在一定期限内享有对其发明的专 利权称为专利权 4、专利的特征有:排他性、地域性、时效性 5、专利的类型有:发明专利、实用新型专利、外观设计专利、 集成电路布图设计 6、国内检索专利信息的网站有哪些? (1)中国知识产权网; (2)中华人民共和国知识产权局 (3)中国专利信息网 (4)中国专利信息检索系统 (5)中国专利文摘数据库 (6)中国香港特别行政区知识产权署 7、美国专利与商标办公室简称USPTO 8、对专业人员根据其专业学术水平而授予的一种称号称为 学位 9、学位论文分为哪几种类型?(简答) 一类是理论研究型的,作者通常在搜集、阅读了大量资料之 后,依据前人提出的论点和结论,再通过自己的深入研究或 大量实验,进一步提出自己的新论点和新假说。另一类是调 研综述型的,作者主要以前人关于某一主题领域的科研课题 做出概括性的总结,提出自己独特的论点和新见解。 10、会议文献:是指在各种学术会议上宣读的论文、产生的 记录及发言、论述、总结等形式的文献。 11、会议文献按照出版时间的先后分为:会前文献、会中文 献、会后文献 12、科技报告:对科学、技术研究结果的报告或研究进展的 记录 13、美国政府的四大科技报告分别是:PB报告、AD报告、 NASA报告、DOE报告 14、标准文献:按照规定程序编制并经过一个工人的权威机 构批准的,供在一定范围内广泛而多次使用,包括一整套在 特定活动领域必须执行的规格、定额、规划、要求的技术文 件。 15、标准文献主要分为:国际标准、区域标准、国家标准、 专业标准、行业标准、基础标准 第七章 1、目前INTERNET网络资源主流是网络信息资源 2、网络信息检索的主要特点是什么?(简答) (1)交互式作业方式 (2)用户透明度 (3)信息检索空间的拓宽 (4)友好的用户界面且操作方便 3、网络检索工具共有的特点是交互式作业 4、网络信息检索工具的类型有哪些? (1)按照检索机制划分可分为: 1、分类目录检索工具; 2、搜索引擎检索工具; 3、混合型检 索工具\(2)按照检索的内容划分可分为1、综合型检索工具; 2、特殊型检索工具; 3、多元检索工具; 4、万维网和非万维 网检索工具 5、能够利用多个检索工具进行网络信息查询的检索工具称 为:多元检索工具 6、网络信息检索工具按照检索机制划分可分为:分类目录检 索工具、搜索引擎检索工具、混合型检索工具 7、搜索引擎按照信息内容组织方式划分为按检索词检索和 按分类检索 8、分类目录型检索工具的典型网站是:YAHOO 9、目前网络上适用最多的引擎的检索形式是按检索词检索 10、搜索引擎使用最多的分类是按照主题 11、搜索引擎主要由三个部分构成,分别是:搜索软件、索 引软件、检索软件 12搜索软件,通常称为机器人 13、检索软件决定搜索引擎的检索功能和返回结果的相关性 14机器人是一种计算机的程序 15、在遍历算法中,一般用到的两种方式是深度优先和广度 优先 16、内容索引项可以分为单索引项和多索引项 17、索引技术可以使用集中式索引算法或分布式索引算法 18、输入接口可以分类两种,分别是简单接口和高级接口 19、ALTA VISTA是常用的单个搜索引擎 20、EXCITE提供基本检索和高级检索 21、检索式中,专有名词的首字母必须大写 22、EXCITE突出特点是采用了概念检索 23、EXCITE特有的功能是范例检索 24、便于用户在各个搜索引擎间进行灵活快捷的切换的引擎 称为多元搜索引擎 25、用户的浏览器和多元搜索引擎系统交互的界面称为用户 接口 26、多元搜索引擎实际上是一种网络查询接口工具 27、功能较强的多元搜索引擎一般采用的处理方式是并行和 串行 28、查询操作大多仅支持简单的布尔逻辑操作 29、多元搜索引擎一般可分为并行处理和串行处理 30、常用多元搜索引擎又:MAMMA、SEARCH、 METACRA WLER、ASK JEEVES、PROFUSION 31、提高搜索结果准确性的方法主要有哪些?(简答) (1)运用引擎的词组检索、字段检索和邻接算符等控制检索 的范围 (2)使用有些搜索引擎的REFINE功能 (3)可以使用概念检索和相似页检索 32、基于链接评价的搜索引擎的优秀代表是GOOGLE 33、搜索引擎的研究发展方向是:智能化搜索、个性化搜索、 结构化搜索、垂直化专业领域搜索、本土化搜索 34、结构化搜索:是指充分利用XML等技术使信息结构化, 同时使查询结构化,从而使搜索的准确度大大提高。 35、搜索引擎的发展新趋势是垂直搜索引擎 第八章 1、联机检索系统包括的三个部分是:检索终端、通信网络、 联机检索中心 2、系统拥有的各种数据库称为联机数据库 3、联机系统中数据库的选择方法有:数据库类型、收录范围、 文档结构、记录内容、更新周期 4、DIALOG的特点有哪些?(简答) (1)拥有最多的数据库;(2)拥有的用户数量最多;(3)服 务项目较多;(4)检索模式较多 5、世界上规模最大的综合性商业联机检索系统是DIALOG 6、DIALOG的检索模式有:菜单式检索、命令式检索、目标 检索、WWW检索 7、DIALOG的八种服务方式都是什么?(论述) (1)回溯性检索。利用回溯性检索,系统能够保证满足用户 查全某一课题或者领域方面的文献需要 (2)定题信息检索。DIALOG系统的数据库根据文献信息内 容更新周期或者根据用户检索要求,定期的向用户提供所需 的信息。 (3)商界链接服务。它是系统为满足用户的商业信息需求而 提供的一种菜单式信息检索服务。 (4)电子邮件服务。它是DIALOG系统提供的电子邮件传 递服务。 (5)原文订购服务。它是DIALOG系统提供的联机文献订 购服务 (6)多文档检索服务。它允许用户使用一个检索策略同时检 索多个数据库,而没有必要每检索一个数据库就重复输入检 索指令。 (7)DIALINDEX。它是DIALOG系统为用户提供的数据 库选择工具。 (8)其他服务。DIALOG还提供图像输出服务、报表生成服 务、光盘检索服务、通信软件和图像处理软件服务以及各种 培训服务。 8、DIALOG系统中,检索字段分为基本检索字段和辅助检 索字段 9、保证获得满意检索结果的前提是正确选择数据库 10、选择数据库应该遵循的原则有:内容原则、范围原则、 时效原则、费用原则 11、获取检索结果通常采用的方式有:联机显示、脱机打印、 订购原始文献

信息检索复习资料

文献的定义 最简明的定义:记录有知识的一切载体。 定义:记录知识的一切载体,即用文字、图形、符号或声频等技术手段记录知识的物质载体,或固化在物质载体上的知识。 二次文献 将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。 特种文献 会议文献、学位论文、专利文献、标准文献、科技报告、政府出版物、产品资料、档案8种类型文献是一种介于图书与期刊之间的文献类型,通常在出版发行方面或获取途径方面比较特殊,因而也被称为特种文献或灰色文献。 文献检索式 或:A or B 或 A + B;用于扩大检索范围,增加命中文献数量,有利于提高检索结果的查全率。 与:A and B 或 A * B; 用于对检索词进行限定,从而缩小检索范围,有利于提高检索结果的查全率。 非:A not B 或 A – B;表示检索记录中凡含有A不含B的记

录被检出。能够缩小命中文献的范围,增强检索的准确性。 网上的文献格式 期刊、专著、论文集、学位论文、报告、专利论文、[国际、国家标准]、报纸文章、电子文献。 文献信息源 用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。文献信息源是信息源的主体部分,是信息搜集、存储、检索和利用的主要对象。 CA美国化学文摘数据库收录文献 期刊论文、会议论文、图书、学位论文、专利、技术报告。 什么数据库能检索会议文献 国外:ISI会议录数据库、会议论文索引数据库、OCLC PapersFirst 与ProceedingsFirst、STN联机系统中的CONF会议论文数据库、美国物理所电子会议录数据库、美国光学工程师学会会议文献数据库、美国航空航天协会电子图书馆。 国内:中国重要会议论文全文数据库、万方数据知识服务平台会议论文数据库、中国国家科技图书文献中心会议论文数据库、中国学术会议文献通报、上海图书馆会议资料数据库。

文献检索期末复习题

信息、知识、情报三者的相互关系是 A.情报>知识>信息 B.信息>知识>情报 C.知识>信息>情报D.信息是知识的源泉,知识是活化的情报,情报是系统化、理论化的信息 专著属于() A、一次文献 B、二次文献 C、三次文献 D、零次文献 二次文献是指( B ) A.参考或引用他人的著作之后出版的文献. B.对一次文献进行收集、分析、整理并加以编排的文献 C.对知识进行加工之后产生的文献 D.对一次文献阅读分析、归纳整理和推理之后进行概括、论述而成的文献。下列文献类型中不属于三次文献的是 A.百科全书 B.年鉴 C.会议文献 D.词典 目录、索引、文摘都属于: A、一次文献 B、二次文献 C、三次文献 D、零次文献 下列文献类型中属于二次文献的是:(C) A、百科全书 B、综述 C、 D、词典 下列文献类型中属于三次文献的是 A.学位论文 B.期刊论文 C.动态综述 D.文摘 以下文献哪一项是三次文献 A.指南 B.会议录 C.专利说明书 D.目录 文献特征包括外部特征和内部特征,它对应于数据库中的 A.字段 B.记录 C.文档 D.字段值 下列哪种文献属于一次文献 A、期刊论文 B、百科全书 C、综述 D、文摘 下列哪种文献属于二次文献 A、专利文献 B、学位论文 C、会议文献 D、目录 下列哪种文献属于三次文献 A、标准文献 B、学位论文 C、综述 D、文摘 下列选项中属于连续出版物类型的选项有 A、人民日报 B、学位论文 C、词典 D、会议文献 下列选项中属于连续出版物类型的选项有 A. 图书 B.学位论文 C.科技期刊 D、会议文献 人类从改造世界的实践中所获得的认识和经验总结可称为 A. 信息 B. 文献 C .知识 D. 情报 以下属于一次文献的是 A.综述 B.期刊论文 C.百科全书 D.会议记录 书目数据库主要提供的是 A.一次信息 B. 二次信息 C.三次信息 D.零次信息 下列文献中不是一次文献的有()。 A. 专利文献 B. 教科书 C. 科技报告 D. 期刊论文 下面哪一项不是情报的特点: A、保密性 B、传递性 C、公开性 D、时效性 利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止的检索方法

武汉大学《信息检索》试卷及答案(两套)

三.选择填空(4 x 5分=20分)1.C,d,g,I,j 2.a,b,e,g,h3.c,d,e,g, h4.c,d,f,g此题为多项选择题,选错者不倒扣分,但所选答案不得多于5个。 1.下列中不能用于查找期刊论文引用信息的有: a. SSCI b. CSSCI c. Journal Citation Report d. Ulrich’s International Directory of Periodicals e. SCI f. A&HCI g. ProQuest Digital Dissertations h. Web of Knowledge i.VIP Chinese Scientific Journal Database j.Chinese Enterprises and Companies Database 2.检索图书馆学、信息管理学的期刊论文,可用的检索工具有: a. LISA b. ISA c. BA d. CA e. Web of Knowledge f. Ei g. SSCI h. SCI i. ProQuest Digital Dissertations 3.下列中可用于查找机构信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals c.Chinese Enterprises and Companies Database d. Foundation Dire ctory e. Peterson’s Gradline f. Who is Who g. World of Learning h. Encyclopedia of Associations 4.下列中可用于查找期刊论文信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals c. ABI/INFORM d. Elsevier e. Journal Citation Report f. Chinese Academic Journal Fulltext Database g. OCLC Electronic Collections Online 武汉大学信息管理学院2008-2009学年度第二学期 《信息检索》考试试卷(A)答案 一、名词解释(5x4=20分) 1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 3.China Academic Library and Information System中国高等教育文献保障系统。 4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。 5.搜索引擎(Search Engine)是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。 二、简答(5x6=30分) 1.电子图书有哪些特点? 存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使

相关文档
最新文档