计算机信息检索02139自考资料

计算机信息检索02139自考资料
计算机信息检索02139自考资料

计算机信息检索02139自考资料

第一章信息检索概述

1.信息检索:指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。

2.根据检索手段的不同,信息检索能够分为手工检索、光盘检索、联机检索和网络检索。

3.信息检索的基本原理

经过对大量的、分散无序的文献信息是进行搜集、加工、组织、存储,建立各种各样的检索系统,并经过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获

得和利用信息源。

4.信息检索语言

信息检索语言是人们在加工、存储和检索信息时用来描述信息内容和信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。

5.五个信息检索阶段:手工检索、机械信息检索、脱机批处理检索、联机检索、网络信息检索,后

三者统称为计算机信息检索。

6.与手工检索相比,计算机信息检索的特点表现在:

(1)速度快、效率高,仅几分钟就能够从成千上万条记录中找到所需信息;

(2)检索范围广,能够迅速而方便地浏览相关学科或主题的所有数据库中的记录,在网络中,几乎每一台个人计算机都能够成为信息源;

(3)检索不受时空的限制,只要拥有相应的软件和硬件设备,就能够在任何地方借助光盘和通信网络查询所需信息。

7.信息检索的模型:就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译

和抽象,表述为某种数学公式,再经过演绎、推断、解释和实际校验,反过来指导信息检索实践。

信息检索的三个经典模型是:布尔模型、向量空间模型和概率模型。

8.信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。

9.信息检索系统是信息检索所用的硬件资源、系统软件以及信息资源集合的总和。

10.数据库由字段、记录和文档构成。

11.根据载体的不同,数据库可分为:联机数据库、光盘数据库和网络数据库三种。

12.信息检索系统评价的核心是检索性能评价。

13.检索性能评价:根据一定的评价指标对实施信息检索活动所取得的成果进行客观科学评价,以进

一步完善检索工作的过程。

评价检索效果的最主要的指标:查全率和查准率。

14.查全率

查全率是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。

15.查准率

查准率是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。

第二章网络信息检索的方法与技术

1.布尔逻辑检索的主要运算符

布尔逻辑检索的主要运算符有:逻辑与(“AND”)、逻辑或(“OR”)、逻辑非(“NOT”)。

它们分别代表的含义是:(1)逻辑“与”。表示检索结果中必须包含所有的检索词;(2)逻辑“或”。

表示检索结果中只要包含任何一个检索词即可;(3)逻辑非。表示检索结果中一定不能出现“NOT”

后面的检索词。

2.邻近检索

邻近检索是用一些特定的算符来表示检索词与检索词之间的顺序和词间距的检索。

3.短语检索:短语用“”表示,检索出与“”内形式完全相同的短语,以提高检索的精度和准确度,

因而也有人称之为“精确检索”

4.截词检索

是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符一般用“?”或“*”表示,但不同的数据库中有所差别。

常见的截词检索方法有前截词、中间截词和后截词。

5.在信息检索过程中,为了提高查全率或查准率,需要将检索范围限制在特定的字段中,即字段限

制检索。

6.模糊检索:模糊检索是指使用某一检索词进行检索时,能同时对该词的同义词、近义词、上位词、

下位词进行检索,以达到扩大检索范围、避免漏检的目的。

7.信息检索的主要技术有:

(1)全文检索技术;(2)多媒体信息检索技术;(3)超文本及超媒体检索技术;(4)智能信息检索技术;(5)可视化信息检索技术;(6)跨语言信息检索技术;(7)文本聚类技术。

(8)智能信息检索的最大特点是在检索过程中引入了资源对象的语义处理。

8.检索策略

检索策略是为实现检索目标而制订的全盘计划或方案,是就一个问题检索一个或多个数据库所输入的全部检索式的集合。

9.信息检索的一般步骤(主要流程):

(1)分析信息需求。即要确切了解所要查询的目的和要求,确定检索问题的关键词、涉及学科、信息类型、查询方式、查询范围、查询时间等。

(2)选择合适的检索工具。选择合适的检索工具主要从检索工具的类型、收录范围、检索问题的类型、检索具体要求等方面综合考虑。

(3)确定检索点与关键词。应尽量选专指词、特定概念或专业术语,避免冷僻词汇和太泛的词。

(4)正确构造检索式。利用搜索工具支持的检索运算、允许使用的检索标识和各种限定,正确构建检索式。

(5)及时调整检索策略。当检索结果为零或检索结果太少,需要扩大检索范围;检索时如果得到太多的检索结果,或检索结果不相关,需要缩小检索范围。

(6)检索结果的输出。

第三章搜索引擎

1.搜索引擎是一种基于Web上应用的软件系统,它以一定的策略在Web上搜索和发现信息,在对信

息进行处理和组织后,为用户提供web信息查询服务。

搜索引擎有三个功能模块:网页搜集;预处理;查询服务。

2.搜索引擎的工作原理:

搜索引擎的三个功能模块形成了搜索引擎工作的三个阶段。

(1)网页搜集。系统在一定时间内定向向网站派出“蜘蛛”程序,扫描网站的所有网页并将相关信息存入数据库。

(2)预处理。主要包括关键词的提取;重复网页或转载网页的消除;链接分析;网页重要程度的计算。

(3)查询服务。搜索引擎接受用户提交的查询请求后,按照用户的要求检索索引数据库,找到用户所需要的资源,并返回给用户,列表显示摘要结果。

3.按信息内容的组织方式,搜索引擎可划分为目录式搜索引擎和机器人搜索引擎。

(1)目录式搜索引擎。是以人工方式或半自动方式搜集信息,由搜索引擎的编辑员查看信息之后,依据一定的标准对网络资源进行选择、评价、人工形成信息摘要,并将信息置于事先确定的分

类框架中而形成的主题目录。

(2)机器人搜索引擎。是由一个被称作“蜘蛛”的计算机程序依据一定的网络协议以某种策略自动在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输

入检索索引库,并将查询结果返回给用户。

4.Yahoo是当前最流行的目录式搜索引擎,提供主题目录检索。

5.按专业范畴划分,可将搜索引擎划分为综合性搜索引擎和专业性搜索引擎。综合性搜索引擎内容

涵盖各个学科和生产生活的各个领域,可检索图片、音频、视频等多种资源类型,适用对象广泛。

6.常见的综合性搜索引擎包括哪些,专业性搜索引擎包括哪些

7.按检索功能划分,可将搜索引擎划分为独立搜索引擎和元搜索引擎。元搜索引擎是多个独立搜索

引擎的集合,经过一个统一的用户界面,可同时对多个搜索引擎进行检索操作。

8.调查显示,截止6月底,中国网民人数已达3.38亿。其中约2.35亿网民使用过搜索引擎,中国网

民用得最多的搜索引擎是百度。在全球范围内,7月,搜索引擎用户已达1137亿次,其中Google

市场份额最高。

9.综合性搜索引擎的评价指标主要有:

(1)收录范围。即搜索引擎收录的范围是否完备充分。(2)分类。即搜索引擎的分类是否科学合理,分类的广度与深度是否合适。(3)检索功能与效果。检索手段是否完善,检索效果是否好。

(4)对检索结果的处理。结果的排序方式是否多样、是否有去重功能、能否按照用户反馈动态调整

和显示检索结果。(5)页面组织。页面组织是否清晰、类目设置是否合理、界面是否友好。(6)其

它功能与服务。能否满足用户多方面的信息需求。

第四章国内重要的综合性信息检索系统

1.中国知网CNKI的《中国期刊全文数据库》(CAJ)是当前世界上最大的连续动态更新的中国期刊

全文数据库,收录了国内1994年至今的8200余种综合性期刊与专业特色期刊的全文。

2.中国知网CNKI提供了导航检索、逻辑式检索、智能辅助检索三种类型。

3.中国知网的源数据库资源主要有:中国学术期刊全文数据库,中国博士学位论文全文数据库,中

国优秀硕士学术论文全文数据库,中国重要会议论文全文数据库,中国重要报纸全文数据库,中国年鉴网络出版总库,中国工具书网络出版总库。

4.维普资讯网VIP的前身是科学技术部西南情报中心的情报分析网站,当前已发展成为集外文献、

企业咨询、动态新闻服务、行业信息资源等多种服务为一体的科技文献知识资源门户网站。

5.维普资讯网的主要资源有:中国科技期刊数据库,中文科技期刊引文库,外文科技期刊数据库,

中国科技经济新闻数据库,中国科学指标数据库。

6.维普资讯网设有专门的“专业检索首页”,为中文期刊专业文章提供一站式的检索服务。检索方式

有快速检索,传统检索,高级检索,期刊导航。

7.国家科技图书文献中心NSTL是经国务院领导批准,于6月12日成立的一个基于网络环境的科技

信息资源服务机构。

8.国际科学引文数据库(DISC)是国家科技图书文献中心(NTSL)于首创的集文献发现、引文链

接、原文传递为一体的信息服务系统。它提供快速检索,期刊浏览,来源文献检索,引文检索。9.中国高等教育文献保障系统CALIS 是经国务院批准的中国高等教育“211工程”、“九五”、“十五”

总体规划中三个公共服务体系之一。它的数据资源主要有中文数据资源、外文数据资源两大类。10.中国高等教育文献保障系统(CALIS)中的联合目录公共检索系统(OPAC)选择多库分类检索,

OPAC中的数据按照语种划分,可分为中文、西文、日文、俄文四个数据库。

11.中国科学院国家科学数字图书馆(CSDL)建设以来非常重视信息服务,其中:论文查收查引检索

及评价服务是根据用户需要,在国内外权威数据库中检索其论文被收录和被引用的情况,并出具相关检索证明报告。定题、专题检索服务是针对用户事先选定的专题,定期或不定期地进行文献跟踪检索,把经过筛选的最新检索结果,以书目、索引、全文等方式提供给用户。科技查新服务是根据用户提供的有关科研资料查证其研究结果是否具有新颖性,并做出结论。在线参考咨询服务是用户可按专业、机构或所处地理位置选择专家提问,可在线提交咨询表单。

第五章国外重要的综合性信息检索系统

1.学术资源整合平台(WOK)是基于互联网建立的动态的学术信息资源整合平台,提供自然科学、

工程技术、社会科学、艺术与人文等多个领域中高质量的学术信息。

2.学术资源整合平台(WOK)支持的运算有布尔逻运算,截词检索,短语检索。

3.在截词检索中,一般运用*代表多个字符,运用?代表一个字符。

4.引文检索是指从被引著者、被引文献入手检索文献的被引用情况。

5.美国Dialog系统是世界上最早和最大的专业情报检索系统,也是中国科技界广泛使用的系统。

6.美国Dialog联机检索系统支持的运算有布尔逻运算,位置限制检索,短语检索和截词检索。

7.SDOL采取浏览与检索相结合的方式,主要有期刊论文浏览、快速检索、高级检索、专家检索。

8.联机计算机图书馆中心(或OCLC)创立于1967年,是全球最大的不以赢利为目的、维护和管理

电子资源系统并提供计算机图书馆服务的会员制合作和研究组织。

9.PowerSearch 2.0检索平台支持对Gale的2万多种出版物的浏览,提供5种检索方式,包括基本检

索、主题词浏览、出版物浏览、高级检索、异构跨库检索。

10.CSA Illumina 是一个多学科、多信息类型的信息服务平台,当前由美国Proquest公司提供服务,

具有多语种文字检索界面。

第六章国外专业性书目信息检索系统

1.SciFinder是美国化学学会的分支机构推出的基于网络的文献检索系统。

2.在SciFinder检索窗口最上方的主工具栏中列出了3种检索模式:Explore References ,Explore

Substances,Explore Reactions。

3.在数据库CASREACT中检索化学反应及相关信息。检索化学反应仅有1种检索途径。

4.用化学结构式检索化学反应,能够用反应分类,报道反应信息的文献来源,文献出版年和反应步

数加以限定,以缩小检索范围。

5.在数据库CAS Registry 中检索化合物及相关信息,系统提供3种检索途径:化学结构检索,分子

式检索,物质检索.

6.BP主界面上提供6种检索方式:基本检索,高级检索,题录检索,检索工具,字段检索,多字段

检索。

7.工程索引(Engineering Village)系统所提供了5种检索方式:简单检索,快速检索,专家检索,

词表检索,标签检索。

8.PubMed提供概要、简介、文摘、引文、MEDLINE等5种显示检索结果内容的记录格式。

9.PubMed能够全部或部分保存文献记录,既可保存当前页,又能够保存其中的几条记录。保存方式

有:网页格式和纯文本方式。

10.荷兰医学文摘(Excerpta Medica,简称EM)创刊于1947年

11.美国教育资源信息中心(ERIC)的检索方法有:初级检索,高级检索,ERIC叙词表检索。

12.美国教育资源信息中心(简称ERIC)包括两部分内容:教育资源和当前教育期刊索引。

13.LexisNexis公司的数据库产品有:律商联讯、法律数据库、国会大全、统计大全、环境大全和学术

大全。

14.进入LexisNexis中文网站后,可见4个资源子库:法律子库,新闻和商业子库,企业界信息子库,

在线查询库

15.LexisNexis在线服务数据库主页的特点是无检索框。

16.LexisNexis系统默认的是Search方式,这种方式最符合用户的检索习惯。

第七章Internet上多媒体信息的检索

1.多媒体信息检索是指对包括图像和音频、视频等在内的多媒体信息进行特征元数据提取、索引建

库,同时根据用户的检索需求,将用户的信息需求表示与多媒体索引库进行相似度匹配运算,识别和返回用户所需信息,并经过与用户之间的反馈,不断优化、调整显示结果的过程。

2.当前,主流的多媒体信息检索方式主要分为基于文本的和基于内容的多媒体信息检索两类。

3.现在,主流搜索引擎都有基于文本的图像检索功能,具有基于内容的图像检索功能的搜索工具还

不多见。

4.基于内容的图像检索的原理是:首先根据分析图像的内容,提取其颜色、形状、纹理,以及对象空间关

系等信息,建立图像的特征索引库,而后将用户的检索提问与特征索引库进行匹配计算,返回检索结果。

5.常见的图像检索系统有10个:QBIC, WebSEEK, TinEye, Titomo, V AST, ImageRover, Scour,

Amazing Picture Machine, Lycos, Image Surfer

6.QBIC:QBIC是基于内容的图像检索系统的简称,是IBM Almaden研究中心开发的第一个商用的

基于内容的图像及视频检索系统,主要为IBM的DB2大型数据库提供图像检索,并支持基于Web 的图像检索服务。它提供了对静止图像及视频信息基于内容的检索手段,是标准的基于内容特征检索图像的工具。

7.WebSEEK的检索途径有3种:一是使用关键词进行自由全文检索,但不支持短语检索;二是利用

不同的类目等级进行主题浏览;三是在检出图像的基础上利用其可视属性进行进一步检索。

8.视觉语义图像查询系统提供4种功能,分别是:(1)文本查询功能:能够直接在文本检索框中输

入想要查询的文本关键字;(2)示例查询功能:在示例图像框中输入想要查询的样例图像,或者点击浏览选择图片;(3)综合查询功能:在示例图像框中输入想要查询的样例图像,或者点击浏览选择,同时在文本检索框中输入想要查询的文本关键字;(4)相关反馈:在进行文本查询后,如果满意结果中的某张图片,能够点击该图片下面的反馈链接,系统将返回与此图片相似且与文本关键字相关的图片集。

9.基于内容的视频检索一般有基于属性和基于对象两种方法,能够经过颜色、纹理、形状、空间

联系、原始语义、客观属性、主观属性、动作、文本和领域概念来表征视频信息。

10.基于内容的视频检索,其检索过程分为数据库建立和视频检索两个阶段,前一阶段的任务主要是

侦测视频片段边界、选择关键属性和提取诸如颜色、纹理、形状等低级别的空间特征,后一阶段则致力于经过颜色、形状或颜色与其它类目的组合,来进行用户需求向量与已有资源向量空间的相似度匹配。

11.现有的基于内容的视频信息检索工具主要有6个:VisualSeek,Informedia-II Digital Video Library,

Google Video Search, Yahoo Video Search, Open V,VideoQ

12.音频信息的检索可经过同音比较、听觉或知觉特征的提取、个人语言的主观特征描述和拟声法4

种方式来实现。

八专题信息的检索

1.专利包含三层含义,分别是专利权、专利技术和专利说明书。

2.专利权是指国家专利主管机关依据专利法授予申请人的一种实施其创造创造的专有权。

3.中国专利法将专利分为三种,即创造、实用新型和外观设计。

4.专利信息是指以专利文献作为主要内容或以专利文献为依据,经分解、加工、标引、统计、分析、整合

和转化等信息化手段处理,并经过各种信息化方式传播而形成的与专利有关的各种信息的总称。

5.专利信息可分为5种:技术信息、法律信息、经济信息、著录信息、战略信息。

6.专利文献是包含已经申请或被确认为发现、创造、实用新型和工业品外观设计的研究、设计、开发和试

验成果的有关资料,以及保护创造人、专利所有人及工业品外观设计和实用新型注册证书持有人权利的有关资料的已出版或未出版的文件(或其摘要)的总称。

7.专利文献的类型有一次专利文献,二次专利文献,专利分类资料。

8.专利分类是按专利文献的技术内容或主题进行分类,以便于查找,各国曾有不同的专利文献分类法。

9.中国专利说明书的编号体系包括:申请号,专利号,公开号,授权公告号

10.专门检索专利的搜索引擎有:FreePatentsOnline,IP-Discover,免费专利在线

11.商标是区别商品或服务来源的一种标志,每一个注册商标都是指定用于某一商品或服务上的。

12.商标信息检索的途径有:分类检索,关键词检索,图像检索

13.商标信息的主要来源有:商标主管部门提供的商标信息,商业性的商标数据库,专门的商标搜索引擎,

某企业的商标数据库。

14.专门的商标搜索引擎有:Trademarkia,桑尼维尔专利和商标中心,托马斯网

15.商业性的科技报告数据库:万方数据中的科技成果类数据库,NSTL的国外科技报告数据库,NTIS美

国政府报告数据库。

16.科技报告按保密性能够分为:保密报告、非保密报告和解密报告。

第九章网络信息检索与利用中的有关问题

1.《时代》杂志自起每年都会评选最佳网站。

2.Robert Harris是一名作家和具有多年大学教育经验的教育家,她提出了因特网研究资源评价的著名的

CARS指标体系,即:可信性、准确性、合理性、支持度。

3.我们将网络信息的评价标准归为两大类:网站性能的评价标准和网站内容的评价标准。

4.网站内容是网络信息资源评估中最重要的指标。

5.网络信息资源的评价方法一般划分为定性评价法、定量评价法和综合评价法。

6.网络信息利用中应特别注意知识产权的四个特征,即法定性、专有性、地域性和时间性。

7.个人文献管理软件是一种用于帮助用户组织、管理与课题相关的参考文献,建立个人参考文献数据库的

软件。

8.个人文献管理软件的主要作用是帮助用户有效管理已经获取的文献信息,而且对已经获得的文献信息进

行方便快捷的利用。

9.个人文献管理软件的基本功能包括:建立个人的书目文献数据库,或是个人虚拟图书馆;帮助用户组织、

管理已获取的文献信息;对个人的书目文献数据库进行快速检索;按特定格式要求快速插入引文(参考文献);导出/导入、备份/恢复个人文献数据库中的内容。

10.自动翻译是在没有人工翻译参与的情况下,利用最新技术生成的翻译,自动翻译一般也称为“机器翻译”。

11.自动翻译工具的功能有:文本翻译、文档翻译、网站翻译和翻译电子邮件。

第十章信息检索的主要应用-科技查新

1.“查新”一词来源于专利审查,其原来意义是新颖性检索,最早见于1978年6月公布的《专利合作条

例》。

2.1991年国家科委正式制定《科技查新咨询工作管理办法(讨论稿)》,并经过考核评定,公布了首批11

个国家查新咨询单位,查新工作纳入制度化轨道?

3.查新咨询分为以下几类:科研咨询;产品咨询;技术、方法咨询以及专利咨询。

4.查新质量主要表现在文献检索质量和查新报告质量两方面。

5.查新报告的质量情况主要由对比分析质量、结论质量和表述质量反映。

信息检索技术书中答案

《信息检索技术》书后习题及参考答案(部分) 第1章绪论 【综合练习】 一、填空题 1.文献是信息的主要载体,根据对信息的加工层次可将文献分为_________文献、__________文献、___________文献和___________文献。 2.追溯法是指利用已经掌握的文献末尾所列的__________,进行逐一地追溯查找_________的一种最简便的扩大情报来源的方法。 3.用规范化词语来表达文献信息__________的词汇叫主题词。主题途径是按照文献信息的主题内容进行检索的途径,利用能代表文献内容的主题词、关键词、叙词、并按字顺序列实现检索。 4.计算机信息检索过程实际上是将___________与____________进行对比匹配的过程。 5.无论是手工检索还是计算机检索,都是一个经过仔细地思考并通过实践逐步完善查找方法的过程。检索过程通常包含以下几个步骤_________、__________、__________、__________、_________。 6.检索工具按信息加工的手段可以分文__________、____________、___________。 7.《中国图书馆图书分类法》共分___________个基本部类,下分________个大类。 8.索引包括4个基本要素:索引源、___________、___________、和出处指引系统。 答案1.零次,一次,二次,三次 2.参考文献,引文 3.内容特征 4.检索提问词,文献记录标引词 5.分析课题,选择检索工具,确定检索途径及检索式,进行检索,获取原文 6.手工检索工具,机械检索工具,计算机检索工具 7.五,22 8.索引款目,编排方法 二、判断题 1.在检索信息时,使用逻辑符“AND”可以缩小收缩范围。() 2.逆查法是由近及远地查找,顺着时间的顺序利用检索工具进行文献信息检索的方法。() 3.按编制方法划分,信息检索工具可以分为:手工检索工具、机械检索工具、计算机检索工具。() 4.请判断下面图书的国际标准书号的格式是否正确。ISBN:978-030-26151-X。() 5.文献的专利号、报告号、合同号、标准号、索取号、国际标准书号、刊号属于文献的内部特征。 6.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检索。 答案1.√2.×3.×4.√5.√6.× 三、选择题(单选或多选)

信息检索心得体会

学习信息检索这门课程后,对其应用有了学习、熟悉的过程,从中得到了很多体会与心得。 通过对信息检索的学习,不仅让我真正懂得了信息检索的深刻涵义,更了解到怎样选择正确的检索词来构成检索策略进行检索。在实际检索过程中,仅需一个检索词就能满足检索要求的情况并不很多。通常我们需要使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂课题的要求。对于文献信息检索的方法,最重要的是关键词的选择,即检索词和检索策略的选择。检索词选的精确,不仅可以节省时间,提高检索速度,而且可以大大提高检索结果的质量,更容易找到自己所需数据或文献资料。 书本检索工具具有查阅方便的特点,但有时受出版时间的限制,往往不能反映最新的资料。期刊式检索工具能反映最新的资料,但由于篇幅的限制,又不能全面反映资料的历史内容。查找学科方面的专题资料,首选的是专业性检索工具,因为它反映的是本学科领域内的文献,专指性强,能节省时间和精力。但同时,也要注意配合使用综合性检索工具。综合性检索工具能反映各个学科的内容,开拓知识面和视野。 现代学科之间的渗透很多,查阅综合性检索工具有时能得到意想不到的收获,尤其是国内的一些检索工具,往往采用分类进行编排,一些跨学科的文献往往分散在不同的类目中,因此更要注意利用综合性检索工具。在检索中要注意将专题书目与综合性书目、专题索引与综合性索引、专业数据库与综合性数据库等配合起来使用。中文检索工具,如中国知网、万方数据资源系统等,只能反映国内的研究成果,要注意充分使用外文的检索工具如EBSCOhost-外文期刊全文数据库、Springer-Verlag,WorldSciNet(WSN)全文电子期刊,获得世界上最新的研究动态。只有了解国内外的研究动态,才能使论文具有较高的水平。 科技文献检索与论文写作这门课程是最实用的课程之一,学习这门课程的目的是学会利用信息检索如何最快最准确的搜索想要的信息。文献检索作为一种工具,能通过他人的知识而对前人研究继承,发展和创新,通过研究思路和方法的学习和借鉴来进一步进行自己的研究,对于我们以后写毕业论文会有很大的帮助。文献信息资料是学习和研究工作的基础,各项学习和研究工作都将根据我们搜集到的文献信息资料来开展。信息资源越丰富,学习和研究工作成功的可能性就越大。面对日益增长的文献资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息?这就需要具备文献检索的基本技能,通过文献检索,可以获取学术动态;通过文献检索可以寻找未知问题的答案;通过文献检索可以培养信息意识、提高自学的能力……可以说,同学们平时的学习及毕业论文的写作等都与文献检索密切相关。 在此次文献检索课程中,通过老师的介绍,我不仅了解到了信息检索方面的基础知识,如文献可以分为期刊,专利,会议资料,学位论文,科技报告等,并

中国科学院大学计算机领域信息检索期末考试答案

域信息检索与利用实用技巧 任课老师:李玲 试题专用纸 1、简答题:您在学习和研究过程中遇到下列问题时,常用哪些方法来解决? (10题,3分/小题,共30分) (1)查找期刊时,您常用的方法? 答: 中文期刊一般用:中国知网、万方数据库、维普数据库等; 外文期刊一般用:ACM、IEEE、Elsevier ScienceDirect、SpringerLink、Science Online 、Taylor & Francis Online Journals 、Cambridge Journal等; 可通过国科大图书馆进入上述网站首页,输入所需检索的期刊信息,如期刊名 称、作者、发表年份等信息进行查询。 (2)查找中国科学院学位论文时,您常用的方法? 答: 进入“中国科学院大学”首页→点击右下方“图书馆”→点击进入“中科院学位论文数据库”→进入检索界面,输入所需检索的论文信息,如:论文名称、作者、指导老师等。 (3)查找各国专利以及专利的被引用情况时, 您常用的方法? 答:进入国家知识产权局官网“https://www.360docs.net/doc/e113338292.html,”,输入所需检索专利的发明名称、申请号、申请人(三者至少必填其一)进行检索,查看专利被引用情况。 (4)查找SCI期刊的影响因子,您常用的方法? 答:通过国科大图书馆点击“ISI-SCIE”进入web of science平台查询界面,输入期刊的关键词、作者等信息,可通过“AND”进行多个关键词组合以缩小查询范围。 (5)查找标准文献时,有哪些注意事项? 答:合理选择标准数据库(如中文期刊会议类检索工具选用CNKI、维普、万方等,查询专利选用国家知识产权局等数据库); 注意文献的发表时间(如利用CNKI科技类期刊数据库查询只能查询1994年之后发表的文献,维普中文科技期刊库可查询1984年之后发表的文献) 使用多个精确的关键字组合,以减小检索范围。 (6)文献管理时,您常用的方法? 答:使用EndNote文献管理工具,进行分类管理方便后期查询。

计算机信息检索重点

信息检索 数据(Data):泛指所有描述事物的形貌、特性、状态或任何其他属性的数字、文字或符号。一般指原始,未处理过的数据。 信息(Information):1. 物质存在的一种方式。一般指数据、消息中所包含的意义。可以使消息中所描述的事件的不定性减少。 2. 是事物运动的状态与方式的反映。 知识(Knowledge):A、是在改造世界的实践中所获得的认识和经验的总和。 B、是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的 有组织的陈述。提供某种经过思考的判断和某种实验的结果。 (信息是知识的原材料,知识是信息加工的抽象化产物。) 情报(Information):钱学森:“情报是活化了的、激活了的知识”。可以理解为是指传递着的有特定效用的知识或信息。 三要素:知识性、传递性、效用性 文献(Literature):记录有知识的一切载体。 三要素:载体(文献的外部形式,它是知识的包装或运载方式,常称之为媒体(media)。)、知识(反映了文献的信息内容。)、记录(信息的一种人工编码,通过人工、机械以及声、光、电、磁等各种技 术手段生成多种包含知识信息内容的符号,以一定的形态出现,形成各种媒体的文献类型。) 文献对人类文明进步具有重大意义:知识的积累、传播与创造研究成果的确认与评价 信息环境及其认识:信息环境的变化,20世纪90年代中期前,书本时期-----手工检索,缩微时期-----缩微检 索,20世纪90年代后期,光盘时期-----单机检索,网络初期-----联机 检索 21世纪,网络兴盛-----网络检索 第一章信息检索原理 一、信息检索的含义(掌握) 广义:信息检索包括信息的存储过程和查找过程;狭义:仅指信息的查找。 二、信息检索的类型 (一、)以检索内容划分(重点) 1.文献信息检索 凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位等,都属于文献信息检索范畴。其检索的结果是文献信息 2.数据信息检索(Data Retrieval) 凡是利用参考工具书、数据库等检索工具检索包含在文献中的某一数据、参数、公式或化学分子式等,统称为数据信息检索。其检索结果为数据信息。 3.事实信息检索(Fact Retrieval) 凡是利用百科全书等检索工具从存储事实的信息系统中查找出特定事实的过程称为事实信息检索。其检索结果是基本事实。 文献信息检索是一种相关性的检索,检索的结果是文献线索,还必须进一步查找才能检索到有关的一次信息;数据与事实信息检索是一种确定性检索,检索的结果是可供用户直接利用的信息。一般情况下,文献信息检索通过二次信息来实现,而数据与事实信息检索则通过三次信息来完成。 (二、)以信息存储和检索的方式和技术划分(掌握) 1.手工检索(Manual Retrieval) 手工检索简称“手检”,是指人们通过手工的方式来存储和检索信息。其使用的检索工具主要是书本型、卡

计算机信息检索02139自考资料

第一章信息检索概述 1.信息检索:指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.根据检索手段的不同,信息检索可以分为手工检索、光盘检索、联机检索和网络检索。 3.信息检索的基本原理 通过对大量的、分散无序的文献信息是进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。 4.信息检索语言 信息检索语言是人们在加工、存储和检索信息时用来描述信息内容和信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。 5.五个信息检索阶段:手工检索、机械信息检索、脱机批处理检索、联机检索、网络信息检索,后三 者统称为计算机信息检索。 6.与手工检索相比,计算机信息检索的特点表现在: (1)速度快、效率高,仅几分钟就可以从成千上万条记录中找到所需信息; (2)检索范围广,可以迅速而方便地浏览相关学科或主题的所有数据库中的记录,在 网络中,几乎每一台个人计算机都可以成为信息源; (3)检索不受时空的限制,只要拥有相应的软件和硬件设备,就可以在任何地方借助 光盘和通信网络查询所需信息。 7.信息检索的模型:就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译和 抽象,表述为某种数学公式,再经过演绎、推断、解释和实际校验,反过来指导信息检索实践。 信息检索的三个经典模型是:布尔模型、向量空间模型和概率模型。 8.信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。 9.信息检索系统是信息检索所用的硬件资源、系统软件以及信息资源集合的总和。 10.数据库由字段、记录和文档构成。 11.根据载体的不同,数据库可分为:联机数据库、光盘数据库和网络数据库三种。 12.信息检索系统评价的核心是检索性能评价。 13.检索性能评价:根据一定的评价指标对实施信息检索活动所取得的成果进行客观科学评价,以进一 步完善检索工作的过程。 评价检索效果的最主要的指标:查全率和查准率。 14.查全率 查全率是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。 15.查准率 查准率是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。 第二章网络信息检索的方法与技术 1.布尔逻辑检索的主要运算符 布尔逻辑检索的主要运算符有:逻辑与(“AND”)、逻辑或(“OR”)、逻辑非(“NOT”)。 它们分别代表的含义是:(1)逻辑“与”。表示检索结果中必须包含所有的检索词;(2)逻辑“或”。表示检索结果中只要包含任何一个检索词即可;(3)逻辑非。表示检索结果中一定不能出现“NOT”后面的检索词。 2.邻近检索 邻近检索是用一些特定的算符来表达检索词与检索词之间的顺序和词间距的检索。 3.短语检索:短语用“”表示,检索出与“”内形式完全相同的短语,以提高检索的精度和准确度, 因而也有人称之为“精确检索” 4.截词检索 是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符一般用“?”或“*”表示,但不同的数据库中有所差别。 常用的截词检索方法有前截词、中间截词和后截词。 5.在信息检索过程中,为了提高查全率或查准率,需要将检索范围限制在特定的字段中,即字段限制 检索。 6.模糊检索:模糊检索是指使用某一检索词进行检索时,能同时对该词的同义词、近义词、上位词、 下位词进行检索,以达到扩大检索范围、避免漏检的目的。

信息检索答案

信息检索答案 题型一 1、信息素养或素质的具体内容有那些? 信息素质是指用户在利用以计算机及其网络技术为代表的现代科学技术进行知识学习、成长的过程中,逐步形成的主动参与信息活动、自觉应用信息技术的意识、态度、理念及具备的获取、识别、加工、处理、传递、创造信息的能力和利用信息去解决实践问题的能力。它包括强烈的信息意识、系统化的信息理念、综合信息能力等内容。 2、信息、知识、情报、文献的概念?文献的组成要素? 信息的概念:1、信息是人们根据一定目的和需要,把从自然现象和社会现象中搜集的原始材料进行加工、处理,找出其中关系而形成的对象实体。 2、信息是有一定含义的、经过加工处理的、对决策有价值的的数据,即信息=数据+处理 3、信息是人们对数据进行系统组织、整理和分析,使其产生相关性,但没有与特定用户行动相关性的实体对象,信息可以被数字化。 知识的概念:知识是指人们在认识世界、改造世界中所获得的认知,包括通过阅读、学习等方式的认知和通过自己或他人的历练所积累的一切经验的总和。 情报的概念:是被人们所利用的信息、被人们感受并可交流的信息。 文献的概念:是记录有知识的一切载体。 文献的组成要素:不但包括现代图书馆的全部馆藏,同时也包括了档案馆、博物馆、声像馆和情报中心收藏的全部馆藏。 3、信息、信息资源包括那些类型?1)信息的类型:从产生信息的客体的性质来分,可分为自然信息(瞬时发生的声、光、热、电、形形色色的天气变化、缓慢的地壳运动、天体演化……)、生物信息(生物为繁衍生存而表现出来的各种形态和行为,如遗传信息、生物体内信息交流、动物种群内的信息交流)、机器信息(自动控制系统)和(人类)社会信息。以信息所 依附的载体为依据,可分为文献信 息、口头信息、电子信息、生物信息 等 信息资源类型:根据存储媒介不同, 信息资源可以划分为印刷型信息资 源、电子信息资源、数字信息资源和 多媒体信息资源。 4、文献有那些类型?将文献划分成 这些类型的依据是什么? 1)根据载体材料、存储技术、和传 递方式划分 可划分为:印刷型、缩微型、试听型 和机读型文献信息源 2)根据加工程度的不同划分 可分为:一次文献信息源、二次文献 信息源、和三次文献信息源 3)根据文献信息源的内容划分 可以分为:图书、期刊、报纸、科技 报告、政府出版物、会议文献、专利 文献、学位论文、标准文献、档案文 献、产品样本 5、数据库的类型?网络资源有那些 特点? 数据库的类型:联机数据库和光盘数 据库、网络数据库 网络资源有那些特点:数量庞大、增 长迅速;内容丰富、形式多样;变化 频繁、价值不一;结构复杂、分布广 泛;信息分散、无序等 6、何为“核心期刊“?本专业的核心 期刊有那些? 核心期刊定义是 :在某一学科中 ,少 数期刊覆盖了该学科的大部分文献 , 而多数期刊仅包含该学科的少量文 献 ,这少数期刊就是该学科的核心期 刊。 本专业的核心期刊有:《政治与法 律》、《环球法律评论》、《当代法学》、 《法学》 7、什么是信息检索?类型有哪些? 定义:是通过一定的方法和手段将用 户的提问特征与数据源所采用的特 征标志进行对比,然后将二者相一致 或比较一致的信息提取出来供用户 使用的过程。 类型:文献检索、数据检索、事实检 索 8、简述信息检索的原理。 信息检索的实质是一个匹配过程,也 就是信息用户需求的主题概念或检 索表达式同一定信息系统的系统语 言相匹配的过程,如果两者匹配,则 所需信息被检中,否则检索失败。 9、什么是计算机信息检索系统?它 由几个部分组成? 计算机信息检索系统:是利用计算机 和一定的通信设备查找所需信息的 检索方式,检索的系统就是人的设计 操作和计算机自动化处理相结合的 系统。 组成部分:光盘检索系统、联机检索 系统、网络检索系统 10、计算机信息检索技术包括哪些? 布尔检索、向量空间检索、模糊集合 检索、概率检索、全文检索,发展到 超文本检索并向着智能化方向发展。 11、从外表特征和内容特征来看,检 索语言的类型各有哪些?不同特征 各举一简单的检索式。 描述信息外部特征的检索语言包括 题名(书名、刊名、篇名)、著者姓 名\单位名称、出版事项、代码\序号 (如专利号、报告号、标准号)等, 其作为检索标志直接明了,使用时较 为简单。 描述信息内容特征的检索语言包括 分类语言和主题语言,主题语言又可 分为关键词语言、单元词语言、标题 词语言和叙词语言。 12、为什么要创建检索语言,它有哪 些类型?比较分类语言和主题语言 的优缺点。 1)检索语言是指用于描述信息系统 中信息的内容特征及外部特征和表 达用户信息提问的一种专门语言,目 的是为了便于检索文献。 2)类型:按检索语言是否受控可分 为人工语言和自然语言,按检索时的 组配实施状况可分为先组式和后组 式检索语言,按描述信息特征的不同 可分为描述信息外部特征的检索语 言和描述文献内容特征的检索语言。 13、信息(文献)检索的方法与途径, 详细论述检索步骤? 1、分析研究课题,明确检索要求: 分析课题的主要内容、确定课题的文 献类型、确定检索时间范围、分析用 户的检索评价要求 2、选择检索工具:根据检索课题的 要求,选择最能满足检索要求的检索 工具书,不同的资料类型就应该选用 不同的数据库 3、确定检索策略:确定检索途径、 制定检索策略 4、调整检索方案:确定了具体的检 索方法之后,就要利用所用数据库, 在一定的年代范围内具体查找,以获 得文献线索。用户对每次检索结果在 作出判断,并对检索策略做出相应的 修改和调整,知道得到满意的结果 5、获取原文:利用全文数据库直接 获取,利用文献传递系统获取、利用 文摘数据库的原文服务、利用OPAC 检索系统,进行馆际互借。 14、什么是文献线索?列举以上不同 文献类型(期刊论文、会议论文、图 书、标准等)的线索。 文献线索:文献检索的概念有狭义和 广义之分。 狭义的检索(Retrieval)是指依据一 定的方法,从已经组织好的大量有关 文献集合中,查找并获取特定的相关 文献的过程。这里的文献集合,不是 通常所指的文献本身,而是关于文献 的信息或文献的线索。如果真正要获 取文献中所记录的信息,那么还要依 据检索所取得的文献线索索取原文。 广义的检索包括信息的存储和检索 两个过程(Storage and Retrieval)。信息 存储是指工作人员将大量无序的信 息集中起来,根据信息源的外表特征 和内容特征,经过整理、分类、浓缩、 标引等处理,使其系统化、有序化, 并按一定的技术要求建成一个具有 检索功能的工具或检索系统,供人们 检索和利用。而检索是指运用编制好 的检索工具或检索系统,查找出满足 用户要求的特定信息。 15、简述“超星电子图书馆”、“书生之 家数字图书馆”、“中国学术期刊全文 数据库”、“维普中文科技期刊数据库” 和“万方数字化期刊”收藏资源的特 点 1)、超星电子图书馆:收录的电子图 书内容丰富,包括经典理论、哲学、 社科、经济、语言文字、文学、数理 化、生物、工业技术、计算机等50 余个学科门类,现拥有中文电子图书 80万种,论文300万篇,全文总量4

计算机信息检索实验报告(6个)

实验一网上中文搜索引擎及其使用 一、实验心得 在电脑已经成为生活必备品的现在,日常搜索是一件很平常的事情。俗话说,天天百度知识丰富。当然,我国国内主要的搜索引擎除了百度,还有谷歌、雅虎、搜狗、网易、新浪。 一般来说,百度和谷歌是最多人用的。不同的搜索引擎,不同的搜索方法,得到搜索结果的速度和准确度也不一样。所以我觉得学习计算机信息检索的主要目的就是更好地提高自己搜索的速度和准确度。 在这次实验当中,我们主要学习和掌握以下搜索技巧的运用。「“”」的基本用法、「+」或「空格」的基本用法、「+」的基本用法、「-」的基本用法、「OR」的基本用法、「site」的基本用法、「inurl」的基本用法、「intitle」的基本用法、「filetype」的基本用法。比起以前直接把整个问题打上去然后从网页中寻找满意的答案,灵活使用这些搜索技巧可以更快地找到准确率高的答案。这些技巧在现实生活中具有高度的可操作性和便捷性。 二、实验结果 (一)请使用Google或百度搜索引擎完成以下知识测验:(请将检索结果复制到题干之后,并把所有有关的网页都下载到你的作业文件夹中,以作为本作业评分的依据。) 1.谁根据小仲马的《茶花女》改编了同名歌剧( B ) https://www.360docs.net/doc/e113338292.html,/b/7602599.html A.奥斯汀 B.威尔第 C.福楼拜 2."生存还是死亡,这是一个问题。"出自莎士比亚的哪部作品?( A )https://www.360docs.net/doc/e113338292.html,/question/25934693.html A.《哈姆雷特》 B.《李尔王》 C.《麦克白》 3."侦探福尔摩斯"第一次出现是在下列哪部作品中: ( A ) https://www.360docs.net/doc/e113338292.html,/question/1306083005651.html A.《血字的研究》 B.《东方快车谋杀案》 C.《尼罗河上的惨案》 D.《难逃一生》 4.李清照词中名句"寻寻觅觅,冷冷清清,凄凄惨惨戚戚"的词牌名是: ( D ) https://www.360docs.net/doc/e113338292.html,/wenda/thread?tid=7c29ad4f072df739&hl=cn A.醉花阴 B.一剪梅 C.如梦令 D.声声慢 (二)请在网上寻找如下列图片。 1.寻找如下图所示世界名画《蒙娜丽莎》的指定图片和介绍她被偷的文章 提示:可试用以下检索词:Mona Lisa Louvre museum stolen 蒙娜丽莎 500岁蒙娜丽莎被偷卢浮宫 图片网址: https://www.360docs.net/doc/e113338292.html,/i?ct=503316480&z=0&tn=baiduimagedetail&word=Mo na+Lisa+Louvre+museum+stolen&in=31376&cl=2&lm=-1&pn=10&rn=1&di=101230 20660&ln=1&fr=&ic=0&s=&se=&sme=0&tab=&width=&height=&face=0&fb=0 文章地址:https://www.360docs.net/doc/e113338292.html,/hualang-1534-7665506.shtml

信息检索学习的重要性和必要性

信息检索学习的重要性和必要性 随着社会信息化程度的不断提高,现代科技进步和社会经济发展对信息资源、信息技术和信息产业的依赖越来越大,人才被赋予新的内涵。检验人才的标准除具有良好的思想觉悟和道德品质,较宽厚的专业知识、较合理的知识结构外,是否具备较强的信息素质已成为一项不可或缺的重要指标。面对信息社会,只有具备信息素质的人,才能适应信息社会的需要,也只有接受过良好信息素质教育的人,才能在信息社会中表现出极大的潜力和创造力,在社会竞争中处于优势。 德国柏林图书馆门前有这样一段话:“这里是知识的宝库,你若掌握了它的钥匙,这里的全部知识都是属于你的。”这里所说的“钥匙”即是指信息检索的方法。 信息检索顾名思义就是把你想要知道的、了解的信息通过某种途径把它搜索出来。在百度词条中可以查到,信息检索的释义是信息按一定的方式组织起来,并根据信息用户的需要找出相关的信息的过程和技术。 信息检索起源于图书馆的参考咨询和文摘索引工作。而在信息处理技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各个领域高速发展,并得到了广泛的应用。

在现代社会,各种文化和知识不断充斥着我们的大脑,我们对各式信息的需求越来越多,可是有时候面对太过复杂而且繁多的信息量时,我们会感到无所适从。我们要找到符合自己需要的信息时,就必须运用信息检索这一重要的信息查询手段,因而学会信息检索是十分重要且必要的。 学习如何利用信息检索搜索有用信息,有利于培养学生利用信息的习惯,并使其认识到信息检索的重要性,提高信息检索的速度,使用信息检索这一工具也更加熟练。这特别对我们来说,信息检索是我们必须掌握的一门技术,学会之后,有利于增强我们的专业知识,提高我们的文化素养。 信息检索对每一个现代人都是十分必要的,你总会在某些时候需要它,因此它具有很强的实用性。当我们遇到学识上的困难时,以往我们会通过去图书馆翻阅资料来解决问题。但现代社会是一个高科技占主导地位的社会,因此现如今我们经常使用网络上的搜索工具来帮助我们,如谷歌、百度、维基,在未学习信息检索之前,我只知道这些,学习之后,我知道了有比百度之类的更具有专业性的信息检索网站,如中国知网、万方、维普。老师说这些网站对于我们写毕业论文、研究生论文等都具有非常强大的作用的,因为它们这里面有很多书籍是在一般门户网站里找不到的,具有很高的专业性。 我们掌握了信息检索的方法和步骤后,我们可以以最快

计算机信息检索复习资料

计算机信息检索复习知识点 第一章 1、人类生活的3个基本要素是材料、能源和信息。(单选) 2、信息是指应用文字、数据或信号等形式,通过一定的传输和处理,来表达各种相互联系的客观事务在运动中所具有的特征性内容夫人总称。(名词) 3、信息的特征有:客观性、动态性、相对性、依存性、可传递性。(多选) 4、共享性是指同一内容的信息可以在同一时间里被多个信息用户使用。 5、信息的功能有哪些?(简答) (1)信息是感知世界的中介;(2)信息是管理决策的依据;(3)信息是科学研究的必要条件;(4)信息是社会发展的资源; 6、信息的类型有哪些?(论述) (1)按信息的表达形式划分,可以分为 ①文献信息②声像信息③电子信息 (2)按信息的应用范围划分,可分为 ①白色信息②灰色信息③黑色信息 (3)按信息的加工层次划分 ①一次信息②二次信息③三次信息 7、信息需要:所谓信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需要。(名词) 8、信息需求的特征有哪些?广泛性、社会性、发展性、多样性(多选) 9、现代信息技术的基础是微电子技术(单选) 10、数据库是指为满足多个用户的多种应用需要,按一定的数据模型在计算机中组织、存储和使用的相互联系的数据集合。(名词、单选) 11、通信系统的基本组成包括信源和:信宿、变换器、反应器、信道、噪声源 12、信号的接收者称为信宿 13、信息传输的通道称为信道 14、信号在传输过程中受到的干扰称为噪声 15、数据库简称DB 16、数据库的四种基本操作是:检索、更新、删除、插入 17、数据库的特点有哪些?(简答)(1)数据共享;(2)面向全组织的数据结构化;(3)数据独立性;(4)可控数据冗余度;(5)统一数据控制功能。 18、数据结构化有利于实现数据共享 19、数据库管理系统可以提供哪些方面的数据控制功能:安全性、完整性、并发控制、数据恢复 20、构成数据库的三个主要层次是:文档、字段、记录 21、记录的基本单元是:字段 22、文档的基本单元是记录 23、一个文档中你好,认识一下!包含大量的记录 24、检索系统提供的数据库相关文档组成包括的文件数是3个 25、顺排文档:按记录的存取号的大小顺序存入全部记录,它相当于印刷型检索工具的正文部分。 26、倒排文档:把记录中的可检字段抽出,包括单元词、多元词,按某种顺序重新加以组织后得到的一种文档。 27、倒排文档只包括记录的标识、信息的数量及信息存取号。 28、存储了数据库所有记录的特征标识的是倒排文档 29、数据库文档中便于随机存取,实现非顺序存储结构的文件是索引文档 30、传统的检索对象主要是文献型的信息源 31、传统的检索对象的存储介质是纸张 32、对超文本、超媒体信息资源实施的检索是超维检索 第二章 1、计算机信息检索经历了哪几个主要发展阶段?(简答)(1)脱机批处理检索阶段;(2)脱机检索阶段;(3)光盘检索阶段;(4)网络化检索阶段 2、计算机信息检索必备的条件是物质和人员 3、计算机检索的类型有哪些?(论述) 计算机信息检索的类型可以通过检索的内容、信息出版的时间和检索工作的方式加以划分 1根据计算机信息检索的内容划分,检索可以分为 (1)数据检索;(2)事实检索;(3)文献检索 2根据被检索信息出版的时间划分,可分为:(1)定题信息检索;(2)回溯性信息检索 3根据计算机检索工作的方式划分,可分为:脱机检索系统;(2)联机检索系统 4、事实检索的对象是事实 5、检索结果能够满足用户需要的文献线索或文献全文的是文献检索 6、回溯性信息检索:根据用户提供某一段时间范围内的文献信息的检索方法 7、计算机批处理的信息检索系统称为脱机检索系统 8、用户以联机会话方式直接访问系统及其数据库的信息检索系统称为联机检索系统 9、信息检索系统:是指按照某种方式、方法见利起来的供读者检索信息的一种有层次的体系,是表征有序的信息特征的集合体。 10、信息检索系统的职能有:报道职能、存储职能、检索职能 11、信息数据库可以划分为:参考数据库、源数据库、混合型数据库 12、参考数据库:是指用户从中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库 13、源数据库:能够直接为用户提供原始资料或具体数据的一类数据库。 14、信息系统的构成模式是什么?(简答) (1)信息数据的选择、处理、录入和维护子系统;(2)词表和标引子系统;(3)检索子系统;(4)系统----用户接口子系统统 15、信息检索系统的存储结构有:印刷存储、微缩存储、磁存储、半导体存储、光存储 16、信息存储的逻辑结构有:线性结构、非线性结构、树形结构、网形结构 17、数据元素按一定顺序构成一个有限序列的信息存储结构称为:线性结构 18、非线性结构中最常用的的是树形结构和网形结构 19、将信息用二进制表示称为编码 20、计算机处理信息的最小单位是一位二进制数 21、两级存储器是指主存储器和辅助存储器 22、信息检索的概念起源自文献信息检索 23、对信息进行主题分析,提取代表该信息的特征的过程称为标引 24、自动抽词标引:利用计算机直接从信息正文、标题或文摘中抽出能表达信息主题的关键词作为标引词,并自动生成 关键词索引或倒排文档。 25、对一本书或一篇文章所做的扼要摘述称为文摘 26、利用计算机自动编制文摘称为自动文摘 27、在信息检索自动化处理中,常用的运算是排序 28、常用的自动排序的方法有选择排序和快速排序 29、存储区域网简称为SAN 30、目前大多数中小企业见利网络环境的协议基础是 TCP/IP 31、信息检索系统的组织:为了控制信息的流速和流向、数 量和质量等,把传递中的杂乱无序的信息整理为系统有序状 态的活动。 32、信息检索系统的组织目的是什么?(简答) (1)减少社会信息流的混乱程度; (2)提高信息系统的质量和价值; (3)建立信息检索系统与用户的联系; (4)节省社会信息活动的总成本。 33、信息检索系统的组织的要求有哪些 (1)信息内容有序化; (2)信息流向明确化; (3)信息流速适度化; (4)信息质量最优化。 34、信息检索系统组织方法:是指对每一信息的各种外表特 征和内容特征进行描述并确定其标识,然后按一定方式或规 则将其内容组织起来以供检索的方法 35、信息检索系统的传统组织方法有哪些? (1)分类组织法;(2)主题组织法;(3)字顺组织法;(4) 号码组织法;(5)自然组织法 36、进行网络信息资源组织的方式主要有:文件组织方式、 主题树组织方式、超文本组织方式、超媒体组织方式、元数 据组织法 37、以文件为单位共享和传输信息的组织方式称为文件组织 方式; 38、超文本的信息组织方法是非线性; 39、元数据又称描述数据; 40、对初选信息的鉴别、筛选和删除称为优化; 41、优化选择的方法有:比较法、分析法、核查法、引用摘 录法、专家评估法 42、检索语言:检索信息所使用的人工语言; 43、登录在类表、词表中的所有标识称为词汇 44、检索语言的作用有哪些?(简答) (1)对信息内容进行主题分析;(2)便于将标引、检索用 的标识符进行相符性比较,保证检索和标引的一致性;(3) 保证检索结果和检索要求的一致性;(4)保证信息存储集中 化和系统化 45分类语言的基础是科学分类 46主题语言是使用词语标识的一类信息检索语言,称为主题 法 47、把主题词按照一种便于检索的方式编排起来,称为主题 词 48、关键词:从信息的题名、摘要和内容中抽取出来的,能 够表达信息主题内容的具有检索意义的关键性词汇。 49、叙词:是指从自然语言中优选出来并经过规范化处理的 名词术语,属于后组式语言的一种,是采用表示单元概念的 规范化语词的组合来对信息主题或内容进行描述的标识系 统。 50、叙词的特点:专指性、直观性、多维检索、适应性、网 络结构 51、按照学科体系进行系统排列的语言称为分类语言 52、按照主题词的字顺序列排列的语言称为主题语言 53、计算机信息检索是指利用计算机存储信息和检索信息 54、进入检索的入口称为检索途径 55、按学科分类体系查找信息的途径称为分类检索 56、利用信息主题内容进行检索的途径称为主题检索 57、选择实现检索计划的具体方法和手段是选择检索方法 58、利用检索系统查找信息的方法称为工具法 59、信息检索策略:将课题的提问及其检索词与检索系统的 收录内容、编排特点相匹配而确定的检索方案或程序。 60、检索效果:是指信息系统检索信息的有效程度,反映了 信息系统的检索能力 61、查全率:检索出的相关信息量与信息系统中的相关信息 量之比 62、查准率:检索出的相关信息量和检索出的信息总量之比。 63、衡量检索效果的相对合理指标是差准率和查全率 第三章 1、布尔逻辑检索:是指通过标准的布尔逻辑关系词来表达检 索词与检索词之间逻辑关系的检索方法。 2、布尔逻辑运算符有:逻辑与、逻辑或、逻辑非 3、INTERNET上信息出传输的主要方式是FTP 4、检索者将检索词在他认为合适的地方截断称为截词 5、限制检索:在检索系统中,使用缩小和限定检索范围的方 法称为限制检索 6、邻近检索:通过专门符号来规定检索词在结果中的相对位 置 7、中级检索技术包括哪些内容? (1)加权检索技术;(2)自然语言检索技术;(3)相关信 息反馈检索技术;(4)模糊检索技术;(5)概念检索技术。 8、自然语言处理应用领域之一是信息检索 9、概念层次网络简称HNC 10、自然语言处理技术可以分为机器翻译、语义处理以及人 机会话 11、搜索引擎用到的自然语言处理技术是机器翻译与语义处 理 12、实现只能搜获的过程主要分为:语义处理、知识管理、 知识检索 13、从用户角度看,用户可以分为最终用户和职业用户 14、信息检索发展史上的突破是应用了自然语言检索 15、智能代理资源管理器的基本结构是:适配器、引擎、知 识、库、视图 16、智能代理信息检索系统的特点有哪些?(论述) (1)智能代理侧重于面向用户。 (2)智能代理主要借助知识库、数据库,并参考用户需求习 惯和一段时期内的偏好,推断用户提问的真实意图,提高检 索的专指性。 (3)智能代理采用机器学习、用户框架模型、推理机制主动 协助用户查找信息。 (4)智能代理不仅是关键字的匹配,而且是基于概念和知识 的检索。 (5)智能代理能不断了解用户需求的变化,并根据用户的反 馈信息及时修正检索目标策略。 (6)智能代理能分离发送请求和接收结果,使它们异步进行。 (7)智能代理能使用户按照个人的兴趣爱好进行信息分类。 17人们进行信息检索时总是期望获得较高的查全率和查准率 18对信息进行采集、标引、存储、处理,最后形成信息集合 体 19、通过模拟自然进化过程搜索最优解的方法称为遗传算法 20、搜索引擎和挖掘引擎处理的都是字串和文本 21、数据挖掘也称知识发现 22、聚类:按照事物的某些属性,把事物聚集成类,使类间 的相似性尽量小,类内相似性尽量大 23、一种很有效的预测模型技术是神经元网络 第四章 1.INTERNET起源于ARPANET 2、我国的四大互联网络是:中国科技网、中国教育科研网、 中国公用互联网、中国公用经济信息网 3、INTERNET提供的基本信息服务有:电子邮件、文件传输、 远程登陆、电子公告板、网络新闻组 4、可以在异地主机上登陆注册的服务是TELNET 5、通过专用电缆与INTERNET主干网直接连接在一起的称 为专线连接 6、综合业务数字网简称ISDN 7、非对称数字用户环路简称ADSL 8、网络信息资源主要类型是联机检索系信息资源和网络信 息资源 9、联机检索信息资源的主要表现形式是联机数据库 10、文件传输协议是FTP 11、网络信息资源进行组织的主要方式有:文件方式、主题 树方式、超文本方式、数据库方式、超媒体方式、元数据方 式。 12、元数据:就是关于数据的数据,是对数据内容的描述。 13、元数据的作用有哪些?(论述) (1)描述数据的内容、质量和特征,以及数据所适用的范围。 (2)管理和存储大量科学数据 (3)提供一种对数据进行检索、查询的方法 (4)帮助数据的使用者更好的了解和使用数据。 (5)促进数据共享 (6)为数据交换和数据传输提供辅助信息 (7)元数据是数据发挥其作用的一个必要条件 (8)维护科研成果,维护在数据方面的投资。 14、DC的特点有:简易性、通用性、兼容性、灵活的可扩展 性 15、知识产权:是公民和法人对在科学和文学等领域内创造 的精神财富以及智力成果依法享有权利的总称。 16、INTERNET上每位用户都有的帐号称为域名 17、数据库开发主要是开发书目数据库、文摘数据库和全文 数据库 18、开发网络信息资源的一个重要途径是制作知识导航库 19、数字图书馆开发利用网络信息资源的一种主要形式是馆 际互借 20、网络信息资源开发利用中的知识产权保护策略是什么? (简答) (1)加强开发利用网络信息资源的立法工作 (2)加强国际交流,逐步与国际接轨; (3)建立和完善知识产权集体管理制度 (4)使用技术手段防止侵权 (5)重视解决网络信息知识产权保护的两个基本原则,即网 络发表权问题和复制权问题。 第五章 1、中国期刊网全文数据库检索系统是基于INTERNET 2、专业检索的具体步骤是: (1)通过单击页面右上角的状态栏,即可进入专业检索条件 界面; (2)选择检索范围 (3)填写检索条件 3、二次检索:通过简单检索、高级检索及专业检索,在这些 检索结果上还可以继续进行操作。 4、二次检索的操作方式有:并且、或者、不包含 5、保存题录中最大保存记录数为50 6、向导式检索的检索操作顺序是由上到下 7、中共高等教育文献保障体系简称CALIS 8、中文社科报刊数据库检索方法的具体步骤是什么?(论述) (1)系统进入、检索途径的选择和结果的输出 (2)主题词、题名和著者检索途径 (3)分类号检索途径 (4)人名检索途径 (5)刊名检索途径 (6)检索结果的显示、标记、打印和保存 (7)索引词列表的使用方法 (8)历次检索策略的选用 9、最重要的统计工具和学术分析及评价工具是SCI 10、普通检索中检索来源文献的途径可分为:主题词、著者、 来源出版物、著者地址 11、执行检索后命中的记录在屏幕上显示的格式是简单格 式 12、联机公共检索目录简称OPAC 第六章 1、产权主要有哪几种:动产权、不动产权、知识产权 2、著作权:也叫版权,是指文学、艺术、科学作品的作者, 对其创作的作品,依照法律享有的专有权利。 3、以法律的形式保护发明人在一定期限内享有对其发明的专 利权称为专利权 4、专利的特征有:排他性、地域性、时效性 5、专利的类型有:发明专利、实用新型专利、外观设计专利、 集成电路布图设计 6、国内检索专利信息的网站有哪些? (1)中国知识产权网; (2)中华人民共和国知识产权局 (3)中国专利信息网 (4)中国专利信息检索系统 (5)中国专利文摘数据库 (6)中国香港特别行政区知识产权署 7、美国专利与商标办公室简称USPTO 8、对专业人员根据其专业学术水平而授予的一种称号称为 学位 9、学位论文分为哪几种类型?(简答) 一类是理论研究型的,作者通常在搜集、阅读了大量资料之 后,依据前人提出的论点和结论,再通过自己的深入研究或 大量实验,进一步提出自己的新论点和新假说。另一类是调 研综述型的,作者主要以前人关于某一主题领域的科研课题 做出概括性的总结,提出自己独特的论点和新见解。 10、会议文献:是指在各种学术会议上宣读的论文、产生的 记录及发言、论述、总结等形式的文献。 11、会议文献按照出版时间的先后分为:会前文献、会中文 献、会后文献 12、科技报告:对科学、技术研究结果的报告或研究进展的 记录 13、美国政府的四大科技报告分别是:PB报告、AD报告、 NASA报告、DOE报告 14、标准文献:按照规定程序编制并经过一个工人的权威机 构批准的,供在一定范围内广泛而多次使用,包括一整套在 特定活动领域必须执行的规格、定额、规划、要求的技术文 件。 15、标准文献主要分为:国际标准、区域标准、国家标准、 专业标准、行业标准、基础标准 第七章 1、目前INTERNET网络资源主流是网络信息资源 2、网络信息检索的主要特点是什么?(简答) (1)交互式作业方式 (2)用户透明度 (3)信息检索空间的拓宽 (4)友好的用户界面且操作方便 3、网络检索工具共有的特点是交互式作业 4、网络信息检索工具的类型有哪些? (1)按照检索机制划分可分为: 1、分类目录检索工具; 2、搜索引擎检索工具; 3、混合型检 索工具\(2)按照检索的内容划分可分为1、综合型检索工具; 2、特殊型检索工具; 3、多元检索工具; 4、万维网和非万维 网检索工具 5、能够利用多个检索工具进行网络信息查询的检索工具称 为:多元检索工具 6、网络信息检索工具按照检索机制划分可分为:分类目录检 索工具、搜索引擎检索工具、混合型检索工具 7、搜索引擎按照信息内容组织方式划分为按检索词检索和 按分类检索 8、分类目录型检索工具的典型网站是:YAHOO 9、目前网络上适用最多的引擎的检索形式是按检索词检索 10、搜索引擎使用最多的分类是按照主题 11、搜索引擎主要由三个部分构成,分别是:搜索软件、索 引软件、检索软件 12搜索软件,通常称为机器人 13、检索软件决定搜索引擎的检索功能和返回结果的相关性 14机器人是一种计算机的程序 15、在遍历算法中,一般用到的两种方式是深度优先和广度 优先 16、内容索引项可以分为单索引项和多索引项 17、索引技术可以使用集中式索引算法或分布式索引算法 18、输入接口可以分类两种,分别是简单接口和高级接口 19、ALTA VISTA是常用的单个搜索引擎 20、EXCITE提供基本检索和高级检索 21、检索式中,专有名词的首字母必须大写 22、EXCITE突出特点是采用了概念检索 23、EXCITE特有的功能是范例检索 24、便于用户在各个搜索引擎间进行灵活快捷的切换的引擎 称为多元搜索引擎 25、用户的浏览器和多元搜索引擎系统交互的界面称为用户 接口 26、多元搜索引擎实际上是一种网络查询接口工具 27、功能较强的多元搜索引擎一般采用的处理方式是并行和 串行 28、查询操作大多仅支持简单的布尔逻辑操作 29、多元搜索引擎一般可分为并行处理和串行处理 30、常用多元搜索引擎又:MAMMA、SEARCH、 METACRA WLER、ASK JEEVES、PROFUSION 31、提高搜索结果准确性的方法主要有哪些?(简答) (1)运用引擎的词组检索、字段检索和邻接算符等控制检索 的范围 (2)使用有些搜索引擎的REFINE功能 (3)可以使用概念检索和相似页检索 32、基于链接评价的搜索引擎的优秀代表是GOOGLE 33、搜索引擎的研究发展方向是:智能化搜索、个性化搜索、 结构化搜索、垂直化专业领域搜索、本土化搜索 34、结构化搜索:是指充分利用XML等技术使信息结构化, 同时使查询结构化,从而使搜索的准确度大大提高。 35、搜索引擎的发展新趋势是垂直搜索引擎 第八章 1、联机检索系统包括的三个部分是:检索终端、通信网络、 联机检索中心 2、系统拥有的各种数据库称为联机数据库 3、联机系统中数据库的选择方法有:数据库类型、收录范围、 文档结构、记录内容、更新周期 4、DIALOG的特点有哪些?(简答) (1)拥有最多的数据库;(2)拥有的用户数量最多;(3)服 务项目较多;(4)检索模式较多 5、世界上规模最大的综合性商业联机检索系统是DIALOG 6、DIALOG的检索模式有:菜单式检索、命令式检索、目标 检索、WWW检索 7、DIALOG的八种服务方式都是什么?(论述) (1)回溯性检索。利用回溯性检索,系统能够保证满足用户 查全某一课题或者领域方面的文献需要 (2)定题信息检索。DIALOG系统的数据库根据文献信息内 容更新周期或者根据用户检索要求,定期的向用户提供所需 的信息。 (3)商界链接服务。它是系统为满足用户的商业信息需求而 提供的一种菜单式信息检索服务。 (4)电子邮件服务。它是DIALOG系统提供的电子邮件传 递服务。 (5)原文订购服务。它是DIALOG系统提供的联机文献订 购服务 (6)多文档检索服务。它允许用户使用一个检索策略同时检 索多个数据库,而没有必要每检索一个数据库就重复输入检 索指令。 (7)DIALINDEX。它是DIALOG系统为用户提供的数据 库选择工具。 (8)其他服务。DIALOG还提供图像输出服务、报表生成服 务、光盘检索服务、通信软件和图像处理软件服务以及各种 培训服务。 8、DIALOG系统中,检索字段分为基本检索字段和辅助检 索字段 9、保证获得满意检索结果的前提是正确选择数据库 10、选择数据库应该遵循的原则有:内容原则、范围原则、 时效原则、费用原则 11、获取检索结果通常采用的方式有:联机显示、脱机打印、 订购原始文献

相关文档
最新文档