武汉大学信息检索整理

武汉大学信息检索整理
武汉大学信息检索整理

名词解释

1.信息检索(Information Retrieval)是指将信息按一定的式组织和存储起来,并根据信息用户的需要找出有关信息的过程。

2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。

3.CALIS:China Academic Library and Information System中国高等教育文献保障系统。

4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索法。

5.搜索引擎(Search Engine)是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的式搜索所需信息。

6.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符一般用“?”或“*”表示,但不同的数据库中有所差别。

7.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。

8.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。

9.文献及其要素

“文献”是泛指“有历史价值或参考价值的图书资料。”

要素:1、构成文献核的信息、知识、数据、事实.2、载体信息、知识、数据、事实的物质载体。3、记录信息、知识、数据、事实的符号系统。

10.专利文献:专利文献是实行专利的、地区及国际专利组织在批审专利过程中产生的官文件及出版物,包括专利说明书、专利权利要求书、专利公报、专利分类表、专利检索工具等。

11.三大检索系统:SCI(《科学引文索引》,EI是美国《工程索引》(TheEngineeringIndex)的简称,ISTP是IndextoScientific&TechnicalProceedings的缩写。

12.二次文献:二次文献又称二级次文献,它是文献检索工具,能比较全面、系统地反映某个学科、专业或专题在一定时空围的文献线索,是积累、报道和检索文献资料的有效手段.

13.受控语言:受控语言是一种规化的人工语言,包括具有较强族性检索功能的分类语言和具有较强特性检索功能的主题语言。

14.信息素质教育:是指一个人的信息意识教育、信息道德教育、信息能力教育

15.引文追溯法:追溯法是指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”

的一种最简便的扩大情报来源的法。它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的容相关文献。

16.同引文献:与本文有相同参考文献的文献,与本文有共同研究背景或依据的文献。

17.学科导航:学科导航是按学科门类将学科信息、学术资源等集中在一起,以实现资源的规搜集、分类、组织和序化整理,并能对导航信息进行多途径容揭示,便用户按学科查找相关学科信息和学术资源的系统工具。

18.知识产权:知识产权是指对智力劳动成果依法所享有的占有、使用、处分和收益的权利。知识产权是一种无形财产,它与房屋、汽车等有形财产一样,都受到法律的保护,都具有价值和使用价值。有些重大专利、驰名商标或作品的价值也远远高于房屋、汽车等有形财产。

19.IPC:国际专利分类法是国际上通用的专利文献分类法。用国际专利分类法分类专利文献(说明书)而得到的分类号,称为国际专利分类号,通常缩写为IPC号。IPC采用了功能和应用相结合,以功能性为主、应用性为辅的分类原则。采用等级的形式,将技术容注明:部——分部——大类——小类——大组——小组,逐级分类形成完整的分类体系。

20.NSTL:NSTL是科技图书文献中心的简称,它是根据国务院领导的批示于2000年6月12日组建的一个虚拟的科技文献信息服务机构,成员单位包括中国科学院文献情报中心、工程技术图书馆(中国科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院、中国化工信息中心)、中国农业科学院图书馆、中国医学科学院图书馆。网上共建单位包括中国标准化研究院和中国计量科学研究院。中心设办公室,负责科技文献信息资源共建共享工作的组织、协调与管理。

21.百科全书:百科全书是全面系统的介绍文化科学知识,收集各种专门名词、术语,按词典形式编排,解说详细的大型参考工具书。

它汇总了各学科或某一学科的知识,提供人类有关知识领域的基本事实、基本概念和基本理论。百科全书由众多专家撰稿、编审,故有较高的权威性。

简答

1.电子图书有哪些特点?

存储空间大(磁介质存储密度高、容量大,一光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸等物质资源)、使用便(借助于专门的软件便可使用,可以便捷地编辑和查找特定容)、传播过程中的无独占性和无损坏性(可以同时供多人使用,可无失真地重复使用)。

2.对搜索引擎的选择与比较主要从哪些面考虑?

收录围(索引库中容的数量、地域围、语言种类、资源类型、资源的深度和广度)、分类(分类式是否合理多样、类名是否规、分类的广度与深度是否合适)、检索功能与效果(是否包含浏览检索和关键词检索功能、是否支持布尔检索、截词检索等高级检索功能、是否有检索帮助和提示功能、检索结果和查全率、查准率及响应时间)、结果处理(结果的排序式是否多样、是否有去重功能、能否按照用户反馈动态调整和显示检索结果)、页面组织(页面组织是否清晰、类目设置是否合理、界面是否友好)、其他功能与服务(能否满足用户多面的信息需求)、用户评价(是否有用户评价及统计功能)。

2.1搜索引擎有哪些类型?

搜索引擎按信息搜集式分:有目录式搜索引擎和机器人搜索引擎;按照信息组织式分:有网络资源指南与关键词搜索引擎;按学科围与资源种类分,有综合性搜索引擎和专门性搜索引擎;按照功能和是否有自建索引库分,有独立搜索引擎和元搜索引擎。

2.2 按信息采集式,搜索引擎分为哪两种类型?各自的基本特点?列举至少2个有代表性的搜索引擎名称?

3.网络信息选择的标准有哪些?

权威性(及其建站机构的权威性和知名度)、容(容应当客观、切题、标题清楚、组织规、逻辑性强、有明确的围和边界、有足够的深度和广度、有自己的特色)、时效性(容及其应当新颖、应明确地说明其创建和更新期)、网页设计(应以合理的式综合使用图像、声音和文字、界面的友好性、清晰直观)、适用性(应保证用户能用较短的时间、点击较少的找到所需信息)、用户对象(信息的专业化程度应能满足目标用户的特定需求)、访问次数或被次数(网络信息的被访问和被其他网页的次数)。

4.查找国外引文与学位论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。

(1)查找国外引文可用引文索引数据库,如查找国外引文可选择《科学引文索引》(SCI)、《社会科学引文索引》(SSCI)、《艺术与人文科学引文索引》(A&HCI),即著名的三大引文索引SCI、SSCI、AHCI;查找国引文可选择中国科学引文数据库(Chinese Science Citation Database,简称CSCD)、中文社会科学引文索引(Chinese Social Science Citation Information,简称CSSCI)等。

(2)查找国外学位论文可用学位论文索引与摘要数据库,如CALIS的《学位论文库》,万数据资源系统中的《中国学位论文数据库》,CNKI的《优秀硕博士论文数据库》,美国博硕士论文库PQDD(ProQuest Digital Dissertations),美国学位论文网络数字图书馆NDLTD (Networked Digital Library of Thesis and Dissertations)等。

5.除商业数据库和搜索引擎外,还可以从哪些途径获取网络信息资源?请至少给出5种,每种举一例。

学科信息门户(如CALIS的学科导航库、SOSIG等)、数字图书馆(如数字图书馆)、开放获取资源(如OA期刊、机构知识库等)、专业机构的、专业人员的个人或博客、国外政府机构的、精品课程、国外大学的免费课程资源等。鼓励自由发挥。

6.布尔逻辑检索的主要运算符有哪些?它们各代表什么含义?请分别举一例说明。

布尔逻辑检索的主要运算符有“AND”、“NOT”、“OR”,它们分别代表逻辑与(表示检索结果中必须包含所有的检索词)、或(表示检索结果中只要包含任一个检索词即可)和非(表示检索结果中一定不能出现“not”后面的检索词),如:美国AND 社会保障,数字图书馆OR 虚拟图书馆,玉米NOT 甜玉米。

论述题

一、从哪些面全面地查找关于某一主题的研究成果?(20分)

(1)图书的查找,包括图书馆目录、网络书店、读秀、Google Books等图书搜索引擎的使用等;

(2)期刊论文的查找,包括检索国外的期刊数据库、引文索引库和OA期刊,利用Google Scholar查找等;

(3)学位论文的查找,包括国外学位论文库的查找;

(4)会议论文的查找,可以通过搜索引擎或专门的会议文献数据库查找相关会议文献;

二、通过检索实践,你认为网络信息检索中的主要问题有哪些(10分)?应掌握哪些技巧与注意事项(15分)?该题鼓励同学们在课本有关容基础上进一步发挥。

网络信息检索中存在的问题

一是网络信息良莠不齐。网络信息的发布具有很大的自由性和随意性,缺乏规,无用信息掺杂其间,垃圾信息、虚假信息、冗余过时信息的存在,增加了信息的不确定性和用户的不安全感,使信息质量和精度降低,其可靠性、权威性和利用价值受到质疑,令网络用户无所适从。

二是检全率低。虽然在网络信息检索工具的索引数据库中包含了成千上万的网页,但由于网络蜘蛛跟不上网络发展的速度,加之网络信息格式多样性等因素,致使没有一种网络信息检索工具能够为整个网络建立索引,从而使网络量质量高、实用性强的隐性信息难以查全。

三是检准率低。利用网络信息检索工具找到的往往是一大堆网址,检索结果的重复率相当高,用户只有逐个浏览才能从中筛选出所需的信息。与利用商业性联机检索数据库相比较,用户虽然可以节省昂贵的查询费用,但却要花费大量的时间对信息进行判断。

四是检索效率低。网络信息导航只支持单步信息定位,只允导航系统一步一步地追踪信息,客户机在追踪过程中接受了诸多冗余信息,造成效率降低,即使是一些优秀的搜索引擎,也需按屏幕揭示一步一步追踪,如果查到的地址有几百条、几千条,要确定哪个符合要求就很困难。

五是无统一检索规。由于各网络信息检索工具收集信息的式、信息覆盖面、索引编制和标引式、检索功能和检索结果的描述和排列式都不一样,一面使得相同的检索在不同的网络信息检索工具中会产生不同的检索结果;另一面用户在利用不同的网络检索工具时需要经过不同的适应过程,增加了用户的负担。

六是缺乏多语种检索。互联网是一个巨大的数字资源信息库,包含着不同语言信息。但当前的检索工具不能将检索词自动转换成其他语种进行检索,容易造成信息的漏检。

七是缺少基于容的信息搜索引擎。网络上的信息除了文本外,还有大量的声音、图像、动画等多媒体信息,但目前信息检索技术还是以线性的文本检索为主,对多媒体信息的检索主要借助于文本的信息检索,一般不涉及图像自身特征的分析处理,使得对多媒体信息的检索受到了很大限制。所以,传统信息检索技术无法满足现代图像数据检索的需要,必须从一个新的角度来管理图像信息,使非结构化的数据向结构化的数据转换。

八是索引数据库更新速度慢。网络检索工具是通过网络蜘蛛建立索引数据库的,但网络蜘蛛只能在系统管理员确定的时间间隔跟踪特定信息,不能保证信息的及时更新,容易出现信息过时或死链现象。

九是个性化需求差。信息服务的在机理要求信息服务的出发点和立足点是用户信息活动,而不是信息资源。不同的用户有着不同的信息需求,若要每一位用户都感到满意,仅仅提供网络信息获得途径或者是直接从网上获得信息远远不够,只有针对不同用户的不同需求,对症下药,提供个性化服务,才有可能使每位用户都感到满意,信息的价值才能得以实现,但这面的技术还不成熟。

?Internet 检索技巧

1.分析检索的主题

即要确切了解所要查询的目的和要求,确定需要的信息类型(全文、摘要、名录型等;文本、图象、声音)、查询式(浏览、分类检索、关键词检索)、查询围(所有网页、标题、新闻组文章、FTP、软件;中文、外文)、查询时间(所有年份、最近几年、最近几、最近几天、当天)等。

2.选择合适的检索工具

各种搜索引擎在查询围、检索功能等面各有千秋,不同目的的检索应选择不同的搜索引擎。选择合适的检索工具主要从工具的类型、收录围、检索问题的类型、检索具体要求等面综合考虑。一般来讲,如果用户希望获得关于某个问题的广泛性信息,那么最好使用像YAHOO这样的目录式搜索引擎,而要获得关于该问题的细节性信息,则要利用像Alta Vista这样的关键词检索工具。对搜索引擎的了解与选择,可以借助于搜索引擎的集合与评价站点,如搜索引擎大全(https://www.360docs.net/doc/e15737498.html,/home/chinese-search/)。

在进入新的检索前,应首先了解如使用这种检索工具,尤其要注意了解该系统所特有的检索式,它所允的检索功能(布尔逻辑检索、字段限制检索、截词检索、短语检索等)同时还应了解检索结果有几种表达式,所使用的搜索引擎的缺省语法。不同的引擎缺省的运算符不同,如LYCOS 为“OR”,有的引擎不支持某些运算符,如YAHOO,LYCOS不支持NOT。多搜索引擎使用各自的标准去排列检索结果,这些标准包括:题目、URL、HTML、META tag等。

3.抽取适当的关键词。应尽量选专指词、特定概念或专业术语,避免普通词和太泛的词,如计算机、互联网、中国、世界等,太多太泛,失去了检索价值,会反馈数以万计的检索结果,失去检索意义,被称为“禁用词”。现对关键词的选择提出以下建议:

(1)使用名词或物体做关键词

(2)检索式中使用2——3个关键词

(3)使用截词检索(可检索出词根相同的词或同一词的单复数形式),如,film*

(4)通过OR连接同义词、近义词、相关词或术语的不同表达式,如,Internet OR Web OR OR (the net)

(5)对专有名词,如人名、地名、机构名,使用大写字母指定检索, 如United States

(6)对固定短语,用“”括起进行短语检索,如“World Wide Web”,以提高检索的精度

(7)用括号将各个概念分开,如(Internet OR Web) AND (search* OR retriev*)

4.正确构造检索式

利用搜索工具支持的高级检索功能、允使用的检索标识和各种限定,正确构建检索式。

多搜索引擎都提供简单查询和高级查询,建议使用后者,如组合使用布尔逻辑运算符AND(+)、NOT(-)、双引号、使用日期与语种限定,可使检索结果控制在一定围。充分利用进阶检索,即某些工具提供的Refine, Search within these results等功能,在前一次检索产生的结果基础上做进一步的检索,如可在“Refine”检索框继续增补检索词或修改检索式,使检索围缩小。

5.及时调整检索策略

(1)扩大检索围。

当检索结果为零或检索结果太少,需要扩大检索围。可以使用同义词、近义词或相关词,使用较普遍的词,或改用上位词;使用缩写与全称;使用截断技术;利用某些搜索引擎的自动扩检功能进行相关检索;使用多个搜索引擎,或者直接利用多元搜索引擎。(2) 缩小检索围。

检索时如果得到太多的检索结果,或检索结果不相关,需要缩小检索围。可使用布尔逻辑算符、位置算符和固定词组检索(短语检索)等式限制查询围。

6.加快检索速度,节省检索时间与费用

(1)直接进入相关站点。平时多积累有用的网址,利用浏览器的“书签”功能,将经常访问的加入“收藏夹”对其进行保存,再次使用时,直接点击便可进入,省去大量输入网址和利用工具搜索的时间。另外,还可以利用网上书签。

三、最常用搜索会议论文的数据库?如搜索最有影响期刊数据库?

1、会议论文数据库

(1)CALIS的会议论文数据库

CALIS会议论文数据库收录来自于“211工程”的61所重点学校每年主持的国际会议的论文,目前该数据库正在建设中。

(2)万学术会议论文数据库

万数据资源系统会议论文数据库收录一级协会、二级协会、二级以下协会、一级会议、二级会议、二级以下会议、重点实验室、研究会和其它机构主办的学术会议,涉及哲学、宗教、社会科学等20大类。

(3)CNKI中国重要会议论文全文数据库

中国知网的中国重要会议论文全文数据库收录我国2000年以来二级以上学会、协会、高等院校、科研机构、学术机构等单位的论文集。

(4)NSTL的中外文会议论文库

科技图书文献中心NSTL的会议数据库包括了中文会议论文数据库和外文会议论文数据库。。

(5)OCLC FirstSearch会议论文与会议录索引

OCLC First中的国际学术会议论文索引库包括在世界围的各种会议、座谈会、博览会、研讨会、专业会、学术报告会上发表的论文的索引,收录了自1993年以来在不列颠图书馆文献提供中心(BLDSC)的会议录上收集到的已出版的论文,并通过馆际互借获取全文。

(6)ISI会议论文集引文索引

ISI会议论文集引文索引包括自然科学版和社会科学与人文科学版,收录1996年以来世界上最著名的会议、座谈会、研讨会、专题讨论会及其它各种会议中发表的会议录论文及其引文信息,分别取代原来的科技会议录索引和社会科学与人文会议录索引,其覆盖的学科围非常广泛,是目前世界上了解会议文献信息最主要的检索工具。

2、

四、个人文献管理软件的主要功能?比较几个典型的文献管理软件?

以下是课件上资料(PDF第九章)

个人文献管理软件的主要作用是帮助用户有效管理已经获取的文献信息,并且对已经获得的文献信息进行便快捷的利用

基本功能包括:

1.建立个人的数目文献数据库,或者是个人的虚拟图书馆

2.帮助用户组织、管理已获取的文献信息

3.对个人的数目文献数据进行快速检索

4.按特定格式要求快速插入引文(参考文献)

5.导出/导入、备份/恢复个人文献数据库中的容

6.网络发布或者共享数据库中的全部或者部分容

7.添加阅读笔记和附件

8.利用已经保存在PC中的全文生成数据库中的记录

9.利用RSS导入记录数据

10.只能捕获网页信息

网上资料

个人文献信息管理系统可以帮助读者处理个人所汇集的各种书目信息,主要功能包括建立并维护个人文献资料库,使用者在输入文献信息后,可以按纪录中有容的字段进行检索,如利用关键词、作者、标题等字段进行布尔逻辑检索。它还包含有一般管理系统的功能,如排序、增删纪录等。这种个人研究领域的文献资料库,无论在撰写研究报告时的参考引用、查阅文献纪录的书目资料或者为学生开列参考书目时都很便。

目前市场上可以提供给读者使用的个人文献信息管理软件的基本功能小异,主要有以下一些功能:

(1) 批次输入信息资料:系统提供了各种资料库的检索结果直接转入系统的功能。用户可以将不同数据库的检索结果直接转入系统,成为格式一致的资料信息。

(2) 检索查询功能:文献信息输入后,可按不同的字段进行检索,例如用author, title, journal, keyword ,subject 等进行布尔逻辑组配检索,并可作排序或增删纪录等。该功能有效帮助读者写研究报告查阅文献纪录

(3) 查重:当用户陆续汇集多资料后,系统可以自动查重,并允将重复的纪录删除。

几个典型的文献管理软件对比:

(1)EndNode

优点:覆盖的数据库最多,使用人数众多;参考文献可以与本地电脑中的PDF原文建立关联,对其进行管理。

缺点:笔记功能太弱,不支持图形绘制功能,只能以关联式图片、表格等信息;对中文数据库支持不好;无法再一种Outstyle 下同时体现中文和英文两种参考文献的格式;不支持交叉引用(即不同文章的相互引用关系);授权花费大;需要花一定时间学习其功能。

(2)NoteExpress

优点:对中文数据库的支持是最好的,大部分数据库都有所覆盖,笔记功能也很强大,可以图文并茂,Word插件写作论文时也很便。

缺点:把数据库的检索结果添加到NE中的操作比较繁琐;没有网络同步功能,不能通过Web与他人共享文献,不能进行研究交流。

(3)NoteFirst

优点:文献数据库可进行网络同步;可抓取网页,全文共享。

缺点:覆盖的数据库还比较少;笔记功能较弱;

(4)Zotero

优点:开源工具;数据可以在网络上同步,也能在本地管理文献,也可以在网络上管理;不但可以管理学术文献,也可以管理各种形式的信息;自动识别文献题录信息,一键保存;对中文的支持不错,也支持CNKI的自动识别。

缺点:不能直接本地文件。

(5)Mendeley

优点:免费;PDF导入;置PDF阅读功能;提供在线和桌面两种式,可将文献上传到网络个人空间中。

缺点:不支持中文数据库。

五、三大检索的中英全称,应用

(1)《科学引文索引》(Science Citation Index, SCI)是由美国科学信息研究所(ISI)1961年创办出版的引文数据库,其覆盖生命科学、临床医学、物理化学、农业、生物、兽医学、工程技术等面的综合性检索刊物,尤其能反映自然科学研究的学术水平,是目前国际上三大检索系统中最著名的一种.

(2)《工程索引》(EngineeringIndex,EI),1884年创刊,由美国工程信息公司出版,报道工程技术各学科的期刊、会议论文、科技报告等文献。收录文献几乎涉及工程技术各个领域。例如:动力、电工、电子、自动控制、矿冶、金属工艺、机械制造、土建、水利等。它具有综合性强、资料来源广、地理覆盖面广、报道量大、报道质量高、权威性强等特点。

(3)《科技会议录索引》(Index to Scientific & TechnicalProceedings,ISTP),也是由ISI出版,1978年创刊,报导世界上每年召开的科技会议的会议论文。该索引收录生命科学、物理与化学科学、农业、生物和环境科学、工程技术和应用科学等学科的会议文献,包括一般性会议、座谈会、研究会、讨论会、发表会等。

在ISTP、EI、SCI这三大检索系统中,SCI最能反映基础学科研究水平和论文质量,该检索系统收录的科技期刊比较全面,可以说它是集中各个学科高质优秀论文的精粹,该检索系统历来成为世界科技界密切注视的中心和焦点。ISTP、EI这两个检索系统评定科技论文和科技期刊的质量标准面相比之下较为宽松

查找某学科有哪些三大索引的源刊物、数据库、英文全称、简称、中文

(1)Science Citation Index Expanded(简称SCIE)科学引文索引扩展版,收录全球自然科学、工程技术、临床医学等领域170 多个学科的8,600 多种有影响力的学术刊物,数据可回溯至1900 年。目前我馆订购的是1999年以来的数据。数据库每更新。

(2)Social Science Citation Index(简称SSCI)社会科学引文索引,收录社会科学的50 多个核心学科领域的3,000 多种最具影响的期刊文献信息。数据可回溯到1900 年。

(3)Arts & Humanities Citation Index(简称A&HCI)艺术与人文科学引文索引,收录艺术与人文学科领域1,700 多种学术期刊,数据可回溯至1975 年。

六、期刊中外文数据库,各一例

中文的数据库:万、维普、CNKI、博看

外文的数据库:Springer、EBSCOhost、APS、Emerald、SAGE

维普介绍:维普是我国最大的数字期刊数据库,该库自推出就受到国图书情报界的广泛关注和普遍赞誉,目前已拥有包括港澳台地区在2000余家固定单位用户,是我国数字图书馆建设的核心资源之一,高校图书馆文献保障系统地重要组成部分,也是科研工作者进行科技查证和科技查新的必备数据库。

维普特点:

(1)收录期刊最多、年限最长、专业文献量最大的中文期刊数据库

(2)引用《中图法》等通用规则进行分类标引、主题标引的标准化数据库

(3)采用国际标准的PDF全文数据格式,更清晰

(4)独有的同义词库和同名作者库,更精准定位检索请求

(5)执行ISO9001国际质量管理体系,更高品质保证

(6)国一流全文检索核,更快更稳定

Springer介绍:

SpringerLink数据库提供包括原Springer和原Kluwer出版的全文期刊、图书、科技丛书和参考书的在线服务。具体学科涉及:数学、物理与天文学、化学、生命科学、医学、工程学、计算机科学、环境科学、地球科学、经济学、法律。

Springer特点:

(1)部分文献可以看到未来一个季度即将出版的期刊全文。

(2)部分论文同时有html和ODF两种格式。

(3)可以进行分类浏览和定向检索

七、查找图书中外文数据库,各两例

国:(1)超星电子图书:超星浏览器主要功能:阅读电子图书、做书签、最近阅读过的图书列表、文字识别、图像复制、窗口切换、采集图书中的容。

(2)正电子图书

(3)读秀知识库:是由海量图书等中文学术文献资源组成的庞大的知识系统,它集文献搜索、试读、传递为一体,是一个可以对文献资源及全文容进行深度检索,并且提供文献传递服务的平台。

国外:Encyclopeida Britannica Online、Ebrary电子图书、ECCO电子图书、EEBO电子图书、Springer电子图书、Safari电子图书、NetLibrary电子图书、NAP免费电子图书、Knovel四种免费参考书

Ebrary整合来自220多家学术、商业和专业出版商的权威图书和文献,覆盖商业经济、计算机、技术工程、语言文学、社会科学、医学、历史人文、科技和法律等主要科目的书籍种类。

ECCO收录了1700-1799年之间所有在英国出版的图书和所有在美国和英国联邦出版的非英文书籍。涵盖历史、地理、法律、文学、语言、参考书、宗教哲学、社会科学及艺术、科学技术及医学等多个领域,可进行全文检索。

EEBO数据库收录了所有现存的1473-1700年之间英语世界出版物的资料,是目前世界上记录从1473年到1700年的早期英语世界出版物最完整、最准确的全文数据库。

八、网络信息选择与评价标准

1、已制定的标准

作为网络信息选择评价的基础,很多机构和研究人员从不同的角度制定了网络信息资源的评价标准。其中有影响的评价标准有以下几种:

(1)美国图书馆协会的免费网络信息资源选择标准

(2)美国因特网侦查项目的选择标准

(3)英国学科信息门户Intute收录资源的标准

(4)因特网公共图书馆的标准

(5)美国南加州大学教授Robert

(6)美国乔治大学教授Gener

(7)美国威廉康星大学的10C标准

2、制定网络信息资源的评价标准要考虑的因数

将网络信息的评价标准归为两大类:性能的评价标准和容的评价标准,具体可以细分为:

(1)性能的评价

①网址②形式③稳定性④浏览与检索功能⑤编排设计⑥⑦传输速度

(2)容的评价

①权威性②客观性③独特性④时效性⑤有序性⑥交互性⑦费用⑧写作质量⑨网络信息安全

九、.为什么必须对文档实施安全运用?谈你对网络环境下个人信息安全的重要性认识?

网络环境下个人信息安全的重要性:

1、个人信息在网络环境下的法律特征:个人信息的主体仅限于自然人。个人信息的主体是自然人,这是个人信息的主要法律特征,也是个人信息法律保护的重要前提,个人信息的客体是数字化的人格权和财产权。个人信息具有可识别性。个人信息可识别性中还有一个很重要的属性就是法律属性,自然人作为法律意义上的主体,应享有相应的法律权利和承担相应的法律义务,这也就意味着,虚拟主体的网络行为对个人信息造成侵权,也要承担相应的法律责任。个人信息的时效性。自然人有决定使用以及如使用自己个人信息的权利。

2、我国个人信息在网络环境下法律保护的必要性:有利于保障基本人权的实现,有利于建立健全个人信用征信体系和维护市场信息安全,有利于促进我国电子商务的健康发展,有利于促进国际贸易的发展。

十、谈谈信息检索个人实践,好处,意见?

1、在这个迅速变化的时代,学生不可能在学校里学到将来所需的每一种知识和技能,必须在具备阅读、数学、科学等面基础的前提下,努力培养自己的学习能力。学会如学习(learn how to learn),将比学会事实(learn to know)更为重要。

在信息爆炸的今天,纵观人类知识的倍增期,在19世纪为50年,20世纪前半叶为10年左右,到了70年代,缩短为5年,80年代末几乎已到了每3年翻一番的程度;而被海量或真或假信息淹没的现代人,得到的信息快速也海量,全面也矛盾,很难找到有用的信息,这一切都要面对耗时巨大、描述技巧、知识产权、理论与实际的巨大差距、经济影响排名和政府管制等问题。所以一个研究生要具有信息意识、信息技能和信息道德就显得尤为重要了。而信息检索有助于增强决策的科学性、缩短获取信息的时间、有利于信息用户获取所学的全部信息、提高工作的成功率和促进社会的进步和经济的发展。

所采用的检索策略一般分为:

1.分析检索课题

2.选择合适的检索工具

3.确定检索点与检索词

4.正确构造检索式

5.及时调整检索策略

十一、请结合本人检索实践,谈谈信息检索的益处,你获取研究资料过程中存在哪些困难(鼓励在授课容上自由发挥)?

信息检索的作用与意义主要体现在以下三面。

(一)避免重复研究或走弯路

我们知道,科学技术的发展具有连续性和继承性,闭门造车只会重复别人的劳动或者走弯路。比如,我国某研究所用了约十年时间研制成功“以镁代银”新工艺,满怀信心地去申请专利,可是美国某公司早在20世纪20年代末就已经获得了这项工艺的专利,而该专利的说明书就收藏在当地的科技信息所[7]。科学研究最忌讳重复,因为这是不必要的浪费。在研究工作中,任一个课题从选题、试验直到出成果,每一个环节都离不开信息。研究人员在选题开始就必须进行信息检索,了解别人在该项目上已经做了哪些工作,哪些工作目前正在做,谁在做,进展情况如等。这样,用户就可以在他人研究的基础上进行再创造,从而避免重复研究,少走或不走弯路。

(二)节省研究人员的时间

科学技术的迅猛发展加速了信息的增长,加重了信息用户搜集信息的负担。多研究人员在承接某个课题之后,也意识到应该查找资料,但是他们以为整天泡在图书馆“普查”一次信息就是信息检索,结果浪费了多时间,而有价值的信息没有查到几篇,查全率非常低。信息检索是研究工作的基础和必要环节,成功的信息检索无疑会节省研究人员的大量时间,使其能用更多的时间和精力进行科学研究。

(三)是获取新知识的捷径

在改革开放的今天,传统教育培养的知识型人才已满足不了改革环境下市场经济的需求,新形势要求培养的是能力型和创造型人才,具备这些能力的人才首先需要具备自学能力和独立的研究能力。大学生在校期间,已经掌握了一定的基础知识和专业知识。但是,“授之以鱼”只能让其享用一时。如果掌握了信息检索的法便可以无师自通,找到一条吸收和利用大量新知识的捷径,把大家引导到更广阔的知识领域中去,对未知世界进行探索。是谓“教人以渔”,才能终身受用无穷。

德国柏林图书馆门前有这样一段话:“这里是知识的宝库,你若掌握了它的钥匙,这里的全部知识都是属于你的。”这里所说的“钥匙”即是指信息检索的法。

说明一下,如果只是简答,你只需要选取每个点的标题即可。

信息检索是获取知识、信息的基本手段。如有效、快速、准确地在信息海洋中找到人们所需要的信息,使之成为重要资源,已是信息时代人们的重要需求,因而,信息检索技术在信息社会中将发挥越来越重要的作用。主要体现在以下几个面:

1.能够全面地掌握有关的必要信息,增强决策的科学性

掌握一定量的必要信息,是进行研究、搞好工作的首要条件,也是进行正确决策必不可少的前提条件。科学的决策,源于对信息资料的充分了解与认识,信息检索是、部门、单位和个人等决策者获取信息的重要途径。因此,信息检索会使、部门、单位和个人的决策建立在科学基础之上,大大增加了决策的科学性,减少了决策的盲目性。

2.提高信息利用的效率,缩短获取信息的时间

信息检索可以使用户在短时间获取有需求紧密相关的信息,使用户有更多的时间去完成更重要的工作,从而大大提高了工作效率。

3.有利于信息用户获取所需的全部信息

信息检索工作往往依存于一个或多个很大的信息库,信息库中存储着很全面的各种信息。通过信息检索工作,一次就可查获信息用户所需要的全部信息。

4.提高信息素质和科研工作的成功率

所谓信息素质,是指获取信息的强烈意识,掌握信息检索的技术和法,拥有信息的鉴别利用的能力。信息素质的提高,可增强信息意识,熟悉检索技巧,有利于科学研究工作的顺利开展,同时可提高科研工作的成功率。

5.促进社会的进步和经济的发展

社会的进步和经济的发展,推动了信息的产生、流通和使用;反过来,信息的生产:、流通和使用式的变革,又将促进社会和经济的进一步发展。

十二、检索与某专题有关的中外文学位论文信息,有哪些数据库(请至少列举3种中文和外文数据库)?学位论文常用的检索手段有哪些?

第八章(PDF)先举例数据库,再说检索手段

十四、信息检索的技术

信息检索的技术主要包括:全文检索技术,多媒体信息检索技术,跨语言信息检索技术,信息检索可视化技术,信息检索文本聚类技术

1)全文检索技术:搜索引擎起源于传统的信息全文检索理论,即计算机程序通过扫描每一篇文章中的每一个词,建立以词为单位的到排文件,检索程序根据检索词在每一篇文章中出现的频率和每一个检索词在一篇文章中出现的概率,对包含这些检索词的文章进行排序,最后输出排序的结果。

2)多媒体信息检索技术:多媒体搜索,是指带图片或媒体文件搜索功能的引擎,包括图像检索、音频检索、视频检索,以及包括动漫、音乐电影、电视等等。

3)跨语言信息检索:跨语言检索(Cross Language Information Retrieval, CLIR)即可用一种提问语言检索出用另一种语言书写的信息,也就是一种跨越语言界限进行检索的问题。主要问题如下

1. 查询词与检索到的文献分属不同语言。这是跨语言信息检索的最主要特征,由于提问与文献分属不同的语言,因此在两者之间需要通过词典、语料库(平行语料、可比语料)或者机器翻译系统等式建立不同语言的语义关联,进行跨语言的翻译,将查询词语和检索文献统一映射为一种语言;

2. 词的歧义和多义性。由于原始提问中有些词义的不确定性,系统中需要借助歧义性、多义性分析机制,将原始提问排歧后转换成最终提问;

3. 查询词的切分。一些语言(如中文、日文、文等)由于词与词之间没有明显的分隔符号,因此词的切分问题成为此类语言的跨语言检索研究要点之一;

4. 文献的多语言性。在跨语言检索系统中,由于原始文献是用不同的语言书写的,因此语种识别是检索的基本工作,此类情况常出现在自动标引的系统中;

5. 输出结果的排序式。检索结果中,不同语种的文献如排序,如对不同语种的文献进行相关度的计算,也是跨语言资讯检索系统必须研究的问题;

?6. 对多语言资源的依赖。由于跨语言检索需要借助多语言资源如双语词典、语料库等进行跨语言的翻译转换,所以跨语言信息检索

的性能受到多语言资源的质量和数量的约束,因此构建高质量的多语言资源是跨语言信息检索中亟待解决的难题。

4)信息检索可视化技术:是指将信息资源,用户提问,信息检索模型,检索过程及检索结果中各种不可见的部语义关系转换成图形,并显示在一个二维,三维或多维的可视化空间中,帮助用于理解检索结果,把握检索向,以提高信息检索的效率与性能。它是可视化技术在信息检索领域的应用。技术基础包括:关联更新技术,广角与聚焦技术,焦点加上下文技术,滤镜技术,空间显示技术,动态查询与过滤技术。

5)信息检索文本聚类技术:文本聚类(Text clustering)文档聚类主要是依据著名的聚类假设:同类的文档相似度较大,而不同类的文档相似度较小。作为一种无监督的机器学习法,聚类由于不需要训练过程,以及不需要预先对文档手工标注类别,因此具有一定的灵活性和较高的自动化处理能力,已经成为对文本信息进行有效地组织、摘要和导航的重要手段,为越来越多的研究人员所关注。应用:

? 1. 文档聚类可以作为多文档自动文摘等自然语言处理应用的预处理步骤,比较典型的例子是哥伦比亚大学开发的多文档文摘系统Newsblaster 。Newsblaster 将每天发生的重要新闻文本进行聚类处理,并对同主题文档进行冗余消除、信息融合、文本生成等处理,从而生成一篇简明扼要的摘要文档;

? 2. 对搜索引擎返回的结果进行聚类,使用户迅速定位到所需要的信息。Hua-JunZeng 等人提出了对搜索引擎返回的结果进行聚类的学习算法。比较典型的系统则有vivisimo 和infonetware 等。系统允用户输入检索关键词,而后对检索到的文档进行聚类处理,并输出各个不同类别的简要描述,从而可以缩小检索的围,用户只需关注比较有希望的主题。另外这种法也可以为用户二次检索提供线索;

? 3. 对用户感兴趣的文档(如用户浏览器cache 中的网页)聚类,从而发现用户的兴趣模式并用于信息过滤和信息主动推荐等服务。? 4. 聚类技术还可以用来改善文本分类的结果,如俄亥俄州立大学的Y.C. Fang, S.Parthasarathy 和F. Schwartz 等人的工作。

十五、信息检索的分类法

(1)根据检索手段的不同,分为手工检索、计算机检索(光盘检索、联机检索和网络检索)(2)根据检索对象、形式的不同,分为文献型信息检索、数据型信息检索、事实型信息检索。

?文献引文引文索引的概念

文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。也可以理解为古今一切社会史料的总称。现在通常理解为图书、期刊等各种出版物的总和。文献是记录、积累、传播和继承知识的最有效手段,是人类社会活动中获取情报的最基本、最主要的来源,也是交流传播情报的最基本手段。正因为如此,人们把文献称为情报工作的物质基础。另外,《文献》杂志为中文类核心期刊。引文是科学对话的一种法,是作者认为对自己的研究“有用”的资料,但同时也表明,引文的含义不是简单的,它并不是多人认为的那样只是“定量”的、“客观”的。首先它是作者的“主观”判断,但有多少个作者有这样的“主观”判断,其引文的“数据”则是“客观”的。它既是定性的,又是定量的。

?期刊评价指标

影响因子(Impact factor,缩写IF)是指某一期刊的文章在特定年份或时期被引用的频率,是衡量学术期刊影响力的一个重要指标,由美国科学情报研究所(ISI)创始人尤金·加菲得(Eugene Garfield)在1960 年代创立,其后为文献计量学的发展带来了一系列重大革新。

5 年影响因子某一期刊前五年发表的论文在统计当年的被引用总次数与该期刊在前五年发表的论文总数之比。计算公式为:五年影响因子=该期刊前五年发表论文在统计当年

被引用的总次数/该期刊前五年发表论文总数

立即指数(Immediacy Index) 立即指数量度一份期刊的普通文章在出版年度被引用的速度,或者在同一年期刊中的论文被引用的频率。这一数字对于评价新兴学科或尖端学科的期刊很有用。

被引用半衰期(Cited Half-life) 被引用半衰期确定被引用期刊的年龄基准,显示一份期刊从当前年度向前推算引用数占截止当前年度被引用期刊的总引用数50%的年数。这一数字有助于图书馆确定期刊采购和期刊馆藏的策略。被引半衰期:衡量期刊老化速度快慢的一种指标,指某一期刊论文在某年被引用的全部次数中,较新的一半被引论文发表的时间跨度。

文献总数:指来源期刊论文所引用的全部参考文献数,是衡量该期刊科学交流程度和吸收

外部信息能力的一个指标

信息检索模型:信息检索模型(Information Retrieval Model)是指如对查询和文档进行表示,然后对它们进行相似度计算的框架和法。本质上是对相关度建模。

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

1请构造英文检索式,查找2013年出版或者发表的关于环境保护(Environment Protection)立法面的英文著作或者论文。

TS=”environment protection legislation” AND PY=2013

中文:PY=2013 AND C 环境保护法AND 立法AND la=English AND (dt=book OR article)

英文:PY=2013 AND “Environmental Protection ” AND (law* OR legislat* OR rule) AND la=English AND (dt=book OR article)

2查找某学科有哪些三大引文索引的源刊物,用什么数据库?请给出英文全称,简称与中文名称。

SCI:科学引文索引(Science Citation Index)是其中最为重要的检索系统之一,由美国科学信息研究所(ISI)1961年创办出版的引文数据库,其覆盖生命科学、临床医学、物理、化学、农业、生物、兽医、工程技术等面的综合性检索刊物,尤其能反映自然科学研究的学术水平,是目前国际上三大检索系统中最著名的一种,其中以生命科学及医学、化学、物理所占比例最大,收录围是当年国际上的重要期刊,尤其是它的引文索引表现出独特的科学参考价值,在学术界占有重要地位。

EI—工程索引(Engineering Index),1884年创刊,由美国工程信息公司出版,报道工程技术各学科的期刊、会议论文、科技报告等文献

ISTP—科技会议录索引(Index to Scientific&Technical Proceedings,简称ISTP),也是由ISI出版,1978年创刊,报导世界上每年召开的科技会议的会议论文

3查找某主题有哪些中外文图书,最合适的数据库是什么?

万数据库

4请列举至少2个学术搜索引擎。

谷歌学术Google Scholar (http://scholar.google./ )

Google 推出的免费学术搜索工具,可以帮助用户快速查找学术资料,包括来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、论文、图书、摘要和技术报告。

百度学术http://xueshu.baidu./

Scirus .scirus./

Search4Science .search4science./

北大天网https://www.360docs.net/doc/e15737498.html,.

CNKI知识搜索https://www.360docs.net/doc/e15737498.html,/

6.试结合你的科研实践,谈谈为什么要进行科技查新(鼓励在授课容基础上自由发挥)?应该从哪几个面进行科技查新?

科技查新作用:

1)为科研立项提供客观依据

科研课题在论点、研究开发目标、技术路线、技术容、技术指标、技术水平等面是否具有新颖性,在正式立项前,首要的工作是全面、准确地掌握国外的有关情报,查清该课题在国外是否已研究开发过。通过查新可以了解国外有关科学技术的发展水平、研究开发向;是否已研究开发或正在研究开发;研究开发的深度及广度;已解决和尚未解决的问题等等,对所选课题是否具有新颖性的判断提供客观依据。这样可防止重复研究开发而造成人力、物力、财力浪费和损失。

2)为科技成果的鉴定、评估、验收、转化、奖励等提供客观依据

查新可以为科技成果的鉴定、评估、验收、转化、奖励等提供客观的文献依据;查新还能保证科技成果鉴定、评估、验收、转化、奖励等的科学性和可靠性。在这些工作中,若无查新部门提供可靠的查新报告作为文献依据,只凭专家小组的专业知识和经验,难免会有不公正之处,可能会得不出确切的结论。这样既不利于调动科技人员的积极性,又妨碍成果的推广应用。高质量的查新,结合专家丰富的专业知识,便可防止上述现象的发生,从而保证鉴定、评估、验收、转化、奖励等的权威性和科学性。

3)为科技人员进行研究开发提供可靠而丰富的信息

随着科学技术的不断发展,学科分类越来越细,信息源于不同的载体已成为普遍现象,这给获取信息带来了一定的难度。有关研究表明,技术人员查阅文献所花的时间,约占其工作量的50%,若通过专业查新人员查新,则可以大量节省科研人员查阅文献的时间。查新机构一般具有丰富的信息资源和完善的计算机检索系统,能提供从一次文献到二次文献的全面服务,可检索科技、经济、商业等资料的数据库,容涉及各种学术会议和期刊的论文、技术报告、学位论文、政府出版物、科技图书、专利、标准和规、报纸、通告等,保证信息的回溯性和时效性,基本能满足科研工作的信息需求。科技查新与文献检索及专家评审的主要区别

从哪几个面进行科技查新?

或省级专利网、科技网、中国科学技术协会网络、科技创新比赛平台、高科技展览会

8.结合本人体会,谈谈学位论文信息检索的重要性,如对国外的学位论文进行信息检索?

9.试述OCLC-FirstSearch联机检索系统的12个基本组数据库及其联机检索系统的特点。

特点:

1、面向最终用户

FirstSearch是一个面向最终用户设计的联机检索系统,任技术人员只要经过半天的培训都能熟练地应用,然后可自己亲自上机操作检索适合自己需要的文献,而且可以在图书馆、办公室、试验室甚至家中等任地的联到Internet网的微机上使用。

2、提供一体化服务

OCLC的一体化服务分为三个层次: 第一层对用户提出的问题进行相关文献的检索,可检索的数据库大多为二次文献数据库。第二层是查找文献所在地,其所在地包括世界围的图书馆、世界上可提供全文服务的文献服务社或OCLC自身。第三层是提供一次文献,提供的式可能是OCLC的数量达100多万篇的随时都在更新的联机全文库,也可能是通过所在图书馆的馆际互借服务,也可能是第三的文献服务社。最终保证了用户能取到所需的文献。

3、收费低

OCLC是按检索的次数而不是按所用的机时收取费用,用户每递交一次检索式并得到命中记录的一览表后计为一次检索,之后你可以对其表中任一条记录进行联机显示、打印或以E-mail式传递回本地信箱,不论你浏览了多少条记录和经过多长时间均在一次收费之。

4、信息量大

用FirstSearch系统可检索主题畴非常广泛的70多个数据库。

这些畴包括:艺术和人文学科、工商管理和经济、会议和会议录、消费者事物和人物、教育、工程技术、普通科学、生命科学、医学和健康学、新闻和时事、公共事务和法律、社会科学、综合和参考等。它检索到的文献信息中不仅包含文摘还能查阅到馆藏地点。

5、信息更新快

OCLC的数据库经常在修改,每天都有新的信息增加到数据库中,因此用户从OCLC的数据库能检索到世界上最新的资料和信息。

除以上主要特点之外,还有其他多特点,例如操作简便,网络支持服务环境好等。

13个基本组数据库简介

1. Article1st ---- 15,000多种期刊目次页所列文章的索引

Article1st数据库包括15,000多种学术期刊目次页所列文章的索引,主题覆盖了工商、人文学、医学、科学、技术、社会学和大众文化等。虽然大多数期刊是英文资料,但也收录了部分其它语言的期刊。该库覆盖了1990年到现在的资料,每天更新。

2.ClasePeriodica----- 有关科学和人文领域的拉丁美洲期刊索引

ClasePeriodica数据库由Clase和Periodica两部分组成,其中Clase索引了在拉丁美洲期刊中发表的社会科学和人文学科面的文献;Periodica收录了科技面的期刊。该库提供对以西班牙文、葡萄牙文、法文和英文出版的2,600种学术期刊的检索,总计达30多万条书目引文。Clase收录的期刊从1975年开始至今;Periodica收录的期刊从1978年开始至今,数据库每季度更新一次。

3.Ebooks-----世界各地图书馆的联机电子书的OCLC目录

Ebooks数据库包括世界各地图书馆已在WorldCat数据库中编目的联机电子书,共计200,000多种,其中也包括OCLC的netLibrary电子书。用户可以检索所有这些电子书的书目,并可到你单位已订购且包含在WorldCat数据库中的电子书进行阅读。

4.ECO---- 联机电子学术出版物(只能查到书目信息)

ECO是一个全部带有联机电子全文文章的期刊数据库,主题畴广泛,可检索到书目、文摘信息和全文文章。收录的期刊来自70多家出版社,总计4,800多种。数据库中的文章都以页映像的格式(PDF, RealPage, 或HTML) 显示,在页映像中包括了文章的全部原始容和图像。该库收录的期刊大多从1995年开始,每天更新。OCLC提供了1,691种刊可按篇购买。

5.ERIC---- 教育面的期刊文章和报告

ERIC是由教育资源信息中心生产的已出版的和未出版的教育面文献的一个指南。它囊括了数千个教育专题,提供了最完备的教育书刊的书目信息,覆盖了从1966年到现在的资料,每月更新记录。现在,ERIC包括约2100多种期刊,同时还包括一个ERIC叙词表。

6.GPO---- 美国政府出版物(由美国政府出版署创建)

GPO 包含55万多条记录,收录了与美国政府相关的各面的文件。这些文件的类型有:国会报告、国会听证会、国会辩论、国会档案、法院资料以及由美国具体实施部门,如:国防部、政部、劳动部、总统办公室等出版发行的文件。它覆盖了从1976年7月以来的资料,每月更新记录。

7.MEDLINE---- 医学的所有领域,包括牙科和护理的文献(由医学图书馆创建)

MEDLINE 覆盖了所有医学领域,包括临床医学、实验医学、牙科学、护理、健康服务管理、营养学以及其它学科。它索引了国际上出版的9,580多种期刊,覆盖了从1965年到现在的资料,每天更新记录。

8.PapersFirst---- 国际学术会议论文索引

该数据库包括在世界各地学术会议上发表的论文,它覆盖了自1993年10月以来在“大英图书馆资料提供中心”的会议录收集的每一个代表大会、专题讨论会、博览会、座谈会和其它会议上发表的论文,可通过馆际互借获取全文。该库每两更新一次。

9.Proceedings---- 国际学术会议录索引

Proceedings是PapersFirst的相关库,它包括在世界各地举行的学术会议上发表的论文的目录表。该库提供了一条检索“大英图书馆资料提供中心”的会议录的途径。

10.UnionLists---- OCLC成员馆所收藏期刊的联合列表库

该数据库包括着数千种期刊的馆藏情况,有850多万条记录,每一条记录包括某种期刊和它的收藏馆的有关信息。每半年更新一次。

11.WilsonSelectPlus---- 科学、人文、教育和工商面的全文文章

该数据库是一个联机全文、索引和摘要信息的集合,这些全文文章选自H.W. Wilson公司的普通科学文摘、人文学科文摘、读者指南文摘和Wilson商业文摘。它包括1,650多种期刊,覆盖了从1994年至今的资料,每更新一次。

12.WorldAlmanac---- 世界年鉴

该数据库在1868年第一次出版,它是适用于包括学生、图书馆的读者、图书馆的参考咨询人员和学者等几乎每个人的一个十分重要的参考工具。涉及的畴包括:艺术和娱乐、新闻人物、计算机、科学和技术、经济学、体育运动、环境、税收、年纪念日、美国的城市和州、国防、人口统计、世界上的等等,覆盖了1998年至今的资料,每年更新一次。

13.WorldCat---- 世界围图书和其他资料的OCLC联合编目库

该库是OCLC的一个由9千多成员馆参加的联合目录数据库。它包括400多种语言的5,700多万条记录,覆盖了从公元前1000年至今的资料,基本上反映了世界围的图书馆所拥有的图书和其他资料。它的主题畴广泛,并以每年200万条记录的速度增长。该库每天更新。

12论述利用Web of Science提高科研效率的几种途径(15分)

利用Web of Science提高科研效率的途径体现在以下5个面:

(1)检索和浏览:快速找到有用的信息。Web of Science包含4000多种学术期刊,100年科技文献与施引、被引文献检索,可以检索特定的研究主题,检索某个作者发表的论文,检索某个机构发表的文献,检索特定期刊特定年代发表的文献等。

(2)分析:挖掘找到的文献背后的信息。分析研究趋势、发现技术热点、揭示论文间的潜在联系、提供引文报告。

(3)管理:积累文献。定题/引文跟踪(Email/RSS)、管理参考文献EndNote Online/Basic、管理检索策略、管理全文。

(4)写作:提高写作效率。在Microsoft Word中边写作边引用,自动生成文中和文后参考文献,提供2,300多种期刊的参考文献格式。

(5)发现:可以发现某个重要理论或概念的初始由来,所在研究领域的历史与最新进展,潜在的合作伙伴,交叉学科的研究领域,新的研究机会与可能性,基金资助的研究成果等。

14.请结合本人实际,谈谈你学习“信息检索”慕课(M00C)的收获、问题与建议;或者谈谈学习本课程的收获、问题与建议(10分)(大家自行选择)

收获:

1、有利于培养我们的信息意识、自学意识和知识创新能力,使我们养成了自主学习的习惯和独立获取信息的能力,了解了信息社会中文献信息检索的重要性及其发展趋势及信息检索的基本知识。让我明白了学习科技文献检索的重要性,通过学习让我了解到了更广阔、更科学的途径来搜集相关资料,这对我撰写论文或者进行相关研究,提供了很大帮助。

2、学习文献信息检索,能很好的帮助我们利用图书馆的资源,不论是纸质,还是电子资源。

3、文献信息检索课程可以让我们更快的找到自己需要的文献信息,从而避免重复研究或走弯路,一定程度上为我们学习节省了不少时间。

问题:

1、文献检索课程的主要容是为学生介绍文献的发展过程,科技文献的种类和特点,文献检索的基础知识,各种专业性的期刊、书籍、工具书、专利等的特点和查找法,以及专业数据库的特点及其检索符号、检索过程、检索结果处理等,因此课堂教学过程相对比较枯燥。

2、不同老师所讲授的容不够连贯,还有部分重复的,无法清晰掌握课程脉络。

3、缺乏实战,导致老师讲授的容很快忘记。

建议:

1、改进教学法,充分利用多媒体教学手段,并结合教学如说根据现有图书馆条件,充分利用馆藏目录、图书馆数据库、Internet网等教学资源,也可以结合学生专课程学习情况及毕业论文写作等,设置检索容,使学生接受文献检索综合训练,从而提高学习兴趣和论质量,达到理想的教学效果。以上法不仅可使学生掌握各种检索法,而且可使学生获得相关文献资料,真正达到学以致用的目的。

2、这是实用性很强的课程,我们不应该只是坐在教室里听,而应该在图书馆或者机房进行实战演练。

3、本课程是由多个老师分别讲述,容安排上有些重复和凌乱,开课前应该组织好各位老师所将的容,让容更加连贯。

2、在EBSCO数据库中检索克隆羊“多利(Dolly)”的图片,应如检索?请写出检索步骤。

答:打开EBSCO数据库,在检索框中输入“Dolly”,点击下的“检索选项”,在限制结果选项中选择检索的图片类型,在“特殊限制条件用于MEDLINE”中选择“动物”,然后检索可得到结果。

9、(必考)谈谈如提高文献检全率和检准率?

答:

提高检全率的法:

(1)降低检索词的专指度,可从词表或检出文献中选一些上位词或相关词补充到检索式。

(2)调节检索式的网罗度,如删去某个不甚重要的概念面。

(3)进行族性检索,可用分类号或采用一组近义词、同义词或者相关词用OR连接在检索中。

(4)进行截词检索,可以采用后截断、前截断、前后截断等法。

(5)增加检索途径,如将主题途径与非主题途径结合起来使用。

(6)取消限制过的前后缀符、限制符。

提高检准率的法:

对于需要提高检准率的课题,主要从缩小检索围入手,可采用以下法。

(1)提高检索式的专指度,增加或换用下位词和专指度较强的自由词。

(2)用AND连接一些进一步限定主题概念的相关检索项。

(3)限制检索词出现的可检字段。

(4)用位置算符控制检索词的词间顺序与位置。

(5)利用限制符、前缀符限制输出文献的外表特征。

(6)利用NOT限制与情报提问不相关的文献的输出。

(7)进行加权检索,从定量的角度加以控制。

10、简述检索专利的途径和法,什么是TPC分类法。(答案不完整)

答:检索专利的途径主要有:知识产权局专利数据库(https://www.360docs.net/doc/e15737498.html,.)、中国专利信息网(.patent..)、中国知识产权网(.cnipr.)、中国专利网(.cnpatent.)、中国专利信息中心网(.cnpat..)

检索专利的法:1、登录到知识产权局专利数据库(https://www.360docs.net/doc/e15737498.html,.)(或者其他检索专利的)主页上提供专利快速检索入口,或者点击“高级检索”即可进入专利高级检索界面。

IPC分类法即国际专利分类法,它是一种国际统一化、标准化的专利分类法。它采用等级分类结构,将所有技术领域按照六个等级—部、分部、大类、小类、组、小组逐级展开,组成一个完整的分类体系。分类法是按照文献的技术主题来设立类目的,其设立原则一般为二种,一种叫做应用性原则,一种叫做功能性原则。所采用的是功能与应用相结合、以功能为主的原则。

11、确定搜索关键词的一般法有哪些?

答:主题分析法、切分法、删除法、替换法、聚类法、补充法、限定法

13、(必考)写出10个以上本校图书馆的电子信息资源。

答:超星数字图书、书生之家数字图书、外文数字图书馆、CNKI、维普中文科技期刊全文数据库、人大复印报刊资料、万学位论文、搜数网、龙源期刊网、年鉴资源库、EBSCO数据库

18、查找论文被引用情况可用哪些数据库?

答:社会科学引文索引(SSCI)《科学引文索引》(SCI)《工程索引》(EI)《科学会议录索引》(ISTP)《艺术与人文科学引文索引》(AHCI)

19、第一次检索的结果有172条文献,你建议一下他采用种式来缩小检索围。

答:(1)提高检索式的专指度,增加或换用下位词和专指度较强的自由词。

(2)用AND连接一些进一步限定主题概念的相关检索项。

(3)限制检索词出现的可检字段。

(4)用位置算符控制检索词的词间顺序与位置。

(5)利用限制符、前缀符限制输出文献的外表特征。

(6)利用NOT限制与情报提问不相关的文献的输出。

(7)进行加权检索,从定量的角度加以控制。

注意:只选其中一两种办法阐释。

20、信息素质体现在?通过哪些途经培养?

答:体现:1、信息资源意识,看能否整体了解所需信息的信源。2、信息传递与沟通意识,看能否整体了解各种有效信息传递渠道及式,能都有效的进行信息交流与沟通。3、利用信息进行分析与创新意识与能力,看利用各种信息进行综合分析、创新等习惯、冲动、激情与能力。4、信息保密意识与技能、信息安全意识与技能。5、竞争合作意识与工作中的沟通与团队协作能力。6、信息职业道德观,含价值、法制观及诚信意识。

途径:通过《信息检索与利用》课程的学习,做到整体了解所需信息的信源,整体了解各种有效信息传递渠道及式,利用各种信息进行综合分析、创新等习惯、冲动、激情与能力。做到信息保密意识与技能、信息安全意识与技能。培养竞争合作意识与工作中的沟通与团队协作能力

21、文献检索一般可划分为哪几个步骤

1)明确查找目的与要求

2)选择检索工具

3)确定检索途径和法

4)根据文献线索,查阅原始文献

22、文献检索的类型有哪些?

答:1.数据检索:是将经过选择、整理、鉴定的数值数据存入数据库中,根据需要查出可回答某一问题的数据的检索。数据信息检索的对象是数值性数据,即具有数量性质并以数值形式表示的量化信息。例如:检索“某种材料的电阻,某种金属的熔点”。

2.事实检索:是将存储于数据库中的关于某一事件发生的时间、地点、经过等信息查找出来的检索。它既包含数值数据的检索、运算、推导,也包括事实、概念等的检索、比较、逻辑判断。事实信息检索的对象是已经存在的各种事实的有关资料,它是数值信息和系统数据信息的混合。例如:检索“迅生于年”。

3.文献检索:是将存储于数据库中关于某一主题文献的线索查找出来的检索。它通常通过目录、索引、文摘等二次文献信息为工具,以原始文献的出处为检索目的,可以向用户提供有关原文献的信息。例如:“关于商标保护有哪些参考文献?

23、文献检索的途径。

1、主题途径:通过反映文献资料容的主题词来检索文献。由于主题法能集中反映一个主题的各面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。我们通过主题目录或索引,即可查到同一主题的各面文献资料。

2、分类途径:分类途径是从文献容所属的学科类别出发来检索文献,利用相应检索工具的分类目录和分类索引检索到相关容。这一途径是以知识体系为中心分类排检的,因此,比较能体现学科系统性,反映学科与事物的隶属、派生与平行的关系,便于我们从学科所属围来查找文献资料,并且可以起到"触类旁通"的作用。

3、作者途径:作者途径是从文献的作者姓名出发来检索其文献。“作者”广义上还应该包括汇编者、编者、译者、主办者、代表机构、单位的团体作者等。

4、题名途径:直接利用信息的题名查找信息的法。它包括信息标题名、图书名、刊名、标准名、文档名、数据库名等。

5、引文途径:文献所附参考文献或引用文献,是文献的外表特征之一。利用这种引文而编制的索引系统,称为引文索引系统,它提供从被引论文去检索引用论文的一种途径,称为引文途径。

6、途径:利用信息的获取相关信息的法。包括文献的编号、代码等。如专利号、报告号、合同号、标准号、国际标准书号和刊号等。

7、其他途径(专门项目途径):从文献信息所包含的或有关的名词术语、地名、人名、机构名、商品名、生物属名、年代等的特定顺序进行检索,可以解决某些特别的问题。

1.武汉大学《信息检索》试卷及答案(两套)

武汉大学信息管理学院2008-2009学年度第二学期 《信息检索》课程考试卷(A卷) 年级专业图书馆学姓名学号 (请务必将答案写在答题纸上,否则无效) 一、名词解释(5 x 4分=20分) 1.信息检索 2.引文索引 3.CALIS 4.邻近检索 5.搜索引擎 二.简答(5 x 6分=30分) 1.电子图书有哪些特点? 2.对搜索引擎的选择与比较主要从哪些方面考虑? 3.网络信息选择的标准有哪些? 4.查找国内外引文与学位论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。 5.除商业数据库和搜索引擎外,还可以从哪些途径获取网络信息资源?请至少给出5种,每种举一例。三.选择填空(4 x 5分=20分) 此题为多项选择题,选错者不倒扣分,但所选答案不得多于5个。 1.下列中不能用于查找期刊论文引用信息的有: a. SSCI b. CSSCI c. Journal Citation Report d. Ulrich’s International Directory of Pe riodicals e. SCI f. A&HCI g. ProQuest Digital Dissertations h. Web of Knowledge i.VIP Chinese Scientific Journal Database j.Chinese Enterprises and Companies Database 2.检索图书馆学、信息管理学的期刊论文,可用的检索工具有: a. LISA b. ISA c. BA d. CA e. Web of Knowledge f. Ei g. SSCI h. SCI i. ProQuest Digital Dissertations 3.下列中可用于查找机构信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals c.Chinese Enterprises and Companies Database d. Foundation Directory e. Peterson’s Gradline f. Who is Who g. World of Learning h. Encyclopedia of Associations 4.下列中可用于查找期刊论文信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals

信息检索基本方法教案.doc

布尔逻辑检索 Boolean logic 由 GEORGE BOOLE 1815-1864提出,目前大多数搜索引擎都 采用与AND,*,& 或OR,+ ,︱ 非 NOT,—, ! 逻辑“与” : 用关系词 AND表示 ( 可写作“ * ”或“ &”) 。逻辑“与”表示 AND 所连接的两个检索词必须同时在结果中出现才满足检索条件。 逻辑“或” : 用关系词 OR表示 ( 可写作“ +”或“︱” ), 逻辑“或”表示 OR所连接的两个检索词只要有一个能出现在结果中就算满足了检索条件。 逻辑“非” : 用关系词 NOT表示 ( 可写作“ and not ”“ —”或“ ! ” ), 逻辑“非”表示 NOT后面的那个检索词一定不能在检索结果中出现。 例如:校庆AND武汉大学 高等教育 *中国 湖南 OR 湖北 移动学习 + 泛在学习 大学 NOT 武汉大学 玉米–甜玉米 例如,用 GFsoso检索,电子AND读书笔记 电子读书笔记 OR 读书笔记软件 位置限制检索 临近检索( Proximity Search) 以 Dialog 为例,收 900 多个数据库 (1)PRE/0, P/0表示前后词序不能颠倒,中间不能插入其他词,但可以插 入符号。 With,(W) 例如: Wuhan P/0 University (2)PRE/#, P/#表示前后词序不能颠倒,中间可插入一定数量的单词,即

插入 #个单词。 例如: Wuhan P/1 University 检索结果:Wuhan Medical University ; Wuhan Agriculture University ; Wuhan Technology University ; (3)NEAR/0,N/0表示前后词序可以颠倒,但中间不能插入单词。 例如:Wuhan N/0 University 检索结果: Wuhan University;Wuhan–University;Wuhan,University University, Wuhan; University-Wuhan; University Wuhan (4)NEAR/#,N/#表示前后词序可以颠倒,中间可以插入#个单词。 例如: Wuhan N/1 University 检索结果: Wuhan Medical University; Wuhan Agriculture University; Wuhan Technology University; University of Wuhan; University in Wuhan; University at Wuhan (5)(s)是 sentence 的缩写, A( s) B 表示 A 和 B 必须同时出现在记录的同一个句子或短语中,但次序可以随意改变, A 与 B 之间可以有若干个其他的词。 如: resin (s) ester (酯化树脂) 【练习】 1、查找 computer 和 game的间隔不大于 100 个单词的网页 2、检索“杂交玉米”的外文文献,要求两词间隔 1 个词,前后次序固 定。 hybrid 、corn 答案: 1、computer near/100 game 2、hybrid p/1 corn hybrid w/1 corn

信息检索论文

信息污染研究综述 [论文关键词]信息污染网络信息对策 [论文摘要] 随着互联网技术的迅速发展和知识经济的到来,信息作为一种社会发展的战略资源,越来越受到人们的重视。由于网络环境下信息量的激增,信息传递的无序性和失控性,导致信息污染日益加剧,给社会造成了严重危害。因此,必须采取有效措施,进行网络环境下信息控污,净化网络信息空间,为更好地利用网络信息资源创造有利条件。针对网络信息环境,分析了信息污染的内涵、外在表现、污染原因,指出了信息污染的危害,给出了相关的解决对策。 一.信息污染类型 信息超载或信息过剩。 是指个人或系统所接受的信息超过其处理能力或有效应用的情况。这往往使信息用户无所适从。信息本来是用以消除不确定性的,过量的信息却增加了人们的不确定性和不安全感。每个人或结构的信息负载量是有一定限度的,当人们接受的信息超过其所能消化的信息量时,往往会患上“信息超载焦虑症”,带来财力、物力和人力的浪费。而且,信息超载又使人们面临新的信息匮乏。由于信息量太大,身处信息的海洋却找不到自己所需要的信息,致使社会信息吸收利用率反而下降。在网络信息技术十分发达的美国和日本,近年来的信息吸收率仅为10%左右。 信息垃圾 根据资料分析,在全球信息系统中,文献中信息垃圾( 包括冗余信息、盗版信息、虚假信息、过时老化信息、污秽信息等) 所占的比例不少于50%, 在个别学科领域甚至高达80%, 严重污染了互联网中的信息源和信息环境, 干扰了对有效信息的开发和利用。冗余信息即多余的、重复的、无价值的信息,包括期刊、书籍、因特网都有一些内容空洞、言之无物的东西。有的是剽窃、抄袭、拼揍之作,有的是多次重复发布,成为人们信息处理的负担。盗版信息是指在未经版权所有人同意或授权的情况下,对其拥有著作权的作品、出版物等进行复制所形成的信息。虚假信息传播布者有意识地传递的虚假错误信息,误导、诱骗他人。过时老化信息,即失去时效、老化无用信息。由于科学技术飞速发展,知识更新速度不断加快,据统计,化学专业文献在出版后8.1年出现老化,化工文献经过4.8年就老化,地理学、地质学、植物学分别经过16.0、11.8、10.0年而变得老化。污秽信息要指带有巫术、迷信等内容的信息,还有无从证实的传闻、流言、诽谤等恶意传递的污垢信息。 计算机病毒 它给整个因特网乃至整个社会带来难以估量的危害。世界上已有几千种病毒传播流行,它们被指令插入磁盘引导区、引导程序或应用程序中,捣乱甚至销毁系统中的数据、删除文件等,不仅造成电子信息污染,更严重是引发计算机犯罪,威胁着人类的生存社会的发展。对于信息污染,必须严加控制和治理,这已引起国际社会的高度重视。国际环球网联合会要求世界各国推行因特网监控软件,对信息标记进行审查。由欧洲和美国微软等大公司开发了PICS(Platform for Internet Content Selection),即“因特网络内容选择平台”,这一监控软件可以根据要求限制对网络信息调阅,也可以实现对特定信息监控。

武汉大学《信息检索》试卷及答案(两套)

三.选择填空(4 x 5分=20分)1.C,d,g,I,j 2.a,b,e,g,h3.c,d,e,g, h4.c,d,f,g此题为多项选择题,选错者不倒扣分,但所选答案不得多于5个。 1.下列中不能用于查找期刊论文引用信息的有: a. SSCI b. CSSCI c. Journal Citation Report d. Ulrich’s International Directory of Periodicals e. SCI f. A&HCI g. ProQuest Digital Dissertations h. Web of Knowledge i.VIP Chinese Scientific Journal Database j.Chinese Enterprises and Companies Database 2.检索图书馆学、信息管理学的期刊论文,可用的检索工具有: a. LISA b. ISA c. BA d. CA e. Web of Knowledge f. Ei g. SSCI h. SCI i. ProQuest Digital Dissertations 3.下列中可用于查找机构信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals c.Chinese Enterprises and Companies Database d. Foundation Dire ctory e. Peterson’s Gradline f. Who is Who g. World of Learning h. Encyclopedia of Associations 4.下列中可用于查找期刊论文信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals c. ABI/INFORM d. Elsevier e. Journal Citation Report f. Chinese Academic Journal Fulltext Database g. OCLC Electronic Collections Online 武汉大学信息管理学院2008-2009学年度第二学期 《信息检索》考试试卷(A)答案 一、名词解释(5x4=20分) 1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 3.China Academic Library and Information System中国高等教育文献保障系统。 4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。 5.搜索引擎(Search Engine)是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。 二、简答(5x6=30分) 1.电子图书有哪些特点? 存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使

武汉大学期末GIS复习总结

第一章地理信息系统概论: 地理信息系统:是一种决策支持系统,它具有信息系统的各种特点。地理信息系统与其他信息系统的主要区别在于其存储和处理的信息是经过地理编码的,地理位置及与该位置有关的地物属性信息成为信息检索的重要部分。 “GIS是由计算机硬件、软件和不同的方法组成的系统,该系统设计用来支持空间数据的采集、管理、处理、分析、建模和显示,以便解决复杂的规划和管理问题”。(推荐定义) 信息:向人们或机器提供关于现实世界新的事实的知识,是数据中所包含的意义,它不随载体的物理设备形式的改变而改变。 数据:数据时指某一目标定性、定量描述的原始资料,包括数字、文字、符号、图形、图像以及他们能转换成的数据的形式。 有人认为,输入的都叫数据,输出的都叫信息,其实不然。数据是信息的表达、载体,信息是数据的内涵,是形与质的关系。只有数据对实体行为产生影响才成为信息,数据只有经过解释才有意义,成为信息。 地理信息:地理信息是有关地理实体的性质、特征和运动状态的表征和一切有用的知识,它是对地理数据的解释。 地理信息具有区域性、多维结构特性和动态变化的特性。 地理数据:地理数据时指表征地理圈或地理环境固有要素或物质的数量、质量、分布特征、联系和规律的数字、文字、图像和图形等的总称。 信息系统:是具有数据采集、管理、分析和表达数据能力的系统,它能够为单一的或有组织的决策过程提供有用的信息。它能对数据和信息进行采集、存储、加工和再现,具有采集、管理、分析和表达数据的能力。 主要由计算机硬件、软件、数据、用户四大要素组成。 地理信息系统可以分为三大类:专题地理信息系统、区域信息系统、地理信息系统工具。 地理信息系统的构成:空间数据、系统软件、系统硬件、应用人员。 空间数据:是地理信息的载体,是地理信息系统的操作对象,它具体描述地理实体的空间特征、属性特征和时间特征。 空间特征:是指地理实体的空间位置及其相互关系; 属性特征:表示地理实体的名称、类型和数量等; 时间特征:指实体随时间而发生的相关变化。 根据地理实体的空间图形表示形式,可将空间数据抽象为点、线、面三类元素,它们的数据表达可以采用矢量和栅格两种组织形式,分别称为矢量数据结构和栅格数据结构。

武汉大学信息管理学院2001-2002学年度第一学期《信息检索》期末考试卷

2008-2009学年度第二学期《信息检索》考试试卷(B)答案 一.名词解释(5 x 4=20分) 1.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符用“?”或“*”表示。 2.信息检索:信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 3.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。 4.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。 5.引文索引:是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 二.简答(5x 6=30分) 1.查找国内外学位与会议论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。 学位论文索引与摘要,如:CALIS《学位论文库》(http://162.105.138.230/opac/treatise),万方数据资源系统《中国学位论文数据库》(https://www.360docs.net/doc/e15737498.html,),PQDD (https://www.360docs.net/doc/e15737498.html,/dev/dissertations) 会议论文索引与摘要,如:CALIS 会议论文数据库(http://162.105.138.230/opac/meeting),万方数据资源系统《中国学术会议论文数据库》(https://www.360docs.net/doc/e15737498.html,),OCLC 会议数据库(https://www.360docs.net/doc/e15737498.html,/login )——《在会议上提交的文章索引》(PapersFirst),《会议出版物索引》(Proceedings),科学网会议录索引(Web of Science Proceedings,https://www.360docs.net/doc/e15737498.html,) 2.布尔逻辑检索的主要运算符有哪些?它们各代表什么含义?请分别举一例说明。 布尔逻辑检索的主要运算符有“AND”、“NOT”、“OR”,它们分别代表逻辑与、或和非,如:美国AND 社会保障,数字图书馆OR 虚拟图书馆,玉米NOT 甜玉米 3.搜索引擎有哪些类型? 按照信息组织方式分:有网络资源指南与关键词搜索引擎;按学科范围与资源种类分,有综合性搜索引擎和专门性搜索引擎;按照功能分,有独立搜索引擎和元搜索引擎 4. 5.电子图书有哪些特点? 容量大,节省空间,环保,功能多 6.网络信息选择的标准有哪些? 权威性、内容、时效性、网页设计、适用性、用户对象、访问次数或被链接次数 三.选择填空(5 x 5=25分) 此题为多项选择题,选错者不倒扣分,但所选答案不得多于5个。 1.c d e h i 2.a c d e h 3.a c d f h 4.b d e f g 5.a b g i j 四.论述题(1X25=25分) 通过检索实践,你认为网络信息检索中的主要问题有哪些(10分)?应掌握哪些技巧与注意事项(15分)?该题鼓励同学们在课本有关内容基础上进一步发挥。 “网络信息检索中的主要问题”部分考察学生发现问题的能力,鼓励个人发挥,若只答

武汉大学信息检索往年试卷选辑

2009春季《信息检索》试卷A 1.电子图书有哪些特点? 2.对搜索引擎的选择与比较主要从哪些方面考虑? 3.网络信息选择的标准有哪些? 4.查找国内外引文与学位论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。 5.除商业数据库和搜索引擎外,还可以从哪些途径获取网络信息资源?请至少给出5种,每种举一例。四.论述题(2X15分=30分) 1.从哪些方面全面地查找关于某一主题的研究成果? 2.在完成专题信息导航或准备课堂教学实践过程中遇到的困难有哪些(5分)?学习“信息检索”这门课,你最大的收获是什么(5分)?请写出你对提高本课程教学质量的建议(5分)。 2009春季《信息检索》试卷A答案 武汉大学信息管理学院2008-2009学年度第二学期 1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 3.China Academic Library and Information System中国高等教育文献保障系统。 4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。 5.搜索引擎(Search Engine)是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。 二、简答(5x6=30分) 1.电子图书有哪些特点? 存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使用,可无失真地重复使用)。 2.对搜索引擎的选择与比较主要从哪些方面考虑? 收录范围(索引库中内容的数量、地域范围、语言种类、资源类型、资源的深度和广度)、分类(分类方式是否合理多样、类名是否规范、分类的广度与深度是否合适)、检索功能与效果(是否包含浏览检索和关键词

(完整word版)武汉大学信息检索整理

名词解释 1.信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。2.引文索引是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 3.CALIS:China Academic Library and Information System中国高等教育文献保障系统。 4.邻近检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的检索方法。 5.搜索引擎(Search Engine)是一种Web 上应用的软件系统,它以一定的策略在Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。 6.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符一般用“?”或“*”表示,但不同的数据库中有所差别。 7.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。 8.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。 9.文献及其要素 “文献”是泛指“有历史价值或参考价值的图书资料。” 要素:1、构成文献内核的信息、知识、数据、事实.2、载体信息、知识、数据、事实的物质载体。3、记录信息、知识、数据、事实的符号系统。 10.专利文献:专利文献是实行专利的国家、地区及国际专利组织在批审专利过程中产生的官方文件及出版物,包括专利说明书、专利权利要求书、专利公报、专利分类表、专利检索工具等。 11.三大检索系统:SCI(《科学引文索引》,EI是美国《工程索引》(TheEngineeringIndex)的简称,ISTP是IndextoScientific&T echnicalProceedings的缩写。 12.二次文献:二次文献又称二级次文献,它是文献检索工具,能比较全面、系统地反映某个学科、专业或专题在一定时空范围内的文献线索,是积累、报道和检索文献资料的有效手段. 13.受控语言:受控语言是一种规范化的人工语言,包括具有较强族性检索功能的分类语言和具有较强特性检索功能的主题语言。14.信息素质教育:是指一个人的信息意识教育、信息道德教育、信息能力教育 15.引文追溯法:追溯法是指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文” 的一种最简便的扩大情报来源的方法。它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。 16.同引文献:与本文有相同参考文献的文献,与本文有共同研究背景或依据的文献。 17.学科导航:学科导航是按学科门类将学科信息、学术资源等集中在一起,以实现资源的规范搜集、分类、组织和序化整理,并能对导航信息进行多途径内容揭示,方便用户按学科查找相关学科信息和学术资源的系统工具。 18.知识产权:知识产权是指对智力劳动成果依法所享有的占有、使用、处分和收益的权利。知识产权是一种无形财产,它与房屋、汽车等有形财产一样,都受到国家法律的保护,都具有价值和使用价值。有些重大专利、驰名商标或作品的价值也远远高于房屋、汽车等有形财产。 19.IPC:国际专利分类法是国际上通用的专利文献分类法。用国际专利分类法分类专利文献(说明书)而得到的分类号,称为国际专利分类号,通常缩写为IPC号。IPC采用了功能和应用相结合,以功能性为主、应用性为辅的分类原则。采用等级的形式,将技术内容注明:部——分部——大类——小类——大组——小组,逐级分类形成完整的分类体系。 20.NSTL:NSTL是国家科技图书文献中心的简称,它是根据国务院领导的批示于2000年6月12日组建的一个虚拟的科技文献信息服务机构,成员单位包括中国科学院文献情报中心、工程技术图书馆(中国科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院、中国化工信息中心)、中国农业科学院图书馆、中国医学科学院图书馆。网上共建单位包括中国标准化研究院和中国计量科学研究院。中心设办公室,负责科技文献信息资源共建共享工作的组织、协调与管理。 21.百科全书:百科全书是全面系统的介绍文化科学知识,收集各种专门名词、术语,按词典形式编排,解说详细的大型参考工具书。 它汇总了各学科或某一学科的知识,提供人类有关知识领域的基本事实、基本概念和基本理论。百科全书由众多专家撰稿、编审,故有较高的权威性。 简答 1.电子图书有哪些特点? 存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名著)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使用,可无失真地重复使用)。 2.对搜索引擎的选择与比较主要从哪些方面考虑? 收录范围(索引库中内容的数量、地域范围、语言种类、资源类型、资源的深度和广度)、分类(分类方式是否合理多样、类名是否规范、分类的广度与深度是否合适)、检索功能与效果(是否包含浏览检索和关键词检索功能、是否支持布尔检索、截词检索等高级检索功能、是否有检索帮助和提示功能、检索结果和查全率、查准率及响应时间)、结果处理(结果的排序方式是否多样、是否有去重功能、能否按照用户反馈动态调整和显示检索结果)、页面组织(页面组织是否清晰、类目设置是否合理、界面是否友好)、其他功能与服务(能否满足用户多方面的信息需求)、用户评价(是否有用户评价及统计功能)。 2.1搜索引擎有哪些类型? 搜索引擎按信息搜集方式分:有目录式搜索引擎和机器人搜索引擎;按照信息组织方式分:有网络资源指南与关键词搜索引擎;按学科范围与资源种类分,有综合性搜索引擎和专门性搜索引擎;按照功能和是否有自建索引库分,有独立搜索引擎和元搜索引擎。

信息检索与利用复习资料

信息检索与利用习题 一、判断题(正确的打√,错误的打×) 1.最佳参考资源(Outstanding Reference Sources)由英国CILIP负责评选。× 2.最佳免费参考网站(Best Free Reference Web Sites)由美国RUSA负责评 选。√ 3.《工具书指南》(Guide to Reference Books)是一种综合性的工具书评介工 具。√ 4.《工具书指南》(Guide to Reference Books)已经有100多年的出版历史。 √ 5.国外习惯于把书目划分为两大类型:列举式书目(enumerative bibliography)和分析书目(analytical bibliography)。√ 6.注释书目提供简单的作者、题名、出版日期和出版地等信息。× 7.列举式书目对每一个书目做简短的介绍或评价性的注解,对参考源的相关性、准确性和质量做出判断。× 8.大部分国家书目都不收录国外出版的关于本国的出版物。× 9.国家书目应该由专门的国家机构负责编纂,这样的机构一般设在国家图书 馆。√ 10.《中国国家书目》收录1911—1949年间我国出版的中文图书。× https://www.360docs.net/doc/e15737498.html,由Bowker公司出版。√ 12.WebPAC(Web-based Public Access Catalog)或IPAC(Internet Public Access Catalog)被称为是第二代OPAC。× 13.联合目录能够让我们检索到收藏馆地址。√ 14.查找某一学术会议的主办单位的检索工具是书目。× 15.学位论文索引提供的检索入口包括论文的导师。√ 16.Walford’s Guide to Reference Material被称为是参考工作的“圣经”。× 17.The New Walford开始收录网络资源,包括免费资源和收费资源。√ 18.登记书目的主要表现形式是国家书目。√ 19.网络书店具有书目信息功能。√

武汉大学信息检索答案整理

一、最常用搜索会议论文的数据库?如何搜索最有影响期刊数据库? 1、会议论文数据库 (1)CALIS的会议论文数据库 CALIS会议论文数据库收录来自于“211工程”的61所重点学校每年主持的国际会议的论文,目前该数据库正在建设中。 (2)万方学术会议论文数据库 万方数据资源系统会议论文数据库收录国家一级协会、二级协会、二级以下协会、一级会议、二级会议、二级以下会议、国家重点实验室、研究会和其它机构主办的学术会议,涉及哲学、宗教、社会科学等20大类。 (3)CNKI中国重要会议论文全文数据库 中国知网的中国重要会议论文全文数据库收录我国2000年以来国家二级以上学会、协会、高等院校、科研机构、学术机构等单位的论文集。 (4)NSTL的中外文会议论文库 国家科技图书文献中心NSTL的会议数据库包括了中文会议论文数据库和外文会议论文数据库。。 (5)OCLC FirstSearch会议论文与会议录索引 OCLC First中的国际学术会议论文索引库包括在世界范围的各种会议、座谈会、博览会、研讨会、专业会、学术报告会上发表的论文的索引,收录了自1993年以来在不列颠图书馆文献提供中心(BLDSC)的会议录上收集到的已出版的论文,并通过馆际互借获取全文。(6)ISI会议论文集引文索引 ISI会议论文集引文索引包括自然科学版和社会科学与人文科学版,收录1996年以来世界上最著名的会议、座谈会、研讨会、专题讨论会及其它各种会议中发表的会议录论文及其引文信息,分别取代原来的科技会议录索引和社会科学与人文会议录索引,其覆盖的学科范围非常广泛,是目前世界上了解会议文献信息最主要的检索工具。 2、 二、个人文献管理软件的主要功能? 个人文献信息管理系统可以帮助读者处理个人所汇集的各种书目信息,主要功能包括建立并维护个人文献资料库,使用者在输入文献信息后,可以按纪录中有内容的字段进行检索,如利用关键词、作者、标题等字段进行布尔逻辑检索。它还包含有一般管理系统的功能,如排序、增删纪录等。这种个人研究领域的文献资料库,无论在撰写研究报告时的参考引用、查阅文献纪录的书目资料或者为学生开列参考书目时都很方便。 目前市场上可以提供给读者使用的个人文献信息管理软件的基本功能大同小异,主要有以下一些功能: (1) 批次输入信息资料:系统提供了各种资料库的检索结果直接转入系统的功能。用户可以将不同数据库的检索结果直接转入系统,成为格式一致的资料信息。 (2) 检索查询功能:文献信息输入后,可按不同的字段进行检索,例如用author, title, journal, keyword ,subject 等进行布尔逻辑组配检索,并可作排序或增删纪录等。该功能有效帮助读者写研究报告查阅文献纪录 (3) 查重:当用户陆续汇集许多资料后,系统可以自动查重,并允许将重复的纪录删除。 三、三大检索的中英全称,应用 (1)《科学引文索引》(Science Citation Index, SCI)是由美国科学信息研究所(ISI)1961年创办出版的引文数据库,其覆盖生命科学、临床医学、物理化学、农业、生物、兽医学、工程技术等方面的综合性检索刊物,尤其能反映自然科学研究的学术水平,是目前国际上三大检索系统中最著名的一种.

相关文档
最新文档