文献检索第三章

文献检索第三章
文献检索第三章

第三章计算机信息检索

计算机信息检索的发展

计算机检索主要经历了以下四个阶段(1)脱机检索阶段(1954-1964年)早期应用系统,利用单台计算机,以磁带作为存储介质,进行的批量或定题检索。已基本淘汰。脱机检索(Offline Retrieval),即批处理检索,1946年世界上第一台电子计算机问世后,20世纪50年代初就有人开始研究其在信息检索领域的应用。1954年,美国海军武器实验站图书馆在一台电子管计算机上建立了世界上第一个计算机检索系统。(2)联机检索阶段(20世纪60年代-80年代)进入20世纪60年代,计算机检索进入了实用和全面发展阶段。20世纪60年代末,数据通讯网络出现,大容量计算机分时系统和强功能检索软件研制成功,使脱机检索发展到联机检索并迅速得到了推广。20世纪70-80年代,联机检索得到迅速发展,一些联机检索系统开始向公众提供商业性服务,如DIALOG、ESA、ORBIT、BRS等许多世界著名的联机检索系统相继投入商业性运营。

联机检索的优缺点:直接利用国内外大量规范化得专业数据库进行信息检索,迅速地查到相关信息。有较高的查全率和查准率,但联机费用较高,而且需要熟练地检索技能。(3)光盘检索阶段 1983年,出现了一种新的存储器,CD-ROM光盘。光盘检索具有储量极大而体积微小,要求设备简单,可随地安装,使用方便、易于操作,检索费用低(不需要昂贵的联机检索通讯费用),具有可随时修改检索策略而具有很高的查全率和查准率等优点,因而至今仍被世界各地广泛应用。(4)网络化检索阶段进入20世纪90年代,随着卫星通讯、公共数据通讯、光缆通讯技术以及信息高速公路事业在全世界的迅猛发展,计算机情报检索走向了全球大联网。网上资源具有信息的时效性、内容的广泛性、访问的快速性、搜索的网络性和资源的动态性五大特点,那么要及时、准确、有效地获取与自身需求相关的实用信息,对所有网络用户都非常具有挑战性。

计算机信息检索原理计算机信息检索是指人们在计算机检索网络或终端上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需要的信息,然后再由终端设备显示和打印的过程。为实现这种信息检索,必须事先将大量的原始信息加工处理、存贮在各种信息载体上待用,所以计算机信息检索广义上讲包括信息的存贮和检索两个方面。

信息检索则是查询的过程。用户对检索课题加以分析,明确检索范围,弄清主题概念,然后用系统语言来表示主题概念,形成检索标识及检索策略,输入到计算机进行查找。这一查找的过程实际上是计算机自动比较匹配的过程,当检索标识、检索策略与数据库中的信息的特征标志及其逻辑组配关系相一致时,则属“检索命中”,即找到了符合要求的信息。检索结果可以联机或脱机打印输出。

信息存贮的过程就是将所选中的一次文献进行主题分析、标引和著录,按一定格式输入计算机,构成可供机读数据库记录及文献特征标识,这相当于编制手工检索用的文摘索引等检索工具。

数据库是计算机技术和文献信息检索技术相结合的产物,同时它又反作用于信息检索。它是文献信息检索系统必不可少的组成部分,是计算机信息检索系统的信息源和核心,也是现代信息资源管理的重要工具。所谓数据库,是计算机信息检索的重要组成部分。它是以二进制代码形式在计算机存贮设备上(如磁带、磁盘和光盘等)合理存放的相关数据的信息集合,通常由存贮信息记录及其索引的若干文档组成。

数据库类型根据数据库所含信息内容来分,可将数据库分为以下四种类型的数据库:文献型数据库数值型数据库词典型数据库全文型数据库

文献型数据库又叫书目型数据库,记录文档中主要存入的是原始文献的书目。包括原始文献的篇名、作者、文献出处、文摘、关键词,以及主要用于查询各种文献资料的书目性线索、文摘等。该数据库主要以文献或书目形式记录在存储介质上,其记录实体有期刊论文、图书、博士论文、技术报告及其他出版物。包括机读版的文摘、索引、目录等,它的作用是指引用户查找一次文献,文献出处是不可缺少的内容。用户可从大量文献记录中筛选出有参考价值的文献源,以获取一次文献。目前这类数据库占有很大的比例,其代表性的数据库有《Ei Compendex Plus》(工程索引)、《INSPEC》(科学文摘)和《中文期刊数据库》等

数值型数据库的记录包括各种调查数据或统计数据。它是一种以自然数值形式表示、计算机可读的数据集合,这些数据是从文献中分析、概括、提取出来,或以调研、观测及统计工作中直接获得的数据。数值型数据库主要用于查询各种有关的数字、参数、公式等。如:气象数据、地质资料、化学或物理化合物特性的文献数据、人口统计资料、市场调研数据等。

词典型数据库 (事实型)这类数据库的文献记录主要介绍一些有关公司、团体或名人的情况,供用户查询某一事物发生的时间、地点、过程或简要情况,或诸如化学物质名称、结构、俗称和化学物质登记号之类指南性信息,故又称之为指南型数据库。如:百科全书、手册、地图集、人名录、企事业名录、计算机程序、音乐等。《中国科学技术成果数据库》、《中国企业、公司及产品数据库》等等

全文型数据库这类数据库的文献记录存入了原始信息的正文。通过它可以直接检索出原始信息的全文,从而大大方便了用户,也提高了信息的有效利用。目前大多数的全文型数据库的记录都是图像扫描格式,阅读时需要专门的软件,大多可以通过软件转换成文本格式。目前全文数据库逐渐增加,如《人民日报全文数据库》、《中国学术期刊全文数据库》等。

数据库结构数据库主要由记录、字段、文档三个层次构成。一个数据库一般都有数以万计的信息记录,每条记录都有不同的字段组成,一组相关记录组成一个数据库文档。通常,数据库的文档由顺排文档和倒排文档组成。顺排文档:记录文档。按文摘号(文献记录存取号)顺序由小到大排列的二次文献文档结构,查找时按文献号顺序,检索结果的显示是由大到小排列。倒排文档:按数据库记录的检索标识(主题、著者等)的某种顺序排列起来的文档。

信息检索技术布尔逻辑检索截词检索位置检索限制检索加权检索

布尔逻辑检索 (Boolean Logical)是用布尔逻辑运算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。它是机检系统中最常用的一种检索方法。逻辑算符主要有:And/与、Or/或、Not/非,

逻辑“与”运算符为 And 或 * 。检索词A和检索词B用“与”组配,检索式为:A And B或者 A * B 它表示检出同时含有A、B两个检索词的记录。逻辑与检索能增强检索的专指性,使检索范围缩小。此算符适于连接有限定关系或交叉关系的词。逻辑“或”运算符为 Or 或 + 。检索词A和检索词B用“或”组配,检索式为:A Or B或者 A+B 它表示检出所有含有A 词或者B词的记录。逻辑或检索扩大了检索范围。此算符适于连接有同义关系或相关关系的词。

逻辑“非”运算符为 Not 或 - 。检索词A和检索词B用“非”组配,检索式为:A Not B或者 A - B 它表示检出含有A 词,但同时不含B词的记录。逻辑非和逻辑与运算的作用类似,可以缩小检索范围,增强检索的准确性。

注意事项:大多数计算机检索系统都支持布尔逻辑运算,但表现形式不尽相同,有的用AND、OR、NOT,有的用符号+、-、*来代替,还有的把运算符号直接隐含在菜单中,所以在检索中一定结合系统的实际情况选择。

信息检索技术-截词检索截词检索(Truncation)是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索。它可以起到扩大检索范围,提高查全率,减少检索词的输入量,节省检索时间,降低检索费用等作用。对于外文来讲,检索时,若遇到名词的单复数形式,词的不同拼写法,词的前缀或后缀变化时,均可采用此方法。按截断部位可分为右截断、左截断、中间截断、复合截断等;按截断长度分为有限截断和无限截断。1) 右截断:截去某个词的尾部,是词的前方一致比较,也称前方一致检索。例如:输入geolog?(?为截断符号),将会把含有geological、geologic、geologist、geologize、geology等词的记录检索出来。若输入PY=199?,会把90年代的记录全部查出来。

信息检索技术-截词检索

2) 左截断:截去某个词的前部,是词的后方一致比较,也称后方一致检索。例如:输入?magnetic 能够检出含有magnetic、electromagnetic、paramagnetic、thermo-magnetic等词的记录。

(3) 中间截断:截去某个词的中间部分,是词的两边一致比较,也称两边一致检索。例如:输入organi?ation可以检出organization、organisation;输入f??t可查出foot、feet。

(4)复合截断:是指同时采用两种以上的截断方式。例如?chemi?可以检出chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry等。

5) 有限截断:是指允许截去有限个字符。例如comput??? ?可检出compute、computer、computers、computing等词,不能检出computable、computation、computerize等词。注意:词干后面连续的数个问号是截断符,表示允许截去字符的个数,最后一个问号是终止符,它与截断符之间要有一个空格,输入时一定要注意。

无限截断:是指允许截去的字符数量不限,也称开放式截断。

上面右截断、左截断所举的例子均属此类型。

信息检索技术-位置检索

位置检索(Proximate)是在检索词之间使用位置算符(也称邻近算符Adjacent Operators),来规定算符两边的检索词出现在记录中的位置,从而获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录。

能够提高检索的准确性,当检索的概念要用词组表达,或者要求两个词在记录中位置相邻/相连时,可使用位置算符。

机检系统中常用的位置算符(按限制强度递增顺序排列)如下:(1)(f)算符Field:要求被连接的检索词出现在同一字段中,字段类型和词序均不限。例如 happiness(f)sadness and crying 2)(s)算符Sub-field/Sentence:要求被连接的检索词出现在同一句子(同一子字段)中,词序不限。例如 machine(s)plant(3)(n)算符near:(n)要求被连接的检索词必须紧密

相连,词之间除允许有空格、标点、连字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多可以夹N个词(N为自然数1、2、3…),且词序任意。例如:information(n)retrieval 可以检出 information retrieval 和 retrieval information,又如econom ?? ?(2n) recovery 可以检出economic recovery、recovery of the economy 、recovery from economic troubles(4)(w)算符With:(w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、标点、连字符外,不得夹单词或字母;(Nw)表示连接的两个词之间最多可夹入N个词(N为自然数),词序不得颠倒。例如input(w)output可检出input output而wear(1w)materials可检出wear materials、wear of materials采用位置算符检索时,通常最严谨的算符放在最左面,例如:european(w)economic(w)community(f)patio,又如redwood(3n)deck?(s)(swimming(w)pool?)注意:不同的机检系统,位置检索的功能及算符不同,应参看机检系统的说明,上述为DIALOG系统的位置算符。

信息检索技术-限制检索限制检索(Range)是通过限制检索范围,达到优化检索结果的方法。限制检索的方式有多种,例如进行字段检索、使用限制符、采用限制检索命令等。(1)字段检索:是把检索词限定在某个(些)字段中,如果记录的相应字段中含有输入的检索词则为命中记录,否则检不中。例如:查找微型机和个人计算机方面的文章。要求“微型机”一词出现在叙词字段、标题字段或文摘字段中,“个人计算机”一词出现在标题字段或文摘字段中,检索式可写为:microcomputer? ?/de,ti,ab OR personal computer/ti,ab又如查找wang wei写的文章,可以输入检索式:au=wang wei (2)使用限制符:用表示语种、文献类型、出版国家、出版年代等的字段标识符来限制检索范围。例如要查找1999年出版的英文或法文的微型机或个人计算机方面的期刊,则检索式为:(microcomputer? ?/de,ti,ab OR personal computer/ ti,ab)AND PY=1999 AND(LA=EN OR FR)AND DT=Serial3)使用范围符号:

如:Less than、Greater than、From to等,如查找1989~1999年的文献,可表示为:PY=1989:1999 或者 PY=1989 to PY=1999

又如查找2000年以来的计算机方面的文献,可表示为 computer? ? And Greater than 1999

查找在指定的文摘号范围内有关地震方面的文献,可表示为 earthquake?/635000-80000(4)使用限制指令:限制指令可以分为:一般限制指令(Limit,它对事先生成的检索集合进行限制)、全限制指令(Limit all,它是在输入检索式之前向系统发出的,它把检索的全过程限制在某些指定的字段内)。

例如:Limit S5/328000-560000 表示把先前生成的第5个检索集合限定在指定的文摘号内。又如:Limit all/de,ti 表示将后续检索限定在叙词和题名字段。

上述几种限制检索方法既可独立使用,也可以混合使用。

信息检索技术-加权检索

加权检索是指根据检索词对检索课题的重要程度,事先指定不同的权值。检索时,系统先查找这些检索词在数据库记录中是否存在,并对存在的检索词计算它们的权值总和;凡是在用户指定的临界值(称阈值)之上者作为命中记录被输出。阈值可视命中记录的多寡灵活地进行调整,阈值越高,命中记录越少。

3.5 计算机信息检索系统 VIP科技期刊数据库检索 CNKI<中国期刊全文数据库>检索

维普公司介绍

重庆维普资讯有限公司是科学技术部西南信息中心下属的一家大型的专业化数据公司 , 是中文期刊数据库建设事业的奠基人。自 1989 年以来 , 一直致力于期刊等信息资源的深层次开发和推广应用 , 集数据采集、数据加工、光盘制作发行和网上信息服务于一体;收录有中文期刊 12000 种 , 中文报纸 1000 种 , 外文期刊 4000 种 , 拥有固定客户 2000 余家,目前已成为推动我国数字图书馆建设的坚强支柱之一。其研究开发的《中国科技期刊数据库》是国内最大的综合性文献数据库,赢得了国内图书情报界的高度赞誉,同时成为国内各省市高校文献保障系统的重要组成部分

收录情况

收录年限:全文数据库包含了1989年以来的数据。

数据来源:自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等学科8000余种期刊刊载的660余万篇文献,并以每年100万篇的速度递增。

覆盖范围:按照《中国图书馆分类法》进行分类,所有文献被分为7个专辑:自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报。专辑又细分为27个专题。

使用情况1、快速检索在题名或关键词处输入“图书馆”,点击搜索选中“以人为本做好图书馆的管理与服务”,点击打

开。选择“全文下载”点击题目名选择“打开”、“保存”、“取消”。

检索式和复合检索:简单检索直接输入检索式

复合检索有两种方式:一是利用二次检索,一是直接输入复合检索式。

如:关键词输入“高校”,点击检索,出现检索结果。

输入“图书馆”,即会进行二次检索。2、传统检索

选择检索入口:关键词、作者、刊名、第一作者、机构、文摘、分类号、题名或关键词等。检索者根据自己的实际需求选择检索入口、输入检索式进行检索。

限定检索范围:学科类别限定、数据年限限定、期刊范围限定、同义词限定、同名作者限定。

检索式和复合检索:简单检索直接输入检索式。复合检索有两种方式:一是利用二次检索,一是直接输入复合检索式。

如:关键词输入“高校”,点击检索,出现检索结果。

输入“图书馆”,即会进行二次检索

3、分类检索点击分类检索如“选文化和艺术类”

在题名和关键词处输入相应的内容。如“图书编辑”点击搜索。

4、高级检索

点击“高级检索”,进入高级检索页面。高级检索可以严格对检索条件进行限制,最大限度地提高“检准率”,其中标题/关键词、刊名、分类号、作者、第一作者、机构、文摘可以“或、与、非“组合,从而更精确地定位所需资源,确保一次检索就能最大限度地找到相关资源。

高级检索中的“逻辑”选项均可以“或、与、非”组合查询,检索者可以填写一处或几处关键词来缩小检索范围。

扩展功能:①查看同义词:比如检索者输入关键词“土豆”,单击“查看同义词”,即可检索出“土豆”的同义词:“春马铃薯”、“马铃薯”、“洋芋”,对此,建议检索者全选,以扩大搜索范围。②同名/合著作者:比如检索者可以输入“张三”,单击“同名/合著作者”,即可列表形式显示不同单位的同名作者,检索者可以选择作者单位来限制同名作者范围。③查看分类表:检索者可以直接单击按钮,会弹出“查看分类表”,同分类检索。④查看相关机构:比如检索者可以输入“中华医学会”,单击“查看相关机构”,即可显示以“中华医学会”为主办(管)机构的所属期刊社列表。

扩展检索条件:检索者可以根据需要,以时间条件、专业限制、期刊范围进一步限制范围。

CNKI简介

中国知识基础设施工程(China National Knowledge Infrastructure,CNKI)于1999年6月正式启动。它的数据库有:中国期刊网全文数据库(CDJ);中国优秀博士硕士论文全文数据库(CDMD)、中国重要报纸全文数据库(CCND)、中国基础教育知识仓库(中学版)(CFED)、中国基础教育知识仓库(小学版)(CFED)、中国医院知识仓库、中国重要会议论文全文数据库、中国企业知识仓库、问答与导学、信息技术与课程整合、中国期刊题录数据库(免费)、中国专利数据库(免费)。

截至目前为止CNKI工程已完成的主要项目有:CNKI源数据库建设项目、中国期刊全文数据库(CJFD)、中国优秀博士、硕士学位论文全文数据库(CDMD)、中国重要会议论文全文数据库(CPCD)、中国重要报纸全文数据库(CCND)。

CNKI<中国期刊全文数据库>检索

《中国期刊全文数据库(CJFD)》是目前世界上最大的连续动态更新的中国期刊全文数据库,截止2004年年底已积累全文文献1200多万篇,题录1500余万条,分九大专辑,126个专题文献数据库。

知识来源:国内公开出版的6600种核心期刊与专业特色期刊的全文。

覆盖范围:理工A(数理化天地生)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学等。

产品形式:WEB版(网上包库)、镜像站版、光盘版、流量计费。

收录年限:1979年至今,部分期刊为创刊至今

更新频率:CNKI中心网站及数据库交换服务中心每日更新,各镜像站点通过互联网或卫星传送数据可实现每日更新,专辑光盘每月更新。

进入图书馆主页(https://www.360docs.net/doc/b814532605.html,)打开电子资源菜单,选择”CNKI数据库”

(1)初级检索:能快速方便地检索信息,适用于不熟悉多条件组合的用户查询。对于一些简单查询,可使用这种检索方式。

①选择检索年代、检索途径、检索词或词组。②二次检索:若第一次检索得到的结果太多,可以对其进行优化。就是在初次

检索结果的基础上,在右侧上部窗口的检索框中选择在结果中检索,输入新的检索词,并单击“检索”便可得到进一步的检索结果。如:检索1999-2008年,关键词为“文献检索”,得到 9630 篇文献。缩小范围,选中“在结果中检索”,输入“专利”,得到 506 篇文献。

(2)高级检索:利用高级检索系统能进行快速有效的组合查询,优点是查询结果,命中率高,对于复杂的查询,可使用这种检索方式。如:查找“人事档案管理方面的弊端”的文章

输入篇名包含“人事档案”,关键词包含“弊端”的文章

3)专业检索。可检索字段:主题,题名(篇名),关键词,摘要,作者,第一责任人(第一作者),机构(单位),中文刊名&英文刊名(刊名),引文(参考文献),全文,年,期,基金,分类号(中图分类号),ISSN,CN(统一刊号) 例如:查出含有“计算机”、“网络”、“计算机网络”关键词的文献。

当输入关键词为“计算机”时,共有记录277504条

当输入关键词为“计算机+网络”时,则检出篇名中含有“计算机”或“网络”之一的文献,共有记录683739条。

究竟采用何种方式检索,完全取决于检索者所设定的文献范围。

第三章思考题

1、计算机检索经历了那四个阶段?

2、计算机信息检索原理是什么?

3、根据数据库所含信息内容来分,可将数据库分为几种类型的数据库?各是什么?

4、学会使用VIP科技期刊数据库和CNKI<中国期刊全文数据库>进行检索。

1)、检索出作者为“李雪峰”的文献。

2)、检索出单位为“青岛科技大学”的文献。

写出检索步骤。

教育研究方法[第三章教育文献检索]山东大学期末考试知识点复习

第三章教育文献检索 (一)教育文献概述 1.教育文献的含义 文献是科学研究的基础。所谓文献是指记录有知识的一切载体,包括各种手稿、书籍、报刊、文物、影片、磁带、磁盘、幻灯片、胶片等。教育文献就是记载有关教育科学的情报信息和知识的载体,其随着人类社会的发展而日益丰富,表现方式也日益多样,教育文献的数量与质量是一个国家或地区教育科学发展水平的重要标志。 2.教育文献在教育研究中的作用 (1)帮助研究者选定研究课题、确定研究方向。通过文献的检索和阅读,可以了解该领域前人或他人的主要研究成果、研究的重点、使用的方法、积累的经验和存在的问题。 (2)提供科学的论证依据和研究方法。查阅文献的过程就是一个总结过去相关研究工作的过程,通过查阅文献,有利于建构研究的概念或理论框架、提出收集和分析资料的方法、把握在研究中需要注意的问题等等。 (3)避免重复劳动、提高科学研究的效益。查阅文献可以使研究者充分占有相关材料,了解相关信息,区分已经完成和需要完成的研究,从而避免重做前人已经解决了的问题,也就提高科学研究的效益。 (二)教育文献的种类及主要分布 1.教育文献的等级 根据加工程度的不同,教育文献可分为三种等级,即一次文献、二次文献、三次文献: (1)一次文献。一次文献指作者以本人的时间为依据而形成的原始文献,直接记录了时间经过、研究成果、新的知识或技术的文献,具有原创性和很高的参

考借鉴价值,其主要包括调查报告、档案材料、有关的研究论文或专著等。 (2)二次文献。二次文献指对原始文献加工整理、使之系统化的检索性文献,主要包括书目、题录、索引、提要和文摘等。二次文献具有报告性、汇编性和简明性,为一次文献的利用提供一项便捷通道,使查找一次文献所花费的时间大大减少。 (3)三次文献。三次文献指在利用二次文献基础上对特定范围内的一次文献进行广泛的深入的分析研究之后综合集中而成的参考性文献,包括专题述评、动态总数、进展报告、数据手册、年度百科大全以及专题研究报告等,具有综合性、浓缩性和参考性的特点。从一次文献、二次文献到三次文献,是一个由分散到集中,由无序到有序,由博而精的对知识信息进行不同层次的加工的过程。一次文献是最基本的信息源,是文献信息检索和利用的主要对象。二次文献是一次文献的集中提炼和有序化,它是文献信息检索的工具。三次文献是把分散的一次文献、二次文献,按照专题或知识的门类进行综合分析加工而成的成果,是高度浓缩的文献信息,它既是文献信息检索和利用的对象,又可作为检索文献信息的工具。 2.教育文献的主要分布 (1)书籍 书籍是教育文献中种类最多、数量最大、跨越年代久远的一种信息载体,主要包括以下几种类型: 名著要籍,是指一个时代、一个学科或一个流派最有影响的著作,如马克思主义经典作家教育论著,古今中外著名教育家、哲学家的教育著作等。 教育专著,是就教育领域某一学科、某一专门问题进行系统、全面、深入论述的著作,教育专著中论述了作者自己的独到见解,论述系统,形式规范,包含了新颖的材料,通常反映学术研究的最新进展。 教科书、教学参考书,是指提供给各级各类学校师生在教学中使用和参考的图书,如政府颁行的正式教材、教师规定的必读资料等。

专业文献检索第三章课件

第三章文献信息检索基本原理及方法 3.1.1 文献信息检索的基本含义 一、文献信息检索的基本含义 检索”即“查找”之意。信息检索,是将信息按照一定的方式组织、存储起来,并针对用户的需要查找所需信息的过程。因此信息检索包含了信息的存储和检索两个不可分的部分。我们通常所说的信息检索是指狭义的信息检索,即从检索工具和检索系统中查找所需信息的过程及其所采取的一系列方法和策略。 3.1.2 文献信息检索的类型 按检索手段:(1)手工检索:依靠手工操作来完成检索过程,所用文献一般是以纸张为载体。 (2机械检索:主要是指利用计算机进行文献信息检索,也称作计算机信息检索,所用的文献多以非纸张为载体, 手工检索和计算机检索的关系:手检是基础,机检是发展方向。 信息检索发展历史:信息检索作为一门技能,其历史可以追溯到图书目录和文摘、索引产生的时代。19世纪30年代——手工检索逐渐成熟,以印刷型文献为检索对象。最近50年——计算机信息检索。 手工检索阶段:公元前26年,我国第一步综合性的书目检索工具《七略》问世,它是以当时诸子百家的学术分类思想为基础,以汉代天禄阁的藏书为对象,按“部次甲乙”来组织文献典籍,这也是世界上第一部书本式的文献检索工具。近现代,利用图书馆馆藏书目工具为读者提供查找图书、期刊或事实信息。如卡片目录。还有各种书本式的目录、文摘、索引等检索工具。 手工检索阶段的主要特点是: ?遵循既定的标引规则来著录各项的内容; ?以印刷型文献(如图书、期刊、会议、专利、标准、学位论文等)为主要检索对象; ?以各类文摘、题录和目录性工具书为主要的检索工具; ?检索方法简单、灵活; ?检索策略便于修改,检索过程可及时发现问题,及时修改和补充; ?检索效率比较低,费时费力,且查全率较低; ?进行复杂问题的多途径检索时,需要反复查找许多检索工具; ?用户主要是专业技术研究人员。 3.1.2 文献信息检索的类型 按检索要求划分: 相关性检索——是系统不直接回答用户所提出的技术问题本身,而是只提供与之相关的文献供用户参考。 确定性检索——是以数据或事实为检索对象,系统要直接问答用户提出的技术问题,即直接提供用户需要的确切的数据或事实。 文献信息检索的类型 根据检索对象划分 ●书目检索:是以文献线索为检索对象的文献检索,即检索检索系统存储的是以二次文献为对象(目录、索引、文摘) 的信息,他们是文献信息的外部特征与内容特征的描述集合体,信息用户通过检索,获取的是原文的“替代物”。用户通过检索获得的是与检索课题有关的一系列文献线索,然后再通过阅读决定取舍。 ●全文检索:是以文献所含的全部信息作为检索内容的文献检索,即检索系统提供的是整篇文章或整部图书的全部内 容,检索时可以查找到原文以及有关的句、段、接、章等文字,并可进行各种频率统计和内容分析。全文检索主要

文献检索期末复习完整版

第一章绪论 1.文献检索(information retrieval)是指收集整理文献并按一定方式组织和存储,同时根据用户的信息需求查找出相关信息的过程,又称为“文献存储与检索”。狭义的文献检索是指根据用户信息需求,利用检索工具或检索系统从文献信息集合里找出用户所需文献的过程。 2.文献检索语言是根据文献检索需要而人工规范的语言系统,用来描述文献特征和表达信息检索提问的一种专用语言,供信息标引以及文献检索时使用。 3.文献指以文字、图像、公式、声频、视频、代码等手段将信息、知识记录或描述在一定的物质载体上,并能起到存贮和传播信息情报和知识作用的一切载体。三个基本要素:内容上的知识或信息;揭示和表达知识信息的标识符号;记录信息符号的物质载体。 4. 信息素养 又称为信息素质,是伴随着社会信息化的形成和发展而出现的一个名词术语,指具有检索、分析、评价和利用各种信息源以解决信息需求及制定明智决策的能力,是对个人信息行为能力、独立学习能力以及批判性思维能力等概括性描述。 第二章医学文献信息资源 1.按文献内容的加工深度和内容性质划分 一次文献、二次文献、三次文献、零次文献 (1)零次文献零次文献指未经正式发表或未进入正式交流的最原始的文献。(2)一次文献是指作者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作,如专著、期刊论文、科技报告、学位论文等。(3)二次文献是将大量无序分散的一次文献收集、整理、加工、著录其特征(如著者、篇名、分类、主题、出处等),并按一定的顺序加以编排,形成供读者检索所需一次文献线索的新的文献形式,如索引、文摘、目录以及其相应的数据库等。因其具有检索功能而称为检索工具或检索系统。 (4)三次文献是科技人员围绕某一专题,借助二次文献,在充分研究与利用大量一次文献的基础上,经过阅读、分析、归纳、概括,撰写而成的新的文献。

第三章网络信息检索工具

第三章网络信息检索工具 【知识框架】 信息检索的一般流程 网络经贸信息资源的概念与类型 网络资源查询方法及检索工具 ?按检索机制分: 目录型(Subject directory, catalogue) 索引型:搜索引擎(Search Engine) 混合型(Hybrid tools) ?按检索内容分: 综合型 专题型 特殊型 ?按包含检索工具数量分: 单一型(Singular search tools) 集合型(Collective search tools):元搜索引擎 (Metasearch Engine或Megasearch Engine 目录型检索工具(Subject directory catalogue) 搜索引擎(Search Engine) ?单一搜索引擎 ?集成搜索引擎 检索工具的工具——指南类检索工具和元搜索引擎 ?(一)网络资源指南(Resource Guide) 也称学科门户SIG ?(二)元搜索引擎 集合式搜索引擎、索引式搜索引擎 ?(三)手工检索工具的“工具书指南”、网址簿 网络版参考咨询工具(Reference Tools) 智能搜索代理和搜索软件 补充教材第二章: 检索工具与语言 检索策略 【主要内容】 1、信息资源检索的一般流程 分析问题

?问题分类 ?分析已知和欲知信息 ?分析需求主题 ?广泛利用文献 ?选择检索范围 选择检索工具 ?熟悉各种检索工具 从检索工具中查找所需信息 获取原文 2、网络信息资源的概念和类型 1)按传输方式分: ●WWW ●FTP ●Usenet/Newsgroup ●LISTSERV/Mailing List ●Telnet ●Gopher ●WAIS 2)按内容加工 一次加工信息 ?网上图书、期刊、报纸、专利、政府出版物、会议资料等 二次加工信息 ?文摘索引数据库、搜索引擎、网站导航等 三次加工信息 ?百科全书、手册指南等参考型网站 3)格式与后缀 3、网络检索工具的分类 按检索机制分: ?目录型(Subject directory, catalogue) ?索引型:搜索引擎(Search Engine) ?混合型(Hybrid tools) 按包含检索工具数量分: ?单一型(Singular search tools) ?集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine 4、目录型检索工具(Subject directory catalogue) 1)网络资源目录 这是一种独立型检索工具,网站自身包含可检索的数据库。网络资源目录又称网站目录、分类站点目录、专题目录或主题指南、站点导航系统、主题词典型检索工具等。这是一种将网络资源搜集后,按某种分类法进行组织整理,并和检索法集成在一起的信息检索方式。 特点:

科技文献检索第三章习题及答案

第三、五章上机实习题目1.本馆数字资源有哪些?请分类列举出来(截图)。答:本图书馆的资源如下图所示:

2.列出《中图法》22个基本大类。“写作、修辞”在分类法中如何 表示,是几级类目,并以树形结构列出其上级和下级类目。 答:这个是大类本来还有个物资经济在分类法中的你所说的树形结构,是三级类,。一级类是F经济,二级类是F2经济计划与管理,三级类是F25物资经济。 F经济F2经济计划与管理 F25物资经济 F250物资经济理论 F251物资管F252物资流通F253物资企业经营与管理F259世界各国物资经济 写作、修辞分类应该是在语言文学类中,是二级内容。

3.哪个网站可以查询国家承认的各类高等教育学历证书。包括研究生、普通本专科、成人本专科、网络教育、高等教育自学考试以及高等教育学历文凭考试等? 答:中国高等教育学生信息网可以查询,如下图所示: 4.中华人民共和国人力资源和社会保障部的门户网站是什么? 答:是https://www.360docs.net/doc/b814532605.html,/ 如下图所示

5.什么是检索策略,它的基本环节有哪些?制定检索策略需注意哪些问题? 答:计算机信息检索,实质上由计算机将输入的检索策略与系统中存贮的文献特征标识及其逻辑组配关系进行类比、匹配的过程。由于信息需求本身具有不确定性,加之对数据库中的文献特征标识不能充分了解,以及系统功能的某些限制,都会不同程度地影响检索效果。但是只要遵循一定的检索步骤,制定良好的检索策略,便可以减少各种不利因素的影响,尽可能地使检索提问标识与信息需求和检索系统保持良好的一致性,从而在系统中检索出满足用户需求的信。 1.检索步骤 (1)弄清信息需求,明确检索目的 (2)选择数据库,确定检索途径 (3)确定课题的概念组面和检索标识 应该注意的问题:

文献检索第三章

第三章计算机信息检索 计算机信息检索的发展 计算机检索主要经历了以下四个阶段(1)脱机检索阶段(1954-1964年)早期应用系统,利用单台计算机,以磁带作为存储介质,进行的批量或定题检索。已基本淘汰。脱机检索(Offline Retrieval),即批处理检索,1946年世界上第一台电子计算机问世后,20世纪50年代初就有人开始研究其在信息检索领域的应用。1954年,美国海军武器实验站图书馆在一台电子管计算机上建立了世界上第一个计算机检索系统。(2)联机检索阶段(20世纪60年代-80年代)进入20世纪60年代,计算机检索进入了实用和全面发展阶段。20世纪60年代末,数据通讯网络出现,大容量计算机分时系统和强功能检索软件研制成功,使脱机检索发展到联机检索并迅速得到了推广。20世纪70-80年代,联机检索得到迅速发展,一些联机检索系统开始向公众提供商业性服务,如DIALOG、ESA、ORBIT、BRS等许多世界著名的联机检索系统相继投入商业性运营。 联机检索的优缺点:直接利用国内外大量规范化得专业数据库进行信息检索,迅速地查到相关信息。有较高的查全率和查准率,但联机费用较高,而且需要熟练地检索技能。(3)光盘检索阶段 1983年,出现了一种新的存储器,CD-ROM光盘。光盘检索具有储量极大而体积微小,要求设备简单,可随地安装,使用方便、易于操作,检索费用低(不需要昂贵的联机检索通讯费用),具有可随时修改检索策略而具有很高的查全率和查准率等优点,因而至今仍被世界各地广泛应用。(4)网络化检索阶段进入20世纪90年代,随着卫星通讯、公共数据通讯、光缆通讯技术以及信息高速公路事业在全世界的迅猛发展,计算机情报检索走向了全球大联网。网上资源具有信息的时效性、内容的广泛性、访问的快速性、搜索的网络性和资源的动态性五大特点,那么要及时、准确、有效地获取与自身需求相关的实用信息,对所有网络用户都非常具有挑战性。 计算机信息检索原理计算机信息检索是指人们在计算机检索网络或终端上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需要的信息,然后再由终端设备显示和打印的过程。为实现这种信息检索,必须事先将大量的原始信息加工处理、存贮在各种信息载体上待用,所以计算机信息检索广义上讲包括信息的存贮和检索两个方面。 信息检索则是查询的过程。用户对检索课题加以分析,明确检索范围,弄清主题概念,然后用系统语言来表示主题概念,形成检索标识及检索策略,输入到计算机进行查找。这一查找的过程实际上是计算机自动比较匹配的过程,当检索标识、检索策略与数据库中的信息的特征标志及其逻辑组配关系相一致时,则属“检索命中”,即找到了符合要求的信息。检索结果可以联机或脱机打印输出。 信息存贮的过程就是将所选中的一次文献进行主题分析、标引和著录,按一定格式输入计算机,构成可供机读数据库记录及文献特征标识,这相当于编制手工检索用的文摘索引等检索工具。 数据库是计算机技术和文献信息检索技术相结合的产物,同时它又反作用于信息检索。它是文献信息检索系统必不可少的组成部分,是计算机信息检索系统的信息源和核心,也是现代信息资源管理的重要工具。所谓数据库,是计算机信息检索的重要组成部分。它是以二进制代码形式在计算机存贮设备上(如磁带、磁盘和光盘等)合理存放的相关数据的信息集合,通常由存贮信息记录及其索引的若干文档组成。 数据库类型根据数据库所含信息内容来分,可将数据库分为以下四种类型的数据库:文献型数据库数值型数据库词典型数据库全文型数据库 文献型数据库又叫书目型数据库,记录文档中主要存入的是原始文献的书目。包括原始文献的篇名、作者、文献出处、文摘、关键词,以及主要用于查询各种文献资料的书目性线索、文摘等。该数据库主要以文献或书目形式记录在存储介质上,其记录实体有期刊论文、图书、博士论文、技术报告及其他出版物。包括机读版的文摘、索引、目录等,它的作用是指引用户查找一次文献,文献出处是不可缺少的内容。用户可从大量文献记录中筛选出有参考价值的文献源,以获取一次文献。目前这类数据库占有很大的比例,其代表性的数据库有《Ei Compendex Plus》(工程索引)、《INSPEC》(科学文摘)和《中文期刊数据库》等 数值型数据库的记录包括各种调查数据或统计数据。它是一种以自然数值形式表示、计算机可读的数据集合,这些数据是从文献中分析、概括、提取出来,或以调研、观测及统计工作中直接获得的数据。数值型数据库主要用于查询各种有关的数字、参数、公式等。如:气象数据、地质资料、化学或物理化合物特性的文献数据、人口统计资料、市场调研数据等。 词典型数据库 (事实型)这类数据库的文献记录主要介绍一些有关公司、团体或名人的情况,供用户查询某一事物发生的时间、地点、过程或简要情况,或诸如化学物质名称、结构、俗称和化学物质登记号之类指南性信息,故又称之为指南型数据库。如:百科全书、手册、地图集、人名录、企事业名录、计算机程序、音乐等。《中国科学技术成果数据库》、《中国企业、公司及产品数据库》等等

第三章 文献检索

第三章文献检索(文献的搜集与整理) 主要内容 ●第一节文献检索概述 ●第二节教育文献的种类及主要分布 ●第三节文献检索的过程和方法 ●第四节查阅检索程序 ●第五节文献综述的撰写 一、教育科学文献及其检索的基本涵义 1、文献 文献,指记录有知识的一切载体,即以载体形式传递知识。文献是记载人类知识的最重要手段,是传递交流研究成果的重要渠道和形式。文献作为一种主要情报源和信息源,是进行教育科研的重要部分。 ●文献一词,最早见于《论语》,朱熹注:“文,典籍也;献,贤也。”古人以“文”为典籍记录,“献”就是贤者及其学识。后来发展为专指著述。文献,是把人类的知识用文字、图形、符号、音像等手段记录下来的有价值的典籍,包括各种手稿、书籍、报刊、文物、影片、录音录像、磁带、幻灯片及缩微胶片等。 2、文献检索 ●文献检索是从文献中迅速准确地查找出所需情报的一种方法和程序。 二、文献检索在教育研究中的作用

●从文献中我们要看出什么 1.这个领域已经做了哪些事情,各种变量之间业已存在什么样的关系,哪些研究已经完成,哪些研究还要继续,从而确定自己研究的课题和限制,找到起点和研究应解决的重点。 2.在本领域内已有哪些相关工作,注意学习先前研究所采用的方法手段,探索作者如何分类、探索和解释事实及其关系,提供对研究有益的思路、方法或修改意见。 3.为进一步研究提供背景和基础,为解释研究结果提供背景材料,把握在研究中可能出现的差错,对研究方案提出一些适当的修改意见,以避免预想不到的困难。 文献是进行科学研究的基础,它贯穿科学研究的全过程,从选题,初步调查以及论证课题,制定计划,搜集整理和分析研究资料到形成研究报告,都离不开有关课题文献的检查和利用。 ●1、全面正确地掌握所要研究问题的情况,帮助研究人员选定研究课题和确定研究方向 ●只有了解了有关研究的动态(what?re they doing? What?s be done?),才能选定最有价值又最值得研究的前沿课题,才能发现前人研究问题所涉及的范围。 ●2、为教育研究提供科学的论证依据和研究方法 ●3、避免重复劳动,提高科学研究的效益 第二节教育文献的种类及主要分布 ●一、文献的三种等级 ●根据加工程度的不同,文献可分为三种等级: ●1、一次文献 ●包括专著、论文、调查报告、档案资料等以作者本人的实践为依据而创作的原始文献,是直接记录事件经过、研究成果、新知识、新技术的文献,具有创造性,有很高的直接参考和借鉴使用价值,但它储存分散,不够系统。 ●2、二次文献

相关文档
最新文档