全文型文献数据库的评价标准

全文型文献数据库的评价标准

全文型文献数据库的评价标准

郁笑春胡芒谷

内容提要本文在对全文型文献数据库的新特点进行阐述的基础上,强调对全文型文献数据库的评价标准必须坚持科学性、整体性、可行性、动态性和针对性的原则,定义了评价标准的4个要素,即内容、界面设计、检索功能和可获得性,并展开了详细讨论和分析。

关键词全文;文献数据库;特点;评价标准

全文型文献数据库是当前图书馆和情报所对外提供文献服务的重要文献资源,具有集成度高、信息量大而全、可获得性强等特点。在国内,万方、维普、清华同方、书生和超星等机构都有自己成熟的全文型文献数据库产品;在国外,Elisever、EBSCO、Blackwell等公司也有各自的全文型文献数据库对外提供服务。本文拟在阐述当前全文文献数据库新的特点的基础上,对全文型文献数据库的评价标准进行讨论和分析。

1 全文型文献数据库的新特点

全文型文献数据库经过多年的发展和完善,在现阶段呈现了以下新特点:

(1)强大的检索性能,检索结果处理多样化

全文型文献数据库已不是简单意义上提供关键词检索和外部特征字段检索并提供全文即完成任务的传统数据库。事实上,随着其检索入口和手段的不断丰富,各类索引技术(包括基于形态的字索引技术、基于语义的词索引技术、基于内容的主题索引技术完全匹配的高效串索引技术以及字词混合索引技术)的开发,全面提高了全文型文献数据库的检索速度、查准率和查全率,检索功能不断加强。如EBSCO的图片检索、索引词检索和引文检索,清华同方期刊全文数据库的引文检

索,维普全文数据库的同义词词典等,均大大加强了全文型文献数据库的检索功能。同时,许多数据库在检索结果的显示方式上灵活多样,更加人性化,主要表现为:显示记录数的限定;排序方式的多样化,可按相关度、出版时间、文献标题、著者、来源、语言、出版国等多种方式升序或降序排列:显示格式的多样化,可提供题录、题录+文摘、全记录或选择字段等多种格式显示。

(2)类型多,收录文献全,数据库质量高

如Elsevier收录的270种医学类期刊中,有171种被SCI收录,20种被SSCI收录;部分期刊从创始年开始收录,回溯检索与印刷型期刊同步发行与更新;数据标准、规范、多元,都支持IE、Netseape 等通用浏览器,且支持功能强,数据更新及时,大多为日更新:网络型期刊通常使用PDF格式文档的标准阅读器Acrobat Reader等。许多全文型数据库提供了多种形式的链接,用户通过检索不但能看到全文,也为读者提供了其他服务线索。

(3)用户界面友好方便,易于理解,便于使用

数据库的用户界面设计通常直观清晰、图文并茂,如不同的文献类型用不同的图形符号表示。数据库往往设有专门的功能帮助键,帮助信息详略适当、清晰,便于查阅。

(4)增加了个性化服务内容

任何文献用户都有其特殊的文献需求,越来越多的全文型文献数据库开始为用户提供强大的个性化服务内容。例如,EBSCO的host文件夹就是一个强大的个性化服务工具,其功能包括保存结果列表(Resuh List Items)、网络链接保存(Persistent Links to Searches)、检索历史保存与定制提醒(savedSearches/Search Alerts)、期刊提醒(Journal Alerts)、资料整理网页(Web Pages)等。

2 全文型文献数据库的评价原则

对于用户和图书情报机构来说,如何选择全文型文献数据库,对于相同类型的全文型文献数据库如何进行评价和选择,是一个很重要

也很现实的问题。一般来说需遵循以下原则:

(1)科学性原则

全文型文献数据库既是网络资源,也是科技文献的一种。要求指标的定义、计算方法等应符合网络资源评价分析和一般文献评价的基本理论,在考虑应用的同时需要与此相互协调。

(2)整体性原则

建立数据库评价指标体系是一项系统性的工作,应该使评价指标全面反映评价对象多方面的主要特性。因此,评价指标体系应体现主客观相结合、定性与定量相结合的特点。整体性原则还要求各指标间相互独立,指标间的相关性,不仅增加了评价工作量,而且直接影响评价的有效性和可靠性,使评价结果出现偏向性。因此,在建立指标体系时要考虑各指标反映的信息是否与其他指标存在重叠,并尽量减少这种相关性。

(3)可行性原则

评价指标应力求简便、实用、指标涵义明确,数据便于获取。同时,数据在时间和空间上要具有可比性。

(4)动态性原则

指标应能够反映系统动态变化的特点,即反映全文型文献数据库内容变更、软件升级、软件服务变化等动态特性。

(5)针对性原则

指标体系应该符合读者使用需求的特点。表征全文型文献数据库的指标很多,如果选取的指标太多,一方面难以突出影响数据库品质的主要因素,另一方面太多的指标也增加了指标间相关的可能性。同时,评价体系以满足文献用户的一段时间的特定需求为目的,没有必要采用太多的指标。

3 全文型文献数据库的评价要素

根据以上评价标准设定的原则,综合分析国内外诸多全文型文献数据库,我们认为,可由内容、界面设计、检索功能和可获得性4个

要素作为全文型文献数据库的评价标准。

3.1 内容(Content)

内容代表了一个数据库的真正价值,内容的质量又可由权威性、覆盖面和收录时间3个方面来体现。

(1)权威性(Authority)

全文型文献数据库的权威性体现在出版者、审查制度和收录文献3个方面。例如,ScienceDirect是Elisever公司出版的全文型文献数据库,该公司是国际知名的科学和工程技术文献提供商,历史悠久,并且在业内享有很高的声誉和口碑,用户普遍有认同感,该数据库收录的文献都是特定专业领域的高质量论文,有非常严格的审查制度,保障了数据库的权威性。

(2)覆盖范围(Coverage)

覆盖范围包含覆盖内容和覆盖时间两个方面的含义。全文型文献数据库根据覆盖内容和领域分为综合性和专业性两类全文型文献数据库,如ScienceDirect是世界上最大的科学、技术和医学文献数据库,而Emerald则是管理学和图书馆学情报学专业类数据库,其建设目标都是给文献用户一个彻底的全文解决方案,因此数据库覆盖本文原文的广度、提供内容的多少等是至关重要的:对于时间上的覆盖范围来说,文献数字化的浪潮出现在上世纪90年代末和本世纪初,文献全文数字化程度与其加工能力有很大提高,因此全文型文献数据库收录文章一般都是从上世纪90年代开始的,这也是我们判断全文型文献数据库好坏的重要依据。

(3)时间性(Timeline)

全文型文献数据库与纸质型文献相比在出版上要滞后一个时间差,这个时间差如果过长,读者就会转而去查阅纸质型文献或者其他数据库产品。随着读者需求的进一步提高,许多数据库生产商正在努力减少甚至消除这种时间差,有的数据库产品与纸质型文献做到了零时差,有的数据库生产商能够提供预印本期刊全文,有效地消除了时间差。

3.2 界面设计(Interface De-sign)

因为读者对数据的浏览和检索都要通过人机界面来实现,优秀的

人机界面会对用户起到良好的引导作用,而不好的人机界面常常会有误导、出错等情况产生,因此界面的设计也是评价数据库系统的重要指标。有的数据库系统界面除了有很多类信息外,还提供了很多使用工具和选择项,但同时也产生了负面影响,就是界面过于纷乱复杂;而有些数据库界面就比较简洁直观,读者也比较容易上手,类似于搜索引擎的Google和Baidu。因此,特定需求下的一些功能和界面的设计是非常有用的,比如清华同方的“知网节”为读者提供了单篇文章的关联线索,包含了单篇文献的题录摘要以及该文献各种扩展信息的入口汇集点,这些扩展信息通过概念相关、事实相关等方法揭示知识间的关联,达到知识扩展的目的,帮助实现知识获取和知识发现,也为读者二次检索提供了方便;SeienceDirect有一个“主题页面”的界面(subjeet Homepage),对用户使用数据库提供了记忆功能,可以记忆用户使用系统的路径,避免了老用户对使用路径的多次反复操作,而且作为国际文献提供商,还提供了多种非英语语言的支持。

3.3 检索功能(Search Func—tionality)

首先,优秀的全文型文献数据库可以提供读者适用的检索工具,包括检索语句、下拉菜单等,检索功能的优劣要靠系统响应速度、使用灵活性以及读者对人机交互能力的控制上来判断。同时,强大的浏览功能也是必不可少的,因为许多读者的需求要用检索和浏览交替进行来实现。

其次,系统提供的下载速度和功能也很重要,下载速度过慢会导致读者心理焦虑和信心丧失,对数据库评价降低。HTML文本格式下载速度较快,消耗系统资源也较少;相反,PDF格式的文本需要更多的下载时间,但是它更能完整地反映文本的原貌,所以系统使用何种文本格式对系统的检索功能构成影响。

3.4 可获得性(Accessiblity)

数据库产品目前有单机版和网络版之分,网络版的数据库可通过局域网进行共享,产品可获得性较好;单机版数据库只能在一台计算机上使用,共享性差。除此之外,数据库还应配有FAQ和HELP等性质的文档供用户学习借鉴,用户可以方便地进入和使用数据库,有的

数据库系统还专门为图书馆员配备了专门HELP系统,可以帮助他们更好地开展参考服务。

综上所述,在全文型文献数据库不断发展和完善的今天,用户对全文型文献数据库提出了更新的要求,如何选择高质量又符合用户需求的文献数据库产品,对于文献用户特别是图书情报机构愈发显得重要,我们希望本文的论述能对他们的工作和实践产生一定的帮助。同时要指出的是,很少有全文型文献数据库产品都做得近乎完美无缺的,最重要的是它们在满足用户需求方面做得如何。

原载:《中国信息导报》2007年第1期

文献检索

主流中文全文数据库包括:维普中文期刊全文数据库、万方医药全文数据库和中国期刊全文数据库。3、目前认为图片检索功能最强的两个搜索引擎是Google和DOGPILE 。4、PubMed收录医学文献的范围,除Medline 记录外,还包括Premedline 记录、以及出版商直接提供的其他记录;其中用于规范主题词用法的词表是Mesh。5、Genbank、EBML、DDBJ三大国际核酸序列数据库,这三个数据库每天都交换数据。6、《Web of SCI》是SCI、SSCI、A&HCI的网络版,是ISI公司基于Internet环境下的新产品。1、目前Internet上的生物信息学数据库种类按其功能属性可以分为基因组数据库、核酸和蛋白质一级结构序列数据库、生物大分子(主要是蛋白质)三维空间结构数据库以及以上述三类数据库和文献资料为基础构建的二次数据库四大类。2、SCI的检索方法(功能)有基本检索、作者姓名检索、被引作者和被引文献检索、作者地址检索、刊名全称检索、复合检索等。3、science online反映当前自然科学各领域研究动态和成果的综合性杂志,刊载论文、报告、评论、简讯、新闻和书评。1997年国家自然科学基金委和美国《科学》周刊达成协议,获得了《科学在线》在我国的网上发行权,成为中国在世界上唯一的读者不需要订阅印刷版便可免费获其网络版全文的杂志。4、生物医学信息学是一门有关处理生物医学(和人类健康)相关的信息、数据以及如何解决问题和作出决定的科学。5、检索过程中的主题分析的基本要素主要可以分解为分析课题内容实质;析出误假主题概念所表征的真实概念;出主要概念,排除无关概念和复杂概念;析出被隐匿的主题概念;用主题概念宽泛而检索意义不大的主题词。6、MeSH由字母顺序表、树状结构表、副主题词表及当年新增词4个部分组成。7、PubMed的检索功能主要有:逻辑组配检索、自动转化提问词、截词检索、作者姓名自动截词检索、有摘要或全文记录检索、字段检索8、中国生物医学文献光盘数据库(CBMdisc)收录内容涉及基础医学、临床医学、预防医学、药学、中医学及中药学等生物医学的各个领域,其检索途径有:基本检索、主题词检索、索引词检索,其他辅助性检索,包括分类检索和期刊检索。1、生物医学信息资源按载体形态可以分为印刷型资源、缩微型资源、视听型资源、数字化资源,其中印刷型资源和数字化资源是目前生物医学领域的两大主流信息资源。5、信息检索的通用技术主要包括基本布尔逻辑组配、截词技术、限定技术等。1、常用的布尔逻辑组配运算为AND、OR、NOT。4、Web of science的检索功能有论文被收录情况检索、论文被引用情况检索、溯源检索、最新进展与延伸检索、拓展检索。5、特种文献的主要类型有:专利、标准、科技报告、会议文献、学位论文1、ISBN 的含义是国际标准书号,其有10位数字组成。2、特种文献又称为非书非刊资料,主要有科技报告、会议文献、标准文献、专利文献、学位论文、政府出版物等。3、Science online(科学在线)在中国成为世界上惟一的读者不需要订阅印刷版便可以免费获得其网络版全文的杂志,《科学在线》包括了美国《科学》、《科学此刻》、《科学后浪》、《科学知识环境》7、NCBI开发的引物设计工具,可以用来查找目的DNA片段中的STS标记物的工具是E-PCR8、BA/RRM基于INTERNET 的网络版数据库的名称是BIOSIS Preview1、循证医学的英文全称是Evidence Based Medicine。5、Medline共包括三种主要索引:Index Medicus 、Index to Dental Literature 、International Nursing Index 。7、查到文献线索后,获取原文的途径有:查找全文数据库、向收藏单位请求复印、向作者本人索取、向出版发行单位请求帮助、请求馆际互借。十大情报源中的科技图书、括科技图书、科技期刊和专利文献被视为科技文献的三大支柱。2、全世界每年出版的科技报告约有70万件,主要有美国政府的四大报告,即PB(美国政府出版局)报告、AD(美国武装部队技术情报服务)报告、NASA(美国国家宇航局)报告、AEC(美国原子能委员会)报告。3、CBMdisc主要有基本检索_、主题检索_、索引词_、分类词检索_和刊名检索_五个检索入口。4、MEDLINE包括Index Medicus(医学索引)、Index to Dental Literature(牙科文献索引)和__International Nursing Index(国际护理学索引)_。5、MEDLINE的检索入口词有Search(基本检索)、Index(索引词检索)和Theasaurus(主题词检索)。6、在PubMed中的特殊功能栏内有Limits(条件限定)、Previews/Index(预览/索引)、History (检索史)、Clipboard(粘帖板)和Details(检索策略查询按钮。)1、循证医学的英文全称是Evidence Based Medicine。 4、我国学术界通常以SCI、EI和ISTP等三大检索系统中的数据作为学术产出的评价依据。 生物医学信息学定义为:生物医学信息学是一门有关处理生物医学(和人类健康)相关的信息,数据以及如何解决问题和作出决定的学科,它几乎涉及生物医学学科的所有基础和应用领域,并与现代信息技术尤其是计算机和通讯技术紧密结合。生物医学信息资源按载体形态可分为印刷型资源、缩微型资源、视听型资源、数字化资源。其中印刷型和数字型资源是目前生物医学领域的两大主流信息资源。核心期刊是指在某学科领域中所载该学科文献量大、质量高,足以代表该学科现有水平和发展方向,实际被引用率、文摘率和利用率较高的那部分期刊。特种文献又称非书非刊资料,包括图书、期刊以外的其他出版物,常为不定期出版物,多数具有连续性。特种文献收集渠道多通过交换和检索办法获得。特点是数量大、种类多、内容广、参考价值大。标准文献是技术标准、技术规格、和技术规则等文献的总称。所谓综述文献是对前人已经发表论文的综合性述评或分析,是经过精选、整理、加工后提炼的研究精华,情报密度大,专业人员可据此花较少精力获取较多有效信息。与生物医学相关的大型电子图书服务系统:NetLibrary(https://www.360docs.net/doc/c119079540.html,)、Ebrary(https://www.360docs.net/doc/c119079540.html,)、wiley(https://www.360docs.net/doc/c119079540.html,/bookfinder.html)、springer(http://link.springer.de/link/service/series)大型电子期刊数据库:academic press电子期刊,John Wiley电子期刊,EBSCO电子期刊,BioMed central电子期刊,LWW电子期刊。5个免费电子期刊网络:freemedicaljourmals,Highwire 免费期刊,Directory of Electronic Health Sciences Journals(DEHSJ),Biovisa,Science Online,“好医生”网站。重要生物医学综合网站:National Center for biotechnology information NCBI,National Institute of Health (NIH),Food and Drug Administration(FDA)美国食品与药品管理局,Center for Disease and Prevention (CDC)美国疾病控制与防治中心,National Center Library of Medicine(NLM),中国医学生物信息网导航,中国国家科技图书文献中心,上海复旦大学医学导航系统。 National Center for biotechnology information NCBI,美国国家生物技术信息中心。包括的数据库有核酸序列数据库,蛋白质序列数据库,全基因组数据库,大分子结构数据库,PopSet数据库,在线孟德尔人类遗传学数据库,PubMed数据库。National Institute of Health (NIH)是世界一流的生物医学研究中心,网上信息资源及其丰富,其中的Clinical Trials 包括4000多项临床试验研究信息。SRS英国EBI的序列检索系统。MeSH词是受控词表。PubMed是美国国立医学图书馆(NLM)下属的美国国家生物技术信息中心(NCBI)于1997年5月推出的web检索软件。PubMed可检索的数据库实际上是由许多期刊出版商参与共建的MEDLINE数据库的扩充版,包括MEDLINE记录,PreMEDLINE记录(未完成MeSH标记的最新记录),以及出版商直接提供的其他记录(record supplied by publisher)。CA(Chemical Abstracts,美国《化学文摘》),是世界最大的化学文摘库,也是目前世界上应用最广泛和最为重要的化学、化工及相关学科的检索工具。

中国期刊全文数据库

中国期刊全文数据库 中国期刊全文数据库 国内公开出版的6100种核心期刊与专业特色期刊的全文。 覆盖范围:理工A、理工B、理工C、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学。 收录年限:1994年至今,6100种全文期刊的数据完整性达到98%。 产品形式:《中国期刊全文数据库》、《中国学术期刊》、《中国期刊专题全文数据库光盘版》。1994-2000的专题全文数据库已出版"合订本",每个专题库1-2张DVD光盘。 更新频率:CNKI中心网站及数据库交换服务中心每日更新,各镜像站点通过互联网或卫星传送数据可实现每日更新,专辑光盘每月更新,专题光盘年度更新。 收录期刊名录:中国期刊全文数据库收录期刊名录 XXX数据库特点 ● 海量数据的高度整合,集题录、文摘、全文文献信息于一体,实现一站式文献信息检索; ● 参照国内外通行的知识分类体系组织知识内容,数据库具有知识分类导航功能; ● 设有包括全文检索在内的众多检索入口,用户可以通过某个检索入口进行初级检索,也可以运用布尔算符等灵活组织检索提问式进行高级检索;

● 具有引文连接功能,除了可以构建成相关的知识网络外,还可用于个人、机构、论文、期刊等方面的计量与评价; ● 全文信息完全的数字化,通过下载的最先进的浏览器,可实现期刊论文原始版面结构与样式不失真的显示与打印; ● 数据库内的每篇论文都获得清晰的电子出版授权; ● 多样化的产品形式,及时的数据更新,可满足不同类型、不同行业、不同规模用户个性化的信息需求; ● 遍布全国和海外的数据库交换服务中心,配上常年的用户培训与高效的技术支持。 XXX数据库应用 CJFD除了可用于信息检索、信息咨询、原文传递等常规服务外,还可以用于以下一些专项服务: ● 引文服务,生成引文检索报告; ● 查新服务,生成查新检索报告; ● 期刊评价,生成期刊评价检索报告; ● 科研能力评价,生成科研能力评价检索报告; ● 项目背景分析,生成项目背景分析检索报告; ● 定题服务,生成CNKI快讯。 XXX相关问题解答 1. 问:为什么说CJFD是完整意义上的全文数据库? 答:文献数据库一般分成书目数据库和全文数据库两类。在历史发展的进程中,一些书目数据库也开始收录文献全文。当收录的全文量达到一定的比例时,该数据库便归入全文数据库的范畴。另外,有些数据库虽然从建库一开始收录的就是全文文献,但采用的是图像形

医学文献检索与利用教学大纲

《医学文献检索与利用》教学大纲 课程名称:医学文献检索 课程类别:专业方向课 学时数:20 一、课程教学目的 本课程是一门以医学文献检索工具利用为主线,以电子与网络文献信息、数据库与Internet上医学文献信息的检索为重点,系统介绍医学文献信息的类型、特点、文献检索的基本知识、各类文献信息检索工具及其利用方法,旨在培养学生了解医学文献的特点,熟悉文献检索的基本方法,基本掌握获取和利用文献信息的能力。使学生了解医学文献基本知识、文献检索的基本知识,熟悉并掌握各种医学及相关学科专业文献检索工具、数据库的特点和检索方法,以及网络医学资源的分布及利用方法,培养医学生的信息素养。 专科生的信息需求相对较少,教学以培养学生如何利用图书馆和文献基础知识为主,旨在培养学生自学能力,目的是让学生对了解医学文献基本概况和基本的检索方法。 二、课时分配 课时分配表 授课内容理论教学时数 第一章医学文献概论 6 第二章文献检索概论 4 第三章中文检索工具 4 第四章 Pubmed 2 第五章全文数据库检索 2 第六章网上医学信息检索 2 学时合计 20 三、课程内容及教学要求 第一章医学文献概论 [教学目的] 1.了解文献类型、特点及社会作用,使学生能够掌握不同类型文献的作用。 2.掌握文献类型及其组织方式、不同文献在科学研究中的作用。 [讲授内容]: 1.信息、知识、情报、文献的概念; 2.文献类型及其作用:按载体类型、加工深度、文献编辑出版方式等划分。重点介绍科技图书、期刊以及特种文献的特点、作用;医学工具书的类型与应用; 3.医学文献现状与特点,文献在科研与医疗服务中的作用; 4.文献组织方式:主要介绍分类方法与主题法; 5.图书馆利用基础知识; 6.全文获取方法。 [教学方法] 课堂讲授 第二章文献检索概论 [教学目的] 1.了解文献检索的目的与意义;

文献质量评价标准

文献质量评价标准 在进行文献质量评价时,需要考虑多个因素,包括研究的原创性、科学性、实用性、可行性、可重复性、广泛性、研究方法的准确性、研究结果的可靠性、研究结论的稳定性以及影响力等。 1.研究的原创性:评价研究是否具有新的思想、新的观点或者新的方法,是否为相关领域的研究提供了新的见解和知识。 2.研究的科学性:评价研究是否基于科学的方法和原则,是否采用了合适的研究设计、数据采集和分析方法,是否得出了合理的结论。 3.研究的实用性:评价研究是否针对实际应用场景,是否能解决实际问题,是否能对实践产生积极的影响。 4.研究的可行性:评价研究是否具有可操作性,研究过程是否合理、可行,是否能得到预期的研究结果。 5.研究的可重复性:评价研究是否具有可重复性,其他研究者是否能根据研究方法和过程重复实验并得出相同的结果。 6.研究的广泛性:评价研究是否具有广泛的应用前景,是否能应用于多个领域或多个情境中。 7.研究方法的准确性:评价研究方法是否准确、可靠,是否能准确地得出研究结论。 8.研究结果的可靠性:评价研究结果是否可靠、稳定,是否能经受住时间的考验。 9.研究结论的稳定性:评价研究结论是否稳定、可靠,是否受到其他因素的影响。

10.研究的影响力:评价研究结果对社会、经济、技术等方面的影响力,是否能引起广泛的关注和讨论。 在进行文献质量评价时,需要对以上因素进行综合评估。同时,还需要注意以下几点: 1.重视研究的创新性和实用性。原创性的研究往往能推动学科的发展,而实用性的研究则能解决实际问题。 2.注意研究的可重复性和广泛性。可重复性的研究能增加研究的可信度,广泛性的研究则能扩大研究的影响力。 3.关注研究方法的准确性和研究结果的可靠性。准确的研究方法和可靠的研究结果能提高研究的价值。 4.评估研究结论的稳定性和影响力。稳定的结论和广泛的影响力能表明研究的价值和社会效益。 5.避免片面强调某个因素而忽视其他因素。全面的评估才能得出准确的文献质量评价。 6.注意比较不同文献之间的差异和优劣。通过比较,可以更好地评估文献的质量和价值。 7.重视同行评议的作用。同行评议可以提供专业的意见和建议,帮助评估文献的质量和研究水平。 总的来说,在进行文献质量评价时,需要全面考虑多个因素,并重视创新性、实用性和可靠性等方面。同时,还需要注意评估过程的客观性和准确性,以保证文献质量评价的公正和合理。

全文数据库的优缺点

全文数据库集文献检索与全文提供于一体,是近年来发展较快和前景看好的一类数据库。目前的中文全文数据库有:中国期刊全文数据库(清华同方)、中文科技期刊数据库(维普)、万方系统的数字化期刊全文数据库(万方)。 三种全文数据库共同优点 1、免去了检索书目数据库后还得费力去获取原文的麻烦。 2、多数全文数据库提供全文字段检索,这有助于文献的查全。 3、三个库都可以进行简单检索、二次检索、高级检索等,检索策略都可以编辑、保存。 共同的缺点 1、阅读全文数据库中的全文,计算机内必须安装有全文浏览器。 2、通用的全文格式较少,主要有PDF格式和HTML格式。 各类全文数据库的优缺点: 1、从期刊种类收录情况来看,清华同方收录期刊为8712种,其中核心期刊1750多种;万方收录5928种,核心期刊2374种;维普收录12000余种,核心期刊1810种。维普收录期刊总数最多,其中包括了具有一定影响且连续性的非正式发行刊物。三个数据库对核心期刊的收录均沿用了自身设定的遴选标准,因此无法作出绝对的判断。但从以上三大数据库对核心期刊收录量分别占期刊总数的百分比来看,清华同方占20.1%、维普占15.1%,万方占40.0%。2007年以来医学中华系列杂志由万方独家发行,这样万方数据库在收录核心期刊中占有绝对优势。 2、从收录全文篇数来看(截止日期为2007年年底),清华同方收录期刊全文文献6196125条,维普收录期刊文献12514411条,万方数字化期刊收录期刊文献约800万条,维普收录期刊全文文献最多,特别是在学科交叉中体现较为明显,例如以中药葛根为关键词,时间限定在2003年~2007年,维普检索是2744条,清华同方是2315条,万方数据库是2061条,数据相差的原因是葛根不仅仅在医药专辑中能查到,在农林专辑中也可以查到。 3、从学科覆盖范围来看,清华同方和维普都涵盖了文理工农医全部学科的内容,而万方学科覆盖范围在人文科学方面要稍显不足。 4、从检索字段来看,清华同方提供的检索字段最多,其次是维普,而万方只提供了最基本的检索字段。清华同方除了提供一些必需的检索字段,还提供了诸如参考文献,全文,智能检索,基金,中图分类号,ISSN等字段可以更方便更准确地检索到所需的文章。 5、从对检索结果的处理方式来看,万方对于检索结果的处理方式更为全面周到,尤其是对检索结果的排序,在三个库中是最全面的。 6、从检索导航功能来看,三个库中,清华同方的导航途径最多,有多种导航系统,检索查询更为方便自如,而万方和维普各只有三种导航系统。 7、关于引文的查询,清华同方和万方都有专门的引文库,维普也能进行引文查询。 8、从能否进行检索范围限定来看,维普可进行范围限制的功能最全面,其次是清华同方,而万方不可进行范围限制。 9、从语言界面看,清华同方和万方有简体中文,繁体中文,英文三种,适应不同语言的检索人员使用,检索的更多更广。维普只有简体中文一种语言界面。 10、清华同方实现了对CNKI各源数据库统一分类导航,新的导航统一为10大专辑,168个专题数据库,期刊、学位论文、会议论文、报纸四种载体在统一导航的机制下,进行事实上的整合,实现跨库检索功能。学校图书馆还可以向清华同方公司申请到50个漫游用户,使用漫游帐号,读者可不受IP地址限制,在校园网外同样可以检索学校订购该数据库资源和下载文章。这样更方便了家住校外及出差外地的老师同样也能使用CNKI数据库资源,真正体会到无距

国内三大中文期刊全文数据库的比较

中国期刊网全文数据库》、《维普中文科技期刊数据库》和《万方数据库资源系统数字化期刊》是国内影响力和利用率很高的综合性中文电子期刊全文数据库,这三个数据库已经成为大多数高等院校、公共图书馆和科研机构文献信息保障系统的重要组成部分。在互联网中,这三大数据库也成为中文学术信息的重要代表,体现了我国现有的中文电子文献数据库的建设水平。 笔者结合工作和学习中的实践,就上述三大数据库的收录情况、检索功能、检索结果、检索界面、用户服务等方面进行全面的比较,并通过检索实践举例进行比较分析,以供参考。 1 收录情况(数据较早,甚至不是2004年的数据,感觉更像2002年左右的数据,后面将尽可能给出最新的数据值。) 收录范围与数量 《中国期刊网全文数据库》(本文中简称“清华”)是由清华同方光盘股份有限公司、光盘国家工程研究中心和中国学术期刊(光盘版)电子杂志社共同研制出版的综合性全文数据库。该数据库收录自从1994年来公开出版发行的6600余种国内核心期刊和一些具有专业特色的中英文期刊全文,累积全文文献618万多篇,题录1500万余条,按学科分为理工A(数理科学)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学九大类,126个专题文献数据库。 《中文科技期刊数据库》(本文中简称“维普”)由科技部西南信息中心主办,重庆维普资讯有限公司制作。其前身为《中文科技期刊篇名数据库》。该数据库收录了自1989年以来国内出版发行的12000种期刊,其中全文收录8000余种,按学科分为经济管理、教育科学、图书情报、自然科学、农业科学、医药卫生、工程技术等7大类,27个专辑,200个专题,按《中图法》编制了树型分类导航和刊名导航系统,基本覆盖了国内公开出版的具有学术价值的期刊,同时还收录了中国港台地区出版的108种学术期刊,积累700余万篇全文文献,数据量以每年100万篇的速度递增。 《万方数据资源系统数字化期刊》(本文中简称“万方”)是万方数据库资源系统三大组成部分之一,由中国科技信息研究所属下的北京万方数据股份有限公司创办。万方期刊收录了我国自然科学的大量期刊以及社会科学的部分期刊,范围包括基础科学、医药卫生、农业科学、工业技术、人文科学等5大类,以及英文版期刊、中国科学系列杂志,共2500多种期刊。期刊收录情况

全文型文献数据库的评价标准

全文型文献数据库的评价标准 全文型文献数据库的评价标准 郁笑春胡芒谷 内容提要本文在对全文型文献数据库的新特点进行阐述的基础上,强调对全文型文献数据库的评价标准必须坚持科学性、整体性、可行性、动态性和针对性的原则,定义了评价标准的4个要素,即内容、界面设计、检索功能和可获得性,并展开了详细讨论和分析。 关键词全文;文献数据库;特点;评价标准 全文型文献数据库是当前图书馆和情报所对外提供文献服务的重要文献资源,具有集成度高、信息量大而全、可获得性强等特点。在国内,万方、维普、清华同方、书生和超星等机构都有自己成熟的全文型文献数据库产品;在国外,Elisever、EBSCO、Blackwell等公司也有各自的全文型文献数据库对外提供服务。本文拟在阐述当前全文文献数据库新的特点的基础上,对全文型文献数据库的评价标准进行讨论和分析。 1 全文型文献数据库的新特点 全文型文献数据库经过多年的发展和完善,在现阶段呈现了以下新特点: (1)强大的检索性能,检索结果处理多样化 全文型文献数据库已不是简单意义上提供关键词检索和外部特征字段检索并提供全文即完成任务的传统数据库。事实上,随着其检索入口和手段的不断丰富,各类索引技术(包括基于形态的字索引技术、基于语义的词索引技术、基于内容的主题索引技术完全匹配的高效串索引技术以及字词混合索引技术)的开发,全面提高了全文型文献数据库的检索速度、查准率和查全率,检索功能不断加强。如EBSCO的图片检索、索引词检索和引文检索,清华同方期刊全文数据库的引文检

索,维普全文数据库的同义词词典等,均大大加强了全文型文献数据库的检索功能。同时,许多数据库在检索结果的显示方式上灵活多样,更加人性化,主要表现为:显示记录数的限定;排序方式的多样化,可按相关度、出版时间、文献标题、著者、来源、语言、出版国等多种方式升序或降序排列:显示格式的多样化,可提供题录、题录+文摘、全记录或选择字段等多种格式显示。 (2)类型多,收录文献全,数据库质量高 如Elsevier收录的270种医学类期刊中,有171种被SCI收录,20种被SSCI收录;部分期刊从创始年开始收录,回溯检索与印刷型期刊同步发行与更新;数据标准、规范、多元,都支持IE、Netseape 等通用浏览器,且支持功能强,数据更新及时,大多为日更新:网络型期刊通常使用PDF格式文档的标准阅读器Acrobat Reader等。许多全文型数据库提供了多种形式的链接,用户通过检索不但能看到全文,也为读者提供了其他服务线索。 (3)用户界面友好方便,易于理解,便于使用 数据库的用户界面设计通常直观清晰、图文并茂,如不同的文献类型用不同的图形符号表示。数据库往往设有专门的功能帮助键,帮助信息详略适当、清晰,便于查阅。 (4)增加了个性化服务内容 任何文献用户都有其特殊的文献需求,越来越多的全文型文献数据库开始为用户提供强大的个性化服务内容。例如,EBSCO的host文件夹就是一个强大的个性化服务工具,其功能包括保存结果列表(Resuh List Items)、网络链接保存(Persistent Links to Searches)、检索历史保存与定制提醒(savedSearches/Search Alerts)、期刊提醒(Journal Alerts)、资料整理网页(Web Pages)等。 2 全文型文献数据库的评价原则 对于用户和图书情报机构来说,如何选择全文型文献数据库,对于相同类型的全文型文献数据库如何进行评价和选择,是一个很重要

文献检索基础知识

信息 信息的特征:普遍性与客观性、真伪性、可知性、共享性、时效性、价值性、依存性、传递性。 信息、知识、情报、文献的相互关系 信息:物质的属性、规律、运行状态、存在标志等 知识:从无序到有序,有序化过程,人脑加工过的自然和社会信息,学习、劳动等实践活动。 情报:具有特定利用价值的动态知识,知识性、有用性、动态性 文献:记录有知识和信息的物理载体,通常表现为出版物,知识内容、符号、物理载体,书籍、期刊、年鉴….. 信息资源:信息资源是人类在认识世界和改造世界过程中产生、整理和记录有用信息的集合 信息资源的类型 1、按载体形式划分:书写型、印刷型、缩微型、视听型、数字型 2、按出版形式划分:图书、期刊、会议文献、学位论文、专利文献、科技报告、标准文献、技术档案、产品资料、政府出版物(十大科技情报来源)

3、按加工深度划分:零次、一次、二次、三次文献 4、按信息源产生的时间顺序:先导信息源,即时信息源,滞后信息源。 5、按传播形式:口头信息源,文献信息源,实物信息源 零次文献 零次文献一般认为是形成一次文献之前的信息、知识、情报,即 未经信息加工,直接记录在载体上的原始信息,如实验数据、观测记录、调查材料、手稿、讲义、书信、笔记、记录、教学经验、口头交流、操作方法等等。 一次文献 定义:未经加工的原始文献 范畴:期刊论文、专利文献、技术标准、科技报告、会议论文、学位论文 特点:内容先进、成熟;叙述具体、详尽和系统;数量庞大分散 功能:学习参考的最基本文献类型,也是最主要的文献情报源,二次、三次文献产生的基础; 二次文献 定义:将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储,以便于检索和利用。范畴:题录、目录、书目、索引、文摘 特点:汇集性、工具性、综合性、系统性 功能:检索、通报、控制一次文献,用于查找一次文献的线索;

医学文献检索(重点)

医学文献检索(知识点汇总) 1、信息:物质的一种方式、形态或运动状态,是事物的一种普遍属性.一般指数据、消息中包 含的意义可以导致消息中所描述事件的不定性减少. 信息的基本属性:客观性、可知性、传递性 2。知识:是人们认识和改造客观世界的实践中所获得的认识和经验的总和。是人类通过对信息的感知、获取、选择、处理、加工等一系列思维过程,形成的对客观事物的本质和规律的认识. 3。情报:情报就是为了解决某一特定问题去收寻而来的所需要的知识,它激活了知识。 情报的三个基本属性:知识性、传递性、效用性. 4、文献:记录有知识的一切载体. 4。1、文献的类型 按照载体不同划分:印刷型、电子型、缩微型、视听型 按照出版方式不同可分为:图书、科技期刊、专利文献、会议文献、科技报告、国际机构和政府出版物、技术标准、产品资料、学位论文、技术档案. 4。2、文献的分级 按照揭示文献内容的深度不同,分为四个级别 一次文献(primary Literature)二次文献(secondary Literature) 三次文献(tertiary Literature)零次文献(zero—level Literature) 一次文献(primary Literature) 一次文献即原始文献、信息源,是以作者本人的工作经验、观察或实际科研成果为依据而创作的具有一定发明创造或一些新见解的文献.例如:期刊论文、学位论文、研究报告、专利文献等 特点:内容先进、成熟;叙述具体、详尽;数量庞大、分散 二次文献(secondary Literature) 二次文献是对一定范围、时间或类型的大量一次性文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。例如:书目、索引、文摘、数据库等检索工具 特点:汇集性、工具性、综合性、系统性 三次文献(tertiary Literature) 三次文献是在充分利用二次文献的基础上对一次文献做出的系统整理和概括的论述,并加以分析综合编写而成的概括性文献.例如综述、参考工具书、文献指南等 特点:内容的浓缩性、针对性,具有参考性和指引性

文献检索在环境科学工程中的应用两篇

第一篇: 文献检索在环境科学工程技术中的应用 摘要:环境科学工程技术是通过实验技能、工程实践、计算机应用、科学研究与工程设计方法等的基本训练,对当今环境质量进行研究和评估、对企业的环保工程进行革新改造,并进行环保新型产品的开发设计。其中,文献检索是环境科学工程技术进行调查,收集、整理资料,研究不可缺少的关键。 关键词:文献检索环境科学工程技术文献检索系统 环境科学是以环境的地理、物理、化学、生物四个部分为主要研究对象,它提供了综合、定量,和跨学科的方法来研究环境系统。由于大多数环境问题涉及人类活动,因此经济、法律和社会科学知识往往也可用于环境科学研究。一门研究人类社会发展活动与环境演化规律之间相互作用关系,寻求人类社会与环境协同演化、持续发展途径与方法的科学。环境科学工程技术中不乏需要人们文献检索来快速寻找答案。 1 文献检索的简介 | 文献检索的认识 文献检索,是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索”,这是广义的文献检索。狭义的文献检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。 文献检索能帮助人们快捷、准确、全面的获取所需知识,最大限度地节省查找时间,使我们的文献检索过程变得事半功倍,更是信息能够得到充分的利用。我们目前面临的是一个崭新的信息社会。信息技术迅速发展,信息高速公路的飞快建设,使得信息产品已经渗透到各个学科领域,信息的产出量呈指数级增长,信息技术已经成为人类认识世界和改造世界不可缺少的手段。在当今社会活动的人,几乎每天每时每刻都与信息打交道。可能我们已经感觉到有的人做事往往容易成功,而有些人则不易成功,这在很大程度上是因为前者有较强的信息意识,能够掌握较多的信息,对所做的事情能够做出正确的判断,因而他们的成功率也

文献检索系统及检索效率评价指标分析

文献检索系统及检索效率评价指标分析 李辉 【期刊名称】《《科技创业月刊》》 【年(卷),期】2012(000)012 【总页数】2页(P160-161) 【关键词】文献检索; 检索效率; 综合指标 【作者】李辉 【作者单位】黑龙江科技学院图书馆黑龙江哈尔滨150027 【正文语种】中文 【中图分类】G252.7 1 文献检索系统的类型 文献检索系统又叫文献情报检索系统,它是检索和提供文献线索、文献地址、文献目录、文献原文或文献复制件的一种常见的检索系统。它是一个使情报用户需要同文献情报源之间相互联系,包含有文献情报资源,具备一定的物质载体与设备,能够提供一定检索技术手段的有机整体。 在文献检索系统中,文献描述体数据库,就是文献检索工具。检索工具虽然是文献著录款目的集合,但它却包含了词表、索引等因素。它是一种有形的实体,总是同一定的载体设备相联系,它必然具备一定的检索手段和潜力,并且总是体现着一定的用途、对象和目标。实际上,检索工具就是检索系统的核心和概括。文献检索系

统的种类主要有:①书目检索系统。书目检索系统包括传统的文摘、索引和目录、机读目录、联机目录以及提供书目数据库查询服务的系统;②全文检索系统。全文检索系统包括传统的缩微检索系统、电子报刊、电子辞书以及能提供其它全文数据库查询服务的系统;③语段检索系统。以语段作为存贮和检索单元,介于文献检索与事实检索之间。 2 文献检索系统的构成 2.1 逻辑构成 一个完整的文献检索系统通常包括以下六个方面,即六个子系统: (1)文献选择子系统,即检索工具对一定学科范围文献的覆盖面,摘贮率,以及对文献类型、文种与时间跨度的包含程度。 (2)词表子系统,即作为文献的存贮与检索两个方面的用来表达文献内容与提问内容的共同依据,词表(包括主题词表和分类表等)的规模(网罗度)与细分程度(专指度),是影响检索工具查全与查准潜力的重要因素。 (3)标引子系统,即根据一定的词表,将文献的主题内容经过概念分析,而翻译(转换)成检索系统语言的词汇。这里,不仅决定文献描述的准确性和信息含量,而且引得深度、标引的一致性也是影响检索效率的因素。 (4)查寻子系统,即把情报用户的需求,经过概念分析,翻译(转换)成检索系统语言的词汇,并指出其逻辑关系的过程,具体来说,就是构造检索策略的过程。(5)用户与系统之间交互子系统,即通过同情报用户的商谈并收集反馈,弄清用户的真实情报需求,形成明确的检索概念,并将其准确地表述出来的过程。这是确定具体检索目标的过程,即决定检索的角度、深度、广度和时间、文种范围的关键一步,也是成功地制定检索策略、实施检索的前提。 (6)匹配子系统,即检索策略同文献索引中的有关标引记录相比较而决定其取舍的过程。情报检索的实质,就是文献特征同情报提问之间的“匹配”。匹配的各种

文献综述评价

文献综述评价 文献综述是在科学研究和学术研究中常见的研究方法。它是通过梳理大量学术资料,整合不同视角来评价学术研究的一种方式。文献综述是科学研究的基础,是科学发现的充分前提。它有助于提高研究成果的质量和效率,在学术研究中尤其重要,因此被广泛采用。 二、文献综述的重要性 文献综述是一种查阅、理解、汇编和总结已有文献的系统性过程。它帮助学者们更好的理解和掌握某一领域的研究现状和进展情况。文献综述能够帮助研究者梳理出学术研究的整体规律,发现解决问题的可行性途径,并给出合适的方案。文献综述有助于改进新的研究方向和方法,探索有助于解决问题的新思路和新技术。文献综述也有助于传播已有研究成果,促进科学技术的发展。 三、文献综述评价标准 文献综述评价有助于研究者确定学术研究的质量。评价标准主要包括内容完整性、文献可信度、文献价值和价值客观性等。文献综述评价的核心是内容覆盖度。内容覆盖度指的是文献综述篇幅内容的完整性。它牵涉到文献的搜索、筛选、分析、整合和总结等环节。文献的可信度指的是文献的真实性和可靠性,文献价值指的是文献的价值和对于学术研究的重要性,客观性指的是研究者在进行文献综述时,能够公正无偏地审视每一份文献。 四、文献综述的方法 文献综述通常分为两个阶段:搜索和评价。搜索包括文献筛选和

搜索,重点是筛查出有用的文献;而评价则是整理文献,比较各自的优点和缺点,根据各文献的优缺点,形成对文献的整体综合评价。 搜索文献的方法有两种:一种是通过专业的文献数据库来搜索;另一种是通过进行有效网络搜索,查找到更新的文献材料。 评价文献的方法有:首先,根据研究内容,把文献整理为实验性、体系性和实用性文献,以便于进行准确的评价;其次,要重视文献的质量和原创性,看文献是不是有效的,可靠的,有研究价值的;第三,要按照文献的出版时间的先后顺序进行评价,以确保文献的有效性。 五、结论 文献综述是学术研究和科学研究的一种基本方法。它有助于研究者从多方面梳理、理解、分析和总结学术研究工作,并从中发现解决问题有效途径。文献综述评价是评价学术研究质量的重要手段,它评价的主要标准包括内容覆盖度、文献可信度、文献价值和客观性等。文献综述的搜索和评价过程,要求学者们有效地运用已有的学术资源,尽心竭力地完成一份优质的文献综述。

医学信息检索(重点)

医学信息检索与利用 信息素质: 1、信息意识素质:对周围情报信息的敏感性和主动利用情报信息的自觉性 2、信息能力素质:信息技术应用能力,信息查询及获取能力,信息组织加工及分析能力 3、信息道德素质:在整个信息活动中的道德,是调节信息生产者、信息加工者、信息传递者及信息使用者之间相互关系的行为规范的总称。 信息利用对医学工作者的重要性: 1、知识更新的源泉 2、提高医学工作水平的重要途径 3、医学科研必不可少的条件 基本概念 1、信息:生物体或具有一定功能的机器,通过感觉器官或相应的设备同外界交换内容的总称 2、知识:通过人的大脑加工整理后,使之系列化的信息 3、情报:应用一定的形式,传递给用户,并产生效用的知识和信息 4、文献:文献是记录着知识的一切载体 医学情报信息的来源:正式情报信息源,非正式情报信息源。 正式情报信息源按文献的出版形式划分: (1)图书(2)期刊(3)专利文献(4)会议文献(5)科技报告(6)标准文献(7)国际机构和政府出版物(8)学位论文(9)技术档案(10) 产品资料(11) 报纸、通报 根据对知识的加工深度划分: (1)一次文献作者根据自己的工作和研究成果而创作的原始文献,是信息源 主要形式有:期刊论文、研究报告、会议文献、专利说明书、学位论文等 (2)二次文献(检索工具):对一次文献进行收集、分析、整理并按照其外部特征或内部特征,按一定的规则加以编排形成的文献,是检索一次文献的检索工具 主要形式有:目录、索引、文摘等 (3)三次文献在利用二次文献的基础上,对收集来的一次文献进行阅读、分析、整理、概括,重新组织加工而撰写出来的文献,具有概括全面、系统深入、信息密集的特点 主要形式有:综述、评论、进展、年鉴、指南、百科全书、专著等 (4)零次文献尚未用文字记录或正式出版发行的信息资料 主要形式有:口头信息、实物信息、书信、记录等 情报信息检索:以科学的方法,利用专门的工具,从大量的情报信息资料中,查找出特定的、所需要的情报信息资料的过程。 种类: 1.文献检索:对象---某一学科、概念、著者的相关文献;使用---文献检索工具 2.事实检索:对象---具体的知识、事实、术语解释;使用---参考工具书 3.数据检索:对象---数值性数据、图表、公式、结构式;使用---参考工具书 信息检索工具也称检索系统,是用以报道、存贮、查询知识信息的一切工具和设备的统称。 按载体形式划分:手工检索工具,机读型检索工具,网络检索工具 按著录内容划分: (1)目录型检索工具目录:是以一个完整出版物为著录单元 (2)索引型检索工具索引:是以书刊资料中的某一部分为著录单元

《信息检索》考试答案及评分标准

山东科技大学2010—2011学年第一学期 《信息检索》考试答案及评分标准 一、填空题(每空0.5分,共10分) 1、小王在某个数据库中检索到了50篇文献,查准率和查全率分别为40%、80%,则全部相关文献有25 篇。 2、文件ABC.001.TXT的后缀名是TXT ,文件类型是文本文件。 3、多数网页采用HTML编写,这里的HTML指的是:超文本标识语言。 4、在使用搜索引擎检索时,URL:ustc可以查到网址中带有ustc的网页。 5、根据索引编制方式的不同,可以将搜索引擎分为索引型搜索引擎和网络目录型搜索引擎。 6、按文献的相关度来划分,可以把文献分为密切相关文献、相关文献、参考文 献。 7、检索工具具有两个方面的职能:存储职能、检索职能。 8、利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为追溯法,又称为引文法。 9、、已知一篇参考文献的著录为:”Levitan, K. B. Information resource management. New Brunswick: Rutg ers UP,1986”,该作者的姓是:Levitan 。 10、检索语言可分为两大类:分类语言、主题词语言。 11、当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。 12、查询关键词为短语"DATA OUTPUT",可以用位置算符(W)改写为:DATA (W) OUTPUT 。 二、单项选择(每题1分,共15分) 1、一般来说,关键词出现在文献的不同字段表达的相关性不同,以表达的相关性从强到弱排序如下:【C】 A.关键词>标题>文摘>正文 B.关键词>文摘>正文>标题 C.标题>关键词>文摘>正文 D.正文>文摘>关键词>标题 2、关于索引型搜索引擎的采集和索引机制,错误的说法是:【B】

文摘索引型数据库和全文数据库区别

文摘索引型数据库和全文数据库区别 文摘索引型数据库和全文数据库的最大差别就是前者结果只提供题录和文摘等二次文献信息 , 后者除可提供二次文献信息外 , 还能提供作者原文的一次文献信息。 1 检索途径存在着差异 检索途径有主题、分类及除此之外的作者、号码等其它辅助途径 , 通过数据库设置的检索字段反映检索途径的实现。不同的数据库根据检索的实际需要设置检索字段。 全文数据库设置的检索字段一般较文摘索引型数据库少 , 如 Springer -Link 只设全文、文摘、作者、题名 4 个检索字段。有些全文数据所设字段如出版物日期只是起限制检索结果的作用 , 不具备真正的检索意义。文摘索引型数据库设置检索的字段较多 , 且每个字段的检索能在命令检索指令中独立执行。文摘索引型数据库由于收录的文献众多 , 一般不采用简单的浏览途径。有的数据库提供分类途径 , 但其分类一般遵循全景式的细致的学科等级体系 , 较之全文数据库的浏览分类导航系统严谨。 2 收录文献的原则和目的不同 , 数据库所起的作用不同 文摘索引型数据库一般收录特定时期的综合学科领域或某一学科分支的相同或不同出版类型的文献。有的强调收录文献的全面性 , 如维普公司上世纪出版的《中国科技期刊篇名数据库》以收录中国期刊全面而著名。有的强调收录文献的质量性 , 如 EI 公司的 COMPENDEX 以收录具有永久保留价值的文献为宗旨。 全文数据库以为用户提供利用一次文献为主要宗旨 , 其数据库商必须和著者或出版单位商谈著作使用权问题 , 只有双方达成协议签署合同 , 并履约支付著作权报酬才能使用文献原文而收录数据库。 3 检索技术的运用不尽相同 3 .1 检索原理的不同 文摘索引型数据库是以记录组织文献 , 处理每一条记录依据基于文献内容的特征属性和文献外表的特征 , 如题名、主题词、作者等等。它们构成了记录的一个个字段 , 是 典型的结构化的线性的数据 , 模式简单 , 易于处理 , 体现传统的布尔检索、截词检索和位置检索等功能。 全文数据库主要通过运用对整个文本信息的分析 , 利用将全部文本划分为主题紧凑的不同子段 , 用不同的关键字特征标注各子段的文本切分技术和计算机自动进行全文自动抽词标引来处理原始文献的。全文检索技术能体现关键词在子段和全文出现的频率和分布 , 处理的是典型的非结构化的非线性的数据。 3 .2 主题检索特征不同

相关文档
最新文档