信息检索学习参考资料

信息检索学习参考资料
信息检索学习参考资料

第一讲信息检索基础知识

1.信息、知识、情报、文献的概念以及四者之间的关系?

信息是事物的运动状态和方式。

知识是关于事实和思想的有组织有系统的陈述。

情报是作为交流对象的有用知识,是在特定时间、特定状态下对特定的人提供的有用知识,是激活了、活化了的知识,其基本属性是知识性、传递性和效用性。

文献是指“记录有知识的一切载体”,它是存储在一定物质载体上的关于知识信息的记录。

四者的关系:信息包含知识、知识包含情报和文献、情报和文献是交叉关系。

2.什么是信息资源?什么是信息源?

信息资源是经过人类筛选、组织、加工,并可以存取和能够满足人类需求的各种信息的集合。

信息源是人们获取信息的来源。

3.什么是信息素质?信息素质教育的目标是什么?信息素质由哪些方面构成?各方面的具体含义是什么?

信息素质是指利用已掌握的信息工具的知识与技能,对需求的信息进行检索、加工并且有效地利用这些获取的信息解决实际问题的能力。让用户学会学习,获得终身学习的能力是信息素质教育的目标。

信息素质由:信息需求、信息意识、信息知识、信息道德、信息能力五个方面构成。

(1)信息需求是指人们在一个阶段的目标、任务位置中产生的信息需要行为。

(2)信息意识是人们对信息的敏锐意识(由信息需求激发出来,包括人们对信息的感受力,持久的注意力和对信息价值的洞察力,判断力) (3)信息知识是人们有关信息的特点与类型,信息交流和传播的基本规律与方式,信息的功用及效应,信息检索的方法和技能等方面的知识。

(4)信息道德是人们在收集信息,获取信息和使用信息时必须遵守的伦理道德规范。

(5)信息能力是人们在探求与个人兴趣有关的信息活动中,能够精确地、批判性地评价信息,对信息进行创造性表达和知识创新,最佳地收集、分析和使用信息,从而完成解决实际问题和探求知识的能力。

4.信息能力按应用途径及方式可分为哪些方面的内容?

信息能力按应用途径及方式可分为如下八个方面:

运用信息工具的能力;获取信息的能力;处理信息的能力;创新信息的能力;表达信息的能力;发挥信息作用的能力;信息协作意识与能力;信息免疫能力。

5.按文献的物理形态和加工方式可分别将文献分为哪几种类型?

按文献的物理形态和加工方式区分,文献可分为:手写型、印刷型、缩微型、声像型、数字型。

6.按文献的加工深度可将文献分为哪几种类型?它们之间的关系是什么?

按加工深度的不同,可将文献分为:零次文献、一次文献、二次文献、三次文献。

它们之间的关系:零次文献是一次文献的素材,一次文献是二次、三次文献的来源和基础,二次、三次文献是对一次文献进行组织、加工、综合后形成的,它们编写目的明确,专指性强。

7.按文献的内容特点和出版方式可将文献分为哪几种类型?

按内容特点和出版方式区可分为:图书、期刊、报纸、会议文献、学位论文、政府出版物、标准文献、科技报告、专利文献、产品样本、其他零散资料。其中,会议文献、学位论文、政府出版物、标准文献、科技报告、专利文献、产品样本又称为特种文献。

8.什么是二次文献?二次文献的主要作用是什么?二次文献有哪些类型?

二次文献是信息部门将那些分散的、无组织的一次文献,用一定的方法经过加工整理、归纳、简化,把文献的外表特征和内容特征著录下来,使之成为有组织、有系统的检索工具。二次文献主要作用是存储和报道一次文献线索、提供查找的途径。二次文献类型包括书目、题录、文摘、索引等。

9.什么是三次文献?它可分为哪几类?

三次文献是在二次文献的基础上选用一次文献、零次文献的内容进行分折、概括、综合研究和评价而编写出来的文献。

三次文献可分为:综述研究类:如动态综述、学科总结、专题述评、进展报告等。

参考工具类:如年鉴、手册、大全、词典、百科全书等。

10.简述国际标准书号的含义,并举一个例子说明之。

国际标准书号(International Standard Book Number)简称ISBN,国际标准书号号码由13位数字组成,并以四个连接号或四个空格加以分割,每组数字都有固定的含义。

第一组:978或979。

第二组:国家、语言或区位代码

第三组:出版社代码由各国家或地区的国际标准书号分配中心分给各个出版社。

第四组:该出版物代码,由出版社具体给出。

第五组:校验码只有一位,从0到9。

例如:有一本书,其书号为:ISBN 978-7-03-026769-6

ISBN代表:国际标准书号,7代表国家、语言或区位代码,03代表出版社代码,026769代表该出版物代码,6代表校验码。

11.简述国际标准刊号的含义,并举一个例子说明之。

国际标准刊号(International Standard Serial Number)简称:ISSN,由8位数字分两段组成,前7位是期刊代号,末位是校验号。

如有一期刊,其刊号为:ISSN 1003-3513。ISSN代表:国际标准刊号,1003-351代表:期刊代号,最后一位“3”代表:校验号。

12.简述国内统一刊号的含义,并举一个例子说明之。

国内统一刊号是指我国报刊的代号,是报刊管理部门为了便于报刊统计、管理而按一定规则进行编排的号码总称。国内统一刊号由地区号、

报刊登记号和《中图法》分类号组成。

如有一期刊,其国内统一刊号是CN11-2856/G2 。CN代表:中国国别代码,11代表:地区号,2856代表:报刊登记号,G2代表:《中图法》分类号。

13.简述中国标准刊号的含义,并举一个例子说明之。

中国标准刊号(简称CSSN)经国家质量技术监督局正式批准发布,从1989年7月1日开始实施. 由国际标准刊号(ISSN)和国内统一刊号(CN)两部分组成.

如有一期刊,其中国标准刊号为:ISSN1002-557X CN11-1725/C

在ISSN1002-557X中,ISSN代表:国际标准刊号,1002-557代表:期刊代号,最后一位“X”代表:校验号。在CN11-1725/C中,CN代表:中国国别代码,11代表:地区号,1725代表:报刊登记号,C 代表:《中图法》分类号。

14.什么是核心期刊?

核心期刊是指刊载论文数量多、品质高,而且能反应出该学科最新研究成果及发展趋势,受到读者重视之学术期刊。

15.请写出在参考文献标识中纸质型文献所有单字母所标识的文献类型,电子型文献所有双字母所标识的文献类型,所有非纸张型载体电子文献,在参考文献标识中标明的载体类型。

1.纸张类型文献以单字母标识:

M——专著(含古籍中的史、志论著)

C——论文集

N——报纸文章

J——期刊文章

D——学位论文

R——研究报告

S——标准

P——专利

A——专著、论文集中的析出文献

Z——其他未说明的文献类型

2.电子文献类型以双字母作为标识:

DB——数据库 CP——计算机程序 EB——电子公告 MT——磁带DK——磁盘 CD——光盘 OL——联机网络

3.非纸张型载体电子文献,在参考文献标识中同时标明其载体类型:DB/OL——联机网上的数据库 DB/MT——磁带数据库

M/CD——光盘图书 CP/DK——磁盘软件 J/OL——网上期刊

EB/OL——网上电子公告

第二讲信息检索理论基础

主题词又称叙词,在标引和检索中用以表达文献主题的规范化的词或词组。

《汉语主题词表》是我国第一部大型的综合性的叙词表,由中国科技信息研究所和北京图书馆负责主持,1975年开始编制,1980年正式出版。分为社会科学、自然科学和附表3卷,共10个分册,共收叙

词 11万条。该词表主要供电子计算机系统存储和检索文献用,亦可用来组织卡片式主题目录和书本式主题索引。

索引是揭示文献内容出处,提供文献查考线索的工具书。

SCI(科学引文索引)、EI(工程索引 )、ISTP(科技会议录索引)是世界著名的三大科技文献检索系统,是国际公认的进行科学统计与科学评价的主要检索工具,其中以SCI最为重要。

标引,顾名思义,标是标记,引是指引,就是通过标记指引人们方便、快捷地找到所需要的信息。

检索是指从文献资料、网络信息等信息集合中查找到自己需要的信息或资料的过程。

检索标识即检索词,是指能表达检索课题主题概念和信息需求的名词术语、分类号、名称及代码等的总称,包括主题词、关键词、名称、分类号、分子式、专利号及各种号码等。

数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。联机检索指用户借助通讯线路,通过终端设备同检索系统联机所进行的文献与数据检索。

服务器,从广义上讲,服务器是指网络中能对其它机器提供某些服务的计算机系统(如果一个PC对外提供ftp服务,也可以叫服务器)。从狭义上讲,服务器是专指某些高性能计算机,能通过网络,对外提供服务。相对于普通PC来说,稳定性、安全性、性能等方面都要求更高,因此在CPU、芯片组、内存、磁盘系统、网络等硬件和普通PC 有所不同。

多媒体,从广义上讲,多媒体指的是能传播文字、声音、图形、图象、动画和电视等多种类型信息的手段、方式或载体。包括电影、电视、CD-ROM、VCD、DVD、电脑、网络等。从狭义上讲,多媒体指融合两种以上“传播手段、方式或载体”的、人机交互式信息交流和传播的媒体,或者说是指在计算机控制下把文字、声音、图形、影像、动画和电视等多种类型的信息,混合在一起交流传播的手段、方式或载体。如多媒体电脑、因特网等。

1.什么是信息检索?

狭义的信息检索(Information Retrieval)是指依据一定的方法,从已经组织好的大量有关信息集合中,查找并获取特定的相关信息的过程。

广义的信息检索包括信息的存储和检索两个过程(Information Storage and Retrieval)。信息的存储是将大量无序的信息集中起来,根据信息源的外部特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的数据库或检索系统,供人们检索和利用。而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。

2.信息检索的类型(按不同标准划分)有哪些?

按检索方式分:(1)手工检索(2)计算机检索(3)综合检索

按检索内容或检索目标分:(1)文献型信息检索(2)事实型信息检索(3)数据型信息检索

按系统中信息的组织方式分:(1)全文检索(2)超文本检索(3)

超媒体检索

3.信息检索的途径(按不同标准划分)有哪些?

按内容特征途径分:

(1)主题途径(2)分类途径(3)代码途径

按外表特征途径分:

(1)题名途径(2)著者途径(3)机构途径(4)编号途径(5)其他途径

4.检索语言(按不同标准划分)有哪些?

按检索词的规范化程度,检索语言可分为自然语言(也称非受控语言)和人工语言(也称受控语言)两种。

其中人工语言可分为:(1)分类语言(2)主题语言(3)代码语言分类语言又可分为:

(1)主题分类语言(2)学科分类语言(3)图书分类语言(4)专利分类表

主题语言又可分为:

①关键词语言②标题词语言③单元词语言④叙词语言

按组配方式划分,检索语言可分为:

(1)先组式语言(2)后组式语言

4.检索系统(按不同标准划分)有哪些?

检索系统的类型:

按文献信息事业来划分可分为:

(1)图书馆系统(2)情报信息系统(3)档案馆系统

按检索的工具和方式来划分可分为:

(1)手工检索系统(2)机械检索系统(3)计算机检索系统

其中,计算机检索系统一般又可分为光盘检索系统、脱机检索系统、联机检索系统、网络检索系统。

5.什么是检索方法?检索方法有哪些?其各自又包括哪些方法?

检索方法是为实现检索方案中的检索目标所采用的具体操作方法和手段的总称。

检索方法有:1.工具法 2.追溯法 3.交替法

其中,工具法又包括:1)顺查法 2)倒查法 3)抽查法

追溯法又包括:1)传统追溯法 2)引文追溯法

交替法又包括:1)直接交替法 2)间隔交替法

6.什么是检索技术?常用的检索技术有哪些?

检索技术是指应用于信息检索过程的原理、技术、方法、策略的总称,是检索系统为了提高检索效率,从概念相关性、位置相关性等方面对检索提问进行组配、加权、扩展、截词、邻近、限定的比较和运算处理技术。

常用的检索技术有:(1)布尔检索 (2)截词检索 (3)位置检索(4)短语或词组检索(5)优先算符(6)精确与模糊检索(7)字段限定检索(8)加权检索(9)多媒体检索(10)超文本检索

7.简述布尔逻辑算符AND、OR和NOT在编制检索提问式中的作用。具有概念交叉或概念限定关系的组配,用“*”或“AND”算符表示(少数工具用“+”或空格表示)。

具有概念并列关系的组配,用“+”或“OR”算符表示(也有用“| ”或“/”表示)。

具有概念排除关系的组配,用“–”或“NOT”算符表示。

8.什么是查全率?查准率?误检率?漏检率?

查全率指检出的相关信息数与信息库中相关信息总数的百分比。

查准率指检出的相关信息数与检出的信息总数的百分比。

误检率指检出的非相关信息数与检出的信息总数的百分比。

漏检率指未检出的相关信息数与信息库中相关信息总数的百分比9.在一个具有1000篇文献的检索系统中检索某课题,用一特定检索策略查核课题时输出文献60篇。经分析评估,发现该系统中共有该课题相关文献50篇,检出的文献中实际相关文献只有30篇,求查全率、查准率、误检率、漏检率。

查全率=30/50*100%=60%; 查准率=30/60*100%=50%;

由于检出的文献中实际相关文献只有30篇,因此,未检出的相关文献有50-30=20篇,检出的非相关有60-30=30篇,因此:

误检率=30/60*100%=50%;漏检率=20/50*100%=40%

查全率和漏检率是互补的;而查准率和误检率也是互补关系。即:查全率 + 漏检率 = 1 ;查准率 + 误检率 = 1 。

10.简述信息检索的基本步骤。

1.分析检索课题

2.选择检索系统

3.确定检索词

4.确定检索途径和检索方法

5.制定检索策略构建试验性检索式

6.调整检索策略构建正式检索式

7.输出检索结果

8.用户评价

11.为检索课题“航空或航天发动机的设计和制造”编制检索式。((航空+航天)*发动机)*(设计+制造)

12.截词检索有几种形式?

截词检索包括前截断、后截断、中间截断、前后截断四种检索形式。使用“*”截断表示无限截断,表示词的前后可以跟任意多个词。如:economic* 可以表示为:economic、economic s、economic st、economic alism

如:*computer可以表示为:mini computer 、micro computer

使用“?”可以表示有限截断。也可以表示为无限截断

有限截断:wom?n 可以表示为:wom a n 、wom e n 两种形式。

无限截断:如: ?computer?可检出: computer、computer s、computer ize、computer ized、mini computer、mini computer s、micro computer、micro computer s等多种形式。

注意:在截词检索中一个“?”代表一个字母或任意多个字母,一个“?”比较特殊,两个“??”代表二个以内字母,可以是一个,也可以是二个。三个“???”代表三个以内字母,可以是三个字母,也可以是二个字母。也可以是一个字母。等等以此类推。

13. 位置检索有几种形式?

位置检索包括:(W)与(nW)算符、 (N)与(nN)算符、(S)算符、(F) 算符。

例如:laser(1W)printer,表示在“laser”和“printer”之间允许插入一个实词或虚词,但“laser”和“printer”这两个词的次序

不能颠倒。

例如:economic(2N)recovery表示在“economic”和“recovery”之间允许插入最多二个实词或虚词,但“economic”和“recovery”这两个词的次序可以任意颠倒。

14.请写出以下课题的文献检索式:

(1)涂料与环境涂料+环境

(2)自然环境的规划与发展自然环境*(规划+发展)

(3)无土栽培无土*栽培

(4)无磷洗衣粉推广研究 (无磷*洗衣粉)*(推广+研究)

(5)关于铵盐冷却性能的实验与探讨 (铵盐*冷却性能)*(实验+探讨)

(6)食品与化学食品+化学

(7)化肥对土壤的影响 (化肥*土壤)*影响

(8)厨房里的化学厨房*化学

(9)石油的开发与利用石油*(开发+利用)

(10)同时含有草莓、香草和巧克力三种口味的冰淇淋

(草莓+香草+巧克力)*冰淇淋

第三讲馆藏文献信息资源分布概述及利用指南

1.西京学院图书馆购买的电子资源主要有哪些?

西京学院图书馆购买了如下电子资源的使用权:

(1)中国知网(2)超星汇雅中文电子图书(3)博图外文电子

图书

2.西京学院图书馆主页的网址是?

https://www.360docs.net/doc/1d11776248.html,

3.西京学院图书馆主要由哪几个部门组成?

(1)流通借阅部(2)中西文采编部(3)网络与信息技术部(4)期刊阅览部(5)参考咨询部(6)办公室

4.西京学院图书馆能够提供的服务有哪些?

(一)文献借阅服务(二)文献阅览服务(三)预约、续借服务(四)图书荐购(五)查询系统服务(六)校园网上信息服务(七)参考咨询服务(八)馆际互借服务(九)文献传递服务(十)用户培训服务(十一)信息技术服务

5.西京学院图书馆主要的手工检索工具有哪些?

手工检索工具:书苑二楼工具书阅览室。主要的检索工具有字典、辞典、年鉴、手册、百科全书、汇编等。

6.OPAC的英文全称是?中文全称是?

英文全称是:On-Line Public Access Catalogue.

中文全称是:联机公共查询目录

7.西京学院图书馆使用的OPAC系统的名称是?

ILASIII数字图书馆。

8.使用《中国图书馆分类法》表示化学大类的图书分类号是?化学工业大类的图书分类号是?

化学大类的图书分类号是:O6,化学工业大类的图书分类号是:TQ

9.有一本图书的索书号是O62/32,其中O62代表?32代表?

O62代表图书分类号, 32代表图书种次号。

10.有一本图书的索书号是TB23/12=2,其中TB23代表?12代表?2代表?

TB23代表图书分类号, 12代表图书种次号,2代表第二版。

11.《中国图书馆分类法》的简称是?《中国图书馆分类法》是如何分类的?

《中国图书馆分类法》简称《中图法》。

《中国图书馆分类法》将各类图书分为五大部类,22个大类,具体如下:

五大部类为:1.马列主义类,2.哲学类、3.社会科学类、4.自然科学类、5.综合性图书类

22个大类为:

A马克思主义、列宁主义、毛泽东思想、邓小平理论;

B哲学、宗教;C社会科学总论;D政治、法律;E军事;F经济;G 文化、科学、教育、体育;H语言、文字;I文学;J艺术;K历史、地理;N自然科学总论;O数理科学和化学;P天文学、地球科学;Q 生物科学;R医药、卫生;S农业科学;T工业技术;U交通运输;V航空、航天;X环境科学、安全科学;Z综合性图书

12. 什么是索书号?西京学院图书馆的图书索书号是如何组成的?

索书号是图书馆赋予每种馆藏图书的唯一标识,可借以准确地确定馆藏图书在书架上的排列位置,方便读者查找图书。西京学院图书馆的

图书索书号由图书分类号和图书种次号两部分组成。

第四讲网络中文信息资源网站分布概述及利用指南

1.网络中文信息资源网站主要包括哪些种类?

(1)中文检索性网站 (2)中文免费全文资源网站 (3)中文考试招聘留学网站 (4)中文导航性网站 (5)中文视频网站 (6)中文教育论坛网站 (7)中文网络工具书网站

第五讲网络外文信息资源网站分布概述及利用指南

1.网络外文信息资源网站可分为哪几类?

(1)外文检索性网站(2)外文免费全文资源网站(3)外文导航性网站(4)外文视频网站(5)外文网络工具书网站

2. 全球最大的网上书店是?

亚马逊网上书店也被称为全球最大的网上书店。

3.美国政府科技报告由哪些报告组成?各类报告分别是什么报告?美国政府科技报告主要由美国商业部的PB报告、美国国防部的AD报告、美国能源部的DOE报告和美国国家航空及宇航局的NASA报告组成,通常称为“四大”科技报告。

PB报告是公开发行的民用报告,AD报告是军事报告,DOE报告是美国能源部报告,NASA报告是航空航天报告。

4.世界最著名的两种期刊是?(写出英文名称及中文名称)《Science》(《科学》周刊);《Nature》(自然)

熟悉以下知识:

美国国会图书馆是全球最重要的图书馆之一。

大英图书馆是世界上最大的学术图书馆之一。

哈佛大学图书馆是世界上藏书最多、规模最大的大学图书馆。

美国DIALOG系统是目前世界上最强大的国际联机检索系统

OCLC,全称:Online Computer Library Center)是世界上最大的提供文献信息服务的机构之一。

《化学文摘》,Chemical Abstracts,简称CA,是世界最大的化学文摘库。也是目前世界上应用最广泛,最为重要的化学、化工及相关学科的检索工具。

第六讲网络搜索引擎分布概述及利用指南

1.什么是搜索引擎?

搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

2.搜索引擎由哪几部分组成?

搜索引擎一般由搜索器、索引器、检索器和用户接口四个部分组成。

3.搜索引擎的分类?

搜索引擎可分为:全文搜索引擎、目录搜索引擎、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表。

4.全球最大的中文搜索引擎是?

百度搜索引擎

5.在百度搜索引擎中,要在特定的网站https://www.360docs.net/doc/1d11776248.html,中查找相关内容,其检索表达式为?要查找网址中含有xijing的网址,其检索表达式为?要查找网页标题中含有“西京学院”的网页,其检索表达式为?查找文件类型是pdf格式的文献,其检索表达式为?要查找有关“苹果手机”方面的文献并且文献类型是ppt格式的文献,其检索表达式为?

◆在特定的网站https://www.360docs.net/doc/1d11776248.html,中查找相关内容,其检索表达式为: site: https://www.360docs.net/doc/1d11776248.html,

◆要查找网址中含有xijing的网址,其检索表达式为:

inurl:xijing

◆查找网页标题中含有“西京学院”的网页,其检索表达式为: intitle:西京学院

◆查找文件类型是pdf格式的文献,其检索表达式为:

filetype:pdf

◆要查找有关“苹果手机”方面的文献并且文献类型是ppt格式的文献,其检索表达式为:

苹果*手机 filetype:ppt

6.因特网上最大的搜索引擎是?

因特网上最大的搜索引擎是:谷歌搜索引擎(Google)

7.在谷歌中要查找computer这个词的定义,其检索表达式为?要在特定的网站https://www.360docs.net/doc/1d11776248.html,中查找相关内容,其检索表达式为?

要查找网址中含有xijing的网址,其检索表达式为?要查找网页标题中含有“西京学院”的网页,其检索表达式为?查找文件类型是pdf格式的文献,其检索表达式为?

◆在谷歌中要查找computer这个词的定义,其检索表达式为:define:computer

◆要在特定的网站https://www.360docs.net/doc/1d11776248.html,中查找相关内容,其检索表达式为: site:https://www.360docs.net/doc/1d11776248.html,

◆要查找网址中含有xijing的网址,其检索表达式为:inurl:xijing ◆要查找网页标题中含有“西京学院”的网页,其检索表达式为: intitle: 西京学院

◆查找文件类型是pdf格式的文献,其检索表达式为:filetype: pdf

8.在百度中要进行精确搜索,所使用的符号有哪些?

在百度中要进行精确搜索,所使用的符号有:双引号“”以及书名号《》。如:要精确查找有关“手机”的电视剧,可使用检索表达式《手机》。

9.在谷歌中要进行精确搜索,所使用的符号有哪些?

在谷歌中要进行精确搜索,所使用的符号有:双引号“”。

注意:Google可使用“全词通配符”取代某个单词(而不是单词中的一个或几个字母),其全词通配符号用“*”表示,一次检索可以同时使用若干个。在英文短语搜索中,它可减少单词输入量。在中文短语搜索中,还可以用一个全词通配符“*”来代替一个汉字。

如:在谷歌中要精确查找有关“我爱我家”方面的信息,其检索表达

式为:“我爱*家”

第七讲网络化学化工信息资源分布概述

1.网络重要化学化工检索工具有哪些?

网络重要化学化工检索工具有:美国《化学文摘》(CA)、美国《科学引文索引》(SCI)、美国《科技会议录索引》(ISTP)、《中国科学引文数据库》 (CSCD)

2.中国国家科学数字图书馆化学学科信息门户是网上化学专业信息

资源和信息服务的门户网站

第八讲个人文献信息管理软件概要

1.个人文献信息管理软件主要有哪些功能?

(1)批次输入信息资料 (2)检索查询功能 (3)查重 (4)直接搜索网络信息 (5)显示文献资料状况 (6)可加注个人读书心得 (7)利用文字处理系统产生引用资料清单 (8)自动产生期刊所需的参考书目格式 (9)产生科技写作模板,简化论文投稿程序

2.世界上目前使用范围最广的个人文献信息管理软件有哪些?(举三个例子)

世界上目前使用范围最广的个人文献信息管理软件有EndNote, ProCite, Reference Manager。

3.中国文献管理软件市场上的第一品牌软件是?

NoteExpress已经成为中国文献管理软件市场上的第一品牌。

信息检索课题汇总

信息检索课题汇总 一.课题题目:基于教育领域大数据的研究 课题选取来源于现在比较关注的“大数据”一词,大数据作为计算机领域的一大创新,它渐渐的在我们身边各行各业有了初步的应用,效果也十分显著。作为教育技术的人来说,我们要保持对技术的敏感性,积极接受新的技术和方法,并将其与教育结合,以促进教育更好更快发展。 二.使用数据库:中国知网、维普资讯、中国数字化期刊、超新数字图书馆、百度文库、豆丁文库。 中国知网作为中国第一大学术资料库,它给我们提供了包括期刊、博硕士论文、包括报纸和外国文献。里边的资料丰富,汇集了大部分人的知识结晶,是我们寻找学习和参考文献的首选。其次像维普和百度文库这样的学术性可能不及中国知网的文献资料库,提供给我们的文献专业性略差,却也可以有不少收获,特别是来自一些非学术界的一线工作人员的智慧。他们将自己经验收获写成文字,供更多的人了解。不同的数据库,有着不同的资源,我们要充分利用这些现有资源,将自己的课题做得更好。 三.搜索工具及评价:谷歌搜索、百度搜索 在我日常的学习或者生活中,经常使用这两个搜索网站。总体感觉还是不错的。当我们输入要检索的关键字,它就会根据相似度罗列很多资源供我们选择,包括视频文字各种各样的资源。所以在这个课题的进行中,我们在学习文献时,有不懂或者想拓展的时候,我们就会谷歌或者百度,它确实是非常方便的。但是作为综合性搜索平台,巨大的资源量没有很好的归类推送,诸如文字类或者视频类,那样会浪费是搜索人很多的时间精力去筛选自己想要的资源。这也是我在使用中体会到的,不同水平的搜索者,从同一平台中获得的资源差距非常大。 四.使用知识管理工具及存在问题:数字化学习与研究平台CNKI E-Learning 2.4.0 在学习这门课的过程中,陈老师给我们引入了知识管理这一观念,我深受启发。在接受教育的十多年里,我们只懂得接受着老师已经选择好的知识,也就是考试的知识进行学习和思索。知识对我们而言也就是应付考试,考完也就忘了。但是处在信息时代,知识的重要性被一次又一次强调,作为大学生,我们应该主动寻找知识,管理知识,并灵活应用。第一次使用知识管理工具,也就是E-Learning 平台,给我的感觉就是方便快捷,符合现在利用电脑学习的新趋势。我们很多资源都在电子版,我们不能像以前一样在书上做笔记、写反思,我们需要这样的管理工具。 在使用过程中,存在的问题大概就是,遇到不理解的地方需要复制粘贴到其他搜索平台,不能立即跳转,这样很多时间在复制粘贴或者换平台上。像蓝鸽平台就增强了这一点,我们遇到不懂的题,将其选中,右键就有百度搜索或者其他的搜索平台进行搜索,方便很多。 五.查找到的文献 (1)陆璟. 大数据及其在教育中的应用[J]. 上海教育科研,2013,09:5-8+22 (2)柯清超. 大数据与智慧教育[J]. 中国教育信息化,2013,24:8-11. (3)[1]刘太如. 大数据时代区域教育信息化准备好了吗——以上海市闵行区教育信息化为例[J]. 中国教育信息化,2013,24:11-15. (4)宓詠,赵泽宇. 大数据创新智慧校园服务[J]. 中国教育信息化,2013,24:3-7

信息检索结课作业

(1)与土木工程专业相关的核心期刊、EI源刊、SCI源刊 刊名种 类 刊期ISSN CN 邮发代号或通讯方式 东南大学学报(自然科学版)核 心 期 刊 双月1001-0505 32-1178/N 28-15 土木工程学报核 心 期 刊 月刊1000-131X 11-2120/TU 2-582 天津大学学报(自然科学与工程技术版)核 心 期 刊 月刊 493-2137 12-1127/N 6-27 清华大学学报(自然科学版)核 心 期 刊 月刊1000-0054 11-2223/N. 2-90 湖南大学学报(自然科学版)核 心 期 刊 月刊1674-297443-1061/N42-44 岩土工程学报EI 源 刊 月刊1000-4548 32-1124/TU 28-62 重庆大学学报(自然科学版)EI 源 刊 月刊1000-582X50-1044/N78-16 岩石力学与工程学报EI 源 刊 月刊1000-691542-1397/0338-315 中南大学学报(自然科学版)EI 源 刊 月刊1672-720743-1426/N42-19 同济大学学报(自然科学版)EI 源 刊 月刊0253-374X 31-1267/N 4-260 ADVANCES IN STRUCTURAL SCI 源Bimonthy 1369-4332 MULTI SCIENCE PUBL CO LTD, 5 WATES WAY, ---------------------------------------------------------精品文档---------------------------------------------------------------------

生物信息学期末考试重点

第一讲 生物信息学(Bioinformatics)是20世纪80年代末随着人类基因组计划的启动而兴起的一门新型交叉学科,它体现了生物学、计算机科学、数学、物理学等学科间的渗透与融合。 生物信息学通过对生物学实验数据的获取、加工、存储、检索与分析,达到揭示数据所蕴含的生物学意义从而解读生命活动规律的目的。 生物信息学不仅是一门学科,更是一种重要的研究开发平台与工具,是今后进行几乎所有生命科学研究的推手。 生物技术与生物信息学的区别及联系 生物信息学的发展历史 ?人类基因组计划(HGP) ?人类基因组计划由美国科学家于1985年提出,1990年启动。根据该计划,在2015年要把人体约4万个基因的密码全部揭开,同时绘制出人类基因的谱图,也就是说,要揭开组成人体4万个基因的30亿个碱基对的秘密。HGP与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划,被誉为生命科学的登月计划。(百度百科) 随着基因组计划的不断发展,海量的生物学数据必须通过生物信息学的手段进行收集、分析和整理后,才能成为有用的信息和知识。换句话说,人类基因组计划为生物信息学提供了兴盛的契机。上文所说的基因、碱基对、遗传密码子等术语都是生物信息学需要着重研究的地方。 :

】 第二讲回顾细胞结构 细胞是所有生命形式结构和功能的基本单位 细胞组成 细胞膜主要由脂类和蛋白质组成的环绕在细胞表面的双层膜结构 细胞质细胞膜与细胞核之间的区域:包含液体流质,夹杂物存储的营养、分泌物、天然色素和细胞器 细胞器细胞内完成特定功能的结构:线粒体、核糖体、高尔基体、溶酶体等 细胞核最大的细胞器 DNA的结构 碱基(腺嘌呤A、鸟嘌呤G、胞嘧啶C、胸腺嘧啶G) 。 核苷酸 核苷酸是构成DNA分子的重要模块。每个核苷酸分子由一分子称作脱氧核糖的戊 糖(五碳糖)、一分子磷酸和一分子碱基构成。每种核苷酸都有一个碱基对,也就 是A、T、C、G 基因是什么 基因是遗传物质的基本单位 基因就是核苷酸序列。 大部分的基因大约是1000-4000个核苷酸那么长。 基因通过控制蛋白质的合成,从微观和宏观上影响细胞、组织和器官的产生。 基因在染色体上。

信息检索总结

1.信息检索方法与步骤 分析检索课题(分析检索课题的主题内容、确定文献类型、确定检索的时间范围、分析已知信息)、选择检索工具、实施检索、策略的修正、检索结果处理 2.检索词的提取 检索课题名称及描述语句不能直接作为检索表达式使用,为了提高查全率和查准率,要对课题名称进行切分、删除、替换、补充、组合等操作。 3.信息检索方法P32 常用法:顺查法、倒查法、抽查法追溯法——参考文献分段法 4.检索结果优化:P27 扩检:减少“AND”或“NOT”、增加“OR”、用截词符、使用上位词、同义词、近义词 缩检:增加“AND”或“NOT”、减少“OR”、提高检索词专指度、检索词限制在受控词范围内、利用外部特征来限制 5.传统出版模式存在的问题 政府提供基金资助,出版商控制文献的获取;图书馆期刊需求没有弹性,投入的经费赶不上期刊价格的增长;商业出版商牟取的利润 6.开放存取是指: 任何地方的任何人在网上可免费获得信息, 而对获取不收取任何费用。 7.开放获取一般有两种途径: 金色道路(开放获取期刊):是采用作者付费,读者免费的获取方式; 绿色道路(自动存档发):是作者向传统期刊投稿的同时,将自已的论文以电子档的形式存放在专门的开放获取知识库(知识机构库)中供读者阅读。 8.学术信息的开放存取:开放存取仓储、开放存取期刊、预印本文献 9.教学信息资源的开放存取:国外开放课程、国内开放课程 10.预印本是指科研工作者的研究成果还未在正式出版物上发表,而出于和同行交流目的自愿先在学术会议上或通过互联网发布的科研论文、科技报告等文章。与刊物发表的文章以及网页发布的文章比,预印本具有交流速度快、利于学术争鸣、可靠性高的特点。 11.网上电子报纸信息P434;网上高等学校信息P436;网上人物、机构信息资源P441 12.选择具体一本书关注其图书的基本信息: 1、借阅次数 2、豆瓣评论 3、图书目录 4、馆内流通信息 5、与此书相关的其他图书知识链接 6、是否有书后光盘 13.获取图书: 1、试读:目录可以了解图书具体编排内容 2、纸本:可以本馆借阅,若本馆没有收藏,先可以关注大学城其他成员馆有无收藏 3、电子版:本馆电子书,若无关注是否有文献传递链接 读秀:1、书的详细信息,包括获取此书各种途径,本馆馆藏纸书、电子书以及由近及远的其他大学收藏情况。如果在获取途径里有“图书馆文献传递”链接,则表示此书读秀已经获得此书版权可以提供电子文献传递。2、引用图书,揭示图书与图书引证关系 14.图书馆信息资源的获取 利用全文数据库直接获取;根据文献出处项到本单位的图书馆或资料部门去获取(利用馆藏目录);利用联合目录;联系作者获取(要知道作者详细的通迅地址) 15.例:查询北大的王少华老师2000年在首都经济贸易大学学报发表的有关人力资源管理或人才资源管理方面的文献。 检索式:作者单位=?北京大学?AND 作者=王少华AND 刊名=首都经济贸易大学学报AND 关键词= (人力资源OR 人才资源)

【9A文】文献检索课后作业

第二次上机课“每课一练” (每个学生必须要做的) 注: 1.进入图书馆主页“信息检索与利用课程”(https://www.360docs.net/doc/1d11776248.html,/RRjsk/fzkt1.asp)观看理工信息检索与利用第二次的教学课件与视频,请大家重点观看第二单元中的3,4,5,6四个课件与视频,并完成以下作业。 2.11月21日之前做好,修改文件名发给小组长,文件名格式:学号+班级+姓名。 3.小组长打包发到老师QQ邮箱。打包文件注明:专业班级+小组名称,如机械1301-第1组。 1WebofScience数据库(观看“4.WebofScience的检索与利用”教学课件完成该部分作业) (1)WebofScience包括SCI、SSCI和CPCI等子库,这三个子库的英文全称及中文名称是什么? SCI:科学引文索引(ScienceCitationIndeR) SSCI:社会科学引文索引(SocialSciencesCitationIndeR)CPCI:数据库分为两个子库:ConferenceProceedingsCitationIndeR –Science,简称CPCI-S ConferenceProceedingsCitationIndeR– SocialSciences&Humanities,简称CPCI-SSH (2)什么是施引文献?引文检索语言的作用是什么? 施引文献:是指引用或参考文献的文献 作用: ①可以用一篇文章、一个专利号、一篇会议文献或者一本书作为 检索词,检索这些文献被引用的情况,了解引用这些文献的论文所做的研究工作。 ②可以回溯某一研究文献的起源与历史或者追踪其最新的进展,既 可以越查越广,也可以越查越新,越查越深入。

生物信息学考试试卷修订稿

生物信息学考试试卷 WEIHUA system office room 【WEIHUA 16H-WEIHUA WEIHUA8Q8-

一、名词解释(每小题4分,共20分) 1、生物信息学 广义:生命科学中的信息科学。生物体系和过程中信息的存贮、传递和表达;细胞、组织、器官的生理、病理、药理过程的中各种生物信息。 狭义:生物分子信息的获取、存贮、分析和利用。 2、人类基因组计划 人类基因组计划准备用15年时间,投入30亿美元,完成人类全部24条染色体的3×109脱氧核苷酸对(bp)的序列测定,主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别。其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。作图和测序是基本的任务,在此基础上解读和破译生物体生老病死以及和疾病相关的遗传信息。 3、蛋白质的一级结构 蛋白质的一级结构是指多肽链中氨基酸的序列 4、基因 基因--有遗传效应的DNA片断,是控制生物性状的基本遗传单位。 5、中心法则 是指遗传信息从传递给,再从RNA传递给,即完成遗传信息的转录和翻译的过程。也可以从DNA传递给DNA,即完成DNA的复制过程。这是所有有细胞结构的生物所遵循的法则。 6 、DNA序列比较 序列比较的根本任务是:(1)发现序列之间的相似性;(2)辨别序列之间的差异 目的: 相似序列相似的结构,相似的功能 判别序列之间的同源性 推测序列之间的进化关系 7、一级数据库 数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释 8、基因识别 基因识别,是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别DNA序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码基因,也包括其他具有一定生物学功能的因子,如RNA基因和调控因子。 9、系统发生学 系统发生学(phylogenetics)——研究物种之间的进化关系。 10、基因芯片 基因芯片(gene chip),又称DNA微阵列(microarray),是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。

信息检索报告-终极版

《信息检索与利用》实习报告(理工科版) 说明:(1)本报告总分60分,占总成绩的60%。报告完成后应将此说明部分(1)至(6)项全部删除再打印成纸质的。课程结束后八天内由班长按学号收齐交老师。 (2)课题选取要结合本专业课程。实习时,围绕选定的课题进行检索与报告。检索年限:近5年的相关文献。如果文献量太少,可以放宽检索年限。 (3)检索式包括检索词、逻辑组配符号等,如有其他检索限定请一一注明。检索式是运用逻辑运算符将检索词连接起来用于检索文献信息的运算式。中文检索式举例:主题=新会计准则*(公司+企业)*影响-利润;英文检索式举例:ZP=212013 AND AU=zhang yk not (TI=“laser shock”and (TI=steel or TI= aluminum alloy))。 (4)逻辑运算符有:①布尔逻辑运算符:and、or、not、*、+、-;②位置运算符:near、w、pre、n等;③通配符:*、?、$等;④精确匹配算符:“”、{ }等。注意:不同的数据库所使用的逻辑运算符各不相同。 (5)本报告中的题录要求:中文文献包含文献的外部特征和内容特征;外文文献包含文献的外部特征。 (6)本报告中的题录格式可参照国家标准GB/T 7714《文后参考文献著录规则》。一、选题(10分) 1.检索课题名称 中文: _____汽轮发电机组的原理______________________________ 英文:The principle of turbine generator unit 2.所涉及的学科领域电机学物理学 3.分析课题,提取核心概念词、扩展相同和隐含概念的词(中、英文):

《文献信息检索与利用》考试试题答案

考试说明: ①综合成绩总分100分,分为平时成绩(占综合成绩的40%)和期末考试试卷成绩(占综合成绩的60%)。 ②要求认真审题,独立完成,试卷及作业雷同者、抄袭者和被抄袭者均不得分!!! ③要求交打印稿和电子稿。可先在电脑上做好后再打印出来,注意排版整洁清晰,字体五号字,页边距可设为2×2×2×2。 ④考卷WORD文档名称和发送EMAIL标题名一律为“学号+姓名+系部”,如:200942058丁月_计算机科学系。发送至huadanduoji@https://www.360docs.net/doc/1d11776248.html,. ⑤考试时间为9月5日—8日,8日16:30前将考试卷交任课教师处。 一、检索题(80分)。(以下题如果文字不足以说明,可以采用截图表示。) 1、搜索引擎题。(20分) (1)在中国教育网站内搜索有关“信息检索”方面的doc\pdf\ppt格式的文献,给出检索式。(5分)答:信息检索filetype:doc 信息检索filetype:ppt 信息检索filetype:pdf (2)对本专业的“门户网站”进行搜集,列出你认为最有价值的2个门户网站的名称及网址,并说明选择它的理由。(5分) 答:1)有机化学网:https://www.360docs.net/doc/1d11776248.html,/ 理由:有机化学网是国内最大的化学网站,内有最丰富的化学技术文章、资料、信息、资讯,最全面的有机化合物库,最权威的化学品供求平台 2)化学学科网:https://www.360docs.net/doc/1d11776248.html,/ 理由:化学学科网作为国内最大的教育门户网站,拥有权威、丰富、及时的独家教育资源。当前注册会员400多万人,并参与资料上传,同时有千余名一线教师共同审核维护。每日更新资料数2000多套,非常活跃。 (3)请搜索“中国商标网”网站并用该网站检索绍兴 咸亨酒店食品有限公司的商标图案和专用权期限;(5分) 答:绍兴咸亨酒店食品有限公司 商标如右图: 专用期限权: 2004 年9 月28 日至2014 年9 月27 日(4)请运用GOOGLE学术搜索,检索近3年内标题内含有“物联网”和“移动通信”方面的学术论文,请打开其中一篇论文全文,把其题名、作者、单位、中英文关键词和摘要、分类号及其一级标题复制粘贴如下。(5分) 答:题名:物联网的体系结构与相关技术研究 作者:沈苏彬范曲立宗平毛燕琴黄维 单位:南京邮电大学软件学院,江苏南京 南京邮电大学信息材料与纳米技术研究院,江苏南京 关键词:物联网;网络化物理系统;下一代网;产品电子标签;网络体系结构 摘要:物联网技术已经引起国内学术界、工业界和新闻媒体的高度重视,当前物联网的定义、

网 络 资 源 与 信 息 检 索 课作业

网络资源与信息检索课 综合实习报告 一、报告概况 1.课题名称: “传感器应用” 2.检索人员: 3. 反映课题内容的关键词以及相似词、同义词关键词(3-5个中英文): 关键词: 传感器应用 相似词:传感器法氧传感器硅传感器点传感器软传感器 主传感器热传感器双传感器微传感器力传感器 4. 中图法类号、类目: T工业技术 5.简要分析课题的主题内容: 传感器是一种物理装置或生物器官,能够探测、感受外界的信号、物理条件(如光、热、湿度)或化学组成(如烟雾),并将探知的信息传递给其他装置或器官。 二、课题检索报告 (一)利用百度查找与课题相关的信息

1、检索表达式:关键词=传感器应用 2、记录相关结果2条(包括网页标题、网页URL、主要内容): 结果1: 网页标题:百度百科 网页URL:https://www.360docs.net/doc/1d11776248.html,/view/2601562.htm 本书是以面向中职教育为准则,以职业岗位对人才的需求为出发点编写的。全书共10章,内容包括传感器基本知识、温度传感器、气敏和湿敏传感器的应用、力敏传感器、液位和流量传感器、位置及位移传感器、新型传感器、传感器接口技术、常用检测仪表、传感器综合应用等。本书在编写中力求简化传感器原理,突出传感器的应用,强调通俗易懂,着眼于学生在应用能力方面的培养。本书可作为中等职业学校机电技术、仪器仪表、自动控制、电子技术等专业的教材,也可供从事检测、控制技术等相关专业的工程技术人员参考。 结果2: 网页标题:https://www.360docs.net/doc/1d11776248.html,豆丁网 网页URL: https://www.360docs.net/doc/1d11776248.html,/p-189308288.html 主要内容:

生物信息学试题整理

UTR的含义是(B ) A.编码区 B. 非编码区 C. motif的含义是(D )。 A.基序 B. 跨叠克隆群 C. algorithm 的含义是(B )。 A.登录号 B. 算法 C. RGR^ (D )。 A.在线人类孟德尔遗传数据 D.水稻基因组计划 下列Fasta格式正确的是(B) 低复杂度区域 D. 幵放阅读框 碱基对 D. 结构域 比对 D. 类推 B. 国家核酸数据库 C. 人类基因组计划 A. seql: agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta B. >seq1 agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta C. seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta D. >seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta 如果我们试图做蛋白质亚细胞定位分析,应使用(D) A. NDB 数据库 B. PDB 数据库 C. GenBank 数据库 D. SWISS-PROT 数

据库 Bioinformatics 的含义是(A )。 A. 生物信息学 B. 基因组学 C. 蛋白质组学 D. 表观遗传学 Gen Bank中分类码PLN表示是(D )。 A.哺乳类序列 B. 细菌序列 C.噬菌体序列 D. 植物、真菌和藻类序列 ortholog 的含义是(A)0 A.直系同源 B.旁系同源 C.直接进化 D.间接进化 从cDNA文库中获得的短序列是(D )o A. STS B. UTR C. CDS D. EST con tig的含义是(B )o A.基序 B. 跨叠克隆群 C. 碱基对 D. 结构域 TAIR (AtDB)数据库是(C)o A.线虫基因组 B. 果蝇基因组 C. 拟南芥数据库 D. 大肠杆菌基因组ORF的含义是(D )o A.调控区 B. 非编码区 C.低复杂度区域 D. 幵放阅读框

2019年第一次信息检索课作业及答案

2013年第一次信息检索课作业 一、文献检索课基础知识练习题 1.具有相近含义的同义词或同族词在构成检索策略时应该使用( B )算符予以组配。 A.逻辑“与” B.逻辑“或” C.逻辑“非” D.位置 2.若想排除某概念,以缩小检索范围,可使用(B)算符。 A.逻辑“与” B.逻辑“非” C.逻辑“或” D.位置 3.当某些检索词词干相同、词义相近,但词尾有变化时,可采用( B )方法表示。 A.逻辑“与” B.截词 C.位置算符 D.字段限定 4.切分课题“当前商业银行经营体系的特点”的概念,并用布尔逻辑算符构成检索策略。(无需扩展概念,无需使用英语) 商业银行 AND 经营体系 AND 特点 5.切分课题“当前数理统计模型研究的趋势”的概念,并用布尔逻辑算符构成检索策略。(无需扩展概念,无需使用英语) 数理统计模型 AND 趋势 二、Google搜索引擎练习题 1.用Google的“手气不错”功能,,选择检索下面国家某所大学的网站,写出该大学的名称及其主页的网址。 (1)英国的大学。(2)美国的大学。(3)加拿大的大学。(4)澳大利亚的大学。(5)新加坡的大学。(6)香港大学 牛津大学;.uk/ 2. Google学术搜索引擎练习 (1) 请写出Google学术搜索网址。 (2) 利用Google学术搜索引擎,检索《僧帽牡蛎三倍体的研究》从维普或CNKI数据库中写出该文献前两篇引文的作者,并写出CNKI数据库用户名与密码。 第一篇:曾志南; 陈木; 林琪; 陈朴贤; 刘伟斌 第二篇:赵荣涛; 何建瑜; 刘慧慧 用户名:db0185 密码:dlscxy 3.李阳是著名的英语教育专家,请用google检索标题中包含“疯狂英语”的中国商业类网站的文献,并写出有效的检索式。 李阳or疯狂英语 4.采用google的高级语法(filetype:pdf),搜索有关“信息检索”方面的doc\pdf\ppt格式的文献,给出检索式。

最新生物信息学考试复习

——古A.名词解释 1. 生物信息学:广义是指从事对基因组研究相关的生物信息的获取,加工,储存,分配,分析和解释。狭义是指综合应用信息科学,数学理论,方法和技术,管理、分析和利用生物分子数据的科学。 2. 基因芯片:将大量已知或未知序列的DNA片段点在固相载体上,通过物理吸附达到固定化(cDNA芯片),也可以在固相表面直接化学合成,得到寡聚核苷酸芯片。再将待研究的样品与芯片杂交,经过计算机扫描和数据处理,进行定性定量的分析。可以反映大量基因在不同组织或同一组织不同发育时期或不同生理条件下的表达调控情况。 3. NCBI:National Center for Biotechnology Information.是隶属于美国国立医学图书馆(NLM)的综合性数据库,提供生物信息学方面的研究和服务。 4. EMBL:European Molecular Biology Laboratory.EBI为其一部分,是综合性数据库,提供生物信息学方面的研究和服务。 5. 简并引物:PCR引物的某一碱基位置有多种可能的多种引物的混合体。 6. 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。

7. BLAST:Basic Local Alignment Search Tool.是通过比对(alignment)在数据库中寻找和查询序列(query)相似度很高的序列的工具。 8. ORF:Open Reading Frame.由起始密码子开始,到终止密码子结束可以翻译成蛋白质的核酸序列,一个未知的基因,理论上具有6个ORF。 9. 启动子:是RNA聚合酶识别、结合并开始转录所必须的一段DNA序列。原核生物启动子由上游调控元件和核心启动子组成,核心启动子包括-35区(Sextama box)TTGACA,-10区(Pribnow Box)TATAAT,以及+1区。真核生物启动子包括远上游序列和启动子基本元件构成,启动子基本元件包括启动子上游元件(GC岛,CAAT盒),核心启动子(TATA Box,+1区帽子位点)组成。 10. motif:模体,基序,是序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。 11. 分子进化树:通过比较生物大分子序列的差异的数值重建的进化树。 12. 相似性:序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占的比例。 13. 同源性:两个基因或蛋白质序列具有共同祖先的结论。

文献信息检索作业

科技检索机检实习(一) 姓名:田童童班级2009级3班学号:2009113248 练习数据库:CNKI中国知网中国期刊全文数据库 练习题目查找“低温环境中乳酸菌菌种的分离与鉴定”方面的相关文献 练习过程和检索策略 1):拆分检索概念:低温环境乳酸菌菌种分离鉴定 扩展概念:高温环境酵母菌菌种培养 2):构建检索策略:(乳酸菌or酵母菌)and(分离or鉴定or培养) 3):初级检索界面:年份选择:2001—2010 专辑选择:理工 检索过程: 一次检索第一次二次检索第二次二次检索 字段检索词命中 数 检索词命中数检索词命中数 篇名乳酸菌1620分离188鉴定110 关键词乳酸菌4899分离365鉴定186 全文乳酸菌25814分离13294鉴定5225从篇名字段检索所得的第一篇文献篇名为:中温大曲中乳酸菌的分离鉴定及产酸特性从关键词字段检索所得的第一篇文献篇名为:高产胞外多糖的乳酸菌菌种的筛选 从全文字段检索所得的第一篇文献篇名为:秸杆生物转化燃料酒精研究现状 可见,篇名和关键词字段所得文献与课题关系比较密切。 4)高级检索界面(年份选择和专辑选择同初级检索界面) (1)基本字段 一次检索二次检索 字段检索词算符检索词命中 数 检索词算符检索词命中数 篇名乳酸菌或者酵母菌2681分离并且鉴定143关键词乳酸菌或者酵母菌9286分离并且鉴定257全文乳酸菌或者酵母菌62555分离并且鉴定15762 (2)辅助字段 在高级检索的篇名字段所得结果的基础上,选用"作者单位"字段,查找“中国农业大学”得到以下一篇文献:腐乳中乳酸菌的分离与鉴定 检索结果: 篇名:腐乳中乳酸菌的分离与鉴定 作者:王夫杰;鲁绯;渠岩 关键词:乳酸菌;分离;鉴定;

文献信息检索与利用

南阳理工学院(论文)2014-2015学年科目考查卷论文 文献信息检索与利用的感悟 学院(部): 专业: 学生姓名: 学号: 指导教师: 手机号码:

【摘要】21世纪是知识经济和网络时代。快捷准确,及时有效地检索和利用信息,是知识经济和网络时代对信息检索提出的新要求,也是置身21世纪的人们必须具备的基本信息素养。在这个充满机遇和挑战的时代,信息检索对我们的创意或事业能否取胜也是关键所在。以下就是我对信息检索的浅谈。 本文阐述了本人对文献检索的认识、收获及其应用,还有网络信息检索发展状况及其对文献检索的影响,探讨了教材内容体系和教学方法、手段和改革等问题,并指出了21 世纪文献检索课的发展趋势。 【关键词】信息网络文献检索网络查询工具数据库 【正文】本学期,我们学习了一门很特别而且很有用的学科,名字叫文献检索,这门课程给我带来了不少收获。文献检索课程是高校教学中不可缺少的一门课程,是素质教育中重要的组成部分,是当代大学生必须掌握的基本技能。 文献检索教育是培养我们大学生的信息意识,使我们掌握用手工方式和计算机方式从各种文献或互联网中获取知识和信息的一种科学方法学,是信息素养教育中重要的组成部分,是大学生素质教育中不可缺少的一个环节。高校的文献检索课作为我国高校情报用户教育的主要形式,是学生学习信息知识、掌握信息检索技术、普及信息素质教育的基础课,它和外语、计算机等一样是当代大学生必须掌握的基本技能。所以,对我们来说,文献检索十分有必要。而且我们必须好好掌握这样一门课程。 文献检课程从第3周开始,到14周结束,在这期间,通过网络学习,我们对计算机检索基础知识、中文数据库检索、专利基础知识及专利数据库检索、常用英文数据库检索等检索知识和方法有了一个深刻的了解;通过课下练习,我们经过实际操作,对清华数据库、维普数据库、方正电子图书数据库以及springer 数据库、ei village 2 数据库等各类中英文数据库都加深了印象。同时,学习了具体的文献检索知识,对于我们的日常的学习和工作也很有帮助,例如,当我们需要查询专业课程的相关文献用以学习的时候,我们便可以利用这些文献检索数据库来搜索到我们所需要的论文和书籍。另外,在必要的时候,为了方便搜索,我们还可以在网上申请个人图书馆,专门查询一些自己所需的不易随便下载的文

四川师范大学信息检索课上机作业2014190454

四川师范大学信息检索课上机作业 2014190454 1、举例说明搜索引擎中filetype、site、双引号这三个高级检索语法的功能。 要求: 1)请问上述语法的作用是什么?什么情况下用到这些语法? f i l e t y p e 作用:检索专业文档 使用情况:如检索W O R D、E X C E L等。f i l t y p e作为一种限制检索技术,提高了查准率。 s i t e 作用:从指定网站检索,也是一种限制检索技术,即限制结果来源,提高了查准率。 使用情况:当需要在某指定网站寻找某个资源的时候用 双引号 作用:精确匹配。不让搜索引擎对检索词进行拆分,是一种限制检索技术,即限制结果来源,提高了查准率。 使用情况:如果检索词较长,搜索引擎可能根据自己的分析对检索词进行拆分,而这种拆分可能与我们的检索初衷相悖。如果不希望搜索引擎拆分检索词,可以为查询词加上双引号。

2)自己设计一个或多个检索案例,体现这些语法的功能,说清楚检索意图和检索表达式,并对检索效果进行评价。 f i l e t y p e 语法格式:检索词f i l e t y p e:文档后缀名 1.前一个关键词和f i l e t y p e之间必须有空格。 2.f i l e t y p e后可以跟:D O C、X L S、P P T、P D F、R T F、A L L 。其中,A L L表示搜索所有这些文件类型。 3.点击结果标题,可直接下载,也可以点击标题后的“H T M L 版”快速查看该文档的网页格式内容。 案例: 搜索:入党申请书格式

意图:大一新生有一次入党机会,但是大部分同学不知道入党申请书的格式,所以可以借助网络手段获取一些必要的资料。一般的网页内容格式不太确切,所有寻找w o r d格式的入党申请书格式模板,以用于参考。 评价:左图为只在搜索栏中输入“入党申请书格式”所得结果,内容都为不规则的网页版本,没有想要的结果。 右图为利用了语法f i l e t y p e所得结果,搜索结果可直接看到所需要的内容。 总评:f i l e t y p e限制了文本格式,过滤了其他不需要的文本。s i t e 语法格式:检索词s i t e:域名 1.s i t e:后面跟的域名,不要带“h t t p://”或“w w w”; 2.s i t e:和站点名之间,不要带空格; 3.s i t e:和前面的检索词之间,要有空格 案例: 搜索:曳步舞教学

生物信息学期末考试重点

1、生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解 释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计 算机科学相结合形成的一门新学科。它通过综合利用生物学,计算机科学和信息技 术而揭示大量而复杂的生物数据所赋有的生物学奥秘。 2、数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于 距今六十多年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后, 数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方 式。数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数 据存储的大型数据库系统都在各个方面得到了广泛的应用。 3、表达序列标签从一个随机选择的cDNA 克隆进行5’端和3’端单一次测序获得的短 的cDNA 部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp。EST 来源于一定环境下一个组织总 mRNA 所构建的cDNA 文库,因此EST也能说明该组织中各基因的表达水平。 4、开放阅读框是基因序列中的一段无终止序列打断的碱基序列,可编码相应的蛋白。 ORF识别包括检测六个阅读框架并决定哪一个包含以启动子和终止子为界限的 DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个 真正的单一的基因产物。ORF的识别是证明一个新的DNA序列为特定的蛋白质编 码基因的部分或全部的先决条件。 5、蛋白质的一级结构在每种蛋白质中氨基酸按照一定的数目和组成进行排列,并进 一步折叠成特定的空间结构前者我们称为蛋白质的一级结构,也叫初级结构或基 本结构。蛋白质一级结构是理解蛋白质结构、作用机制以及与其同源蛋白质生理 功能的必要基础。 6、基因识别是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别 DNA序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码基因, 也包括其他具有一定生物学功能的因子,如RNA基因和调控因子。基因识别是基 因组研究的基础。

生物信息学复习重点

生物信息学是一门交叉学科, 包含了生物信息的获取、加工、存储、分配、分析、解释等在内的所有方面, 它综合运用数学、计算机科学和生物学等的各种工具来阐明和理解大量数据所包含的生物学意义。 生物信息学宗旨在揭示基因组信息结构的复杂性及遗传语言的根本规律。从生物分子获得和挖掘深层次生物学知识。人类基因组计划(HGP:获得遗传图、物理图、序列图、转录图;终极目标:阐明人类基因组全部DNA序列;识别基因;建立储存这些信息的数据库;开发数据分析工具;研究HGP实施所带来的伦理、法律和社会问题。其中我国承担了人类3 号染色体短臂。 记录:一个数据库记录一般由两部分组成:原始序列数据和描述这些数据生物学信息的注释。 冗余:在一个数据库存在着多个相同的项,如两个或者更多的记录中有一个相同序列 Fasta 格式开始于一个标识符:">" ,然后是一行描述。 GenBank格式:每个基因描述可有多个描述行,包含一行以LOUCU开头描述行,基因序列以ORIGN开头,以/结尾。 EMBL入口标识符ID,序列开始标识符SQ结束是/。 数据库的特点:①数据库是可以检索的,即具有检索功能;②数据库应该是定时更新的,即不断有新版内容发布;③数据库是交叉引用的,特别是在互联网时代,数据库应该通过超链接与其他数据库相连。 EST序列:表达序列标签对cDNA文库测序得到的,是转录的DNA序列。 STS序列:序列标签位点染色体上位置已定的、核苷酸序列已知的、且在基因组中只有一份拷贝的DNA短片断,(200bp —500bp)。 STS序列标签位点是基因组上定位明确、作为界标并能通过PCR扩增被唯一操作的短的、单拷贝DNA序列,用于产生作图位点。 GSS序列:基因组概览测序基因组DNA克隆的一次性部分测序得到的序列。 HTG序列:高通量基因组序列 三大数据库: NCBI(GenBank):美国生物技术中心,建立了一系列生物信息数据和各种服务。 EMBL欧洲分子生物学实验室。 DDBJ日本遗传研究所。 同源性基因系指起源于同一祖先但序列已经发生变异的基因成员。基因同源性只有“是”和“非”的区别,是一种质的判断。 直系同源基因:分布在不同物种间的同源基因又称直系同源基因。 旁系同源基因:同一物种的同源基因则称旁系同源基因 (水平基因:, 水平基因由重复后趋异产生。 一致性:序列中同一碱基位置的相同的碱基成员, 或者蛋白质的同一氨基酸位置的相同的氨基酸成员的百分比。 相似性:序列中同一位置相同或相似序列的百分比。如同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。可取代氨基酸系指具有相同性质如极性氨基酸或非极性氨基酸的成员,它们之间的代换不影响蛋白质(或酶)的生物学功能。 相似性和同源性关系:一般来说序列间的相似性越高的话,是同源序列的可能性就更高,所以经常可以通过序列的相似性来推测序列是否同源。 序列比对:确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。任务:通过比较生物分子序列,发现它们的相似性,找出序列之间共同的区域,同时辨别序列之间的根本差异。 相似性:可能是核酸/氨基酸序列的相似、可能是结构的相似、可能是功能的相似

信息检索作业

1.我们为什么要进行信息检索? 答;因为①信息检索是获取知识的捷径②信息检索是科学研究的向导③信息检索是终身教育的基础。 2.信息检索分哪几类? 答:信息检索分为三类分别是:数据检索(Data retrieval)、事实检索(Fact retrieval)、文献检索(Document retrieval)。 3.简述信息、知识、情报、文献之间的关系? 答:信息、知识、情报、文献之间的关系如下图所示: 4. 检索工具的类型有哪几类?科技文献的检索方法有哪三种? 答:检索工具的类型有四类,分别是:目录、题录、文摘和索引;科技文献的检索方法分为常规法、追溯法和循环法(综合法)这三种。

1.请问国际三大检索系统是哪些?它们的中英文名称分别是什么? 答:三大检索系统分别是:SCI.《科学文献索引》即Science Citation Index ;EI.《工程索引》即Engineering Indes ;ISIP.《科技会议录索引》即Indes to Scientific。 2.请分别说出三种化学化工类中英文核心期刊名称、出版单位名称 及主编名字。 答: ① Chemical Journal of Chinese Universities 《高等学校化学学报》,出版单位是中华人民共和国教育部委托吉林大学和南开大学,主编是周其凤; ② Chinese journal of Analytical Chemistry《分析化学》,出版单位是中国化学会、中科院长春应用化学研究所,主编是汪尔康院士; ③ Acta Chimica Sinica 《化学学报》,出版单位是中国化学会、中科院上海有机化学研究所,主编是周其林。 3.期刊的影响因子如何计算? 答: 影响因子=(该刊前两年发表论文在统计当年被引用的总次数)/ (该 刊前两年发表论文总数).

生物信息学复习题及答案

一、名词解释: 1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。 2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。 序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。 序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。P98 8.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。P29 9.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。P29 10.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表真正的进化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。P37值:衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越接近零,越不可能找到其他匹配序列,E值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义。P95 12.低复杂度区域:BLAST搜索的过滤选项。指序列中包含的重复度高的区域,如poly(A)。 13.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。 14.多序列比对:通过序列的相似性检索得到许多相似性序列,将这些序列做一个总体的比对,以观察它们在结构上的异同,来回答大量的生物学问题。 15.分子钟:认为分子进化速率是恒定的或者几乎恒定的假说,从而可以通过分子进化推断出物种起源的时间。 16.系统发育分析:通过一组相关的基因或者蛋白质的多序列比对或其他性状,可以研究推断不同物种或基因之间的进化关系。 17.进化树的二歧分叉结构:指在进化树上任何一个分支节点,一个父分支都只能被分成两个子分支。 系统发育图:用枝长表示进化时间的系统树称为系统发育图,是引入时间概念的支序图。 18.直系同源:指由于物种形成事件来自一个共同祖先的不同物种中的同源序列,具有相似或不同的功能。(书:在缺乏任何基因复制证据的情况下,具有共同祖先和相同功能的同源基因。) 19.旁系(并系)同源:指同一个物种中具有共同祖先,通过基因重复产生的一组基因,这些基因在功能上可能发生了改变。(书:由于基因重复事件产生的相似序列。) 20.外类群:是进化树中处于一组被分析物种之外的,具有相近亲缘关系的物种。 21.有根树:能够确定所有分析物种的共同祖先的进化树。

相关文档
最新文档