信息检索-多选题

信息检索-多选题
信息检索-多选题

多选题

1. 当检出的文献量小于期望时,可以尝试以下方法扩大检索范围:

A.删除某些用AND连接的次要的检索词。

B.增加用OR连接的检索词。

C.检索词后用截词符。

D.选用上位主题词扩检。

2. 当检出的文献量过多,其中一部分文献并非真正需要时,可以尝试以下方法缩小检索范围:

A.增加用AND连接的检索词。

B.减少用OR连接的检索词。

C.选用下位主题词检索。

D.在原用副主题词的基础上,增加其它副主题词来检索。

3. In terms of information literacy, an information literate student is able to

A.determine the nature and extent of the information needed and access needed information effectively and efficiently.

B.evaluate information and its sources critically and incorporate selected information into his or her knowledge base and value system.

https://www.360docs.net/doc/0d13128902.html,e information effectively to accomplish a specific purpose individually or as a member of a group.

D.understand many of the economic, legal, and social issues surrounding the use of information and access and use information ethically and legally.

4. Management of Information is one of the seven requirements in Global minimum essential requirements (GMER) in medical education, which requires a medical practitioner to be able to A.search, collect, organize and interpret health and biomedical information from different databases and sources.

B.retrieve patient-specific information from a clinical data system.

https://www.360docs.net/doc/0d13128902.html,e information and communication technology to assist in diagnostic, therapeutic and preventive measures, and for surveillance and monitoring health status.

D.understand the application and limitations of information technology.

5. 下列关于信息的描述,正确的是:

A.信息可分为自然信息、生物信息、机器信息和社会信息。

B.信息是客观存在的。

C.信息是客观事物的反映,可被人们感知和认识。

D.信息可以口头、书面、信息技术等方式进行传递。

6. 知识是:

A.人们在认识和改造客观世界实践中获得的认识和经验的总和。

B.理论化、系统化的信息。

C.有两类,一类是专业知识;另一类是寻找知识的知识。

D.被激活的信息。情报

7. 关于情报,以下说法是正确的:

A.情报属于知识的一部分。

B.情报的唯一来源是文献。

C.情报具有知识性、传递性和效用性。

D.情报的本质表现在它的专业性。效用性

8. 关于文献,以下说法是正确的:

A.文献是记录有知识的一切载体。

B.文献内容是知识。

C.文献的载体有纸张、光盘、U盘等。

D.记录科技知识的文献叫做科技文献。

9. 关于文献类型的描述,正确的是:

A.按照文献载体的不同,可分为printed form, micro form, audio-visual form, 和electronic form.

B.印刷型文献便于直接阅读,但体积大、存储密度低、占用空间多等。

C.电子型文献容量大、成本低,但必须通过计算机等设备阅读。

D.缩微型文献体积小、成本高,但阅读方便。成本低

10. 关于期刊的描述,正确的是:

A.它的英文术语是journal或者periodical.

B.一般采用统一名称(刊名)。

C.定期或不定期出版。

D.有连续的卷、期号。

11. 关于一次文献的描述,正确的是:

A.它的英文术语是primary literature.

B.是作者根据自己的工作或研究成果等第一手资料写成的文章。

C.其特点是内容有创新性。

D.综述是一次文献的一种。三次文献

12. 关于二次文献的描述,正确的是:

A.它的英文术语是secondary literature.

B.是对一次文献进行收集、分析、整理,并根据其不同的特征按一定规则加以编排而成。

C.专利是二次文献的一种。一次文献

D.是可用于检索一次文献的工具。

13. 关于三次文献的描述,正确的是:

A.它的英文术语是tertiary literature.

B.学位论文是三次文献的一种。

C.是对一次文献进行阅读、分析、归纳、整理,进行概括,重新组织、加工写成的文章。

D.三次文献篇末一定有参考文献。

14. 关于零次文献的描述,正确的是:

A.会议论文是零次文献的一种。

B.可以是没有正式发表的文章。

C.可以是尚未用文字记录的信息。

D.它的英文术语是fragmentary literature.

15. 医学文献发展的特点是:

A.数量庞大、增长迅速。

B.更新周期短、失效期加快。

C.文种单一。

D.交流传播及变化速度加快。

16. 信息检索工具质量评价从以下方面着手:

A.信息收录范围。

B.信息特征提示。

C.信息标引质量。

D.信息报道速度。

17. 关于二次文献描述,正确的是:

A.它的英文术语是secondary literature.

B.是对一次文献进行收集、分析、整理,并根据其不同的特征按一定规则加以编排而成。

C.是可用于检索一次文献的工具。

D.索引是二次文献的一种。

19. 关于三次文献的描述,正确的是:

A.它的英文术语是tertiary literature.

B.是对一次文献进行阅读、分析、归纳、整理,进行概括,重新组织、加工写成的文章。

C.三次文献篇末一定有参考文献。

D.学位论文是三次文献的一种。

20. 关于零次文献定义的描述,正确的是:

A.它的英文术语是fragmentary literature.

B.可以是尚未用文字记录的信息。

C.可以是没有正式发表的文章。

D.笔记是零次文献的一种。

21. 医学文献发展的特点是:

A.数量庞大、增长迅速。

B.文种繁多。

C.更新周期短、失效期加快。

D.交流传播及变化速度加快

22. 关于信息检索类型,正确的是:

https://www.360docs.net/doc/0d13128902.html,rmation retrieval includes document retrieval, fact retrieval and data retrieval.

B.文献检索是查找含有特定内容的文献的检索。

C.事实检索是获取关于某一事件发生时间、地点和过程事实或相关知识的检索。

D.数据检索是直接获取以数值形式表达的量化信息的检索。

23. 关于信息检索语言的说法,正确的是:

A.信息检索语言是人工语言。

B.题名、作者、出处属于外表特征检索语言。

C.主题词、关键词属于内容特征检索语言。

D.关键词属于规范化检索语言

24. 关于分类检索语言的说法,正确的是:

A.《中国图书馆图书分类法》是一种分类语言。

B.在《中图法》中,R代表医药卫生。

C.《中图法》是一种规范化语言。

D.《中图法》以学科分类为基础。

25. 关于主题词的说法,正确的是:

A.主题词有时也叫做款目词。

B.经过严格规范的名词术语或词组。

C.主题词与副主题词是严格的一对一配对。

D.表达同一个概念可以有多个同义词、近义词,但只能有一个主题词。

26. 关键词是:

A.从文献题名、文摘或全文中抽取出的表达文献主题概念,起关键作用、具有实质意义的名词术语。

B.属于自然词范畴,不经规范化程序。

C.能及时反映新出现的主题概念。

D.表达同一个概念的关键词可能不止一个。

27. 关于MeSH描述,正确的是:

A.由美国国立医学图书馆编制的规范化的动态性叙词表。

B.MeSH表中的decriptor(叙词)也叫主题词。

C.MeSH表中的主题词定期更新。

D.MeSH表中的主题词被用于“中国生物医学文献数据库”中。

28. 关于款目词的描述,正确的是:

A.它对应的英文是entry term.

B.MeSH表中的款目词与主题词的关系可用”See”来表达。

C.MeSH表中的款目词如果单独用于检索,容易漏检。

D.MeSH表中的款目词实际上是相应主题词的同义词。

29. 关于副主题词的描述,正确的是:

A.它对应的英文是subheading或者qualifier.

B.副主题词没有独立检索意义。

C.使用副主题词的目的是提高对文献主题标引及检索的专指度。

D.目前有83个副主题词。

30. 关于MeSH树状结构的描述,正确的是:

A.其对应的英文是MeSH tree structure.

B.在CBM数据库中有主题词的树状结构。

C.用于表示主题词之间的上下隶属及派生关系。

D.在CNKI数据库中没有主题词的树状结构。

31. 分析信息特点从以下方面考虑

A.信息的类型

B.出版年代

C.语种

D.出版类型

32. 关于检索效果的评价,正确的是

A.查全率和查准率是两个重要评价指标。

B.当查全率提高的时候,查准率也会提高。

C.当查准率提高的时候,查全率会降低。

D.主题词与副主题词组配有误的时候,会影响查准率。

33. 关于数据库的描述,正确的是

A.数据库是指相互关联的数据在计算机外存储器上有序的集合。

B.数据库的字段是用来描述文献特征的数据项,比如“标题”、“主题词”。

C.数据库的记录由若干字段组成,每条记录都描述原始信息的外表和内容特征。

D.数据库的文档是一部分记录的集合。

34. 有关布尔逻辑检索的描述,正确的是

A.布尔逻辑符包括AND, OR, NOT.

B.增加由AND连接的检索词,检索范围将缩小。

C.增加由NOT连接的检索词,检索范围将扩大。

D.在含有不同逻辑算符的复杂组配中,逻辑运算的先后顺序是( ) > NOT > AND > OR.

35. 有关计算机检索技术的描述,正确的是

A.在有些数据库(如:PubMed)中,China[ti]表示要检索摘要含有China的文章。标题

B.AU=Smith J表示要检索作者为Smith J的文章。

C.在CBM数据库中,“中文标题:青?素”的检索式可能检索出关于青霉素或青蒿素的文章。

D.用”蛋白质作用”进行检索,检索系统会把双引号里面的“蛋白质作用”看作是一个不可分割的整体。

36. 计算机信息检索的描述,正确的是

A.计算机检索系统通常由计算机、通信网络、检索终端设备以及数据库构成。

B.其原理是用户输入提问标识与已存于数据库内的文献特征标识进行匹配比较,凡符合给定的比较原则和逻辑运算条件的就是命中文献。

C.与手工检索相比,计算机信息检索的优点包括检索速度快、效率高,检索内容新、数量大,检索手段灵活、途径多样等。

D.计算机检索是在百度网站中完成。

37. 检索手段包括以下哪几项?

A.布尔逻辑关系检索( and, or, not )

B.截词检索(例如:psycholog*)

C.固定短语检索(例如:"brain ischemia")

D.限定检索字段或检索范围(例如:限制在title字段中)

38. 关于中国知网,以下说法正确的是:

A.又称CNKI(China National Knowledge Infrastructure)

B.由清华大学、清华同方发起,始建于1999年6月

C. Caj全文浏览器是阅读和编辑CNKI系列数据库文献的专用浏览器,支持中国知网的CAJ、NH、KDH和PDF格式文件

D. 收录文献,其出版年代可追溯到1979年1月

39. 关于中国知网,以下说法正确的是:

A.题录摘要免费检索、阅读

B.全文下载或在线阅读按0.5元/页计费

C.个人用户可以注册

D.Caj全文浏览器是唯一可用的浏览工具

40. 关于中国知网,以下说法正确的是:

A.可查到中国博士学位论文全文

B. 可查到中国硕士学位论文全文

C.可查到中国硕士学位论文全文

D.可查到中国重要会议论文全文

41. 关于中国生物医学文献数据库,以下说法正确的是:

A. 也称CBM(China Biomedicine)

B. 属于中国生物医学文献服务系统(SinoMed)的一个子库

C.个人用户可以注册

D. 支持医学主题词检索

42. 关于中国生物医学文献数据库,以下说法正确的是:

A.缺省字段:是中文标题、摘要、作者、关键词、主题词和刊名内容的组合

B. 智能检索:在“缺省”字段,自动实现检索词、检索词对应主题词及该主题词所含下位词的同步检索

C. 精确检索:是检索结果等同于检索词的一种检索,适用于关键词、主题词、特征词、分类号、作者、第一作者、刊名等字段

D.限定条件:可以方便检索者限定文献的年代范围及类型、研究对象年龄组、性别等

43. 关于中国生物医学文献数据库,以下说法正确的是:

A.输入多个检索词,检索词之间若为一个空格,则默认为“AND”运算

B. 检索词可使用的单字通配符是“%”?

C.检索词含有特殊符号“-”、“(”等,用英文半角双引号标识检索词

D.检索词之间可直接使用逻辑运算符“AND,OR和NOT”

44. 关于万方数据知识服务平台,以下说法正确的是:

A.由中国科技信息研究所等单位创建

B.获得中华医学会旗下115种医学核心期刊的独家数字出版权

C.可查到学位论文

D. 支持医学主题词检索

45. 关于维普网,以下说法正确的是:

A.由重庆维普资讯有限公司创建

B.其中的《中文科技期刊数据库》收录了中国境内历年出版的中文期刊12000 余种

C.《中文科技期刊数据库》有包括医药卫生在内的8个专辑

D. 支持医学主题词检索

46. 关于维普网,以下说法正确的是:

A.收录的期刊文献,其出版年代是1989年至今

B.可进行核心期刊检索

C.《中文科技期刊数据库》有包括医药卫生在内的8个专辑

D.可查到SCI收录期刊的影响因子

47. 在PubMed,可查到原文为以下语种的文献:

A.英语

B.汉语

C.法语

D.俄语

48. 在PubMed,可查到以下信息:

A.收录期刊的刊号

B.以英文形式出现的中文文献

C.以中文形式出现的中文文献

D.被SCI收录文献所载期刊的影响因子

49. 二次证据包括以下哪几种?

A.系统评价

B.随机对照试验

C.临床实践指南

D.Meta分析

50. 下列哪些数据库会有二次证据?

A.Cochrane Library

B.中国知网

C.PubMed

D.中国生物医学文献数据库检索系统(CBM)

51. 循证医学实践中,提问的要素包括:

A.患者/人群(patient or population)

B.干预措施(intervention)

C.对比(comparison)

D.结局(outcome)

52. 关于医学论文的结构,正确的是:

A.医学论文的三要素一般可理解为论点、论据和论证方法。

B.论点是依据材料,经过分析提炼而成的一种理性认识。

C.论据是从理论上用以证明论点的材料和依据。

D.论证方法包括综合归纳法、演绎推导法、比较分析法、驳论反证法等。

53. 综述的主体部分是综述的基础和核心,其写法主要有:

A.列举法:将所论述的内容按观点、方法或国家地区归纳成条目一一列举,再进行评述。

B.阶段法:根据课题历史年代不同时期的特点归纳成几个发展阶段,据此进行综述评论。

C.层次法:按课题的学科属性归纳成若干层次,按层次设置标题,逐一进行论述。

D.分析法:在所讨论的问题范围内归纳出几个重要的问题,进行专门分析,亦可将数据和资料列表进行分析。

54. 在撰写论文过程中,找到一篇与您主题相近的论文,在下列哪些情况下应该把它作为参考文献?

A.引用其中一整段文字。

B.引用其中若干句子。

C.引用其中一个句子。

D.把它的内容和思想用自己的话写出。

56. MeSH词表由以下部分构成:

A.字顺表

B.树状结构表

C.副主题词表

D.国际分类表

57. 根据ACRL信息素养标准,有信息素养的学生有能力决定所需信息的性质和范围。其表现指标包括:

A.能定义和描述信息需求

B.可以找到多种类型和格式的信息来源

C.能权衡获取信息的成本和收益

D.必要时能重新评估所需信息的性质和范围

58. 根据ACRL信息素养标准,有信息素养的学生可以有效地获得需要的信息。其表现指标包括:

A.会选择适合的获取信息的方法

B.会制定和实施有效的检索策略

C.会运用线上线下各种方法获取信息

D.必要时会改进现有的检索策略

E.会摘录、记录和管理信息及信息的出处

59. 根据ACRL信息素养标准,有信息素养的学生会评估信息和信息的出处,然后加以学习,补充自身的知识库、丰富自己的价值体系。其表现指标包括:

A.学会总结学习资料的要点

B.能表达并运用信息及其出处的初步评价标准

C.能综合主要思想来构建新概念

D.能通过对比新旧知识来判断信息是否增值,或是否矛盾

E.能决定新的知识对个人的价值体系是否有影响,并采取措施消除分歧

60. 文献是记录有知识的一切载体,其基本要素包括:

A.以知识为内涵

B.以文字、符号、图像等来表现

C.以一定的手段来记录,如印刷术、照相术等

D.以一定的物质载体为文献的外在表现,如纸张、光盘等

61. 正式情报源包括:

A.科技出版社出版的教材

B.未经发表的课堂笔记

C.词典

D.交谈

E.展览

62. 以下属于外表特征检索语言的有:

A.作者

B.刊名

C.关键词

D.作者单位

63. 以下属于规范化检索语言的有:

A.主题词

B.标题词

C.中图分类号

D.关键词

E.摘要(文摘)

64. 以下属于非规范化检索语言的有:

A.主题词

B.标题词

C.中图分类号

D.关键词

E.摘要(文摘)

简易信息检索系统

课程设计报告 ( 2013—2014 年度第一学期) 课程:微机原理及应用 题目:简易信息检索系统 院系:动力工程系 班级:自动化11K2 学号: 指导教师:李冰刘恒涛 设计周数:一周 成绩: 日期:2014年1 月2 日

《微机原理及应用》课程设计 任务书 一、目的与要求 1.通过对微机系统分析和具体设计,使学生加深对所学课程的理解。 2.掌握汇编语言程序设计的基本方法和典型接口电路的基本设计方法。 3.培养学生分析问题、解决问题的能力。 4.培养学生对微型计算机应用系统的基本设计能力。 5.提高学生的实践动手能力和创新能力。 二、主要内容 设计题目:简易信息检索系统。 1.针对所选择的设计题目进行硬件设计,合理选用所需元器件,绘制系统结构框图、硬件接线图,并在实验系统上完成电路的连接和调试。 2.根据所选题目的要求对微机系统进行程序设计,绘制程序总体流程图并编写源程序上机调试。 3.写出课程设计报告,对整个设计过程进行归纳和综合,对设计中所存在的问题和不足进行分析和总结,提出解决的方法、措施、建议和对这次设计实践的认识和收获。 三、进度计划 四、设计成果要求 1.系统硬件设计合理,软件编程达到设计要求。 2.系统硬件结构图和软件流程图绘制清楚规范。 3.设计报告完整规范。 五、考核方式 根据设计任务的完成情况、课程设计报告撰写情况及演示答辩情况采用五级记分制评定成绩。 学生姓名: 指导教师:李冰刘恒涛

一、课程设计目的与要求 1.通过对微机系统分析和具体设计,使学生加深对所学课程的理解。 2.掌握汇编语言程序设计的基本方法和典型接口电路的基本设计方法。 3.培养学生分析问题、解决问题的能力。 4.培养学生对微型计算机应用系统的基本设计能力。 5.提高学生的实践动手能力和创新能力 二、课程设计正文 1.程序正文 stack segment stack db 256 dup(0) stack ends data segment msg0 db '0. 0$' msg1 db '1. 1$' msg2 db '2. 2$' msg3 db '3. 3$' msg4 db '4. 4' msg5 db '5. 5$' msg6 db '6. 6$' msg7 db '7. 7$' msg8 db '8. 8$' msg9 db '9. 9$' index dw msg0,msg1,msg2,msg3,msg4,msg5,msg6,msg7,msg8,msg9 msg db 'Input a number please.',13,10,36 data ends

信息检索考试题库

一、单项选择题 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 知识是指人类对客观世界的认识。知识可分为(C) A.有用知识和无用知识 B.基础知识和高级知识 C.感性知识和理性知识 D.理论知识和实践知识 文献按载体形式可分为:印刷型、缩微型、声像型和(D)A.甲骨型 B金石型 C.电脑型 D.机读型 信息检索系统的功能为:报道文献信息、存储文献信息和(B) A.揭示文献信息 B.检索文献信息 C.宣传文献信息 D.介绍文献信息 检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和(D) A.目次 B.题录 C.附图 D.正文(主文档) 为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的标识叙述是正确的(A) 是题名的标识符 是关键词的标识符 是摘要的标识符 是著者的标识符 以下不是布尔逻辑算符的是(B) B.Near 布尔逻辑算符通常的运算顺序是(A) A.有括号时,括号内的先执行;无括号时 NOT > AND > OR B.有括号时,括号内的先执行;无括号时 NOT > OR >AND C.有括号时,括号内的先执行;无括号时 AND >NOT > OR D.有括号时,括号内的先执行;无括号时 AND > OR > NOT 限定词“in”是为了缩小检索范围,提高检索速度和命中率的。下列检索表述式正确的是(B) A.“信息in OCLC” B.信息in AB” C. 信息in CNKI” D.信息in Calis” 我国高校与公共图书馆的文献资料,一般采用的分类法分类的是(A) A.《中国图书馆图书分类法》 B.《国际十进分类法》 C.《人大法》 E.《科图法》 信息检索的方法有追溯法、综合法和(C) A.须查法 B.倒查法 C.工具法 D.抽查法 CNKI数据库的全文数据输出文件的格式为(D) 和TXT 和VIP 和PDF 和PDF 超星电子图书提供快速检索和高级检索两种检索方式,利用快速检索可以按图书的单项模糊查询,这些单项包括(A) A.书名、作者、索书号和出版日期 B.书名、作者、索书号和出版社 C.书名、作者、分类号和出版社 D.书名、版本、索书号和出版社 读秀知识库是由海量全文数据及元数据组成的超大型 数据库。其提供的中文图书有(B) 万种 万种 万种 D400万种 SCienCe DireCt数据库收录2000多种期刊,其中被ISI 收录期刊种类为(C) SD数据库常用字段中“TITLE-ABSTR-KEY”字段是表示: ( D ) A.题名-作者-关键词 B.题名--作者-摘要 C.作者- 摘要-关键词 D.题名-摘要-关键词 Dialog数据库于1972年正式开始提供商用联机服务, 是世界上最大、历史最悠久的联机检索系统。目前数据 库有( A ) 多种 多种 多种 多种 网络信息资源的一次出版信息包括:网上图书、期刊、 报纸、专利、政府出版物和( D ) A.电子邮件 B.新闻 C.博客 D.会议资料 Google检索框中的两个关键词之间用空格隔开则默认 的连接是( A ) A.“AND”(“与”运算) B.“OR”(“或“运算) C.“NOT”(“非”运算) D.“W”(位置运算) 下列哪个是Google指定文件类型检索(B) A.检索词site: B.检索词filetype: C.检索词insite: D.检索词innurl 百度搜索中能实现精确匹配查询的是(C) A.单引号‘’ B.中括号[] C.双引号“” D.逗号 下列开哪个开放存取学术资源利用平台的名称是正确 的(D) :中图链接服务 : OA资源一站式检索服务平台 :开放存取期刊仓库 J – GATE:开放存取期刊门户 论文摘要的文字必须十分简炼,内容亦需充分概括,字 数一般不超过论文字数的( B ) A.6%, %, %, % 制定检索策略首先要弄清用户的提问要求,并确定要查 找的文献学科范围、类型、文种和(C) A.地点 B.样式 C.时间 D.方位 搜索引擎的由哪几个部分组成(A) A.搜索器、索引器、检索器和用户接口 B.搜索器、编辑器、检索器和用户接口 C.搜索器、索引器、整理器和用户接口 D.查询器、索引器、检索器和用户接口 下列文献哪个“参考文献”的格式著录是正确的(D) A.[1]刘付芬. 黄银安,青少年网瘾对家庭经济危害的 分析及对策,《消费导刊》,2010年第8期,25-28页 B.(1)刘付芬. 黄银安,青少年网瘾对家庭经济危害 的分析及对策,消费导刊,2010(8):25-28 C.<1>刘付芬, 黄银安.青少年网瘾对家庭经济危害的 分析及对策.消费导刊,2010(8):25-28 D.[1] 刘付芬, 黄银安.青少年网瘾对家庭经济危害 的分析及对策.消费导刊,2010(8):25-28 每个被收录的网页,在百度上都存有一个纯文本的备 份,称为:(C) A.百度文档 B.百度相似搜索 C.百度快照 D.百度百科 在百度中如果在特定站点“新浪网中搜索关于“公司治 理”方面的文献信息的检索式为:(B) A. 公司治理intitle:公司治理site: 公司治理inurl: 公司治理filetype:开放存取期刊门户”的网址为:(C) 文献综述的写作步骤包括:选题、查阅文献资料、加 工处理,拟定提纲,撰写成文,反复修改和(A) A.定稿成文 B.定题名称 C.定稿打印 D.定稿腾写 判断一篇文献综述质量高下的分界线是:(D) A.评论 B.综合归纳 C.总结 D.描述 二、多项选择题 (在每小题的备选答案中,可能有一个或多个正确的答 案,请将其代码分别填在题干的括号内,多选、少选、 错选、均无分。) 信息是事物存在的方式和运动状态及其规律的表征,是 事物的一种普遍属性。信息的特征有(A、B、C、D、E) A.客观性 B.时效性 C.传递性 D、共享性 E.中介性 以信息所依附的载体为依据,信息可分为(A、C、D) A.文献信息 B.自然信息 C.口头信息 D.电子信息 E.社会信息 文献是记录有知识的一切载体。构成文献的要素为(A、 B、D、E) A.知识、信息内容 B.信息符号 C.信息类型 D.载体材料 E.记录方式 文献按出版形式区分,可分为十大文献情报源,除图书、 期刊和报纸外下列哪些文献属于十大文献情报源(C、D、 E) A.研究报告 B.宣传手册 C.会议文献 D.政府出版物 E.专利文献 下列属于四大科技报告的有(B、C、D、E) 报告 报告 报告 报告 报告 下列属于零次文献的有(A、B、C、D) A.书信 B.手稿 C.记录 D.笔记 E.研究报告 下列属于一次文献的有(B、C、E) A.论文手稿

信息检索试题94386

(这是我上网搜到的其他院校的《信息检索》试题,有的会考,有的不会考,你要相信自己的直觉!这可以借鉴,不做做题,怎么知道会怎么考嘞。) A卷 一、单选题(20分,每题1分) 1、个人信息源又称为( B )。 A、文献信息源 B、口头信息源 C、生物信息源 D、实物信息源 2、文献是记录有知识的(A)。 A、载体 B、纸张 C、光盘 D、磁盘 3、下列哪种文献属于一次文献(A )。 A、期刊论文 B、百科全书 C、综述 D、文摘 4、下列哪种文献属于二次文献( D )。 A、专利文献 B、学位论文 C、会议文献 D、目录 5、下列哪种文献属于三次文献( C )。 A、标准文献 B、学位论文 C、综述 D、文摘 6、下列选项中属于连续出版物类型的选项有(A )。 A、人民日报 B、学位论文 C、科技期刊 D、会议文献 7、下列选项中属于特种文献类型的有(AD )。??? A、学位论文 B、图书 C、科技期刊 D、标准文献 8、纸质信息源的载体是( D ) A、光盘 B、缩微平片 C、感光材料 D、纸张 9、《中国图书分类法》(简称《中图法》)将图书分成( A ) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。 A、S类目 B、Q类目 C、T 类目 D、R类目 11、使用逻辑“与”是为了(B ) A、提高查全率 B、提高查准率 C、减少漏检率 D、提高利用率 12、使用逻辑“或”是为了(A ) A、提高查全率 B、提高查准率 C、缩小检索范围 D、提高利用率 13、利用文献末尾所附参考文献进行检索的方法是(C ) A、倒查法 B、顺查法 C、引文追溯法 D、抽查法 14、至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为(A )。 A、数据库 B、记录 C、字段 D、文档 15、广义的信息检索包含两个过程(B ) A、检索与利用 B、存储与检索 C、存储与利用 D、检索与报道 16、要查找李平老师所发表的文章,首选途径为(A ) A、著者途径 B、分类途径 C、主题途径 D、刊名途径 17、狭义的专利文献是指(C ) A、专利公报 B、专利目录 C、专利说明书 D、专利索引 18、中国国家标准的代码是( A )

《信息检索系统》方案

HX-2055信息检索系统方案

目录 一项目意义 (2) 二系统设计 (3) 2.1技术原理 (3) 2.2系统构架 (5) 三系统功能 (6) 3.1信息采集 (6) 3.2中文自然语言处理 (6) 3.3全文检索功能 (7) 3.4格式文件检索 (8) 3.5性能指标 (8)

一项目意义 随着互联网的快速发展,每天有数千万条信息生成,包括文字信息、图片信息、视频信息、语音信息等,通过百度、谷歌等大型商业搜索引擎可以找到自己想要的信息,但是也存在很多弊端。 百度、谷歌等大型商业搜索引擎的搜索原理是基于网络爬虫(Spider)在世界各地百万台服务器上爬取网页数据,然后存储到数据库之后展现给查询用户,随着网站数量以及网络上信息更新的快速化,这些网络爬虫不能保证把所有的信息都抓到,尤其是特殊行业的行业信息,即便是抓到了也不一定能够在众多数据中展现出来。所以,对于一个部门来讲,有必要存在一款互联网信息检索系统来检索某一个行业的信息,每天自动在各大行业网站、政府网站等数据库中检索最新信息,通过自建的网络爬虫进行目标数据的抓取、存贮、归类、展现。 通过自己的信息检索系统,可以让自己部门每天轻松地获得世界各地、各个部门都发生了什么,有哪些新的政策,方便管理层在最新的信息数据下快速做出正确的决定。 据统计,内部网上的信息每年以200%的速度增长,其中发布到互联网上的信息只占到信息量的1%-2%,而98%以上的信息是发布在内部网上的。内部网上的信息既有网页形式的,也包含其他Word、PDF、XML等多种格式的数据。因此,面对内部网中海量异构的信息资源,如何帮助用户快速找到他们所需要的信息是一个主要的技术挑战。 搜索引擎能帮助用户方便、快捷、安全地获取内部网上的信息,在满足高效的同时,更重要的是保证了较高的查全率和查准率,能提供智能化的概念扩展搜索,极大的提高工作效率。内部网搜索引擎将组织中分散管理的信息整合在一起,在组织层面上实现新的增值与共享,从而有效实现组织内容利用的最优目标。 搜索引擎的目标是实现内部网全文检索。系统可对实施了内部网站资源进行爬行,无论内部网上的数据源在何地、以何种形式存在,都能够对其快速地访问,通过准确的分词建立索引,从而实现高质量的搜索查询。搜索引擎的主要目标包括:

信息检索试题

信息检索试题 单项选择题: 1、以下各项属于二次信息的是(A ) A、索引 B、期刊 C、学位论文 D、百科全书 2、下列文献中属于一次信息的是( A ) A、专利说明书 B、百科全书 C、目录 D、综述 3、年鉴属于下列哪一类别( D ) A、零次信息 B、一次信息 C、二次信息 D、三次信息 4、( C )是出版周期最短的定期连续出版物。 A、图书 B、期刊 C、报纸 D、学位论文 5、为了有效地存储和传播知识,人类利用各种( C )来记录信息。 A、知识 B、文献 C、载体 D、视听资料 6、报道范围主要为能源方面的科技报告为(D )。 A、AD B、PB C、NASA D、DOE 7、了解各个国家政治、经济、科技发展政策的重要信息源是( B ) A、科技报告 B、政府出版物 C、标准文献 D、档案文献 8、利用截词技术检索“?英语考试”,以下检索结果正确的是(D ) A、英语四级考试 B、英语考试成绩 C、英语考试报名 D、六级英语考试 9、我国最早的分类法是( B) A、《中经新簿》 B、《七略》 C、《四库全书总目》 D、《隋书经籍志》 10、《四级英语阅读与完型填空》这本图书的分类号是( D )。 A、G636.33 B、G216.2 C、I247.4 D、H319 11、按照《中国图书馆分类法》,《新编六级英语阅读解析》这本书应属于哪个类目(A )。 A、H大类 B、I大类 C、T大类 D、O大类 12、《信息检索》这本书的分类号为G252.7,这是按照( B )分类。 A、科图法 B、中图法 C、杜威分类法 D、刘国钧分类法 13、布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A ) A、检索出除了中年教师以外的在职人员的数据

个性化智能信息检索系统研究

个性化智能信息检索系统研究 随着网络应用的普及,网上信息量以惊人的速度增长,并且更新频繁。人们面对的问题不再是缺乏有用信息,而是如何找到自己所需要的信息。传统信息检索技术满足了人们的一定需要,但仍然面临低检准率和低检全率问题。 多数商业搜索引擎提供的信息检索服务,由于其通用的性质,不能满足不同背景、不同目的和不同时期的查询请求。基于这种现状,作者设计并实现了个性化智能信息检索系统,旨在提高信息的检准率。作者在广泛研究了国内外信息检索技术发展现状之后,掌握了目前信息检索系统的不足和发展趋势。 本文针对目前检索系统的缺点,进行了个性化智能信息检索系统研究。本系统是一个结合人工智能领域Agent技术、机器学习技术、聚类技术与现有信息检索系统为一体的个性化智能信息检索系统。本文给出了本系统的总体设计思想和系统体系结构。 详细阐述了本系统个性化智能化的实现方法,对其中应用到的关键性技术和算法进行了详细描述。本系统通过观察用户在与系统交互时的行为,学习用户的兴趣,基于用户个人兴趣对检索结果做个性化过滤处理。经过过滤处理后的文档,其精度显著提高,更加贴近用户的兴趣。 其中Agent模块是本系统的核心模块,它负责获取用户的喜好;创建并及时更新用户兴趣模型;基于用户兴趣模型对文档做个性化过滤。为了实现信息检索的个性化智能化,作者提出使用个人兴趣档案模型来描述用户的兴趣,其中基于主题分类的个人兴趣词库是该模型中体现个人兴趣的关键部分。本文提出应用强化学习方法对个人兴趣模型进行自主更新,应用聚类技术于相关文档的个性化过滤。

经实验验证,这些技术取得了良好的效果。作者在信息检索的个性化智能化领域,进行了有益的探索,并取得一定成果。

全文检索系统整体方案

1全文检索系统方案 1.1全文检索需求 1)系统提供模糊检索、分类搜索、高级复合搜索、全文检索、图片内容 检索、跨库检索等多种检索途径; 2)支持字索引和词索引; 3)检索条件具有完整的关键词布尔逻辑运算AND、OR、NOT能力,支持 复合式布尔逻辑运算查询,并且可以配合多组左括号"("与右括号")"作 关键词查询优先级的设置; 4)提供用户多次递进查询的功能,用户可根据上一次查询关键词得到的 检索结果集,增加查询关键词与缩小搜索日期范围,而得到更准确的 查询结果集; 5)能够支持对以上文件中的中文(简体/繁体)、英文、日语、韩语内容 实现关键字检索; 6)支持对Word、TXT、PDF等多种主流文档格式全文检索,并提供开发 接口以支持特殊文档格式的全文检索; 7)在数据源数据发生更新时,能在索引库中反映出来,保证搜索的信息 为最新,即支持增量索引机制; 8)用户可自行设定时间,让系统自动定时进行更新索引; 9)对于百万级记录数的搜索以及结合模糊搜索等查询方式,搜索时间不 得超过10秒; 10)提供跨数据源、数据格式的搜索;

11)同过相关性搜索,能够把和搜索条件相关联的信息搜索出来; 12)不但能够对图片的描述信息进行搜索,还能对图片内容的检索; 13)提供COM与SOAP的搜索接口(Interface) 可让其它应用程序或查询网 页能够提供用户查询入口和查询结果的呈现,用户可通过应用程序或 浏览器访问全文检索服务器,提交查询条件,可在浏览器中查看检索 结果; 14)查询结果集中应包含结果集总数、命中的结果文件的完整路径,以及 符合关键词出现的内容片断; 15)在搜索结果集中,关键词应被标识出来,用特殊的字体及颜色和其他 文字进行区别,查询者可在查询结果片断中一目了然的看到关键词出 现的位置; 16)查询结果可按照关键词命中次数,命中结果文件的修改时间,大小等 条件进行排序; 17)可提供用户对检索命中结果文件在索引库中进行标记,从而再次检索 时,不在标记过的文件中进行查询; 1.2全文检索系统总体方案 系统将采用以下全文检索流程。

信息检索题库(含答案)

注意: 1、通读教材,根据页码提示完成下列题目。 2、最后一次上机课在线测试,范围不超出如下题 目。 第一章 一、单选 1、报道范围主要为能源方面的科技报告为(D)。A、AD B、PB C、NASA D、DOE{第7页} 2、(C)是出版周期最短的定期连续出版物。A、图书B、期刊C、报纸D、学位论文{第6页} 3、(A )是高校或科研机构的毕业生为获取学位而撰写的。A、学位论文B、科技报告C、会议文献D、档案文献{第6页} 4、了解各个国家政治、经济、科技发展政策的重要信息源是(C)A、科技报告B、政府出版物C、标准文献D、档案文献{第8页} 5、年鉴属于下列哪一类别(D)A、零次信息B、一次信息C、二次信息D、三次信息{第5页} 6、下列哪种文献属于一次文献(A )。A、图书B、百科全书C、综述D、文摘{第4页} 7、下列文献中属于一次信息的是(A )A、专利说明书B、百科全书C、目录D、综述{第4页} 8、以下各项属于二次信息的是(A )A、索引B、期刊C、学位论文D、百科全书{第4页} 二、多选 9、二次信息主要包括(CD)等。A、手册B、年鉴C、目录D、题录{第4页} 10、信息的属性包括(ABCD)A、客观性B、时效性C、传递性D、共享性{第3页} 11、信息素质的内涵主要包括(ABC)。A、信息意识素质B、信息能力素质C、信息道德素质D、信息职业素质{第9页} 12、以下类型的信息属于三次信息的是(BC)。A、目录B、词典C、百科全书D、科技报

告{第4页} 三、判断 13、档案文献具有原始性特点,客观真实地反映了历史。(∨){第8页} 14、年鉴和百科全书属于二次信息。(×){第4页} 15、图书一般不能反映最新的信息,时效性差,相比之下,期刊出版发行速度快,内容新颖。(∨){第6页} 16、文献信息源是各种信息源中检索与利用的主体。(∨){第3页} 17、一次信息也称为第一手资料,如书目和索引。(×){第4页} 18、语言信息源,即零次信息,也就是指非正式的、口头交换的信息。(×){第4页} 19、知识被包含于信息,是信息的组成部分。(×){第2页} 20、专利说明书属于二次信息的范畴。(×){第4页} 第二章 一、单选 21、(D)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。A、查全率 B、查准率 C、误检率 D、漏检率{第43页} 22、《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D)。A、G636.33 B、G216.2 C、I247.4 D、H319{第21页} 23、布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A)A、检索出除了中年教师以外的在职人员的数据B、中年教师的数据C、中年和教师的数据D、在职人员的数据{第34-35页} 24、布尔逻辑检索中检索符号“OR”的主要作用在于(C)。A、提高查准率B、提高查全率C、排除不必要信息D、减少文献输出量{第35页} 25、根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C)。A、目录B、题录C、索引D、文摘{第30页} 26、将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索是(A )A、全文检索B、文献检索C、超文本检索D、超媒体检索{第14页}

中文数据库信息检索

实验5中文数据库信息检索(万方学位论文数据库) 【实验目的】 熟悉万方学位论文数据库的基本情况;掌握其信息检索系统的检索方法以及检索结果的处理;掌握提高查全率和查准率的方法。 学时安排:2 学时 【实验内容】 1、查阅该数据库的检索方式及其检索流程。 2、根据自选检索课题,从上次实验本组检索获取的10篇相关论文中的作者(至少8人)出发,使用作者途径(不限定年份)利用万方数字化期刊全文数据库检索本组课题内容。分别统计每位作者的发表论文分 检索,要求写出:检索课题名称、检索分类序列、检索结果数、5—10条检索命中记录的题录信息(题名、作者、文献出处)。 【实验报告】 1、进入武汉工业学院图书馆主页,点击〖常用数据库〗中的〖万方数据资源系统〗,即可进入图5-1,然后点击〖万方学位论文数据库〗,即可开始检索历程。

2、自选检索课题,如:数据加密技术,使用万方学位论文数据库检索。 图5-2 万方学位论文数据库分类检索页 实验6外文数据库信息检索(EBSCO期刊全文数据库) 【实验目的】 熟悉EBSCO期刊全文数据库信息检索系统的基本情况,掌握外文数据库信息检索系统的检索方法以及检索结果的处理。 学时安排:2 学时

【实验准备】 1、根据在实验3、4、5中的自我选题的查询情况,选择相应的主题检索词并将其翻译成英文(至少3~5个),可以通过阅读已查中文文献中的英文摘要、英文关键词的形式获得。 2、EBSCO期刊全文数据库 (1)访问地址:https://www.360docs.net/doc/0d13128902.html,/ 或https://www.360docs.net/doc/0d13128902.html, (2)使用方法:此服务器不计国际流量,只对我校合法的IP地址开放。(3)内容介绍: 我馆情况:已经购买了其中的ASP(Academic Search Premier)和BSP 包。 学术期刊集成全文数据库(Academic Search Premier,简称ASP):ASP是当今全世界最大的多学科学术期刊全文数据库。包括有关生物科学、工商经济、资讯科技、通讯传播、工程、教育、艺术、文学、医药学等领域的7876种期刊的文摘和索引;3990种学术期刊的全文,全文最早回溯到1990年,索引和文摘最早回溯到1984年。数据每日更新。商业资源集成全文数据库(Business Source Premier,简称BSP):BSP 收录了3048种学术性商业类全文期刊,文摘和索引的收藏更超过3851种期刊。较著名的有华尔街日报(The Walls Street Journal)、哈佛商业评论(Harvard Business Review)、每周商务(Business Week)、财富(Fortune)、American Banker、Forbes、The Economist等,涉及的主题范围有国际商务、经济学、经济管理、金融、会计、劳动人事、银行等。适合高等院校经济学、工商管理、金融银行、劳动人事管理等专业使用。全文最早回溯至1990年。数据每日更新。 3、世界科学出版社全文电子期刊数据库 (1)访问地址:https://www.360docs.net/doc/0d13128902.html, (2)内容介绍: 资源特点:WorldSciNet为新加坡世界科学出版社(World Scientific Publishing Co.)电子期刊发行网站,该出版社委托EBSCO/MetaPress 公司在清华大学图书馆建立了世界科学出版社全文电子期刊镜像站。WorldSciNet目前提供58种全文电子期刊,涵盖数学、物理、化学、生物、医学、材料、环境、计算机、工程、经济、社会科学等领域。我馆情况:从2002年开始订阅。 资源状态:为网络资源,我校用户直接连接在清华的镜像站点使用。4、德国施普林格全文电子期刊数据库 (1)访问地址:https://www.360docs.net/doc/0d13128902.html, (2)使用方法:为网络资源,拥有我校合法IP的用户,直接连接施普林格在清华的镜像站点使用。 (3)内容介绍: 资源特点:德国施普林格(Springer-Verlag)是世界上著名的科技出版集团, 通过Springer LINK系统提供学术期刊及电子图书的在线服务。目前Springer LINK所提供的全文电子期刊共包含439种学术期刊(其中近400种为英文期刊),是科研人员的重要信息源。我馆情况:从2002年开始订阅。 【实验内容】

信息检索考试题汇总(附答案)

一、单项选择题(从下列各题四个备选答案中选出一个正确答案,并将其代号写在答题纸相应位置处。每题2分,共30分) C 1. _是题录型检索工具 A. CABI B.中国学术期刊文摘 C.全国报刊索引(自然版) D.经济纵横 D 2. 浏览超星数字图书馆,应首先安装______. A. Apabi Reader B. Adobe Reader C. CAJ Viewer D. SSReader A 3. 世界上第一大联机检索系统是__。 A.DIALOG系统 B.OBRIT系统 C.OCLC系统 D.STN 系统 B 4. 利用baidu搜索信息时,要将检索范围限制在网页标题中,应该使用的语法是_________。 A.site: B.intitle: C. inurl: https://www.360docs.net/doc/0d13128902.html,: A 5.国际农业和生物科学中心英文名称的简称为_ 。 A.CABI B. AGRINDEX C. BA D.B of A C 6.信息检索根据检索对象不同,一般分为_____________。A. 二次检索、高级检索 B.分类检索、主题检索 C.数据检索、事实检索、文献检索 D.计算机检索、手工检索 A 7. 国际上评价期刊最有影响力的一个指标是 _______。 A. 影响因子 B.读者统计数据 C.引文量 D.价格 C 8. 二次检索指的是:_____________。 A.第二次检索 B.检索了一次之后,结果不满意,再检索一次C.在检索结果中运用“与、或、非”进行再限制检索 D.以上都不是 A 9.国际连续出版物编号____________。 A.ISSN B.OCLC C.ISBN D. CSSCI B 10.下列搜索引擎具有书名号检索功能的有_____________。A.Google B.百度 C.中搜 D.AltaVista B 11.《中文核心期刊要目总览》2004 版的“农业经济”类核心期刊有___ 种。 A.20 B.19 C.17 D.15 B 12.通过追溯检索获得的相关文献与原文献相比在发表时间上____。 A.早 B.晚 C. 相同 D. 不确定 B 13.在维普中文期刊全文数据库中“在检索结果中”检索相当于。 A.逻辑“非” B.逻辑“与” C.逻辑“或” D.逻辑“加” D 14.检索语言中,是自然语言。 A.标题词 B.主题词 C.单元词 D.关键词 A 15.在baidu搜索引擎中,要实现字段的精确检索,可以用来限定。 A.“”(双引号) B.()(括号) C.+ (加号) D.-(减号) 二、判断正误(在正确答案后面划√,在错误答案后面划×,每小题2分,共10 分) 1.专利文献根据发明创造的性质可以分为发明、实用新型和外观设计专利。(√) 2. CNKI检索系统可以检索博硕士论文。(√) 3. Google不具有学术搜索功能。(×)4.国际标准书号的英文简称ISBN,新版国际标准书号2007年正式实施,国际标准书号由10位升至13位。(√) 5.检索效果的评价指标主要有查全率和漏检率。(×) 1.NSTL是(国家科技图书文献中心)的简称。 2.(信息检索系统)是指由一定的设备和信息集合构成,具有一定存储、检索与传送技术设备,提供一定的存贮与检索方法及检索服务功能的工作系统。 3.体系分类表通常由(类目表、标记符号、说明和注释、类目索引)4个部分组成。 4. 正式出版的中文期刊在检索工具和数据库中一般著录有国际标准刊号(ISSN)和国内统一刊号(CN)。 5. 缩写刊名“J.Anal.Chem.”还原成原刊名为(Journal of Analytical Chemistry)。 6. CASHL是指(中国高校人文社会科学文献中心),其英文全称是China Academic Social Sciences and Humanities Library,是全国性的、唯一的人文社科外文期刊收藏和服务中心。2002年开始规划建设,2004年3月15日正式启动 7. 电子期刊,指以(数字或称电子)形式出版发行的期刊,英文为(electronic Journal),简称e-journal. 8. 国家知识基础设施(National Knowledge Infrastructure,NKI)的概念,由世界银行提出于1998年。CNKI是指(中国基础知识设施工程),它是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于(1999)年6月。 https://www.360docs.net/doc/0d13128902.html,KI平台的检索方式有(单库检索)、(跨库检索)、(数据库导航),在单库和跨库检索中有(初级)、(高级)、(专业)三种检索方式。 10.(报告号)是识别科技报告的显著标志。 11. 专利文献著录中,除了和专利有关的(专利名称)、(发明人)和(专利权人)等之外,还著录有(专利公布号)、(国际专利分类号)、(优先权号),有的还有申请号和申请日期、公布日期等。 13. 分类检索语言又称分类法,是用(分类号)和(类名)来表达信息的主题概念,并且按照知识门类的逻辑次序将信息系统地组织和划分的语言。 14. 对于刊名缩写,国际标准化组织ISO在1972年和1974年分别发布了两个相关标准,规则要点有: 1)刊名中的(前置词、冠词、连词)均省略; 2)刊名必须有(两个)词以上才可用缩写; 3)单词的缩写大多数采用(减少音节)的方法,如“Chemistry”缩写成(chem),只有极少数常用单词用首字母表示,如“Journal”缩写成(J); 4)刊名缩写时,刊名第一个单词的首字母一定要(大写)。 15、完整的信息检索系统是由( 检索 )和( 存贮 )两部分构成。 16、文献内容特征的检索途径主要有( 主题 )和 ( 分类 )。 17、文献检索方法分为( 常用法)、(追溯法)和(循环法)。 18、写出下列各国国家标准代号:中国(GB ) 、美国 (ANSI) 、英国 (BSI ) 、日本(JIS)

信息检索与利用(本科)试题及答案

文件检索 1、个人信息源又称为( B )。 A、文献信息源 B、口头信息源 C、生物信息源 D、实物信息源 2、文献是记录有知识的( A)。 A、载体 B、纸张 C、光盘 D、磁盘 3、下列哪种文献属于一次文献(A)。 A、期刊论文 B、百科全书 C、综述 D、文摘 4、下列哪种文献属于二次文献( D )。 A、专利文献 B、学位论文 C、会议文献 D、目录 5、下列哪种文献属于三次文献( C )。 A、标准文献 B、学位论文 C、综述 D、文摘 6、下列选项中属于连续出版物类型的选项有( A )。 A、人民日报 B、学位论文 C、科技期刊 D、会议文献 7、下列选项中属于特种文献类型的有( A )。 A、学位论文 B、图书 C、科技期刊 D、标准文献 8、纸质信息源的载体是( D) A、光盘 B、缩微平片 C、感光材料 D、纸张 9、《中国图书分类法》(简称《中图法》)将图书分成( A ) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。A、S类目 B、Q类目 C、T 类目 D、R类目 11、使用逻辑“与”是为了( B) A、提高查全率 B、提高查准率 C、减少漏检率 D、提高利用率 12、使用逻辑“或”是为了(A ) A、提高查全率 B、提高查准率 C、缩小检索范围 D、提高利用率 13、利用文献末尾所附参考文献进行检索的方法是( C ) A、倒查法 B、顺查法 C、引文追溯法 D、抽查法 14、至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为(A )。 A、数据库 B、记录 C、字段 D、文档 15、广义的信息检索包含两个过程(B ) A、检索与利用 B、存储与检索 C、存储与利用 D、检索与报道 16、要查找李平老师所发表的文章,首选途径为(A ) A、著者途径 B、分类途径 C、主题途径 D、刊名途径 17、狭义的专利文献是指(C ) A、专利公报 B、专利目录 C、专利说明书 D、专利索引 19、政府出版物主要包括两大类型的文献( B ) A、专利与标准 B、行政文件与科技文献 C、图书与期刊 D、档案与标准 20、ISBN是( B )的缩写A、国际标准刊号 B、国际标准书号 C、连续出版物代码 D、国内统一刊号 二、多选题(20分,每题2分) 1、文献的构成要素( A B C )A、信息内容 B、载体材料 C、信息符号 D、纸、光盘 2、下列各项哪些属于文献( A B C ) A、图书、期刊 B、光盘、磁盘 C、光盘数据库 D、纸张 3、期刊论文的外部特征有( A B C D ) A、文献题目 B、著者 C、文献出处 D、主题词 4、图书的外部特征有( A B C D ) A、分类号 B、著者 C、书名 D、出版社 5、检索词包括规范化词和非规范化词,下列选项中属于规范化词的有( A C D )。 A、叙词 B、标题词 C、关键词 D、主题词 6、著者(责任者)途径主要是通过( A B )进行检索。 A、著者索引 B、专利权人索引 C、主题索引 D、号码索引 7、以文献的外部特征为检索途径的有( B C D ) A、主题途径 B、分类途径 C、题名途径 D、责任者途径 8、信息检索按其检索手段划分,可以分成( A C ) A、计算机检索 B、文献检索 C、手工检索 D、全文检索 9、世界三大农业数据库是指( A B D ) A、CABI B、AGRIS C、EBSCO D、AGICOLA 10、印刷型检索工具常用的三种途径是(A B D) A、著者途径 B、分类途径 C、主题途径 D、刊名途径

《信息检索系统》方案

HX-2055信息检索系统方案 目录 一项目意义 随着互联网的快速发展,每天有数千万条信息生成,包括文字信息、图片信息、视频信息、语音信息等,通过百度、谷歌等大型商业搜索引擎可以找到自己想要的信息,但是也存在很多弊端。 百度、谷歌等大型商业搜索引擎的搜索原理是基于网络爬虫(Spider)在世界各地百万台服务器上爬取网页数据,然后存储到数据库之后展现给查询用户,随着网站数量以及网络上信息更新的快速化,这些网络爬虫不能保证把所有的信息都抓到,尤其是特殊行业的行业信息,即便是抓到了也不一定能够在众多数据中展现出来。所以,对于一个部门来讲,有必要存在一款互联网信息检索系统来检索某一个行业的信息,每天自动在各大行业网站、政府网站等数据库中检索最新信息,通过自建的网络爬虫进行目标数据的抓取、存贮、归类、展现。 通过自己的信息检索系统,可以让自己部门每天轻松地获得世界各地、各个部门都发生了什么,有哪些新的政策,方便管理层在最新的信息数据下快速做出正确的决定。 据统计,内部网上的信息每年以200%的速度增长,其中发布到互联网上的信息只占到信息量的1%-2%,而98%以上的信息是发布在内部网上的。内部网上的信息既有网页形式的,也包含其他Word、PDF、XML等多种格式的数据。因此,面对内部网中海量异构的信息资源,如何帮助用户快速找到他们所需要的信息是一个主要的技术挑战。

搜索引擎能帮助用户方便、快捷、安全地获取内部网上的信息,在满足高效的同时,更重要的是保证了较高的查全率和查准率,能提供智能化的概念扩展搜索,极大的提高工作效率。内部网搜索引擎将组织中分散管理的信息整合在一起,在组织层面上实现新的增值与共享,从而有效实现组织内容利用的最优目标。 搜索引擎的目标是实现内部网全文检索。系统可对实施了内部网站资源进行爬行,无论内部网上的数据源在何地、以何种形式存在,都能够对其快速地访问,通过准确的分词建立索引,从而实现高质量的搜索查询。搜索引擎的主要目标包括:(1)较高的查准率。搜索系统支持按词索引、按字索引,同时实现中文自动分词。 (2)较高的查全率。搜索系统可搜索各类异构的信息资源,包括传统的网页信息、Word、PDF、XML等不同格式的文档以及各类主流数据库的表中记录。 (3)智能化的检索结果排序。安全搜索系统应采用相关度分析技术,将用户需要的信息排在结果列表的前面,屏蔽无用和错误的信息。 二系统设计 技术原理 HX-2055互联网信息检索系统(以下简称HX-2055)是针对特殊行业、政府部门、决策部门设计的一款高效率互联网信息检索系统,采用国际一流程序算法设计,系统构架与谷歌和百度的搜索引擎拥有共同的技术特点,能够保证系统对实时信息的快速采集、归类、展现。 在当今信息爆炸的时代,每个单位或个人都在为信息的快速增长做出了各种贡献。信息的种类也在不断的扩展,越来越多的非结构化信息不断出现,包括企业的各种报表、帐单、电子文档、网站的各种元素、图片、传真、扫描影像,以及大量的多媒体的音频、视频信息等等。所有的存储数据中,有85%采用的是非结构化格式的,非结构化信息每三个月增长一倍。由于信息格式的差异很大,所以基本无法整合为统一的接口供政府工作人员或广大群众方便使用。 全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。 全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。全文检索系统的核心则具有建立索引、处理查询返回结果集、增加索引、优

2013文献检索试题样题

信息检索试题样板 一、单选题( 30 分,每题 1 分) 1、个人信息源又称为(B)。 A 、文献信息源B、口头信息源C、生物信息源D、实物信息源 2、文献是记录有知识的(A)。 A 、载体B、纸张C、光盘D、磁盘 3、下列哪种文献属于一次文献(A)。 A 、期刊论文 B 、百科全书C、综述 D 、文摘 4、下列哪种文献属于二次文献(D)。 A 、专利文献 B 、学位论文C、会议文献 D 、目录 5、下列哪种文献属于三次文献(C)。 A 、标准文献 B 、学位论文C、综述 D 、文摘 6、下列选项中属于连续出版物类型的选项有( C )。 A 、人民日报 B 、学位论文C、科技期刊 D 、会议文献 7、下列选项中属于特种文献类型的有(D)。 A 、学位论文 B 、图书C、科技期刊 D 、标准文献 8、纸质信息源的载体是(D) A 、光盘B、缩微平片C、感光材料D、纸张 9、《中国图书分类法》(简称《中图法》)将图书分成 (A) A5大部分22 个大类B5大部分26 个大类 C 6 大部分 22 个大类 D 6大部分 26 个大类 10、 A)类目下查找。 《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A、S类目 B、Q 类目 C、T 类目 D、R 类目 11、使用逻辑“与”是为了(A) A 、提高查全率B、提高查准率C、减少漏检率 D 、提高利用率 12、使用逻辑“或”是为了(B) A 、提高查全率B、提高查准率C、缩小检索范围 D 、提高利用率 13、利用文献末尾所附参考文献进行检索的方法是( C ) A 、倒查法B、顺查法C、引文追溯法D、抽查法 14、至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为(A)。 A 、数据库B、记录C、字段D、文档 15、广义的信息检索包含两个过程(B) A 、检索与利用B、存储与检索C、存储与利用 D 、检索与报道 16、要查找李平老师所发表的文章,首选途径为( A ) A 、著者途径 B 、分类途径C、主题途径D、刊名途径 17、狭义的专利文献是指( B ) A 、专利公报B、专利目录C、专利说明书 D 、专利索引 18、中国国家标准的代码是(A) A 、G B B、CB C、 ZG D、CG 19、政府出版物主要包括两大类型的文献(B) A 、专利与标准B、行政文件与科技文献C、图书与期刊 D 、档案与标准 20、 ISBN 是(B) 的缩写 A 、国际标准刊号 B 、国际标准书号C、连续出版物代码D、国内统一刊号

相关文档
最新文档