信息检索

google搜索引擎检索性能评价

Google搜索引擎检索性能评价 2012/12/9

Google搜索引擎检索性能评价 摘要: 网络信息和信息检索技术的发展推动了搜索引擎实践的发展,使得搜索引擎评价研究成为信息检索领域的研究热点之一。本文以搜索引擎检索结果的相关性为核心指标,对Google搜索引擎的检索性能进行了评价,旨在帮助用户在利用搜索引擎时选取恰当的检索策略。 关键词:搜索引擎信息检索评价相关性 Abstract: The development of Internet information and technologies of information retrieval accelerates the development of search engine. It has made the study of evaluation of search engine to be one of the popular issues in the field of information retrieval. This paper takes relevance of retrieval results as index to evaluate the performance of Google. The finding can be used to assist users in formulating an appropriate search strategy. Keywords:search engine; information retrieval; evaluation; relevance 前言 研究背景: 根据2012年7月由中国互联网络信息中心(CNNIC)公布的中国互联网络发展状况统计报告显示截至2012年6月底,中国网民数量达到5.38亿,互联网普及率为39.9%。伴随着如此巨大规模的网络用户而来的是海量的互联网信息,面对这些信息,用户们不免迷失于此,网络信息资源的无限增长与用户有限的效用信息需求之间的矛盾便日益凸显[1]。因此用户利用搜索引擎辅助,以尽可能得到自己所需信息也就是很自然的了。据上述报告,截至2012年6月底,搜索引擎用户规模达到4.29亿,较2011年底增长2121万人,半年增长率为5.2%;在网民中的渗透率为79.7%,使用比例与2011年6月、12月基本持平,是仅次于即时通信的第二大网络应用。但是,即使使用搜索引擎,也难免不能获取所需信息,研究表明,公认最好的搜索引擎,其检索结果中的相关信息也不会超过50%。[2]所以如何使搜索引擎用户能够获取所需信息,在信息研究领域便显得尤为重要。而这则一定离不开搜索引擎的评价研究,通过调查搜索引擎的检索性能并进行评价研究,对搜索引擎的改进将起到很大帮助。 研究目的 从上个世纪90年代初到现在,短短的20余年间搜素引擎的发展发生了巨大的变化,不断地有新的搜素引擎出现,同时也有一些搜素引擎退出了历史舞台。因此搜索引擎市场千变万化,要对它们全部进行评价研究还不现实。经过综合考虑搜素引擎的流行度与所占市场份额,笔者选取Google作为典型案例加以分析。Google当前以83.33%的搜索量占据搜素引擎

索引与查询性能

第14章索引与查询性能 索引中文词典解释根据一定需要,把书刊中的主要内容或各种题名摘录下来,标明出处、页码,按一定次序分条排列,以供人查阅的资料。如果一本书籍没有目录,要想快速检索出想要查询的资料,就只有逐页查找,这种方式效率极其底下。数据库中的索引也类似于书籍目录相同的功能。 索引是有效使用数据库系统的基础,当表中的数据量较小时,使用索引和不使用索引带来的性能差异不大;但当表中的数据量极大时,就一定需要索引的辅助才能有效的存取数据。 一般索引建立的是否适当,是决定性能好坏的关键。并由于更改索引结构不会影响数据字段的定义,也就是前端程序可以照常存取,因此当上线后的应用程序使用效率比较低的时候,可以尝试建立或优化所以,从而提高应用软件的性能。 SCMDB示例数据库中表的数据量较小,无法演示使用索引带来的效率提升。本章采用微软示例数据库AdventureWorks作为演示数据库。希望通过以下的测试,给读者一个感性认识。 【演示】查询表SalesOrderDetail中销售订单编号在48077-48080范围内的订单编号、产品ID以及订单数量。 【分析】表SalesOrderDetail的记录数为121317,其中Sales前缀为架构名称。通过参数set statistics time on开启统计时间。图14-1所示为在表SalesOrderDetail使用聚集索引后的演示效果,时间执行时间仅仅为1毫秒。图14-2所示为删除聚集索引后的运行时间为27毫秒。表中的数据量越大,使用索引与不使用索引带来的性能上的差异性越大。 图14-1 使用索引进行查询 图14-2 没有使用索引进行查询 14.1 索引的分类 SQL Server中索引分为两种类型:聚集索引(Clustered Index)和非聚集索引(Non Clustered Index),也可称为聚簇索引和非聚簇索引。

信息检索-多选题

多选题 1. 当检出的文献量小于期望时,可以尝试以下方法扩大检索范围: A.删除某些用AND连接的次要的检索词。 B.增加用OR连接的检索词。 C.检索词后用截词符。 D.选用上位主题词扩检。 2. 当检出的文献量过多,其中一部分文献并非真正需要时,可以尝试以下方法缩小检索范围: A.增加用AND连接的检索词。 B.减少用OR连接的检索词。 C.选用下位主题词检索。 D.在原用副主题词的基础上,增加其它副主题词来检索。 3. In terms of information literacy, an information literate student is able to A.determine the nature and extent of the information needed and access needed information effectively and efficiently. B.evaluate information and its sources critically and incorporate selected information into his or her knowledge base and value system. https://www.360docs.net/doc/1b12368387.html,e information effectively to accomplish a specific purpose individually or as a member of a group. D.understand many of the economic, legal, and social issues surrounding the use of information and access and use information ethically and legally. 4. Management of Information is one of the seven requirements in Global minimum essential requirements (GMER) in medical education, which requires a medical practitioner to be able to A.search, collect, organize and interpret health and biomedical information from different databases and sources. B.retrieve patient-specific information from a clinical data system. https://www.360docs.net/doc/1b12368387.html,e information and communication technology to assist in diagnostic, therapeutic and preventive measures, and for surveillance and monitoring health status. D.understand the application and limitations of information technology. 5. 下列关于信息的描述,正确的是: A.信息可分为自然信息、生物信息、机器信息和社会信息。 B.信息是客观存在的。 C.信息是客观事物的反映,可被人们感知和认识。 D.信息可以口头、书面、信息技术等方式进行传递。 6. 知识是: A.人们在认识和改造客观世界实践中获得的认识和经验的总和。

百度搜索引擎查询外部链接命令

百度搜索引擎查询外部链接命令 百度搜索引擎是没有查询外部链接的命令,只能使用“domain”命令来查询含有当前网址的结果页面。有的朋友会说查询外链可以使用雅虎搜索引擎就可以了,不过大家应该都知道,相关域的数量和质量对网站权重的提升也有作用,而domain命令返回的结果是否是真实的相关域数量呢? 曾经看到过很多网站收录一百万,查询其网站相关域的时候会发现数量远远超过一百万,这是什么情况呢?DOMAIN查询出来的结果中只是显示了包含有您查询的网址的页面,不管这个页面来自哪里,这样查询出来的结果中肯定会包含很多自己的页面,甚至是所有site查询出来的所有结果都在domain查询中出来了,因为域名也是被搜索的对象。而“-”的命令是减去的意思,意思很容易理解,但如何更好的利用才是关键,就比如刚刚的情况,想要得到网站在百度的相关域的准确数据可以使用这个组合命令,命令解释为查询当前域名在百度的相关域的数量并减去当前域名在百度收录的数量,那么得到的结果自然就是当前域名的百度的相关域数量的准确值了。 还有一个问题给大家解释一下,那就是很多站长在DOMAIN自己网站的时候会发现本来查询数量为几千,但是翻页后却发现只有几百个了,这种情况其实很好解释,那就是你在发外链的时候网址局限性比较大,很多查询结果都源自固定的几个或十几个网站,百度为了节省资源而省略了一个网站下的多个查询结果,所以一般在结果的最后一页都有提示:为了提供最相关的结果,我们省略了一些内容相似的条目,点击这里可以看到所有搜索结果。再细心点的网友还发现即使点了那个链接后再来看,翻到后面也不一定会显示跟原来一样的结果,甚至当你翻到最后一页的时候你算下页数计算出总数后跟百度提供的数据还是对不上,我的理解是这样的,因为百度数据库非常大,可能其中一样数据都被分在很多服务器上,所以查询时不同的服务器给出的结果会对不上。

信息检索第一次作业

信息检索课作业一 姓名: 张雯馨专业:数学1701 学号 20172499 一、填空(10题) 1、广义的“信息检索”是指将信息资源按照一定的方式(组织)和(存储) 起来,并根据用户的信息需求按照一定的程序找出有关信息的过程和方法。 2、在信息检索方法中,回溯法也称为引文法或(参考文献法),是利用文献末尾 所附的参考文献或引用文献,由近及远地进行逐一追踪检索。 3、在检索方法中,输入aero* 能够检出aeroplane、aeronautics、aerodynamic、 aerobic等词的记录,这种方法称为(截词)检索。 4、信息检索评价的效果主要有两项指标:(查全率)和(查准率)。 5、分类法有很多种,中国古代最著名、最常用的是“四分法”。诗集、词集、词 韵一类的书应收入四分法中的(集)部。 6、《普通高等学校图书馆规程》总则第二条规定:高等学校图书馆(以下简称" 图书馆)是学校的文献信息资源中心,是为人才培养和科学研究服务的(学术) 机构。 7、印度著名的图书馆学家阮冈纳赞提出了“图书馆学五定律”,包括:书是为了 用的、每个读者有其书、每本书有其读者、节省读者的时间、(图书馆是一个生 长着的有机体)。 7、文献有四个构成要素:信息知识、记录符号、(载体材料)、制作方式。 9、中国专利分为发明专利、(实用新型专利)和外观设计专利。 10、AND、OR、NOT属于信息检索方法中的(布尔)逻辑检索。 二、单项选择(10题) 1、《中图法》的类号采用拉丁字母和阿拉伯数字相结合的混合号码制,一个字母

标志一个大类。其中I和T分别代表( C )类目。 A.文学,艺术 B.艺术,交通运输 C.文学,工业技术 D.艺术,工业技术 2、“图书馆学”一词,最早由谁提出来的?( B ) A.刘国钧 B.施莱廷格 C.阮冈纳赞 D.刘向(西汉) 3、如果想查找历年的统计数据,应通过哪类检索工具?( D ) A.字典 B.百科全书 C.手册 D.年鉴 4、CAJViewer是下列哪个数据库全文的阅读软件?( C ) A.读秀学术搜索 B.维普期刊全文库 C.清华同方(CNKI) D.中国数字图书馆 5、WITH是位置运算符,“information(W)retrieval”表示information与retrieval两个词同时出现在( A )中。 A.字段 B.文摘 C.题名 D.记录 6、文献类型标识有不同的含义,如M代表图书,J代表期刊,那么,D代表什么?( B ) A.会议文献 B.学位论文 C.专利 D.标准 7、下列哪个数据库属于文摘型数据库?( A ) A.ScienceDirect(Elsevier) B.Springer 电子图书 C.Medline D.JSTOR数据库 8、位置检索是常用的计算机信息检索技术,如:water(3W)pollution的含义是:( C ) A. water 和 pollution必须同时出现在文献中,且必须间隔3个词,词序可以颠倒。 B. water 和 pollution必须同时出现在文献中,且必须间隔3个词,词序不可以颠倒。 C. water 和 pollution 必须同时出现在文献中,且最多间隔3个词,词序不可以颠倒。 D. water 和 pollution 必须同时出现在文献中,且最多间隔3个词,词序可以颠倒。 9、关于“读秀学术搜索”文献传递服务功能中,下列哪个说法是正确的?( D )

文献检索的基本内容

1、CA由哪两部分组成 CA有文摘和索引两大部分组成 2、布尔逻辑算符的名称、符号和作用。 (1)逻辑与用符号“and”或“*”表示,其逻辑表达式为:A and B或A*B;其意义为检索记录中必须同时含有检索词A和B的文献,才能命中文献。用途及检索功能:用于缩小检索范围,提高查全率。 (2)逻辑或用符号“or”或“+”表示,其逻辑表达式为:A or B或A+B;其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A或B的,均为命中文献。 (3)逻辑非用符号“not”或“-”表示,其逻辑表达式为“A not B”或“A-B”其意义为检索记录中含有检索词A,但不能含有检索词B的文献,才能算中文献。用途及检索功能:用于缩小检索范围,提高查准率。 3、在CNKI数据库上,检索一篇专业相关文献并写出以下内容: 文献题目:乙烯氢酯基化合成丙酸酯的催化及反应工程研究 作者姓名:徐魁文献出处:中国博士学术论文全文数据库 关键词:催化;化学反应工程;乙烯;甲酸甲酯;丙酸甲酯;氢酯基化反应;叶轮;质量传递 摘要:甲酸甲酯作为新的碳源,在羰基合成化学中的作用越来越受到重视。丙酸甲酯是重要的有机化工原料,在过去的研究中大多是利用CO+CH3OH与乙烯氢酯基化反应而合成。随着甲酸甲酯化学的兴起,利用甲酸甲酯使烯烃氢酯基化反应合成羧酸酯的研究便成为这一领域研究的热点。本文针对乙烯与甲酸甲酯氢酯基化反应合成丙酸甲酯的催化反应过程,主要研究了适合该反应的催化剂体系、催化反应工艺条件和催化反应动力学规律,在此基础上进一步探讨了乙烯与甲酸甲酯氢酯基化反应在间歇搅拌反应釜中实施的条件,并根据间歇搅拌反应釜的特点,设计出了适合该反应体系的虹吸式涡轮搅拌器。主要的研究内容与结论如下:1.在高压间歇搅拌反应釜拌中,就CH3ONa、PdCl2、Pd(OAc)2和RuCl3等四种物质,在多种溶剂、促进剂和配位体作用下,分别评价了它们对乙烯和甲酸甲酯氢酯基化反应的催化活性,通过实验得出,CH3ONa基本没有活性,过量的CH3ONa将导致甲酸甲酯发生严重的脱羰基化反应。PdCl2和Pd(OAc)2在DME 作溶剂,配位体Ph3P和dppb作用下,表现出一定的活性,丙酸甲酯的收率为5.45%;在DMF作溶剂时,RuCl3的实验结果表明其活性最高,由N(C2H5)3分别和N(C2H5)4I、N(CH3)4I、C2H5I、n-C4H9I等四种碘化物组成最理想的促进剂,当催化剂、碘化物、三乙胺的比列为1:2:5或1:2:10时活性最好,

基于内容的视频分析与检索

摘要文章简要介绍了从基于内容地视频分析与检索问题地提出到所涉及地关键 技术以及目前研究状况,并简要介绍了现阶段在这方面地研究热点及以后要做地工作. 一、问题地提出: 互联网地出现给人类带来了很大地便利,特别是实现资源共享之后地互联网,但面对这浩如烟海地资源到底哪些是对自己有利用价值地呢?而90年代以来,多媒体技术和网络技术地突飞猛进,人们正快速地进入一个信息化社会.现代技术已能运用各种手段采集和生产大量各种类型地多媒体信息数据,出现了数字图书馆、数字博物馆、数字电影、可视电话、交互电视、会议电视、点播视频服务、远程教育以及远程医疗等多种新地服务形式和信息交流手段,在众多地多媒体信息中最大也是最主要地一种就是视频信息,人类接受地信息约有70%来自视觉, 视频所携带地信息量远远大于语音和数据.在视频信息高度膨胀地今天,随之而来地问题就是对海量视频信息地高效检索和浏览,即人们如何快速有效地查看大量地视频信息,并从中找出自己感兴趣地内容.b5E2RGbCAP 传统地视频信息检索方案是使用文字标示符进行检索,具体到对视频帧地查询是借助对帧图像地编号和注释来进行地,首先给帧图像加上一个对其描述地文字或数字注释,然后在检索时对注释进行检索,这样一来对帧图像地查询就变成了基于注释地查询.这种方法虽然简单,但不能完全满足对视频数据检索地需要,首先视频数据量很大,用手工方式添加注释工作量很大,而且效率很低;其次视频内容丰富很难用文字标签完全表达;再次文字描述是一种特定地抽象,特定地标签只适合特定地查询;最后文字标签是靠观察者加上去地,因此受主观因素地影响,[1].从而需要一种客观全面地视频自动检索方法,不同地观察者可能有不同地描述基于内容地视频检索(Content-Based Video Retrieval,CBVR>应运而生.它根据视频地内容及上下文关系,对大规模视频数据库中地视频数据进行检索.提供这样一种算法:在没有人工参与地情况下,自动提取并描述视频地特征和内容.区别于传统地基于关键字地检索手段.融合了图像理解、模式识别、计算机视觉等技术.p1EanqFDPw 近年来随着多媒体信息在娱乐、商业、生产、医学、安全、国防、军事等领域地大量应用,基于内容地视频检索技术己经成为近年来国内外研究地热点问题研究视频数据地高效分类、处理和索引技术,建立和完善视频信息地快速浏览检索机制,开发功能强大、使用便捷地视频信息浏览检索系统,既具有极大地理论价值,也具有巨大地应用潜力.DXDiTa9E3d 二、解决方案: 视频标注:视频标注是通过人工地方式将某一段视频进行主观地属性标注,然后以文本地方法进行检索.视频标注技术己相当成熟,但有其固有地不足,第一,要人工手动完成,工作量极大,且效率很低.第二,某些视频和感知特征很难用文字来描述.第三,主观性很强,没有统一地标准,不同地人对同一段视频有不同地理解,必然导致不同地标注结果.RTCrpUDGiT 视频摘要:视频摘要以自动或半自动地方式,从原视频中提取有意义地部分,

化学结构式检索

化学结构式检索 第一部分:学习数据库 Dialog系统可以进行结构式检索的数据库: Beilstein Facts (File 390) Derwent Chemistry Resource (File 355) IMS Patent Focus (File 447,947) IMS R&D Focus (File 445,955) Index Chemicus (File 302) Pharmaprojects (Files 128,928) Prous Science Drug Data Report (File 452) Prous Science Drugs of the Future (File 453) 390: Beilstein Facts 389: (ONTAP Beilstein Facts) Beilstein 贝尔斯坦化学文摘(390,391,393号文档) 是世界上最大的关于有机化学事实的数据库,数据来源于175种期刊,已收录9百多万个化合物和9百多万个反应。作为最基本的化学文献数据库,Beilstein能帮助有机化学研究人员形成新思路、设计合成路径(包括起始原料和中间体)、确定生物活性和物理性质、了解外界环境对化合物的影响,等等。主要数据的索引分为3部分:其中390 Beilstein Facts即化学物质部分收集了结构信息及相关的事实和参考文献,包括化学、物理和生物活性数据;391 Beilstein Reactions反应部分提供化学物质制备的详细资料,帮助研究人员用反应式检索特定的反应路径;393 Beilstein Abstracts文献部分包括引用、文献标题和文摘,化学物质部分和反应部分的条目与文献部分有超链接。1771至今,季度更新。 355: Derwent Chemistry Resource Derwent Chemistry Resource 德温特化学资源(355号文档) 可对Derwent世界专利索引(Derwent World Patent Index,DWPI)和Derwent药学文档(Derwent Drug File,DDF)中的化学内容进行结构检索。DWPI含有全球40多个专利发布权威机构的一千一百万篇专利文献,并且每年新增一百五十万。本库提供专利中的化学信息,包括化学结构、分子式、化学名称等信息,通过它可以直接用化学结构绘图检索DWPI和DDF中的专利信息,并掌握相关的化学信息。每周更新2次。 445: IMS R & D Focus IMS R&D Focus ,IMS医药研发聚焦(445号文档) 该库侧重企业和健康研究机构新药的研发过程。提供23300种处于R&D阶段的药物,9400种表现活跃的药物,4800种生物制品,关注3000家业内公司及国际药品市场从研发到商业等一系列进展。每条记录包括药品从研发到推向市场的全部信息。信息来源于IMS HEALTH 公司出版的R&D Focus和R&D Focus Drugs News。1991至今,每周更新。 447: IMS Patent Focus IMS Patent Focus (IMS药物专利数据库)

检索效果的评价指标

检索效果的评价指标 克兰弗登(Cranfield)在分析用户基本要求的基础上,提出了6项检索系统性能的评价指标,它们是收录范围、查全率、查准率、响应时间、用户负担和输出形式。 (1)查全率 查全率(recall factor)是指检出的相关文献量与检索系统中相关文献总量的百分比,是衡量信息检索系统检出相关文献能力的尺度,可用下式表示: 查全率=检出的相关文献总量/系统中的相关文献总量×100%即R=b/a * 100% 设R为查全率,P查准率,M表示漏检率、N表示误检率,m为检出文献总量,a为检索系统中的相关文献总量,b为检出的相关文献总量。 例如,要利用某个检索系统查某课题。假设在该系统数据库中共有相关文献为40篇,而只检索出来30篇,那么查全率就等于75%。 (2)查准率 查准率(Pertinency factor)是指检出的相关文献量与检出文献总量的百分比,是衡量信息检索系统精确度的尺度,可用下式表示: 查准率=检出的相关文献总量/检出文献总量×100% 即P=b/m*100% 例如,如果检出的文献总篇数为50篇,经审查确定其中与课题相关的文献只有40篇,另外10篇与该课题无关。那么,这次检索的查准率就等于80%。 检索效果2 检索系统的响应时间是指从发出检索提问到获得检索结果平均消耗的时间。主要包括:

①用户请求到服务器的传送时间;②服务器处理请求的时间;②服务器的答复到用户端的传送时间;④用户端计算机处理服务器传来信息的时间。 提高检索效果的措施 1."提高用户信息素质 2."选择好的检索工具和系统 3."优选检索词 4."合理调整查全率和查准率 不同的检索课题对文献信息的需求不同,用户应根据课题的需要,适当调整查全率和查准率,优化检索策略,以达到最佳检索效果。 (1)提高查全率 提高查全率时,调整检索式的主要方法有: ①降低检索词的专指度,从词表或检出文献中选一些上位词或相关词。 ②减少AND组配,如删除某个不甚重要的概念组面(检索词)。 ③多用OR组配,如选同义词、近义词等并以“OR”方式加入到检索式中。 ④族性检索,如采用分类号检索。 ⑤截词检索。 ⑥放宽限制运算,如取消字段限制符,调松位置算符等。 (2)提高查准率 提高查准率时,调整检索式的主要方法有: ①提高检索词的专指度,增加或采用下位词和专指性较强的检索词。

文献检索期末重点内容

通过感觉器官或相应设备同外界交换内容的总称 评价和使用信息的能力,是信息社会劳动者必须掌握的终身技能。具有信息素养的日呢,也就具备了终身学习的能力。 是调节信息生产者,信息加工者,信息传播者及信息使用者之间相互关系的行为规范的总和。 ~ 审校过程并由正式的出版发行渠道传播的信息 利用专门的工具,从大量的情报信息资料中,查找出特定的,所需要的情报信息资料的过程。 使信息存贮和检索这两个过程所采用的特征标识达到一致,以便有效的获取和利用文献信息的过程。 它不直接解答用户的提问,而是提供与提问有关的文献线索或原始文献。 利用各种统计数字、图表、化学结构式、计算式等工具来实现的。

质是一系列表达信息内容的概念及其相互关系的概念标识系统。 属性集中文献信息,提供用户从课题的学科分类角度检索文献信息的方法 分类检索语言:学科、专业属性(目的)、分类号(语言或标识)、类目(学科名)上下位类(大类和小类)、分类表(标准和依据)、分类检索(途径)2主题检索语言:主题概念(目的)、主题词/副主题词(语言或标识)、主题检索(途径)3著者检索:有关作者(目的)、作者姓名,姓前名后(语音或标识)著者途径(途径) 从课题的主题概念检索文献信息的方法 切工具和设备的统称 检索引擎,是一种能够通过Internet接受用户的查询指令,并向用户提供符合其查询要求的信息资源网址的系统。 数据库是检索系统的信息源,也是用户检索的对象。结构:1、文档,文档一般分为顺排文档和倒排文档2、记录;字段组成类型1、文献型2、事实型3、数据型4、多媒体型 分类叙述附有参考书目按词典形式编成的大型

工具书有工具书之王美称 术语及短语,并解释其概念、意义和用法的工具书 用图形或表格的形式直观的反映客观事物和科学知识,并配以简要通俗的文字说明的特定类型的参考工具书。特点:直观形象,简明清晰。 人物传记和机构名录。主要用于查找有关人物或机构的背景资料 加以浓缩并按特定的方法排检专供查阅,参考的特定类型图书。基本功能是解答有关事实和数据方面的疑难问题。 进展动向,成就成果,统计资料内容等,按年度编辑出版的一种动态性工具书 具有法律效力。 途径,提供相关资料的工具书。 利用统计学及数学逻辑思维方法等,对文献的应用和被引用现象进行分析,用来评价论文的质量,某机构或著者的学术水品和预测某学科的发展趋势的一种定量方法。

爱信誉图书馆_参考文献_引用文献的追踪检索策略研究

□ 赵 慧 杜秋雨 一、引言 在专利申请中,存在一部分偏向于基础研究的专利申请,在这一领域中多数以高校、研究机构作为申请人,相较于这一领域的公司申请,这些大学、研究院所的发明专利申请,更有前瞻性,审查员针对这类申请的检索,一般情况下,在专利数据库中基本上很难检索到非常相关的文献。还有一类专利申请,为涉及前沿技术的公司申请,虽然申请人不是高校、研究机构,但是针对这类专利申请的检索,也需要关注非专利文献库。当遇到这些专利申请时,审查员如何实现快速全面的检索从而避免漏检,亟需深入的研究。 参考文献/引用文献的追踪检索策略研究 摘要:在专利审查中,会遇到申请人为高校、研究机构、或本领域的前沿技术的情形,针对这类申请的检索,通过以发明人或申请人为入口可以检索到相关的对比文件,但是时间晚于本申请的申请日时,这时可以尝试在检索到的申请人发表的论文、学位论文的参考文献、引用文献中进行追踪,或者在相关的会议论文中进行追踪;如果以发明人或申请人为入口检索不到相关的对比文件,那么可以以关键词或者发明人、申请人结合关键词在Google Scholar 或ISI Web of Knowledge 等外网检索资源中进行拓展检索,如果检索到的相关文献时间仍不可用,则继续关注其参考文献、引用文献,通常这一方法可以很快的检索到相关的对比文件,获得事半功倍的效果。本文将通过几个实际案例来表现如何进行参考文献/引用文献的追踪,从而拓宽检索的思路,避免漏检。 关键词:参考文献 引用文献 追踪 检索 下面,笔者将结合几个实际案例来具体探讨以下三种情形的追踪检索: ⑴直接以申请人、发明人为入口进行检索后,如何进行追踪。 ⑵以关键词为入口追踪检索后,如何进行再追踪。⑶以申请人、发明人结合关键词为入口追踪检索后,如何再追踪。 通过对这三种情形的追踪检索的研究,拓宽检索的思路,以期对该领域的检索策略的完整性做一个补充。 二、案例分析及研究 (一)直接以申请人、发明人为入口检索后的追踪【案例一】 申请号:200910069163.4 发明名称:一种基于电磁层析成像的钢水流速测量方法和装置 申请人:天津大学发明人:尹武良 申请日:2009年6月5日1.初步检索 审查员在检索时,首先选择在中国全文期刊数据库(CNKI )中以发明人“尹武良”为检索入口,进 行了检索,其中涉及本申请发明人的文章共有9篇, 本文作者:赵慧

文献检索内容

1、什么情况下用分类检索途径进行检索? 在知道一定内容,但不知道什么书或有哪些著者的情况下使用分类检索途径进行检索。查阅时,可采取由大到小,由广而狭,逐步缩小的办法尽量找到最细的类目,就能在该类目下找到所需要的书。 2、例如:要找一本关于商业广告方面的书,但既不知道具体书名,又不知道著者姓名,那就只有查分类目录了。 其查找步骤为:A、找“经济F”大类,B、在它的若干小类中找到F7“贸易经济”,C、再找“贸易经济理论与方法”、“贸易计划与管理体制”……“商品流转与市场”等更小的类目,D、再往下找即可找到“广告宣传”这个类目。 3、什么情况下用主题途径 在了解用于表达文献内容的主题标识(标题、叙词、关键词)的基础上,选择主题途径进行检索。 例如:我们查有关“价格”问题的全面资料,用分类途径,往往事倍功半,因为“价格”这一经济范畴几乎遍及各个经济领域和部门,检索时必须从“政治经济学”、“世界各国经济概况”、“经济计划与管理”以及各部门经济中查找,结果花很多时间、精力,还不能查准、查全,如果通过主题检索途径,那么在“价格”这一标题下,可以一揽子查找有关价格的全部文献资料,收到事半功倍的效果。 4、进行检索策略的制定时要注意的问题: 选择检索工具时要注意质量。 选择一种最省时、省力的方案。 不可超越主客观条件所允许的范围去制定检索策略。 5、索引条目的著录格式: 文献顺序号题名/责任者//出处复印资料 期数和页码 例: 0316 科技管理中的五大悖论/丁福虎//中国 文献顺序号题名责任者 科技论坛(京),2004.3.101-103 出处年份、期数和页码 6、著录格式: 顺序号文献题名/责任者(第一作者所属单位,邮编)// 报刊名.—年,卷(期).—页码 例: 050107832 深圳中小广告企业面临的危机和发展对策/胡莹 顺序号文献题名责任者 (深圳大学文学院,518060)//深圳大学学报:人文社科版 第一作者所属单位,邮编报刊名 (深圳).—2004,21(5).—22-25 年,卷(期)页码 7、网络信息资源的特点: (1)信息量大,传播广泛(2)信息层次多,品种多样 (3)自由发布,交流直接(4)信息传播速度快,变化频繁 (5)检索方便,价廉实惠(6)分散无序,缺乏管理 (7)内容庞杂,质量不一 8、搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户。 利用搜索引擎进行检索的优点是:省时省力,简单方便,检索速度快、范围广,能及时获取新增信息。缺点在于,由于采用计算机软件自动进行信息的加工处理,且检索软件的智能性不是很高,造成检索的准确性不是很理想,与人们的检索需求及对检索效率的期望有一定差距。 9、A、空格:其作用与逻辑“与”相同。B、逗号:其作用类似逻辑“或”,也是查找那些至少含有一个制定关键词的页面,区别是,

CNKI检索技巧

CNKI数据库使用方法 一、简单检索 点击检索方式选择区的“简单检索”按钮,进入简单检索界面。简单检索提供了类似搜索引擎的检索方式,检索者只需要输入所要找的检索词,点击“简单检索”进行检索,就可查到与检索词相关的文献。 二、标准检索 点击检索方式选择区的“标准检索”按钮,进入标准检索界面。系统提供了检索范围和文献内容特征两部分的检索控制,另外通过分类导航区和数据库选择区的内容选择,能够精确地检索到相关文献。 (一)检索范围控制条件 该部分可对发表时间、文献来源、国家及各级科研项目、作者四部分进行限定和选择。所有检索框在未输入关键词时默认为该检索项不进行限定,即如果所有检索框不填写时进行检索,将检出库中的全部文献。 1.发表时间 提供了具体时间、最近一周、一月、半年、一年选项,能够精确地对时间范围进行限定;具体时间输入可通过日历表进行选择,将光标移至输入框时,系统自动弹出日历表。 2.文献出版来源 是指在检索中限定文献的来源范围、出版媒体、机构或提供

单位等。可直接在检索框中输入出版媒体、机构的名称关键词,也可以点击检索框后的“文献来源列表”按钮,跳转至“文献出版来源”检索界面进行检索,在检索结果中选择文献来源输入检索框中。此项限定功能提供了精确和模糊检索。 3.国家及各级科研项目 是指在检索中可限定文献的支持基金,可直接在检索框中输入基金名称的关键词,也可以点击检索框后的“基金列表”按钮,跳转至“科研基金检索”界面进行检索,在检索结果中选择基金输入检索框中。此项限定功能提供了精确和模糊检索。 4.发文作者控制 是指在检索中可限定文献的作者和作者单位。可通过点击“+”图标增加多个作者和作者单位(最多可增加至4个),扩大检索范围,提高查准率。此项限定功能提供了精确和模糊检索以及逻辑运算(并且、或者、不含)选项。 (二)文献内容特征部分 提供了基于文献的内容特征的检索项:全文、篇名、主题、关键词、中图分类号。可通过点击“+”图标增加多个条件(最多可增加至4项),提高查准率。 1.扩展词推荐 在检索框中输入一个检索词后,点击检索框后的扩展按钮

学术检索技巧

Google 学术搜索及其检索技巧 1 Google 学术搜索简介 2 Google 学术搜索的功能 3 Google 学术搜索检索技巧及其实例 3.1 关键词检索 3.2 作者检索 3.3 组合检索 3.4 高级检索 4 与其他检索系统的对比分析 5 结论 6 现场交流

1 Google 学术搜索简介 Google Scholar (https://www.360docs.net/doc/1b12368387.html,/)Google学术搜索, 是网络搜索领域的领头羊Google公司于2004 年11 月18 日推出 的一项新的搜索服务,它能帮助用户查找包括期刊论文、学位论文、书籍、预印本、摘要和科技报告等在内的学术文献,内容涉 及诸多学科,并且经过了业内专家的评审,具有一定的权威性。 它以“站在巨人的肩膀上” (Stand on the shoulders of giants) 为服务理念, 重点提供医学、物理、经济、计算机等学科文献的 检索, 还通过知识链接功能提供了文章的引用次数及链接, 人们

可以利用它查找文献的被引用情况, 这是目前为止除 web of science 外的另一个可以检索英文文献被引情况的检索工具。 2006 年1 月11 日Google推出了Google 中文学术搜索Beta 版(https://www.360docs.net/doc/1b12368387.html,/intl/zh-CN/ ),用于搜索网上的中文学术文献,同时它还具有检索中文文献被引情况的功能,为科学研究与学术共同体学术评价工作的开展提供了新的工具和途径。笔者通过对Google 学术搜索的分析、使用,以及与其它商业性跨库检索系统的比较,对Google 学术搜索的检索功能进行了评价,以便大家更好的使用。

浅谈背景技术文献追踪检索在专利审查实践中的应用

浅谈背景技术文献追踪检索在专利审查实践中的应用 发表时间:2019-07-09T16:43:40.647Z 来源:《科学与技术》2019年第04期作者:程京京王冬雪[导读] 通过追踪背景技术文献来获取准确关键词进行检索,以期寻求一种审查关键词表达难度较大的权利要求的方法。国家知识产权局专利局专利审查协作湖北中心 摘要:本文指出专利审查实践中,通过追踪背景技术文献来获取准确关键词进行检索,以期寻求一种审查关键词表达难度较大的权利要求的方法。 关键词:背景技术追踪检索 引言 按照专利法实施细则的规定,说明书背景技术部分应当写明对发明或者实用新型的理解、检索、审查有用的背景技术,并引证反映这些背景技术的文件[1]。因此,审查实践中,背景技术文献对理解发明、检索等起到重要的作用,充分挖掘背景技术文献信息可以有效提高检索效率。 一、案例分析 案例一 该案权利要求为:“1.一种基于偏振干涉的带内光信噪比检测方法,其特征在于,所述方法具体包括……。2.如权利要求1所述的方法,其特征在于,所述步骤A中测量光信号中的噪声功率具体包括……”。 对于光信噪比检测领域,其结构表达难度较大,实际检索中,首先确定准确的CPC分类号:H04B 10/07953、H04B 10/07955,然后使用CPC分类号在外文库中检索到相关文献US7149407B1,其说明书背景技术中提到一篇期刊“IEEE:Orthogonal-Polarization Heterodyne OSNR Monitoring Insensitive to Polarization-Mode Dispersion and Nonlinear Polarization Scattering”,其测量噪声功率的方式是正交极化外差的方式进行测量,不是本案所述的“偏振干涉测量”的方式,但通过查看其参考文献,发现一篇文献“OSNR Monitoring Technique Based on Orthogonal Delayed-Homodyne Method”,根据分析可发现其与权利要求2中测量噪声功率的方式一致,可作为评述本案创造性的文献。通过阅读该文献,发现其使用了“Homodyne”(零差)一词,其可以准确表达延时、干涉的测量方式,是较为专业的表述方式。使用准确的关键词进行补充检索,得到可用对比文件US2008205886A1。 案例二 该案权利要求为:“1. 一种采用水热反应法制备单分散三角形银纳米盘的方法,其特征在于……”。 本案涉及一种采用水热反应法制备单分散三角形银纳米盘的方法,属于纳米功能材料技术领域,首先选取非专利数据库,在CNKI中检索得到一篇期刊文献,通过追踪其参考文献,得到可用对比文件“Mechanistic Study of the Synthesis of Au Nanotadpoles Nanokites and Microplates by Reducing Aqueous HAuCl4 with Poly(vinylpyrrolidone)”。 案例三 该案权利要求为:“1.一种用于缓冲吸能材料的泡沫镁制备方法,其特征在于,包括如下步骤:(1)称取23.40~51.89重量份的尿素和48.11~76.60重量份的镁粉……;(2)用钢制模具将前一步所得的混合料静压成型……;(3)将生坯放入真空碳管炉内进行烧结……”。 本案涉及泡沫金属材料制备技术领域,首先在CNKI中检索,在一篇名为“泡沫镁的制备及其性能和应用”的综述性文章中提到一种通过有造孔剂的粉末冶金法制备泡沫镁的方法,该方法由日本结构和功能材料研究所C.E.Wen等提出,以工业纯镁为基体材料,尿素为造孔剂制备泡沫镁,通过追踪其参考文献,得到可用对比文件“processing and mechanical properties of magnesium foams”。 二、启示 这三个案例均通过对背景技术文献进行追踪,进一步挖掘参考文献信息,例如关注与发明或实用新型技术方案相关的综述性文章,有利于梳理现有技术发展脉络,关注文章引用的参考文献,有利于获取有效证据。 三、结论 以上,通过对三个案例的分析,对于专利审查实践中如何通过追踪背景技术文献获取有效证据提供了思路,有助于提高专利审查中证据获取的能力和效率。 参考文献 [1]中华人民共和国国家知识产权局.专利审查指南2010[M].北京:知识产权出版社,172-175.

专利检索方式之基本检索法说明

专利检索方式之基本检索法说明 专利基本检索是一种基于某一特定的检索字段进行的简单检索,即检索人利用己知的、确定的检索词,输入到某一个检索入口中,查找所需专利信息。基本检索可分为主题检索、人名检索和号码检索。 1.主题检索 主题检索是指根据技术主题进行查找专利信息的工作,其检索的结果是找出含有该技术主题的相关专利信息。通过分析技术主题可以查出该主题对应的分类号,以及代表其技术特征的关键词,因此可以利用这两个检索字段分别检索。 也就是说,主题检索实际上是分类号检索或关键词检索。可以将技术主题所对应的分类号,输入到分类号入口中进行检索;也可以将代表其技术特征的关键词,输入到关键词入口中进行检索。 例如,用中国专利文摘检索数据库检索有关“电饭锅”方面的专利信息。通过分析“电饭锅”技术主题,查到其相关分类号是A47J2’7/00,将其输入到分类号入口中检索,得到1265 条相关专利信息。

“电饭锅”一词是代表该技术主题特征的关键词,将其输入到关键词入口中检索,得到349 条相关专利信息。 2.人名检索 人名检索是利用已知的专利权人、专利受让人、专利申请人或者发明人的名称作为专利检索字段,进行查找专利信息的工作,其检索的结果是找出与该人名有关的特定或全部专利信息。一般的专利检索系统中均为专利权人名称、发明人名称设立了专门的入口,因此可以分别就专利权人名称、发明人名称进行检索。 例如,检索富士公司专利。在专利权人入口中输入“富士”或Fuji Film,即可检索出该公司的相关专利。 3.号码检索 号码检索是指用专利或专利申请的特定号码作为专利检索字段,查找该专利或专利申请有关信息的工作,它所涉及的号码有申请号、优先权申请号和文献号(专利号)等。可以用申请号查专利号,以便索取专利说明书;可以用专利号查申请号,以便了解专利的法律信息;还可以用优先权申请号查同族专利的信息。

相关文档
最新文档