新搜索引擎与问天搜索对比分析报告

新搜索引擎与问天搜索对比分析报告
新搜索引擎与问天搜索对比分析报告

1搜索环境

新搜索引擎:PC机,2G内存,数据量166万;

问天搜索:服务器,数据量500万

2搜索地址

问天搜索:

https://www.360docs.net/doc/0d6252032.html,/ClassifyResults.aspx?vectors=58+59+60+61+62+&journals=&field=qk&star t=1&resultperpage=20&source=all&sortoption=relevancy&query=&xTitleIndex=42&select=58+

新搜索引擎:

http://192.168.0.172/https://www.360docs.net/doc/0d6252032.html,/zhishiku.aspx

3搜索结果对比表

4搜索结果截图(详见附表1)

5结论

搜索时间:

当数据量不是很大时,两个搜索引擎的搜索时间差距不是很大,而当数据量很大时,新搜索引擎的用时少。

搜索数量:

从结果对比表可以看出,问天搜索的结果数量较少,甚至搜索结果为0,而新搜索引擎的结果数量较多。

搜索相关度:

大多数情况下,问天搜索的相关度不是很理想,没有达到预期的效果,新搜索引擎的相关度则相对来说较好,满足了搜索的预期要求。

另外知识库的关键字是自定义的,所以关键字定义的越全面,新搜索引擎的搜索结果也更加全面更加准确。

1 搜索环境

新搜索引擎:PC机,2G内存,数据量166万;

问天搜索:服务器,数据量500万

2 搜索地址

问天搜索:

https://www.360docs.net/doc/0d6252032.html,/SearchResults.aspx?lang=s&start=1&source=all&resultperpage=10&query= &sortoption=relevancy&field=all

新搜索引擎:

http://192.168.0.172/https://www.360docs.net/doc/0d6252032.html,/search.aspx

3 搜索结果对比表

4搜索结果截图(详见附表2)

5 结论:

搜索时间:

当数据量不是很大时,两个搜索引擎用时没有很大的差距,但数据量很大时,新搜索引擎的用时明显少。

搜索相关度:

问天搜索的结果中包含有很多如“的”、“而且”等一些需要过滤的停用词,而且位置都排在搜索结果的前面,严重的影响着搜索的相关度。

新搜索引擎启用了较全面的停用词库,很好的过滤掉了那些不需要的停用词,相对于问天搜索,相关度明显提高很多。

搜索数量:

问天搜索的搜索数量很少,而且停用词占了一部分,并且还存在搜索不出结果的情况,新搜索引擎的搜索数量比问天搜索的搜索数量高出很多。

附表1(知识库搜索截图)1、知识库:心理健康(专业导航)

问天搜索搜索结果如下:(用时:734ms 记录数:764 )

新搜索引擎搜索结果如下:(用时:725ms 记录数:59461)

问天搜索搜索结果如下:(用时:546ms 记录数:5 )

问天搜索搜索结果如下:(用时:531ms 记录数:5 )

4、知识库:心理健康(课程导航)->非智力因素

问天搜索搜索结果如下:(用时:406ms 记录数:0 )

新搜索引擎搜索结果如下:(用时:719ms 记录数:1371)

5、知识库:哲学类

问天搜索搜索结果如下:(用时:859ms 记录数:74233)

问天搜索搜索结果如下:(用时:625ms 记录数:7138)

7、知识库:经济学类

问天搜索搜索结果如下:(用时:406ms 记录数:0)

新搜索引擎搜索结果如下:(用时:711ms 记录数:75332)

8、知识库:经济学类->经济学

问天搜索搜索结果如下:(用时:296ms 记录数:0)

新搜索引擎搜索结果如下:(用时:749ms 记录数:48295)

返回

附表2 关键字搜索截图1、关键字:吉林市长

问天搜索搜索结果如下:(用时:218ms 记录数:600)

新搜索引擎搜索结果如下:(用时:851ms 记录数:730)

问天搜索搜索结果如下:(用时:2562ms 记录数:22866)

新搜索引擎搜索结果如下:(用时:939ms 记录数:61922)

问天搜索搜索结果如下:(用时:718ms 记录数:519)

新搜索引擎搜索结果如下:(用时:1067ms 记录数:1990)

问天搜索搜索结果如下:(用时:815ms 记录数:141)

新搜索引擎搜索结果如下:(用时:793ms 记录数:2774)

5、关键字:中国经济在将来将会有更快更好的发展

问天搜索搜索结果如下:(用时:1328ms 记录数:3)

新搜索引擎搜索结果如下:(用时:1047ms 记录数:403)

6、关键字:教育独生子女问题,这是很多家长要关心的问题问天搜索搜索结果如下:(用时:640ms 记录数:0)

新搜索引擎搜索结果如下:(用时:944ms 记录数:163)

返回

三、多表联合查询搜索

关系型数据库中,多表关联是很常见的事情。但是,目前使用的搜索引擎不具备多表连接搜索的功能,大大的限制了项目中搜索功能的强壮性。

新搜索引擎通过视图的方法对多表关联的情况建索引,从而解决了多表关联的全文搜索问题。通过视图创建表可以逻辑分割索引,这样用户就不需要专门建一个大表来解决多表关联时的全文索引问题,无论是在索引效率或者维护方便程度上都比建一个大表效果高出很多。查看地址:

http://192.168.0.172/https://www.360docs.net/doc/0d6252032.html,/multiTable.aspx

四、https://www.360docs.net/doc/0d6252032.html,优缺点分析

优点分析:

1、缓存

如上图所示,新搜索引擎提供三种级别的缓存方案。

Index cache :索引级别缓存用于缓存倒排索引和单值索引。这种缓存为系统自动管理,不能关闭。索引级别缓存会自动监控数据的增删改,并进行相应修改。

Query cache :查询级别缓存对查询的条件进行缓存,https://www.360docs.net/doc/0d6252032.html, 系统服务会将不同查询条件对应的文档ID(DocId)缓存下来,下次查询时直接从缓存中获取符合条件的文档ID,不再访问低级别缓存或索引。和索引级别缓存不同的是,当表的数据发生变化时,查询级别缓存将会失效,需要重新缓存。

Data cache :数据级别缓存运行在客户端,客户端查询得到的数据被缓存下来,下次查询时将从数据缓存中直接获取数据,而不再到https://www.360docs.net/doc/0d6252032.html, 系统服务中去获取数据。和查询级别缓存一样,表的数据发生变化时,数据级别缓存将会失效,需要重新缓存。

2、并发控制

新搜索引擎设计了非常完善的并发控制机制,用户的增删改查可以同时进行,不会存在任何冲突。

3、内存管理

新搜索引擎以系统服务存在,不会像Lucene那样和应用程序共用内存。新搜索引擎设计了一套内存管理机制,用户可以设置最大内存使用数量,一旦新搜索引擎使用内存超过这个数量,新搜索引擎就会自动启动内存整理程序,将一些不经常使用的缓存从内存中清理掉以腾出更多的内存空间给用户。用户可以通过SP_CONFIGURE 存储过程来查看和管理内存。

缺点分析

当视图的增、删、改操作很频繁时,需要对视图进行实时的同步,但是目前https://www.360docs.net/doc/0d6252032.html,同步就比较麻烦。

五、https://www.360docs.net/doc/0d6252032.html,与https://www.360docs.net/doc/0d6252032.html,对比分析

总体来说,https://www.360docs.net/doc/0d6252032.html,相对于https://www.360docs.net/doc/0d6252032.html, 有重大的改进。

1、https://www.360docs.net/doc/0d6252032.html, 建立索引文件的时间比https://www.360docs.net/doc/0d6252032.html, 短,而且索引文件大小比https://www.360docs.net/doc/0d6252032.html, 小。

2、在对于结果集大小在50万以内的情况,新搜索引擎要比https://www.360docs.net/doc/0d6252032.html, 快不少,而对于较

大结果集,两者差别不大。

3、单个关键字的情况下,两者的搜索素的是接近的,但是多关键字情况下新搜索引擎比

https://www.360docs.net/doc/0d6252032.html, 具有明显的优势,查询速度快5-10倍,甚至上百倍。

下表列举的是一些细节上的比较。

浅析各类搜索引擎之间的联系与区别

浅析各类搜索引擎之间的联系与区别 摘要internet上蕴藏着非常丰富的信息资源,但是要从浩如烟海的信息 中准确、及时、方便、迅速的找到自己所需要的信息,却并不是一件容易的事情.为此应对重点网络搜索引擎的检索技术和功能作一全面的介绍.使学生在网络信息检索中选择了好的搜索引擎,才能快速、准确地找到所需要信息.本文主要对百度和google两个典型搜索引擎之间的检索技术、各自特点进行全面的比较和分析,从而得出各类搜索引擎之间的联系与区别。 关键字google 百度搜索引擎比较分析 Google是世界上最大的搜索引擎,通过对200多亿网页信息的整理,每天为世界各地提供1.5亿次以上的网上信息查询服务。百度是全球最大的中文搜索引擎, 拥有超过10多亿的中文网页数据库, 每天响应超过亿次的网络信息搜索请求。在这两大搜索引擎之间, 搜索的结果平均有85%的不同,因此,有网站把两者结合建立了百Google度。然而,这两大搜索引擎之间究竟有什么特点和区别,本文将根据数据加以分析、比较研究。 Google与百度的特点 Google的特点 google秉持着开发“确解用户之意, 切返用户之需”的“完美的搜索引擎” , 使得搜索方式发生了根本性变化, 在业界独树一帜, 其强大的功能和独到的特点就在于: (1)“网页快照”功能。能从google服务器里直接取出缓存的网页。如果原地址打开很慢, 那么可以直接查看google缓存页面, 因为google服务器速度极快;如果原链接已经死掉或者因为网络的原因暂时链接不通, 那么可以通过google快照看到该页面信息;如果打开的页面信息量巨大, 一下子找不到关键词所在位置, 那么可以通过google快照, 因为快照中google用黄色表明关键字位置。 (2)“单词英文解释”功能。写英文文章的时候, 最头疼的事情就是对某个英文单词的用法不确定。现在有了google, 一切就迎刃而解了!无论你是想查找某个生词的意思还是想了解某个单词的用法, 均可使用在线词典。 (3)“网页翻译”功能。google提供了网页翻译功能, 虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文, 但是不得不承认, 这是个杰出功能, 只要你点击“Translate this page ”按钮, google为你提供了人工智能的机器翻译, 翻译出来的结果让你大致能够看得明白。 (4)“搜索结果过滤”功能。网络上的成人信息浩如烟海, 而且很多站点具有欺骗或者其他不良企图, 浏览者很容易掉入其中的陷阱。为此google新设立了成人内容过滤功能, 见google的设置页面,不过, 中文状态下的尚没有这个功能。 (5)“超文本匹配分析”功能。google的搜索引擎, 同时也分析网页内容,

实验五搜索引擎使用实验

实验五搜索引擎使用实验一、实验目的 1.了解搜索引擎的发展情况和现状;理解搜索引擎的工作原理;2.了解中英文搜索引擎的基本知识和种类; 3. 掌握中英文搜索引擎的初级检索与高级检索两种方式; 4. 分析和对比各种中英文搜索引擎的共性与区别; 5. 了解网络促销的主要方式二、实验内容: 1. 找网上的中英文搜索引擎,并列出5个中文搜索引擎和5个英文搜索引擎的名称; 2.掌握google、百度中高级搜索语法应用方法。 3. 用3个中文、2个英文搜索引擎对同一主题\同一检索词(关键词)进行检索,从检索效果分析得到的检索结果,并比较分析你所选择的搜索引擎的共性与区别。 4.了解网络促销的应用方式和网络广告促销的特点三、实验步骤 1. 搜索引擎的关键词检索(1)进入Google,熟悉并掌握以下功能:掌握Google 的网站检索功能,选取一些关键词在主页上使用“所有网页”检索网页,并通过使用运算符提高查准率;同时使用“高级检索”功能;掌握Google的图像检索功能;掌握Google的网上论坛功能;掌握Google的主题分类检索功能。(2)进入百度,熟悉并掌握Baidu各功能。搜索到至少两个专利介绍网站,并搜索一条关于手机防盗产品的专利技术,写出检索步骤并截图。 2. 搜索引擎的高级搜索语法应用(百度或谷歌) 3.浏览不同类型的网络广告。四、实验报告 1.进入Google,

搜索关键词“搜索引擎优化”,要求结果格式为Word格式;搜索关键词“电子商务”,但结果中不要出现“网络营销”字样;分别写出检索步骤并截图。 2. 精确匹配——双引号和书名号,分别加和不加双引号搜索“山东财经大学”,查看搜索结果。分别加和不加书名号搜索“围城”,查看搜索结果。 3. 搜索同时包含“山东财经大学”和“会计学院”的网页,并查看数量。 4.利用百度搜索两个专利介绍网站,并搜索一条关于手机防盗产品的专利技术,写出检索步骤并截图。 5.选择使用Google和百度,查询某商务信息(自定,如“海尔2012年销售额” )。要求写出:搜索引擎的名称、检索信息的主题、检索结果(列出前5个)。6.分析实验中所使用搜索引擎的优缺点。 7.比较说明中国和美国的网络广告发展情况。五.实验操作答案 1.(1)可以直接搜索word版的搜索引擎优化即可。如下图 (2)操作和上面差不多,看下图 2.不加引号搜索“山东财经大学”时,没有结果;而加引号时则有许多搜索结果。但是加不加引号搜索“围城”时,结果却是相同的。 3.大多为关于山东财经大学的信息,而会计学院则是属于山财的分支。 4. 1.进入

国内外搜索引擎的特征及其比较

国内搜索引擎的特征及其比较 摘要随着信息的剧增,Internet的进一步普及,在浩如烟海的信息高速公路上,根据自己的需求快速准确地需找所需要的信息越来越依赖于借助多种多样的Internet信息检索工具,而搜索引擎是我们平时使用最多的一种。下面就国内的四个著名搜索引擎来探究它们的特征和区别。 关键字引擎检索查询 一百度(http://WWW.baidu.corn) 百度由百度网络技术有限公司于1999年底在美国硅谷创建,是目前全球最大的中文搜索引擎。数据库中收录约3亿个中文网页,平均2周更新一次,对部分网页每天更新。搜索方式以关键词检索为主,同时可结合分类目录限定检索范围,分基本检索和高级检索两种,支持布尔算符和字段限制符。特设百度快照功能,供用户迅速查看每条检索结果的内容。检索时不区分英文字母的大小写,检索结果依相关度排列。 二中文Goog1.(hap://WWW.google.corn) Gcog1.由两位斯坦福大学的博士I丑rry Page和SergeyBrin在1998年创立,是目前世界上最大的搜索引擎。数据库中收录约1O亿多个中文网页,采用高级的网页级别技术,用户界而出色,有新闻组、图像、新闻等搜索,以搜索相关性高闻名。检索方式为关键词检索,分为基本检索和高级检索,基本检索以布尔检索为主,高级检索中包括: (1)排除某些站点; (2)限定检索结果于某一特定网站; (3)限定语言类型; (4)相关网页检索,检索结果依检索式相关性排列。 三新浪(http://WWW.sina.com) 新浪搜索引擎是面向华人的网上资源查询系统。提供网站、网页、新闻、软件、游戏等查询服务。共有16大类目录,1万多个细目和数十万个网站。搜索方式包括关键词查询和分类目录检索两种。除基本检索以外,还具备“重新查询”“在结果中再查”和“在结果中去除”三种高级检索,支持布尔逻辑检索,用

网站SEO分析诊断报告实例

SEO分析报告实例 .zjzja. 一、当前状况 1.IP : 96.46.4.61 2.IP下域名: a.***. b.***. 3.页面收录: a.百度:1,240,000 页面 b.Google:711,000页面 4 PR值:0 5. Alexa排名:2,542 主要的二级域名: product.***. web.***. ***. img2.***. mobile.***. nb.***. cpu.***. bbs.***. lcd.***. mb.***. dc.***. vga.***. diy.***. doc.***. 二、当前存在的问题及改进意见。 1.两个域名指向,未进行重定向,分散了外部得分。

使用搜狗查询工具: .sogou./web?query=link%3Awww.***.&pid=58009401 结果: .***. 10,145 个网页 .***.390,510 个网页 由于有两个域名,导致搜索引擎在计算外部得分时,将分数分散到2个,没有获得统一的得分。解决案: 1.对外宣传时以一个网址为准,也容易让用户记住你的主域名。 例如:google, 如果用户输入.gogle. ,直接跳转到.google.页面。下次用户就不会再输入错误。 2.对现有的域名进行跳转。 a.在IIS 进行操作:将.***.重定向到.***. . 特别注意:一定要选择此资源的永久重定向。 b.使用命令式重定向: https://www.360docs.net/doc/0d6252032.html, Response.Status = "301 Moved Permanently"; Response.AddHeader("Location","http://.***./); 上述法告诉搜索引擎,.***.是.***.的另外一个域名,.***. 的所有外链得分都算

SEO实训报告

实训报告(2014 -2015学年度第一学期) 项目名称:《搜索引擎优化与营销》 指导教师: 实训类型: 学生姓名: 学生学号: 班级: 实训时间:2014年12月8日—12日实训地点:电子商务实训室 实训作品:目标网站搜索引擎优化建议 信息管理系监制

文轩网网站SEO优化方案 一、实训项目介绍 文轩在线是新华文轩出版传媒股份有限公司(简称"新华文轩")的控股子公司。新华文轩是我国第一家按照上市公司标准组建的股份制出版发行企业。2007年,在香港联合交易所主板(H股)上市,成为国内首家在港上市的出版发行企业。文轩网作为新华文轩推出的电子商务品牌,现已成为文轩自零售、中盘、定制之后的第四销售渠道。文轩网已拥有注册会员四百万余;常备图书品种超过70万种;开辟了包括淘宝、拍拍、新浪、乐酷天等国内外知名网站在内的多家网络连锁渠道;连续3年销售规模增长率逾200%。目前,文轩网月独立IP访问过千万,月均点击率超过10亿次,是国内少数几家网上零售规模上亿的企业之一。 二、任务内容 1、准备工作 ①团队建设

2、项目要求 一选择目标分析网站,确定竞争对手 二对强劲竞争对手的网站结构和页面优化分析 三目标网站关键词的研究 四目标网站的优化建议 3、项目规划 经过组员毛遂自荐,和对自己能力分析做出如下规划

4、项目实施过程 一.选择目标分析网站,确定竞争对手 <1>目标网站信息 通过百度搜索新华书店查找到文轩网这个网站。基于从小去新华书店买图书,决定对这个网站进行分析。 ①目标网站的基本信息

<2>竞争对手分析 通过对各种搜索引擎进行交叉比对。查找出文轩网做大需要面对的5个竞争对手 ①竞争对手网站 ②竞争对手网站基本信息

不同搜索引擎的搜索结果之区别

不同搜索引擎的搜索结果之区别 11新闻吴雅静1117409059 关键词:媒体 使用的搜索引擎:百度、Google、搜狗 媒体 1、百度 搜索用时:未显示,小于0.5秒 词语解释:所谓媒体,是指传播信息的媒介,通俗的说就是宣传的载 体或平台,能为信息的传播提供平台的就可以称为媒体了,至于媒体 的内容,应该根据国家现行的有关政策,结合广告市场的实际需求不 断更新,确保其可行性、适宜性和有效性。它是指人借助用来传递信 息与获取信息的工具、渠道、载体、中介物或技术手段。也可以把媒 体看作为实现信息从信息源传递到受信者的一切技术手段。媒体有两 层含义,一是承载信息的物体,二是指储存、呈现、处理、传递信息 的实体。 2、Google 搜索时间:0.1秒 词语解释:媒体(Media)一词来自拉丁语“Medium”(意为两者之间), 即传播媒介、传播媒体,是指信息传播过程中,信息与信息的接收者 之间的中介物,即存载并传递信息的载体和物质工具。从广义的角度 播、录音机、录像机、录像带、计算机与各种软件等,都属于媒体范 畴。人类的生活离不开信息的传播,也离不开媒体。 3、搜狗 搜索时间:未显示,约0.3秒 词语解释:所谓媒体,是指传播信息的媒介,通俗的说就是宣传的载 体或平台,能为信息的传播提供平台的就可以称为媒体了,至于媒体

的内容,应该根据国家现行的有关政策,结合广告市场的实际需求不断更新,确保其可行性、适宜性和有效性。解释同百度搜索。 通过对比百度、Google以及搜狗,这三个搜索引擎,可以发现这三种搜索引擎均具备百度百科对“媒体”这一关键词的解释。相对而言,Google的搜索结果比较详细,具备维基百科和互动百科对媒体的不同解释,信息量较其他两种搜索引擎更为丰富。其次搜狗的搜索结果比较省略。就搜索速度而言,Google比百度和搜狗要更快。 建议:百度和搜狗应该在搜索关键词时显示搜索用时。三种搜索引擎都应该将有价值的搜索结果放在第一页,并且就信息的价值而言,有待提高。应该要排除一些与关键词没有直接关联的信息,让阅览者一目了然。最后,百度,Google,搜狗都应该减少搜索结果中的商业推广信息,提高搜索结果的价值。

搜索引擎营销实训报告Violet

`` 评 语 Comment 教师签字 日期 Signature of Tutor______________Date:_______ 成绩 Score 学时 Time 2学时 小组名称 No. Violet 58.56.41.36 项目名称 Item 搜索引擎营销实训 课程名称 Course 网络营销实务 教材 Textbook 网络营销教程 1、举例说明(百度、GOOGLE 、搜狐任选其一)利用搜索引擎开展关键字推广的基本步骤; 2、结合小组企业查找利用搜索引擎开展营销推广的 案例1个。 3、上网搜索利用搜索引擎做推广有哪些基本技巧 4、将小组公司网站到搜索引擎注册登记,截图; 5、上网观看搜索引擎营销视频,写出观感体会 6、到百度推广虚拟体验中心,体会百度推广过程 以1~5上以小组为单位完成实训报告,下课前交,第6题每人都做 。 1、 举例说明(百度、GOOGLE 、搜狐任选其一)利用搜索引擎开展关键字 推广的基本步骤; 第一步:将网站提交到百度。 第二步:到百度收录吧申请百度收录新站,留下网站名称、网站地址、及网站的简单介绍。 第三步:到百度知道提交一个与新站相关的问题,顺便带上新站的链接。 第四步:在百度百科创建一个与新站内容相关的词条,并在词条下面的相关新闻记者栏位加上新的链接。 第五步:将网站内的精彩文章推荐到天极网摘、天天网摘、POCO 网摘、和讯网摘等。 第六步:到A5、Chinaz 、门户通、落伍等知名的站长论坛或其它权重高的论坛、博客发布文章并带上网站的链接。 2、结合小组企业查找利用搜索引擎开展营销推广的 案例。 我们的公司名字:Violet 服装有限公司 Violet 以打造“魅力女神”为侧重点,让每个爱美的女性寻找最适合的,最独一无二的,最无与伦比的美。 网店标语:流行稍纵即逝,唯violet 风格永存。 网店宗旨:特别的爱,给特别的你。 以下是结合我们服装店的情况利用搜索引擎开展营销推广的 案例 案例:兰蔻——品牌、销售两不误 如若有消费者在百度搜索上敲下“兰蔻”两个字,搜索结果页面最上方不再是普通的文字链接,而是图文并茂深 圳 职 业 技 术 学 院 Shenzhen Polytechnic 项 目 实 训(验)报 告

六大搜索引擎的比较

一、界面、广告以及速度搜索引擎在我们日常操作中的使用频率非常高,大家使用它的目的都非常明确,就是用它来搜寻需要的内容,而不会为搜索引擎的页面做过多的停留,因此搜索引擎的界面设计和速度就对我们的使用产生不小的影响,下面来看看这六款搜索引擎在界面和速度上的表现。谷歌、百度和微软的Live Search,这三大搜索引擎的界面大家都已经相当熟悉,它们有着共同的特点,就是简洁至极:网站LOGO、搜索框和按钮以及个别功能服务链接,除此以外,页面上就没有其他多余和花哨的东西了,给人的感觉非常清爽,界面一目了然,特别是Live Search在不失简洁的同时还通过一些小脚本和背景图片使得页面整体更加美观。三者使用起来都很方便,并且首页界面上没有任何第三方的广告。搜索结果页面,三者同样是采用简洁的风格,页面左侧排列着搜索结果,百度搜索结果页面右侧有不少广告,谷歌视关键词的不同也可能出现右侧广告。 Live Search的界面十分简洁且美观 百度搜索结果页面右侧的广告与上面三者相比,雅虎全能搜在界面上显得更为活泼、色彩更加多样,并且在首页内容上也更丰富。首页上除了常规的搜索所需组成部分外,雅虎全能搜还加入了天气预报、邮箱登录的显示区域。虽然这些占据了一点点页面,但是它们功能实用且不影响正常使用。雅虎全能搜的搜索主页 搜狗搜索的界面可谓结合了谷歌和Live Search:在布局上

与谷歌类似,而在细节上与Live Search有着异曲同工之妙;而搜索新军——网易有道的界面与谷歌、百度站在同一阵线,风格、版式都十分一致。在搜索结果页面中,搜狗搜索页面左侧有少量广告。总的来说,六款搜索引擎的界面设计都比较合理、美观、大方。雅虎全能搜的界面稍有不同,加入了天气预报和邮箱模块,而其他五款都尽量精简,其中谷歌、百度和有道趋于一致,采用最简的风格,而Live Search和搜狗在首页的一些细节上多加以了一些修饰。此外,值得一提的是一些搜索引擎对于Logo文化的重视,在传统的节日或者一些特殊的纪念日时都会将首页的Logo徽标换成与该日子相关的设计。其中在这方面要数谷歌和百度做得最为出色:无论是三八节、五一节这样的国际节日,或者情人节、万圣节这样的西方舶来物,还是春节、清明、端午等传统的中国农历节日,谷歌和百度都会精心设计相应的节日Logo;此外,谷歌在一些特殊的纪念日,如达芬奇诞辰、地球日之类的纪念日也会推出专门的徽标;而百度近期开始定期在首页推出一个搜索封面人物,以此反映对互联网时代风云人物的价值取向,十分有特色。雅虎和搜狗在节日Logo设计方面也有所表现,在节日时也可经常看到其专门的徽标;网易有道正式版新近推出不久,我们还无法对其在特殊Logo的设计上是否会有所表现作出评价。搜索引擎的特色Logo其实并不仅仅是一个单纯的设计,它还有更多的作用:它承载了一种信息,传达了搜索引擎提供商对于创新、

企业网站搜索引擎友好性分析实验报告

企业网站搜索引擎友好性分析实验报告 1.实验目的 了解搜索引擎营销对网络营销信息传递的作用,通过对部分选定网站搜索引擎进行友好性分析,深入研究网站建设的专业性对搜索引擎营销的影响,对于发现的问题,提出相应的改进建议。 2.实验内容和步骤 (1)从备选网站中选定一个企业网站; (2)浏览该网站并确认该网站最相关的2-3个核心关键词(比如主要产品名称、所在行业等); (3)用每个关键词分别在搜索引擎google和百度进行检索,了解该网站在搜索结果中的表现,如排名、网页标题和摘要信息内容等,同时记录 同一关键词检索结果中与被选企业同行的其他竞争者的排名和摘要信息情况; (4)根据有关信息分析被调查网站的搜索引擎友好性。 本实验备选网站网址 https://www.360docs.net/doc/0d6252032.html, https://www.360docs.net/doc/0d6252032.html, https://www.360docs.net/doc/0d6252032.html, https://www.360docs.net/doc/0d6252032.html, https://www.360docs.net/doc/0d6252032.html, https://www.360docs.net/doc/0d6252032.html, https://www.360docs.net/doc/0d6252032.html, https://www.360docs.net/doc/0d6252032.html, https://www.360docs.net/doc/0d6252032.html, https://www.360docs.net/doc/0d6252032.html, 3.实验报告 本次实验所选的网站是娃哈哈集团的https://www.360docs.net/doc/0d6252032.html,,并以GOOGLE,百度两个搜索引擎进行搜索。 杭州娃哈哈集团有限公司为中国最大的食品饮料生产企业,全球第五大饮料生产企业,仅次于可口可乐、百事可乐、吉百利、柯特这4家跨国公司主要生产含乳饮料、瓶装水、碳酸饮料、茶饮料、果汁饮料、罐头食品、医药保健品、休闲食品等八大类60多个品种的产品,其中瓶装水、含乳饮料、八宝粥罐头多年来产销量一直位居全国第一。进入该公司网页首先出现醒目的“娃哈哈”三个字,背景是传统的鮮紅色,配以简单的关键词和动态的产品图片介紹。通过浏览其网站后我觉得应该选用“饮料业”“饮用水”“乳品”作用核心关键词进行研究分析。 一,在GOOGLE搜索。

数据压缩实验报告

实验一常见压缩软件的使用 一、实验目的 使用一些常见的压缩软件,对数据压缩的概念、分类、技术和标准形成初步的认识和理解。 二、实验要求 1.认真阅读实验指导书,按实验步骤完成实验内容。 2.实验过程中注意思考实验提出的问题,并通过实验解释这些问题。 3.通过实验达到实验目的。 三、实验环境 计算机硬件:CPU处理速度1GHz以上,内存258M以上,硬盘10G以上 软件:Windows操作系统2000或XP。 四、实验内容 1.使用WinZip或WinRAR两种压缩软件分别对文本文件(.txt,.doc)、程序源代码文件(.c)、数据文件(.dat)、二进制目标代码文件(.obj)、图像文件(.bmp)、音频文件(.wav)和视频文件(.avi,.wmv)进行压缩,分别计算出压缩率,判断这两种压缩软件采用的是可逆压缩还是不可以压缩,猜测其可能用到了那些压缩(编码)技术? 2.使用jpegimager、TAK和BADAK分别进行图像、音频和视频的压缩,体验其压缩效果。3.使用bcl程序对文本文件、程序源代码文件、数据文件、二进制目标代码文件、图像文件等进行多种统计编码技术的压缩,包括香农-费诺(shannon-fano)编码、霍夫曼(huffman)编码、游程编码rle、字典编码lz等,记录每种压缩方法对不同类型文件的压缩效果并进行比较,结合所学知识,解释其中的原因。 五、实验步骤 1、下载并打开WinZip和WinRAR两种压缩软件 2、分别新建两个文档:qqjj.winzip 和winrar。添加所要压缩的文件:文本文件(.txt,.doc)、程序源代码文件(.c)、数据文件(.dat)、二进制目标代码文件(.obj)、图像文件(.bmp)、音频文件(.wav)和视频文件(.avi,.wmv)进行压缩,如图所示:

技能训练5-1主要搜索引擎特性的对比分析

技能训练5-1 主要搜索引擎特性的对比分析 以“六度空间理论”、“搜索引擎优化”、“手持移动电视”为关键字,在三大搜索引擎(百度、谷歌、搜搜)上进行“网页”搜索,将相关搜索结果整理为100字左右的文字描述,然后以4-6人为小组分享各自的结论,并就三大搜索引擎的特点、返回结果信息的相关性、价值度的大小等方面进行讨论,并将形成的结论填入下表。 表5-4 三大搜索引擎对比分析表 调查时间: 11·28 调查人:余思琪 搜索对象搜索引 擎种类 搜索引擎 特性描述 信息 相关 性 评价 信息 价值 度 评价 是 否存在 商业推 广 六度 空间理论百度 拥有目前世界上 最大的中文信息库, 支持主流的中文编码 标准,采用智能相关 度算法,支持二次检 索(又称渐进检索或 逼进检索),采用先进 的网页动态摘要显示 技术 相关 度高,前 20条里有 19条都与 之相关,大 多来自百 科.文库. 博客 信息 价值度,在 这19条中 我都能了 解到关于 六度空间 理论的相 关信息 没 有Google 目前规模最大搜 索引擎,提供常规搜 不高, 前十条中 一般, 其中有不 存 在关键

索和高级搜索两种功能。信息条目数量。但也要注意其多种语言字母无大小写之分,全部默认为小写,不使用词干法,也不支持通配符只有5条 与其相关 来自百科, 和一些网 页 少与所搜 索的东西 不相关 字广告 和广告 联盟 搜搜 腾讯出品为广 大用户提供的问答互 动平台。覆盖面广 ——接触庞大QQ用户 群,针对性强——准 确覆盖目标用户,互 动性强——即搜即Q, 立刻抓住您的客户, 灵活可控——快捷调 整广告内容和广告开 销 相关 度很高,前 十条内都 与之相关 信息 价值度高。 从前十条 中我都能 了解到六 度空间理 论的含义 没 有 什么是六度空间理论? 你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。这就是六度分割理论,也叫小世界理论。

常用中文搜索引擎对比

几大常用中文搜索引擎的对比 随着互联网的不断发展扩大,网络上中文信息资源和上网的中文用户也大量增加,各类中文搜索引擎更是层出不穷。以下我选取了Google中文,百度,搜狗,必应这几个常用的中文搜索引擎进行较为粗浅的比较。 先比较一下各搜索引擎的特点。Google中文:包括网页、图片、新闻搜索,支持个性化搜索及本地搜索,提供论坛、邮箱、日历服务和桌面搜索工具,是万维网上最大的搜索引擎,但Google中文在中国却一直受到百度搜索的压制,最终由于黑客攻击和敏感词过滤问题退出中国内地转至香港。百度:是全球最大的中文搜索引擎,除网页搜索外,还提供MP3、文档、地图、传情、影视等多样化的搜索服务,率先创造了以贴吧、知道为代表的搜索社区,是目前国内最大的商业化全文搜索引擎。搜狗:搜狗是全球首个百亿规模中文搜索引擎,收录100亿网页,创造了全球中文网页收录量新高,搜狗以网页搜索为核心,在音乐、新闻、图片、地图等方面提供了垂直搜索服务,通过说吧建立用户间的搜索社区,2010年8月搜狐与阿里巴巴宣布将分拆搜狗成立独立公司,引入战略投资,注资后的搜狗有望成为仅次于百度的中文搜索工具。必应(bing):必应是微软公司09年新推出的中文搜索引擎。主打快乐搜索体验。

接着从各方面对比:1.外观排版:Google、百度、搜狗的外观都是以简单的白色背景为主,而必应的背景是一副定期更换的图片,乍看比较新鲜,可是用习惯后我发现搜索引擎还是简洁一点好。不同于其他3家“相关搜索”出现在搜索结果的底部,必应在网页左侧和底部都出现了“相关搜索”,虽然略显重复,但在一定程度上为用户提供了方便。2.搜索结果:在这4家引擎同时输入“集美大学诚毅学院”,可以看到Google用时0.10 秒获得约62,900 条结果,百度用时0.018秒找到相关网页约55,000篇,必应没有显示用时找到共50,900 条,搜狗用时0.027 秒只有30,636条。可见在Google的搜索量大,而百度的时间最短,速度和数量比最好,搜狗略逊一筹3.搜索内容:四家网站的内容更新都比较及时,百度的优势在于很中国化很生活化,符合中国人的习惯。但它的内容的匹配度不如Google高,而且很商业化,广告和垃圾网站很多,适合搜索一般问题。Google专业搜索比较好,适合技术人员,学生教师,搜索范围较广。特别是Google的地图和翻译是其他搜索引擎无法比拟的。但是Google由于版权问题无法搜索MP3,这是个硬伤,因为搜索MP3在中国已经成为流行。Google的死链率也比较高,中文网站检索的更新频率不够快,“网页快照”功能在国内经常出现不可访问的问题。搜狗较多的被用在搜索新闻,音乐,电影上,娱乐性强,商机搜索和说吧也很有特色。必应搜索与传统搜索引擎只是单独列出一个搜索列表不同,微软还会对返回的结果加以分类。但必应默认搜索结果只显示5页,其他搜索引擎都是10页,在点击到第五页的时候,会自动出现9页结果,这显然

搜索引擎推广手段应用现状调查报告

搜索引擎推广手段应用现状调查报告 班级:B09工商管理(3)班 姓名:吕胜聪 学号:07

搜索引擎推广手段应用现状调查报告 1调查题目:搜索引擎推广手段应用现状调查报告 2调查员:吕胜聪 3调查日期:2012年6月13日-2012年6年20日 4调查方式:网络调查 5调查结果总结 1搜索引擎的简介 搜索引擎推广是指利用搜索引擎、分类目录等具有在线检索信息功能的网络工具进行网站推广的方法。由于搜索引擎的基本形式可以分为网络蜘蛛型搜索引擎(简称搜索引擎)和基于人工分类目录的搜索引擎(简称分类目录),因此搜索引擎推广的形式也相应地有基于搜索引擎的方法和基于分类目录的方法,前者包括搜索引擎优化、关键词广告、竞价排名、固定排名、基于内容定位的广告等多种形式,而后者则主要是在分类目录合适的类别中进行网站登录。随着搜索引擎形式的进一步发展变化,也出现了其他一些形式的搜索引擎,不过大都是以这两种形式为基础。 2 搜索引擎的推广手段 搜索引擎推广的方法又可以分为多种不同的形式,常见的有:登录免费分类目录、登录付费分类目录、搜索引擎优化、关键词广告、关键词竞价排名、网页内容定位广告等。 2.1首先我讲解下本站主要提供的服务, 也就是搜索引擎推广法中的搜索引擎优化环节,在网站推广中,搜索引擎优化是非常重要必不可少的一种推广方式,他是我们专业的SEOER通过网站优化,将网站打造成搜索引擎所喜欢的站点类型,并且辅助其他的一些方法,达到在搜索引擎左侧搜索结果获得高排名的一种方法,搜索引擎优化将最大限度的节约企业的推广资金,并且所获得的效果是搜索引擎推广其他的任何方式都无法比拟,它具有竞价排名推广方式的所有优点,并且也不足了竞价排名的一些不足,例如恶意点击等无法避免的遗憾,唯一的缺点是无法速成,从优化到见效需要3个多月的时间。

网络营销上机实验报告

实验一 实验日期:星期四56 第1次实验 实验名称:企业网站专业性诊断评价 实验目的:加深对网络营销导向的企业网站的认识,利用所学知识对对网站专业性进行分析评价,记录评价过程中发现的主要问题,并提出相应的改进建议。 实验内容:企业网站专业性诊断评价 实验步骤: 我选择对杉杉的企业网站进行网页诊断和分析郑永刚领军的杉杉投资控股(集团)有限公司(下简称杉杉控股),是以资本为纽带的大型企业集群。杉杉控股2008年销售额达116亿,资产总额超过100亿,产业涉及时尚产业、新能源新材料、投资、园区开发、国际贸易五大板块,旗下拥有杉杉股份和中科英华两家上市公司。2002年以来杉杉控股连续入选中国企业500强。2009年杉杉集团与伊藤忠商社实现全面合资合作,双方在管理、品牌、技术、国际化等多方面展开紧密对接,杉杉进入一个新的发展时期。 我觉得该网站的优点有: 1、首先该网站下载速度还比较快,我在10秒内打开了该企业网站。 2、通过最多3次点击,可以通过首页到达任何一个页面内容 这是第一个页面(首页)

这是第二个页面 这是第三个页面

还可以通过任何一个页面到达站内的其他任何网站,比如,我现在所在的页面是一个三级页面,可以到达其他任何一个页面。如下图。 3、公司介绍还比较详细,有企业的具体联系方式。

4、网站可以稳定运行,访问速度挺快。这从我诊断该网站的过程中可以了解到。 5、为用户提供站内搜索、多种语言等在线服务手段。

6、用户关心的信息可以在网站首页直接找到。 我觉得该网站的缺点有: 1、网站首页、各栏目首页以及各个内容页面没有能反映网页核心内容的网页标题,整个网站几乎都用一个网页标题,各网页标题几乎都是“杉杉控股”,除了一级栏目“校园招聘”下的网页标题是“[杉杉投资2011校园招聘]杉杉投资前程无忧官方校园招聘网”外。

2011搜索引擎排名因素调查报告

报告理论依据 作为搜索引擎优化技术人员,我们对商业网站搜索结果最具影响的因素尤为注意。因此,我们对此一直进行研究,调查网站搜索结果和Linkscape工具中的链接与锚文本等数据,以及从Facebook得到的社会媒体信号,还有页面因素/链接地址/域名关键词因素之间的关系。 这份文件阐释了我们的理论方法,包括数据的建立和统计分析,主要构成如下:接下来的部分包含数据建立的细节,对数据源和样本抽取的选择。最后一部分描述的是统计分析方法。 在研究细节之前,我们想对几个重要特点进行分析。虽然以后我们计划拓展分析,但目前我们只考虑英语语言,即从谷歌搜索引擎得到的结果。在2011年3月,也就是在谷歌的Farmer/Panda更新之后,我们对所有数据资料进行了采集。 数据收集 关键词列表:构建数据集的第一步选择一个查询词列表.因为该列表决定了数据集的构成质量,所以确保它涵盖各种主题和查询 种类是至关重要的.为达到此目标,我们使用了Google Adwords工具推荐的排名前15的查询种类(表1给出了关键词分类清单).Google Adwords工具给每一种类提供了800个查询,共计12000个.通过清除副本(有些查询含多个种类),我们最后得出的清单有10980个查询.

通过搜索量来测算,关键词的最终列表包含样本的头、中、尾查询。表2列出了不同本地搜索量的查询数量。从罕见搜索(每月少 于1000次)到频繁搜索(每月超过20000次,以及包含每月超过1000000次关键词搜索的数据),所有的搜索量都得到了较好的体现。 SERPs:我们在谷歌美国搜索引擎中对查询列表上10980个查询词进行了查询,并且每个词都提取了前30个搜索结果。我们 从结果中删除所有非网页搜索结果(图像、视频、新闻等),最后,我们排除所有返回的结果小于15的查询,以确保每个SERP有足够的数据点进行分析。最终剩下223737个独立的URL。 因素:构建数据集的最后一步是计算排名因素。我们收集了各种来源的因素,具体如下。 1、Linkscape URL指标.所有链接的相关因素均来源于Linkscape,使用url-metrics API调用。(Linkscape是SEOmoz开发的软件,使用自己的爬虫来获取海量的数据) 2、Linkscape锚文本对于每一个网址,我们提取了使用Linkscape锚文本API调用的前1000个锚文本术语和短语。然后,我 们确定是否有局部/精确匹配的查询。这里的“精确匹配”是指整个查询的锚文本完全匹配,而“部分匹配”是指查询中至少有一个词与锚文本匹配。 3、社会媒体的信号。对于每一个网址,我们从Facebook、谷歌Buzz和Topsy(Twitter)的API中获取各种社会媒体的信号。 4、网页上的因素。我们检索每个网址的原始的HTML/XML内容,而且计算了各种利益因素。如在不同页面元素中的关键词匹配,文件的长度等 5、域名/URL因素我们也采集了有关网址和域名的各种因素,如查询是否与域名匹配,是否域名中包含任何连字符等。在带有所有结果的数据集中可以发现该因素的完整列表和每个描述。 此次调查的介绍 此次调查的介绍两段更改为:2011年3月期间,SEOmoz采访了134位SEO专业人士,收集了他们对目前商业网站搜索结果影响因素的看法及对未来搜索的预测。下面的数据显示,自由职业者与营销人员受访者之间存在较大的分歧。此外,这些受访者的工作地点涵盖了从当地小规模网站到企业级别的网站。 本次调查还包括一些关于搜索计算的基本问题,要求每个受访者针对特定类别的网站,按顺序罗列出其潜在影响因素的清单。每个问题均有115到126人回答。除个别结果按比例进行了缩放以外,其它调查结果仍按收集的原样呈现。

搜索引擎优化实验报告

实验 成绩 实验评阅教师签名 简 要 评 语 华北科技学院管理系 实验报告册 20 实验课程名称: 网上创业 实验项目序号: 实验六 实验项目名称: 搜索引擎优化 实验室名称: 电子商务实验室 开课学 期: 2011 ——2012 学年第 1 学期 授 课 教 师: 白宏斌 实验指导教师: 白宏斌 专 业: 电子商务专业 班 级: B09-3 姓 名: 巩伟 学 号: 200904064327

实验报告实验时间: 2011 年12月20 日

关键词:新闻 凤凰网 凤凰网是一个集图文资讯、视频点播、专题报道、虚拟社区、免费资源、电子商务为一体的Internet 站点;网站设有专栏,介绍凤凰卫视中文台、资讯台、电影台、欧洲台、美洲台和《凤凰周刊》。凤凰网秉承“开创新视野,创造新文化”之精神,凤凰展翅之理想,始终坚持以先进科技配合卓越服务,根据每一位用户和客户的需求制定个性化的服务程式,务求协助用户和客户准确达成目标,创造辉煌成绩。 凤凰网是一个集图文资讯、视频点播、专题报道、虚拟社区、免费资源、电子商务为一体的Internet站点;网站设有专栏,介绍凤凰卫视中文台、资讯台、电影台、欧洲台、美洲台和《凤凰周刊》。 一、标志 凤凰LOGO由两只凤凰构成一个圆,中间是一只注视着世界的眼睛。颜色的基调是象征高贵、雍荣的黄色,黄色之中,又有热烈、耀眼的红色,这两种颜色是中国人最喜欢的。 1、一凤一凰两只鸟,盘旋飞舞、和谐互动的共容在一个圆内。寓意凤凰的起源、成形;凤凰台的东方特色;凤凰台是东西传媒合作的产物。 2、两只鸟头朝里,尾朝外呈弧形打开,所有的口都是开放的。寓意在中国传统的、封闭的意识形态中找到出口;开门办台,欢迎合作,迎接挑战,吸收各种先进经验和优秀文化;发挥传媒影响力,以开放姿态融入世界,让世界了解中国。 3、与中国道教的太极图有形似意同之妙。寓意阴阳的彼此对立又相互消长,阴阳是宇宙运行之道,是万物之和,世界之和。 4、中国解释历史的方式是盛衰分合带有轮转的性质,西方的历史观以直线前进的观点为基础。凤凰LOGO将二者结合为螺旋式前进。团凤构成的圆又是像一个地球,寓意凤凰将把影响力扩大到全世界。 凤凰网是凤凰新媒体旗下的一个图文音、视频综合资讯网站,提供国际、中国大陆及港、澳、台地区的时政、社会、财经、娱乐、时尚、生活等综合新闻信息;以博客、论坛、辩论、调查等Web 2.0应用为用户提供互动与共动交流空间;以RSS、TAG、点播、轮播、个人节目表等可订制的多媒体服务满足用户的个性化信息需求。 二、资讯中心 资讯频道 凤凰资讯,真实、多维、高远,立足大中华、聚焦两岸三地、放眼全世界,为你提供与国内媒体不尽相同的资讯大餐。高度、角度、尺度、深度、热度、速度、黏度,第一时间将资讯的力量与您分享,是个人提升不可缺少的资讯平台。 财经频道 高端财经、深度解读、全球视野、独家观点、评论访谈,凤凰网财经频道依托强大的凤凰

七大搜索引擎特点

七大搜索引擎:百度、XX、搜搜、搜狗、有道、雅虎、必应 1?百度: 1.基于字词结合的信息处理方式。巧妙解决了中文信息的理解问题,极大地提高了搜索的准确性和XX。 2.支持主流的中文编码标准。包括GBK汉字内码扩展规范)、GB2312简体)、BIG5繁体),并且能够在不同的编码之间转换。 3.智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。 5.百度搜索支持二次检索(又称渐进检索或逼进检索)。可在上次检索结果中继续检索,逐步缩小查找范围,直至达到最小、最准确的结果集。利于用户更加方便地在海量信息中找到自己真正感兴趣的内容。 6.相关检索词智能推荐技术。在用户第一次检索后,会提示相关的检索词, 帮助用户查找更相关的结果,统计表明可以促进检索量提升10-20%。 7.运用多线程技术、高效的搜索算法、稳定的UNIX平台、和本地化的服务器,保证了最快的响应速度。百度搜索引擎在xx境内提供搜索服务,可大大缩 短检索的响应时间(一个检索的平均响应时间小于0.5秒) 8.可以提供一周、二周、四周等多种服务方式。可以在7天之内完成网页 的更新,是目前更新时间最快、数据量最大的中文搜索引擎。 9.检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。支持用户选择时间范围,提高用户检索效率。 10.智能性、可扩展的搜索技术保证最快最多的收集互联网信息。拥有目前世界上最大的中文信息库,为用户提供最准确、最广泛、最具时效性的信息提供了坚实基础。 11.分布式结构、精心设计的优化算法、容错设计保证系统在大访问量下的高可用性、高扩展性、高性能和高稳定性。

搜索引擎性能评价报告

实验:搜索引擎性能评价 小组成员:黄婷苏亮肖方定山 一、实验目的: 依据MAP,P@10,MRR等评价指标对各个搜索引擎(百度、搜狗、必应)的查询性能进行评测,对搜索引擎满足不同信息需求的情况加以比较。 二、实验方案: 1.构建查询样例集合: (1)构建查询样例集合 规模:100个查询 热门程度:冷门/热门 类型:导航类/信息类/事务类(2:5:3) (2)根据个人经验,撰写每个查询样例的信息需求内容 2.构建Pooling: (1)抓取各个搜索引擎对步骤一查询词的查询结果 抓取的搜索引擎:五个中文搜索引擎(百度、搜狗、必应) 抓取范围:查询结果的前30位结果 注:pooling method的大概意思是查询结果去重 3.构造标准答案集合: (1)根据步骤1中撰写好的信息需求,对Pooling里的结果进行标注,标注为“答案”和“非答案”两类即可 4.查询性能评价: (1)根据标注结果,依据MAP,P@10,MRR等评价指标对各个搜索引擎的查询性能进行评价 (2)对搜索引擎满足不同信息需求的情况加以比较 5.扩展内容: (1)可以尝试对搜索引擎处引擎处理非中文查询、有错别字查询等情况的不同策略进行分析、比较 三、实验结果及分析:

根据实验结果及目的,详细分析实验结果。 1.实验结果: 百度:https://https://www.360docs.net/doc/0d6252032.html, 搜狗:https://https://www.360docs.net/doc/0d6252032.html, Bing国内版:https://https://www.360docs.net/doc/0d6252032.html, 综合比较: 2.结果分析: (1)导航类搜索词 对于导航类搜索关键词,RR一般用作评价导航类的查询需求,用于表示用户在知道目标前需要浏览的结果数目,可以看到,搜狗事务类的MRR指标偏高,可以发现,当用户想要搜索的信息为已知资源,主页,资源等信息时,搜索引擎可能会更倾向于返回给用户一些官方的主页信息,以使用户能够尽快找到目标,对于导航类信息的其他指标,相差也不大,但是P@10的指标值差异有些明显,搜狗和百度的P@10值是较好的,而必应的结果则稍差,查看原始搜索结果标记,

搜索引擎对比

百度、谷歌、搜狗、有道四大搜索引擎的比较分析学校:中南财经政法大学学号:2009357770832 姓名:李心彤 随着经济与科技的发展,信息对于人们来说越来越重要,而随着计算机的普及,人们利用搜索引擎来获取信息也是越来越频繁。因此,国内外的几家搜索引擎展开了角逐,在各自领域努力发挥着自己的优势。本文通过对百度、谷歌、搜狗、有道四大搜索引擎的个人化体验,对其作出比较与分析。体验主要从以下几个方面进行: 一、政治敏感度

搜索引擎百度搜狗有道谷歌 词条数量323 1433 43 69100 可以看出,在搜索较为敏感的政治事件时,各大搜索引擎表现出极大的不同。作为国内最大用户最多的百度搜索引擎,是唯一一个表现出明确屏蔽态度的搜索引擎,会在搜索框下方显示“根据相关法律法规和政策,部分搜索结果未予显示”,且其搜索数量也是几个搜索引擎中较少的。同时,在搜索出来的词条中,再未显示关键词中的任何一个字,仅在具体内容中偶有一两个相同字眼。可见百度对政治敏感内容十分顾忌。 而搜狗则在搜索页的最末用灰色字体显示“根据相关法律法规和政策,部分搜索结果未予显示”,不太能够引起人的注意。其搜索结果虽然在四个引擎中排名第二,但仍然并不算多。且其跟百度一样,搜索出来的结果中并未出现过多的关键词。 有道虽然是所有引擎中结果数量最少的,但出人意料的是,有道所搜索出来的前几个词条,是完全符合搜索词的。虽然其具体内容皆无法打开,但不得不说有道是国内引擎中最大胆的。 而谷歌作为国外开发的搜索引擎,一向对政治事件十分随意,因此,我们不难从图片中看出搜索政治敏感事件时,谷歌就像搜索随意的生活内容一样将各项结果显示,且有些资源是来自于国外的网站。但是具体点击时,视频、图片以及部分文字类内容明显在检测和过滤后是打不开的,且检测与过滤速度十分缓慢。但是,部分论坛里的讨论、对事件阐述并不太多也不太高调的文字类内容还是能够得以显现。 笔者随后更换搜索的关键词,使其更多与国家政治领导人相关,其搜索结果为: 搜索引擎百度搜狗有道谷歌 词条数量80200 3986 99 117000

相关文档
最新文档