超越Google使用GrokkerⅡ搜索结果


不能否认,Google是一种功能非常强大的搜索工具,它已经成为很多人每天不可缺少的得力助手:搜索对自己工作和学习有帮助的Internet信息,从大海中捞出那根有价值的“绣花针”。可是,经常使用Google的人也会发现,真正搜索到自己需要的有价值的信息的难度也是很高的,Google往往在有用的信息中掺杂了太多的无用信息,实际上它把找到的“绣花针”从大海里捞出来以后,又放进了饱含无用信息的“沙漠”中——你需要的信息往往都被淹没在几十页的搜索结果中。


也许有人会说,那是因为你没有恰当地使用关键词或者没有利用它所提供的高级功能选项。不错,笔者承认Google所提供的高级搜索选项配合非常恰当的关键字会让搜索结果事半功倍,但是你也得承认,大多数人无法掌握如此高超的搜索技巧,也没有时间去学习这种与自然语法迥异的搜索语法规则,因此大多数人(包括笔者)都不能经常从Google那里得到满意的搜索结果(不满意的搜索结果所占的比例甚至超过80%)。 数据挖掘研究院

好在有人已经注意到这个问题,一些有趣的技术也浮出“水面”了。这些技术的出现是对Google等搜索引擎的有效补充,满足了那些非专业人士的信息搜索需求。也许在不久的将来,这些技术将会成为一场改变人们挖掘Internet信息的行为方式的革命。目前已经有人开发出来一些相关的软件,这些软件会分析搜索的结果,自动将结果分类归档,并且对结果进行排序。它们可以提供比传统的文本链接列表更丰富、更有用的信息。

正如Vivisimo的创始人之一Raul Valdes-Perez所说的:“我们将其他毫无生气的搜索结果变得更加生动、活泼,更符合使用者的实际需求。”Vivisimo就是一种可以将搜索结果按照类别分类的搜索工具(如图)。位于美国匹兹堡的Vivisimo公司向各大公司和研究机构出售它们的搜索技术,并且向普通用户提供免费的网络搜索工具,你可以访问www.vivisimo.com来体验一下不一样的搜索结果。Valdes-Perez是这样描述它的公司的:如果Internet是一个巨型的书店——浩如烟海的图书被随意堆放在一起,那么Vivisimo就是一个手脚非常敏捷的图书管理人员,它可以迅速将书架上的图书按照一定的意义整理归类,让无序的书店变成井井有条的图书馆。你可以将Vivisimo看做一种21世纪的图书分类方法,只不过它不是用来管理普通图书的,而是用来管理Internet上浩如烟海的信息。但是,Vivisimo并没有预先定义好的分类目录。软件在搜索的同时对结果进行分类,分类目录的类别是由搜索结果决定的。通过一种结合语法与统计分析结合算法分析,Vivisimo的搜索算法不仅可以处理英语信息,在未做任何设定的情况下,它在左侧列出了搜索分类目录,也可以用于搜索其他的语言信息。
[数据挖掘专家] [数据挖掘研究院] [数据挖掘论坛] [数据挖掘实验室]
上一篇:超文本文献检索系统和方法
下一篇:超越Google使用GrokkerⅡ搜索结果
最新评论共有 0 位网友发表了评论 , 查看所有评论
发表评论( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航 数据挖掘论坛导航
  • 数据挖掘工具
  • 数据挖掘论坛
  • DataCruncher - Cognos
  • MineSet - MathSoft
  • Intelligent Miner - GainSmarts
  • Sqlserver - SAS - Clementine
  • CART - Weka - WizSoft
  • NeuroShell - ModelQuest
  • data mining tools - Darwin
  • 数据挖掘交友
  • 数据挖掘博客
  • 数据挖掘工具
  • 数据挖掘资源
  • 数据挖掘技术算法
  • 数据挖掘相关期刊、会议
  • 研究院联盟合作专区
  • 数据挖掘基础与相关技术
  • 数据挖掘厂商与就业
  • 数据挖掘研究者乐园
  • 知名厂商数据挖掘工具资料
  • 国内数据挖掘实验室
  • Foreign Data Mining Lab
  • 热点关注
  • Mercator: A Scalable, Extensible Web Cra
  • 什么是垂直搜索引擎(之二)
  • Writing a web crawler
  • 互联网搜索的未来
  • 国家版权局版权司副司长许超:关于搜索引擎
  • 百度数分钟内闪电裁员 企业软件事业部遭抛
  • 我对垂直搜索引擎的几点认识
  • Google Patent Filings by the Dozen
  • Manageability - Open Source Web Crawlers
  • 微软卡位第三代搜索技术 认为Google将很快
  • 论坛最新话题
  • Foundations of Statistical Natural Langu
  • Game Theory meet Data Mining: A Recent P
  • System Building: How does it help or hin
  • 数据挖掘与Clementine培训
  • 新手报到
  • 求 SASEM 客户流失预测分析
  • 数据挖掘工程师/搜索研究院—北京——无线
  • 数据挖掘入门介绍(如何着手数据挖掘)
  • Information Overload Survey Results
  • The INEX 2005 Workshop on Element Retrie
  • 相关资讯
  • 谷歌宣布进军可替代能源 计划投资4.4万亿美
  • 搜索大战成Web 2.0操作系统之争
  • 7月美国搜索市场环比增长2% 雅虎微软成输家
  • 网页面向搜索引擎的搜索引擎优化
  • 史上最具技术创新的10大搜索引擎
  • Google如何预测下一届美国总统
  • 微软1亿美元收购语义搜索引擎Powerset
  • 很黄很暴力:人肉搜索引擎
  • OpenSocial只不过是Google公关骗局
  • 数据之美 百度GOOGLE统计的秘密
  • 数据挖掘实验室资料
  • 数据挖掘博客地址
  • 数据挖掘实验室网站地址
  • Prepare for Medicare audits by using dat
  • 注册成为SAS用户与爱好者俱乐部会员
  • 水南梅
  • 明日烟
  • 新人报道
  • 下载
  • 厦门服务器托管,450元/月—0592-5177319 高
  • 买空间送域名--0592-5177319 高静