如何调用别的网站上的搜索结果

我想在网站上加个搜索框,搜索调用别的网站上的搜索结果,还有如果调用的网站不止一个,如何把搜索的结果给重新聚合显示出来,谢谢。

调用一个网站的话,直接采集过来就可以了,多个网站如果涉及分页的话比较复杂,除了采集之外,还涉及到求并集运算,如果同一个网站位于被调用的网站不同的页码上,想做到结果独立是非常耗资源的。

自己做代理及做好代理缓存.

当收到搜索结果时用数据库表将其存起来,然后再从一个表中读出就汇总了

1  做一个网络爬虫,爬到所需要的网页,file_get_content($url)好像就可以,不过要是有登录的话就要伪造cookie,好像pear中的http client可以办到。
2 把爬到的网页筛选出有用的信息,这个可以用正则。
3  把信息汇总

好像是采集吧  
  我也不会   
学习中 

file_get_content($url)是一个比较好的方法,将对方的搜索页面抓取过来,然后在分析出结果.
如果网站是熟悉的,可以通过它提供的webservice接口来获得搜索信息.

很多搜索引擎,比如google,有开放API的,你想调用查查它的API

如果你不介意在对方的网页显示出来,用apache的代理功能 数据挖掘工具

如果介意,除了采集好像也没有什么好办法

抓网页

正则出 搜索结果链结

数组合并

最好就采集下来以后,正则,然后存入数据库,要不然,每次都采集很慢啊.

嗯,没有什么大难题吧,但比较麻烦的

Create By Any-Extract(WL-AE) 数据挖掘工具

[数据挖掘工作交流] [数据挖掘研究院] [数据挖掘论坛] [数据挖掘实验室]
上一篇:mysql数据库的一些问题
下一篇:php中一个页面上如何实现两次的数据提交
最新评论共有 0 位网友发表了评论 , 查看所有评论
发表评论( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航 数据挖掘论坛导航
  • 数据挖掘工具
  • 数据挖掘论坛
  • DataCruncher - Cognos
  • MineSet - MathSoft
  • Intelligent Miner - GainSmarts
  • Sqlserver - SAS - Clementine
  • CART - Weka - WizSoft
  • NeuroShell - ModelQuest
  • data mining tools - Darwin
  • 数据挖掘交友
  • 数据挖掘博客
  • 数据挖掘工具
  • 数据挖掘资源
  • 数据挖掘技术算法
  • 数据挖掘相关期刊、会议
  • 研究院联盟合作专区
  • 数据挖掘基础与相关技术
  • 数据挖掘厂商与就业
  • 数据挖掘研究者乐园
  • 知名厂商数据挖掘工具资料
  • 国内数据挖掘实验室
  • Foreign Data Mining Lab
  • 热点关注
  • 揭秘成为最牛程序员的五大要诀
  • MYSQL错误:Illegal mix of collations (lat
  • PHP程序不适用大型系统的九大原因
  • 上海酒店公寓,上海短租公寓,上海短租房,上
  • 安装php5.2.5和mysql5.045后phpmyadmin报错
  • 福利彩票幸运号码自动生成器
  • 关于APACHE的配置文件httpd.conf
  • 国际:身处两难境地,PHP 该走向何方?
  • PHP跳转的方法?
  • 函式:preg_match_all()
  • 论坛最新话题
  • 正规省级、国家级别期刊征集论文稿件
  • 寻data mining cookbook 一书的配套光盘
  • 网博垂直搜索引擎完全开源版
  • 电脑也会成为火灾元凶 操作不当也会有危险
  • 网络暴力间接逼死崔真实 韩国拟立法实名上
  • 网络最流行的歌曲单良《那一场雪》推荐给大
  • 快国庆了大家怎么安排
  • 08年“铁观音秋茶”安溪铁观音,茶叶批发网
  • 快国庆了大家怎么安排
  • 世界最大规模“网格计算”网络启动
  • 相关资讯
  • Module mod_log_config
  • 圣殿骑兵PHP 2007年Web开发技术预言 (四)
  • 圣殿骑兵PHP 2007年Web开发技术预言 (三)
  • 圣殿骑兵PHP 2007年Web开发技术预言 (二)
  • 圣殿骑兵PHP 2007年Web开发技术预言 (一)
  • 一棵php的类树(支持无限分类)
  • 通过对php一些服务器端特性的配置加强php的
  • 如何使用动态共享对象的模式来安装PHP
  • 提升PHP执行速度全攻略(上)
  • phpBBBBcode处理的漏洞
  • 数据挖掘实验室资料
  • 注册成为SAS用户与爱好者俱乐部会员
  • 水南梅
  • 明日烟
  • 新人报道
  • 下载
  • 厦门服务器托管,450元/月—0592-5177319 高
  • 买空间送域名--0592-5177319 高静
  • mit ocw 数据挖掘相关课程连接
  • Introduction to Data Mining
  • Data Mining & Business Intelligence