数据挖掘与数据仓库的联系与区别

难为仁兄能具体解释一下数据挖掘与数据仓库的联系与区别?

简单的说,数据仓库是过去,数据挖掘是面向未来,个人理解!

数据仓库(DW):数据的集成,面向主题,不可更新历史,不随时间变化。


数据挖掘(DM):建立在DW之上,分析DW。:)


说的都有道理。可能否在具体或是在全面一些那。非常感谢!

感谢两位的回帖。对于DM和DW的区别与联系,我了解一点,可感觉好像还是不太清晰。对于一楼的朋友的回答,不知能否更具体些那。

过两天就要学这个了,期盼》》》

还是2楼的说的言简意赅,赞一个!

到仓库中挖知识

从历史数据源中抽取数据建立数据仓库,供分析用
从建立的数据仓库中进行知识发现,进行数据挖掘
层次不一样哦

在实际工作中发现这样一个问题:
老板总喜欢认为在上了数据仓库后,为了缓解OLTP系统的压力,会把比较多日报表等的数据源连接到数据仓库。

这样就需要每日晚上就要跑一遍ETL,及时更新数据仓库的资料。

可记得最初不是说数据仓库是对大量历史数据的汇总,而且是一般不作更新的吗?
但是如果导入的数据包括前一日的话,线上的数据难免会有更新,数据仓库也要跟着改。。。 数据挖掘研究院

有经验的人能说说数据仓库出了建立/处理cube,保存历史数据,还应该干什么?一般更新的频率是多少呢?

首先说说个人对数据仓库和数据挖掘的理解。
其实这是两个概念,人们常常拿数据库和数据仓库来比较,从网上摘录一段话,说得比较清楚。“事实上,数据仓库和数据库不同,它不是现成的软件或者硬件产品。比较确切地说,数据仓库是一种解决方案,是对原始的操作数据进行各种处理并转换成有用信息的处理过程,用户可以通过分析这些信息从而作出策略性的决策。因此,在很多场合,我们也把数据仓库系统称为决策支持系统。由于这个原因,数据仓库的用户不是类似银行柜员的终端操作人员,而是针对各个业务部门的用户和有关决策人员。因此,数据仓库的用户比传统的OLTP(联机事务处理:On-line   Transaction   Processing)用户少得多。”
再来回答一下michaelgy关于数据仓库应用的问题,其实也是数据仓库查询的特点,其中也涉及什么是数据挖掘。
针对数据仓库系统的查询大都非常复杂,主要有两种:一种以报表为主,从数据库中产生各种形式的业务报表。这种查询是预先规划好的(Pre-defined   Query);另一种则是随机的、动态的查询(Ad-Hoc   Query),对查询的结果也是不能预料的。数据仓库中的查询由于其复杂性,会经常使用多表的联接、累计、分类、排序等操作,这些大都要对整个表进行搜索。每次查询返回的数据量一般很大,经常需要根据上次查询的结果进行进一步的搜索,这个过程常称为数据挖掘。  



Create By Any-Extract(WL-AE) 数据挖掘论坛

[数据挖掘专家] [数据挖掘研究院] [数据挖掘论坛] [数据挖掘实验室]
上一篇:高分请求MDX中where语句的语法规则
下一篇:excel无法连接analysis服务器,急!!!
最新评论共有 0 位网友发表了评论 , 查看所有评论
发表评论( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航 数据挖掘论坛导航
  • 数据挖掘工具
  • 数据挖掘论坛
  • DataCruncher - Cognos
  • MineSet - MathSoft
  • Intelligent Miner - GainSmarts
  • Sqlserver - SAS - Clementine
  • CART - Weka - WizSoft
  • NeuroShell - ModelQuest
  • data mining tools - Darwin
  • 数据挖掘交友
  • 数据挖掘博客
  • 数据挖掘工具
  • 数据挖掘资源
  • 数据挖掘技术算法
  • 数据挖掘相关期刊、会议
  • 研究院联盟合作专区
  • 数据挖掘基础与相关技术
  • 数据挖掘厂商与就业
  • 数据挖掘研究者乐园
  • 知名厂商数据挖掘工具资料
  • 国内数据挖掘实验室
  • Foreign Data Mining Lab
  • 热点关注
  • SQL与最短路径算法
  • 求一个数据库备份方案
  • 某商店数据仓库的原型分析和设计
  • 移动通信数据仓库联合实验室在北京成立
  • 数据仓库的规划构建策略
  • NCR Teradata数据仓库概述
  • 各位进来帮忙参考一下关于个人发展方向问题
  • 关于数据仓库的数据模型
  • 第五届机器学习及其应用研讨会日程表
  • 数据库归来——下一代数据库扫描简介
  • 论坛最新话题
  • Foundations of Statistical Natural Langu
  • Game Theory meet Data Mining: A Recent P
  • System Building: How does it help or hin
  • 数据挖掘与Clementine培训
  • 新手报到
  • 求 SASEM 客户流失预测分析
  • 数据挖掘工程师/搜索研究院—北京——无线
  • 数据挖掘入门介绍(如何着手数据挖掘)
  • Information Overload Survey Results
  • The INEX 2005 Workshop on Element Retrie
  • 相关资讯
  • 处理海量数据的经验和技巧
  • 数据仓库的新生
  • 什么是ETL
  • Data Warehousing for the Midsize Organiz
  • Data warehouse management strategies for
  • 第五届机器学习及其应用研讨会日程表
  • SQL Data Warehouse Analyst
  • Edge appliances and the evolution of dat
  • 动态数据仓库让BI走向一线
  • The OLAP Report
  • 数据挖掘实验室资料
  • 数据挖掘博客地址
  • 数据挖掘实验室网站地址
  • Prepare for Medicare audits by using dat
  • 注册成为SAS用户与爱好者俱乐部会员
  • 水南梅
  • 明日烟
  • 新人报道
  • 下载
  • 厦门服务器托管,450元/月—0592-5177319 高
  • 买空间送域名--0592-5177319 高静