难为仁兄能具体解释一下数据挖掘与数据仓库的联系与区别?简单的说,数据仓库是过去,数据挖掘是面向未来,个人理解!数据仓库(DW):数据的集成,面向主题,不可更新历史,不随时间变化。
数据挖掘(DM):建立在DW之上,分析DW。:)啊
说的都有道理。可能否在具体或是在全面一些那。非常感谢!感谢两位的回帖。对于DM和DW的区别与联系,我了解一点,可感觉好像还是不太清晰。对于一楼的朋友的回答,不知能否更具体些那。过两天就要学这个了,期盼》》》还是2楼的说的言简意赅,赞一个!到仓库中挖知识从历史数据源中抽取数据建立数据仓库,供分析用
从建立的数据仓库中进行知识发现,进行数据挖掘
层次不一样哦在实际工作中发现这样一个问题:
老板总喜欢认为在上了数据仓库后,为了缓解OLTP系统的压力,会把比较多日报表等的数据源连接到数据仓库。
这样就需要每日晚上就要跑一遍ETL,及时更新数据仓库的资料。
可记得最初不是说数据仓库是对大量历史数据的汇总,而且是一般不作更新的吗?
但是如果导入的数据包括前一日的话,线上的数据难免会有更新,数据仓库也要跟着改。。。 数据挖掘研究院
有经验的人能说说数据仓库出了建立/处理cube,保存历史数据,还应该干什么?一般更新的频率是多少呢?
首先说说个人对数据仓库和数据挖掘的理解。
其实这是两个概念,人们常常拿数据库和数据仓库来比较,从网上摘录一段话,说得比较清楚。“事实上,数据仓库和数据库不同,它不是现成的软件或者硬件产品。比较确切地说,数据仓库是一种解决方案,是对原始的操作数据进行各种处理并转换成有用信息的处理过程,用户可以通过分析这些信息从而作出策略性的决策。因此,在很多场合,我们也把数据仓库系统称为决策支持系统。由于这个原因,数据仓库的用户不是类似银行柜员的终端操作人员,而是针对各个业务部门的用户和有关决策人员。因此,数据仓库的用户比传统的OLTP(联机事务处理:On-line Transaction Processing)用户少得多。”
再来回答一下michaelgy关于数据仓库应用的问题,其实也是数据仓库查询的特点,其中也涉及什么是数据挖掘。
针对数据仓库系统的查询大都非常复杂,主要有两种:一种以报表为主,从数据库中产生各种形式的业务报表。这种查询是预先规划好的(Pre-defined Query);另一种则是随机的、动态的查询(Ad-Hoc Query),对查询的结果也是不能预料的。数据仓库中的查询由于其复杂性,会经常使用多表的联接、累计、分类、排序等操作,这些大都要对整个表进行搜索。每次查询返回的数据量一般很大,经常需要根据上次查询的结果进行进一步的搜索,这个过程常称为数据挖掘。
Create By Any-Extract(WL-AE) 数据挖掘论坛