返回首页

商业智能技术发展趋势及其标准探讨

时间:2004-11-23 01:19来源: 作者:unkonwn 点击:
  各位嘉宾,大家下午好,非常抱歉,因为现在已经到了 5:30的时间,几乎差不多快到晚饭的时间,也非常感谢大家这么有耐心,还在这边。我准备了一个很长的PPT,但是我尽量的把它短一点,希望快速的把这件事情,不影响我们大家的晚饭时间和我们下面的讨论的时间。

       我今天准备的题目叫商业智能技术的发展趋势及其标准的探讨,我们谈了这么多的商业智能,大家其实想一下,商业智能其实最核心的几个点,关键点就是这么几块,一个是数据,第一块是数据,然后把数据转换成信息,把信息变成知识,然后把知识应用到我们的决策过程中,所以所有的商业智能应该围绕四大块,就是这样的一个过程。围绕这个情况,我今天的演讲简单的从这几个方面。

       首先简单跟大家介绍一下商业智能应用的发展,其次谈一下市场发展的情况以及未来的发展趋势和行业标准简单的跟大家谈一下。商业智能这个东西,现在总的来讲发展趋势是什么东西,我们谈到以客户为中心逐渐的走向以客户为中心,大家很难撇开CRM,这是一个最高境界,我们能达到吗,很难,大家经常说晚上一家人在一起吃饭的时候,都众口难调,更何况合适的产品,他乐意接受的渠道,还有一个适中的价钱,提供给在一个适当的时候,但是商业智能是一个非常好的工具,这个工具可以让我们逐渐的走向他,也就是说我们大家学高等数学里面,我们经常学到无穷大,无穷大究竟是什么呢?恐怕大家很难解释得了,大家都知道,我们这里面有一个逼近的过程,逐渐就是走向一个以客户为中心的目的。

       现有的业务系统,商业智能里面有几个层次,第一、就是刚才很多人讲的,数据的整合,另外一个就是数据的分析,然后把分析转化成我们的信息,信息转化成我们的决策过程中。从几个方面来讲,第一步是数据的采集,数据的采集然后对数据进行分析,然后最主要的问题是把它应用到我们的业务和我们的决策过程中,最主要的围绕的目的,所有的商业智能的目的是什么?就是提高我们企业的经营管理水平,使我们企业的效益最大,也就是说反过来这个商业智能的东西,跟经济学上联系很多,经济学里面所有的核心点是什么呢?核心点里面经济学,西方经济学假设里面有两个核心体,第一个核心体是一个企业,企业的目的是什么,效益,利润最大化,另外一个主体是什么,是我们每个人,我们的感觉到快乐,商业智能既然是谈到了商业,我们做智能的目的是什么,使我们企业获取最多的效益。他主要有几个阶段,第一个阶段是什么?就是我们的业务报表,第二个阶段是数据仓库对数据的整合,第三个阶段主要是应用,现在主要是一个发展的趋势和方向,围绕这个东西,最主要的左边是我们的业务系统,通过整合然后对我们的数据进行了分析,分析的话目前我们获取信息的另外一个就是说,今天简单的跟大家说一下,获取信息一共有四个不同的方面,第一个方面是什么我们的查询,今天很多人讲的,第二、报表,第三、是我们的多维分析和统计分析,第四、数据挖掘,也就是商业智能里面最难的也就是一个最高的境界,也是我们现在商业智能发展的一个趋势和方向。这边跟大家举一个图,这个图是我们国内一家银行的,整个最左边是我们所有的业务系统,我们最中间是一个庞大的,画了一个数据仓库,我们对数据进行整合,最右边是围绕着我们所有的业务的发展的几个方面,第一个是我们希望实现什么,我们跟客户的一个交流,第二、我们希望做一个有效的分析,还有一个很重要的风险的管理以及我们资产负债的管理,这是整个发展的一个方向。从难易的程度来讲,最简单的就是报表,发展的趋势最简单的从报表,发展到我们多维分析,到顶端数据挖掘的这样一个应用的过程?

       下面我跟大家讲一下市场的发展,主要根据在2005年10月份的时候到11月之间,有一个ITtoolbox对全球数据仓库市场做了一个调查,有57%的人来自于大型的企业,整个这个对我们业界有一个很重要的信息,所有人员中只有9%的参与者说他企业里面没有数据仓库,也就是说有91%的参与调查的人,都认为这个企业已经有了,而43%的人说未来的12个月中,数据仓库的投入会增加10%左右,这样一个情况。而45%认为企业数据量会增加很大,这是一个主要的,从几个方面。特点是数据仓库数据的存储,原来从一个T几百个G,整个数据仓库量越来越大,数据本身在增大,一个企业的数据仓库数目在增大,数据量在增加,投资的额度也在逐渐的增大,人们为什么花这么多时间和金钱做这件事,前面有几位,像NCR的介绍,IBM的介绍,他给企业带来了巨大的效应,在美国的时候,两千年的时候有一个简单的调查,95年之前基本上是一个分界岭,95年之前建立数据仓库失败的概率在50%左右,95年之后发生很大的变化,主要有几个方面,一个是建立的方法发生了本质的变化,人们的思维方式变化了,人们不是花一个很大的很长期的,我跟大家举一个很简单的例子,在美国一家银行,这家银行基本上花了三年的时间,花了一亿零四百万美金建立一个数据仓库,大家知道美国最大的征信管理局有三家,“依斯批瑞”在95—98年之间,花了时间花了9800万美金建立了一个数据仓库,为什么在95年之前,大家都是这样,因为以前大家理解的问题,技术的问题,导致了很多的领导花了大量的金钱而看不到效果,大家看到今天的情况不一样了,在95年之后为什么是一个分水岭呢,它主要的原因是因为人们对数据仓库的认识和理念方法发生了很大的变化,计算机的技术也发生了很大的变化,以前主要想到把数据先建一个很庞大的系统,其后主要从应用,从我们的业务角度去出发,发生了一个很大的变化,也就是说,在2000年的调查里面,大部分企业有一部分调查,就是IDG的调查,他在2000年调查平均下来以后,行业的回报率在数据仓库的投入的回报率在400%,这是美国的一个数据。

       这是数据仓库的,前面在整个全球的一个发展调查,这个是对亚洲的,基本上的趋势是一致的,也就是说一个大型的企业,数据仓库的数量在增加,有四到五个的,这个跟前面大家讲的一个企业只有一个完整的数据仓库不完全是一样的,对很多的大型企业,有很多不同的业务,这是第一个。第二、数据仓库的投入在加大,第三、数据仓库本身的应用层面在发生着很大的变化。围绕这些东西,主要有几个方面的趋势,第一、我先谈谈技术发展的趋势,技术发展现在一个很重要的趋势,就是数据仓库在向着趋向实施操作分析,也就是说数据仓库逐渐跟我们业务系统发生一个很强的联系,这个就是刚才NCR这位先生刚讲到的,跟业务系统怎么有效的结合。另外一个来讲,预测分析很重要,刚才我们谈到了我们建立数据仓库,最主要的目的是提升我们企业的竞争力,我们谈到了,刚才谈到了比如说客户的流失问题,哪些客户会流失,流失本身对过去的描述,对我们企业作用不大,关键问题怎么去预测哪些客户可能会流失,预测的分析会显得越来越重要。另外技术发展,另外一个就是提高处理的能力和效率,大家知道随着计算机的发展,人们对计算机的忍耐程度是越来越差,以前比如说你等三五分钟可能问题不大,现在我按一个键我等了五秒或者十秒的时候,这个结果没出来的时候,往往使用者就会变得烦燥不安,所以处理的能力和效率是变成非常重要的一个因素。另外用户界面的友好程度,这个是在国外和国内都非常重要的一点,如果一个企业的数据仓库我们大家都在讲我们功能多好,我们模块化多好,我们的性能多好,如果我们页面不友好,使用者会放弃使用。我举一个很简单的例子,北京移动原先建立数据仓库的时候,最早在2002年做,第一期做完的时候使用情况不太好,原因是什么?当你看到他界面的时候,你会感觉这个界面很差,很多人在界面里面很复杂,罗利罗嗦的,里面很多的东西,导致很多业务人员说我搞不清楚,我根本搞不清楚,所以这个往往在建立数据仓库很多人,比较容易忽略的,他技术含量不高,反正也不是很重要,这是从技术的发展趋势,这是四个方面。

       另外从业务的发展或者分析的发展趋势,其实一个很重要的问题,大家谈到一个绩效管理,一个很重要的商业智能的发展趋势,就是绩效管理挂钩,绩效管理最主要的问题,我们讲一个企业的绩效管理,对数据仓库本身也有一个绩效管理,我企业投了这么多钱,我花了这么多人力,我花了这么多物力,我等了这么长时间,给我带来多大效益,与绩效管理的有效结合也是非常重要的一个。另外实时网络数据的分析,也就是跟我们网络连接以后,可能大家印象最深的是什么,这方面做得最好的是Amazon.com,买这个书的人同时会买ABCD,我以前在美国的时候,基本上我每年大概买书大概是2000—3000美金这样一个量,每次我一上去,我一点,基本上我都会把它捡到篮子里面,非常有效,他对我来讲,虽然他赚了我很多钱,我非常喜欢,他省去了我很多时间,看这个书的人同时会看什么什么书,他是一个与网络实时的非常重要。

       还有一个刚才大家有人前面提到了,是非结构化数据的处理,这是非常非常重要的一个趋势,很多的信息和数据,因为我们结构化的数据占有很少的部分,很多的数据和信息是非结构的,怎么对数据结构进行处理。实施应用发展,在于数据挖掘,刚才大家谈到巴塞尔协议,很重要的一个点就是内部评级,怎么对大部分企业建立内部评级,怎么帮助银行做好这件事,大家想一想,对于我们中国的银行,一个是资本充足率的问题,一个是储备金的问题,但是因为巴塞尔协议里面,你有没有评级,大家知道评级最多的是目的和标准,反过来看看我们所有中国被贷款的企业,有几家有这个,在美国也是有很大部分没有,现在有一种很大的方法是什么,利用数据挖掘的方法建立我们的评级体系,使我们的评级体系能够跟巴塞尔协议相一致,所以数据挖掘是一个很重要很重要的一种方法。

       究竟我跟大家讲的这些东西都是一些理念,能做到什么东西呢?我给大家举一个很简单的例子,我原先在美国的时候帮一家征信管理局做的,这是一个什么曲线呢?每一个人对贷款的信用额度的一个使用的情况,大家看看最左上角的地方是S曲线,最开始很低很低,忽然升得很高,很高的地方停下来,这些个人在美国的时候,18个月之后有很大一部分都宣布了个人的破产,这是我们用数据挖掘分类的方法做的。中间有一段,就是说他基本上很平稳的是什么,这是所有银行的信用卡公司都在极力寻找的一类客户,这帮人,你给他一万块钱额度,他花了八千块,他每个月银行让他说,你最少需要付500块,这个人付了500块,继续花继续付,为什么?银行信用卡公司赚取18%甚至20%的利息,这种叫很好的,他花费没有到一定的程度,他不会破产。右下角的是什么,这是一种客户的流失,这些客户变得比较聪明了,我借的钱我还掉了,我不付你这个,所以都是一种数据挖掘所能解决的一些问题。

       再给大家看一个例子,这是我们对美国一亿八千万人所做的一个分析,因为美国也是,所有的征信管理局里面,大家知道美国一共不到三亿人,一亿八千万是美国征信管理局拥有的总数,这是做数据挖掘做分类,分类完了以后,大家做分类,中间有1.0,有一个0.2,这两部分的人加起来,看到什么呢?他占整个人口的1.2%,1.2%的人他的消费占了“每系”占了他消费的38%,占了其他的“地他们斯当”24%,占了另外一个很高的消费店22%,但是这个当时是我们帮一家征信管理局做的,但是这个信息你知道怎么办,这家征信管理局拿到这个信息以后,他去找这些人,他说我知道有这么一组人群,这组人群占全国的1.2%,他的消费是多少,你对这个东西有没有兴趣,这些商店的老总会怎么讲,当然感兴趣了,为什么?因为我不需要大量的做电视广告,我也不需要大量的盲目的去做报纸的广告,为什么?这是一个非常有效的信息,这里边这些数据都是一些真实的数据和图示。

       另外我们大家讲到我们中国现在有个问题,企业或者个人出现财务的破产的问题,这个模型其实就是一个,具体的他是整个来讲,是我原先还在IBM的时候申请的一项专利,怎么去建立破产模型,预估这些破产,当时我们在2.5%的时候,预估未来18个月里的破产,认为前面2.5%极可能宣布破产未来18个月里面占了整个破产额度,整个破产人数的42%,是这样的情况。趋势的问题,怎么样利用这个东西来解决你的问题,中国大家可能知道,商业智能今天几乎所有的厂商没有不谈到风险管理的问题,谈到风险管理最主要的问题,我们拿我们国内的银行来讲,我们银行现在最大的问题是什么,就是坏帐,坏帐国家剥离了很多,大家都知道,工农中建在几年前国家给拨了两万个亿,去年又有,他们剩了大概一万个亿,现在大概又有几万个亿的不良贷款,国家拼命往里面砸钱,这里面有一个问题,我们风险很高,我们判断一个企业风险的时候,我们凭什么判断一个企业,我们根据他的财务报表,财务报表大家也都知道,中国企业的财务报表是什么,不准,我们经常会说,企业的财务报表不准,这些事情可不可以做呢,大家看看,这是我们在做的一个,帮上海证券交易所做的一套系统,叫企业财务报表的风险分析和企业财务报表的欺诈分析,我们把欺诈改成诚信,叫企业的诚信分析,这都是说,这些已经在使用的一些系统,而这些系统目前对整个交易所带来很大的效益,他减少了监管人员的工作时间和工作力度,我们基本上拿到一个企业的财务报表,我看这个企业的财务报表有没有什么问题,而且这里面预估的情况,准确的程度很高,所以这些都是整个的来讲,发展的趋势。他的趋势是什么,商业智能的发展趋势,就是怎么样尽快的把你的数据有效的整合起来,然后转换成信息,让你的信息,转换成你的知识,用到决策过程中,最主要围绕着所有的商业活动的一个目的,为了企业获取最大的利润,这是我们的目标。现在整个的趋势是什么呢?整个最早期,我们谈到更主要的是数据的整合,那是属于低层次,就是报表的问题,数据整合的问题,现在更主要的问题就是说整个的趋势,我们要做更多的多维的分析,我们要做更多的数据挖掘,我们如何有效的和我们的系统实时的结合起来,解决企业的问题,这是整个趋势的问题。

       下面我再花几分钟谈一下标准,标准这个东西,是很难的一件事,尤其在商业智能领域,目前来讲,基本上没有一个统一的标准,大家想一下,商业智能里面,其实最核心的技术有几大块,一共两大块,一个是数据仓库,一个是数据挖掘,这两大块是不一样的,数据仓库包括ETCR,这是最基本的,数据库,我们的OLAP,我们的前端战时,另外就是数据挖掘,大家想一下数据库里面,目前你说没有标准,但是好像也有标准,为什么呢?大家看看以前的数据库很多,现在数据库想一下,这个企业里面能选择的有几个,没有几个,对不对,大概Oracle最大,IBM的DB2等等,基本上你选择空间很少,另外一块除了数据库之外,我们谈到ETCR,这些工具是挺多的,行业里面,用得比较好的,其他的企业也有各种各样的工具,他有没有标准,基本上在这个行业是没有一个完全的标准体系。没有标准大家都知道,为什么对我们企业会带来多大的不好呢?我用你一个工具,我再用别的工具的时候是一个统一的问题,大家都知道,因为我是陕西人,大家知道秦始皇对中国的几大贡献,其中一个是统一的度量衡,这就是一个标准的问题,怎么样逐渐的使他逐渐的更加统一,这个事情来讲,这是一个很难的问题,但是如何有效的使这个系统之间进行有效的沟通,和数据的传输,包括我们刚才王院士讲的BI究竟是什么,企业应用整合的问题,这些数据之间,统一的结构和整合,这是我们所能追求的,但是你要追求完整的一个统一的这个是很难的,因为各个厂商的情况,他要有一个个性。这里面很重要的问题,一个是像我们的模型建设的标准,这个标准不能完全是一个统一的模型,为什么?即使在银行建,不可能拿统一的模型建,但是我们建模的方法,这个可以统一和规范化的,在这个过程中。还有一个,与其他应用系统的沟通和交流,这个标准是我们基本上可以做的。另外一个就是其他的一些行业,通讯行业的一些标准,这个我简单不再讲了,现在的时间正好是六点整,这个东西我简单的跟大家介绍到这个地方,谢谢大家。

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
最新评论 查看所有评论
发表评论 查看所有评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 密码: 验证码:
发布者资料
admin 查看详细资料 发送留言 加为好友 用户等级: 注册时间:2008-12-30 06:12 最后登录:2008-12-31 04:12