RSS
热门关键字:  数据挖掘  数据仓库  商业智能  人工智能  搜索引擎

使用 WebSphere Commerce Analyzer 以关联规则进行数据挖掘

来源: 作者:互联网作品 时间:2007-02-13 点击:

引言 数据挖掘研究院

在您的 IBM® WebSphere® Commerce 数据库中所隐藏的东西是信息的固有价值所在,使用简单的分析是看不到模式的。这个信息帮助您更好的了解客户,并更准确的瞄准市场行为。数据挖掘是从大量的数据中萃取知识的一种科学。 数据挖掘研究院

数据挖掘是包含许多技术的多学科领域。关联规则是在数据挖掘中所使用的一种技术,并对电子商务事务信息非常有用。关联规则描述可能一起发生的事件。它们是形式为:X =>Y 的正式的语句,也就是如果 X 发生,那么 Y 有可能发生。 数据挖掘研究院

为何使用关联规则进行挖掘?

数据挖掘研究院

一个典型的例子是在超市里一起购买某某商品。您可能已经想到当购物者购买热狗时,他也很有可能购买热狗小面包。但是销售小组所没有预期到的购物者想要一起购买的其他成组的商品是什么?一个经常被引用的例子是,在美国通常一起购买啤酒和尿布。 数据挖掘研究院

电子商务站点可以很明显的从强大的关联规则中的受益。您可以使用关联规则中规则进行挖掘,然后设置用户有意要一起购买的捆绑包。您也可以使用它们设置相应的交叉销售,也就是购买某种商品的顾客会看到相关的另外一种商品的广告。

您可以针对 WebSphere Commerce 操作数据库实现关联规则挖掘,或更进一步,针对 WebSphere Commerce Analyzer 数据集市。当针对数据集市运行时,没有嵌入产品系统可以利用历史数据来帮助识别过去的倾向。

数据挖掘研究院

背景 数据挖掘研究院

挖掘关联规则需要两方面的数据,事务及该事务中所包含的信息。在 WebSphere Commerce 中您可以使用存储在 WebSphere Commerce Analyzer 数据集市的 WCA.FACT ORDERITEMS 表中的 ORDER ID 和 PRODUCT ID 字段。有两个与关联规则相关的衡量标准:

数据挖掘研究院

  1. 可信度:一个商品的购买暗示着另一个的购买。例如,对所有购买牙刷的人来说,48% 的人同时也购买牙膏。48% 就是规则的可信度。
  2. 支持度:同时购买两件商品。例如,所有购买者的 0.135% 同时购买牙刷与牙膏。0.135% 就是这个规则的支持度。某一特定情况下的支持度通常很低,由于要根据所有的购买者及所有的事务来计算。

  数据挖掘研究院

要进行交叉销售市场活动,我们最感兴趣的是关联规则的可信度,并且在我们的样例中也将重点放在它上面。 数据挖掘研究院




先决条件

在本指南中您需要使用下面的软件: 数据挖掘实验室

  • Data V8.1. DB2 Intelligent Miner 的 DB2® Intelligent Miner,它包括六个不同的挖掘功能,关联规则就是其中之一
  • Microsoft® Windows® 2000 或更高
  • WebSphere Commerce Analyzer data mart V5.6

 

数据挖掘研究院





逐步的介绍

下面的步骤将引导您通过使用 DB2 Intelligent Miner(下面称作 Intelligent Miner)定义数据的流程,通过它您可以分析及定义您可以应用到数据集的挖掘模型。Intelligent Miner 将派生出一些关联规则,您可以使用它们来深入了解顾客的购买习惯。 数据挖掘研究院

登录到 DB2 Intelligent Miner

数据挖掘研究院

  1. 点击开始菜单的 Start -> Programs -> IBM DB2 Intelligent Miner for Data V8.1 -> Intelligent Miner 启动 DB2 Intelligent Miner for Data。然后将会出现个参数窗口,在这里您可以连接到数据库。这将告诉 Intelligent Miner 到何处查找数据。
  2. 点击 Database Logon 选项卡,然后填入数据库名、用户 id、密码。
  3. 点击 Add,然后点击 Apply,最后点击 OK
  4. 当您重新打开时 Intelligent Miner 时,您只需为刚刚创建的入口提供密码。

    图 1. 数据库登录
    数据库登录

创建数据

Intelligent Miner 需要被分析数据的描述。从 Create 菜单中选择 Data。在向导中,按照如下步骤进行:

  1. Data format and settings 页面中点击 Database Table/View,然后输入您以后可以识别出的 Settings Name ,例如“AssocOrder”。也可以输入注视语句。点击 Next >
  2. Database table or view 上从数据库服务器下拉列表中选择您的 WebSphere Commerce Analyzer 数据集市名。选择左侧列表中的 WCA,然后选择右侧列表中的 FACT ORDERITEMS。点击 Next >
  3. Field 参数页上改变某些字段的数据类型。这不影响表本身,只是影响 Intelligent Miner 查看数据的方式。虽然都是整型值,关联规则挖掘要求值是无条件的。由于整型字段实际上是整数,您可以将它们重新定义为无条件的,这样挖掘就会工作了。分别对 PRODUCT ID,ORDER ID 及 MEMBER ID 字段点击 Data type 下拉框,然后选择 Categorical。点击 Next >
  4. 不需要改变 Computed 字段,点击 Next >
  5. Summary 页面上点击 Finish

 

数据挖掘实验室

创建挖掘模型

数据挖掘研究院

挖掘模型描述了您将使用的数据,还有其他为运行模型所必需的输入参数。从 Create 菜单中选择 Mining。在向导中按照如下步骤进行: 数据挖掘研究院

  1. Mining 功能及设置页面中,选择 Associations 并提供 Settings name,例如“OrderAssoc”。点击 Next >
  2. Input data 页面中,点击在前一部分中定义的 AssocOrder 输入数据。点击 Next >
  3. Input fields 页面中,在 Available 字段列表中找到 ORDER ID,点击最上面的箭头将该字段转移到 Transaction 字段中。找到 PRODUCT ID,然后点击下面的箭头将该字段转移到 Item 字段。点击 Next >。图 2 显示了这个屏幕的样例。

    图 2. 输入字段选项卡
    输入字段选项卡
  4. Parameters 页面上,为首次运行保留这些默认值。如果当您运行模型时的返回值是:缺少规则,将 Minimum 信任度调整降低到 20 或 15。如果在规则中返回太多的条目,您可以设置 Maximum 规则长度。例如,如果确定同时购买 50 个商品的组,但是您希望设置绑定不超过 5 个条目。点击 Next >
  5. Available results 页面上,给出 Results 名,例如“AssocOrder1”。直道以您喜欢的方式取得模型,选中 覆盖相同名称的结果 复选框。
  6. Summary 页面上。点击 Finish

 

运行模型

现在您已经定义了模型,您可以运行它了。

数据挖掘研究院

  1. 展开位于窗口左侧的 Mining 文件夹,然后点击 Association 文件夹。
  2. 选择挖掘模型,点击工具栏上的绿色箭头运行模型。然后流程窗口显示出来。在典型的 Windows 机器上,您可以在不足一分钟时间内处理 200,000 条预定条目。

 

数据挖掘研究院

理解结果

在另外一个窗口中显示结果。图 3 显示了模型找到的规则的集合样例。



图 3. 观察规则
观察规则

在本例中发现三条关联规则。您需要返回到 PRODUCT REF 表来查找产品 ID 代表什么。在本例中前两个规则有关系。它们是两个相同的产品,暗含着互相购买。结果这些是儿童咳嗽糖浆,除口味不同之外相同的产品。或许许多父母希望提供选择,他们可以更容易的确信他们的孩子使用咳嗽糖浆。从这个结论来看,您可能决定将这个作为咳嗽糖浆种类页面的“提示”。当父母访问站点时可能只想购买一种口味的糖浆,但您可以提供两种风味的糖浆,将其绑定以轻微的折扣价销售给父母。 数据挖掘实验室

在第二种情况下,两种产品都可以有治疗作用,但是此时是为成人所用。第一个是治疗鼻腔充血,第二个是热饮的,治疗咳嗽和发烧。如果商店提供了应付这两种情况的商品,商店可能决定在产品显示页面上为这两个产品做宣传。有鼻腔充血的购买者可以直接购买他(她)知道的已存在的产品,而没有意识到还有新的选择。解决方法是为两个产品在那些页面上做交叉销售广告,使每个购买者都知道商店提供两个产品。 数据挖掘实验室

图 4 显示了条目设置的例子。

数据挖掘研究院



图 4. 查看条目集
查看条目集

条目集,在这种情况下是一起购买的符合最低支持度和可信度的产品。这个视图以条目的降序排序,在顶部显示多条目设置。由算法生成许多单条目集,此时可以忽略该算法。他们与您不用数据挖掘就能决定的最受欢迎的产品有些相似。 数据挖掘研究院

这些设置都是产品绑定的机会,或是 WebSphere Commerce 中商品销售的联合体。例如,上面的规则之一是维生素 C 和维生素 E 经常是一起购买的。

保存您的工作 数据挖掘实验室

您所做的每一件事,包括数据、模型以及结果,全部都是挖掘基础(Mining Base)。您可以用一有意思的名字保存这个基础,例如使用 AssocOrders,在以后可以装载它继续工作。如果您想将结果转移到另外一台机器上或允许其他人检查结果,您也可以将挖掘基础导出。

数据挖掘实验室




重要的注意事项 数据挖掘研究院

下面的注意事项描述了您使用本指南中的步骤创建的模型的一些可能的变化。 数据挖掘研究院

将每个购物者都视为事务 数据挖掘研究院

您可以使用上面的介绍创建新的挖掘模型,它的事务 id 是 MEMBER ID 而不是 ORDER ID。每个购物者的购买都会被视为单独的事务,允许您以后分析该购买。例如,了解购买维生素 E 和补充铁质倾向于是相同的顾客所为是有益处的,但是没有必要进行相同的购买。您可以发现顾客登录到站点上购买了维生素 E,但过去没有购买过铁质,那么可以显示铁质的优惠券,因为它是与维生素 E 最有关联的。

结果的保持 数据挖掘研究院

当您每次运行挖掘模型时,花一点时间来打开结果集并给它起一个新名字。您可以点击 Results 文件夹,这里将显示出您所生成的所有的结果,不用每次都重新运行模型。如果您想进入 Intelligent Miner 单纯的查看结果,您可以点击 Cancel 略过初始化数据库登录窗口。 数据挖掘实验室

如果有几百万个事务怎么办?

如果运行挖掘模型比做决定花费的时间多,您可以使用 Intelligent Miner 创建简单设置。使用 Create 菜单创建 Processing,它允许您选择 Get Random Sample 功能设置您想分析的数据的百分比。您可以使用处理的结果作为挖掘模型的输入。

商品销售关联

在 WebSphere Commerce 中,商品销售关联由 Source Catalog Entry 及一个或多个 Target Catalog Entries 组成。您可以将在数据挖掘中发现的每条规则表示成商品销售关联。 数据挖掘研究院





结束语 数据挖掘研究院

您已经学习到了使用关联规则的数据挖掘是识别出在顾客购物车中的相关条目的有用的方式。使用 WebSphere Commerce Analyzer 数据集市和 DB2 Intelligent Miner for Data,您可以理解、解释并预测关于顾客购买习惯信息的感兴趣部分。您可以使用这个技巧加强您市场及销售活动。



参考资料

数据挖掘研究院

最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
匿名?