RSS
热门关键字:  数据挖掘  人工智能  数据仓库  搜索引擎  数据挖掘导论

关联规则挖掘在保险业务中的应用

来源: 作者:互联网作品 时间:2007-02-07 点击:

----现 在 有 很 多 数 据 挖 掘 软 件 工 具 可 以 实 现 关 联 规 则 的 发 现, 下 面 讨 论 如 何 用MineSet 对 保 险 业 务 数 据 进 行 关 联 规 则 的 挖 掘。 出 于 行 业 保 密, 其 中 有 些 数 据 做 了 加 工 处 理。

数 据 准 备


----首 先 需 要 连 接 数 据。MineSet 提 供 了 一 些 主 流 关 系 数 据 库 的 接 口( 包 括Oracle7.2 或 以 上 版 本、Informix、Sybase, 既 可 以 访 问 本 地 数 据 库, 也 可 以 通 过 网 络 访 问 远 程 主 机 的 数 据 库), 可 以 直 接 读 取 存 放 在 数 据 库 中 的 数 据;MineSet 也 支 持 以 文 本 文 件 方 式 存 储 的 数 据 文 件, 这 些 文 件 必 须 以 一 定 的 格 式 组 织 数 据。

----在 实 际 应 用 中, 如 果 用 户 的 数 据 由MineSet 不 支 持 的 数 据 库 系 统 来 管 理, 那 么 可 以 用 一 些 第 三 方 产 品 或 自 己 实 现, 把 数 据 转 存 到 文 本 文 件 中。 由 于 使 用 数 据 文 件 的 方 式 速 度 要 快 一 些, 因 此 如 果 用 户 的 数 据 变 化 不 大, 而 且 需 要 反 复 多 次 使 用 数 据 做 知 识 发 现, 那 么 也 可 以 转 存 到 文 本 文 件 中, 以 提 高 效 率。 数据挖掘研究院

----数 据 挖 掘 的 过 程 是 不 会 修 改 源 数 据 的。

数据挖掘研究院

----这 里 我 们 使 用 的 保 险 数 据 是 存 储 在 本 地 数 据 文 件 中, 所 以 直 接 打 开 数 据 文 件 就 可 以 了。

数据挖掘研究院

----用MineSet 的 集 成 工 具 记 录 浏 览 器(Record Viewer) 观 察 数 据, 表1 是 其 中 的 一 小 部 分。

数据挖掘研究院

  数据挖掘实验室

----我 们 可 以 看 到 这 是 一 份 保 单 数 据, 一 条 记 录 存 储 了 一 个 投 保 人 的 一 些 基 本 信 息 以 及 其 索 赔 次 数。 我 们 主 要 想 通 过 数 据 挖 掘 找 出 索 赔 过 的 投 保 人 有 什 么 特 征, 没 索 赔 过 的 投 保 人 有 什 么 特 征。 我 们 主 要 关 心 索 赔 次 数 以 及 与 此 相 关 的 信 息, 可 以 认 为 保 单 号、 单 位 代 号、 单 位 名 称 是 一 些 无 关 信 息, 因 此 从 源 数 据 中 挑 选 年 龄、 年 工 资、 单 位 类 别、 单 位 地 区、 索 赔 次 数 这 几 列 做 进 一 步 的 分 析。

最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
匿名?