异常数据挖掘与反保险欺诈

异常数据挖掘与反保险欺诈

  数据挖掘在反保险欺诈方面的应用,是通过对异常数据挖掘来实现的。

  在数据分析过程,一些数据对象可能因与一般行为模型不一致,而视为噪声或异常而丢弃,但是,在保险欺诈、信用卡欺诈等异常行为识别上,专门针对异常数据的挖掘具有更为重要的价值,因为保险欺诈行为作为一种非正常行为,它的数据特征、模型正是隐含在这些异常数据中的。

  虽然传统数据分析发现一些表面特征,如重复投保、高额投保、频繁投保等,可能是影响欺诈概率、欺诈金额的关键因素,但是由于传统的分析方法并不具备足够的能力进行更深入地分析,隐含的数据间更本质的特征很难被识别和加以利用,而且,传统数据分析通常从很多预设的假设条件出发,试图寻找保险欺诈的特征,这种做法显然会缩小分析范围,遗漏有价值的信息,降低分析的科学性和效果。

  数据挖掘较好地克服了这两方面的问题,首先,数据挖掘借助强大的分析工具,能深入地挖掘隐含的数据间关系并加以模型化,其次,数据挖掘是在没有明确假设的前提下去挖掘信息,真实地、全面地反映数据间的客观存在的关系,这是其与传统数据分析的本质区别,也是其独特优势的体现。数据挖掘有助于识别出那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识。在反保险欺诈方面,这些不能靠直觉发现或违背直觉的知识可能更具有应用价值,使我们对保险欺诈特征的认识更加深入、更加客观。 数据挖掘实验室

  对于异常数据的挖掘主要是使用偏差检测,在数学意义上,偏差是指分类中的反常实例、不满足规则的特例,或者观测结果与模型预测值不一致并随时间的变化的值等等。偏差检测的基本目标是寻找观测结果与参照值之间有意义的差别,主要的偏差技术有六西格玛检测、聚类、序列异常、最近邻居法、多维数据分析等。除了识别异常数据外,异常数据挖掘还致力于寻找异常数据间隐含模型,用于智能化的分析预测。

  通过异常数据的检测和建模分析,可以发现保险欺诈行为特征,这些特征既包括保险欺诈的一些表面特征,也包括一些不能通过直觉发现的特征。识别出这些特征,能为保险公司的经营决策提供支持。针对不同险种、不同地域、不同客户群进行专门的数据挖掘,发现更具体化的欺诈特征,以制定出具有针对性的措施,提高反欺诈的效果。识别保险欺诈行为特征是开展数据挖掘在反保险欺诈其它方面应用的基础。

  保险产品定价

  由于保险欺诈的存在,一种类似于坏账准备金的费用必须以附加保费的形式包含在保险费率当中。通过对欺诈行为的识别、欺诈比例的预测,使这部分附加保费的制定更加科学、合理,使保险产品定价更具有竞争力。由于保险欺诈的存在,保险人会提高保险费,而保险费的提高又可能导致诚实投保的人退出保险市场,但有欺诈动机的人并不会因此而退出,这又会大大增加保险单中保险欺诈的比例,从而迫使保险人再次提高保险费,这种逆选择导致恶性循环。为了防止逆选择,阻止保费上涨的恶性循环,保费必须要低于一定的临界值,使有欺诈动机的投保人的诚实投保收入大于欺诈投保的收入而降低欺诈动机,此临界值就是主要由保险欺诈被发现的概率以及对保险欺诈的惩罚度决定。所以,正确预测欺诈行为发生的概念显得尤为关键。 数据挖掘论坛

营销预演

  通过数据挖掘,可以进行不同保险产品的业务拓展计划仿真,或者称为“营销预演”,即综合考虑各种因素下,预测业务拓展计划的实际效果,在营销方案实施之前调整好营销方案。对于经识别后认定的欺诈概率较高的客户群,实际发生欺诈行为的比率肯定会高于其它客户群体,据此可以调整营销方案,将这部分客户群作为非重点营销对象,减少营销的投入,提高承保条件或组织专门的调查人员进行重点调查,如果无法有效控制风险和成本,应放弃这部分客户群。

  反欺诈成本预算

  随着保险业务规模扩大和信息技术的发展,反保险欺诈难度和成本持续增长,合理确定反保险成本预算尤为重要。据报道,2002年美国27个州保险欺诈调查署支出的总额达到7400万美元,但追回的保险欺诈返还的总金额仅有7050万美元,成本和收益相差无己,由此可见,制定合理反欺诈成本预算的重要性。通过对过去反保险欺诈支出的数据进行挖掘,可以预测各种反欺诈方式的成本与收益对比,从而选择合适的反欺诈的方式或方式组合,达到总成本可控和成本开支减少的目的。反保险欺诈支出的数据,包括各种与反保险欺诈相关的调查、诉讼、人力费用、声誉损失等直接成本和间接成本的数据。根据数据挖掘的结果,对于那些成本会明显高于收益的欺诈调查或追偿,可能选择主动放弃,以减少不必要的资源耗费。

数据挖掘交友



  保险企业在决策应用数据挖掘的过程中必须考虑以下几点因素:第一,数据特别业务数据的集中是开展数据挖掘的前提和基础;第二,数据挖掘的成本,包括数据挖掘系统硬件、软件投入以及人力成本等,将远远高于传统的数据分析系统,但数据挖掘带来的长期的经济收益是显著的;第三,数据挖掘是一种技术手段,主要作用是为反保险欺诈提供决策支持,只是作为反保险欺诈的一项措施,反保险欺诈需要多管齐下,需要多方面措施来共同治理。

数据挖掘交友

[数据挖掘工作交流] [数据挖掘研究院] [数据挖掘论坛] [数据挖掘实验室]
上一篇:数据挖掘课本??聚类
下一篇:Algorithms for Mining Distance-Based Outliers in Large Datas
最新评论共有 0 位网友发表了评论 , 查看所有评论
发表评论( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航 数据挖掘论坛导航
  • 数据挖掘工具
  • 数据挖掘论坛
  • DataCruncher - Cognos
  • MineSet - MathSoft
  • Intelligent Miner - GainSmarts
  • Sqlserver - SAS - Clementine
  • CART - Weka - WizSoft
  • NeuroShell - ModelQuest
  • data mining tools - Darwin
  • 数据挖掘交友
  • 数据挖掘博客
  • 数据挖掘工具
  • 数据挖掘资源
  • 数据挖掘技术算法
  • 数据挖掘相关期刊、会议
  • 研究院联盟合作专区
  • 数据挖掘基础与相关技术
  • 数据挖掘厂商与就业
  • 数据挖掘研究者乐园
  • 知名厂商数据挖掘工具资料
  • 国内数据挖掘实验室
  • Foreign Data Mining Lab
  • 热点关注
  • OUTLIER
  • What are outliers in the data?
  • Algorithms for Mining Distance-Based Out
  • Dealing with ′Outliers′: How
  • 异常数据挖掘与反保险欺诈
  • Carnegie Mellon Researchers Uncover Onli
  • Outliers and Data Having Undue Influence
  • 数据挖掘课本??聚类
  • 论坛最新话题
  • 搜索引擎Ask.com改版 搜索速度质量双双提升
  • 正规省级、国家级别期刊征集论文稿件
  • 寻data mining cookbook 一书的配套光盘
  • 网博垂直搜索引擎完全开源版
  • 电脑也会成为火灾元凶 操作不当也会有危险
  • 网络暴力间接逼死崔真实 韩国拟立法实名上
  • 网络最流行的歌曲单良《那一场雪》推荐给大
  • 快国庆了大家怎么安排
  • 08年“铁观音秋茶”安溪铁观音,茶叶批发网
  • 快国庆了大家怎么安排
  • 相关资讯
  • Dealing with ′Outliers′: How
  • What are outliers in the data?
  • OUTLIER
  • Outliers and Data Having Undue Influence
  • Algorithms for Mining Distance-Based Out
  • 异常数据挖掘与反保险欺诈
  • 数据挖掘课本??聚类
  • 数据挖掘实验室资料
  • 注册成为SAS用户与爱好者俱乐部会员
  • 水南梅
  • 明日烟
  • 新人报道
  • 下载
  • 厦门服务器托管,450元/月—0592-5177319 高
  • 买空间送域名--0592-5177319 高静
  • mit ocw 数据挖掘相关课程连接
  • Introduction to Data Mining
  • Data Mining & Business Intelligence