首页 | 人工智能 | 数据挖掘知识 | 相关研究方向 | 编程技术 | 电脑常识 | 互联网资源 | 交流论坛 | 免费书籍资料下载 | 论文下载 | 文档资料 | 在线手册
人工智能: 信息检索 商业智能 搜索引擎技术与新闻 神经网络 生物信息学 模式识别 知识工程 本体理论与方法 机器学习 决策支持 自然语言理解 专家系统 >>更多
数据挖掘知识:
数据挖掘论文 数据挖掘其他 数据挖掘工具与应用 时序模式 相关研究人员主页 相关方向求职招聘信息 文本挖掘 学位论文 异类 预测 web数据挖掘 >>更多
相关研究方向: 联机分析 信息抽取 小波变换 数据仓库 access数据库 DB2数据库 Mysql数据库 Oracle数据库 SqlServer数据库 Sysbase数据库 统计分析 >>更多
主页>数据挖掘知识>异类>

Algorithms for Mining Distance-Based Outliers in Large Datas

This paper deals with finding outliers (exceptions)
in large, multidimensional datasets.
The identification of outliers can lead to the
discovery of truly unexpected knowledge in areas
such as electronic commerce, credit card
fraud, and even the analysis of performance
statistics of professional athletes. Existing
methods that we have seen for finding outliers
in large datasets can only deal efficiently
with two dimensions/attributes of a dataset.
Here, we study the notion of DB- (Distance-

字串9

Based) outliers. While we provide formal and
empirical evidence showing the usefulness of 字串7

DB-outliers, we focus on the development of
algorithms for computing such outliers.
First, we present two simple algorithms, both
having a complexity of O(k N

字串3

2

字串1

), k being the
dimensionality and N being the number of objects
in the dataset. These algorithms readily
support datasets with many more than
two attributes. Second, we present an optimized
cell-based algorithm that has a complexity
that is linear w... 字串1

 

字串8

资料全文下载 字串4

  字串5

上一篇:Relevant Open Source Projects, Code and Libraries   下一篇:Outliers and Data Having Undue Influence
版权申明:本站信息收集自互联网,仅供学习参考使用。若有违法转摘您的作品请email我们及时删除!  
用户名: 新注册) 密码: 匿名评论 所有评论
评论内容:(不能超过250字,需审核后才会公布,请自觉遵守互联网相关政策法规。
Google
8 热门推荐
  • Dealing with ′Outliers′: How
  • What are outliers in the data?
  • OUTLIER
  • Outliers and Data Having Undue Influence
  • 异常数据挖掘与反保险欺诈
  • 数据挖掘课本??聚类
  • 8 阅读排行
     
    版权所有:数据挖掘研究院 2004-2006 未经授权禁止复制或建立镜像
    增值电信业务经营许可证编号:皖B2-20040042 文网文:[2005]027号