计算机科学 ›› 2007, Vol. 34 ›› Issue (9): 139-141.

• 软件工程与数据库技术 • 上一篇    下一篇

用于不均衡数据集的挖掘方法

  

  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    本文得到国家自然科学基金(No.60503021)、江苏省自然科学基金(No.BK2005075)和江苏省高技术研究计划(No.BG2006027)的资助.

  • Online:2018-11-16 Published:2018-11-16

摘要: 传统的分类算法大多是基于数据集中各类的样本数是基本均衡的假设的,而实际应用场合中面临的往往是不均衡数据。针对不均衡数据集,利用传统的分类方法往往不能获得良好的性能,因而研究用于处理不均衡数据集的分类方法就显得相当重要,本文对相关的研究做了综述。

关键词: 不均衡数据集 过取样 欠取样 代价敏感学习

Abstract: The majority of machine learning algorithms previously designed usually assume that their training sets are well-balanced,but data in real-world is usually imbalanced. The tradition machine learning algorithms on balanced data sets have bad performance wh

Key words: Imbalance data set, Over-sampling,Under-sampling Cost-sensitive learning

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!