计算机科学 ›› 2008, Vol. 35 ›› Issue (3): 158-160.

• • 上一篇    下一篇

基于交叉分组技术的集成算法研究

  

  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    资助项目:国家自然科学基金项目(No.60373111);重庆市教委科学技术研究项目(No.KJ060517);重庆市自然科学基金重点资助项目(2005BA2003);重庆市优秀中青年骨干教师资助计划.

  • Online:2018-11-16 Published:2018-11-16

摘要: 集成学习主要通过扰动训练数据集来产生较强泛化能力。研究者们提出了各种各样的方法来实现这一目标,但如何扰动训练数据集以达到最佳的泛化能力并没有被深入研究。本文中,提出了对训练数据集进行扰动的交叉分组(cross-grouping)方法,通过改变交叉因子以实现对训练数据集不同程度的扰动,从而实现当集成规模较小时,得到更强的泛化能力。实验表明,当选择合适的交叉因子时,CG-Bagging泛化能力要强于Bagging和Boosting,略优于Decorate和RandomForests。

关键词: 机器学习 集成学习 泛化能力 交叉分组

Abstract: Ensemble learning is through disturbing training data to generate strong generalization ability. Researchers have proposed a variety of methods to achieve this goal, but how to achieve the best generalization ability by disturbing training data has not be

Key words: Machine learning, Ensemble learning, Generalization ability, Cross-grouping

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!