基于交叉分组技术的集成算法研究

计算机科学 ›› 2008, Vol. 35 ›› Issue (3): 158-160.

基于交叉分组技术的集成算法研究

出版日期:2018-11-16 发布日期:2018-11-16
基金资助:
资助项目：国家自然科学基金项目（No.60373111）;重庆市教委科学技术研究项目（No.KJ060517）;重庆市自然科学基金重点资助项目（2005BA2003）;重庆市优秀中青年骨干教师资助计划.

Online:2018-11-16 Published:2018-11-16

摘要/Abstract

摘要： 集成学习主要通过扰动训练数据集来产生较强泛化能力。研究者们提出了各种各样的方法来实现这一目标，但如何扰动训练数据集以达到最佳的泛化能力并没有被深入研究。本文中，提出了对训练数据集进行扰动的交叉分组（cross-grouping）方法，通过改变交叉因子以实现对训练数据集不同程度的扰动，从而实现当集成规模较小时，得到更强的泛化能力。实验表明，当选择合适的交叉因子时，CG-Bagging泛化能力要强于Bagging和Boosting，略优于Decorate和RandomForests。

关键词: 机器学习集成学习泛化能力交叉分组

Abstract: Ensemble learning is through disturbing training data to generate strong generalization ability. Researchers have proposed a variety of methods to achieve this goal, but how to achieve the best generalization ability by disturbing training data has not be

Key words: Machine learning, Ensemble learning, Generalization ability, Cross-grouping

. 基于交叉分组技术的集成算法研究[J]. 计算机科学, 2008, 35(3): 158-160. https://doi.org/

参考文献

Metrics

Viewed

Full text

Abstract

Cited

Shared

Discussed