%A 厉柏伸,李领治,孙涌,朱艳琴 %T 基于伪梯度提升决策树的内网防御算法 %0 Journal Article %D 2018 %J 计算机科学 %R 10.11896/j.issn.1002-137X.2018.04.026 %P 157-162 %V 45 %N 4 %U {https://www.jsjkx.com/CN/abstract/article_20.shtml} %8 2018-04-15 %X 结合TF-IDF算法思想,提出了特征频率、森林频率以及伪梯度提升决策树,解决了梯度提升决策树随着迭代次数的增加,错误数据被边缘化的问题。在伪梯度提升决策树中,所有决策树分别在原始数据集的Bootstrapping后的数据集上产生,无须针对每次迭代来对数据集采样。在分布式集群上进行内网防御的实验,结果表明在一定规模的训练集上,伪梯度提升决策树具有更好的预测准确度。