摘要: 针对支持向量机方法对高维大规模数据无法直接处理和对异常样本敏感的问题,提出了一种基于部域粗糙集模型的改进支持向量机。该算法从两个方面对训练样本集进行预处理:一方面利用部域粗糙集模型中对象部域的上、下近似,寻找两种类别的交界部分,从而减小问题规模;然后通过对交界部分样本进行混淆度分析,剔除那些混杂在另一类样本中的异常样本或噪声数据。另一方面利用属性重要性度量对样本集进行属性约简与属性加权处理。基于合成数据集与标准数据集的有关实验证实了该算法的有效性。
No related articles found! |
|