计算机科学 ›› 2008, Vol. 35 ›› Issue (10): 186-187.
孟浩华 李国正
MENG Hao-hua LI Guo-zheng (School of Computer Engineering and Science, Shanghai University, Shanghai 200072, China)
摘要: 机器学习中冗余特征会降低学习器的性能,而特征选择方法可以去掉一些冗余特征。然而,冗余特征也包含有用信息,因此可以利用多任务学习的概念,通过重复利用冗余特征提高预测精度。但是,如何确定哪些特征作为输入和输出仍然是一个待解决的问题。之前的工作是在多任务学习当中,运用遗传算法来确定哪些特征作为输入,哪些作为输出,取得了较好的效果,但是该算法不足之处是没有考虑到不相关特征。现将特征分为三部分:输入的特征、输出的特征和不相关特征,提出了对一个特征进行双位编码的遗传算法搜索策略。在基因芯片数据上的实验结果表明,提出的
No related articles found! |
|