摘要: 针对文本特征向量高维数的问题,给出了一种基于本体论的文本特征选取方法。通过由专业领域本体所建立的概念树,把文本的特征项映射到概念,同时进行特征项频度到概念频度的转换,使得选取得到的特征概念能够很好表征文本的内容。实验结果表明,与未进行特征概念选取相比,采用此方法选取得到的特征概念能够在尽可能减少对文本分类精度的影响下,达到降低特征维数的目的。
林东文 白清源 谢丽聪 谢伙生 张莹. 一种基于本体论的文本特征选取方法[J]. 计算机科学, 2008, 35(3): 152-154. https://doi.org/
LIN Dong-Wen, BAI Qing-Yuan ,XIE Li-Cong, XIE Huo-Sheng ,ZHANG Ying(College of Mathematics and Computer Science, Fuzhou University, Fuzhou 350002). [J]. Computer Science, 2008, 35(3): 152-154. https://doi.org/