摘要: 由于网络聊天文本具有结构松散、简短、上下文相关等特点,对其进行特征选取时使用传统的TFIDF(Term Frequency Inverse Document Frequency)算法存在较大缺陷。针对这个问题,本文提出了一种通过聊天主题来确定聊天文本的特征选取范围的方法,并通过实验验证了该方法的有效性。
李盛瑜 何文. 一种对聊天文本进行特征选取的方法研究[J]. 计算机科学, 2007, 34(5): 202-204. https://doi.org/
LI Sheng-Yu, HE Wen (1.Chongqing Technology and Business University, Chongqing 400067;2.College of Computer, Chongqing University,Chongqng 400044). [J]. Computer Science, 2007, 34(5): 202-204. https://doi.org/