计算机科学 ›› 2007, Vol. 34 ›› Issue (5): 202-204.

• 计算机网络与信息安全 • 上一篇    下一篇

一种对聊天文本进行特征选取的方法研究

李盛瑜 何文   

  1. 重庆工商大学,重庆400067 重庆大学计算机学院,重庆400044
  • 出版日期:2018-11-16 发布日期:2018-11-16

LI Sheng-Yu, HE Wen (1.Chongqing Technology and Business University, Chongqing 400067;2.College of Computer, Chongqing University,Chongqng 400044)   

  • Online:2018-11-16 Published:2018-11-16

摘要: 由于网络聊天文本具有结构松散、简短、上下文相关等特点,对其进行特征选取时使用传统的TFIDF(Term Frequency Inverse Document Frequency)算法存在较大缺陷。针对这个问题,本文提出了一种通过聊天主题来确定聊天文本的特征选取范围的方法,并通过实验验证了该方法的有效性。

关键词: 文本挖掘 聊天文本 TFIDF

Abstract: Because online chat text is loosely and briefly organized and is context dependent, there are some defects to select features by using traditional TFIDF (Term Frequency Inverse Document Frequency). Aiming at solving the problem, this paper presents a meth

Key words: Text mining, Chat text, TFIDF

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!