Computer Science ›› 2017, Vol. 44 ›› Issue (Z6): 428-432.doi: 10.11896/j.issn.1002-137X.2017.6A.096

Previous Articles     Next Articles

SMS Automatic Classification Based on Relational Matrix

LI Feng and WAN Xiao-qiang   

  • Online:2017-12-01 Published:2018-12-01

Abstract: SMS automatic classification is a hot issue of short text study.In this problem,this paper put forward to the feature extraction method of relational strength and the relational matrix,and designed a fully supervised learning algorithm based on relational matrix.In order to implement the system of self learning,this paper also discussed a semi-supervised learning algorithm based on relational matrix,which combines with active learning algorithm of the artificial modification.Finally the experiment results illustrate the effectiveness and efficiency of this algorithm.

Key words: Short text,SMS automatic classification,Relational matrix,Semi-supervised learning,Active learning

[1] 杨柳,殷钊,滕建斌,等.改进贝叶斯分类的智能短信分类方法[J].计算机科学,2014,41(10):31-35.
[2] 李继刚.短信自动分类技术研究与应用[D].上海:东华大学,2012.
[3] 王文霞,王春红.短信文本分类技术的研究[J].计算机技术与发展,2016,26(5):145-148.
[4] 张永军,刘金岭.基于特征词的垃圾短信分类器模型[J].计算机应用,2013,33(5):1334-1337.
[5] 张永军,刘金岭.一种改进的高效贝叶斯短信文本分类器[J].南京师范大学学报(工程技术版),2014(3):70-74.
[6] CHEN T,KAN M Y.Creating a Live,Public Short MessageService Corpus:The NUS SMS Corpus[J].Language Resources & Evaluation,2011,47(2):299-335.
[7] FORMAN G.An extensive empirical study of feature selection metrics for text classification[J].Journal of Machine Learning Research,2003,3(2):1289-1305.
[8] 王文霞.基于贝叶斯文本分类算法的垃圾短信过滤系统[J].山西大同大学学报(自然科学版),2016(3):17-19.
[9] 张杰,陈怀新.基于归一化词频贝叶斯模型的文本分类方法[J].计算机工程与设计,2016,37(3):799-802.
[10] 董红斌,滕旭阳,杨雪.一种基于关联信息熵度量的特征选择方法[J].计算机研究与发展,2016,53(8):1684-1695.
[11] 朱丽,陆建峰.基于主动学习的微博聚类分析[J].数据采集与处理,2016,31(3):599-605.
[12] 商宪丽,王学东.微博话题识别中基于动态共词网络的文本特征提取方法[J].图书情报知识,2016(3):80-88.
[13] 侯旭东.基于内容的短消息智能分析系统研究[D].重庆:重庆理工大学,2010.
[14] 李建磊,王光辉,高宁,等.结合全局信息描述子的局部特征匹配算法[J].测绘科学,2016,41(7):33-36.
[15] 俸世洲.基于自编码神经网络的文本表示应用研究[J].电子测试,2016(19):91-92.
[16] 尚海,罗森林,韩磊,等.基于句义成分的短文本表示方法研究[J].信息网络安全,2016(5):64-70.
[17] 史玉珍,吕琼帅.基于进化模糊规则的Web新闻文本挖掘与分类方法[J].湘潭大学自然科学学报,2016,38(2):99-103.
[18] 马廷淮,金传鑫,侯荣涛,等.一种基于术语频率和卡方统计的文本分类特征选择方法:CN104346459A[P].2015.
[19] 郭飞,张永锋.一种新的中文文本分类特征提取的研究[J].数学的实践与认识,2016(12):125-129.
[20] 孟佳娜.迁移学习在文本分类中的应用研究[D].大连:大连理工大学,2011.
[21] 郭东峰,王东起.机器学习中文本分类处理研究[J].内江科技,2016,37(9):115-116.
[22] 黄旭.基于机器学习的汉语短文本分类方法研究与实现[D].哈尔滨:黑龙江大学,2016.
[23] 路同强,石冰,闫中敏,等.一种用于微博谣言检测的半监督学习算法[J].计算机应用研究,2016,33(3):744-748.
[24] 朱晓光,聂培尧,林培光.基于监督学习的微博情感分类方法[J].计算机应用与软件,2015(8):238-242.
[25] 郭飞,张永锋.一种新的中文文本分类特征提取的研究[J].数学的实践与认识,2016(12):125-129.
[26] 江华丽.中文分词算法研究与分析[J].物联网技术,2016(1):87-89.
[27] 郭华平,董亚东,毛海涛,等.一种基于逻辑判别式的稀有类分类方法[J].小型微型计算机系统,2016,37(1):140-145.
[28] 吴红梅,牛耘.基于特征加权的蛋白质交互识别[J].计算机技术与发展,2016(2):114-117.
[29] http://www.aizhufu.cn/duanxinku/column/77_3/ 1.html.
[30] 李帅,陈笑蓉.改进卡方统计量的BPNN短文本分类方法[J].贵州大学学报(自然科学版),2015,32(6):83-87.
[31] 李国栋,李卫.基于文本分类技术的垃圾邮件识别系统[J].微电子学与计算机,2004,21(6):145-146.

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!