计算机科学 ›› 2017, Vol. 44 ›› Issue (Z11): 418-421.doi: 10.11896/j.issn.1002-137X.2017.11A.089
郑步青,邹红霞,胡欣杰,王桢
ZHENG Bu-qing, ZOU Hong-xia, HU Xin-jie and WANG Zhen
摘要: 网络舆情的迅速发展使舆情发展成为研究热点,它对舆情的预测预警具有重要意义。从文本聚类入手,针对舆情的演化分析过程,在时间序列上进行K-means聚类研究,得到聚类中心,又依此对聚类中的词频统计进行时序加权处理,使统计所得关键词更具有代表性。通过对时间聚类法和时序加权统计法所得关键词的分析,得到了舆情演化的趋势。研究结果表明该方法降低了聚类的维数,减少了噪声,提高了聚类的准确度,增强了演化分析的可信度。
[1] 刘毅.网络舆情研究概论[M].天津人民出版社,2007. [2] 侯万友.群体性突发事件微博舆情演化分析[D].哈尔滨:哈尔滨工业大学,2013. [3] 王雪梅,李晓峰,高巍巍.一种改进的K-Means聚类算法的研究[J].计算机与数字工程,2013,41(11):1717-1719. [4] 刘慧婷,倪志伟.基于EMD与K-means算法的时间序列聚类[J].模式识别与人工智能,2009,22(5):803-808. [5] 李深洛.基于特征的时间序列聚类[D].桂林:广西师范大学,2014. [6] 韩娜.聚类算法在时间序列中的研究与应用[D].广州:广东工业大学,2011. [7] 黄晓军,王博,包秀国.基于层次分析法的微博文本特征权重计算方法[J].通信学报,2016,37(12):50-55. [8] 雷春,付业勤.旅游网络舆情事件的时空分布与演化规律分析——以海南旅游热点事件为例[J].韶关学院学报,2014,35(1):114-119. |
No related articles found! |
|