计算机科学 ›› 2015, Vol. 42 ›› Issue (Z6): 489-490.

• 数据挖掘 • 上一篇    下一篇

一种基于聚类技术的全文检索与推介系统的构建

张克君,任 鹏,钱 榕,居荣斌,姜 琛,张国亮   

  1. 北京电子科技学院计算机科学与技术系 北京100070,西安电子科技大学计算机学院 西安710071,北京电子科技学院计算机科学与技术系 北京100070,北京电子科技学院计算机科学与技术系 北京100070,北京电子科技学院计算机科学与技术系 北京100070,北京电子科技学院计算机科学与技术系 北京100070
  • 出版日期:2018-11-14 发布日期:2018-11-14
  • 基金资助:
    本文受国家自然基金项目(61170037),北京电子科技学院科研项目(2014GCYY09)资助

Construction of One Kind of Full-text Searching & Recommending System Based on Clustering

ZHANG Ke-jun, REN Peng, QIAN Rong, JU Rong-bin, JIANG Chen and ZHANG Guo-liang   

  • Online:2018-11-14 Published:2018-11-14

摘要: 近年来,搜索引擎的发展可谓突飞猛进,排序算法也日新月异,但相关搜索推介这项功能却进展缓慢,无法为用户提供令人满意的有价值的关键词。本项目是专门为了解决这个问题而进行研究的,采用单词到文档,文档到聚类,聚类再回归单词的语义检索流程,完成了K-means聚类算法以及TFIDF权重算法的Java实现。通过此系统,用户不仅可以找到包含指定关键词的网页,还会收到与该关键词关联最紧密的其他关键词推介,协助用户进一步发掘信息。

Abstract: In recent years,the development of the search engine and the sorting algorithm is updating fast.But the recom-mending system,which cannot provide valuable keywords in the past,is barely evolved.Our project is specialized in order to solve this problem.This project goes from word to document,and from document to cluster,then from cluster to the word which is to be returned.It realized the K-means clustering algorithm and the TFIDF weight algorithm with Java.Users can find not only the web pages including the specific keyword,but also the most valuable keyword recommended which is to help them finding information related.

Key words: Search engine,Cluster,Keyword,Recommending

[1] 谷照升.RIA技术解析[J].长春工程学院学报:自然科学版,2010,11(1):85-88
[2] 侯丽.Web2.0的特性及对信息服务的创新性思考[J].图书馆建设,2008(1):66-69
[3] 熊回香,陈姗,许颖颖.基于Web 3.0的个性化信息聚合技术研究[J].情报理论与实践,2011,34(8):95-99
[4] 刘兴宇.基于倒排索引的全文检索技术研究[D].武汉:华中科技大学,2004
[5] 吴洁明,冀单单,韩云辉.基于Web的DCI垂直搜索引擎的研究与设计[J].计算机工程与设计,2013,34(4):1481-1487
[6] Tan Pang-ning,Steinbach M,Kumar V.数据挖掘导论[M].北京:人民邮电出版社,2011
[7] 施聪莺,徐朝军,杨晓江.TFIDF算法研究综述[J].计算机应用,2009,29(1):167-170
[8] 吴夙慧,成颖,郑彦宁,潘云涛.K-means算法研究综述[J].现代图书情报技术,2011,205(5):28-35
[9] 张睿.基于k-means的中文文本聚类算法的研究与实现[D].西安:西北大学,2009
[10] 郑廷,郑诚.基于Lucene的语义检索系统[J].计算机工程,2008,34(16):92-94
[11] 王学松.Lucene+nutch搜索引擎开发[M].北京:人民邮电出版社,2008
[12] 徐会生,康爱媛,何启伟.深入浅出Ext JS[M].北京:人民邮电出版社,2009
[13] 翟延冬.基于WordNet的短文本语义网挖掘算法研究[D].长春:吉林大学,2012
[14] 张体首,蔡明.语义搜索引擎概念模型[J].微电子学与计算机,2007,2(3):171-174

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!