计算机科学 ›› 2018, Vol. 45 ›› Issue (6A): 465-470, 486.

• 大数据与数据挖掘 • 上一篇    下一篇

TEFRCF:标签熵特征表示的协同过滤个性化推荐算法

何明,杨芃,要凯升,张久伶   

  1. 北京工业大学信息学部 北京100124
  • 出版日期:2018-06-20 发布日期:2018-08-03
  • 作者简介:何 明(1975-),男,博士,副教授,主要研究方向为推荐系统、数据挖掘、机器学习,E-mail:heming@bjut.edu.cn;杨 芃(1994-),男,硕士生,主要研究方向为推荐系统、机器学习;要凯升(1994-),男,硕士生,主要研究方向为推荐系统、数据挖掘;张久伶(1990-),男,硕士生,主要研究方向为推荐系统、迁移学习。
  • 基金资助:
    国家自然科学基金项目(91646201,91546111),北京市教委科研计划一般项目(KM201710005023)资助

TEFRCF:Collaborative Filtering Personalized Recommendation Algorithm Based on Tag
Entropy Feature Representation

HE Ming,YANG Peng,YAO Kai-sheng,ZHANG Jiu-ling   

  1. Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China
  • Online:2018-06-20 Published:2018-08-03

摘要: 标签作为Web 2.0时代信息分类和检索的有效方式,已经成为近年的热点研究对象。标签推荐系统旨在利用标签数据为用户提供个性化推荐。现有的基于标签的推荐方法在预测用户对物品的兴趣度时往往倾向于赋予热门标签及其对应的热门物品较大的权重,导致权重偏差,降低了推荐结果的新颖性,未能充分反映用户个性化的兴趣。针对上述问题,定义了标签熵的概念来度量标签的不确定性,提出了标签熵特征表示的协同过滤个性化推荐算法。该算法通过引入标签熵来解决权重偏差问题,利用三分图形式描述用户-标签-项目之间的关系;构建基于标签熵特征表示的用户和项目特征表示,并通过特征相似性度量方法计算项目的相似性;最后利用用户标签行为和项目的相似性线性组合预测用户对项目的偏好值,并根据预测偏好值排序生成最终的推荐列表。在Last.fm数据集上的实验结果表明,该方法能够提高推荐准确性和新颖性,满足用户的个性化需求。

关键词: 协同过滤, 标签, 熵, 推荐系统

Abstract: Tags are served as an effective way for information classification and information retrieval at the age of Web2.0.Tag recommendation systems aim to provide personalized recommendation for users by using tag data.Theexi-sting tag-based recommendation methods tend to assign the popular tags and their corresponding items more larger weight in predicting users’ interest on the items,resulting in weight deviations,reducing the novelty of the results and being unable to fully reflect users’ personalized interest.In order to solve the problems above,the concept of tag entropy was defined to measure the uncertainty of tags,and the collaborative filtering personalized recommendation algorithm based on tags entropy feature representation was proposed.This method solves the problem of weight deviation by introducing tag entropy,and then the tripartite graphs are used to describe the relationship among users,tags and items.The representation of users and items is constructed based on tag entropy feature representation,and the similarity of items is calculated by the feature similarity measure method.Finally,the user preferences for items are predicted by the linear combination of tags behaviors and similarity of items,and then the recommended list is generated according to the rank of preferences.The experimental results on Last.fm show that the proposed algorithm can improve recommendation accuracy and novelty,and satisfy the requirement for users.

Key words: Collaborative filtering, Tag, Entropy, Recommendation systems

中图分类号: 

  • TP391
[1]ADOMAVICIUS G,TUZHILIN A.Toward the next generation of recommender systems:A survey of the state-of-the-art and possible extensions[C]∥Proceedings of the IEEE Transactions Knowledge and Data Engineering.2005:734-749.<br /> [2]L L,MEDO M,YEUNG C H,et al.Recommender systems[J].Physics Reports,2012,519(1):1-49.<br /> [3]SU X,KHOSHGOFTAAR T M.A survey of collaborative filtering techniques [J].Advances in Artificial Intelligence,2009,2009(12):4.<br /> [4]WEI C,HSU W,LEE M L.A unified framework for recommendationsbased on quaternary semantic analysis[C]∥Proceedings of the 34<sup>th</sup> International ACM SIGIR Conference on Research and Development InInformation Retrieval.Beijing,China,2011:1023-1032.<br /> [5]WANG L C,MENG X W,ZHANG Y J.Context-Aware recommender systems:A survey of the state-of-the-art and possible extensions[J].Journal of Software,2012,23(1):1-20.<br /> [6]LIN J,SUGIYAMA K,KAN M Y,et al.Addressing cold-start in apprecommendation:latent user models constructed from twitterfollowers[C]∥Proceedings of the 36th International ACM SIGIR Conference on Research and Development in Information Retrieval.Dublin,Ireland,2013:283-292.<br /> [7]MISTRY O,SEN S.Tag recommendation for social book marking:Probabilistic approaches [J].Multiagent and Grid Systems,2012,8(2):143-163.<br /> [8]于洪,李俊华.一种解决新项目冷启动问题的推荐算法[J].软件学报,2015,26(6):1395-1408.<br /> [9]ZHANG Z K,ZHOU T,ZHANG Y C.Personalized recommendation via integrated diffusion on user-item-tag tripartite graphs[J].Physica A:Statistical Mechanics and its Applications,2010,389(1):179-186.<br /> [10]ZHANG Z K,LIU C,ZHANG Y C,et al.Solving the cold-start problem in recommender systems with social tags [J].EPL (Europhysics Letters),2010,92(2):28002.<br /> [11]ZHANG Z K,ZHOU T,ZHANG Y C.Tag-Aware recommender systems:A state-of-the-art survey [J].Journal of Computer Science and Technology,2011,26(5):767-777.<br /> [12]JOMSRI P,SANGUANSINTUKUL S,CHOOCHAIWATTA- NA W.A framework for tag-based research paper recommender system:An IR approach[C]∥Proceedings of the 2010 IEEE 24th Int’l Conf.on Advanced Information Networking and Applications Workshops.2010:103-108.<br /> [13]蔡强,韩东梅,李海生,等.基于标签和协同过滤的个性化资源推荐[J].计算机科学,2014,41(1):69-71,110.<br /> [14]李慧,马小平,胡云,等.融合主题与语言模型的个性化标签推荐方法研究[J].计算机科学,2015,42(8):70-74.<br /> [15]叶剑虹,叶双.基于混合模式的流媒体缓存调度算法[J].计算机科学,2013,40(2):61-64.<br /> [16]KIDEOK C,HAKYUNG J,et al.How can an ISP merge with a CDN?[J].IEEE Communications,2011,49(10):156-162.<br /> [17]李瑞敏,林鸿飞,闫俊.基于用户-标签-项目语义挖掘的个性化音乐推荐[J].计算机研究与发展,2014(10):2270-2276.
[1] 秦悦, 丁世飞. 半监督聚类综述[J]. 计算机科学, 2019, 46(9): 15-21.
[2] 王涵, 夏鸿斌. LDA模型和列表排序混合的协同过滤推荐算法[J]. 计算机科学, 2019, 46(9): 216-222.
[3] 邓存彬, 虞慧群, 范贵生. 融合动态协同过滤和深度学习的推荐算法[J]. 计算机科学, 2019, 46(8): 28-34.
[4] 张艳红, 张春光, 周湘贞, 王怡鸥. 项目多属性模糊联合的多样性视频推荐算法[J]. 计算机科学, 2019, 46(8): 78-83.
[5] 郭旭, 朱敬华. 基于用户向量化表示和注意力机制的深度神经网络推荐模型[J]. 计算机科学, 2019, 46(8): 111-115.
[6] 康林瑶, 唐兵, 夏艳敏, 张黎. 基于GPU加速和非负矩阵分解的并行协同过滤推荐算法[J]. 计算机科学, 2019, 46(8): 106-110.
[7] 刘长赟,杨宇迪,周丽华,赵丽红. 带有时间标签的流行社交位置发现[J]. 计算机科学, 2019, 46(7): 186-194.
[8] 王亚鸽, 康晓东, 郭军, 洪睿, 李博, 张秀芳. 一种联合Canny边缘检测和SPIHT的图像压缩方法[J]. 计算机科学, 2019, 46(6A): 222-225.
[9] 石晓玲, 陈芷, 杨立功, 沈伟. 基于自适应样本权重的矩阵分解推荐算法[J]. 计算机科学, 2019, 46(6A): 488-492.
[10] 王旭, 庞巍, 王喆. 异构信息网络中基于元结构的协同过滤算法[J]. 计算机科学, 2019, 46(6A): 397-401.
[11] 刘晴晴, 罗永龙, 汪逸飞, 郑孝遥, 陈文. 基于SVD填充的混合推荐算法[J]. 计算机科学, 2019, 46(6A): 468-472.
[12] 陈俊航, 徐小平, 杨恒泓. 基于Seq2seq模型的推荐应用研究[J]. 计算机科学, 2019, 46(6A): 493-496.
[13] 何瑾琳, 刘学军, 徐新艳, 毛宇佳. 融合node2vec和深度神经网络的隐式反馈推荐模型[J]. 计算机科学, 2019, 46(6): 41-48.
[14] 卢竹兵, 李玉州. 基于网络评论情感信任分析的推荐策略[J]. 计算机科学, 2019, 46(6): 75-79.
[15] 杜秀丽, 左思铭, 邱少明. 基于图像灰度熵的自适应字典学习算法[J]. 计算机科学, 2019, 46(5): 266-271.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 编辑部. 新网站开通,欢迎大家订阅![J]. 计算机科学, 2018, 1(1): 1 .
[2] 雷丽晖,王静. 可能性测度下的LTL模型检测并行化研究[J]. 计算机科学, 2018, 45(4): 71 -75, 88 .
[3] 夏庆勋,庄毅. 一种基于局部性原理的远程验证机制[J]. 计算机科学, 2018, 45(4): 148 -151, 162 .
[4] 厉柏伸,李领治,孙涌,朱艳琴. 基于伪梯度提升决策树的内网防御算法[J]. 计算机科学, 2018, 45(4): 157 -162 .
[5] 王欢,张云峰,张艳. 一种基于CFDs规则的修复序列快速判定方法[J]. 计算机科学, 2018, 45(3): 311 -316 .
[6] 孙启,金燕,何琨,徐凌轩. 用于求解混合车辆路径问题的混合进化算法[J]. 计算机科学, 2018, 45(4): 76 -82 .
[7] 张佳男,肖鸣宇. 带权混合支配问题的近似算法研究[J]. 计算机科学, 2018, 45(4): 83 -88 .
[8] 伍建辉,黄中祥,李武,吴健辉,彭鑫,张生. 城市道路建设时序决策的鲁棒优化[J]. 计算机科学, 2018, 45(4): 89 -93 .
[9] 刘琴. 计算机取证过程中基于约束的数据质量问题研究[J]. 计算机科学, 2018, 45(4): 169 -172 .
[10] 钟菲,杨斌. 基于主成分分析网络的车牌检测方法[J]. 计算机科学, 2018, 45(3): 268 -273 .