计算机科学 ›› 2018, Vol. 45 ›› Issue (6A): 465-470.

• 大数据与数据挖掘 • 上一篇    下一篇

TEFRCF:标签熵特征表示的协同过滤个性化推荐算法

何明,杨芃,要凯升,张久伶   

  1. 北京工业大学信息学部 北京100124
  • 出版日期:2018-06-20 发布日期:2018-08-03
  • 作者简介:何 明(1975-),男,博士,副教授,主要研究方向为推荐系统、数据挖掘、机器学习,E-mail:heming@bjut.edu.cn;杨 芃(1994-),男,硕士生,主要研究方向为推荐系统、机器学习;要凯升(1994-),男,硕士生,主要研究方向为推荐系统、数据挖掘;张久伶(1990-),男,硕士生,主要研究方向为推荐系统、迁移学习。
  • 基金资助:
    国家自然科学基金项目(91646201,91546111),北京市教委科研计划一般项目(KM201710005023)资助

TEFRCF:Collaborative Filtering Personalized Recommendation Algorithm Based on Tag
Entropy Feature Representation

HE Ming,YANG Peng,YAO Kai-sheng,ZHANG Jiu-ling   

  1. Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China
  • Online:2018-06-20 Published:2018-08-03

摘要: 标签作为Web 2.0时代信息分类和检索的有效方式,已经成为近年的热点研究对象。标签推荐系统旨在利用标签数据为用户提供个性化推荐。现有的基于标签的推荐方法在预测用户对物品的兴趣度时往往倾向于赋予热门标签及其对应的热门物品较大的权重,导致权重偏差,降低了推荐结果的新颖性,未能充分反映用户个性化的兴趣。针对上述问题,定义了标签熵的概念来度量标签的不确定性,提出了标签熵特征表示的协同过滤个性化推荐算法。该算法通过引入标签熵来解决权重偏差问题,利用三分图形式描述用户-标签-项目之间的关系;构建基于标签熵特征表示的用户和项目特征表示,并通过特征相似性度量方法计算项目的相似性;最后利用用户标签行为和项目的相似性线性组合预测用户对项目的偏好值,并根据预测偏好值排序生成最终的推荐列表。在Last.fm数据集上的实验结果表明,该方法能够提高推荐准确性和新颖性,满足用户的个性化需求。

关键词: 协同过滤, 标签, 熵, 推荐系统

Abstract: Tags are served as an effective way for information classification and information retrieval at the age of Web2.0.Tag recommendation systems aim to provide personalized recommendation for users by using tag data.Theexi-sting tag-based recommendation methods tend to assign the popular tags and their corresponding items more larger weight in predicting users’ interest on the items,resulting in weight deviations,reducing the novelty of the results and being unable to fully reflect users’ personalized interest.In order to solve the problems above,the concept of tag entropy was defined to measure the uncertainty of tags,and the collaborative filtering personalized recommendation algorithm based on tags entropy feature representation was proposed.This method solves the problem of weight deviation by introducing tag entropy,and then the tripartite graphs are used to describe the relationship among users,tags and items.The representation of users and items is constructed based on tag entropy feature representation,and the similarity of items is calculated by the feature similarity measure method.Finally,the user preferences for items are predicted by the linear combination of tags behaviors and similarity of items,and then the recommended list is generated according to the rank of preferences.The experimental results on Last.fm show that the proposed algorithm can improve recommendation accuracy and novelty,and satisfy the requirement for users.

Key words: Collaborative filtering, Tag, Entropy, Recommendation systems

中图分类号: 

  • TP391
[1]ADOMAVICIUS G,TUZHILIN A.Toward the next generation of recommender systems:A survey of the state-of-the-art and possible extensions[C]∥Proceedings of the IEEE Transactions Knowledge and Data Engineering.2005:734-749.<br /> [2]L L,MEDO M,YEUNG C H,et al.Recommender systems[J].Physics Reports,2012,519(1):1-49.<br /> [3]SU X,KHOSHGOFTAAR T M.A survey of collaborative filtering techniques [J].Advances in Artificial Intelligence,2009,2009(12):4.<br /> [4]WEI C,HSU W,LEE M L.A unified framework for recommendationsbased on quaternary semantic analysis[C]∥Proceedings of the 34<sup>th</sup> International ACM SIGIR Conference on Research and Development InInformation Retrieval.Beijing,China,2011:1023-1032.<br /> [5]WANG L C,MENG X W,ZHANG Y J.Context-Aware recommender systems:A survey of the state-of-the-art and possible extensions[J].Journal of Software,2012,23(1):1-20.<br /> [6]LIN J,SUGIYAMA K,KAN M Y,et al.Addressing cold-start in apprecommendation:latent user models constructed from twitterfollowers[C]∥Proceedings of the 36th International ACM SIGIR Conference on Research and Development in Information Retrieval.Dublin,Ireland,2013:283-292.<br /> [7]MISTRY O,SEN S.Tag recommendation for social book marking:Probabilistic approaches [J].Multiagent and Grid Systems,2012,8(2):143-163.<br /> [8]于洪,李俊华.一种解决新项目冷启动问题的推荐算法[J].软件学报,2015,26(6):1395-1408.<br /> [9]ZHANG Z K,ZHOU T,ZHANG Y C.Personalized recommendation via integrated diffusion on user-item-tag tripartite graphs[J].Physica A:Statistical Mechanics and its Applications,2010,389(1):179-186.<br /> [10]ZHANG Z K,LIU C,ZHANG Y C,et al.Solving the cold-start problem in recommender systems with social tags [J].EPL (Europhysics Letters),2010,92(2):28002.<br /> [11]ZHANG Z K,ZHOU T,ZHANG Y C.Tag-Aware recommender systems:A state-of-the-art survey [J].Journal of Computer Science and Technology,2011,26(5):767-777.<br /> [12]JOMSRI P,SANGUANSINTUKUL S,CHOOCHAIWATTA- NA W.A framework for tag-based research paper recommender system:An IR approach[C]∥Proceedings of the 2010 IEEE 24th Int’l Conf.on Advanced Information Networking and Applications Workshops.2010:103-108.<br /> [13]蔡强,韩东梅,李海生,等.基于标签和协同过滤的个性化资源推荐[J].计算机科学,2014,41(1):69-71,110.<br /> [14]李慧,马小平,胡云,等.融合主题与语言模型的个性化标签推荐方法研究[J].计算机科学,2015,42(8):70-74.<br /> [15]叶剑虹,叶双.基于混合模式的流媒体缓存调度算法[J].计算机科学,2013,40(2):61-64.<br /> [16]KIDEOK C,HAKYUNG J,et al.How can an ISP merge with a CDN?[J].IEEE Communications,2011,49(10):156-162.<br /> [17]李瑞敏,林鸿飞,闫俊.基于用户-标签-项目语义挖掘的个性化音乐推荐[J].计算机研究与发展,2014(10):2270-2276.
[1] 陈洁婷, 王维莹, 金琴. 弹幕信息协助下的视频多标签分类[J]. 计算机科学, 2021, 48(1): 167-174.
[2] 马理博, 秦小麟. 话题-位置-类别感知的兴趣点推荐[J]. 计算机科学, 2020, 47(9): 81-87.
[3] 赵钦炎, 李宗民, 刘玉杰, 李华. 基于信息熵的级联Siamese网络目标跟踪[J]. 计算机科学, 2020, 47(9): 157-162.
[4] 史朝卫, 孟相如, 马志强, 韩晓阳. 拓扑综合评估与权值自适应的虚拟网络映射算法[J]. 计算机科学, 2020, 47(7): 236-242.
[5] 刘子琦, 郭炳晖, 程臻, 杨小博, 殷子樵. 基于熵值模糊层次分析法的科技战略评价[J]. 计算机科学, 2020, 47(6A): 1-5.
[6] 骆佳磊, 孟利民. 基于路口相似度的信号配时方案推荐算法[J]. 计算机科学, 2020, 47(6A): 66-69.
[7] 邹海涛, 郑尚, 王琦, 于化龙, 高尚. 基于牛顿法的自适应高阶评分距离推荐模型研究[J]. 计算机科学, 2020, 47(6A): 494-499.
[8] 余孟池, 牟甲鹏, 蔡剑, 徐建. 噪声标签重标注方法[J]. 计算机科学, 2020, 47(6): 79-84.
[9] 林云, 黄桢航, 高凡. 扩散式最大相关熵准则变步长仿射投影符号算法[J]. 计算机科学, 2020, 47(6): 242-246.
[10] 王青松, 姜富山, 李菲. 大数据环境下基于关联规则的多标签学习算法[J]. 计算机科学, 2020, 47(5): 90-95.
[11] 郑伟哲, 仇鹏, 韦娟. 弱标签环境下基于多尺度注意力融合的声音识别检测[J]. 计算机科学, 2020, 47(5): 120-123.
[12] 朱磊, 胡沁涵, 赵雷, 杨季文. 基于评分偏好和项目属性的协同过滤算法[J]. 计算机科学, 2020, 47(4): 67-73.
[13] 赵楠, 皮文超, 许长桥. 一种面向多维特征分析过滤的视频推荐算法[J]. 计算机科学, 2020, 47(4): 103-107.
[14] 杨洁,王国胤,李帅. 基于边界域的邻域知识距离度量模型[J]. 计算机科学, 2020, 47(3): 61-66.
[15] 李太松,贺泽宇,王冰,颜永红,唐向红. 基于循环时间卷积网络的序列流推荐算法[J]. 计算机科学, 2020, 47(3): 103-109.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 编辑部. 新网站开通,欢迎大家订阅![J]. 计算机科学, 2018, 1(1): 1 .
[2] 雷丽晖,王静. 可能性测度下的LTL模型检测并行化研究[J]. 计算机科学, 2018, 45(4): 71 -75 .
[3] 孙启,金燕,何琨,徐凌轩. 用于求解混合车辆路径问题的混合进化算法[J]. 计算机科学, 2018, 45(4): 76 -82 .
[4] 张佳男,肖鸣宇. 带权混合支配问题的近似算法研究[J]. 计算机科学, 2018, 45(4): 83 -88 .
[5] 伍建辉,黄中祥,李武,吴健辉,彭鑫,张生. 城市道路建设时序决策的鲁棒优化[J]. 计算机科学, 2018, 45(4): 89 -93 .
[6] 史雯隽,武继刚,罗裕春. 针对移动云计算任务迁移的快速高效调度算法[J]. 计算机科学, 2018, 45(4): 94 -99 .
[7] 周燕萍,业巧林. 基于L1-范数距离的最小二乘对支持向量机[J]. 计算机科学, 2018, 45(4): 100 -105 .
[8] 刘博艺,唐湘滟,程杰仁. 基于多生长时期模板匹配的玉米螟识别方法[J]. 计算机科学, 2018, 45(4): 106 -111 .
[9] 耿海军,施新刚,王之梁,尹霞,尹少平. 基于有向无环图的互联网域内节能路由算法[J]. 计算机科学, 2018, 45(4): 112 -116 .
[10] 崔琼,李建华,王宏,南明莉. 基于节点修复的网络化指挥信息系统弹性分析模型[J]. 计算机科学, 2018, 45(4): 117 -121 .