计算机科学 ›› 2019, Vol. 46 ›› Issue (9): 216-222.doi: 10.11896/j.issn.1002-137X.2019.09.032

• 人工智能 • 上一篇    下一篇

LDA模型和列表排序混合的协同过滤推荐算法

王涵, 夏鸿斌   

  1. (江南大学数字媒体学院 江苏 无锡214122);
    (江南大学江苏省媒体设计与软件技术重点实验室 江苏 无锡214122)
  • 收稿日期:2018-07-12 出版日期:2019-09-15 发布日期:2019-09-02
  • 通讯作者: 夏鸿斌(1973-),男,博士,副教授,主要研究方向为计算机网络优化、社交媒体与数据挖掘、智能Web系统,E-mail:hbxia@163.com
  • 作者简介:王 涵(1993-),女,硕士生,CCF会员,主要研究方向为推荐系统、机器学习,E-mail:W_hwang@163.com;
  • 基金资助:
    国家科学支撑计划课题(2015BAH54F01)

Collaborative Filtering Recommendation Algorithm Mixing LDA Model and List-wise Model

WANG Han, XIA Hong-bin   

  1. (School of Digital Media,Jiangnan University,Wuxi,Jiangsu 214122,China);
    (Key Laboratory of Media Design and Software Technology of Jiangsu Province,Jiangnan University,Wuxi,Jiangsu 214122,China)
  • Received:2018-07-12 Online:2019-09-15 Published:2019-09-02

摘要: 基于排序学习的协同过滤推荐算法受数据稀疏性的影响,出现了推荐不准确性的问题。为此,文中提出了一种结合LDA主题模型和列表排序的混合排序学习协同过滤算法。该算法首先使用LDA主题模型对用户-项目评分矩阵建模,获取用户潜在低维主题向量来度量用户之间的相似度;然后通过列表排序学习函数为用户直接预测满足其偏好的排序列表。在Movielens和EachMovie两个真实数据集上的实验结果表明:该算法可以避免排序学习算法由于用户间共同评分信息过少引起的相似度计算不准确的问题,同时体现出了排序推荐的优越性,有效缓解了数据稀疏性带来的影响,提高了推荐准确度。

关键词: 协同过滤, 排序学习, 列表排序, LDA主题模型

Abstract: Rranking-oriented collaborative filtering is affected by the sparsity of data,which leads to the inaccuracy of recommendations.This paper proposed a hybrid ranking-oriented collaborative filtering algorithm based on LDA topic model and list-wise model.The algorithm uses the LDA topic model to model the user-item ratings matrix,and obtains the potential low-dimensional topic vector of the user,then measures the similarity between users with the topic vector.Next,the list-wise learning function is used to directly predict the total order of items that satisfies the users preference.The experimental results on the two real datasets of Movielens and EachMovie show that the algorithm can avoid the inaccuracy of similarity calculation between users caused by too little common score information,and at the same time reflect the superiority of learning to rank.It can effectively alleviate the effect of data sparsity and improve the accuracy of recommendation.

Key words: Collaborative filtering, Learning to rank, List-wise model, LDA topic model

中图分类号: 

  • TP301
[1]SCHAFER J B,DAN F,HERLOCKER J,et al.Collaborative Filtering Recommender Systems[J].Acm Transactions on Information Systems,2007,22(1):5-53.
[2]XING Y Y,XIA H B,WANG H.An Improved ALS Algorithm for Online Recommendation with Missing Data Modeling[J].Computer Engineering,2018,44(8):218-223.
[3]HUANG S,WANG S,LIU T Y,et al.Listwise collaborative filtering[C]//Proceedings of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval.ACM,2015:343-352.
[4]LINDEN G,SMITH B,YORK J.Amazon.com Recommendations:Item-to-Item Collaborative Filtering[J].IEEE Internet Computing,2003,7(1):76-80.
[5]HOFMANN T.Latent semantic models for collaborative filtering[J].ACM Transactions on Information Systems,2004,22(1):89-115.
[6]HUANG Z H,ZHANG J W,TIAN C Q,et al.Survey on Learning-to-Rank Based Recommendation Algorithms [J].Journal of Software,2016,27(3):691-713.(in Chinese)黄震华,张佳雯,田春岐,等.基于排序学习的推荐算法研究综述[J].软件学报,2016,27(3):691-713.
[7]FANG C,ZHANG H,ZHANG M,et al.RecommendationsBased on Listwise Learning-to-Rank by Incorporating Social Information[J].Ksii Transactions on Internet & Information Systems,2018,12(1):109-134.
[8]LU Y,CAO J.Research Status and Future Trends of Recommender Systems for Implicit Feedback [J].Computer Science,2016,43(4):7-15.(in Chinese)陆艺,曹健.面向隐式反馈的推荐系统研究现状与趋势[J].计算机科学,2016,43(4):7-15.
[9]BLEI D M,NG A Y,JORDAN M I.Latent dirichlet allocation[J].J Machine Learning Research Archive,2003,3(1):993-1022.
[10]LIAN T,MA J,WANG S Q,et al.LDA-CF:A Mixture Model for Collaborative Filtering [J].Journal of Chinese Information Processing,2014,28(2):129-135.(in Chinese)廉涛,马军,王帅强,等.LDA-CF:一种混合协同过滤方法[J].中文信息学报,2014,28(2):129-135.
[11]SHI Y,LARSON M,HANJALIC A.List-wise learning to rank with matrix factorization for collaborative filtering[C]//ACM Conference on Recommender Systems,Recsys 2010.Barcelona,Spain,DBLP,2010:269-272.
[12]LIU J,WU C,XIONG Y,et al.List-wise probabilistic matrix factorization for recommendation[J].Information Sciences,2014,278(9):434-447.
[13]BREESE J S,HECKERMAN D,KADIE C.Empirical analysisof predictive algorithms for collaborative filtering[C]//Procee-dings of the Fourteenth Annual Confe-rence on Uncertainty in Artificial Intelligence.Morgan Kaufmann Publishers Inc.,1998:43-52.
[14]LIU N N,YANG Q.EigenRank:a ranking-oriented approach to collaborative filtering[C]//International ACM SIGIR Conference on Research and Development in Information Retrieval.ACM,2008:83-90.
[15]WANG S,SUN J,GAO B J,et al.VSRank:A Novel Framework for Ranking-Based Collaborative Filtering[J].Acm Transactions on Intelligent Systems & Technology,2014,5(3):1-24.
[16]KULLBACK S.Information Theory and Statistics[J].Population,1962,17(17):377-378.
[17]XIONG H X,DOU Y.Research on Tag Hybrid Recommendation Based on LDA Topic Model[J].Library and Information Service,2018,62(3):104-113.
[18]GAO N,YANG M.Topic Model Embedded in Collaborative Filtering Recommendation Algorithm[J].Computer Science,2016,43(3):57-61.(in Chinese)高娜,杨明.嵌入LDA主题模型的协同过滤推荐算法[J].计算机科学,2016,43(3):57-61.
[19]ZHOU X,WU S.Rating LDA model for collaborative filtering[J].Knowledge-Based Systems,2016,110:135-143.
[20]PENG M,XI J J,DAI X Y,et al.Collaborative Filtering Recommendation Based on Sentiment Analysis and LDA Topic Model[J].Journal of Chinese Information Processing,2017,31(2):194-203.(in Chinese)彭敏,席俊杰,代心媛,等.基于情感分析和LDA主题模型的协同过滤推荐算法[J].中文信息学报,2017,31(2):194-203.
[21]CAO Z,QIN T,LIU T Y,et al.Learning to rank:from pairwise approach to listwise approach[C]//International Conference on Machine Learning.ACM,2007:129-136.
[1] 邓存彬, 虞慧群, 范贵生. 融合动态协同过滤和深度学习的推荐算法[J]. 计算机科学, 2019, 46(8): 28-34.
[2] 张艳红, 张春光, 周湘贞, 王怡鸥. 项目多属性模糊联合的多样性视频推荐算法[J]. 计算机科学, 2019, 46(8): 78-83.
[3] 康林瑶, 唐兵, 夏艳敏, 张黎. 基于GPU加速和非负矩阵分解的并行协同过滤推荐算法[J]. 计算机科学, 2019, 46(8): 106-110.
[4] 张蕾,蔡明. 基于主题融合和关联规则挖掘的图像标注[J]. 计算机科学, 2019, 46(7): 246-251.
[5] 王旭, 庞巍, 王喆. 异构信息网络中基于元结构的协同过滤算法[J]. 计算机科学, 2019, 46(6A): 397-401.
[6] 刘晴晴, 罗永龙, 汪逸飞, 郑孝遥, 陈文. 基于SVD填充的混合推荐算法[J]. 计算机科学, 2019, 46(6A): 468-472.
[7] 卢竹兵, 李玉州. 基于网络评论情感信任分析的推荐策略[J]. 计算机科学, 2019, 46(6): 75-79.
[8] 苏畅, 武鹏飞, 谢显中, 李宁. 基于用户兴趣和地理因素的兴趣点推荐方法[J]. 计算机科学, 2019, 46(4): 228-234.
[9] 王永, 王永东, 邓江洲, 张璞. 融合Jensen-Shannon散度的推荐算法[J]. 计算机科学, 2019, 46(2): 210-214.
[10] 葛梦凡, 刘真, 王娜娜, 田靖玉. 加入标签迁移的跨领域项目推荐算法[J]. 计算机科学, 2019, 46(10): 1-6.
[11] 张洪波, 王佳蕾, 张丽娟, 刘志宏. 基于信任网络的协同过滤推荐方法[J]. 计算机科学, 2018, 45(8): 146-150.
[12] 赵兴旺,梁吉业,郭兰杰. 一种基于空间变换的协同过滤推荐算法[J]. 计算机科学, 2018, 45(7): 16-21.
[13] 魏慧娟, 戴牡红. 融合评分差异和兴趣相似性的协同过滤推荐算法[J]. 计算机科学, 2018, 45(6A): 398-401, 422.
[14] 何明,要凯升,杨芃,张久伶. 基于标签信息特征相似性的协同过滤个性化推荐[J]. 计算机科学, 2018, 45(6A): 415-422.
[15] 何明, 杨芃, 要凯升, 张久伶. TEFRCF:标签熵特征表示的协同过滤个性化推荐算法[J]. 计算机科学, 2018, 45(6A): 465-470, 486.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 孙启,金燕,何琨,徐凌轩. 用于求解混合车辆路径问题的混合进化算法[J]. 计算机科学, 2018, 45(4): 76 -82 .
[2] 张佳男,肖鸣宇. 带权混合支配问题的近似算法研究[J]. 计算机科学, 2018, 45(4): 83 -88 .
[3] 施超,谢在鹏,柳晗,吕鑫. 基于稳定匹配的容器部署策略的优化[J]. 计算机科学, 2018, 45(4): 131 -136 .
[4] 陆佳炜,马俊,张元鸣,肖刚. 面向全局社交服务网的Web服务聚类方法[J]. 计算机科学, 2018, 45(3): 204 -212 .
[5] 郭俊霞,郭仁飞,许南山,赵瑞莲. 基于Session的Web应用软件EFSM模型构建方法研究[J]. 计算机科学, 2018, 45(4): 203 -207, 214 .
[6] 戴文静, 袁家斌. 隐含子群问题的研究现状[J]. 计算机科学, 2018, 45(6): 1 -8 .
[7] 朱文强. 面向O2O服务的移动社交网络个性化可信群体识别模型[J]. 计算机科学, 2018, 45(6): 76 -83 .
[8] 谭博文,王纲,姚稳. 超密集网络中子信道和功率分配研究[J]. 计算机科学, 2018, 45(6A): 279 -282 .
[9] 符晓. 云计算中基于共享机制和群体智能优化算法的任务调度方案[J]. 计算机科学, 2018, 45(6A): 290 -294 .
[10] 代明竹,高嵩峰. 基于考试过程和知识结构的数据挖掘算法研究[J]. 计算机科学, 2018, 45(6A): 437 -441 .