计算机科学 ›› 2019, Vol. 46 ›› Issue (6A): 442-445.

• 大数据与数据挖掘 • 上一篇    下一篇

基于KD-Tree聚类的社交用户画像建模

万家山, 陈蕾, 吴锦华, 高超   

  1. 安徽信息工程学院大数据与人工智能学院 安徽 芜湖241000
  • 出版日期:2019-06-14 发布日期:2019-07-02
  • 作者简介:万家山(1989-),男,硕士,讲师,CCF会员,主要研究方向为数据分析和智能决策、模式识别、机器学习等。
  • 基金资助:
    本文受安徽省教育厅自然科学重大项目(KJ2017ZD53),自然科学重点项目(KJ2017A799)资助。

Persona Based Social User Modeling Using KD-Tree

WAN Jia-shan, CHEN Lei, WU Jin-hua, GAO Chao   

  1. School of Big Data and Artificial Intelligence,Anhui Institute of Information Technology,Wuhu,Anhui 241000,China
  • Online:2019-06-14 Published:2019-07-02

摘要: 传统的信息推送服务普遍缺少对社交用户具体情况的考虑,存在推荐信息针对性不强、系统转化率低等问题。针对上述问题,提出了一种基于用户画像的智能信息推送方法。借助智慧学习平台的用户数据,主要通过KD树来实现在KNN聚类算法中分析用户偏好和行为特征,进而将用户进行类别划分。首先,通过分析聚类中心将每一类用户抽象成高度精炼的短文本,形成具有代表性的标签;其次,根据社交用户个体的标签权重值,结合业务需求进行二次建模来构建用户画像模型,进而逐步细化模型;最后,借助协同过滤推荐算法产生推荐。用户画像不仅提高了数据的可用性和价值,还使分析者从大量的用户数据中摆脱出来,快速地协助分析者做好精细化分类,达到了较好的推荐效果。

关键词: KD树, 个性化推荐, 用户画像, 在线资源推送

Abstract: Traditional information push service takes little consideration of specific needs of social network users in particular conditions,hence it has poorly-targeted recommendations and low-rated system transformation.Responding to these problems,this paper proposed an intelligent push method based on user personas.By analyzing user data of intelligent learning platforms KNN clustering algorithm realized by KD-Tree is used to analyze user preferences and behavior characteristics,and then classifies user categories.First,through clustering center analysis,each type of users is abstracted into a highly-refined short text to form a representative label.Second,on account of label weight value of individual users and different service demands,user personas are modeled two times for refinement.Finally,recommendations are made by collaborative filtering algorithm.User personas will enhance the usability and value of user data.In addition,they may free analysts from large volumes of data,and help make fine classifications and thus more accurate recommendations.

Key words: Individualized recommendation, KD-Tree, Online learning resource push, User personas

中图分类号: 

  • TP311.1
[1]张哲.基于微博数据的用户画像系统的设计与实现[D].武汉:华中科技大学,2015.
[2]王卫平,王金辉.基于Tag和协同过滤的混合推荐方法[J].计算机工程,2011,37(14):34-35.
[3]刘凯鹏,方滨兴.一种基于社会性标注的网页排序算法[J].计算机学报,2010,33(6):1014-1023.
[4]胡蓉.基于标签—主题模型的标签推荐研究[D].武汉:华中师范大学,2013.
[5]邓晓懿,金淳,韩庆平,等.基于情境聚类和用户评级的协同过滤推荐模型[J].系统工程理论与实践,2013,33(11):2945-2953.
[6]王雪霞,李青,李季红.基于共同评分项目数和用户兴趣的协同过滤推荐方法[J].计算机应用,2014,34(11):3140-3143.
[7]李瑞敏,林鸿飞,闫俊.基于用户-标签-项目语义挖掘的个性化音乐推荐[J].计算机研究与发展,2014,51(10):2270-2276.
[8]姜建武,李景文,陆妍玲,等.基于用户画像的信息智能推送方法[J].微型机与应用,2016,35(23):86-89.
[9]赵曙光.高转化率的社交媒体用户画像:基于500用户的深访研究[J].现代传播-中国传媒大学学报,2014,36(6):115-120.
[10]胡媛,毛宁.基于用户画像的数字图书馆知识社区用户模型构建[J].图书馆理论与实践,2017(4):82-85.
[11]牛温佳.用户网络行为画像:大数据中的用户网络行为画像分析与内容推荐应用[M].北京:电子工业出版社,2016.
[12]刘速.浅议数字图书馆知识发现系统中的用户画像——以天津图书馆为例[J].图书馆理论与实践,2017(6):103-106.
[13]陈晓康,刘竹松.基于改进Kd-Tree构建算法的k近邻查询[J].广东工业大学学报,2014(3):119-123.
[14]ABUDALFA S.A Dynamic Linkage Clustering using KD-Tree[J].International Arab Journal of Information Technology,2011,10(3):283-289.
[1] 熊中敏, 舒贵文, 郭怀宇.
融合用户偏好的图神经网络推荐模型
Graph Neural Network Recommendation Model Integrating User Preferences
计算机科学, 2022, 49(6): 165-171. https://doi.org/10.11896/jsjkx.210400276
[2] 孙振强, 罗永龙, 郑孝遥, 章海燕.
一种融合用户情感与相似度的智能旅游路径推荐方法
Intelligent Travel Route Recommendation Method Integrating User Emotion and Similarity
计算机科学, 2021, 48(6A): 226-230. https://doi.org/10.11896/jsjkx.200900119
[3] 梁浩宏, 古天龙, 宾辰忠, 常亮.
联合学习用户端和项目端知识图谱的个性化推荐
Combining User-end and Item-end Knowledge Graph Learning for Personalized Recommendation
计算机科学, 2021, 48(5): 109-116. https://doi.org/10.11896/jsjkx.200600115
[4] 刘晓飞, 朱斐, 伏玉琛, 刘全.
基于用户偏好特征挖掘的个性化推荐算法
Personalized Recommendation Algorithm Based on User Preference Feature Mining
计算机科学, 2020, 47(4): 50-53. https://doi.org/10.11896/jsjkx.190700175
[5] 钟雅,郭渊博,刘春辉,李涛.
内部威胁检测中用户属性画像方法与应用
User Attributes Profiling Method and Application in Insider Threat Detection
计算机科学, 2020, 47(3): 292-297. https://doi.org/10.11896/jsjkx.190200379
[6] 李建军, 侯跃, 杨玉.
基于情景感知的用户兴趣推荐模型
User Interest Recommendation Model Based on Context Awareness
计算机科学, 2019, 46(6A): 502-506.
[7] 张宏丽, 白翔宇, 李改梅.
利用最近邻域推荐且结合情境感知的个性化推荐算法
Personalized Recommendation Algorithm Based on Recent Neighborhood Recommendation and Combined with Context Awareness
计算机科学, 2019, 46(4): 235-240. https://doi.org/10.11896/j.issn.1002-137X.2019.04.037
[8] 朱峙成, 刘佳玮, 阎少宏.
多标签学习在智能推荐中的研究与应用
Research and Application of Multi-label Learning in Intelligent Recommendation
计算机科学, 2019, 46(11A): 189-193.
[9] 石进平,李劲,和凤珍.
基于社交关系和用户偏好的多样性图推荐方法
Diversity Recommendation Approach Based on Social Relationship and User Preference
计算机科学, 2018, 45(6A): 423-427.
[10] 何佶星,陈汶滨,牟斌皓.
流行度划分结合平均偏好权重的协同过滤个性化推荐算法
Coordination Filtering Personalized Recommendation Algorithm Considering Average
Preference Weight and Popularity Division
计算机科学, 2018, 45(6A): 493-496.
[11] 李昊阳,符云清.
基于标签聚类与项目主题的协同过滤推荐算法
Collaborative Filtering Recommendation Algorithm Based on Tag Clustering and Item Topic
计算机科学, 2018, 45(4): 247-251. https://doi.org/10.11896/j.issn.1002-137X.2018.04.041
[12] 王嵘冰,安维凯,冯勇,徐红艳.
基于标签和PageRank的重要微博用户推荐算法
Important Micro-blog User Recommendation Algorithm Based on Label and PageRank
计算机科学, 2018, 45(2): 276-279. https://doi.org/10.11896/j.issn.1002-137X.2018.02.047
[13] 张紫茵, 张恒汝, 徐媛媛, 秦琴.
用户非对称信任关系的推荐算法
Recommendation Algorithm Combining User’s Asymmetric Trust Relationships
计算机科学, 2018, 45(10): 37-42. https://doi.org/10.11896/j.issn.1002-137X.2018.10.007
[14] 费鹏,林鸿飞,杨亮,徐博,古丽孜热·艾尼外.
一种用于构建用户画像的多视角融合框架
Multi-view Ensemble Framework for Constructing User Profile
计算机科学, 2018, 45(1): 179-182. https://doi.org/10.11896/j.issn.1002-137X.2018.01.031
[15] 李恒超,林鸿飞,杨亮,徐博,魏晓聪,张绍武,古丽孜热·艾尼外.
一种用于构建用户画像的二级融合算法框架
Two-level Stacking Algorithm Framework for Building User Portrait
计算机科学, 2018, 45(1): 157-161. https://doi.org/10.11896/j.issn.1002-137X.2018.01.027
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!