计算机科学 ›› 2018, Vol. 45 ›› Issue (11A): 58-62.

• 综述研究 • 上一篇    下一篇

基于大数据平台的企业画像研究综述

田娟, 朱定局, 杨文翰   

  1. 华南师范大学计算机学院 广州510631
  • 出版日期:2019-02-26 发布日期:2019-02-26
  • 作者简介:田 娟(1994-),女,硕士生,主要研究方向为大数据、人工智能,E-mail:1280301862@qq.com;朱定局(1978-),男,博士,副教授,主要研究方向为大数据、人工智能,E-mail:zhudingju@m.scnu.edu.cn;杨文翰(1990-),男,硕士生,主要研究方向为大数据,E-mail:850168675@qq.com。
  • 基金资助:
    本文受国家社会科学基金重大项目(14ZDB101),国家自然自然基金(61105133)项目,广东省科技计划项目软科学研究项目(2014A070703045)资助。

Research on Enterprise Portraits Based on Big Data Platforms

TIAN Juan, ZHU Ding-ju, YANG Wen-han   

  1. College of Computer Science,South China Normal University,Guangzhou 510631,China
  • Online:2019-02-26 Published:2019-02-26

摘要: 随着国民经济的发展,企业的数量不断增加。基于企业运营时产生的海量数据,可以利用大数据技术结合企业画像的理论来对企业进行全面分析,为企业成长、行业发展、政府监管等各方面提供可靠的数据分析。文中首先对当前国内外企业画像构建及其技术进行总结和分析,构建了基于大数据平台的企业画像标签体系模型和建模框架;然后根据企业数据的特点,结合比较热门的用户画像技术,提出了几种处理企业的数据方法;最后提出使用大数据技术处理企业数据时值得讨论的几个问题。

关键词: 企业画像, 大数据技术, 特征分析, 标签提取

Abstract: With the development of economy,the number of enterprises is increasing.For the massive data generated by the enterprised,we can use big data technology processing methods and the theory of enterprise portrait to analyze business data,and provide reliable data analysis for enterprise development,industry development and government regulation.Firstly,this paper summarized and analyzed the construction and technology of corporate portraits at domestic and international.Then,according to the characteristics of enterprise data and combined with the persona technology,this paper put forward several methods to deal with enterprise data.At the last,this paper put forward several issues about handling enterprise data when using big data technology processing methods.

Key words: Enterprise portrait, Large data technology, Feature analysis, Label extraction

中图分类号: 

  • TP301
[1]郝胜宇,陈静仁.大数据时代用户画像助力企业实现精准化营[J].中国集体经济,2016(4):61-62.
[2]孙晔,杨照东,陈德华,等.大数据用户画像技术在商业银行的应用[J].数字通信世界,2016(9):86-88.
[3]刘海,卢慧,阮金花,等.基于“用户画像”挖掘的精准营销细分模型研究[J].丝绸,2015,52(12):37-42,47.
[4]陈志明,胡震云.UGC网站用户画像研究[J].计算机系统应用,2017,26(1):24-30.
[5]吕辉,许道强,仲春林,等.基于电力大数据的标签画像技术与应用研究[J].电力信息与通信技术,2017,15(2):43-48.
[6]陈一平.今品指数:用大数据为企业画像[J].华夏时报,2015-07-06(021).
[7]王磊,郑国勇.大连国税:大数据为企业精准画像[N].中国税务报,2016-10-17(A04).
[8]王雪.基于企业画像的公示数据查询系统设计与实现[D].大连:大连海事大学,2017.
[9]ZHONG C J.“Picture” for domestic enterprises to go to the western “circle”[N].NanJing Times,2016-04-25(A02).
[10]李代祎,谢丽艳,钱慎一,等.基于Scrapy的分布式爬虫系统的设计与实现[J].湖北民族学院学报(自然科学版),2017,35(3):317-322.
[11]胡萍瑞,李石君.基于URL模式集的主题爬虫[J].计算机应用研究,2018(3):1-2.
[12]GOUNARIS A,TORRES J.A Methodology for Spark Parameter Tuning[J].Big Data Research,2018,11:22-32.
[13]李映坤.大数据背景下用户画像的统计方法实践研究[D].北京:首都经济贸易大学,2016.
[14]DING W,WANG T,LIU X H,et al.Research on mobile phone user’s portrait and credit based on large data technology[J].DesigTechn Post Telecommun,2016(3):64-69.
[15]刘鹏.基于Spark的数据管理平台的设计与实现[D].杭州:浙江大学,2016.
[16]徐凯.基于主题抽取演化模型的实时新闻推荐系统[D].广州:广东工业大学,2016.
[17]SEVERYN A,MOSCHITTI A.Learning to rank short text pairs with convolutional deep neural networks[C]∥Procee-dings of the 38th International ACM SIGIR Conference.2015:373-382.
[18]余本功,张连彬.基于CP-CNN的中文短文本分类研究[J].计算机应用研究,2018,35(4).
[19]李春梅.基于TF-IDF的网页新闻分类的研究与应用[J].贵州师范大学学报(自然科学版),2015,33(6):106-109.
[20]谢慧志.基于用户选购及在线点评行为的门店画像研究[D].广州:华南理工大学,2016.
[21]GLOROT X,BORDES A,BENGION Y.Deep spares rectifiter neural network[C]∥Proceedings of International Conference on Artificial Intelligence and Statistice.2011:315-323.
[22]KIM Y.Convolutional Neural Networks for Sentence Classification[C]∥Proceedings of Empirical Methods in Natural Language Processing.2014:1746-1751.
[23]张燕琴,潘利强.Apriori算法在WEB的图书销售智能系统中的应用[J].网络安全技术与应用,2017(9):58-59.
[24]刘志刚.基于标签关联规则的挖掘与研究[J].科技创新与应用,2017(26):26.
[25]左爱文.数据挖掘技术在气象数据中的应用[D].西安:西安电子科技大学,2006.
[26]张玲玲,周全亮,唐广文,等.基于领域知识和聚类的关联规则深层知识发现研究[J].中国管理科学,2015,23(2):154-161.
[27]夏光虎,贾宇波,范红丹.分类与预测挖掘在信用风险评估中的应用研究[J].工业控制计算机,2012,25(7):71-72.
[28]SZEGED Y C,LIU W J,YANG Q.Going deeper With Convolutions[C]∥Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition(CVPR).Boston,USA,2015.
[29]JOHNSON R,ZHANG T.Effective Use of Word Order for Text Categorization with Convolutional Neural Networks[C]∥Proceedings of North American Chapter of the Association for Computational Linguistics.2014:103-112.
[1] 穆晓芳, 邓红霞, 李晓宾, 赵鹏. 基于人工蜂群算法的两阶段图像隐写分析算法[J]. 计算机科学, 2019, 46(6): 174-179.
[2] 朱威, 易瑶, 王图强, 郑雅羽. 一种深度图像帧内编码单元快速划分算法[J]. 计算机科学, 2019, 46(10): 286-294.
[3] 李文莉,高宏伟,冀大雄,李岩. 基于遗传算法的海底沉积物纹理特征优化方法[J]. 计算机科学, 2016, 43(Z6): 130-133.
[4] 崔敏君,段利国,李爱萍. 多特征层次化答案质量评价方法研究[J]. 计算机科学, 2016, 43(1): 94-97.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 编辑部. 新网站开通,欢迎大家订阅![J]. 计算机科学, 2018, 1(1): 1 .
[2] 雷丽晖,王静. 可能性测度下的LTL模型检测并行化研究[J]. 计算机科学, 2018, 45(4): 71 -75 .
[3] 孙启,金燕,何琨,徐凌轩. 用于求解混合车辆路径问题的混合进化算法[J]. 计算机科学, 2018, 45(4): 76 -82 .
[4] 张佳男,肖鸣宇. 带权混合支配问题的近似算法研究[J]. 计算机科学, 2018, 45(4): 83 -88 .
[5] 伍建辉,黄中祥,李武,吴健辉,彭鑫,张生. 城市道路建设时序决策的鲁棒优化[J]. 计算机科学, 2018, 45(4): 89 -93 .
[6] 史雯隽,武继刚,罗裕春. 针对移动云计算任务迁移的快速高效调度算法[J]. 计算机科学, 2018, 45(4): 94 -99 .
[7] 周燕萍,业巧林. 基于L1-范数距离的最小二乘对支持向量机[J]. 计算机科学, 2018, 45(4): 100 -105 .
[8] 刘博艺,唐湘滟,程杰仁. 基于多生长时期模板匹配的玉米螟识别方法[J]. 计算机科学, 2018, 45(4): 106 -111 .
[9] 耿海军,施新刚,王之梁,尹霞,尹少平. 基于有向无环图的互联网域内节能路由算法[J]. 计算机科学, 2018, 45(4): 112 -116 .
[10] 崔琼,李建华,王宏,南明莉. 基于节点修复的网络化指挥信息系统弹性分析模型[J]. 计算机科学, 2018, 45(4): 117 -121 .