计算机科学 ›› 2014, Vol. 41 ›› Issue (9): 75-79.doi: 10.11896/j.issn.1002-137X.2014.09.013
赵薇,刘杰,叶丹
ZHAO Wei,LIU Jie and YE Dan
摘要: 随着数据规模的快速增长,单机的数据分析工具已经无法满足需求。针对大数据的分析问题,设计并实现了一种基于组件的大数据分析服务平台Haflow。Haflow自定义了业务流程模型和可扩展的组件接口,组件接口支持各种异构工具的集成。系统接收用户定义的业务流程,将其翻译成执行流程实例,提交到Hadoop分布式集群上执行。Haflow是一个可扩展的、分布式的、支持异构分析工具的、面向服务的大数据分析服务平台。提出该平台有两重意义:一方面平台将与数据分析业务无关的工作封装起来,支持各种异构组件,以加快分析应用的开发速度;另一方面,平台后端使用Hadoop分布式系统来实现多任务的并发,从而提高应用的平均执行速度。
[1] Islam M,Huang A K,Battisha M,et al.Oozie:towards a scalable workflow management system for Hadoop[C]∥Proceedings of the 1st ACM SIGMOD Workshop on Scalable Workflow Execution Engines and Technologies (SWEET’12).2012,4:1-10 [2] http://oozie.apache.org/docs/3.3.2/index.html [3] http://www.cs.waikato.ac.nz/ml/weka/ [4] http://mahout.apache.org/ [5] http://www.r-project.org/ [6] 纪俊.一种基于云计算的数据挖掘平台架构设计与实现[D].青岛:青岛大学,2009 [7] 余永红,向晓军,高阳,等.面向服务的云数据挖掘引擎的研究[J].计算机科学与探索,2012,6(1):46-57 [8] 钱肖鲁,朱建秋,朱扬勇.DMVisualMiner:一个可视化数据挖掘分析平台[J].计算机工程,2003,29:148-150 [9] 丁岩,杨庆平,钱煜明.基于云计算的数据挖掘平台架构及其关键技术研究[J].中兴通讯技术,2013,9(1):53-60 |
No related articles found! |
|