计算机科学 ›› 2013, Vol. 40 ›› Issue (Z11): 263-266.
宋杰,郝文宁,陈刚,靳大尉,赵成
SONG Jie,HAO Wen-ning,CHEN Gang,JIN Da-wei and ZHAO Cheng
摘要: 针对MapReduce缺少对ETL上层数据模型的具体描述,提出了一种集成的基于MapReduce的分布式ETL(MapReduce Distributed ETL,简称MDETL)多维数据模型处理方法其,把对数据的处理分解成对数据属性(维和事实)的处理,解决了ETL上层具体数据模型的构建问题。用真实的数据集评估了它的性能,实验结果表明MDETL具有很好的可扩展性。
[1] 徐俊,刚裴莹.数据ETL研究综述[J].计算机科学,2011,38(4) [2] Dean J,SGhemawat J.MapReduce:Simplified Data Processingon Large Clusters[C]∥Proc.of OSDI.2004:137-150 [3] Kovoor G,Singer J,Lujan M.Building a Java MapReduceFramework for Multi-core Architectures[C]∥Proc.of MULTIPROG.2010 [4] 王珊,王会举,等.架构大数据:挑战、现状与展望[J].计算机学报,2011,0:1741-1752 [5] 李建江,崔健,等.MapReduce并行编程模型研究综述[J].电子学报,2011,1:2635-2642 [6] Dean J,Ghemawat S.MapReduce:A Flexible Data ProcessingTool[J].CACM,2010,53(1):72-77 |
No related articles found! |
|