摘要: 针对大规模能源数据系统的存储与快速检索需求,提出了一种基于HDFS/Hadoop开源平台的云存储架构 及多级索引目录体系,以及此架构下的基于多级索引表的mDH"I'算法,并完成了算法的MapRcducc编程实现。基于 上述算法完成的4800万条数据的仿真实验表明:在数据量达到1200万一4800万条时,采用多级索引表的mDHT算 法较常规的MS SQI. Scrvcr实现和HDFS/Hiv。方法在检索性能方面有质的飞跃;与单级索引表检索方法比较,在数 据查找时间上也有24. 5 0 0-}-57. 8%的显著降低。文中提出的基于多级索引表的DH`I}算法为构建基于云存储架构的 海量数据快速搜索引擎提供了一个关键技术。
No related articles found! |
|