摘要: 近年来,分布式系统中的数据流监测是一个十分活跃的领域。研究了如何实现通用并且高效的分布式top-k监测,即在分布的多数据流中根据用户给定的排序函数连续监测最大的k个值。在实际应用中,用户给定的排序函数可能是任意的排序函数,然而,目前的分布式top-k监测技术只支持加法作为排序函数。提出了一种通用的支持任意的连续的严格单调的聚集函数的分布式top-k监测算法GMR。GMR的通讯代价和k无关。通过真实世界数据和模拟数据验证了GMR的效率。实验表明,GMR的网络通讯量比同类方法低一个数量级以上。
邓波 饶翔 贾焰 杨树强. 多数据流上的连续分布式Top-k监测[J]. 计算机科学, 2007, 34(2): 125-128. https://doi.org/
DENG Bo ,RAO Xiang ,JIA Yan ,YANG Shu-Qiang ( School of Computer Science, National University of Defense Technology, Changsha 410073). [J]. Computer Science, 2007, 34(2): 125-128. https://doi.org/