我需要使用hadoop实现等深度直方图的逻辑。假设我们有以下测试数据:
10, 11, 14, 16, 80, 90, 65
如何生成等深度直方图?我必须改变 params ,每个桶的项目数和每个桶的项目数。我应该如何实现它?我认为逻辑是找到等宽直方图。计算平均频率。并对输入数据再次执行map reduce。如果是,如何读取两个输入文件(输入数据和来自map reduce 1的结果)还有其他逻辑吗?
params
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!