hbase mapreduce交互

zpgglvta 于 2021-06-03 发布在 Hadoop

关注(0)|答案(1)|浏览(400)

我有一个hbase和mapreduce程序。
我用hdfs存储数据，这个文件的大小是：100g。现在我把这些数据放到hbase上。
我用mapreduce扫描这个文件损失了5分钟。但扫描hbase表却浪费了30分钟。
如何提高使用hbase和mapreduce时的速度？
谢谢。

hadoop hbase mapreduce

来源：https://stackoverflow.com/questions/13304019/hbase-mapreduce-interaction

1条答案

按热度按时间

alen0pnh1#

我假设您有一个单节点hdfs。如果您的100gb文件位于hdf的多节点集群中，那么map reduce和hive的速度都会更快。
你可以尝试增加mapper和reducer上的mapper和reducer的数量来提高性能，看看这篇文章。
hive本质上是一个建立在hdfs之上的数据仓库工具，它下面的每个查询本身就是一个map reduce任务。所以上面的帖子也能回答这个问题。

赞(0）回复(0）举报 2021-06-03

我来回答

hbase mapreduce交互

1条答案

相关问题

热门标签

最新问答