以下是我的问题:hbase是否在其内部工作中使用map/reduce从hadoop中提取数据?hbase是否可以与其他框架(如amazondynamio)一起使用,或者必须使用hadoop作为它的基础框架?hbase容易学吗?设置我可以练习的hbase示例的最佳方法是什么?
kse8i1jr1#
当您试图访问其中的单元格或行时,hbase不使用map/reduce。基本上hadoop存储数据以便知道在哪里找到密钥(密钥按字典顺序存储)。你可以在拉尔斯·乔治的这篇文章中看到细节。hbase确实支持map/reduce,因此您可以将其用作所创建作业的源或目标。hbase需要hadoopapi作为框架,但是像mapr或datastax这样的公司提供了底层hadoop框架的替代实现,所以从技术上讲,如果您真的愿意,您也可以这样做相对于什么?:)用一句陈词滥调来说,hbase易学难掌握。您可以很快地从hbase中获取数据,但要学会正确设计模式、了解使用模式以及它对使用/禁用预写日志、压缩、拆分、是否在每个节点上运行多个区域服务器等的影响,还需要时间。最简单的方法可能是下载一个已经安装了hadoop的vm。e、 g.这些由cloudera提供
1条答案
按热度按时间kse8i1jr1#
当您试图访问其中的单元格或行时,hbase不使用map/reduce。基本上hadoop存储数据以便知道在哪里找到密钥(密钥按字典顺序存储)。你可以在拉尔斯·乔治的这篇文章中看到细节。hbase确实支持map/reduce,因此您可以将其用作所创建作业的源或目标。
hbase需要hadoopapi作为框架,但是像mapr或datastax这样的公司提供了底层hadoop框架的替代实现,所以从技术上讲,如果您真的愿意,您也可以这样做
相对于什么?:)用一句陈词滥调来说,hbase易学难掌握。您可以很快地从hbase中获取数据,但要学会正确设计模式、了解使用模式以及它对使用/禁用预写日志、压缩、拆分、是否在每个节点上运行多个区域服务器等的影响,还需要时间。
最简单的方法可能是下载一个已经安装了hadoop的vm。e、 g.这些由cloudera提供