在bigdata环境中在何处创建暂存数据表?

bvjxkvbb  于 2021-06-09  发布在  Hbase
关注(0)|答案(2)|浏览(269)

我现在有hadoop-2,pig,hive和hbase。我有一个输入数据。我已经在hdfs中加载了这些数据。我想在此环境中创建暂存数据。
我的问题是-
在哪个bigdata组件中,我应该创建staging表(pig/hive/hbase);这会有基于条件的数据进来吗?稍后,我们可能希望运行带有复杂逻辑的mapreduce作业。
请协助

vc9ivgsu

vc9ivgsu1#

Hive: 如果你有olap类的工作负载,不需要实时读/写。 HBase: 如果你有oltp这样的工作量。你需要做实时/流式读/写。使用mapreduce可以完成一些批处理或olap处理。使用apachephoenix可以进行类似sql的查询。
您可以在hive和hbase上运行mapreduce作业。

wlwcrazw

wlwcrazw2#

你想去哪儿都行。pig不是一个选项,因为它没有元存储。如果需要类似sql的查询,请选择hive。基于您的访问模式的hbase。
在数据上运行配置单元查询时,它将转换为mr。
在hive中创建时,使用hive查询&而不是mr。如果使用mr,则使用pig。在数据上创建一个配置单元表不会有什么好处。

相关问题