bigdata—如何使用hbase/bigtable进行数据分析?

sy5wg1nm  于 2021-06-09  发布在  Hbase
关注(0)|答案(1)|浏览(511)

从概念上讲,hbase/bigtable是键值存储。很多时候,当阅读两者的文档时,会提到它们可以用于分析。但既然它们是关键值,而且不支持sql或类似sql的语言,那么它们是如何用于分析的呢?
CloudBigTable还是一个出色的存储引擎,用于批量mapreduce操作、流处理/分析和机器学习应用程序((来源)

5lwkijsr

5lwkijsr1#

您可以在hbase和cloud bigtable上使用hadoop mapreduce、apache spark和apache beam/google cloud dataflow等分析工具,例如,请参阅:
云bigtable的数据流连接器
将apache spark连接到hbase数据库 HBaseIO apache梁连接器 BigtableIO apache梁连接器
此外,tensorflow与cloud bigtable集成用于ml培训,例如,请参见:
使用cloud bigtable作为tensorflow的流数据源
用于访问cloud bigtable中数据的tensorflow api
最后,您可以通过集成运行sql分析,例如bigquery可以对存储在cloudbigtable中的数据运行sql查询;apachehive可以对apachehbase中存储的数据运行sql查询;e、 例如,见:
bigquery+云bigtable联合查询
hive+hbase集成

相关问题