我对hadoop还不熟悉。我想要完成的是在分布式系统中通过云存储时间序列数据。在webopentsdb上查看一些东西对我来说似乎是一个可行的选择。我还有一些rdbms数据库,可以存储在分布式系统中,并使用hive。我们计划做的是使用timeseries数据库和结构化rdbms数据(通过hive读写),然后将时间序列数据与此结构化数据连接起来。以这样的方式存储输出:它可以像sql一样通过hive进行读写。
oo7oh9g91#
不确定你是在问hadoop还是tsdbs。如果您已经有了hadoop环境,那么添加hbase和opentsdb可能是有意义的。如果您想要提供更多以查询为中心的想法的替代方案,那么XDB或timescaledb在该领域似乎更受欢迎。如果可伸缩性真的是个问题,那么cassandra和kairos是另一个选择。作为类似于配置单元的处理的一部分,sparksql可能可以与上述所有组件进行交互
1条答案
按热度按时间oo7oh9g91#
不确定你是在问hadoop还是tsdbs。
如果您已经有了hadoop环境,那么添加hbase和opentsdb可能是有意义的。
如果您想要提供更多以查询为中心的想法的替代方案,那么XDB或timescaledb在该领域似乎更受欢迎。
如果可伸缩性真的是个问题,那么cassandra和kairos是另一个选择。
作为类似于配置单元的处理的一部分,sparksql可能可以与上述所有组件进行交互