我在hbase中存储了大量的时间序列数据,在hbase中它由产品输入,cf/cq存储了该产品的时间序列数据。我们提出了一个python函数,需要将它应用于每个记录(有一些时间序列分析,机器学习的东西,在python中很容易,但在其他语言(java、scala)中却非常复杂。
我想知道什么是最快的方式将该功能应用于hbase中的所有记录。
以下是我的选择:
Pypark公司
MapReduce+jython
把hbase变成扁平+hadoop流媒体。。
我想道歉,如果这不是具体的编程,但任何反馈或比较将不胜感激!
暂无答案!
目前还没有任何答案,快来回答吧!