如何在h2o中获取elasticsearch数据?

8xiog9wr  于 2023-10-17  发布在  ElasticSearch
关注(0)|答案(3)|浏览(96)

我在ElasticSearch中加载了数据。如何在h2o中获取elasticsearch数据?

p4rjhz4m

p4rjhz4m1#

没有直接的方法或API可以将数据从elasticsearch加载到H2O中。h2o支持文件和JDBC,因此您可以将数据从ES写入CSV文件。然后使用POST /3/ImportFiles将数据导入h2o。你可以在如何创建一个h2oframe中参考我的相关回答

sulc1iza

sulc1iza2#

我就直说了。一个是询问ETL过程。基本上,所做的就是将索引作为CSV导出到Hadoop,云存储桶或SQL数据库中,然后按照各种教程之一将数据集导入h2o。
就我个人而言,我只是使用Airflow DAG从ELK导出,将其转换为pandas框架,然后将框架上传到PostgreSQL数据库;然后使用一个h2o wave脚本,该脚本在数据库中的新数据中被触发为Airflow DAG。
你可以用一堆bash脚本和cron作业来完成这一切。

nwlls2ji

nwlls2ji3#

最新版本的elasticsearch附带了一个SQL接口,可以通过JDBC或ODBC连接。我还没有尝试过用H2O,但在理论上...

相关问题