我在ElasticSearch中加载了数据。如何在h2o中获取elasticsearch数据?
p4rjhz4m1#
没有直接的方法或API可以将数据从elasticsearch加载到H2O中。h2o支持文件和JDBC,因此您可以将数据从ES写入CSV文件。然后使用POST /3/ImportFiles将数据导入h2o。你可以在如何创建一个h2oframe中参考我的相关回答
sulc1iza2#
我就直说了。一个是询问ETL过程。基本上,所做的就是将索引作为CSV导出到Hadoop,云存储桶或SQL数据库中,然后按照各种教程之一将数据集导入h2o。就我个人而言,我只是使用Airflow DAG从ELK导出,将其转换为pandas框架,然后将框架上传到PostgreSQL数据库;然后使用一个h2o wave脚本,该脚本在数据库中的新数据中被触发为Airflow DAG。你可以用一堆bash脚本和cron作业来完成这一切。
nwlls2ji3#
最新版本的elasticsearch附带了一个SQL接口,可以通过JDBC或ODBC连接。我还没有尝试过用H2O,但在理论上...
3条答案
按热度按时间p4rjhz4m1#
没有直接的方法或API可以将数据从elasticsearch加载到H2O中。h2o支持文件和JDBC,因此您可以将数据从ES写入CSV文件。然后使用POST /3/ImportFiles将数据导入h2o。你可以在如何创建一个h2oframe中参考我的相关回答
sulc1iza2#
我就直说了。一个是询问ETL过程。基本上,所做的就是将索引作为CSV导出到Hadoop,云存储桶或SQL数据库中,然后按照各种教程之一将数据集导入h2o。
就我个人而言,我只是使用Airflow DAG从ELK导出,将其转换为pandas框架,然后将框架上传到PostgreSQL数据库;然后使用一个h2o wave脚本,该脚本在数据库中的新数据中被触发为Airflow DAG。
你可以用一堆bash脚本和cron作业来完成这一切。
nwlls2ji3#
最新版本的elasticsearch附带了一个SQL接口,可以通过JDBC或ODBC连接。我还没有尝试过用H2O,但在理论上...