pyspark 如何将H2O气泡水模型保存到磁盘

xzv2uavs  于 2023-02-03  发布在  Spark
关注(0)|答案(1)|浏览(132)

我有一个PySpark代码来训练一个H2o DRF模型。我需要将这个模型保存到磁盘,然后加载它。

from pysparkling.ml import H2ODRF
drf = H2ODRF(featuresCols = predictors,
                labelCol = response,
                columnsToCategorical = [response])

我找不到这方面的任何文件,所以我在这里提出这个问题。

jm81lzqq

jm81lzqq1#

我认为文档中关于部署管道模型的部分可能与此相关:https://docs.h2o.ai/sparkling-water/2.3/latest-stable/doc/deployment/pysparkling_pipeline.html
管道可能不是您所需要的,这取决于用例。
类似下面的内容可能适用于您的用例。

drf = H2ODRF(featuresCols = predictors,
                labelCol = response,
                columnsToCategorical = [response])

pipeline = Pipeline(stages=[drf])

model = pipeline.fit(data)
model.save("drf_model")

相关问题