我有一个PySpark代码来训练一个H2o DRF模型。我需要将这个模型保存到磁盘,然后加载它。
from pysparkling.ml import H2ODRF drf = H2ODRF(featuresCols = predictors, labelCol = response, columnsToCategorical = [response])
我找不到这方面的任何文件,所以我在这里提出这个问题。
jm81lzqq1#
我认为文档中关于部署管道模型的部分可能与此相关:https://docs.h2o.ai/sparkling-water/2.3/latest-stable/doc/deployment/pysparkling_pipeline.html管道可能不是您所需要的,这取决于用例。类似下面的内容可能适用于您的用例。
drf = H2ODRF(featuresCols = predictors, labelCol = response, columnsToCategorical = [response]) pipeline = Pipeline(stages=[drf]) model = pipeline.fit(data) model.save("drf_model")
1条答案
按热度按时间jm81lzqq1#
我认为文档中关于部署管道模型的部分可能与此相关:https://docs.h2o.ai/sparkling-water/2.3/latest-stable/doc/deployment/pysparkling_pipeline.html
管道可能不是您所需要的,这取决于用例。
类似下面的内容可能适用于您的用例。