我正在hadoop集群上使用h2o(最新版本3.26.0.10)。我从hdfs中读入了一个Parquet文件,并对它进行了一些操作,建立了一个模型,等等。
我把一些重要的结果储存在 H2OFrame
我希望导出到本地存储,而不是hdfs。有没有办法把这个文件导出为Parquet呢?
我试过用 h2o.exportFile
,此处为文档:http://docs.h2o.ai/h2o/latest-stable/h2o-r/docs/reference/h2o.exportfile.html 但是所有的例子都是用来写.csv的。我试着用a文件路径 .parquet
作为一个扩展,但那不起作用。它写了一个文件,但我认为它基本上是一个.csv,因为它是相同的文件大小的.csv。
例子: h2o.exportFile(iris_hf, path = "/path/on/h2o/server/filesystem/iris.parquet")
另一方面,如果我要导出 H2OFrame
到hdfs而不是本地存储,是否可以用Parquet格式写入?我至少可以把它移到本地存储。
暂无答案!
目前还没有任何答案,快来回答吧!