如何将成对rdd保存到json文件?

fiei3ece  于 2021-05-29  发布在  Spark
关注(0)|答案(1)|浏览(816)

我的rdd是这样的:

[('f1',1), ('f2',2)]

如何将其保存到json文件?

q9rjltbz

q9rjltbz1#

您可以将rdd转换为dataframe并写入json

from pyspark.sql import SparkSession

    spark = SparkSession.builder \
        .appName('SO')\
        .getOrCreate()

    sc= spark.sparkContext

    df = sc.parallelize(
        [('f1', 1), ('f2', 2)]).toDF(["key", "value"])

    df.write.format('json').save('output_path')

json文件中的输出如下所示

{"key":"f1","value":1}
 {"key":"f2","value":2}

相关问题