我试图手动创建一个pysaprk数据框。但数据没有插入数据框。代码如下:
from pyspark import SparkContext
from pyspark.sql import SparkSession
sc = SparkContext.getOrCreate()
spark = SparkSession.builder.appName('PySpark DataFrame From RDD').getOrCreate()
column = ["language","users_count"]
data = [("Java", "20000"), ("Python", "100000"), ("Scala", "3000")]
rdd = sc.parallelize(data)
print(type(rdd))
sparkDF = spark.createDataFrame(data, schema=column)
print(sparkDF)
输出:DataFrame[语言:string,users_count:字符串]
数据框应插入数据
2条答案
按热度按时间9vw9lbht1#
你没有打印你创建的数据框。忘记
rdd
吧。l7wslrjt2#
问题在于导入,我们需要导入如下内容: