我有一个字符串的形式:我需要得到一个['abc','def']
形式的数组
我使用以下代码:schema = StructType([StructField('text_str', StringType(), True)]) dsdf.withColumn('text', from_json(col('text'), schema)).show(truncate=False)
它返回['abc']
。如何获得我真正需要的内容?
我有一个字符串的形式:我需要得到一个['abc','def']
形式的数组
我使用以下代码:schema = StructType([StructField('text_str', StringType(), True)]) dsdf.withColumn('text', from_json(col('text'), schema)).show(truncate=False)
它返回['abc']
。如何获得我真正需要的内容?
1条答案
按热度按时间yeotifhr1#
我使用expr生成一个sql字符串来运行
transform
,这对spark的版本具有最广泛的兼容性,但是transform
可以在最新版本的pyspark中本地运行。split
将生成一个数组,该数组基于您可以通过','拆分它们的假设transform
将对数组中的每一项进行操作如您所知,
from_json
解析json。