我有一个这样的字符串,每行之间用\n分隔。
我试过多种方法,但找不到合适的方法。
列名称\n第一行\n第二行,例如
"Name,ID,Number\n abc,1,123 \n xyz,2,456"
I want to convert it into pyspark dataframe like this
Name ID Number
abc 1 123
xyz 2 456
我有一个这样的字符串,每行之间用\n分隔。
我试过多种方法,但找不到合适的方法。
列名称\n第一行\n第二行,例如
"Name,ID,Number\n abc,1,123 \n xyz,2,456"
I want to convert it into pyspark dataframe like this
Name ID Number
abc 1 123
xyz 2 456
2条答案
按热度按时间xqk2d5yq1#
你可以试试这个
1sbrub3j2#
我假设你试图从一个文本创建。如果是这样的话,有很多方法可以从pyspark-createdataframe()中的列表创建Dataframe,然后使用df()和parallelize。在python中,有许多方法可以将字符串拆分为列表。所以把这两者结合起来应该会得到你想要的结果。请研究它们。一种可能的方法如下: