如何将Dataframe中的列转换为字符串？

sd2nnvve 于 2021-05-16 发布在 Spark

关注(0)|答案(1)|浏览(884)

我使用了转换为json的api，用pandas规范化，用pyspark转换为dataframe。
但我不能更改列，也不能更改窗体或任何内容，我不能选择它们。
我不知道我哪里出错了！

import requests
import json
import pandas as pd  
import pyspark.sql.functions as F
import os
from pyspark.sql.types import DoubleType
from pyspark.sql import types

base_url = "https://api.talkwalker.com/api/v1/search/results"
token = "demo"
search = "cats"

url = base_url + "?access_token=" + token + "&q=" + search + "&pretty=true&hpp=1"

response = requests.get(url)

# print(response.text)

js = response.json()

df1 = pd.json_normalize(js['result_content'],['data'])

pdf = pd.DataFrame(df1)

df = spark.createDataFrame(pdf)

display(df.select('data.url'))

问题在选择中。

python DataFrame apache-spark pyspark apache-spark-sql

来源：https://stackoverflow.com/questions/65242168/how-to-convert-columns-from-a-dataframe-to-string