我尝试从HTTP请求加载信息并将其存储为JSON文件:下面是我如何加载数据:
try:
response = requests.get(url)
except requests.exceptions.ConnectionError as e:
print("ConnectionError:", e)
try:
data = json.loads(response.text)
except JSONDecodeError:
if "Bad Gateway" in response.text:
print("Bad Gateway, sleeping.")
else:
print("JSONDecodeError, data not loaded")
if data and data["response"]["status"] == 200:
for m in data["messages"]:
record = {}
record["id"] = m["id"]
record["text"] = m["body"]
tweets.append(record)
tweets是一个字典列表,包含了我从HTTP请求中获得的所有信息。然后,我将字典列表保存为一个JSON文件,如下所示:
fileName = "stuff/{}/{}.json".format(symbol, Id)
with open(fileName, "w",encoding="utf-8") as f:
json.dump(tweets, f,ensure_ascii=False)
我尝试将JSON作为 Dataframe 加载,如下所示:
一个二个一个一个
JSON文件中的文本如下所示:
"我觉得很糟糕,周四开盘时没有兑现145个看跌期权"
当我检查我的 Dataframe (df. head())时,文本如下所示:
"一百四十五"𝑖𝑓𝑒𝑙𝑡𝑎𝑤𝑓𝑢𝑙𝑡𝑜𝑛𝑜𝑡𝑐𝑎𝑠ℎ𝑜𝑢𝑡𝑡ℎ𝑒145𝑝𝑢𝑡𝑠𝑜𝑛𝑇ℎ𝑢𝑟𝑠𝑑𝑎𝑦𝑜𝑝𝑒𝑛"
我正在使用jupyter笔记本查看数据
我试着将 Dataframe 转换为Numpy数组(a = df ["text"]. values),当我打印出文本时,它看起来很好。
我想问的是:
有人能解释一下为什么会这样吗?是我的数据有问题还是df. head()只是以一种奇怪的风格打印出一些数据?
1条答案
按热度按时间wwwo4jvm1#
早上好,朋友,如果你收到了请求并将其添加到字典中,那么就可以了。按照下面的步骤,因为你使用panda来读取文件,所以在保存之前使用panda来保存为json,“.to_json()",用你想要的方向,你这段代码里,你用orient=“records”,用它来保存,你避免了用import json,你只用了Pandas阅读函数,你可以避免不兼容,如果它不能解决这个问题,有一种方法可以发送完整的代码,而不需要看到导入,这会变得很复杂。