加载JSON时替换ASCII HTML字符

8qgya5xd  于 2023-10-21  发布在  其他
关注(0)|答案(1)|浏览(104)

我正在加载一个由yelp餐厅评论组成的JSON文件,以便它以这种方式删除Unicode字符:

def parse_yelp_restaurant_api(self, response):

        jsonresponse = json.loads(response.text, strict=False)

现在我也想删除ASCII HTML字符。我的JSON文件中满是'&#39','&#34 '等。

sg2wtvxw

sg2wtvxw1#

我按照Panagiotis Kanavos的建议,在检索到的字段上使用html.unescape解决了这个问题。
response.json()(正如puchal所建议的那样)也使Unicode猜测变得更容易。

相关问题