我正在加载一个由yelp餐厅评论组成的JSON文件,以便它以这种方式删除Unicode字符:
def parse_yelp_restaurant_api(self, response): jsonresponse = json.loads(response.text, strict=False)
现在我也想删除ASCII HTML字符。我的JSON文件中满是''','" '等。
sg2wtvxw1#
我按照Panagiotis Kanavos的建议,在检索到的字段上使用html.unescape解决了这个问题。response.json()(正如puchal所建议的那样)也使Unicode猜测变得更容易。
html.unescape
response.json()
1条答案
按热度按时间sg2wtvxw1#
我按照Panagiotis Kanavos的建议,在检索到的字段上使用
html.unescape
解决了这个问题。response.json()
(正如puchal所建议的那样)也使Unicode猜测变得更容易。