我有一个json
文件,大约有1,200,000条记录。我想把这个pyspark
文件读为:
spark.read.option("multiline","true").json('file.json')
但它会导致以下错误:
分析异常:无法推断JSON的架构。必须手动指定。
当我在主文件中创建一个记录数较少的json
文件时,此代码可以读取该文件。
当我将encoding
设置为utf-8-sig
时,可以使用pandas
读取此json
文件:
pd.read_json("file.json", encoding = 'utf-8-sig')
我怎样才能解决这个问题?
2条答案
按热度按时间kuarbcqp1#
试试看:
nx7onnlm2#
由于添加编码会有所帮助,因此您可能需要以下代码: