这个问题已经有答案了:
What is the fastest way to parse large XML docs in Python?(8个回答)
Large XML File Parsing in Python(2个答案)
28天前关闭
我从https://archive.org/details/stackexchange下载了stackoverflow帖子的存档数据。
然而,在扩展7z文件后,我有一个103GB的xml文件。
我试着用python加载它,但服务器失败了。
如何将这么大的文件加载到python中来分析数据?
我尝试了以下链接的代码:how to convert xml file to csv using python script
XML to CSV Python
但是python在打开xml文件的步骤上停了下来。
1条答案
按热度按时间liwlm1x91#
是的,这是一个挑战,我也遇到了同样的问题,
而不是完全在RAM中加载文件。你可以流文件。对于XML文件流,你可以使用python的
ElementTree.
字符串