如何根据gz csv文件的数据字段高效地拆分它

qcbq4gxm  于 2021-06-26  发布在  Hive
关注(0)|答案(0)|浏览(208)

我有一个非常大的gzip csv文件。我想根据特定列中的字符串模式将其拆分为两个gz文件。我知道可以在内容中循环并创建两个文件,但是在效率方面,有没有更好的python方法呢?
另外,原始文件有一个行标题。我想要么在两个结果文件中都有头文件,要么一起删除头文件。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题