这里有一个CSV的例子(我无法控制它的生成方式,所以我可以调整它)
PackingListNumber;OrderNumber;ArticleId;Artist;Title;Units;MediaType;Price (EUR);EANCode;InfoLine;ReleaseDate;PoReference;ShippedAt;QuantityShipped;TotalPrice (EUR)
2007100976;12669151;1E8085;="WEATHER REPORT";="MR. GONE -COLOURED-";1;LP;="16,9";="8719262030909";="180GR./INSERT/1500 COPIES ON GOLD & BLACK MARBLED VINYL";16-Jun-2023;="";06-Nov-2023;1;="16,9"
字符串
我正在使用panda和它的read_csv,这是结果:png screenshot当然这不是最佳的,所以我正在寻找一种方法来摆脱 Package =""。任何想法,这可以在read_csv级别上完成吗?
3条答案
按热度按时间nwlqm0z11#
如果您想在
read_csv
级别进行这种“清理”,可以先读取列并准备转换器。字符串
还有另一种解决方案:首先正常读取数组,然后在所有单元格上应用
cleanup
函数。型
ui7jx7zq2#
=""
.任何想法,这可以在read_csv
级别上完成吗?*我不确定你是否可以通过调整 * quot 'args * 来做到这一点,但你可以尝试this regex
separator
:字符串
输出量:
型
对比表:
| [* sep *]|艺术家|标题|价格(EUR)|EANCode| Infoline| PoReference|总价(欧元)|
| - -|- -|- -|- -|- -|- -|- -|- -|
|
;
个|="天气预报"|="消失先生-有色-"|="16,9"|2019 - 10 - 19 00:00:00| ="180 GR./纸/1500份金色和黑色大理石乙烯基"|- -|="16,9"|| regex的|天气报告|消失先生-有色-|16.9| 8719262030909| 180 GR./纸/1500份金色和黑色大理石乙烯基||16.9|
slhcrj9b3#
一行代码:
字符串
测试代码:
型
输出:
型