所以我有一个丑陋的CSV文件,只有一列和两行,但它有很多元组,看起来像:| 色谱柱A|| --------------|| (一、二、三)(四、五、六)(七、八、九)|| (3,2,1)(5,3,6)(9,8,7)|我想让它看起来| 色谱柱A|B栏|色谱柱C|| --------------|--------------|--------------|| 1个|二|三|| 四|五|六|| 七|八|九|| 三|二|1个|| 五|三|六|| 九|八|七|有什么建议吗?
vuv7lop31#
既然有data-science标记,为什么不使用pandas呢?
#pip install pandas import pandas as pd df = (pd.read_csv("input.csv", sep="|").squeeze() .str.strip("()").str.split("\)\(", expand=True) .melt(ignore_index=False)["value"].str.split(",\s*", expand=True) .sort_index().set_axis(["Column A", "Column B", "Column C"], axis=1) )
输出:
print(df) Column A Column B Column C 0 1 2 3 0 4 5 6 0 7 8 9 1 3 2 1 1 5 3 6 1 9 8 7
1条答案
按热度按时间vuv7lop31#
既然有data-science标记,为什么不使用pandas呢?
输出: