- 此问题在此处已有答案**:
Customizing the separator in pandas read_csv(4个答案)
How to set a custom separator in pandas to_csv()?(6个答案)
Python pandas read_csv with custom separator(1个答案)
2天前关闭。
我尝试导入一个CSV文件使用Pandas,这通常不是一个问题,但现在这个文件不是用逗号分隔,而是每个字段在不同的列中,看起来像:
2020-01-01;2020-01-01 00:00:00.0;2020-01-01 00:05:00.0;SE3;1205.864
2020-01-01;2020-01-01 00:05:00.0;2020-01-01 00:10:00.0;SE3;1211.574
2020-01-01;2020-01-01 00:10:00.0;2020-01-01 00:15:00.0;SE3;1217.963
2020-01-01;2020-01-01 00:15:00.0;2020-01-01 00:20:00.0;SE3;1224.422
我第一次尝试这种方法
df = pd.read_csv(r'C:\Users\simon\Desktop\Vindkraftsprognos∩2020 elområde 5 min.csv')
它可以创建DataFrame,但所有数据都在单个列中。
我还尝试将文件的扩展名更改为"xlsx",并使用以下代码:
svk_df = pd.read_excel(r"C:\Users\simon\Desktop\Vindkraftsprognos∩2020 elområde 5 min.xlsx")
这给我一个错误ValueError: Worksheet index 0 is invalid, 0 worksheets found
。
任何帮助如何解决这个问题将不胜感激。谢谢。
编辑:将图片改为文本。还尝试了答案中的解决方案:
result = pd.read_csv(r'C:\Users\simon\Desktop\Vindkraftsprognos∩2020 elområde 5 min.csv', sep='\s+',header=None)
这给了我三列,excel文件中有五列。
0 1 2
0 2020-01-01;2020-01-01 00:00:00.0;2020-01-01 00:05:00.0;SE3;1205.864
1 2020-01-01;2020-01-01 00:05:00.0;2020-01-01 00:10:00.0;SE3;1211.574
2 2020-01-01;2020-01-01 00:10:00.0;2020-01-01 00:15:00.0;SE3;1217.963
3 2020-01-01;2020-01-01 00:15:00.0;2020-01-01 00:20:00.0;SE3;1224.422
4 2020-01-01;2020-01-01 00:20:00.0;2020-01-01 00:25:00.0;SE3;1230.81
1条答案
按热度按时间wqsoz72f1#
这应该工作正常。你可以尝试改变
sep="|"
也作为评论。注意:最好使用相对路径与Pandas考虑把数据集在同一文件夹中的脚本。