我试图使一个程序,可以同时读取多个CSV文件,并添加一个sertain时间框架内的sertain值在一起,但CSV文件越来越与分离器生成;
df = pd.read_csv(file_path, sep=";", index_col=0)
# Find the colsest column to the target column
closest_column = find_closest_column(df, target_column)
if closest_column:
# Assumin 'Recipe' and the closeset column are in the correct format, proceed with grouping
# grouped_df = df.groupby("Recipe")[closest_column].sum().reset_index()
print(f"\nFile: {file_path}, Closest Column: {closest_column}\n")
else:
print(f"\nColumn similar to '{target_column}' not found in the DataFram for file: {file_path}\n")
字符串
做的方式文件已经作出,我已经改变了他们有分隔符是一个逗号,出两个文件,它看到的列,但只得到一个值,有逗号的矛头
File: C:\Users\nw\Documents\Mini projects\CSV\test\656062f4cd3a83000200000a.csv, Closest Column: Total volume[m3],"0.1"
File: C:\Users\nw\Documents\Mini projects\CSV\test\99-Card.csv, Closest Column: Total volume[m�]
型
我怎样才能让这个函数也得到与列关联的值呢?
我已经查阅了pandas文档,可以将sep/sep设置为什么,但它没有改变任何东西。
1条答案
按热度按时间0s0u357o1#
发现问题是引号
字符串
在这里,它是sep=";”,在此之前没有使它正确工作,并与它改为sep ='“;'它的工作,因为它是为了