我有一个数据框,我创建了从合并一列从7个不同的Excel文件。下面是我使用的代码:
import pandas as pd
import glob
my_excel_files = glob.glob(r"C:\Users\.........\*.xlsx")
total_dataframe = pd.DataFrame()
for file in my_excel_files:
new_df = df['Comments']
total_dataframe = pd.concat([total_dataframe, new_df], axis=1) # Puts together all Comments columns
从代码中可以看到,我从每个excel中抓取了“Comments”列,并将它们放在一个新的df中,唯一的问题是我希望能够将文件名添加到列名中,这样我就可以知道哪个列来自哪个excel文件,所有这些列现在都称为“Comments”。因此,理想情况下,其中一个列标题应该是“Comments(first_response.xlsx)”
1条答案
按热度按时间4c8rllxm1#
让我们使用
pathlib
和pd.concat
。使用dict解析,我们可以从pathlib对象中获取
.name
属性,当使用concat
时,文件名将被设置为索引:这将创建一个文件名为的索引,如果你想把它作为一列,你可以
reset_index
。