我的csv(multiindex columns)看起来像这样:
,,companyName
,,2014_counts
nationalClass,nationalClassTitle,
426,"Food or edible material: processes, compositions, and products",31
424,"Drug, bio-affecting and body treating compositions",25
我尝试使用以下代码以编程方式读取csv文件:
dfs=[]
csv_files = glob.glob(path + "/*.csv")
# read each csv file into a df
for file in csv_files:
dfs.append(pd.read_csv(file, sep=',', header=[0,1,2], index_col=0))
我的输出是:
| 国家级|未命名:1_level_0未命名:1_level_1国家级职称|公司名称2014年_计数未命名:2_level_2|
| --------------|--------------|--------------|
| 四百二十六|食物或可食用材料:processes,compositio...|三十一|
| 四二四|药物、生物作用和身体治疗组合物|二十五|
我的desired输出为:
| 国家级|国家级职称|公司名称2014年_计数|
| --------------|--------------|--------------|
| 四百二十六|食物或可食用材料:processes,compositio...|三十一|
| 四二四|药物、生物作用和身体治疗组合物|二十五|
我不想创建新的MultiIndex并分配给列,如以下答案所示:Mark Empty values in Pandas DataFrame Multi-Row Header
1条答案
按热度按时间taor4pac1#
从输出开始:
下面是使用Pandas rename和get_level_values执行此操作的一种方法:
然后: