我有一个Excel文件中的数据集,其结构如下
col1 col2 col3 col4
a1 a2 a3
row2 label 100 200 300
row3 label 300 400 500
我想解析数据,以便创建以下字典:
{'a1': [100, 300], 'a2': [200, 400], 'a3': [300, 500]}
我看过使用csv.writer和pandas。我看不出前者是怎么可能的(我参考了这个thread),所以我尝试了后者如下:
xls = ExcelFile('1.xlsx')
df = xls.parse
dict = df.to_dict()
这是我得到的:
{'Unnamed: 0': {0: 'label', 1: 'label'}, 'a1': {0: 100, 1: 300}, 'a2': {0: 200, 1: 400}, 'a3': {0: 300, 1: 500}}
我可以将嵌套字典更改为列表(或者元组)并删除索引号吗?我想这会让我接近我所追求的。或者,也许我需要一个多步骤的过程。我很感激我可以将数据存储在json中,这样会容易得多,但它经常被手动更新,json在这方面不太合适。
1条答案
按热度按时间dy1byipe1#
假设您的数据以上面提到的格式保存在csv文件中,这将实现您想要的功能:
输出量: