我正在尝试用Pandas把一个HTML表转换成字典。我正在用漂亮的汤提取HTML,并在tables变量中显示。
这是DataFrame的外观:
Date Value
0 2019 31
1 2018 11
2 2017 11
3 2016 10
4 2015 99
5 2014 98
"这就是我所做的"
df = pd.read_html(str(tables), flavor='lxml')[0]
final = df.to_dict(orient='index')
return final
"这就是我的结果"
"0": {
"Date": "2019",
"Value": "31"
},
"1": {
"Date": "2018",
"Value": "11"
},
"2": {
"Date": "2017",
"Value": "11"
},
"3": {
"Date": "2016",
"Value": "10"
},
"4": {
"Date": "2015",
"Value": "99"
},
"5": {
"Date": "2014",
"Value": "98"
}
}
我正在查找类似以下的输出:
"Values" : [
{ "Date": "2019",
"value" : "31"
},
{ "Date": "2018",
"value" : "11"
},
{ "Date": "2017",
"value" : "11"
},
{ "Date": "2016",
"value" : "10"
},
{ "Date": "2015",
"value" : "99"
},
{ "Date": "2014",
"value" : "98"
}
]
2条答案
按热度按时间fkaflof61#
取代:
执行:
mfuanj7w2#
上面的答案是有效的,但我认为有一个意外的错误。因此,应该是
df.to_dict(orient='record')