我有一个列表如下所示。如何将其转换为数据框架?
a = [["id = abc12", "value1=2.3", "value2=3.4"],["id = abcd4", "value1=4.6", "value2=3.45"],
["id = abr42", "value1=6.2", "value2=6.1"], ["id = abyt5", "value2=1.06"],
["id = abndf1", "value1=3.21", "value2=8.65"],["id = abuz2", "value1=0.9", "value2=6.89"]]
pd.DataFrame(a)
字符串
的数据
但是第3行的输出未正确对齐。我期待3列[id,valu1,value2]和相应的值,如果值不存在,那么列应该为null或na
预期输出:
的
2条答案
按热度按时间f87krz0w1#
您必须将数据转换为
pandas
可以理解的格式之一。例如,它可以是:column_name->whole column contents in a list
column_name->column contents for this row
后者似乎是你最直接的方法。我将把列表中的每个字符串拆分成元组,并将每个列表中的字符串转换成dict。
我还将数字自动转换为浮点数(而不是字符串)。如果
value1
和value2
中的值应该是字符串-删除函数try_cast
及其应用程序。字符串
输出量:
型
uttx8gqw2#
这里有一个方法:
字符串
输出量:
型