我有一个包含12个元素的列表列表,包含10个项目。我想获得一个12列和10行的dataframe。pd.DataFrame()将12个逗号分隔的项视为一列。撇号是列表的一部分,用于指示字符串,但我怀疑它被DataFrame函数解释为列边界。它们是不可替代的。如何做到这一点?是什么导致了这种行为?以下是示例数据:
[['1,er,2,Fado de Padd,1\'18"1,H,6,2600,J. Dekker,17 490 €,A. De Wrede,1,6'],
['2,e,7,Elixir Normand,1\'18"2,H,7,2600,S. Schoonhoven,24 755 €,S. Schoonhoven,14'],
['3,e,3,Give You All of Me,1\'18"2,H,5,2600,JF. Van Dooyeweerd,17 600 €,JF. Van Dooyeweerd,10'],
['4,e,4,Gouritch,1\'18"3,H,5,2600,BJ. Crebas,20 700 €,BJ. Crebas,32'],
['5,e,1,Franky du Cap Vert,1\'18"4,H,6,2600,JH. Mieras,15 536 €,N. De Vreede,65'],
['6,e,10,Défi Magik,1\'18"0,H,8,2620,F. Verkaik,44 865 €,AW. Bosscha,6,3'],
['7,e,9,Fleuron,1\'18"2,H,6,2620,M. Brouwer,44 830 €,D. Brouwer,7,3'],
['8,e,8,Dream Gibus,1\'18"6,H,8,2620,R. Ebbinge,33 330 €,Mme A. Lehmann,36'],
['9,e,5,Beau Gaillard,1\'19"5,H,10,2600,A. Bakker,20 140 €,N. De Vreede,44'],
['0,DAI,6,Bikini de Larcy,H,10,2600,D. Den Dubbelden,21 834 €,N. Rip,52']]
任何帮助欢迎。
2条答案
按热度按时间ehxuflar1#
撇号意味着数据在列表中是字符串类型,但可以使用
my_list[0]
作为第一个元素提取。在放入数据框之前,需要使用列表解析来处理每个列表。在最后一行数据中似乎有一些错别字(缺少坐标),所以我通过添加“null”来纠正它。
输出量
第二种方法,输出相同:
第三种方法,输出类似:
但是,请注意,first方法(列表解析)仍然是最高效的!
yhxst69z2#
如果只使用
split
,它工作得很好,但最后一行不匹配,所以4
列的所有值都被移位: