我一直在尝试尽可能优化一个数据操作,它需要两个部分。我正在使用一个pandas列,其中每个值都是一个不同长度或NaN值的列表,我想提取这些值,并根据它们在列表中的位置将它们放在列中。
以下是一个可复制的示例,以及我目前为止所编码的内容:
df = pd.DataFrame({'first_name': ['Charles', 'Charles2', 'Charles3'],
'last_name': ['George', 'George2', 'George3'],
'banking_number': [['NaN'], ['UK421'], ['UK123', 'FR789']]}
)
个字符
你怎么会得到这样的结果?
df_final = pd.DataFrame({'first_name': ['Charles', 'Charles2', 'Charles3'],
'last_name': ['George', 'George2', 'George3'],
'banking_number': [['NaN'], ['UK421'], ['UK123', 'FR789']],
'bank_1': ['NaN', 'UK', 'UK'],
'bank_2': ['NaN', 'NaN', 'FR']}
)
型
谢谢你的时间和帮助
2条答案
按热度按时间7eumitmz1#
你可以试试这个:
字符串
输出:x1c 0d1x
编辑
在@itprorh86备注之后,下面是一个更新的版本,可以处理不同数量的银行。
型
dw1jzc5e2#
这里有一个与@JulietteB建议的方法略有不同的方法。
字符串
这种方法将提供相同的答案,但具有处理不同数目银行的优点
给定输入数据,执行
parseDF(df)
将产生:型