使用Python Pandas组合格式均为dd/mm/yyyy的两个日期列

jv2fixgn  于 2023-03-21  发布在  Python
关注(0)|答案(1)|浏览(105)

我有一个df,其中包含两个合并的df,每个都包含一个日期列,格式为dd/mm/yyyy(不是日期时间格式)。
我想在新的df中把它们放在一个日期列中,记住有时一个df有一个日期,而另一个没有,所以在df中会出现NaN。
我如何制作这一列并将所有这些日期合并到一个列表中?
我不知道使用什么代码将这些列组合成一个,希望有人会知道如何!

zzlelutf

zzlelutf1#

基于我对你的问题的理解。你需要用一个字段的值来填充另一个字段的缺失值,并将它们转换成一个日期时间对象。这就是我想出来的。

import numpy as np

# Dummy data
data = {
    'date_a': ["21/12/2023", np.nan, "22/12/2023", "23/12/2023"],
    'date_b': [np.nan, "24/12/2023", np.nan, np.nan]
}

df = pd.DataFrame(data)

df['date_merged'] = df['date_a'].combine_first(df['date_b'])

pd.to_datetime(df['date_merged'], format="%d/%m/%Y")

相关问题