我有一个很小的问题,但我无法解决。我有一个很长的数据集(在示例1中有4列(A,B,C,D,E)。
我需要创建一个系列(或新列),它是数据集中其他列(示例中的A、B和D)的垂直连接,忽略每列中的nan。结果(A+B+D)是一个列,其中只有存在的值(不包括nan)被连接。
我所有的数值都是float的,我试过用pd.concat等方法,都没有结果。
df['A+B+D'] = pd.concat([df['A'].notna(), df['B'].notna(), df['D'].notna()], ignore_index = True, axis = 1)
我尝试了其他方法和一些教程,但我不能解决这个问题。
1条答案
按热度按时间68de4m5k1#
假设输入DataFrame具有范围索引(如果不是:
df = df.reset_index(drop=True)
),则可以用途:输出:
使用的输入: