我有两个变量( Dataframe ),一个是47列宽,另一个是87列宽,它们是DF2和DF2。然后我有一个名为full_data的变量( Dataframe )。Df1和DF2是两个不同的数据子集,我希望在发现2行相等时合并在一起。
到目前为止,除了将正确的值附加到新的 Dataframe 之外,我正在做我想做的一切。
下面是我一直在玩的代码行:
full_data = full_data.append(pd.concat([df1[i:i+1].copy(),df2[j:j+1]].copy(), axis=1), ignore_index = True)
一旦我发现Df1和DF2中的行相等,我就尝试读取这两行,并将它们作为一行依次放入变量full_data中。
我想要的是full_data.append(Df1 DF2),现在我得到的是
full_data(i)=DF1
full_data(i+1)=DF2
任何帮助都将不胜感激。EM
full_data = full_data.append(pd.concat([df1[i:i+1].copy(),df2[j:j+1]].copy(), axis=1), ignore_index = True)
1条答案
按热度按时间quhf5bfb1#
最后我解决了我的问题。可能我还不够清楚,但我的问题,但发生了什么,当串联是我得到重复或多行时,预期的结果是得到一个单行串联。
发现问题出在索引上。由于Pandas的工作方式,索引不得不重新设置。
我在这里找到了例子和解释-〉[https://towardsdatascience.com/how-to-combined-data-in-panda-5-functions-you-should-know-651 ac 71 a94 d 6][1]
我的解决方案是:
如果您有一个完整的数据,请使用以下命令:
我首先创建了变量的副本,然后重置了索引。