下面的代码说明 Dataframe Df3
单元格是否与数组dataframe_arrays
中的另一个 Dataframe 单元格具有相同的值。但是,我想打印dataframe_arrays
中与Df3
具有相同值的单元格值和特定 Dataframe 。以下是我尝试的内容-
import pandas as pd
dataframe_arrays = []
Df1 = pd.DataFrame({'IDs': ['Marc', 'Jake', 'Sam', 'Brad']})
dataframe_arrays.append(Df1)
Df2 = pd.DataFrame({'IDs': ['TIm', 'Tom', 'harry', 'joe', 'bill']})
dataframe_arrays.append(Df2)
Df3 = pd.DataFrame({'IDs': ['kob', 'ham', 'konard', 'jupyter', 'Marc']})
repeat = False
for i in dataframe_arrays:
repeat = Df3.IDs.isin(i.IDs).any()
if repeat:
print("i = ", i)
break
我的目标是将当前 Dataframe 列与属于另一组 Dataframe 的列进行比较,并确定哪些值是重复的。
1条答案
按热度按时间wtlkbnrh1#
如果你的数据不是那么大,你可以简单地使用嵌套的
loop
和.iterrows()
来一行一行地遍历 Dataframe ,也可以使用globals()
来获取包含重复数据的 Dataframe 的变量名。输出: