我有一个 Dataframe ,其中包含许多列,格式如下:
| 身份证|列1_df1|列2_df1|第3列_df1|列1_df2|列2_df2|第3列_df2|
| - ------|- ------|- ------|- ------|- ------|- ------|- ------|
| A1|努姆|努姆|努姆|努姆|努姆|努姆|
| A2|努姆|努姆|努姆|努姆|努姆|努姆|
| A3|努姆|努姆|努姆|努姆|努姆|努姆|
| A4|努姆|努姆|努姆|努姆|努姆|努姆|
| A5|努姆|努姆|努姆|努姆|努姆|努姆|
我需要比较前缀前具有相同名称的列。也就是说,我需要比较col1_df1
与col1_df2
,col2_df1
与col2_df2
,依此类推。我需要检查每个"重复"列(每个col1、每个col2,依此类推)中的相等百分比。我无法手动执行此操作,因为列太多。
有没有办法使用Pandas功能来实现这一点?
谢谢!
3条答案
按热度按时间aelbi1ox1#
得到类似于(对于某些随机数据)
rwqw0loc2#
既然已经有了一些合理的答案,我将进行猜测,并给予一个略有不同的答案,以防万一它是有用的。
根据您的列名,您似乎是从两个 Dataframe 中获取此 Dataframe 的,这两个 Dataframe 都具有如下列:
col1
、col2
等。如果是这种情况,我会后退一步,这样做:要获得以上百分比,您可以执行以下操作:
czq61nw13#
例如,假设我们有以下 Dataframe :
可视化:
与使用以下脚本进行比较:
那么
r
就是:在
r
中,0表示相等。在名为
diff1
的r
列(比较col1_df1
和col1_df2
)中,我们得到perc为0,如下所示:完整的建议脚本: