我有一个Dataframe,我正在寻找一种方法来找到两列唯一匹配对的最大数量。例如,如果我将Dataframe限制为仅这两列:
| Y| Y |
| --| ------------ |
| 一个| a |
| B| b |
| c型| c |
| d的| d |
| B| b |
| 一个| a |
| c型| c |
| d的| d |
| 电子| e |
| 电子| e |
| c型| c |
结果应该是:
| Y| Y |
| --| ------------ |
| 一个| a |
| c型| c |
| B| b |
| d的| d |
| 电子| e |
因此,如果匹配1&a,则无法再将1用于列X,也无法再将a用于Y。
- 困难的部分是用这个规则匹配最大数量的配对。*
多谢了。
1条答案
按热度按时间3bygqnnd1#
我会在
crosstab
上使用linear_sum_assignment
:字符串
输出量:
型
中间交叉表(
tmp
):型
其他示例
型