假设我们有dfA:
| 识别号|分数|
| - ------|- ------|
| A类|二十个|
| A类|四十|
| A类|六十|
| B|十个|
| B|九十|
和dfB:
| 识别号|分数|
| - ------|- ------|
| A类|六十|
| B|九十|
预期输出:
| 识别号|分数|
| - ------|- ------|
| A类|六十|
| A类|六十|
| A类|六十|
| B|九十|
| B|九十|
如何根据PySpark中的匹配ID用dfB的分数更新dfA中的分数列?
1条答案
按热度按时间anauzrmj1#
您的数据框
1.在连接之前,将
Scores
列名从 df_1 重命名为old_scores
。1.使用内部联接来匹配使用公共键列的两个DataFrame。
1.从
df_1
删除old_scores
列输出: