我正尝试在name_data
Dataframe 中存在的code
列值上连接两个 Dataframe ,如下所示。
我有两个如下所示的 Dataframe ,我希望得到一个结果 Dataframe ,它只包含来自'team_data dataframe where the corresponding
code value column is present in the
name_data' Dataframe 的行。
我在数据库上使用考拉来完成这个任务,我有下面的代码使用连接操作。
import databricks.koalas as ks
name_data= ks.DataFrame({'code':['123a', '345b', '678c'],
'id':[1, 2, 3]})
team_data = ks.DataFrame({'code':['123a', '23s', '34a'],
'id':[1, 2, 3]})
team_data_filtered = team_data.join(name_data.set_index('code'), on='code')
display(team_data_filtered)
在team_data_filtered
中,预期输出将仅显示以下内容。
Code id
'123a' 1
但是我的代码抛出一个错误,指出columns overlap but no suffix specified: ['id']
。
有人可以帮助解决此问题吗?
2条答案
按热度按时间eqqqjvef1#
尝试添加后缀参数:
如果需要,然后清洗色谱柱:
kiayqfof2#
输出: