我找了几个小时的答案,但就是找不到。我必须要有非常大的数据集,我正试图把它们合并组合成一个。我的问题是,所有的答案,我得到了一个更大的数据集。
第一个数据集包含120000行,第二个数据集包含370000行。它们都具有相同的列ID,但较大的数据集只具有较小数据集的一定数量的ID。最终产品应如本例所示
id name country
1 John USA
2 Mary Portugal
3 Jeff Spain
4 Fred USA
字符串
第二个数据集:
id time
1 12:00
2 11:12
2 06:34
2 07:21
4 15:34
4 18:45
型
最终 Dataframe :
id name country time
1 John USA 12:00
2 Mary Portugal 11:12
2 Mary Portugal 06:34
2 Mary Portugal 07:21
4 Fred USA 15:34
4 Fred USA 18:45
型
还有一个好处是,知道为什么我会得到更多的行,然后预先与合并(所有=)
提前感谢您
1条答案
按热度按时间yebdmbv41#
如果第一个表具有唯一的id,那么您可以
字符串
如果两个表都有不唯一的id,你将自动得到复制。