我有一个df,看起来像这样:
| 识别号|时间|姓名|大小|售出|股票|
| - ------|- ------|- ------|- ------|- ------|- ------|
| 1个|0500|单位|十二|南姓|南姓|
| 1个|0500|南姓|南姓|1个|南姓|
| 1个|0500|南姓|南姓|南姓|第二章|
| 第二章|0500|单元2|十个|南姓|南姓|
| 第二章|0500|南姓|南姓|南姓|三个|
| 第二章|0500|南姓|南姓|1个|南姓|
它比这个长得多,但它来自三个连接在一起的 Dataframe (我无法控制,我只能访问这个 Dataframe )。我如何基于ID和Time等公共值合并行以获得此结果:
| 识别号|时间|姓名|大小|售出|股票|
| - ------|- ------|- ------|- ------|- ------|- ------|
| 1个|0500|单位|十二|1个|第二章|
| 第二章|0500|单元2|十个|1个|三个|
这看起来应该很容易,但是我被难住了。我试过df.groupby(['ID', 'Time'])
,但是它只给了我对象的名称/类型?
1条答案
按热度按时间bwntbbo31#
您可以使用
fill
、bfill
的组合来填充空值,然后使用drop_duplicates
:请注意,如果
NaN
不是实际缺失值,则此操作无效。