我有一个Pandas数据框,看起来像这样:|ID|值|| ------------ | ------------ ||00001|值1||00001|值2||00002|值3||00003 |值4||00004|值5||00004|值6|我想做的是删除它,这样我就可以这样做了:|ID|值|| ------------ | ------------ ||00001|值1||00002|值3||00003 |值4||00004|值5|实现这一目标的最佳方式是什么?
inkz8wg91#
根据我的理解,您希望仅使用第一行作为条件删除重复项,可以使用以下代码
df.drop_duplicates(subset=["ID"], keep='first')
wbgh16ku2#
假设ID只是列而不是索引
ID
df.drop_duplicates('ID', inplace=True)
oxf4rvwz3#
df.drop_duplicates(subset='id', keep="first")
3条答案
按热度按时间inkz8wg91#
根据我的理解,您希望仅使用第一行作为条件删除重复项,可以使用以下代码
wbgh16ku2#
假设
ID
只是列而不是索引oxf4rvwz3#
df.drop_duplicates(subset='id', keep="first")