pandas 如何通过减去另一个电子表格的重复创建新的excel电子表格

fkaflof6  于 2022-12-16  发布在  其他
关注(0)|答案(1)|浏览(186)

我有两个excel电子表格。Test1和Test2。Test1有用户1、用户2、用户3等。Test2有用户1、用户2和用户5。我想从Test1中删除用户1、用户2和用户5。
这是一个例子。长话短说。我有两个提取数据的excel电子表格。一个是自动生成的,另一个是我创建的。我想从创建的电子表格中删除用户,并创建一个新的电子表格,在删除Test2中列出的用户后,只显示Test1中的用户。
我正在使用python和panda,还没有找到解决这个问题的方法。
到目前为止,我已经尝试过在Python和Panda上做研究,我最初的解决方案是每周手动删除用户来创建一个新的电子表格。

disho6za

disho6za1#

如果我没理解错的话?

import pandas as pd

path = "/path/to/files/"
test1 = pd.read_excel(f"{path}Test1.xlsx")
users2 = pd.read_excel(f"{path}Test2.xlsx").users.unique()

users1 = test1.users.unique()
user_intersection = set(users1).intersection(users2)

test1.query("~users.isin(@user_intersection)").reset_index(drop=True).to_excel(f"{path}/Test3.xlsx", index=False)

相关问题