我有一个包含两列(日期和名称)的数据框。我想搜索一个特定的名称,并获得该名称出现的不同日期。然后,我只想保留包含这些日期的行。这是我的数据:
| 会议日期|姓名|
| - ------| - ------|
| 一七四六年六月二日|国王(#p32)|
| 一七四六年六月二日|莫佩屠斯(#p4)|
| 一七四六年六月二日|约旦(#p31)|
| 一七四六年六月九日|莫佩屠斯(#p4)|
| 一七四六年六月九日|伏尔泰(#p37)|
| 一七四六年六月九日|德拉康达明(#p38)|
| 一七四六年六月九日|Sässmilch(编号p16)|
| 一七四六年六月九日|国王(#p32)|
| 一七四六年六月九日|福美(#p27)|
| 一七四六年六月十六日|Margraf(编号p20)|
| 一七四六年六月二十三日|多纳(#p39)|
| 一七四六年六月二十三日|欧拉(#p10)|
我使用了以下代码来查找我的名字的所有匹配项:
df["Name"].value_counts()["Sa Majesté (#p32)"]
我知道用什么来存储相应的日期,但我不确定如何存储。一旦我有了这些日期,我计划存储这些值,并过滤我的原始 Dataframe ,只保留那些具有这些日期的行。
我真的很感激任何帮助/指点。
3条答案
按热度按时间uklbhaso1#
IIUC,这就是你要找的吗?一个取名字并返回过滤数据集的函数?
或
x一个一个一个一个x一个一个二个x
或
如果你只需要一张日期表
一个三个三个一个
hjzp0vay2#
您可以筛选字符串值,然后获取Meeting Dates列的唯一值。
如果你想对所有的名字都这样做,那么你可以使用
groupby
并得到唯一的日期:izkcnapc3#
我提供的解决方案不是基于你的特定数据集,但是对你的问题是有效的。我希望你能看到逻辑并在你自己的用例中实现。
| 身份证|姓名|
| - ------|- ------|
| 1个|......|
| 第二章|......|
| 三个|......|
根据这个通用数据集,我们试图找到
columns name "name"
..下具有certain value
的所有rows
,然后我们获取这些行的id,然后找到具有这些值的所有行。