我有一个包含三列的excel文件,如下所示,
| 识别号|姓名|日期|
| - ------|- ------|- ------|
| 小行星|GG道布林根|2019年4月8日|
| 小行星|曼海因姆|2020年6月16日|
| 小行星|曼海姆·斯特里特科夫|2020年7月24日|
| 小行星|施陶芬贝格|2020年8月15日|
| 小行星|施蒂尔肯|二○二一年三月五日|
| 小行星|施图尔肯(FTTH)|二〇二一年九月十三日|
| 1234|莱尔贝克|2019年4月18日|
| 1234|巴德奥耶豪森|二〇二〇年六月二十六日|
| 1234|维尔公园|2020年7月14日|
| 1234|维尔公园(FTTH)|2020年8月25日|
| 1234|维尔公园(FTTH)|二〇二一年三月十五日|
| 小行星1234|巴特奥耶豪森|二〇二一年九月二十三日|
是否可以过滤掉名称以开头的ID**(FTTH)并且名称结尾不带(FTHH),例如,第一个ID 1136的名称不是以开头(FTTH),但结尾为(FTTH),但我想过滤掉不以(FTTH)开头也不以(FTTH)结尾的ID,如ID 1234**,是否可以使用python??过滤?
希望结果是这样的,
| 识别号|
| - ------|
| 1234|
2条答案
按热度按时间mpbci0fu1#
您可以先聚合
GroupBy.first
GroupBy.last
,然后筛选Series.str.startswith
和Series.str.endswith
的索引:如果需要列表中的值:
如果需要数据框:
如果需要不带
(FTTH)
的first
以及带(FTTH)
的last
,请用途:zpgglvta2#
输出: