我有一个字符串列表
name_list=\['LIONEL MESSI','CRISTIANO RONALD','KYLIAN MBAPPÉ'\]
在csv文件中,有一个名为“long_name”的列有很多球员的名字,值像莱昂内尔安德烈斯·梅西·库西蒂尼、克里斯蒂亚诺·罗纳尔多·多斯·桑托斯阿韦罗、基里安·姆帕普·洛丁和内马尔·达席尔瓦·桑托斯·朱尼尔the csv
如果列包含列表中的字符串,我想过滤该列,即保留列表中的名称,并过滤掉列表中没有的名称,但这些字符串与列不完全匹配,只是部分匹配。
我如何使用这个列表来过滤列?我已经尝试了下面的行,但不工作...
第一个月
我也试过这段代码,但是不能过滤太多df[pd.notna(df['long_name']) & df['long_name'].astype(str).str.contains('|'.join(squad_list))]
2条答案
按热度按时间e5nqia271#
因此,只需执行类似以下操作来创建一个布尔掩码:
要获取df类型df.columns的列。
lokaqttq2#
使用
contains
。它将工作