我有一个pandas数据框架,如下所示:
| 左|顶部|宽度|高度,高度|文字档| Text |
| --|--|--|--|--| ------------ |
| 十二个|三十四|十二个|三十四|商用的| commercial |
| 九九|四十二|九九|四十二|一般| general |
| 一个|四十七|九个|四个|负债| liability |
| 十个|六十九|三十二|六十七|商用的| commercial |
| 九九|七十二|七十九个|八十八个|可用的| available |
我想根据列值**Text
**提取特定行。因此,我想在Text
列中使用re.search
搜索某些关键词,如liability commercial
,如果得到匹配,则提取行,即第三排和第四排。因此,如果输入是liability commercial
,那么输出应该是提取的以下行:
| 左|顶部|宽度|高度,高度|文字档| Text |
| --|--|--|--|--| ------------ |
| 一个|四十七|九个|四个|负债| liability |
| 十个|六十九|三十二|六十七|商用的| commercial |
请记住,列Text
可能包含重复值。因此,在上面的情况下,有2行存在字commerial
。
提前感谢!
1条答案
按热度按时间gmxoilav1#
用途:
字符串
或者,如果需要按条件更改掩码按匹配行分组,则此处拆分值的位置和可能的重复不计数:
型
如果需要通过拆分值进行精确匹配,则可以修改this solution:
型