我有一个pyspark dataframe看起来像下面:
serial_number
000001234
000002887
00008765
0745-218
01-7865
040/7868L
0000124
00002364
01231325246
068775H
我只想提取以前缀0开头的记录(开头是一个0),并且是而不仅仅是数字的记录。也就是说,它应该只包含字母和/或特殊字符。
serial_number
0745-218
01-7865
040/7868L
068775H
我尝试使用一些regex表达式,如^0[^0]
,但它也接受全数字输入。
3条答案
按热度按时间rpppsulh1#
使用下面的rlike.代码
ajsxfq5m2#
按照何阮的回答:
不需要
^
,因为match
从字符串的开头匹配。\d
实际上是0-9
的语法糖gwbalxhn3#