我想在pyspark中将前缀从222..
转换为999..
。应为新列new_id
,并将前缀t更改为999..
s
我将使用此列进行内部合并,b/w 2 pysparl Dataframe
| 身份证|新标识|
| - ------|- ------|
| 小行星222238308750|小行星99999308750|
| 小行星22222579844|小行星99999579844|
| 小行星22225701296|小行星999995|
| 小行星22225|小行星999995|
| 小行星22225|小行星999995|
| 小行星222237274658|小行星99999|
| 小行星2222955099|小行星99999955099|
| 小行星2222955099|小行星99999955099|
| 小行星2222955099|小行星99999955099|
| 小行星2222|九九九九九八八五六七八|
2条答案
按热度按时间kognpnkq1#
你可以用这样的东西来实现它,
输出:
我使用的列名为
value
,您必须将其替换为id
。zwghvu4y2#
您可以尝试以下操作:
id列被拆分为两个临时列,一个具有前缀,另一个具有字符串的其余部分。前缀列的值被替换,并与第二个临时列连接回去。