在spark scala中从string / varchar中删除前导零

0md85ypi  于 2023-04-06  发布在  Scala
关注(0)|答案(1)|浏览(158)

我有一个变量(23字节varchar),它的值带有前导零(例如:0000000036754678)。如何从这个变量中删除前导零。

u2nhd7ah

u2nhd7ah1#

您可以使用regexp_replace内置spark函数,如下所示,前提是您已经将数据加载到名为dataframe的 Dataframe 中,并且包含您的值的列名为value

import org.apache.spark.sql.functions.{col, regexp_replace}

dataframe.withColumn("value", regexp_replace(col("value"), "^0*", ""))

如果您有以下dataframe作为输入:

+----------------+
|value           |
+----------------+
|0000000036754678|
+----------------+

你会得到以下结果:

+--------+
|value   |
+--------+
|36754678|
+--------+

相关问题