Apache Spark 如何将秒添加到另一个变量/ Dataframe 中的时间戳值

xghobddn 于 2022-11-30 发布在 Apache

关注(0)|答案(2)|浏览(166)

lv_seconds_back = mv_time_horizon.select(col("max(time_horizon)") * 60).show() 
mv_now          =spark.sql("select from_unixtime(unix_timestamp()) as mv_now")
local_date_time  =mv_now.select(date_format('mv_now', 'HH:mm:ss').alias("local_date_time"))
lv_start         =local_date_time.select(col("local_date_time") - expr("INTERVAL $lv_seconds_back seconds"))

如何减去lv start变量中的秒数
我尝试使用expr(interval seconds)，但它不接受变量，而是接受数字。
另外，如果我需要在查询中添加lv_start，该如何操作

mt_cache_fauf_r_2= spark.sql("select mt_cache_fauf_r_temp from mt_cache_fauf_r_temp where RM_ZEITPUNKT>= ${lv_start} & RM_ZEITPUNKT <=  ${lv_end}")

这个不行

apache-spark

来源：https://stackoverflow.com/questions/74613675/how-to-add-a-seconds-to-a-timestamp-value-which-is-in-your-another-variable-data

2条答案

按热度按时间

w7t8yxp51#

也许您应该删除.show()，以便在lv_seconds_back变量中捕获列。

赞(0）回复(0）举报 2022-11-30

7cwmlq892#

你的第一句话有两个问题。第一个：col("max(time_horizon)")无法工作，因为col函数需要列名。请执行expr("max(time_horizon)")或max(col("time_horizon"))。然后，show函数将显示部分 Dataframe ，但不返回任何内容。因此，将show的结果赋给变量没有意义。
如果删除show并使用col调用，则结果是一个 Dataframe ，其中一行包含一个元素。first函数可以获取Row对象，从该对象中可以访问其唯一元素，如下所示：

lv_seconds_back = mv_time_horizon.select(F.expr("max(time_horizon)") * 60).first()[0]

然后，如果要从时间戳中减去该值，请在将其转换为字符串之前执行此操作：

mv_now  = spark.sql(f"select from_unixtime(unix_timestamp() - {lv_seconds_back}) as mv_now")

赞(0）回复(0）举报 2022-11-30

我来回答

Apache Spark 如何将秒添加到另一个变量/ Dataframe 中的时间戳值

2条答案

相关问题

热门标签

最新问答