有没有更好的方法来写这个查询。。。考虑到使用spark和hadoop的数百万行
select *
from (
SELECT *, row_number() over(PARTITION BY tran_id ORDER BY load_dt DESC) RN
FROM MySourceTable WHERE CAST(tradeDtae) as TIMESTAMP)
BETWEEN add_months(current_timestamp(), -64) AND current_timestamp()
AND sys_id = 'TRADING
) temp where temp.RN=1;
我的资源表由 tradeDtae
作为int
查询已连续运行数小时,但未能返回满足查询的行
1条答案
按热度按时间stszievb1#
分区修剪可能不起作用,因为函数应用于tradedtae列。试着在没有任何功能的情况下做这件事。而且cast(timestamp)在配置单元中也不能像您期望的那样工作,请考虑以下示例:
将bigint unix时间戳转换为时间戳的正确方法是使用from unixtime:
我建议将参数作为unix时间戳单独计算,并作为参数传递如果分区修剪不适用于此查询,请首先尝试以下操作: