Apache Spark 在增量表中自动递增列，无需重新键入

hgc7kmma 于 2023-01-13 发布在 Apache

关注(0)|答案(1)|浏览(127)

到目前为止，我有一个dim delta表，我使用row_number（）+max（dim_id）计算dim_id。
尺寸标识|用户标识
千零一|1个
小行星1002|三个
1003|五个
1004年|九
例如，如果我删除了1004 ID，然后插入一个新的user_id，如7（row_number（）+max（dim_id）= 1004）1004 ID重复。是否有任何方法可以防止已使用的ID在从增量表中删除后未创建

来源：https://stackoverflow.com/questions/75103629/auto-increment-column-in-delta-table-without-rekey

1条答案

按热度按时间

解决这个问题的最佳方法是Primary Key，但到目前为止还不支持。
您可以将monotonically_increasing_id()与row_number()合并为两列。示例如下：生成唯一递增值

研发部：

赞(0）回复(0）举报 2023-01-13

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前