在hive表中添加唯一值

vlju58qv  于 2021-06-21  发布在  Pig
关注(0)|答案(2)|浏览(388)

我想在输入任何记录时向配置单元表添加一个唯一值,该值不应在整个配置单元表中重复。我找不到任何解决方案或任何函数。在我的例子中,我想用pig拉丁语输入hive中的记录。请帮忙。

cyvaqqii

cyvaqqii1#

hive不提供类似rdbms数据库的约束。
建议使用pig脚本的方法如下。1加载数据2。对数据3应用distinct。将数据存储在位置4。在同一位置创建外部配置单元表。
如果您可以使用hcatalog(它允许您直接将数据存储在配置单元表中),那么第3步和第4步可以结合使用。
官方文件:链接1链接2

5cnsuln7

5cnsuln72#

你看了这个吗?https://github.com/manojkumarvohra/hive-hilo 它似乎提供了一种在Hive中使用hi/lo算法生成序列号的方法

相关问题