我想在输入任何记录时向配置单元表添加一个唯一值,该值不应在整个配置单元表中重复。我找不到任何解决方案或任何函数。在我的例子中,我想用pig拉丁语输入hive中的记录。请帮忙。
cyvaqqii1#
hive不提供类似rdbms数据库的约束。建议使用pig脚本的方法如下。1加载数据2。对数据3应用distinct。将数据存储在位置4。在同一位置创建外部配置单元表。如果您可以使用hcatalog(它允许您直接将数据存储在配置单元表中),那么第3步和第4步可以结合使用。官方文件:链接1链接2
5cnsuln72#
你看了这个吗?https://github.com/manojkumarvohra/hive-hilo 它似乎提供了一种在Hive中使用hi/lo算法生成序列号的方法
2条答案
按热度按时间cyvaqqii1#
hive不提供类似rdbms数据库的约束。
建议使用pig脚本的方法如下。1加载数据2。对数据3应用distinct。将数据存储在位置4。在同一位置创建外部配置单元表。
如果您可以使用hcatalog(它允许您直接将数据存储在配置单元表中),那么第3步和第4步可以结合使用。
官方文件:链接1链接2
5cnsuln72#
你看了这个吗?https://github.com/manojkumarvohra/hive-hilo 它似乎提供了一种在Hive中使用hi/lo算法生成序列号的方法