如何在hive中提取子字符串

twh00eeo  于 2021-06-26  发布在  Hive
关注(0)|答案(1)|浏览(952)

我在尝试提取Hive中的子串时遇到问题。我正在处理的表格有一个名为“裁判员dict”的列,显示等级和相应的球员ID。例如,记录可以如下所示:

[('Bronze1', [2738653, 2738652, 2738655]), ('Bronze2', [2738653, 2738652]), ('Bronze3', []), ('Silver1', []), ('Silver2', []), ('Silver3', [])

我正在寻找获得铜牌2的玩家,所以我想从列表中提取[2738653,2738652]。我知道在python中这很容易,但是我查阅了hive的文档,但仍然不知道如何在sql/hive中实现它。任何帮助都将不胜感激!

q9yhzks0

q9yhzks01#

我想我找到了一个办法。。但是我不知道这是不是最简单的。因为它是一个字符串,所以我将使用regex来捕获“bronze1”[”之后和下一个“]”之前的子字符串。我要用的函数是
regexp\u extract(字符串主题、字符串模式、int索引)。如果有人有类似的问题,希望这能有所帮助。

相关问题