我在尝试提取Hive中的子串时遇到问题。我正在处理的表格有一个名为“裁判员dict”的列,显示等级和相应的球员ID。例如,记录可以如下所示:
[('Bronze1', [2738653, 2738652, 2738655]), ('Bronze2', [2738653, 2738652]), ('Bronze3', []), ('Silver1', []), ('Silver2', []), ('Silver3', [])
我正在寻找获得铜牌2的玩家,所以我想从列表中提取[2738653,2738652]。我知道在python中这很容易,但是我查阅了hive的文档,但仍然不知道如何在sql/hive中实现它。任何帮助都将不胜感激!
1条答案
按热度按时间q9yhzks01#
我想我找到了一个办法。。但是我不知道这是不是最简单的。因为它是一个字符串,所以我将使用regex来捕获“bronze1”[”之后和下一个“]”之前的子字符串。我要用的函数是
regexp\u extract(字符串主题、字符串模式、int索引)。如果有人有类似的问题,希望这能有所帮助。