bigquery查询,以获取斜杠后与特定模式匹配的所有引用

7kjnsjlb  于 2021-07-26  发布在  Java
关注(0)|答案(1)|浏览(292)

我在bigquery中有一个表,它有一个包含许多行的列,其中包含的字符串可以是这样的

row 1 mmmmm hhhhh ccccc tttt /tst /kl:2 /aaaa  nnnn
row 2 ddd bb /lamp /mode:2 /nana
row 3 /dada

我需要抓住所有的:tst,吉隆坡和aaaa,灯,模式,娜娜,达达(意思是所有的字后斜杠)
我该怎么做?
试过这样的东西,但没找到

SELECT column1,
  SPLIT(REGEXP_REPLACE(column1,r'(\/.*?(\s|$))', ','))  AS regex_found  
  FROM table
brtdzjyr

brtdzjyr1#

您可以使用与此类似的查询。它返回单个重复列 tokens 包含你感兴趣的单词:

SELECT
  REGEXP_EXTRACT_ALL(column, r'\/([^ :]+)') AS tokens
FROM
  UNNEST(['mmmmm hhhhh ccccc tttt /tst /kl:2 /aaaa  nnnn', 'ddd bb /lamp /mode:2 /nana', '/dada']) AS column

相关问题