我正在使用Databricks SQL,并试图将字符串解析到单独的列中。
下面是一个对我有效的例子:
regexp_extract('100-200', '(\\d+)-(\\d+)', 1)
returns: 100
我的具体示例是拆分一个名为 match_name 的列(即底特律雄狮队在纽约喷气机队),这样我就可以将主客场球队分成各自独立的列(即AWAY =底特律雄狮队,HOME =纽约喷气机队)
下面是我在SQL查询中尝试对match_name列实现的一些代码,以尝试在单词“at”处进行拆分-目前这些代码都不起作用
split(match_name,'[at]', 1),
regexp_extract(match_name,'(\\d+)at(\\d+)', 1),
任何帮助都是感激的!
1条答案
按热度按时间7xzttuei1#
我在使用Databricks时也遇到过这种挫折,因为我认为split_part是一个有效的函数。无论如何,这里有一种使用regexp_extract的方法...
输出:
| 游戏|客场球队|主队|
| --------------|--------------|--------------|
| A队在B队|A组|B队|
| 亚特兰大对达拉斯|亚特兰大|达拉斯|