为什么sparksession.sql(“set hive.support.quoted.identifiers=none”)不起作用？

pgky5nke 于 2021-06-24 发布在 Hive

关注(0)|答案(1)|浏览(807)

我想在sparksession.sql中使用正则表达式，但无论我使用： SparkSession.builder.enableHiveSupport().config("hive.support.quoted.identifiers", None) 或者 SparkSession.sql("set hive.support.quoted.identifiers=None") .
请告诉我怎么做。
代码：

ss = (pyspark.sql.SparkSession
      .builder
      .enableHiveSupport()          
      .config("hive.support.quoted.identifiers", None)
      .getOrCreate())                                         

# ss.sql("set hive.support.quoted.identifiers=None")

ss.sql("SELECT `(col)?+.+` FROM table")

程序结果：

pyspark.sql.utils.AnalysisException: "cannot resolve '`(col)?+.+`' given input columns: ... ...

Hive apache-spark pyspark

来源：https://stackoverflow.com/questions/57201474/why-sparksession-sqlset-hive-support-quoted-identifiers-none-doesnt-work

1条答案

按热度按时间

6jjcrrmo1#

你能试着启用正则表达式吗？默认情况下，此行为是禁用的，因此在运行带有regex列的查询之前，需要将下面的属性设置为true。

spark.sql("SET spark.sql.parser.quotedRegexColumnNames=true")

赞(0）回复(0）举报 2021-06-24

我来回答

为什么sparksession.sql(“set hive.support.quoted.identifiers=none”)不起作用？

1条答案

相关问题

热门标签

最新问答