我有下面的表达式,
val pageViews = spark.sql(
s"""
|SELECT
| proposal,
| MIN(timestamp) AS timestamp,
| MAX(page_view_after) AS page_view_after
|FROM page_views
|GROUP BY proposalId
|""".stripMargin
).createOrReplaceTempView("page_views")
我想把它转换成一个使用数据集api的
val pageViews = pageViews.selectExpr("proposal", "MIN(timestamp) AS timestamp", "MAX(page_view_after) AS page_view_after").groupBy("proposal")
问题是我不能打电话 createOrReplaceTempView
在这种情况下,构建失败。
我的问题是如何将第一个转换为第二个,并从中创建tempview?
2条答案
按热度按时间vsikbqxv1#
通过使用sparksql函数,您可以一起摆脱sql表达式al
如下所示
yftpprvb2#
考虑到您有一个名为
pageViews
-使用-