spark.sql("create schema if not exists dbo")
spark.sql("create table if not exists dbo.Cities (Name string, Population int)")
spark.sql("INSERT INTO dbo.Cities VALUES('Rome',5000)")
spark.sql("SELECT * FROM dbo.Cities").show()
+----+----------+
|Name|Population|
+----+----------+
|Rome| 5000|
+----+----------+
2条答案
按热度按时间j2cgzkjk1#
请注意,sparksql不支持在insert期间指定列。必须按正确顺序指定每列中的所有值。
mnemlml82#
使用
deltalake
为了这个案子。创建delta表,然后我们可以对表执行更新/删除/插入。
如果要插入到表中,则可以使用
spark.sql
向表中插入数据。但对于更新/删除,您需要使用
delta lake
(或)insert overwrite/deleting partitions
来自spark sql的语句。