这个问题在这里已经有答案了:
在spark sql中更新查询(2个答案)7个月前关门了。我试过使用update语句,但我认为sparksql不允许这样做。
eqqqjvef1#
这取决于数据存储的位置和方式。如果您的数据存储在hdfs或其他类型的对象存储(如s3)中,那么您的数据是不可变的。如果您将配置单元表定义为事务性的,则只有一个选项。在这种情况下,表必须集群化并存储为orc。不幸的是,在其他情况下,您无法更新。有关配置单元事务的更多信息,请参见:https://cwiki.apache.org/confluence/display/hive/hive+transactions
1条答案
按热度按时间eqqqjvef1#
这取决于数据存储的位置和方式。如果您的数据存储在hdfs或其他类型的对象存储(如s3)中,那么您的数据是不可变的。
如果您将配置单元表定义为事务性的,则只有一个选项。在这种情况下,表必须集群化并存储为orc。
不幸的是,在其他情况下,您无法更新。有关配置单元事务的更多信息,请参见:https://cwiki.apache.org/confluence/display/hive/hive+transactions