如何取消长时间的分区操作?
例如,我有处理大量数据的代码(需要很长时间),但我希望能够允许用户取消操作-我该怎么做?
def get_data(self, spark_session):
query = 'Some query...'
my_data_frame = spark_session.sql(query)
my_data_frame.foreachPartition(handle_data)
# How to cancel on user request?
1条答案
按热度按时间bwntbbo31#
可以使用
pysparkapi文档中有一个完整的示例