如何在linux环境下每小时安排pyspark脚本

3htmauhk  于 2021-05-27  发布在  Hadoop
关注(0)|答案(1)|浏览(307)

我有一个pyspark脚本,我希望该脚本每小时执行一次,这意味着每小时后该脚本应该得到执行。我怎样才能每小时执行一次脚本。
我找了很多,但什么也没找到。

knsnq2tg

knsnq2tg1#

您可以使用以下任何一种方法
https://developer.ibm.com/hadoop/2017/06/30/scheduling-spark-job-written-pyspark-sparkr-yarn-oozie/
https://github.com/pinterest/pinball
cron选项卡
http://airflow.apache.org/scheduler.html

相关问题