我正在尝试将databricks作业添加到git repo。我看到你可以在作业中从git仓库运行notebook,但我不知道是否有可能将作业本身添加到git仓库。
iklwldmw1#
您需要的功能是在预览和最近已作出GA。它还支持Terraform Provider参见https://databricks.com/blog/2022/06/21/build-reliable-production-data-and-ml-pipelines-with-git-support-for-databricks-workflows.html
von4xj4u2#
仍然不可能将作业定义“原生”保存到Git中,但可以通过不同的方式完成:
databricks_job
-match
2条答案
按热度按时间iklwldmw1#
您需要的功能是在预览和最近已作出GA。它还支持Terraform Provider
参见https://databricks.com/blog/2022/06/21/build-reliable-production-data-and-ml-pipelines-with-git-support-for-databricks-workflows.html
von4xj4u2#
仍然不可能将作业定义“原生”保存到Git中,但可以通过不同的方式完成:
databricks_job
资源(doc)。使用它的最大优点是它允许处理对其他资源的依赖关系,如现有集群,DLT管道等。但这需要熟悉地形。您还可以使用Terraform Exporter功能(doc)导出具有依赖关系的现有作业,并使用-match
选项导出所选作业。