databricks集群中的公共元数据

rta7y2nd  于 2021-05-27  发布在  Spark
关注(0)|答案(1)|浏览(496)

我在azure云平台的databricks示例中有3-4个集群。我想为所有集群维护一个公共元存储。如果有人实施了这个,请告诉我。

ih99xse1

ih99xse11#

我建议配置外部配置单元元存储。默认情况下,detabricks在幕后旋转自己的元存储。但是您可以创建自己的数据库(azuresql也可以工作,mysql或postgres)并在集群启动期间指定它。
具体步骤如下:https://docs.microsoft.com/en-us/azure/databricks/data/metastores/external-hive-metastore
注意事项:
databricks中的data选项卡—您可以选择集群并查看不同的元存储。
要避免使用sql用户和密码,请查看托管标识https://docs.microsoft.com/en-us/azure/stream-analytics/sql-database-output-managed-identity
通过使用集群的初始化脚本自动化外部配置单元元存储连接
对源的权限管理。如果是adls gen 2,请考虑使用密码传递

相关问题