我在azure云平台的databricks示例中有3-4个集群。我想为所有集群维护一个公共元存储。如果有人实施了这个,请告诉我。
ih99xse11#
我建议配置外部配置单元元存储。默认情况下,detabricks在幕后旋转自己的元存储。但是您可以创建自己的数据库(azuresql也可以工作,mysql或postgres)并在集群启动期间指定它。具体步骤如下:https://docs.microsoft.com/en-us/azure/databricks/data/metastores/external-hive-metastore注意事项:databricks中的data选项卡—您可以选择集群并查看不同的元存储。要避免使用sql用户和密码,请查看托管标识https://docs.microsoft.com/en-us/azure/stream-analytics/sql-database-output-managed-identity通过使用集群的初始化脚本自动化外部配置单元元存储连接对源的权限管理。如果是adls gen 2,请考虑使用密码传递
1条答案
按热度按时间ih99xse11#
我建议配置外部配置单元元存储。默认情况下,detabricks在幕后旋转自己的元存储。但是您可以创建自己的数据库(azuresql也可以工作,mysql或postgres)并在集群启动期间指定它。
具体步骤如下:https://docs.microsoft.com/en-us/azure/databricks/data/metastores/external-hive-metastore
注意事项:
databricks中的data选项卡—您可以选择集群并查看不同的元存储。
要避免使用sql用户和密码,请查看托管标识https://docs.microsoft.com/en-us/azure/stream-analytics/sql-database-output-managed-identity
通过使用集群的初始化脚本自动化外部配置单元元存储连接
对源的权限管理。如果是adls gen 2,请考虑使用密码传递