我正在从事一个项目,该项目要求将科学数据存储在awss3上,作为数据湖开始时的原始数据。我们正在为应用程序数据规划json,并使用s3元数据来持久化应用程序元数据(json模式)和处理元数据。目前,站点s3是我们从aws云上获得的唯一服务。
客户端需要一个发布环境,在这个环境中他们可以将原始数据作为文件返回。我们希望避免构建自定义目录和安全基础结构。
我没有看到任何关于apacheatlas的东西可以直接连接到awss3。但是我们可以把apachehive放在awss3之上,然后把apacheatlas和ranger放在上面。但不确定这是我们如何发布来自s3的原始数据,还是因为hive更像是一个处理环境。
可以直接在awss3上使用apacheatlas和ranger吗?
暂无答案!
目前还没有任何答案,快来回答吧!