我已经使用hadoop和nosql产品在本地实现了生产bigdata解决方案,但从未在云上实现过。
今天我需要转向云,因此我想知道云上bigdata(主要是azure)的已知(生产,而不仅仅是pocs)实现是什么:
完整的paas解决方案:emr/hdinsight+s3/azureblob(或azuredatalake)+kenesis/azure事件中心
完整的iaas发行版(cdh、hdp):iaas上的cloudera或hortonworks+iaas上的kafka
混合paas+iaas:s3/azureblob上的冷数据、iaashadoop上的热数据和交换、paas上的ad-as-paas+azure事件中心
致以最诚挚的问候
1条答案
按热度按时间bz4sfanl1#
除了上面提到的,我还发现许多在云上使用完整paas和iaas解决方案的产品实现,其中一个更成熟的是基于s3和emr的netflix解决方案。