我看到了mapreduce作业的替代品mapr,它可以直接从流中读取数据并进行处理。我的理解正确吗?有我可以参考的样品吗?它是商业的吗?使用它有什么窍门吗?它是Flume的替代品吗?我们可以将它与apachehadoop一起使用吗?如果是,那么为什么发行版只讨论Yarn和mapreduce而不讨论mapr?提前谢谢。
rkue9o1l1#
mapr是apachehadoop的商业发行版,hdfs被maprfs取代。本质上,是相同的hadoop和相同的map减少了运行在上面的作业,覆盖了大量的市场营销,导致了像你这样的困惑和问题。以下是它们分布中的组件图:https://www.mapr.com/products/mapr-distribution-including-apache-hadoop对于mapr之上的流处理,您可以使用apachespark streaming、apacheflume和apachestorm—这取决于您需要解决的任务是的,据我所知,它是商用的,按节点授权。你可以很容易地联系他们的销售人员,他们会很乐意解释价格和条件就像其他hadoop发行版一样,但就我个人而言,我更喜欢完全开源的平台,而不是专有的mapr-fs,但这取决于您的选择不因为apachehadoop是许多商业发行版的一部分:cloudera、mapr、hortonworks、pivotal等等。当你读到hadoop时,你读到的是系统架构,而不是为企业提供支持的商业软件包
1条答案
按热度按时间rkue9o1l1#
mapr是apachehadoop的商业发行版,hdfs被maprfs取代。本质上,是相同的hadoop和相同的map减少了运行在上面的作业,覆盖了大量的市场营销,导致了像你这样的困惑和问题。以下是它们分布中的组件图:https://www.mapr.com/products/mapr-distribution-including-apache-hadoop
对于mapr之上的流处理,您可以使用apachespark streaming、apacheflume和apachestorm—这取决于您需要解决的任务
是的,据我所知,它是商用的,按节点授权。你可以很容易地联系他们的销售人员,他们会很乐意解释价格和条件
就像其他hadoop发行版一样,但就我个人而言,我更喜欢完全开源的平台,而不是专有的mapr-fs,但这取决于您的选择
不
因为apachehadoop是许多商业发行版的一部分:cloudera、mapr、hortonworks、pivotal等等。当你读到hadoop时,你读到的是系统架构,而不是为企业提供支持的商业软件包