aster数据中的所有组件在hadoop堆栈中似乎都有一个类似的组件。afs=>hdfssql mr=>配置单元amc=>Ambariact=>直线/Hive终端postgresforstoragemetadata=>hive可以配置为在任何rdbms中存储元数据queen/worker=>namenode/datanodesql gr=>giraph数据库除了提供一个预构建函数包之外,还有什么与hadoop截然不同的功能吗?
oknrviil1#
你的问题不错,是错的。可能来自hadoop方面,您使用hadoop体系结构提出了这个问题,hadoop体系结构是由分层和/或集成的稍微独立的组件组装而成,每个组件都有自己的功能规范、配置和执行环境等。为什么错了?因为如果比较hadoop和oracle或sap数据库,你不会问同样的问题,对吧?是的,aster端的每个对应项都与hadoop堆栈产品相匹配——区别在于aster没有这样的堆栈(至少到6.x为止)。aster是与hadoop堆栈函数匹配的数据库和分析引擎,而不是组件。例如,act是一个命令行实用程序,类似于sql*plus,用于通过客户机/服务器接口进行oracle操作。它不像hadoop之上的Hive基础设施。aster文件系统作为一个复杂的可插入功能层集成到aster软件中,而不是作为hdfs和hadoop的独立框架和软件。最显著的区别在于由sql、sql/mr和sql/gr组成的aster分析引擎。这意味着数据存储与其在数据存储上运行的运算符(sql语句、sql/mr或sql/gr函数)之间没有功能或操作上的差距—它们生活在同一个环境中(配置、执行、,维护、支持)。例如,列型表和基于行的表对于在其上执行的任何操作都是完全透明的(禁止预先定义和设计的约束)。所以,你的类比确实解释了方程的hadoop方面,但没有给出正确的解释。
ubby3x7f2#
我认为你不必要地追求本质。这个问题是从概念上讲的。比如netezza和teradata mpp。在基本概念上,它们是相同的,它们做同样的工作,但它们是两个不同的物理实现,有各自的算法、存储、索引等。在非常高的级别上,hive和aster有相似之处,因为它们都在分布式存储上运行map reduce。在非常高的级别上唯一的区别是,在非常高的级别上aster可以运行典型的rdms查询以及隐式map reduce,而hive只是map reduce。
2条答案
按热度按时间oknrviil1#
你的问题不错,是错的。可能来自hadoop方面,您使用hadoop体系结构提出了这个问题,hadoop体系结构是由分层和/或集成的稍微独立的组件组装而成,每个组件都有自己的功能规范、配置和执行环境等。
为什么错了?因为如果比较hadoop和oracle或sap数据库,你不会问同样的问题,对吧?
是的,aster端的每个对应项都与hadoop堆栈产品相匹配——区别在于aster没有这样的堆栈(至少到6.x为止)。aster是与hadoop堆栈函数匹配的数据库和分析引擎,而不是组件。
例如,act是一个命令行实用程序,类似于sql*plus,用于通过客户机/服务器接口进行oracle操作。它不像hadoop之上的Hive基础设施。aster文件系统作为一个复杂的可插入功能层集成到aster软件中,而不是作为hdfs和hadoop的独立框架和软件。
最显著的区别在于由sql、sql/mr和sql/gr组成的aster分析引擎。这意味着数据存储与其在数据存储上运行的运算符(sql语句、sql/mr或sql/gr函数)之间没有功能或操作上的差距—它们生活在同一个环境中(配置、执行、,维护、支持)。例如,列型表和基于行的表对于在其上执行的任何操作都是完全透明的(禁止预先定义和设计的约束)。
所以,你的类比确实解释了方程的hadoop方面,但没有给出正确的解释。
ubby3x7f2#
我认为你不必要地追求本质。这个问题是从概念上讲的。比如netezza和teradata mpp。在基本概念上,它们是相同的,它们做同样的工作,但它们是两个不同的物理实现,有各自的算法、存储、索引等。
在非常高的级别上,hive和aster有相似之处,因为它们都在分布式存储上运行map reduce。
在非常高的级别上唯一的区别是,在非常高的级别上aster可以运行典型的rdms查询以及隐式map reduce,而hive只是map reduce。