aster数据与hadoop/hive的区别

wwtsj6pe  于 2021-05-30  发布在  Hadoop
关注(0)|答案(2)|浏览(424)

aster数据中的所有组件在hadoop堆栈中似乎都有一个类似的组件。
afs=>hdfs
sql mr=>配置单元
amc=>Ambari
act=>直线/Hive终端
postgresforstoragemetadata=>hive可以配置为在任何rdbms中存储元数据
queen/worker=>namenode/datanode
sql gr=>giraph数据库
除了提供一个预构建函数包之外,还有什么与hadoop截然不同的功能吗?

oknrviil

oknrviil1#

你的问题不错,是错的。可能来自hadoop方面,您使用hadoop体系结构提出了这个问题,hadoop体系结构是由分层和/或集成的稍微独立的组件组装而成,每个组件都有自己的功能规范、配置和执行环境等。
为什么错了?因为如果比较hadoop和oracle或sap数据库,你不会问同样的问题,对吧?
是的,aster端的每个对应项都与hadoop堆栈产品相匹配——区别在于aster没有这样的堆栈(至少到6.x为止)。aster是与hadoop堆栈函数匹配的数据库和分析引擎,而不是组件。
例如,act是一个命令行实用程序,类似于sql*plus,用于通过客户机/服务器接口进行oracle操作。它不像hadoop之上的Hive基础设施。aster文件系统作为一个复杂的可插入功能层集成到aster软件中,而不是作为hdfs和hadoop的独立框架和软件。
最显著的区别在于由sql、sql/mr和sql/gr组成的aster分析引擎。这意味着数据存储与其在数据存储上运行的运算符(sql语句、sql/mr或sql/gr函数)之间没有功能或操作上的差距—它们生活在同一个环境中(配置、执行、,维护、支持)。例如,列型表和基于行的表对于在其上执行的任何操作都是完全透明的(禁止预先定义和设计的约束)。
所以,你的类比确实解释了方程的hadoop方面,但没有给出正确的解释。

ubby3x7f

ubby3x7f2#

我认为你不必要地追求本质。这个问题是从概念上讲的。比如netezza和teradata mpp。在基本概念上,它们是相同的,它们做同样的工作,但它们是两个不同的物理实现,有各自的算法、存储、索引等。
在非常高的级别上,hive和aster有相似之处,因为它们都在分布式存储上运行map reduce。
在非常高的级别上唯一的区别是,在非常高的级别上aster可以运行典型的rdms查询以及隐式map reduce,而hive只是map reduce。

相关问题