sql和sql mr query在teradata aster内部是如何工作的?

dzjeubhm  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(391)

我目前正在探索tera数据aster(asterexpress 6)。我浏览了文档和博客,但没有解释查询是如何工作的。由于sql和sqlmr获取数据的方式是分布式的,所以它们是否在内部生成map reduce作业?
例如,customer表有10条记录,这些记录是按hash(customer id)分发的,表示它们是3个worker(asterdata中只有节点),数据在它们之间拆分为两个节点上的3条记录和一个节点上的4条记录。
在sql中,简单的select*from customers;在这种情况下有效吗?
但在aster数据中,这个查询是有效的。
它如何从3个节点获取记录?如果普通的sql查询可以产生记录,那么为什么我们需要mapreduce,我们可以使用多个子查询来完成are任务呢?
如果数据分布在多台机器上,那么mapreduce是处理数据的唯一方法吗?
如果有人能解释一下,我会很有帮助的!
普拉迪

mpbci0fu

mpbci0fu1#

www.teradata.com/white-paper/using-sql-mapreduce-for-advanced-analytical-queries/ 是teradata赞助的一份白皮书,解释了他们将mapreduce与sql结合在一起的基本原理,应该是提高理解的一个很好的起点。

相关问题