我对使用tez引擎还不熟悉。我在tez引擎上运行hive查询,查询似乎利用了所有可用的资源。我想知道有没有办法控制集装箱的数量。例如,我们如何在spark中使用--executor cores和--num executors配置进行控制。
我找了又找不到任何具体的东西。另外,我不想通过队列来区分它(因为我在emr上运行它时使用了缩放选项,并且基于多个队列定义缩放会使设置复杂化)。
更新1:带有vertice信息
VERTICES MODE STATUS TOTAL COMPLETED RUNNING PENDING FAILED KILLED
----------------------------------------------------------------------------------------------
Map 1 container RUNNING 17 0 11 6 0 0
----------------------------------------------------------------------------------------------
上面的查询触发1个vertice,其中11个任务并行运行(使用集群的所有11个资源)。我想控制vertice中并发运行任务的数量(在本例中是从11到3)。
1条答案
按热度按时间fykwrbwg1#
小数据集查询的设置:
--为更大的数据集配置:
注意:由于您的配置单元或tez版本以及您的平台权限,可能不支持所提到的某些配置。