我试图在aws上的emr集群中插入一个带有查询的表。表创建正确，同事可以运行与我使用的完全相同的代码，而且不会失败。但是，当我尝试运行代码时，map1中的失败会导致整个作业失败，下面的查询错误如下。
有人能帮我弄清楚为什么我的工作失败了，当我运行它，但我的朋友可以运行它没有问题？我盯着这个看了一整天都过不去。

----------------------------------------------------------------------------------------------
        VERTICES      MODE        STATUS  TOTAL  COMPLETED  RUNNING  PENDING  FAILED  KILLED  
----------------------------------------------------------------------------------------------
Map 1            container       RUNNING     13          0        0       13      40       1  
Map 3 .......... container     SUCCEEDED      1          1        0        0       0       0  
Map 5 .......... container     SUCCEEDED      1          1        0        0       0       0  
Map 7 .......... container     SUCCEEDED      1          1        0        0       0       0  
Map 8 .......... container     SUCCEEDED      1          1        0        0       0       0  
Reducer 2        container        INITED      6          0        0        6       0       0  
Reducer 4 ...... container     SUCCEEDED      2          2        0        0       0       0  
Reducer 6 ...... container     SUCCEEDED      2          2        0        0       0       0  
Reducer 9 ...... container     SUCCEEDED      2          2        0        0       0       0  
----------------------------------------------------------------------------------------------
VERTICES: 07/09  [========>>------------------] 34%   ELAPSED TIME: 132.71 s   
----------------------------------------------------------------------------------------------
Status: Failed
Vertex failed, vertexName=Map 1, vertexId=vertex_1544915203536_0453_2_07, diagnostics=[Task failed, taskId=task_1544915203536_0453_2_07_000009, diagnostics=[TaskAttempt 0 failed, info=[Error: Error while running task ( failure ) : attempt_1544915203536_0453_2_07_000009_0:java.lang.RuntimeException: org.apache.hadoop.hive.ql.metadata.HiveException: java.io.IOException: java.lang.IllegalArgumentException: [
    at org.apache.hadoop.hive.ql.exec.tez.TezProcessor.initializeAndRunProcessor(TezProcessor.java:211)
    at org.apache.hadoop.hive.ql.exec.tez.TezProcessor.run(TezProcessor.java:168)
    at org.apache.tez.runtime.LogicalIOProcessorRuntimeTask.run(LogicalIOProcessorRuntimeTask.java:370)
    at org.apache.tez.runtime.task.TaskRunner2Callable$1.run(TaskRunner2Callable.java:73)
    at org.apache.tez.runtime.task.TaskRunner2Callable$1.run(TaskRunner2Callable.java:61)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1840)
    at org.apache.tez.runtime.task.TaskRunner2Callable.callInternal(TaskRunner2Callable.java:61)
    at org.apache.tez.runtime.task.TaskRunner2Callable.callInternal(TaskRunner2Callable.java:37)
    at org.apache.tez.common.CallableWithNdc.call(CallableWithNdc.java:36)
    at java.util.concurrent.FutureTask.run(FutureTask.java:266)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    at java.lang.Thread.run(Thread.java:748)
Caused by: org.apache.hadoop.hive.ql.metadata.HiveException: java.io.IOException: java.lang.IllegalArgumentException: [VALUE] BINARY is not in the store: 
    at

2条答案

按热度按时间

cnwbcb6i1#

所以矢量化才是问题所在。这些设置将在会话开始时激活。

set hive.vectorized.execution.enabled = true;
set hive.vectorized.execution.reduce.enabled = true;

通过不激活这个，它可以运行得更慢，但成功了。似乎hive不喜欢timestamp值。在下面的wiki的底部是一个限制。如果不设置这些选项，它肯定可以工作。
https://cwiki.apache.org/confluence/display/hive/vectorized+query+execution
总之，时间戳和矢量化在hive中互不相像。。。。但只是有时候。。。

赞(0）回复(0）举报 2021-06-27

fhg3lkii2#

我认为错误在于：
[调整\u事件\u开始\u ts]二进制文件不在存储中
最重要的一点是： not in the store 检查您的查询（只选择不插入）。
哪个表包含 TUNING_EVENT_START_TS ?

配置单元时间戳错误为二进制

2条答案

相关问题

热门标签

最新问答