Apache Spark java.lang.NoClassDefFoundError:org/apache/beam/sdk/coders/CoderProviderRegistrar

hgb9j2n6  于 2023-10-23  发布在  Apache
关注(0)|答案(1)|浏览(136)

我在尝试将一个着色的jar作为spark job提交给dataproc时得到了这个错误:

java.lang.NoClassDefFoundError: org/apache/beam/sdk/coders/CoderProviderRegistrar

我肯定有这门课。问题在哪?
Stacktrace截图:

bcs8qyzn

bcs8qyzn1#

根据Apache Beam Spark Runner的说法:
从Spark Runner 3.2开始,Beam 2.46.0不再支持Spark 2.4.x
这意味着您当前的Spark Runner版本中不支持Beam 2.50.0Spark 2.4.x
通过添加beam-runners-spark-3apache-streamingapache-core来尝试这些依赖项

<dependency>
  <groupId>org.apache.beam</groupId>
  <artifactId>beam-runners-spark-3</artifactId>
  <version>2.50.0</version>
</dependency>
<dependency>
  <groupId>org.apache.spark</groupId>
  <artifactId>spark-core_2.12</artifactId>
  <version>2.4.8</version>
</dependency>
<dependency>
  <groupId>org.apache.spark</groupId>
  <artifactId>spark-streaming_2.12</artifactId>
  <version>2.4.8</version>
</dependency>

参考文档更多的信息,因为它有完整的一步一步的过程,就如何设置和使它运行。

**注意:**里面有maven shade插件示例和dataproc示例。

希望这对你有帮助。

相关问题