在hadoop流处理过程中导入pytz模块时出错

whhtz7ly  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(297)

我在hadoop上运行一个python脚本,它给出了以下错误
导入错误:没有名为pytz的模块
当我在终端上运行python脚本时,它可以完美地执行。理想情况下,这不应该发生,因为hadoop使用与系统相同的python版本和库。你知道吗?

bfrts1fy

bfrts1fy1#

如果在流作业中使用任何python包,则需要在集群的每个节点上安装它。另一种选择是把包裹装在一个帆布包里,然后和包裹一起寄出去 -file 选项。请参阅此答案以了解更多详细信息-如何将python包包含在hadoop流作业中?

相关问题