如何将存档添加到配置单元例如:配置单元>添加存档路径\u project/my\u project.tar.gz;并执行此查询:使用“python path\u project/script.py”从my\u yable limit 1中选择transform(字段\u 1,字段\u 2);我试过了,但没用。谢谢
puruo6ea1#
我想把这个复制到hadoop map reduce-archives不解包的归档文件,但它不允许我因为答案那里不接受。
ADD ARCHIVE path_project/my_project.tar.gz;
添加存档时 path_project/my_project.tar.gz ,存档将被提取到 my_project.tar.gz/ ,因此需要将脚本引用为
path_project/my_project.tar.gz
my_project.tar.gz/
SELECT transform(field_1,field_2) USING 'python my_project.tar.gz/script.py' FROM my_yable LIMIT 1;
如果您查看文档类distributedcache中的示例,它意味着约定。顺便说一句:支持的存档格式是存档(zip、tar和tgz/tar.gz文件)在工作节点上取消存档
1条答案
按热度按时间puruo6ea1#
我想把这个复制到hadoop map reduce-archives不解包的归档文件,但它不允许我因为答案那里不接受。
添加存档时
path_project/my_project.tar.gz
,存档将被提取到my_project.tar.gz/
,因此需要将脚本引用为如果您查看文档类distributedcache中的示例,它意味着约定。顺便说一句:支持的存档格式是
存档(zip、tar和tgz/tar.gz文件)在工作节点上取消存档