清管器变量存储

vmjh9lq9  于 2021-06-24  发布在  Pig
关注(0)|答案(1)|浏览(320)

pig使用变量来存储数据。
当我将hdfs中的数据加载到pig中的变量时。数据临时存储在哪里?
当我们将数据加载到变量中时,在后台到底发生了什么?
好心的帮助

fjnneemd

fjnneemd1#

pig懒散地计算大多数表达式。在大多数情况下,它会检查语法错误等,

a = load 'hdfs://I/Dont/Exist'

除非你使用 STORE 或者 DUMP 或者类似于那些导致 a 类似地,如果文件存在,并且您将其加载到关系中并对其执行转换,则该文件将被后台处理到 /tmp 然后执行转换。如果查看在上运行命令时显示的消息 grunt ,您会注意到文件路径以 file:///tmp/_201706171047235 . 这些是存储中间数据的文件。

相关问题