两者有什么区别 getShipFiles & getCacheFiles 在 EvalFunc 上课?假设此方法中指定的任何文件都可用于 exec 来自分布式缓存的方法
getShipFiles
getCacheFiles
EvalFunc
exec
h7appiyu1#
getcachefiles()允许udf指定要放置在分布式缓存中的hdfs文件的列表。getshipfiles()允许udf指定要放置在分布式缓存中的本地文件列表。所以getshipfiles从本地文件中获取文件,然后缓存从hdfs中获取它们。
1条答案
按热度按时间h7appiyu1#
getcachefiles()允许udf指定要放置在分布式缓存中的hdfs文件的列表。
getshipfiles()允许udf指定要放置在分布式缓存中的本地文件列表。
所以getshipfiles从本地文件中获取文件,然后缓存从hdfs中获取它们。