hdfs-dfs-count从哪里获得信息?

f1tvaqid  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(361)

我们需要计算数据量很大的多租户多节点集群中许多目录中的文件数。所以,我想知道“hdfs-dfs-count/path/to/directory”命令从哪里获得信息?它像hdfs dfs-ls一样工作吗?或者它直接从hdfs中的namenode获取信息?
谢谢!

tquggr8v

tquggr8v1#

它称之为 getContentSummary 来自文件系统api的方法:

ContentSummary summary = src.fs.getContentSummary(src.path);
out.println(summary.toString(showQuotas) + src);

的源代码 org.apache.hadoop.fs.FsShell.Count 的源代码 getContentSummary

相关问题