我们需要计算数据量很大的多租户多节点集群中许多目录中的文件数。所以,我想知道“hdfs-dfs-count/path/to/directory”命令从哪里获得信息?它像hdfs dfs-ls一样工作吗?或者它直接从hdfs中的namenode获取信息?谢谢!
tquggr8v1#
它称之为 getContentSummary 来自文件系统api的方法:
getContentSummary
ContentSummary summary = src.fs.getContentSummary(src.path); out.println(summary.toString(showQuotas) + src);
的源代码 org.apache.hadoop.fs.FsShell.Count 的源代码 getContentSummary
org.apache.hadoop.fs.FsShell.Count
1条答案
按热度按时间tquggr8v1#
它称之为
getContentSummary
来自文件系统api的方法:的源代码
org.apache.hadoop.fs.FsShell.Count
的源代码getContentSummary