客户端、HDFS、namenode、datanode之间数据流在文件读取时，事件发生顺序如下所示：

HDFS文件读取流程

（1）客户端通过调用FileSystem对象的open()方法打开文件，对于HDFS来说这个文件是DistributedFileSystem。

（2）DistributedFileSystem对象通过RPC来调用NameNode，以确定文件起始块的位置。对于每一个块，namenode返回存有块副本的所有datanode地址。此外，这些datanode根据它们与客户端的距离进行排序(根据集群的网络拓扑)。如果客户端本身就是一个datanode(比如：在一个MapReduce任务中)，并存有相应数据块的副本，该节点就会从本地datanode读取数据。

（3）DistributedFileSystem类返回一个FSDataInputStream(seek()方法支持文件定位)给客户端并读取数据，FSDataInputStream类封装DFSInputStream，该对象管理着DataNode与NameNode的IO。客户端对DistributedFileSystem调用read()方法，存储着文件起始几个块的datanode地址的DFSInputStream随即连接距离最近的datanode。

（4）通过对数据流反复调用read()方法，可以将数据从DataNode传输到客户端。到达块末端时，DFSInputStream会关闭与该datanode的连接；

（5）寻找下一个最佳的datanode，读取数据；客户端从流中读取数据时，块是按照打开DFSInputStream与dataNode新建连接的顺序读取的，它也会根据需要询问namenode来检索下一批数据块的datanode的位置。

（6）读取完成，对FSDataInputStream调用close()方法。

在读取数据时，如果DFSInputStream在与dataNode通信时遇到错误，会尝试从这个块的另外一个最邻近dataNode读取数据，也会记住故障dataNode，保证以后不会反复读取该节点上的后续块。DFInputStream也会通过校验和确认从dataNode发来数据是否完成，如果发现损坏块，DFSInputStream会试图从其他dataNode读取其副本之前通知nameNode。

这样设计的重点是：nameNode告知客户端每个块中最佳的dataNode，并让客户端直接连到该datanode检索数据，能使HDFS可扩展到大量的并发客户端，同时，nameNode只需要相应块位置的请求，由于数据块信息均存储在内存中，因此相应高效。

HDFS文件读取流程

相关文章

热门标签

最新文章