这是我用来编写文件的示例代码段 hdfs
```
import java.io.BufferedInputStream;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.URI;
import java.net.URISyntaxException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
import org.apache.hadoop.util.Progressable;
public class WriteFileToHDFS {
public static void main(String[] args) throws IOException, URISyntaxException
{
System.setProperty("hadoop.home.dir", "/");
System.setProperty("HADOOP_USER_NAME", "hdfs");
//1. Get the instance of COnfiguration
Configuration configuration = new Configuration();
//2. Create an InputStream to read the data from local file
InputStream inputStream = new BufferedInputStream(new FileInputStream("/Users/rabbit/Research/hadoop/sample_files/TAO.mp4"));
//3. Get the HDFS instance
FileSystem hdfs = FileSystem.get(new URI("hdfs://192.168.143.150:9000"), configuration);
//4. Open a OutputStream to write the data, this can be obtained from the FileSytem
OutputStream outputStream = hdfs.create(new Path("hdfs://192.168.143.150:9000/filestore/TAO.mp4"),
new Progressable() {
@Override
public void progress() {
System.out.println("....");
}
});
try
{
IOUtils.copyBytes(inputStream, outputStream, 4096, false);
}
finally
{
IOUtils.closeStream(inputStream);
IOUtils.closeStream(outputStream);
}
}
}
我希望这是写为 `/data/hadoop-data/dn/current/blk_1073741869` 相反,它被写成 `/data/hadoop-data/dn/current/BP-1308070615-172.22.131.23-1533215887051/current/finalized/subdir0/subdir0/blk_1073741869` . 我不知道在哪里 `BP-1308070615-172.22.131.23-1533215887051/current/finalized/subdir0/subdir0` -这条路生成了吗?
在hadoop中写入数据节点时如何定义路径结构?
2条答案
按热度按时间83qze16e1#
bp代表“block pool”,它是属于单个hdfs名称空间的块的集合。
这就是hdfs管理数据块的方式,您可以参考此链接了解它的所有内容:
https://hortonworks.com/blog/hdfs-metadata-directories-explained/
e37o9pze2#
bp代表“block pool”,是属于单个hdfs命名空间的块的集合。
下一部分是1308070615,是一个随机生成的整数。
ip地址172.22.131.23是最初创建块池的namenode的地址。
最后一部分1533215887051是命名空间的创建时间。