将tab分隔格式的txt文件加载到hbase中

cyvaqqii  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(428)

我正在尝试将一个制表符分隔的文件加载到hbase中。我得到了屏幕截图中提到的错误,请告知。
文件内容:

2   1/1/16 0:29 1/1/16 0:39
2   1/1/16 0:19 1/1/16 0:39
2   1/1/16 0:19 1/1/16 0:39
2   1/1/16 0:22 1/1/16 0:38
2   1/1/16 0:24 1/1/16 0:39
2   1/1/16 0:32 1/1/16 0:39

查询:

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns= HBASE_ROW_KEY,id,date:c1,date:c2 sample1 hdfs://localhost:9000/FinalProject/Hbase/samplehbase.txt

4ktjp1zp

4ktjp1zp1#

你不应该执行 Importsv 内部声明 hbase shell .

hbase(main)> create 'sample1', 'date'
-Dimporttsv.columns="HBASE_ROW_KEY,id,date:c1,date:c2"

这个 sample1 表只有一个列族 date . id 不是柱族,请将其从 columns .
尝试,

~$ hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns="HBASE_ROW_KEY,date:c1,date:c2" sample1 hdfs://localhost:9000/FinalProject/Hbase/samplehbase.txt

在示例数据中,所有记录都具有相同的行键。导入时,只有最后一行作为 VERSIONS => 1 默认情况下,用于柱族。考虑增加 VERSIONS 在运行导入之前。

hbase(main)> alter 'sample1',{NAME=>'date',VERSIONS=>6}

相关问题