我正在尝试使用shell命令将csv文件加载到hbase表中 Dimporttsv.
csv文件位于hdfs(/csvfiles)中的dir中
csv文件是从一个mysql表生成的,该表包含以下字段:
+-------------+
Field
+-------------+
tweet_id
user_id
screen_name
description
created_at
+-------------+
我在hbase中创建了一个表,其中只有一个姓氏,如下所示:
create 'dummyTable', 'cf1'
我使用的命令:
ImportTsv -Dimporttsv.separator=',' -Dimporttsv.columns=HBASE_ROW_KEY,cf1:user_id,cf1:tweet_id,cf1:screen_name,cf1:description,cf1:created_at dummyTable /csvFiles/all_users.csv
但是我得到了这个语法错误:
SyntaxError: (hbase):8: syntax error, unexpected tSYMBEG
我看了下面的帖子,并遵循其中的建议,但没有任何效果。我会感激你的帮助。
将tsv文件导入hbase表
https://community.hortonworks.com/articles/4942/import-csv-data-into-hbase-using-importtsv.html
http://hbase.apache.org/book.html#importtsv
1条答案
按热度按时间xpcnnkqh1#
退出
Hbase shell
并尝试将单引号添加到importtsv.columns
```bash$ hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.separator=',' -Dimporttsv.columns='HBASE_ROW_KEY,cf1:user_id,cf1:tweet_id,cf1:screen_name,cf1:description,cf1:created_at' dummyTable hdfs://<your_name_node_addr>/csvFiles/all_users.csv