谢谢你关心我的问题。在开始之前,我想让您知道我对hadoop&hbase非常陌生。到目前为止,我发现hadoop非常有趣,并希望在未来做出更多贡献。
我主要对提高hbase的性能感兴趣。为此,我创建了一个hbase表,并为加载5000编写了pig脚本(仅限由“!”分隔的值)将数据行Map到hbase表中,然后我用hive表Map这个h基表。现在一切都很顺利。。。但是现在的问题是我想加载同时具有key和value的数据(例如key1=12!key2=13),所以对于这种类型的解析,我可以选择相应地将键值对数据加载到h基表中,也请让我知道h基表中行键的重要性。
我写了Pig的剧本如下
a=使用pigstorage('!')加载'/bulk\u ark\u data/')as(id:chararray,a:chararray,b:chararray,c:chararray);存储到'hbase://bulk_ark'使用org.apache.pig.backend.hadoop.hbase.hbaservage('af:a af:b af:c');
那么如何在hbase表中加载键值数据呢??????请尽快回复我……)
1条答案
按热度按时间esbemjvw1#
hbase实际上是一个键值数据存储(核心是一个Map)。您不必做任何特殊的事情,但要考虑好您的表模式。对于你的特殊情况,把数据的第一部分作为键,把第二部分作为值怎么样。类似于“cf:key1=>12”