我将把csv数据存储在一个hbase列中,为了节省空间和非常快速地将数据加载到hbase,不需要用专用列将其拆分。每个键一个csv行。例子:
key:identifier\u column1:'aaa;bbb公司;ccc公司;ddd;eee'键:标识符\u gghh column1:'gh;thj公司;gn'
同时,我需要开发一个hbase客户机,它将使用thrift和/或restapi(从非java代码访问hbase)进行操作,并且客户机不需要特定密钥的全部csv数据。相反,它只需要csv中的某些字段。i、 e.第1、4和29栏。
因此,我想为thrift/rest scanner构建一个定制的预处理器,它将解析列中的csv并只返回请求的字段。不幸的是,我没有找到一种方法来调用实现thrift或rest的预处理逻辑的定制java包。
如有任何建议,我们将不胜感激。
暂无答案!
目前还没有任何答案,快来回答吧!