我有格式的样品记录 9220216686,2011-05-05 22:48:26,28,C,PRE_HOST10_JINGLE_PP-PREF_WELCOME_PP-PREF_PROMO_PP|M001:6|M487:8|M312:3|M183:3|M093,CD,49,
我想将数据加载到基于这两者的配置单元中 ,
以及 |
分隔符。我搜索了一下,找到了 MultiDelimitSerDe
. 但我面临的问题是,有些记录在m开头的字段中会有最少的列,比如 9220216686,2011-05-05 22:48:26,28,C,PRE_HOST10_JINGLE_PP-PREF_WELCOME_PP-PREF_PROMO_PP|M001:6|M487:4,CD,49,
此记录仅包含两个m起始字段。我知道我们可以用map-reduce作业来解决这个问题。但是,有没有任何方法可以有效地通过单个查询将数据加载到配置单元中?
暂无答案!
目前还没有任何答案,快来回答吧!