自定义pig加载程序

ozxc1zmp  于 2021-06-04  发布在  Hadoop
关注(0)|答案(0)|浏览(204)

我想写一个自定义的pig加载程序,将记录从多行格式加载到单行格式。稍后我要比较每个子记录。怎么写这样的东西?
这是文件格式-输入

File : 
REC|**Record_1**|ABC|DEF|GEH|1234
SUB_REC1|111|222|333|444|5555
SUB_REC1|AAA|BBB|CCC|DDD
SUB_REC2|EEE|FFF|GGG|HHH
SUB_REC2|III|JJJ
REC|**Record_2**|XYZ|MNO|PQR|1234
SUB_REC1|111|222|333|444|5555
SUB_REC1|AAA|BBB|CCC|DDD
SUB_REC2|EEE|FFF|GGG|HHH
SUB_REC2|III|JJJ

预期产量:


**Record_1**:REC|**Record_1**|ABC|DEF|GEH|1234~SUB_REC1|111|222|333|444|5555~SUB_REC1|AAA|BBB|CCC|DDD~SUB_REC2|EEE|FFF|GGG|HHH~SUB_REC2|III|JJJ
**Record_2**:REC|**Record_2**|XYZ|MNO|PQR|1234~SUB_REC1|111|222|333|444|5555~SUB_REC1|AAA|BBB|CCC|DDD~SUB_REC2|EEE|FFF|GGG|HHH~SUB_REC2|III|JJJ

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题