在hadoop层叠流中,我有许多元组,这些元组被处理,最后我进入了一个目的地。
现在我的要求是:在目标文件的开头和结尾使用定义的常量字符串值接收元组。
例如:我有以下输入元组
10|11|12|13|14|15|16|17|18|19|20
20|21|22|23|24|25|26|27|28|29|30
1|2|3|4|5|6|7|8|9|10
现在我需要这样的输出:
Certain data before those data
10|11|12|13|14|15|16|17|18|19|20
20|21|22|23|24|25|26|27|28|29|30
1|2|3|4|5|6|7|8|9|10
Certain data after those data
我搜索了一点存储库类delimitedparser及其方法,如joinline、joinfirstline,但由于文档不足,我无法获得它的确切含义。
1条答案
按热度按时间9vw9lbht1#
这可能取决于“这些数据之前的某些数据”是什么意思?如果您使用的是textdimited,那么可以将头值转储到接收器中。默认情况下,头值不是按照文档编写的,因此需要启用它。另一件要记住的事情是,头值代表输出字段。
-阿米特