在Map阶段的中间拆分文件并将其传递给另一个Map程序

sirbozc5  于 2021-06-04  发布在  Hadoop
关注(0)|答案(0)|浏览(196)

我是否可以拆分Map程序正在处理的文件,并在遇到特定句子时将其其余部分发送给另一个Map程序?是否可以在Map之间拆分文件?请在这方面指导我。
我的数据文件格式如下:
以“#”开头的行具有数据记录的“年份”,以及具有特定“年份”数据的后续行的“编号”
随后的行记录了每天的温度,而不是记录一年中的所有日子。所以这些线的数目可能不同
我想找出每年的最高气温。当我不知道我的数据文件在哪一行被拆分时,我该怎么做?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题