我想在hadoop中将csv文件自定义拆分为对象,然后将对象列表作为Map器的输入。我不确定hadoop的mapper是否可以将对象作为输入?如果可能的话,请告诉我好吗。谢谢你的回复,普拉文。这真的很有帮助。我遵循了教程,它帮助了我。
5gfr0r5j1#
在这种情况下,自定义inputformat应该很好。这里是一个关于创建相同的教程。k或v可以指定传递给Map器的对象。是k还是v并不重要。
1条答案
按热度按时间5gfr0r5j1#
在这种情况下,自定义inputformat应该很好。这里是一个关于创建相同的教程。k或v可以指定传递给Map器的对象。是k还是v并不重要。