这是我的设想。输入json数据流到flume,需要对其进行索引并以近乎实时的方式存储到solr中。我正在使用最新的cdh版本。我发现文件不完整。有些地方是断开的。你能给我指一下这里的正确方向吗?我应该用变形线Flume说不要做任何变换吗?或者如果我不想对json进行任何转换,我可以使用其他接收器直接写入solr吗?指向具有清晰步骤的文档的指针或者请以一步一步的形式列出你会做什么(当然,非常高的水平)。
xfyts7mz1#
这里有几点提示:1) 如果源代码是rabbitmq,那么jmssource就是正确的组件。2) 除了编写自己的solr自定义源代码之外,我建议您使用morphlinesolrsink,不进行任何转换。它就像一个符咒。如果不必转换或修改内容,可以实现自己的自定义处理程序或使用拦截器。请记住,solr记录的数量必须与源接收到的事件数量相对应。
1条答案
按热度按时间xfyts7mz1#
这里有几点提示:
1) 如果源代码是rabbitmq,那么jmssource就是正确的组件。
2) 除了编写自己的solr自定义源代码之外,我建议您使用morphlinesolrsink,不进行任何转换。它就像一个符咒。如果不必转换或修改内容,可以实现自己的自定义处理程序或使用拦截器。请记住,solr记录的数量必须与源接收到的事件数量相对应。