用neo4j自动化hadoop

zengzsys  于 2021-05-29  发布在  Hadoop
关注(0)|答案(0)|浏览(365)

使用neo4j和hadoop的最佳方法是什么?我必须在管理面板中显示输出。我的限制是-大量的数据和查询操作。
我现在想的是,
将数据引入hadoop,执行etl操作并将其写回系统。将此转换为作业并将其设置为重复执行。对导出的数据使用neo4j。这条路对吗?
当我搜索它时,我发现了一篇文章
过去有一些方法使用hadoop直接快速生成neo4j数据存储。虽然这种方法很有效,但它还与特定neo4j版本的存储格式紧密耦合,因为它必须复制写入功能以分割存储文件。有了并行的neo4j导入工具和neo4j 2.2中引入的api,这样的解决方案就不再需要了。导入设施跨大量CPU扩展以最大化导入性能。
这是否意味着就大型数据集而言,neo4j不再需要hadoop进行数据处理?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题