缩放基于java的树

q1qsirdb 于 2021-06-01 发布在 Hadoop

关注(0)|答案(1)|浏览(364)

我用java编写了一个树，它支持多个子节点和边。到目前为止，我还不必担心这个应用程序的扩展。用例现在要求搜索和维护100个或更多的树示例。
我在这个领域做的研究很少。首先想到的是Spark。不过，我的理解是，spark批量处理事件窗口——几乎删除了“in-stream”方面。时间在这里非常关键。
所以我想利用hadoop的文件系统。在集群中索引树并使用mapreduce进行维护。
我不介意好好读书。如果有任何文章，教程，或建议，将不胜感激。
干杯

Java hadoop hdfs apache-spark scalability

来源：https://stackoverflow.com/questions/44414212/scaling-a-java-based-tree

1条答案

按热度按时间

iugsix8n1#

Hadoop 以及 Spark 都是分布式处理系统。 Spark 旨在克服 Hadoop 系统。 Hadoop 有两个部分，一个叫做 hdfs 以及一种叫做 map-reduce . Spark 是在分析 map-reduce . 因此 RDD （弹性分布式数据集）在 spark 用于内存中的分布式处理。更多信息可以在apachespark和jacek中找到
我们可以使用强大的hadoop文件系统 Spark 处理也一样。
如果你愿意 spark ，您将学习函数式编程 scala 或者 python 或者 R . Hadoop 依赖于 map-reduce 要遵循的算法有点复杂。
还有一些 api s表示scala中的树，也有uderway的作品，例如this和this
我希望这是有帮助的。

赞(0）回复(0）举报 2021-06-01

我来回答

缩放基于java的树

1条答案

相关问题

热门标签

最新问答