hadoop：如何创建自动增量id

uklbhaso 于 2021-06-03 发布在 Hadoop

关注(0)|答案(1)|浏览(316)

我需要一个 AUTO_INCREMENT hadoop中的id。
当我的reduce任务标识一个新项时，这些项需要分配一个唯一的id。
如何在集群中共享原子计数器？报告器计数器似乎只是增量计数器，我看不到getandincrement特性。
如何在作业的map/reduce阶段开始之前设置计数器？

hadoop mapreduce auto-increment

来源：https://stackoverflow.com/questions/13096804/hadoop-how-to-create-an-auto-increment-id

1条答案

按热度按时间

7xzttuei1#

要执行分布式id生成，您可以只生成uuid，也可以使用apachezookeeper中的功能，后者可以在hadoop集群上进行分布式协调。免责声明：我从来没有使用过zookeeper，所以我不知道你是否真的能（甚至理论上）得到一个全局连续的ID集，这似乎就是问题所在。
不过，生成uuid确实有成本；它们需要一些时间来产生。
有关分布式id生成的一般信息，请参阅这个堆栈溢出问题。

赞(0）回复(0）举报 2021-06-03

我来回答

hadoop：如何创建自动增量id

1条答案

相关问题

热门标签

最新问答