假设我们有一个包含5 TB数据的表,其中有10个RegionServer。我们想继续在表中对广泛分布的行ID进行PUT。在这种情况下,增加区域服务器会有帮助,还是减少到较少的区域服务器会有帮助?考虑区域大小是256MB。
bq9c1y661#
如果你想要更快的写入速度,可以使用随机行键(写入负载将被分配),但不适合顺序读取。您可以从10个rs开始,然后根据您的写吞吐量,您可以执行日常维护作业,这些作业将对您所在的区域执行热剥离和压缩。
1条答案
按热度按时间bq9c1y661#
如果你想要更快的写入速度,可以使用随机行键(写入负载将被分配),但不适合顺序读取。您可以从10个rs开始,然后根据您的写吞吐量,您可以执行日常维护作业,这些作业将对您所在的区域执行热剥离和压缩。