我正在AmazonEMR上使用ApacheHive从AmazonDynamodB批量下载一些数据到AmazonS3。我收到以下警告:
警告:dynamodb表jobdetails的配置写入吞吐量小于集群Map容量。clustermapcapacity:20写入吞吐量:5
警告:对此表的写入可能会导致该表的写入中断。
我想 WriteThroughput
与dynamodb表的配置有关。
这个警告是什么意思?是 ClusterMapCapacity
与我的电子病历集群有关?
这个警告是我应该解决的问题,还是我可以忽略它?
1条答案
按热度按时间c7rzv4ha1#
是的,你应该解决这个问题。
最多可以有20个Map作业同时写入表,而表每秒只接受5个写入请求。
所以,您需要在表上至少有20个写容量(如果map每秒可以写多次,甚至更多),以避免限制(限制意味着数据可能丢失)。