我正在运行hadoop,集群中有两个配置相同的服务器。它们运行相同的任务、相同的配置、相同的所有内容,并且都完全专用于hadoop任务节点(worker)。
我在这个集群中运行的作业是高度io限制的。
在一台服务器上我看到 60-100MB/sec
的 IO
和一个 CPU load
的 5-10
,在我看到的另一台服务器上 40-60MB/sec
的 IO
和一个 CPU load of 60-90
(即使运行一个简单的shell,这个盒子也几乎无法使用)。
我已经跑了 smartctl
没有任何磁盘警告。
有没有关于我下一步可能做什么来确定这些框之间的根本区别的建议?经过数小时的处理,这些结果是一致的。
1条答案
按热度按时间jecbmhm31#
它嗅到4096字节物理磁盘/512字节逻辑磁盘扇区上的分区未对齐。