Paddle paddle-gpu的训练过程,是所有迭代过程间的计算并行,还是一次迭代内部计算的并行?

r3i60tvu  于 2021-11-29  发布在  Java
关注(0)|答案(2)|浏览(282)

请问paddle-gpu的训练过程,是所有迭代过程间的并行,还是一次迭代过程内部的并行?

p8ekf7hl

p8ekf7hl1#

看不太懂问题。

目前是一个 batch, all reduce 的方式更新的

s5a0g9ez

s5a0g9ez2#

感谢解答!
paddle gpu版本,训练阶段在gpu并行时,是batch间并行(多个batch同时计算loss、梯度、更新等),还是只是一个batch内部运算时并行(loss、梯度等运算本身并行)?

相关问题