从日志中可以看出,问题出在模型的sampler
属性上。错误提示为:AttributeError: 'LlamaForCausalLM' object has no attribute 'sampler'. Did you mean: 'sample'?
。这意味着LlamaForCausalLM
模型没有sampler
属性,可能是因为使用了错误的属性名。
要解决这个问题,你需要检查你的代码,确保使用正确的属性名。如果你想要使用采样功能,可以尝试将sampler
替换为sample
。
(RayWorkerWrapper pid=7834) mngc-001:7834:7834 [7] NCCL INFO Trees [0] -1/-1/-1->7->6 [1] -1/-1/-1->7->6 [2] -1/-1/-1->7->6 [3] -1/-1/-1->7->6 [4] -1/-1/-1->7->6 [5] -1/-1/-1->7->6 [6] -1/-1/-1->7->6 [7] -1/-1/-1->7->6 [8] -1/-1/-1->7->6 [9] -1/-1/-1->7->6 [10] -1/-1/-1->7->6 [11] -1/-1/-1->7->6 [12] -1/-1/-1->7->6 [13] -1/-1/-1->7->6 [14] -1/-1/-1->7->6 [15] -1/-1/-1->7->6 [16] -1/-1/-1->7->6 [17] -1/-1/-1->7->6 [18] -1/-1/-1->7->6 [19] -1/-1/-1->7->6 [20] -1/-1/-1->7->6 [21] -1/-1/-1->7->6 [22] -1/-1/-1->7->6 [23] -
(RayWorkerWrapper pid=7834) mngc-001:7834:7834 [7] NCCL INFO P2P Chunksize set to 524288 [repeated 2x across cluster]
(RayWorkerWrapper pid=7834) mngc-001:7834:7834 [7] NCCL INFO Channel 23/0 :[7 -> 6][6 -> 4][4 -> 2][2 -> 0][0 -> ...](重复了59次,共跨越了集群)
1条答案
按热度按时间6gpjuf901#
如果你能用fp8权重运行,它将起作用。否则需要#6911来完成。