描述bug
对bug进行清晰简洁的描述。model.quantize(examples, use_triton=False)
获取错误torch._C._LinAlgError: linalg.cholesky: The factorization could not be completed because the input is not positive-definite (the leading minor of order 16383 is not positive-definite).
硬件详情
关于CPU和GPU的信息,例如RAM数量等。
GPU A40
软件版本
相关软件的版本,如操作系统、cuda工具包、python、auto-gptq、pytorch、transformers、accelerate等。
8条答案
按热度按时间vkc1a9a21#
请展示您正在运行的完整代码,以便我们可以看到什么模型/模型类型等。
yhived7q2#
h5qlskok3#
在这里,使用LLAMA-30B的示例代码
64jmpszr4#
我在torch2.0.1上运行了代码。
bf1o4zei5#
相同的问题
eagi6jfj6#
我再次尝试了一下,这次成功了。
e1xvtsh37#
为什么可以了,是换机器还是环境?
weylhg0b8#