AutoGPTQ GPTQ支持MPT模型

当前的类并未实现transformers库的所有方面 - 例如，它不支持device_map=True设置，也不支持可以设置为获取注意力的布尔标志output_attentions:https://huggingface.co/mosaicml/mpt-7b/blob/main/modeling_mpt.py#L140
我在MPT HF仓库上添加了一个问题，但尚未收到回复：https://huggingface.co/mosaicml/mpt-7b/discussions/30#6468e642b2321e47d3277f26
此外，我不确定如何提交PR以在MPTForCausalLM中进行此更改。我认为这不应该很难。

赞(0）回复(0）举报 5个月前

fjaof16o6#

@PanQiWei 这是一个旧问题，但我希望看到一些更新的支持，例如MPT和Falcon。
MPT不断推出新的型号，我们现在有30B-8k和7B-8k,所以如果你们能支持这些型号或者给我指明方向的话，我会非常感激的。：)
#73尝试添加支持，但不幸的是它不起作用。

赞(0）回复(0）举报 5个月前

zzlelutf7#

@PanQiWei 这是一个旧问题，但我希望能看到一些关于MPT和Falcon模型的更新支持。
MPT不断推出新的型号，我们现在有了30B-8k和7B-8k,所以如果你能看一下支持这些型号或者给我指明方向的话，我会非常感激。：)
#73尝试添加支持，但不幸的是它不起作用。
我已经将PR同步到主分支。你可以尝试使用它们的最新代码看看这些型号是否还能工作。

赞(0）回复(0）举报 5个月前

zqry0prt8#

@PanQiWei 这是一个旧问题，但我希望能看到一些关于MPT和Falcon模型的更新支持。

MPT不断推出新的模型，我们现在有了30B-8k和7B-8k,所以如果你能看一下支持这些模型或者给我指明方向的话，我会非常感激。：)

#73尝试添加支持，但不幸的是它不起作用。

我已经将PR同步到主分支。你可以尝试使用最新的代码看看这些模型是否还能正常工作。

MPT仍然没有直接返回attention_mask,这导致了错误。https://github.com/mosaicml/llm-foundry/blob/main/llmfoundry/models/mpt/modeling_mpt.py#L235

赞(0）回复(0）举报 5个月前

我来回答

AutoGPTQ GPTQ支持MPT模型

8条答案

相关问题

热门标签

最新问答