你好,
有人能帮我解决如何使用ctranslate2运行core42/jais-13b-chat模型的问题吗?我运行了转换脚本,但遇到了错误。使用的脚本是:ct2-transformers-converter --model core42/jais-13b-chat --quantization bfloat16 --output_dir jais-13b-ct2 --trust_remote_code
错误: ValueError: No conversion is registered for the model configuration JAISConfig (supported configurations are: BartConfig, BertConfig, BloomConfig, CodeGenConfig, DistilBertConfig, FalconConfig, GPT2Config, GPTBigCodeConfig, GPTJConfig, GPTNeoXConfig, LlamaConfig, M2M100Config, MBartConfig, MPTConfig, MT5Config, MarianConfig, MixFormerSequentialConfig, OPTConfig, PegasusConfig, RWConfig, T5Config, WhisperConfig, XLMRobertaConfig)
4条答案
按热度按时间sbdsn5lh1#
如果你们能调查这个问题或者至少提供指导,那将是非常大的帮助。
gudnpqoy2#
如消息所示,它不在支持的模型列表中。也许您可以尝试查看它与另一个模型的距离有多近,然后适配加载器。
sh7euo9m3#
感谢您的快速回复!
我确实编写了一个Jais的适配器(以下是代码),并成功转换了模型,但在使用ct2进行推理时,遇到了cublas_not_supported错误(这基本上表明在层之间存在错误的矩阵乘法,因此转换存在问题)。以下是适配器类的代码:
这里是实际模型架构的参考:
请花点时间(如果可以的话)审查这段代码,并告诉我是否存在任何缺陷。提前谢谢!
owfi6suc4#
正如您在第二个输出中所看到的,您有卷积层,因此您不能简单地从另一个常规GPT模型中复制粘贴加载器。请查看whisper加载器,但这并不像它看起来那样直接。