python-3.x 无法导入Transformers AutoModelForCasualLM

4nkexdtk 于 2023-10-21 发布在 Python

关注(0)|答案(2)|浏览(482)

我试图按照this article使用transformers的AutoModelForCasualLM来生成bloom文本。但是我一直得到一个错误，说python不能从transformers中AutoModelForCasualLM。我试过多台电脑和多个版本的变压器，但我总是得到以下错误。（来源于最新版本的transformers）

---------------------------------------------------------------------------
ImportError                               Traceback (most recent call last)
Cell In[28], line 1
----> 1 from transformers import AutoTokenizer, AutoModelForCasualLM, BloomConfig
      2 from transformers.models.lboom.modeling_bloom import BloomBlock, build_alibi_tensor

ImportError: cannot import name 'AutoModelForCasualLM' from 'transformers' (/mnt/MLDr/venv/lib/python3.10/site-packages/transformers/__init__.py)

发生错误的代码片段（前10行）：

import os
import torch
import torch.nn as nn
from collections import OrderedDict
def get_state_dict(shard_num, prefix=None):
    d = torch.load(os.path.join(model_path, f"pytorch_model_{shard_num:05d}-of-00072.bin"))
    return d if prefix is None else OrderedDict((k.replace(prefix, ''), v) for k, v in d.items())
from transformers import AutoTokenizer, AutoModelForCasualLM, BloomConfig
from transformers.models.lboom.modeling_bloom import BloomBlock, build_alibi_tensor
model = "./bloom"
config = BloomConfig.from_pretrained(model_path)
device = 'cpu'

transformers-EQUENV结果：