我正在尝试通过PyTorch训练分类器。然而,当我为模型提供训练数据时,我遇到了训练问题。我在y_pred = model(X_trainTensor)
上得到这个错误:
运行时错误:应为标量类型Float的对象,但参数#4“mat1”的标量类型为Double
以下是我的代码的关键部分:
# Hyper-parameters
D_in = 47 # there are 47 parameters I investigate
H = 33
D_out = 2 # output should be either 1 or 0
# Format and load the data
y = np.array( df['target'] )
X = np.array( df.drop(columns = ['target'], axis = 1) )
X_train, X_test, y_train, y_test = train_test_split(X, y, train_size = 0.8) # split training/test data
X_trainTensor = torch.from_numpy(X_train) # convert to tensors
y_trainTensor = torch.from_numpy(y_train)
X_testTensor = torch.from_numpy(X_test)
y_testTensor = torch.from_numpy(y_test)
# Define the model
model = torch.nn.Sequential(
torch.nn.Linear(D_in, H),
torch.nn.ReLU(),
torch.nn.Linear(H, D_out),
nn.LogSoftmax(dim = 1)
)
# Define the loss function
loss_fn = torch.nn.NLLLoss()
for i in range(50):
y_pred = model(X_trainTensor)
loss = loss_fn(y_pred, y_trainTensor)
model.zero_grad()
loss.backward()
with torch.no_grad():
for param in model.parameters():
param -= learning_rate * param.grad
9条答案
按热度按时间6bc51xsx1#
引用来自this github issue。
当错误为
RuntimeError: Expected object of scalar type Float but got scalar type Double for argument #4 'mat1'
时,您需要使用.float()
函数,因为它表示Expected object of scalar type Float
。因此,解决方案是将
y_pred = model(X_trainTensor)
更改为y_pred = model(X_trainTensor.float())
。同样地,当您得到
loss = loss_fn(y_pred, y_trainTensor)
的另一个错误时,您需要y_trainTensor.long()
,因为错误消息显示为Expected object of scalar type Long
。你也可以像@Paddy建议的那样做
model.double()
。c0vxltue2#
在转换为
Tensor
之前,请尝试以下操作:ki1q1bka3#
可以通过将输入的数据类型设置为Double(即
torch.float32
)来修复此问题我希望问题来了,因为你的数据类型是
torch.float64
。您可以在设置数据时避免这种情况,如其他答案中所解释的那样,或者使模型类型也与您的数据相同。即使用float64或float32。
对于调试,打印obj.dtype并检查一致性。
eqfvzcg84#
让我们这样做:
对于x特征也是如此
3yhwsihp5#
如果选择了错误的损失函数,也可能发生此问题。例如,如果你有回归问题,但你试图使用交叉熵损失。然后通过改变MSE上的损失函数来修复
t3irkdon6#
try to用途:target = target.float()# target是错误的名称
ulmd4ohb7#
PyTorch新手出于某种原因,使用所需的数据类型调用
torch.set_default_dtype()
是我在Google Colab上工作的原因。由于某种原因,network.double()
/network.float()
和tensor.double()
/tensor.float()
没有任何影响。kcwpcxri8#
在this answer的基础上,将一种类型的所有列转换为另一种类型。
请注意,这是一个就地操作。
ffx8fchx9#
请尝试以下示例: