import torch
import torch.nn as nn
visual_projection = nn.Linear(768, 512, bias=False)
embeds = visual_projection(pooled_output)
我人为添加了一个Map层,发现和ChineseCLIPModel求出来的编码不一样。
import torch
import torch.nn as nn
visual_projection = nn.Linear(768, 512, bias=False)
embeds = visual_projection(pooled_output)
我人为添加了一个Map层,发现和ChineseCLIPModel求出来的编码不一样。
1条答案
按热度按时间zf2sa74q1#
应该是预训练参数的问题,但是为什么只提供没有投影的版本呢?