1.如何在训练过程中冻结参数,求给一个示例
2.我们save_params的参数格式是16 * 768,如何截取前2 * 768个参数并重新save成相同格式?
x8diyxa71#
1.您指的冻结参数是指停止梯度回传吗?这里有一个示例。2.paddle目前暂不支持这种操作哈
jucafojl2#
哇,为什么会有16 * 768的网络层参数呀,是用在什么地方的,好奇
93ze6v8z3#
poly-encoder
3条答案
按热度按时间x8diyxa71#
1.您指的冻结参数是指停止梯度回传吗?这里有一个示例。
2.paddle目前暂不支持这种操作哈
jucafojl2#
哇,为什么会有16 * 768的网络层参数呀,是用在什么地方的,好奇
93ze6v8z3#
哇,为什么会有16 * 768的网络层参数呀,是用在什么地方的,好奇
poly-encoder