PyTorch实现更新部分网络,其他不更新
torch.Tensor.detach()的使用
detach()的官方说明如下:
Returns a new Tensor, detached from the current graph.
The result will never require gradient.
假设有模型A和模型B,我们需要将A的输出作为B的输入,但训练时我们只训练模型B. 那么可以这样做:
input_B = output_A.detach()
它可以使两个计算图的梯度传递断开,从而实现我们所需的功能。
以上这篇PyTorch实现更新部分网络,其他不更新就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。