宜配屋

pytorch 实现模型不同层设置不同的学习率方式

yipeiwu_com6年前 (2020-03-06)Python基础

在目标检测的模型训练中，我们通常都会有一个特征提取网络backbone，例如YOLO使用的darknet SSD使用的VGG-16。

为了达到比较好的训练效果，往往会加载预训练的backbone模型参数，然后在此基础上训练检测网络，并对backbone进行微调，这时候就需要为backbone设置一个较小的lr。

class net(torch.nn.Module):
  def __init__(self):
    super(net, self).__init__()
    # backbone
    self.backbone = ...
    # detect
    self....

在设置optimizer时，只需要参数分为两个部分，并分别给定不同的学习率lr。

base_params = list(map(id, net.backbone.parameters()))
logits_params = filter(lambda p: id(p) not in base_params, net.parameters())
params = [
  {"params": logits_params, "lr": config.lr},
  {"params": net.backbone.parameters(), "lr": config.backbone_lr},
]
optimizer = torch.optim.SGD(params, momentum=config.momentum, weight_decay=config.weight_decay)

以上这篇pytorch 实现模型不同层设置不同的学习率方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持【听图阁-专注于Python设计】。

pytorch 实现模型不同层设置不同的学习率方式

相关文章

Pycharm中Python环境配置常见问题解析

django 实现编写控制登录和访问权限控制的中间件方法

Python中生成一个指定长度的随机字符串实现示例

Python实现程序的单一实例用法分析

Python使用OpenCV进行标定

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

pytorch 实现模型不同层设置不同的学习率方式

相关文章

Pycharm中Python环境配置常见问题解析

django 实现编写控制登录和访问权限控制的中间件方法

Python中生成一个指定长度的随机字符串实现示例

Python实现程序的单一实例用法分析

Python使用OpenCV进行标定

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号