pytorch常见问题

1 Gather function not implemented for CPU tensors

多卡训练时候,net的forward里面存在Tensor变成其它类型的操作,比如变成numpy,list

解决:改成Tensor操作

2 RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn

https://blog.csdn.net/weixin_41990278/article/details/90311313

https://blog.csdn.net/wu_xin1/article/details/116502378

调节学习率

当学习率过大的时候会导致模型难以收敛,过小的时候会收敛速度过慢,合理的学习率才能让模型收敛到最小点而非局部最优点或鞍点

经验值: 0.01 ~ 0.001

学习率衰减

原因:起初距离目标偏离大,可以设置较大,为了快速收敛,后续逐渐靠近目标,需要精细化一点,所以希望值小一点

分类

1.轮数衰减

每经过k个epochs后学习率减半

2.指数衰减

3.分数衰减

参考

https://blog.csdn.net/LiuPeiP_VIPL/article/details/119581343


:D 一言句子获取中...