Pytorch中的Batch Normalization layer踩坑
1. 注意momentum的定义Pytorch中的BN层的动量平滑和常见的动量法计算方式是相反的,默认的momentum=0.1x^ new =(1− momentum )×x^+ momemtum ×xt\hat{x}_{\text { new }}=(1-\text { momentum }) \times \hat{x}+\t...