概述
腾讯一面问的,这个知识点平常从未遇到过,当时是以为是朴素贝叶斯的平滑方法,说了Add-1 Add-k interpolation good turning smoothing,但没想到还有标签平滑这个东西。笔者当时才研一上学期不到… 刚学习NLP!哈哈
产生背景
工作原理
可以看出,损失比之前增加了,他的标签平滑的原理是对真实标签做了改变,
源码里的公式为:
new_onehot_labels = onehot_labels * (1 - label_smoothing) + label_smoothing / num_classes
腾讯一面问的,这个知识点平常从未遇到过,当时是以为是朴素贝叶斯的平滑方法,说了Add-1 Add-k interpolation good turning smoothing,但没想到还有标签平滑这个东西。笔者当时才研一上学期不到… 刚学习NLP!哈哈
最后
以上就是发嗲狗为你收集整理的标签平滑解析产生背景工作原理的全部内容,希望文章能够帮你解决标签平滑解析产生背景工作原理所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复