可爱唇彩的博客_电脑硬件,云主机,JavaScript,python编程,JSP编程,域名alexa,Photoshop教程,Fireworks教程,transformer领域博主 – 靠谱客

可爱唇彩

文章

资源

加入时间

3年1月8天

transformer中的缩放点积注意力为什么要除以根号d

transformer中的缩放点积注意力为什么要除以根号d

前段时间在看transformer的时候，看到他的self-attention机制的公式里需要除以维度的算术平方根，想了一会没有想明白。回去看原论文。作者认为，当d较大时，点积的幅度也就变大，容易进入softmax函数的梯度消失区域。什么叫点积的幅度变大？这里作者指的应该是方差会变大。点积之后，数据的方差会改变，不等同于原分布。这就需要我们进行一个操作使方差等同于原分布。假设原分布是标准正态分布，那为什么需要除以根号d来归一化到标准正态分布呢？我尝试自己推导一下公式。

transformer 2023-12-10 51 点赞 0 评论 77 浏览

Fireworks怎么修改字体?FW修改字体方法

Fireworks怎么修改字体?FW修改字体方法

Fireworks怎么修改字体，说实话我觉的Fireworks修改字体非常不错，下面小编小编就为大家FW修改字体方法，操作很简单的，大家学会了吗？希

Fireworks教程 2022-04-09 114 点赞 1 评论 172 浏览

photoshop抠图教程：毛茸茸的蒲公英

photoshop抠图教程：毛茸茸的蒲公英

原图最终效果上一页12 3 4 5 下一页阅读全文

Photoshop教程 2022-04-08 108 点赞 1 评论 163 浏览

域名投资人三年来投资域名的感悟

域名投资人三年来投资域名的感悟

我是上班族，平时有点时间，单位随时在线，总想在不影响工作下做点喜欢的事。　　于是06年年底入市，算起来已经三年多了。　　开始是被媒

域名alexa 2022-04-08 203 点赞 3 评论 307 浏览

他的专栏

电脑硬件（0）

云主机（0）

JavaScript（0）

python编程（0）

JSP编程（0）

域名alexa（1）

Photoshop教程（1）

Fireworks教程（1）

transformer（1）

他的归档

2023年12月（1）

2022年04月（3）

热门文章

1

域名投资人三年来投资域名的感悟

2

photoshop抠图教程：毛茸茸的蒲公英

3

Fireworks怎么修改字体?FW修改字体方法

4

transformer中的缩放点积注意力为什么要除以根号d

立即
投稿返回
顶部