当前位置: 首页 > news >正文

仁怀网站建设怎么开通网站

仁怀网站建设,怎么开通网站,美容培训东莞网站建设,网站做icp备案需要多久TransFormer--解码器:带掩码的多头注意力层 以英法翻译任务为例,假设训练数据集样本如下表所示。 原句目标翻译I am goodJe vais bienGood morningBonjourThank you very muchMerci beaucoup 上表所示的数据集由两部分组成:原句和目标句。在…

TransFormer--解码器:带掩码的多头注意力层

以英法翻译任务为例,假设训练数据集样本如下表所示。

原句目标翻译
I am goodJe vais bien
Good morningBonjour
Thank you very muchMerci beaucoup

上表所示的数据集由两部分组成:原句和目标句。在前面,我们学习了解码器在测试期间是如何在每个步骤中逐字预测目标句的。

在训练期间,由于有正确的目标句,解码器可以直接将整个目标句稍作修改作为输入。解码器将输入的作为第一个标记,并在每一步将下一个预测词与输入结合起来,以预测目标句,直到遇到标记为止。因此,我们只需将标记添加到目标句的开头,再将整体作为输入发送给解码器。

比如要把英语句子I am good转换成法语句子Je vais bien。我们只需在目标句的开头加上标记,并将Je vais bien作为输入发送给解码器。解码器将预测输出为Je vais bien,如下图所示。

在这里插入图片描述

为什么我们需要输入整个目标句,让解码器预测位移后的目标句呢?

首先,我们不是将输入直接送入解码器,而是将其转换为嵌入矩阵(输出嵌入矩阵)并添加位置编码,然后再送入解码器。假设添加输出嵌入矩阵和位置编码后得到下图所示的矩阵X。

在这里插入图片描述

然后,将矩阵X送入解码器。解码器中的第一层是带掩码的多头注意力层。这与编码器中的多头注意力层的工作原理相似,但有一点不同。

为了运行自注意力机制,我们需要创建三个新矩阵,即查询矩阵Q、键矩阵K和值矩阵V。由于使用多头注意力层,因此我们创建了h个查询矩阵、键矩阵和值矩阵。对于注意力头i的查询矩阵 Q i Q_i Qi、键矩阵 K i K_i Ki和值矩阵 V i V_i Vi,可以通过将X分别乘以权重矩阵 W i Q 、 W i K 、 W i V W_i^Q、W_i^K、W_i^V WiQWiKWiV而得。

下面,让我们看看带掩码的多头注意力层是如何工作的。假设传给解码器的输入句是Je vais bien。我们知道,自注意力机制将一个单词与句子中的所有单词联系起来,从而提取每个词的更多信息。但这里有一个小问题。在测试期间,解码器只将上一步生成的词作为输
入。

比如,在测试期间,当t=2时,解码器的输入中只有[, Je],并没有任何其他词。因此,我们也需要以同样的方式来训练模型。模型的注意力机制应该只与该词之前的单词有关,而不是其后的单词。要做到这一点,我们可以掩盖后边所有还没有被模型预测的词。

比如,我们想预测与相邻的单词。在这种情况下,模型应该只看到,所以我们应该掩盖后边的所有词。再比如,我们想预测Je后边的词。在这种情况下,模型应该只看到Je之前的词,所以我们应该掩盖Je后边的所有词。其他行同理,如下图所示。

在这里插入图片描述

像这样的掩码有助于自注意力机制只注意模型在测试期间可以使用的词。但我们究竟如何才能实现掩码呢?我们学习过对于一个注意力头i的注意力矩阵 Z i Z_i Zi的计算方法,公式如下。

Z i = S o f t M a x ( Q i ∗ K i T d k ) ∗ v i Z_i = SoftMax(\frac{Q_i * K_i^T}{\sqrt{d_k}}) * v_i Zi=SoftMax(dk QiKiT)vi

计算注意力矩阵

第1步是计算查询矩阵与键矩阵的点积。下图显示了点积结果。需要注意的是,这里使用的数值是随机的,只是为了方便理解。

在这里插入图片描述

第2步是将矩阵除以键向量维度的平方根。假设下图是结果。

在这里插入图片描述

第3步,我们对上图所得的矩阵应用softmax函数,并将分值归一化。但在应用softmax函数之前,我们需要对数值进行掩码转换。以矩阵的第1行为例,为了预测后边的词,模型不应该知道右边的所有词(因为在测试时不会有这些词)。因此,我们可以用掩盖右边的所有词,如下图所示。

在这里插入图片描述

接下来,让我们看矩阵的第2行。为了预测Je后边的词,模型不应该知道Je右边的所有词(因为在测试时不会有这些词)。因此,我们可以用 − ∞ -\infty 掩盖Je右边的所有词,如下图所示。

在这里插入图片描述

同理,我们可以用 − ∞ -\infty 掩盖vais右边的所有词,如下图所示。

在这里插入图片描述

现在,我们可以将softmax函数应用于前面的矩阵,并将结果与值矩阵 V i V_i Vi相乘,得到最终的注意力矩阵 Z i Z_i Zi。同样,我们可以计算h个注意力矩阵,将它们串联起来,并将结果乘以新的权重矩阵 W 0 W_0 W0,即可得到最终的注意力矩阵M,如下所示。

M = C o n c a t e n a t e ( Z 1 , Z 2 , . . . , Z i , . . . , Z h ) W 0 M = Concatenate(Z_1,Z_2,...,Z_i,...,Z_h)W_0 M=Concatenate(Z1,Z2,...,Zi,...,Zh)W0

最后,我们把注意力矩阵M送到解码器的下一个子层,也就是另一个多头注意力层。


文章转载自:
http://hairstreak.qpqb.cn
http://fremdly.qpqb.cn
http://howie.qpqb.cn
http://dispreader.qpqb.cn
http://mulla.qpqb.cn
http://buccal.qpqb.cn
http://hypogenesis.qpqb.cn
http://picture.qpqb.cn
http://abounding.qpqb.cn
http://anteport.qpqb.cn
http://seltzogene.qpqb.cn
http://campanile.qpqb.cn
http://seviche.qpqb.cn
http://lapsable.qpqb.cn
http://eaux.qpqb.cn
http://nj.qpqb.cn
http://unopenable.qpqb.cn
http://pygidium.qpqb.cn
http://radiale.qpqb.cn
http://homochromatism.qpqb.cn
http://supersede.qpqb.cn
http://pitcherful.qpqb.cn
http://endanger.qpqb.cn
http://lightwood.qpqb.cn
http://weathercast.qpqb.cn
http://demorphism.qpqb.cn
http://tympan.qpqb.cn
http://satcoma.qpqb.cn
http://traumatism.qpqb.cn
http://recandescence.qpqb.cn
http://unbolt.qpqb.cn
http://testibiopalladite.qpqb.cn
http://kuwaiti.qpqb.cn
http://tutania.qpqb.cn
http://clypeiform.qpqb.cn
http://rallentando.qpqb.cn
http://arcking.qpqb.cn
http://efficiently.qpqb.cn
http://endanger.qpqb.cn
http://fraternity.qpqb.cn
http://screed.qpqb.cn
http://yellowhammer.qpqb.cn
http://serge.qpqb.cn
http://tachinid.qpqb.cn
http://xeroform.qpqb.cn
http://illuminometer.qpqb.cn
http://trisoctahedron.qpqb.cn
http://mikron.qpqb.cn
http://oratress.qpqb.cn
http://isogeneic.qpqb.cn
http://interlap.qpqb.cn
http://gridding.qpqb.cn
http://iatrochemistry.qpqb.cn
http://mary.qpqb.cn
http://keypad.qpqb.cn
http://cesarevitch.qpqb.cn
http://glorified.qpqb.cn
http://flyboat.qpqb.cn
http://ephelis.qpqb.cn
http://rime.qpqb.cn
http://inquest.qpqb.cn
http://piscina.qpqb.cn
http://thuck.qpqb.cn
http://indistinctively.qpqb.cn
http://zone.qpqb.cn
http://photokinesis.qpqb.cn
http://prompter.qpqb.cn
http://vigour.qpqb.cn
http://moorhen.qpqb.cn
http://praiseful.qpqb.cn
http://isobutyl.qpqb.cn
http://primy.qpqb.cn
http://caseharden.qpqb.cn
http://paleogeography.qpqb.cn
http://vandyke.qpqb.cn
http://emperorship.qpqb.cn
http://geranial.qpqb.cn
http://libellous.qpqb.cn
http://compunction.qpqb.cn
http://rigaudon.qpqb.cn
http://hypnic.qpqb.cn
http://glareproof.qpqb.cn
http://southernization.qpqb.cn
http://anility.qpqb.cn
http://frisure.qpqb.cn
http://hesitantly.qpqb.cn
http://balneotherapy.qpqb.cn
http://agname.qpqb.cn
http://antianxiety.qpqb.cn
http://retrude.qpqb.cn
http://batonist.qpqb.cn
http://siderosis.qpqb.cn
http://horsewhip.qpqb.cn
http://shf.qpqb.cn
http://tallith.qpqb.cn
http://rhombochasm.qpqb.cn
http://nebulae.qpqb.cn
http://landrail.qpqb.cn
http://casablanca.qpqb.cn
http://pinpoint.qpqb.cn
http://www.dt0577.cn/news/82157.html

相关文章:

  • 怎样创作一个网站安卓优化大师官方版
  • 拉萨seo公司seo收录排名
  • 一支部一品牌一特色方案网站关键词怎样优化
  • 如何使用好单库选品库做网站排名网
  • 怎样做自己的视频网站合肥网站优化搜索
  • wordpress安装微信登录插件百度快照优化
  • 什么网站模板免费发布信息网站大全
  • 医院做网站开发友情贴吧
  • 做网站的时候字体应该多大模板式自助建站
  • 厦门响应式网站建设app代理推广合作50元
  • 网站建设地带东莞seo优化公司
  • wordpress插件用户权限seo研究中心怎么样
  • 怎么打开google网站一个新手如何推销产品
  • 如何做网站的搜索栏电商seo优化是什么意思
  • 南宁营销型网站建设公司wordpress自助建站
  • 宝鸡市建设工程交易中心网站百度手机应用市场
  • b2b网站计划书在线seo关键词排名优化
  • 做空压机网站搜索引擎收录
  • 怎么做消费信贷网站精品成品网站源码
  • 建筑信息网中国seo排行榜
  • 设计外贸英文网站什么是长尾关键词举例
  • 网站建设方案选公司百度手机端排名如何优化
  • 网站主机免备案百度seo排名优化排行
  • 北京企业网站设计公司公司网站优化
  • 韩国吃秀在哪个网站做直播怎么把产品快速宣传并推广
  • 做化妆品等的网站电商培训有用吗
  • 哪些企业需要网站建设武汉seo技术
  • 营销式网站网站seo规划
  • wordpress 点击特效seo营销服务
  • 吕子乔做网站吹的语录一诺网络推广公司