当前位置: 首页 > news >正文

小学校园网站建设简介平台推广计划

小学校园网站建设简介,平台推广计划,短链接生成网,上海闸北城市建设有限公司网站一、结构 上面那个图其实不是那么重要,只要知道将输入的x矩阵转换成三个矩阵进行计算即可。自注意力结构的输入为 输入矩阵的三个变形 Q(query矩阵)、K(key矩阵)、V(value矩阵)构成,…

一、结构

上面那个图其实不是那么重要,只要知道将输入的x矩阵转换成三个矩阵进行计算即可。自注意力结构的输入为 输入矩阵的三个变形 Q(query矩阵)、K(key矩阵)、V(value矩阵)构成,那么Q、K、V是如何得到的呢?

假设输入矩阵是 M*N的一个矩阵,也就是意味着输入有M个单词,则:

1.1 Q矩阵:

1.2 K矩阵:

1.3 V矩阵:

注:作为中间矩阵的行数必须是N的,否则不能做矩阵乘法,且Q、K两个矩阵必须行列一致,否则不能保持最后的Q、K、V矩阵行列一致。

二、self-Attention输出

计算公式如下:

 即计算Q矩阵与K矩阵的乘积,得到了一个N * N的矩阵,N为单词个数:

为了避免数值过大,除了向量维度的平方根。

接着计算每个单词对于其他单词的注意力系数,由于是对每一行过Softmax函数,则每行之和为1.

最后将得到的注意力系数矩阵与V矩阵相乘:

eg:word1如何计算得到z1:

 

Reference:Transformer模型详解(图解最完整版) - 知乎

http://www.dt0577.cn/news/16421.html

相关文章:

  • 最新网站模板免费下载怎么制作网页页面
  • 一般的信息网站用什么做宣传渠道有哪些
  • 慈溪网站建设网站页面seo
  • 做网站一个月赚多少爱站
  • 台州 网站建设微信卖货小程序怎么做
  • 深圳做网站排名公司哪家好互联网营销师证书怎么考多少钱
  • 建个人网站做导购怎么备案外贸营销型网站建设公司
  • 做日语字幕的网站google推广 的效果
  • 电子商务网站开发的基本原则?外贸网站优化
  • 太原网站建设方案策划免费推广网站大全
  • 有空间站的国家seo北京公司
  • 企业公司做网站最新军事消息
  • 经过开发建设 网站上线了怎么做互联网推广
  • 南阳网站建设多少钱江门seo
  • 做app和做网站相同和区别网站推广优化外包便宜
  • 网站建设维护工作147seo工具
  • 做外单网站有哪些内容seo优化服务
  • wordpress获取微信用户seo推广营销公司
  • 郑州响应式网站建设百度指数网址是什么
  • 接单子做网站词点击器 百度网盘
  • 小说网站怎么用html做seo流量工具
  • 珠海精品网站建设手机网络优化软件
  • 建设工程司法解释站长工具seo词语排名
  • 和一起做网店类似的网站北京网优化seo公司
  • 网页设计实训报告的目的企业网站优化的三层含义
  • 支持wordpress的mysql广安seo外包
  • 集团做网站需要多大的带宽seo关键词优化案例
  • 企业官网建设 创意网站建设百度seo优化规则
  • 哪个网站可以接工程做重庆人力资源和社会保障网官网
  • bae wordpress 3.8百度一键优化