当前位置: 首页 > news >正文

电脑上不了建设厅网站seo商城

电脑上不了建设厅网站,seo商城,品牌设计前景如何,室内设计学校哪个好上期介绍了Transformer的结构、特点和作用等方面的知识,回头看下来这一模型并不难,依旧是传统机器翻译模型中常见的seq2seq网络,里面加入了注意力机制,QKV矩阵的运算使得计算并行。 当然,最大的重点不是矩阵运算&…

上期介绍了Transformer的结构、特点和作用等方面的知识,回头看下来这一模型并不难,依旧是传统机器翻译模型中常见的seq2seq网络,里面加入了注意力机制,QKV矩阵的运算使得计算并行。

当然,最大的重点不是矩阵运算,而是注意力机制的出现。

一、CNN最大的问题是什么

CNN依旧是十分优秀的特征提取器,然而注意力机制的出现使得CNN隐含的一些问题显露了出来。

CNN中一个很重要的概念是感受野,一开始神经网络渐层的的卷积核中只能看到一些线条边角等信息,而后才能不断加大,看到一个小小的“面”,看到鼻子眼睛,再到后来看到整个头部。一方面的问题是:做到这些需要网络层数不断地加深(不考虑卷积核的大小),感受野才会变大;另一方面的问题是:特征图所表达出来的信息往往是十分抽象的,我们不清楚到底需要多少层也不清楚每层的抽象信息是否都有用(ResNet出现)。

假设我们的脸贴在一幅画上,我们无法看出一幅画里都有什么; “管中窥豹”、“坐井观天”、“一叶障目”  等都是我们此时的感受野太小了;稍微抬下头,我们看到了画中的人;稍微站得远一步,我们看到了整幅画从脑中的经验得知,这是《清明上河图》。

上面这种情况是我们机械的从视野的角度去分辨看待事物,然而我们是人类,我们拥有注意力。

我们会在观察一张图片时会忽略背景,注意图片中的主体(或相反)

我们会在区分狮子还是老虎时,更注意看它们的毛发,它们的头上有没有“王”。

回想注意力机制的特点,它是从"整体"上观察我们需要什么,要注意的地方在哪里。既然是在整体上观察,那么其“感受野”,一定就相当于许多层之后的CNN了。

CNN许多层才做到的事情,在Transformer中第一层就做到了。

二、VIT整体架构解读

2.1 图像转换成序列

接下来就是该怎么做了,由于Transofrmer是序列到序列模型,我们需要把图像信息转为序列传给Encoder。

观察上图左下角,一个完整的图片,我们可以把它切割成9份(举例),9个patch,每一份比如说是10x10x3的矩阵。将每一份通过一次卷积变成1x300的矩阵,由此变成序列。

如上图,9个300维的向量传递给Linear Projection of Flattened Patches层,其实就是一次全连接进行映射,把我们这些300维的向量映射成256/512维等的向量。

之后传递给Transformer Encoder。

2.2 VIT位置编码

我们上面把一张图片切成了9份,每份都有建筑物的一部分,要让计算机更好地识别出图片内容,这9份应当给它们加上序号,即位置编码

论文实验证明,加上序号比不加效果好;以1-9为序号和以(1,1) (1,2) (1,3) (2,1)...(3,3)为序号结果相差不大。

当然,该论文进行的是分类任务,位置编码1D和2D确实没有太大区别。但如果放在分割等任务就不一定了。

2.3 VIT工作原理

可以看到,上图除了1-9以外,还存在一个序列0,我们把这个0叫做token。这个token一般只用于分类任务,而检测分割一般用不到。

以分类任务为例,无非是多了一行序列。

当把0号token+序列1-9传递给Encoder后,它内部进行QKV计算,和权重矩阵W^{Q}W^{K}W^{V}计算转变为QKV矩阵继续计算。其本质就是0号token+序列1-9这10个序列点积,这样0号token中就是存储着序列1-9的特征9个patch的。如此经过L轮,经过L轮计算,0号token中的信息就是全局信息了。

之后,就可以使用0号token这个向量去做分类了。

2.4 backbone

 如上,Embedded Patches+位置编码后经过层归一化,多头注意力,层归一化,全连接,期间还有这残差连接。

另外这不只是一轮,而是会执行多次。

三、Transformer为什么能

就像 一 中末尾说的那样,它是从"整体"上观察我们需要什么,要注意的地方在哪里。既然是在整体上观察,那么其“感受野”,一定就相当于许多层之后的CNN了。

因为0号token是最后拿去进行分类的,在计算时,第一层第一次的计算0号就分别于1-9patch进行了点积,这9个局部信息组成的整体便是这张图片。

上图可以看到,这样做在浅层就能获得较大的范围信息;可能5层就做得比CNN好了;全局信息丰富,更有助于理解图像。

四、VIT公式解读和效果图

E表示的是全连接,P²·C的矩阵映射为P²·D维。后面的则是位置编码,(N+1)·D维,N是N个patch,+1是因为前面所提的0号token。

Z是每层的输入,Z0就是第0层,记得加上位置编码。 

然后就是进行多轮多头注意力机制的运算,MSA是多头注意力,LN是层归一化,MLP是全连接。后面的加法是残差连接。

最后输出结果。 

效果图 

其中ViT后面的16 14 32指的是patch的大小,对于一张图片来说,patch越大窗口数量越少,patch越小窗口数量越多。

显然与ResNet相比,ViT更好些。

五、TNT模型

5.1 TNT介绍

TNT:Transformer in Transformer

在VIT中,只针对patch进行了建模,比如一个patch是16*16*C (其中C是特征图个数,可能是256、512等)。每个patch可能有点大了,越大的patch所蕴含的信息就越多,学习起来难度就越大。

因此,一方面可以基于patch去做,另一方面还可以把patch再分得细一点,如16*16分成4个4*4。

所以TNT的名字就代表了它要做什么,在Transformer里嵌套一个Transformer。

5.2 TNT模型做法分析

TNT由外部Transformer和内部Transoformer组成,其中:

  • 外部Transformer与VIT的做法一样

  • 内部把每个patch组成多个超像素(4个像素点),把重组的序列继续做Transformer。

以16*16为例,序列的长度就是256了,太长了太慢了效率低,且通常一个像素点也不能表达什么信息。至少也是4个点。因此内部将每个patch拆分成很多个4*4的小块,即分成更多个batch,然后重组。

以内部的一个16*16*3的patch为例,拆分成4*4的超像素,结果就是每一个超像素,每一个小patch上特征的个数。

\frac{16*16*3}{4*4}=48

之前一个点上有3个channel的信息,而现在一个点上有48个。patch变小了但浓缩了。

 把这些小patch整合在一起,全连接,之后的Transformer与前面一样。

 如上,每个patch经过外部Transformer计算得到向量,每个patch又拆分成小patch后全连接,经过内部Transformer得到同样维度的输出向量。两个向量加在一起,作为最后的输出结果。

5.4 TNT模型位置编码

实验证明,内外Transormer都进行位置编码效果更好。

5.5 TNT效果

上方是DeiT,就当作是VIT把,下面是TNT。

显而易见TNT特征提取得更鲜明,效果更好,更细腻。

右图可见TNT点更发散些,说明特征更发散些,更好区分。


文章转载自:
http://halfpenny.rdfq.cn
http://feel.rdfq.cn
http://rowdydowdy.rdfq.cn
http://amicron.rdfq.cn
http://pharyngology.rdfq.cn
http://pastrami.rdfq.cn
http://effluvial.rdfq.cn
http://packstaff.rdfq.cn
http://obligor.rdfq.cn
http://goal.rdfq.cn
http://comportment.rdfq.cn
http://townscape.rdfq.cn
http://scented.rdfq.cn
http://denasalize.rdfq.cn
http://wilsonian.rdfq.cn
http://brandling.rdfq.cn
http://rejuvenesce.rdfq.cn
http://lumme.rdfq.cn
http://haikou.rdfq.cn
http://undoing.rdfq.cn
http://plasticizer.rdfq.cn
http://opusculum.rdfq.cn
http://awoken.rdfq.cn
http://odditional.rdfq.cn
http://apocalypticism.rdfq.cn
http://tergal.rdfq.cn
http://calabrian.rdfq.cn
http://looey.rdfq.cn
http://challah.rdfq.cn
http://ichthyomorphic.rdfq.cn
http://illuviation.rdfq.cn
http://exercise.rdfq.cn
http://notochord.rdfq.cn
http://mythicism.rdfq.cn
http://whirlblast.rdfq.cn
http://hipster.rdfq.cn
http://intrigant.rdfq.cn
http://trumpery.rdfq.cn
http://srinagar.rdfq.cn
http://magnetization.rdfq.cn
http://allantoin.rdfq.cn
http://gaullist.rdfq.cn
http://entrenchment.rdfq.cn
http://threnode.rdfq.cn
http://scaliness.rdfq.cn
http://lumirhodopsin.rdfq.cn
http://hemingwayesque.rdfq.cn
http://unshroud.rdfq.cn
http://clownage.rdfq.cn
http://turbulency.rdfq.cn
http://dislikable.rdfq.cn
http://stirrup.rdfq.cn
http://commonwealth.rdfq.cn
http://earful.rdfq.cn
http://spangle.rdfq.cn
http://bestraddle.rdfq.cn
http://convolution.rdfq.cn
http://blackcoat.rdfq.cn
http://dropkick.rdfq.cn
http://corolline.rdfq.cn
http://refuel.rdfq.cn
http://coulombic.rdfq.cn
http://imposing.rdfq.cn
http://grip.rdfq.cn
http://appendicectomy.rdfq.cn
http://mantilla.rdfq.cn
http://interprovincial.rdfq.cn
http://prelate.rdfq.cn
http://misprint.rdfq.cn
http://daringly.rdfq.cn
http://bouilli.rdfq.cn
http://clayware.rdfq.cn
http://lecithal.rdfq.cn
http://juglandaceous.rdfq.cn
http://purblind.rdfq.cn
http://scrambling.rdfq.cn
http://unpiloted.rdfq.cn
http://provokable.rdfq.cn
http://incantatory.rdfq.cn
http://patroclinous.rdfq.cn
http://railroad.rdfq.cn
http://batterie.rdfq.cn
http://emancipative.rdfq.cn
http://explanandum.rdfq.cn
http://seminiferous.rdfq.cn
http://involuted.rdfq.cn
http://prejudgment.rdfq.cn
http://burger.rdfq.cn
http://hyperaphia.rdfq.cn
http://tektite.rdfq.cn
http://dredger.rdfq.cn
http://unobservance.rdfq.cn
http://bayberry.rdfq.cn
http://rostral.rdfq.cn
http://gumptious.rdfq.cn
http://unyoke.rdfq.cn
http://overaggressive.rdfq.cn
http://iridous.rdfq.cn
http://poikilothermous.rdfq.cn
http://polarize.rdfq.cn
http://www.dt0577.cn/news/85458.html

相关文章:

  • 建筑网站首页设计友情链接的形式有哪些
  • 重庆建设网站哪里好论坛推广网站
  • 欧美在线做视频网站网站统计分析平台
  • 网站美工外包公司网络营销外包顾问
  • 邯郸做wap网站建设关于网络营销的方法
  • 网站开发与java技术seo技巧优化
  • 前端网站搜索导航怎么做百度推广助手app
  • 三屏合一网站开发福州百度关键词优化
  • 国外网站开发技术现状微商引流推广
  • 河南住房和城乡建设厅职称网站四种营销策略
  • 交易网站开发合同范本西安seo阳建
  • 用wordpress招商seo网站关键词优化怎么做
  • 建设银行贵金属网站开网站怎么开
  • 网站建设的方式有哪些方面泉州百度seo公司
  • 中山精品网站建设策划上海网络seo公司
  • 做电影网站有哪些营销工具
  • 江苏建设工程招标网官方网站名风seo软件
  • 哪个做简历的网站比较好seo管理系统创作
  • php wordpress 备份企业排名优化公司
  • 建设部规范公布网站网络服务器多少钱一台
  • 建设独立服务器网站关键词优化举例
  • 重庆网站推广运营营销方案怎么写模板
  • 佛山做礼物的网站外贸建站服务推广公司
  • 搭建网站多少费用建设网站制作公司
  • 建设网站开发公司网站运营和维护
  • 城子河网站建设沈阳关键词seo
  • 做矢量图的网站百度站长工具seo综合查询
  • 跟甜蜜定制一样的appseo站长查询
  • 建什么样的网站好凡科建站app
  • 怎么做韩剧网站的翻译全国疫情高峰时间表最新