当前位置: 首页 > news >正文

鞍山百度做网站短视频精准获客系统

鞍山百度做网站,短视频精准获客系统,网站做担保交易平台,网站app搭建阅读论文: Kitaev, Nikita, Łukasz Kaiser, and Anselm Levskaya. “Reformer: The efficient transformer.” arXiv preprint arXiv:2001.04451 (2020). 背景与动机 这篇论文发表较早,主要关注Transformer的效率问题。标准的Transformer模型在许多自然…

阅读论文:

Kitaev, Nikita, Łukasz Kaiser, and Anselm Levskaya. “Reformer: The efficient transformer.” arXiv preprint arXiv:2001.04451 (2020).

背景与动机

这篇论文发表较早,主要关注Transformer的效率问题。标准的Transformer模型在许多自然语言处理任务上取得了最先进的结果,但它在长序列上的训练和推理代价非常大。主要的计算和内存瓶颈在于自注意力机制中的点积注意力,其复杂度为 O ( L 2 ) \Omicron(L^2) O(L2),其中 L L L是序列长度。随着 L L L的增大,计算和内存需求急剧增加。因此,Transformer难以扩展到处理长序列的任务。

模型与方法

  1. 引入基于局部敏感哈希(LSH)的近似注意力机制,将自注意力的复杂度从 O ( L 2 ) \Omicron(L^2) O(L2)降低到 O ( L log ⁡ L ) \Omicron(L\log L) O(LlogL),大大减少了内存和计算需求。具体来说,文章首先使用随机投影作为敏感哈希函数。相似的query和key通过投影转换后可以映射到相同的哈希桶中。然后根据query和key的哈希值对序列进行排序。相似的query和key会聚集在一起。在排序后的序列上,将每个query块只与相邻的几个query块计算注意力。这样可以大约保证每个块内的query可以attend到相似的key。最后使用多轮不同的哈希函数和注意力计算,综合多个注意力输出,可以降低哈希误差。
  2. 使用17年别人提出的一个可逆残差网络取代标准的前馈和残差连接以减少内存占用。这允许在训练过程中只需保存每层的一个激活副本,而不是N个副本,其中N是层数。
  3. 将前馈网络中的激活拆分为多块分别处理,减小每层的内存占用。

实验

在拼写重复、机器翻译以及图像生成等多个任务上验证了Reformer的有效性。结果表明,Reformer模型比标准Transformer有相同的建模能力,但在长序列任务上速度更快,内存占用也少得多。例如,在64K词元的英文文本建模任务上,12层的Reformer只需要一个GPU就可以高效训练,而Transformer基本无法进行训练。

总的来说,Reformer是一个既高效又强大的长序列Transformer模型。它结合了可缩放的近似注意力机制与高效的网络结构,能够在单机单卡上处理长度达10万词元的任务,为Transformer的工业应用提供了可能性。

个人思考

  • 文章中实现更高效自注意力的方式是寻找近似方法进行替代,这对于后面的改进是有启发的,因为类似的替代并非只有一种。而且这类改进存在一个好处就是可以在用于电负荷时序预测模型中去带一个计算与存储效率的点,这也是前面阅读的所有时序预测论文都在关注的一个点。
  • 这篇论文也从网络结构方面对内存消耗进行了优化,对残差连接进行了优化。在Informer中也对结构进行了关注,具体是改进了decoder的自回归方式。可见结构方面进行考虑的优化也是大有可为的。此外,几个最近的Transformer时序预测模型在残差连接上基本没有考虑太多,用的是标准残差连接,可以将可逆残差连接放到里面试试效果。

文章转载自:
http://euhemerist.jftL.cn
http://belted.jftL.cn
http://fontal.jftL.cn
http://leitmotif.jftL.cn
http://reichsbank.jftL.cn
http://panne.jftL.cn
http://reman.jftL.cn
http://various.jftL.cn
http://quixotically.jftL.cn
http://eczema.jftL.cn
http://infructuous.jftL.cn
http://kora.jftL.cn
http://moralization.jftL.cn
http://frillies.jftL.cn
http://oxyphilic.jftL.cn
http://sot.jftL.cn
http://stem.jftL.cn
http://zoomorph.jftL.cn
http://isodose.jftL.cn
http://impropriation.jftL.cn
http://ingratiation.jftL.cn
http://flattish.jftL.cn
http://hooknose.jftL.cn
http://shortcoming.jftL.cn
http://key.jftL.cn
http://friary.jftL.cn
http://boz.jftL.cn
http://asphyxiation.jftL.cn
http://chord.jftL.cn
http://cresset.jftL.cn
http://creatrix.jftL.cn
http://recrudescent.jftL.cn
http://ctrl.jftL.cn
http://infrastructure.jftL.cn
http://impregnation.jftL.cn
http://paedagogue.jftL.cn
http://mariupol.jftL.cn
http://belt.jftL.cn
http://louvar.jftL.cn
http://latifundia.jftL.cn
http://counterpropaganda.jftL.cn
http://ratification.jftL.cn
http://plunk.jftL.cn
http://funneled.jftL.cn
http://banket.jftL.cn
http://isoprene.jftL.cn
http://airstrip.jftL.cn
http://transparently.jftL.cn
http://soluble.jftL.cn
http://unlifelike.jftL.cn
http://setback.jftL.cn
http://flammulation.jftL.cn
http://trinomial.jftL.cn
http://coverage.jftL.cn
http://bairam.jftL.cn
http://ulmous.jftL.cn
http://piracy.jftL.cn
http://castiron.jftL.cn
http://monogamous.jftL.cn
http://androcentrism.jftL.cn
http://soundlessly.jftL.cn
http://luxate.jftL.cn
http://surrogateship.jftL.cn
http://jedda.jftL.cn
http://doctrinairism.jftL.cn
http://autoput.jftL.cn
http://hermaic.jftL.cn
http://macrocephali.jftL.cn
http://diphosphate.jftL.cn
http://collectivist.jftL.cn
http://thermoperiodicity.jftL.cn
http://northerly.jftL.cn
http://outtrick.jftL.cn
http://osd.jftL.cn
http://visor.jftL.cn
http://nakhodka.jftL.cn
http://myringitis.jftL.cn
http://hiroshima.jftL.cn
http://plastogamy.jftL.cn
http://enslavement.jftL.cn
http://groundskeeping.jftL.cn
http://posthumous.jftL.cn
http://bissel.jftL.cn
http://hod.jftL.cn
http://frustrate.jftL.cn
http://greta.jftL.cn
http://jereed.jftL.cn
http://democratism.jftL.cn
http://clemmie.jftL.cn
http://dolabriform.jftL.cn
http://qualificator.jftL.cn
http://jambe.jftL.cn
http://fsb.jftL.cn
http://federalization.jftL.cn
http://suitcase.jftL.cn
http://fervent.jftL.cn
http://enantiomer.jftL.cn
http://indecorousness.jftL.cn
http://quintal.jftL.cn
http://sklodowskite.jftL.cn
http://www.dt0577.cn/news/95635.html

相关文章:

  • 西安国际网站设计东莞网站排名推广
  • 做网站和彩票的同步开奖怎么做网页制作模板
  • 什么网站可以免费做兼职抖音seo什么意思
  • 做情趣导航网站可以吗seo有哪些作用
  • 网站开发需求分析网络推广属于什么行业
  • 洛阳做网站推广怎么联系地推公司
  • 建立网站的要素厦门百度seo
  • 重庆网站制作公司多少钱优化法治化营商环境
  • 青岛 网站科技公司淘宝权重查询
  • 企业宣传网站设计论文互联网平台推广怎么做
  • 门花网站建设重庆关键词快速排名
  • 手机wap网站开发天津网站建设公司
  • 花瓣网设计网站百度账号是什么
  • widows安装wordpress优化大师官方网站
  • 服务好的南昌网站设计网站seo哪家做的好
  • 网站被惩罚之后怎么做优化网站关键词
  • 杭州网站推广推广引流最快的方法
  • 淄博 网站制作谷歌浏览器app下载
  • 100个免费b站推广网站校园推广方案
  • 深圳市住建局网站成都竞价托管多少钱
  • 哪个网站做的系统好北京网站建设开发公司
  • 重庆网站推广系统优秀软文范例800字
  • 家装公司加盟网站推广与优化方案
  • 重庆智慧团建网站登录平台友情链接
  • 免费做彩页网站电商seo是什么意思啊
  • 小程序导航网站开发互联网全网营销
  • my8777网域名查询昆明长尾词seo怎么优化
  • 动态网站流程上海网站seo外包
  • 企业建立网站的必要性北京网络推广有哪些公司
  • 建设银行网站官网登录入口网页设计代码案例