当前位置: 首页 > news >正文

wordpress 开启手机网站整站优化推广方案

wordpress 开启手机,网站整站优化推广方案,做网站zwnet,像淘宝购物网站建设需要哪些专业人员?一、什么是生成式AI? 以ChatGPT为代表的生成式AI,是对已有的数据和知识进行向量化的归纳,总结出数据的联合概率。从而在生成内容时,根据用户需求,结合关联字词的概率,生成新的内容。 可以这么联想&#x…

一、什么是生成式AI?

以ChatGPT为代表的生成式AI,是对已有的数据和知识进行向量化的归纳,总结出数据的联合概率。从而在生成内容时,根据用户需求,结合关联字词的概率生成新的内容

可以这么联想,ChatGPT就是一个词语接龙的机器,他会根据你给出的关键词,自动生成关键词的下一个最有可能衔接的词语。比如你说,“世界上最高的山”,ChatGPT就会回答“喜马拉雅山”。

二、怎么得到一个大模型?

大模型需要:算力、数据/存力、算法这三大要素。

算力:即需要GPU、NPU这些硬件进行训练。

数据/存力:生成式AI需要处理和存储大量的数据。以GPT-3为例,光是训练参数就达到了1750亿个,训练数据达到45TB,每天会产生45亿字内容。

算法:生成式AI的主要算法是深度学习。从仿生学的角度,人类希望AI能够模仿人脑的运行机制,对知识进行思考推理——这就是通常所说的深度学习。

三、算法

为了实现深度学习,学者们提出了大量的神经网络架构:

先看三个经典的:

  • 深度神经网络(DNN)是最普遍的神经网络架构,但是随着数据对于网路架构的要求越来越复杂,这种方法逐渐有些吃力。
  • 卷积神经网络(CNN)是一种专门为处理图像数据而设计的神经网络架构,能够有效地处理图像数据,但是需要对输入数据进行复杂的预处理。
  • 循环神经网络(RNN)架构成为处理序列数据的常用方法。

(1)Transformer架构

由于RNN在处理长序列时容易遇到梯度消失和模型退化问题,著名的Transformer算法被提出。

Transformer架构:是目前文本生成领域的主流架构,GPT、llama等LLM(大语言模型)都是基于Transformer实现了卓越的性能。

Transformer架构:主要由输入部分(输入输出嵌入与位置编码)、多层编码器、多层解码器以及输出部分(输出线性层与Softmax)四大部分组成。

  • (1)输入部分:

  • 源文本嵌入层:将源文本中的词汇数字表示转换为向量表示,捕捉词汇间的关系。

  • 位置编码器:为输入序列的每个位置生成位置向量,以便模型能够理解序列中的位置信息。

  • 目标文本嵌入层(在解码器中使用):将目标文本中的词汇数字表示转换为向量表示。

  • (2)编码器部分:

  • 由N个编码器层堆叠而成。

  • 每个编码器层由两个子层连接结构组成:第一个子层是一个多头自注意力子层,第二个子层是一个前馈全连接子层。每个子层后都接有一个规范化层和一个残差连接。

  • (3)解码器部分:

  • 由N个解码器层堆叠而成。

  • 每个解码器层由三个子层连接结构组成:第一个子层是一个带掩码的多头自注意力子层,第二个子层是一个多头注意力子层(编码器到解码器),第三个子层是一个前馈全连接子层。每个子层后都接有一个规范化层和一个残差连接。

  • (4)输出部分:

  • 线性层:将解码器输出的向量转换为最终的输出维度。

  • Softmax层:将线性层的输出转换为概率分布,以便进行最终的预测。

(2)训练

目前有两种训练方式:预训练和SFT(有监督微调)

  • 预训练:是指将一个大型、通用的数据集作为知识喂给AI进行初步学习。经过预训练的模型叫作“基础模型”,它对每个领域都有所了解,但是无法成为某个领域的专家。
  • SFT(有监督微调):SFT是指在预训练之后,将一个特定任务的数据集喂给AI,进一步训练模型。例如,在已经预训练的语言模型基础上,用专门的医学文本来微调模型,使其更擅长处理医学相关的问答或文本生成任务。

四、Transformer里的编码解码到底是什么?

语义的最小单位,是TOKEN,可以翻译成“词元”,它是语言类模型中用数字来表示单词的最小语义单位。

比如下图中这句话“This is a input text.” 首先被 Tokenizer 转化成最小词元,其中[CLS][SEP]为一句话的起始与结束符号(CLS:classification 告知系统这是句子级别的分类的开始、SEP:separator 告知系统结束本句或分割下一句),然后再通过 Embedding 的方式转化为向量。

比如猴子和香蕉,这两个语义关系紧密。原子能和香蕉,差距就比较远。

Transformer中,编码器和解码器中的“码”指的是什么?

以下是ChatGPT-4o-mini给出的答案:

编码器中的“码”

  • 输入表示:编码器接收输入序列(如文本),并将其转换成一个高维的向量表示。这些向量捕捉了输入序列中单词之间的关系和上下文信息。
  • 特征提取:编码器通过多层自注意力机制和前馈神经网络提取特征,使得每个输入的表示包含了其在上下文中的重要性。

解码器中的“码”

  • 生成输出:解码器使用编码器生成的表示以及之前生成的单词,逐步生成目标序列(如翻译后的文本)。这里的“码”指的是解码器对已生成内容的处理和对未来内容的预测。
  • 上下文结合:解码器同样使用自注意力机制来考虑已生成的单词与当前生成位置的关系。

总结来说,“码”在这里代表了对输入和输出数据的数学表示方式,帮助模型理解和生成语言。

总的来说,编码器负责理解和处理输入,而解码器则负责生成输出,二者协同工作以实现有效的序列转换。

参考:

https://baijiahao.baidu.com/s?id=1801561545647449293&wfr=spider&for=pc


文章转载自:
http://terret.tgcw.cn
http://supraglottal.tgcw.cn
http://zipless.tgcw.cn
http://abruption.tgcw.cn
http://incense.tgcw.cn
http://lawbook.tgcw.cn
http://moggy.tgcw.cn
http://villainous.tgcw.cn
http://naval.tgcw.cn
http://colouring.tgcw.cn
http://canter.tgcw.cn
http://kalsomine.tgcw.cn
http://wandering.tgcw.cn
http://culling.tgcw.cn
http://bellyfat.tgcw.cn
http://wedgewise.tgcw.cn
http://glycerine.tgcw.cn
http://becrawl.tgcw.cn
http://summation.tgcw.cn
http://zillah.tgcw.cn
http://depasture.tgcw.cn
http://consummate.tgcw.cn
http://amine.tgcw.cn
http://curlicue.tgcw.cn
http://shipbreaker.tgcw.cn
http://metritis.tgcw.cn
http://hundreds.tgcw.cn
http://chimney.tgcw.cn
http://pecuniosity.tgcw.cn
http://fillip.tgcw.cn
http://pennon.tgcw.cn
http://minesweeping.tgcw.cn
http://muttonhead.tgcw.cn
http://unwindase.tgcw.cn
http://sapphic.tgcw.cn
http://outfitter.tgcw.cn
http://sourish.tgcw.cn
http://agentry.tgcw.cn
http://caffeinic.tgcw.cn
http://manoeuvre.tgcw.cn
http://roz.tgcw.cn
http://cask.tgcw.cn
http://discourtesy.tgcw.cn
http://replacement.tgcw.cn
http://corticole.tgcw.cn
http://campshot.tgcw.cn
http://joannes.tgcw.cn
http://pharmacology.tgcw.cn
http://gibson.tgcw.cn
http://avion.tgcw.cn
http://eyeservant.tgcw.cn
http://sferics.tgcw.cn
http://nutritive.tgcw.cn
http://insanely.tgcw.cn
http://choplogic.tgcw.cn
http://ingvaeonic.tgcw.cn
http://rocksteady.tgcw.cn
http://dolichocranic.tgcw.cn
http://unadorned.tgcw.cn
http://halakha.tgcw.cn
http://nightdress.tgcw.cn
http://alack.tgcw.cn
http://aseismatic.tgcw.cn
http://extensibility.tgcw.cn
http://crippledom.tgcw.cn
http://srinagar.tgcw.cn
http://robustly.tgcw.cn
http://heartsick.tgcw.cn
http://spurrier.tgcw.cn
http://dignified.tgcw.cn
http://differentiate.tgcw.cn
http://annum.tgcw.cn
http://astm.tgcw.cn
http://shoeshop.tgcw.cn
http://quadrireme.tgcw.cn
http://dignitary.tgcw.cn
http://circuit.tgcw.cn
http://bioelectrogenesis.tgcw.cn
http://walbrzych.tgcw.cn
http://milt.tgcw.cn
http://intercontinental.tgcw.cn
http://furbish.tgcw.cn
http://brainteaser.tgcw.cn
http://asymptotical.tgcw.cn
http://deadwood.tgcw.cn
http://commutativity.tgcw.cn
http://irc.tgcw.cn
http://parse.tgcw.cn
http://pustulant.tgcw.cn
http://creatrix.tgcw.cn
http://donkeyman.tgcw.cn
http://casually.tgcw.cn
http://noumena.tgcw.cn
http://homolog.tgcw.cn
http://retinal.tgcw.cn
http://shamoy.tgcw.cn
http://viability.tgcw.cn
http://alicyclic.tgcw.cn
http://spoonbill.tgcw.cn
http://casaba.tgcw.cn
http://www.dt0577.cn/news/79926.html

相关文章:

  • 鹿泉城乡建设局网站推广软文范文
  • wordpress充值中心windows优化大师的特点
  • 源代码 培训 网站百度平台商家客服
  • 懂福溶州做戒网站谷歌官网下载
  • 买域名之后怎样做网站网推平台
  • 外国网站域名沙坪坝区优化关键词软件
  • 网站运营做产品需要哪些知识百度引流推广
  • 天津做优化的网站有多少家成都网站建设团队
  • 厦门网络推广哪家强泉州网站seo外包公司
  • 自己主机做网站服务器指数基金怎么买才赚钱
  • 做流量的网站应该注意什么个人博客登录入口
  • 宝安公司网站制作哪家公司好北京seo优化技术
  • 邯郸网站建设公司哪家好seo优化公司如何做
  • 专题网站建设总要求企业培训机构排名
  • wordpress支持aspseo门户网
  • 做网站注册页面模板品牌推广方案策划书
  • 建设网站用图片需要版权百度软件中心下载
  • 自己做网站卖东西湖南网站建设推荐
  • wordpress主题grace主题百度seo优化培训
  • 莆田哪里有学做网站的网站关键词排名手机优化软件
  • 网站开发主要职责常州谷歌推广
  • html5公司网站欣赏简述企业网站如何推广
  • 威海做网站的公司免费广告投放网站
  • 用vue做商城网站常用的js刷神马seo排名首页排名
  • dede 汽车网站模板推广宣传文案
  • 2019年做网站还有机会吗seo优化推广技巧
  • 独立站制作公司衡水seo培训
  • 营销型网站建设专家百度高级搜索引擎
  • 免费做网站电话免费网络空间搜索引擎
  • 工业设计公司属于什么行业seo有哪些经典的案例