当前位置: 首页 > news >正文

宽带办理一年多少钱贵州seo技术查询

宽带办理一年多少钱,贵州seo技术查询,有个网站发任务 用手机可以做,怎么看一个网站是否做竞价在本文中,我们回顾了深度学习的概念和技术,这些概念和技术对理解图神经网络至关重要。从将机器学习表述为优化问题开始,介绍了目标函数、梯度下降、非线性和反向传播的概念。 文章目录 1. 大纲2. 优化问题2.1 举例损失函数 3. 如何优化目标函…

在本文中,我们回顾了深度学习的概念和技术,这些概念和技术对理解图神经网络至关重要。从将机器学习表述为优化问题开始,介绍了目标函数梯度下降非线性反向传播的概念。

文章目录

  • 1. 大纲
  • 2. 优化问题
    • 2.1 举例损失函数
  • 3. 如何优化目标函数?
  • 4. 梯度下降
    • 4.1 对于SGD的一些概念
  • 5. 如何获得目标函数?
    • 5.1 反向传播
    • 5.2 非线性变换
    • 5.3 MLP
  • 6. 总结

1. 大纲

在这里插入图片描述

这篇我们主要讲第一部分深度学习的基础。

2. 优化问题

我们将机器学习问题、监督学习问题看作是优化问题:

在这里插入图片描述

我们需要学习这样一个映射函数:将输入 x x x映射为输出的预测标签 y y y

将这样的函数学习表述为一个优化过程

在这里插入图片描述

有两件重要的是:

  • 通过优化参数 Θ \Theta Θ,最小化损失函数 L \mathcal{L} L
  • 损失函数用来测量真实值与预测值之间的差距。

2.1 举例损失函数

交叉熵损失函数:

在这里插入图片描述

讨论多分类问题

比如5分类问题,表示5种颜色,我们用one-hot编码表示。

我们要在某种意义上对它进行建模,使用 f ( x ) f(x) f(x)这是将某个函数 g ( x ) g(x) g(x)经过 S o f t m a x ( ) Softmax() Softmax()函数,得到一个预测5分类的概率,这些概率之和为1。

现在要衡量这个预测的质量。

通过单点的交叉熵损失函数 C E ( y , f ( x ) ) CE(y,f(x)) CE(y,f(x))得到的值越小,就表示预测值与真实的one-hot值越接近。

然后将所有单点的损失相加就得到了总的损失 L = ∑ ( x , y ) ∈ T CE ⁡ ( y , f ( x ) ) \mathcal{L}=\sum_{(x,y)\in\mathcal{T}}\operatorname{CE}(y,f(x)) L=(x,y)TCE(y,f(x)),这是所有训练样本的真实值与预测值之间的总差异。

而我们想要的就是找到一个合适的函数 f ( x ) f(x) f(x)最小化真实值与预测值之间的总差异。

3. 如何优化目标函数?

在这里插入图片描述

经典的优化目标函数是通过梯度下降,所以梯度的概念很重要:

某个定点的梯度是一个方向,该方向是函数的最快增长速率。

现在,我们可以对损失函数进行“询问”,关于我的参数 Θ \Theta Θ,我应该朝着哪个方向?(梯度相反的方向)改变我的参数 Θ \Theta Θ使损失 L \mathcal{L} L减少最多

4. 梯度下降

在这里插入图片描述

上面是最基础的梯度下降版本,重复更新模型参数,直至收敛。

最基础的梯度下降有一些问题,所以后续提出了随机梯度下降(SGD):

在这里插入图片描述

传统的梯度下降每一轮迭代都需要计算所有点的梯度,计算量太大,而SGD只计算一部分。

4.1 对于SGD的一些概念

在这里插入图片描述

  • 首先是batch_size的概念,它是我们评估梯度数据的子集,(不是在整个训练数据集上评估梯度——GD,而是在训练集的一小部分——SGD),batch_size的大小是每一批次数据点的数量,通常我们喜欢更大的batch_size但更大的batch_size会使优化变慢
  • 其次是iteration的概念,SGD的一个迭代(iteration),是SGD的一个步骤,我们在给定的batch_size的数据点上评估梯度。迭代次数是:数据集大小/batch_size。
  • 最后是epoch的概念,它是对数据集的全面遍历

这种小批量训练的思想是深度学习的核心。

5. 如何获得目标函数?

对于简单的模型:

在这里插入图片描述

5.1 反向传播

在这里插入图片描述

反向传播的概念:使用链式法则,来传播中间步骤的梯度,最终获得关于模型参数损失的梯度。

举例:

在这里插入图片描述

在这里插入图片描述

5.2 非线性变换

目前为止只使用了简单的两层神经网络,而 W 2 W 1 W_2W_1 W2W1可以表示为另一个矩阵,它依然可以表示为一层的线性变换。

在这里插入图片描述

这意味着,我们通过两侧的线性变换依然得到的是一个线性模型,没有获得更多的表达能力。

而如果我们引入非线性变换,实际上增加了模型的表示能力。这将我们引向多层感知机的概念(MLP)。

5.3 MLP

在这里插入图片描述

6. 总结

在这里插入图片描述

http://www.dt0577.cn/news/32054.html

相关文章:

  • 网站开发人员薪资企业网站seo优化外包
  • 手机网站生成app客户端百度热门排行榜
  • 原网站开发新功能互联网营销主要学什么
  • 建设雅马哈官方网站有没有免费的seo网站
  • 深圳外贸网站建设友链提交入口
  • 哪个网站可以做破案h5东莞做网站推广的公司
  • 宁波广告公司网站建设seo搜索是什么意思
  • 哈尔滨网站建设信息网站快速推广
  • 烟台网站建设询问企汇互联专业百度搜索入口官网
  • 微网站如何做微信支付宝支付宝支付宝今日热点新闻事件标题
  • 让别人做网站的步骤腾讯广告平台
  • 做一个属于自己的网站免费的短视频app大全下载
  • 网站开发 天津深圳网站开发公司
  • 京东网站建设吗推广普通话活动方案
  • 做菠菜网站代理犯法吗网站的收录情况怎么查
  • 抚州网站制作太原百度关键词优化
  • 常州商城网站制作公司外贸营销型网站建设公司
  • 关于一学一做的短视频网站google广告投放
  • 企业网站的设计要求有哪些淘宝优化标题都是用什么软件
  • 哪些网站可以做代理商济南seo怎么优化
  • wordpress 转 app无忧seo
  • 做购物网站哪个cms好用百度搜索推广采取
  • 金泉网做网站百度怎么推广自己的店铺
  • 个体户可以做企业网站宝鸡seo
  • 多用户商城(c2c)网站制作方案网站运营工作的基本内容
  • 南通医院网站建设方案简述影响关键词优化的因素
  • 单位网站建设规划哈尔滨seo和网络推广
  • app下载汅api免费安卓全国seo搜索排名优化公司
  • 网站建设开发五行属性全媒体广告策划营销
  • 徐州睢宁建设网站百度竞价排名什么意思