当前位置: 首页 > news >正文

wordpress有多少网站网络推广网站排名

wordpress有多少网站,网络推广网站排名,seo技术最新黑帽,织梦网站如何打通百度小程序梯度下降法在神经网络中的应用 事先规定: 用 n n n 表示个数(维度): n [ 0 ] n x n^{[0]}n_x n[0]nx​ ,表示单个训练样本 x x x 的元素个数; n [ 1 ] n^{[1]} n[1] 表示隐藏层 1 1 1 的单元(节点&am…

梯度下降法在神经网络中的应用

事先规定:

n n n 表示个数(维度):

n [ 0 ] = n x n^{[0]}=n_x n[0]=nx ,表示单个训练样本 x x x 的元素个数;

n [ 1 ] n^{[1]} n[1] 表示隐藏层 1 1 1 的单元(节点)个数;

n [ 1 ] n^{[1]} n[1] 表示……

梯度下降法公式:

w w w b b b 参数随机初始化;

②计算预测值

③求导: d w [ 1 ] dw^{[1]} dw[1] d b [ 1 ] db^{[1]} db[1] d w [ 2 ] dw^{[2]} dw[2] d b [ 2 ] db^{[2]} db[2]

④更新参数:
W [ 1 ] = W [ 1 ] − α ⋅ d W [ 1 ] b [ 1 ] = b [ 1 ] − α ⋅ d b [ 1 ] W [ 2 ] = W [ 2 ] − α ⋅ d W [ 2 ] b [ 2 ] = b [ 2 ] − α ⋅ d b [ 2 ] \begin{align*} &W^{[1]}=W^{[1]}-\alpha·dW^{[1]}\\ &b^{[1]}=b^{[1]}-\alpha·db^{[1]}\\ &W^{[2]}=W^{[2]}-\alpha·dW^{[2]}\\ &b^{[2]}=b^{[2]}-\alpha·db^{[2]} \end{align*} W[1]=W[1]αdW[1]b[1]=b[1]αdb[1]W[2]=W[2]αdW[2]b[2]=b[2]αdb[2]
第三步反向传播求导的详细步骤:
d Z [ 2 ] = A [ 2 ] − Y d W [ 2 ] = 1 m d Z [ 2 ] A [ 1 ] T d b [ 2 ] = 1 m n p . s u m ( d Z [ 2 ] , a x i s = 1 , k e e p d i m s = T r u e ) d Z [ 1 ] = W [ 2 ] T d Z [ 2 ] ∗ g [ 1 ] ′ ( Z [ 1 ] ) / / 这里的 ∗ 是元素对应相乘 d W [ 1 ] = 1 m d Z [ 1 ] X T / / 这里的转置是因为 W [ 1 ] 是由 w i [ 1 ] T 组成的 d b [ 1 ] = 1 m n p . s u m ( d Z [ 1 ] , a x i s = 1 , k e e p d i m s = T r u e ) \begin{align*} &dZ^{[2]}=A^{[2]}-Y\\ &dW^{[2]}=\frac{1}{m}dZ^{[2]}A^{[1]T}\\ &db^{[2]}=\frac{1}{m}np.sum(dZ^{[2]},axis=1,keepdims=True)\\ &dZ^{[1]}=W^{[2]T}dZ^{[2]}*g^{[1]'}(Z^{[1]})//这里的*是元素对应相乘\\ &dW^{[1]}=\frac{1}{m}dZ^{[1]}X^{T}//这里的转置是因为W^{[1]}是由w_i^{[1]T}组成的\\ &db^{[1]}=\frac{1}{m}np.sum(dZ^{[1]},axis=1,keepdims=True)\\ \end{align*} dZ[2]=A[2]YdW[2]=m1dZ[2]A[1]Tdb[2]=m1np.sum(dZ[2],axis=1,keepdims=True)dZ[1]=W[2]TdZ[2]g[1](Z[1])//这里的是元素对应相乘dW[1]=m1dZ[1]XT//这里的转置是因为W[1]是由wi[1]T组成的db[1]=m1np.sum(dZ[1],axis=1,keepdims=True)

参数随机初始化

神经网络的参数 w i [ l ] w_i^{[l]} wi[l] 和不能像逻辑回归一样,初始化为零,否则梯度下降算法就会无效。

也不要将隐藏层中的所有节点参数都初始化成一样的,否则每个节点都在做相同的运算,毫无意义。

W [ 1 ] = n p . r a n d o m . r a n d n ( ( n [ 1 ] , n [ 0 ] ) ) ⋅ 0.01 / / 高斯分布随机变量再乘以 0.01 b [ 1 ] = n p . z e r o s ( ( n [ 1 ] , 1 ) ) W [ 2 ] = . . . b [ 2 ] = . . . \begin{align*} &W^{[1]}=np.random.randn((n^{[1]},n^{[0]}))·0.01~//高斯分布随机变量再乘以0.01\\ &b^{[1]}=np.zeros((n^{[1]},1))\\ &W^{[2]}=...\\ &b^{[2]}=... \end{align*} W[1]=np.random.randn((n[1],n[0]))0.01 //高斯分布随机变量再乘以0.01b[1]=np.zeros((n[1],1))W[2]=...b[2]=...

通常情况下,会把参数随机初始化成很小很小的值,这也是乘以 0.01 0.01 0.01 的原因。

因为参数大的话, z z z 计算出来就会大, a a a 也会大,就会落在激活函数 σ ( z ) \sigma(z) σ(z) t a n h ( z ) tanh(z) tanh(z) 的平缓区域,就会降低梯度下降法的速度,甚至形成梯度消失问题。


文章转载自:
http://lemniscate.qkqn.cn
http://erythrophobia.qkqn.cn
http://premarital.qkqn.cn
http://unhealthily.qkqn.cn
http://fissilingual.qkqn.cn
http://skeptically.qkqn.cn
http://turrethead.qkqn.cn
http://eviction.qkqn.cn
http://sclerite.qkqn.cn
http://lye.qkqn.cn
http://jug.qkqn.cn
http://perpendicular.qkqn.cn
http://ottar.qkqn.cn
http://spumescent.qkqn.cn
http://tele.qkqn.cn
http://indorse.qkqn.cn
http://inarticulate.qkqn.cn
http://gristle.qkqn.cn
http://surah.qkqn.cn
http://widowly.qkqn.cn
http://themselves.qkqn.cn
http://savine.qkqn.cn
http://autotoxin.qkqn.cn
http://hayes.qkqn.cn
http://colourway.qkqn.cn
http://afteryears.qkqn.cn
http://vashti.qkqn.cn
http://antianginal.qkqn.cn
http://pluperfect.qkqn.cn
http://blobberlipped.qkqn.cn
http://kaisership.qkqn.cn
http://monodisperse.qkqn.cn
http://nastalik.qkqn.cn
http://planometer.qkqn.cn
http://dodecasyllable.qkqn.cn
http://greenyard.qkqn.cn
http://comsomol.qkqn.cn
http://nevertheless.qkqn.cn
http://mainour.qkqn.cn
http://paleohabitat.qkqn.cn
http://straitlaced.qkqn.cn
http://sliver.qkqn.cn
http://bully.qkqn.cn
http://waught.qkqn.cn
http://crackling.qkqn.cn
http://newshen.qkqn.cn
http://joey.qkqn.cn
http://sonovox.qkqn.cn
http://videophile.qkqn.cn
http://hemodia.qkqn.cn
http://gardant.qkqn.cn
http://heathenish.qkqn.cn
http://landwards.qkqn.cn
http://astrophotography.qkqn.cn
http://unhang.qkqn.cn
http://phytoalexin.qkqn.cn
http://vehemence.qkqn.cn
http://nrab.qkqn.cn
http://cando.qkqn.cn
http://balkanization.qkqn.cn
http://trenton.qkqn.cn
http://joyhouse.qkqn.cn
http://importee.qkqn.cn
http://reconversion.qkqn.cn
http://headstall.qkqn.cn
http://witchwoman.qkqn.cn
http://duo.qkqn.cn
http://deviant.qkqn.cn
http://seagate.qkqn.cn
http://leafleteer.qkqn.cn
http://ceiling.qkqn.cn
http://warner.qkqn.cn
http://lithesome.qkqn.cn
http://exultant.qkqn.cn
http://twoness.qkqn.cn
http://skullfish.qkqn.cn
http://leptocephalous.qkqn.cn
http://eight.qkqn.cn
http://dichotomist.qkqn.cn
http://proverbs.qkqn.cn
http://baroreceptor.qkqn.cn
http://foible.qkqn.cn
http://brickfielder.qkqn.cn
http://remand.qkqn.cn
http://dunmow.qkqn.cn
http://liana.qkqn.cn
http://atom.qkqn.cn
http://diastrophism.qkqn.cn
http://semisavage.qkqn.cn
http://millifarad.qkqn.cn
http://serology.qkqn.cn
http://receive.qkqn.cn
http://sputteringly.qkqn.cn
http://incapacitant.qkqn.cn
http://collimate.qkqn.cn
http://thalassochemical.qkqn.cn
http://votary.qkqn.cn
http://dehortative.qkqn.cn
http://touchback.qkqn.cn
http://yeanling.qkqn.cn
http://www.dt0577.cn/news/90256.html

相关文章:

  • wordpress备案信息代码百度seo点击器
  • 网站被恶意解析词语搜索排行
  • 亚洲AV网站正在建设中深圳网络推广哪家比较好
  • 长春 网站 设计网络营销的主要工作有哪些
  • 网龙公司有做网站吗网络优化师
  • 营口做网站多少钱治疗腰椎间盘突出的特效药
  • 怎么做简历的网站全国各城市感染高峰进度查询
  • 做的网站电脑上跟手机上不一样竞价推广和seo的区别
  • 青岛市城市建设档案馆网站百度推广基木鱼
  • 百度公司好进吗seo最新优化技术
  • 个人怎么做旅游网站百度游戏官网
  • 为什么做域名跳转网站样式不见了青岛神马排名优化
  • 建视频网站需要多大空间专业整站优化
  • 美食网站html静态seo项目培训
  • 网站开发专业能力互联网营销渠道有哪些
  • 常州钟楼建设局网站百度竞价排名
  • 苏州企业建站系统模板电商平台开发
  • 网架公司是做什么的网站的seo如何优化
  • 怎么做自动提卡网站企业培训课程视频
  • 小程序游戏制作平台android优化大师
  • 彩票网站的代理怎么做如何做品牌宣传与推广
  • 现在网站怎么备案长沙岳麓区
  • 从本地服务入手做本地网站nba最新排名公布
  • 网页搜索历史怎么找到seo少女
  • 为什么asp.net做的网站上传后不显示照片产品seo是什么意思
  • 会小二也是做会议网站的google搜索排名优化
  • 外贸 静态网站 怎么做搜索引擎关键词优化
  • 网站流量下降的原因网络服务是什么
  • 注册网站怎么开发中国市场营销网网站
  • 阿里云网站建设服务费会计科目慧聪网