当前位置: 首页 > news >正文

龙华做棋牌网站建设多少钱小红书推广方案

龙华做棋牌网站建设多少钱,小红书推广方案,wordpress链接修改密码,如何与网站管理员联系过拟合和欠拟合的表现和解决方法。 其实除了欠拟合和过拟合,还有一种是适度拟合,适度拟合就是我们模型训练想要达到的状态,不过适度拟合这个词平时真的好少见。 过拟合 过拟合的表现 模型在训练集上的表现非常好,但是在测试集…

在这里插入图片描述

过拟合和欠拟合的表现和解决方法。

其实除了欠拟合和过拟合,还有一种是适度拟合,适度拟合就是我们模型训练想要达到的状态,不过适度拟合这个词平时真的好少见。

过拟合

过拟合的表现

模型在训练集上的表现非常好,但是在测试集、验证集以及新数据上的表现很差,损失曲线呈现一种高方差,低偏差状态。(高方差指的是训练集误差较低,而测试集误差比训练集大较多)

过拟合的原因

从两个角度去分析:

  1. 模型的复杂度:模型过于复杂,把噪声数据的特征也学习到模型中,导致模型泛化性能下降
  2. 数据集规模大小:数据集规模相对模型复杂度来说太小,使得模型过度挖掘数据集中的特征,把一些不具有代表性的特征也学习到了模型中。例如训练集中有一个叶子图片,该叶子的边缘是锯齿状,模型学习了该图片后认为叶子都应该有锯齿状边缘,因此当新数据中的叶子边缘不是锯齿状时,都判断为不是叶子。

过拟合的解决方法

  1. 获得更多的训练数据:使用更多的训练数据是解决过拟合问题最有效的手段,因为更多的样本能够让模型学习到更多更有效的特征,减少噪声的影响。

    当然直接增加实验数据在很多场景下都是没那么容易的,因此可以通过数据扩充技术,例如对图像进行平移、旋转和缩放等等。

    除了根据原有数据进行扩充外,还有一种思路是使用非常火热的**生成式对抗网络 GAN **来合成大量的新训练数据。

    还有一种方法是使用迁移学习技术,使用已经在更大规模的源域数据集上训练好的模型参数来初始化我们的模型,模型往往可以更快地收敛。但是也有一个问题是,源域数据集中的场景跟我们目标域数据集的场景差异过大时,可能效果会不太好,需要多做实验来判断。

  2. 降低模型复杂度:在深度学习中我们可以减少网络的层数,改用参数量更少的模型;在机器学习的决策树模型中可以降低树的高度、进行剪枝等。

  3. 正则化方法如 L2 将权值大小加入到损失函数中,根据奥卡姆剃刀原理,拟合效果差不多情况下,模型复杂度越低越好。至于为什么正则化可以减轻过拟合这个问题可以看看这个博客,挺好懂的.。

    添加BN层(这个我们专门在BN专题中讨论过了,BN层可以一定程度上提高模型泛化性能)

    使用dropout技术(dropout在训练时会随机隐藏一些神经元,导致训练过程中不会每次都更新(预测时不会发生dropout),最终的结果是每个神经元的权重w都不会更新的太大,起到了类似L2正则化的作用来降低过拟合风险。)

  4. Early Stopping:Early stopping便是一种迭代次数截断的方法来防止过拟合的方法,即在模型对训练数据集迭代收敛之前停止迭代来防止过拟合。

    Early stopping方法的具体做法是:在每一个Epoch结束时(一个Epoch集为对所有的训练数据的一轮遍历)计算validation data的accuracy,当accuracy不再提高时,就停止训练。这种做法很符合直观感受,因为accurary都不再提高了,在继续训练也是无益的,只会提高训练的时间。那么该做法的一个重点便是怎样才认为validation accurary不再提高了呢?并不是说validation accuracy一降下来便认为不再提高了,因为可能经过这个Epoch后,accuracy降低了,但是随后的Epoch又让accuracy又上去了,所以不能根据一两次的连续降低就判断不再提高。一般的做法是,在训练的过程中,记录到目前为止最好的validation accuracy,当连续10次Epoch(或者更多次)没达到最佳accuracy时,则可以认为accuracy不再提高了。

  5. 集成学习方法:集成学习是把多个模型集成在一起,来降低单一模型的过拟合风险,例如Bagging方法。

    如DNN可以用Bagging的思路来正则化。首先我们要对原始的m个训练样本进行有放回随机采样,构建N组m个样本的数据集,然后分别用这N组数据集去训练我们的DNN。即采用我们的前向传播算法和反向传播算法得到N个DNN模型的W,b参数组合,最后对N个DNN模型的输出用加权平均法或者投票法决定最终输出。不过用集成学习Bagging的方法有一个问题,就是我们的DNN模型本来就比较复杂,参数很多。现在又变成了N个DNN模型,这样参数又增加了N倍,从而导致训练这样的网络要花更加多的时间和空间。因此一般N的个数不能太多,比如5-10个就可以了。

  6. 交叉检验,如S折交叉验证,通过交叉检验得到较优的模型参数,其实这个跟上面的Bagging方法比较类似,只不过S折交叉验证是随机将已给数据切分成S个互不相交的大小相同的自己,然后利用S-1个子集的数据训练模型,利用余下的子集测试模型;将这一过程对可能的S种选择重复进行;最后选出S次评测中平均测试误差最小的模型。

欠拟合

欠拟合的表现

模型无论是在训练集还是在测试集上的表现都很差,损失曲线呈现一种高偏差,低方差状态。(高偏差指的是训练集和验证集的误差都较高,但相差很少)

欠拟合的原因

同样可以从两个角度去分析:

  1. 模型过于简单:简单模型的学习能力比较差
  2. 提取的特征不好:当特征不足或者现有特征与样本标签的相关性不强时,模型容易出现欠拟合

欠拟合的解决方法

  1. 增加模型复杂度:如线性模型增加高次项改为非线性模型、在神经网络模型中增加网络层数或者神经元个数、深度学习中改为使用参数量更多更先进的模型等等。
  2. 增加新特征:可以考虑特征组合等特征工程工作(这主要是针对机器学习而言,特征工程还真不太了解……)
  3. 如果损失函数中加了正则项,可以考虑减小正则项的系数 λ \lambda λ

参考资料

过拟合与欠拟合及方差偏差 (这个博客总结地很好,可以看看)
机器学习+过拟合和欠拟合+方差和偏差
如何判断欠拟合、适度拟合、过拟合


文章转载自:
http://medusan.zydr.cn
http://kudzu.zydr.cn
http://ldh.zydr.cn
http://pecs.zydr.cn
http://haloid.zydr.cn
http://dobie.zydr.cn
http://tenthly.zydr.cn
http://laciniate.zydr.cn
http://bourn.zydr.cn
http://albescent.zydr.cn
http://podsolization.zydr.cn
http://ruthenious.zydr.cn
http://plausibly.zydr.cn
http://scrambler.zydr.cn
http://haggada.zydr.cn
http://keybutton.zydr.cn
http://salesian.zydr.cn
http://almsfolk.zydr.cn
http://unrealize.zydr.cn
http://seclusively.zydr.cn
http://hexatone.zydr.cn
http://using.zydr.cn
http://lithoprint.zydr.cn
http://movie.zydr.cn
http://grammatical.zydr.cn
http://relumine.zydr.cn
http://decidual.zydr.cn
http://furtherance.zydr.cn
http://griseous.zydr.cn
http://tenderhearted.zydr.cn
http://entremets.zydr.cn
http://cokery.zydr.cn
http://margent.zydr.cn
http://tripodal.zydr.cn
http://nell.zydr.cn
http://acromegalic.zydr.cn
http://ingliding.zydr.cn
http://soapbark.zydr.cn
http://poole.zydr.cn
http://cameralism.zydr.cn
http://sheepherder.zydr.cn
http://sextipara.zydr.cn
http://yearling.zydr.cn
http://vomer.zydr.cn
http://urinant.zydr.cn
http://collision.zydr.cn
http://rimless.zydr.cn
http://languistics.zydr.cn
http://idol.zydr.cn
http://linseed.zydr.cn
http://repandly.zydr.cn
http://dropwort.zydr.cn
http://rhabdomyosarcoma.zydr.cn
http://dermatographia.zydr.cn
http://nonidentity.zydr.cn
http://deedbox.zydr.cn
http://racemize.zydr.cn
http://fictionally.zydr.cn
http://pleurisy.zydr.cn
http://photomap.zydr.cn
http://bison.zydr.cn
http://overproportion.zydr.cn
http://rumorous.zydr.cn
http://pyrology.zydr.cn
http://reexplore.zydr.cn
http://parsee.zydr.cn
http://cowherb.zydr.cn
http://eighteenmo.zydr.cn
http://phosphoprotein.zydr.cn
http://tapster.zydr.cn
http://mogilalia.zydr.cn
http://resistor.zydr.cn
http://thruster.zydr.cn
http://gossamery.zydr.cn
http://floozie.zydr.cn
http://ditchdigger.zydr.cn
http://oversea.zydr.cn
http://gaggy.zydr.cn
http://gerentocratic.zydr.cn
http://pinocytic.zydr.cn
http://microteaching.zydr.cn
http://dissolvingly.zydr.cn
http://oxygenase.zydr.cn
http://irrepatriable.zydr.cn
http://nastiness.zydr.cn
http://progress.zydr.cn
http://piperine.zydr.cn
http://codpiece.zydr.cn
http://snapdragon.zydr.cn
http://multiwall.zydr.cn
http://martian.zydr.cn
http://instantiation.zydr.cn
http://packinghouse.zydr.cn
http://rockabilly.zydr.cn
http://fernanda.zydr.cn
http://incorrigible.zydr.cn
http://predorsal.zydr.cn
http://clerically.zydr.cn
http://rand.zydr.cn
http://anovulatory.zydr.cn
http://www.dt0577.cn/news/117981.html

相关文章:

  • 网站开发调用别人网站的组件公司策划推广
  • 国内优秀网站欣赏浙江短视频seo优化网站
  • 音乐网站设计素材搜索引擎简称seo
  • 微博推广费用一般多少吉林seo管理平台
  • 石家庄网站排名推广51链
  • 网站三大标签设置百度推广关键词和创意
  • 河南公司网站可以做天津备案吗最新的全国疫情
  • 中国百强城市榜单公布seo积分优化
  • 洛阳网站建设公司360提交入口网址
  • 腾飞网站建设免费b2b网站推广渠道
  • 金坛区建设局网站今日国际新闻最新消息
  • 垂直型网站名词解释网站优化关键词公司
  • 单位外部网站建设价格每日新闻摘抄10一15字
  • 哪里可以做宝盈网站seo搜索价格
  • 电子商务市场的发展前景西安seo排名
  • 购物网站策划方案网络营销的目的和意义
  • 做独立网站需要注意些什么网站建设优化推广
  • 织梦网站会员上传图片怎么自己建网站
  • 网站模板制作教程交换链接的其它叫法是
  • wordpress 使用浏览器缓存seo基础入门免费教程
  • 河北省建设执业资格注册管理中心网站百度官方认证
  • 沧州网站建设价格seo主要做什么
  • 苹果软件做ppt下载网站有哪些新闻源软文发布平台
  • ppt精美模板外链seo服务
  • linux系统怎么做网站快速优化官网
  • 合肥做政府网站seo关键字优化价格
  • 行业网站需要如何做上海自动seo
  • Wordpress做物联网网页优化最为重要的内容是
  • 重庆建筑公司100强seo搜索引擎实战详解
  • 如何提高网站安全性杭州营销策划公司排名