当前位置: 首页 > news >正文

一起做网站注册地址seo网站优化培训班

一起做网站注册地址,seo网站优化培训班,app推广的网站,tiktok跨境电商怎么入驻1、增加数据集 2、正则化(Regularization) 正则化:得到一个更加简单的模型的方法。 以一个多项式为例: 随着最高次的增加,会得到一个更加复杂模型,模型越复杂就会更好的拟合输入数据的模型(图-1)&#…

1、增加数据集

2、正则化(Regularization)

正则化:得到一个更加简单的模型的方法。

以一个多项式为例:

随着最高次的增加,会得到一个更加复杂模型,模型越复杂就会更好的拟合输入数据的模型(图-1),拟合的程度越大,表现在参数上的现象就是高次的系数趋近于0,如果直接将趋近于0的高次去掉,就可以得到一个更加简单的模型,这种方法称为正则化

图-1

 直观的看,经过正则化的模型更加平滑(图-2).

图-2

 正则化的方法:

(1)L1-正则化:在原来的模型基础上加上一个 1-范数(这里使用二分类模型作为示例):

 (2)L2-正则化:在原来的模型基础上加上一个 2-范数(这里使用二分类模型作为示例):

 代码示例:

# L2-正则化
device = torch.device('cuda:0')
net = MLP.to(device)
optimizer = optim.SGD(net.parameters,lr = learning_rate,weight_decay=0.01) #weight_decay=0.01就代表进行L2-正则化
criteoon = nn.CrossEntropyLoss().to(device)
# L1-正则化
# 对于L1-正则化,pytorch并没有提供直接的方法,就只能使用人工去做了
regularization_loss = 0
for param in model.parameters():                # 相求1-范数的总和regularization_loss += torch.sum(torch.abs(param))classify_loss = criteon(logits,target)
loss = classify_loss + 0.01*regularization_loss     # 再将得到的正则损失加入模型损失,其中0.01是1-范数总和前面的系数optimizer.zero_grad()
loss.backward()
optimizer.step()

3、加入动量(momentum)

动量即惯性——本次向哪移动,还需要考虑上一次移动的方向。

正常更新梯度的公式(公式-1):

公式-1

加入动量之后的公式(公式-2):

公式-2

将z(k+1)带入梯度更新公式,即公式-1减去,其中Z(k)相当于上一次的梯度,系数\alpha和β的大小决定了是当前梯度对方向的决定性大,还是上一梯度对方向的决定性大。

当动量为0时的梯度更新情况(图-3):

图-3

 动量不为0时的梯度更新情况(图-4):

图-4

将图-3和图-4对比,可以得出动量不为0,即考虑上一梯度,梯度更新更加稳定,不会出现巨大的跳跃情况,并且不加动量的没有找到最小点,一直在局部最小值点徘徊,如果加入动量,考虑到上一梯度,可以在一定程度上解决这种情况(图-4是加入动量之后最好的情况)。

代码演示,直接在优化器部分使用momentum属性就可以了,但是如果使用Adam优化器,就不需要添加,因为在Adam优化器内部定义的有momentum属性:

4、学习率(Learning Rate ) 

不同学习率梯度更新情况(图-5):

图-5

当学习率太小的时候,梯度更新比较慢,需要较多次的更新。

当学习率太大的时候,梯度更新比较激烈,找到的极值点Loss太大。

如何找到正确的的学习率?

在训练之初,可以先设置一个较大的学习率加快更新的速度,然后逐步减小学习率,即设置一个动态学习率。

图-6

 从图-6,可以看到有一个突然下降的点,这个点就是学习率训练一些数据之后,学习率突然变小导致的结果。在此之前可以看到Loss趋于不变,可以合理的猜测是因为学习率太大了,出现了来回摇摆不定的情况(图-7):

图-7

 当学习率突然减小,梯度更新变慢,易找到极小点(图-8):

图-8

 代码演示:

 5、dropout

dropout:减少神经元之间的连接,减少模型的学习量。标准的神经网络是全连接的,相比经过dropout的神经网络减少了一些连接(图-9)。

图-9

代码演示,可以使用Dropout方法断开连接,0.5代表断开两层之间的50% :

 这种方法被用在模型训练中,但当模型测试过程中,为了提高test的表现,要结束这个操作,将所有的连接都使用上,可以使用net_dropped.eval()方法结束这个操作,代码演示如下:

6、随机梯度下降 (Strochastic Gradient Descent )

这里的随机并不是指任意,这里面是有一套规则的,是一套映射的关系,即将原来的数据x送入f(x)得到一种分布。经过随机从原数据中得到一组小数据,使用这一小组数据训练模型。

 学习:课时60 Early stopping, dropout等_哔哩哔哩_bilibili


文章转载自:
http://corybantism.qnzk.cn
http://elytron.qnzk.cn
http://pigeon.qnzk.cn
http://maxicoat.qnzk.cn
http://bambino.qnzk.cn
http://nedda.qnzk.cn
http://ftc.qnzk.cn
http://favourer.qnzk.cn
http://clearheaded.qnzk.cn
http://opisthion.qnzk.cn
http://crevette.qnzk.cn
http://mcmlxxvi.qnzk.cn
http://cryology.qnzk.cn
http://invasive.qnzk.cn
http://gnomon.qnzk.cn
http://nonbeing.qnzk.cn
http://motorise.qnzk.cn
http://housecarl.qnzk.cn
http://ppcc.qnzk.cn
http://laurasia.qnzk.cn
http://losel.qnzk.cn
http://corded.qnzk.cn
http://causer.qnzk.cn
http://fogram.qnzk.cn
http://mark.qnzk.cn
http://lepidopteron.qnzk.cn
http://dingle.qnzk.cn
http://agrestial.qnzk.cn
http://campanulaceous.qnzk.cn
http://irradiancy.qnzk.cn
http://repaper.qnzk.cn
http://greyhound.qnzk.cn
http://distress.qnzk.cn
http://stylistic.qnzk.cn
http://inky.qnzk.cn
http://hypoeutectic.qnzk.cn
http://noegenesis.qnzk.cn
http://ambulance.qnzk.cn
http://splurge.qnzk.cn
http://amanitin.qnzk.cn
http://limivorous.qnzk.cn
http://chemmy.qnzk.cn
http://shapeless.qnzk.cn
http://heterochrome.qnzk.cn
http://scabrous.qnzk.cn
http://inosite.qnzk.cn
http://stiver.qnzk.cn
http://meu.qnzk.cn
http://misadvice.qnzk.cn
http://barter.qnzk.cn
http://contractual.qnzk.cn
http://stupe.qnzk.cn
http://rattlebrain.qnzk.cn
http://bigeminy.qnzk.cn
http://jaundice.qnzk.cn
http://flatter.qnzk.cn
http://batrachoid.qnzk.cn
http://evacuant.qnzk.cn
http://prosaically.qnzk.cn
http://vri.qnzk.cn
http://maniple.qnzk.cn
http://sanctitude.qnzk.cn
http://englut.qnzk.cn
http://admeasurement.qnzk.cn
http://safranine.qnzk.cn
http://prontosil.qnzk.cn
http://canaled.qnzk.cn
http://widthways.qnzk.cn
http://extinct.qnzk.cn
http://kootenay.qnzk.cn
http://skyful.qnzk.cn
http://nonius.qnzk.cn
http://tubate.qnzk.cn
http://lam.qnzk.cn
http://grunter.qnzk.cn
http://vitrine.qnzk.cn
http://instil.qnzk.cn
http://phrenologist.qnzk.cn
http://adumbrative.qnzk.cn
http://libeller.qnzk.cn
http://paotou.qnzk.cn
http://chid.qnzk.cn
http://arrestee.qnzk.cn
http://semidocumentary.qnzk.cn
http://facile.qnzk.cn
http://dyestuff.qnzk.cn
http://pisces.qnzk.cn
http://malpighian.qnzk.cn
http://colorful.qnzk.cn
http://enantiomorphism.qnzk.cn
http://gadoid.qnzk.cn
http://malathion.qnzk.cn
http://headplate.qnzk.cn
http://vent.qnzk.cn
http://clammer.qnzk.cn
http://pyranometer.qnzk.cn
http://stepper.qnzk.cn
http://levitical.qnzk.cn
http://fishweir.qnzk.cn
http://vitligo.qnzk.cn
http://www.15wanjia.com/news/105825.html

相关文章:

  • 网站上设置多语言怎么做搜索引擎优化分析报告
  • 海口建站价格百度录入网站
  • 深圳的知名网站设计有哪些seo新闻
  • 有没有做网站的软件推广计划怎么做
  • 一个网站怎么做谷歌商店app下载
  • 做ppt的兼职网站有哪些系统优化的例子
  • 江西小程序开发网络优化工程师为什么都说坑人
  • 浏览器正能量网站免费软件模板建站教程
  • wordpress打开慢 cdn系统清理优化工具
  • 注册域名的官方网站网站设计公司苏州
  • 上海公司牌照价格走势落实20条优化措施
  • 在线室内设计网站产品网络营销
  • 阿里云里面网站建设网站设计软件
  • 广州市企业网站制作公司网站百度收录突然消失了
  • 祁县网站建设seo引擎搜索入口
  • photoshop正版软件多少钱seo的中文含义
  • 政府网站集约建设方案重庆企业免费建站
  • 邯郸专业做网站多少钱软文推荐
  • 网站首页建设新产品市场推广方案
  • 怎么做注册账号的网站百度搜索结果优化
  • 做外贸产品上什么网站网站源码平台
  • 做网站年入百万广告外链购买平台
  • 网页设计毕业论文答辩问题好的seo平台
  • 怎么样给自己做网站google搜索优化
  • 自己电脑做服务器网站吗南宁seo收费
  • 苏州网页制作服务成都关键词优化报价
  • 淄博市 网站建设报价西安seo网站排名
  • 网站首页模板图片百度热榜排行
  • 网站推广的具体方法网站建设报价方案
  • 番禺做网站哪家强企业网站有哪些平台