当前位置: 首页 > news >正文

网站建站和项目部署一样吗花都网站建设公司

网站建站和项目部署一样吗,花都网站建设公司,wordpress主题 插件下载失败,在公司做网站是什么职位一、原因 神经网络梯度 假设现在有一个 层的神经网络,每层的输出为一个对输入作 变换的函数结果 用 来表示第 层的输出,那么有下列公式: 链式法则计算损失 关于某一层某个参数 的梯度: 注意到, 为向量&am…

一、原因

神经网络梯度

· 假设现在有一个 d 层的神经网络,每层的输出为一个对输入作 f_t 变换的函数结果

· 用 h^t 来表示第 t 层的输出,那么有下列公式:

h^t = f_t(h^{t-1})

· 链式法则计算损失 l 关于某一层某个参数 w_t 的梯度:

\frac{\partial l}{\partial w_t}=\frac{\partial l}{\partial h^d}\frac{\partial h^d}{\partial h^{d-1}}...\frac{\partial h^t}{\partial w_t}

· 注意到,h^t 为向量,这相当于一个 d-t 次的矩阵乘法

这个传递可能造成以下问题:

· 假设每次的梯度为1.5,但随着神经网络的规模变大,往后传递过去可能就有 1.5^{100}=4*10^{17} 这么大,从而产生梯度爆炸。

· 假设每次的梯度为0.8,同样的道理,传递过去可能有 0.8^{100}=2*10^{-10} 这么小,从而使模型最后的变化幅度很小,出现梯度消失。

二、梯度消失

假设用sigmoid函数作为激活函数

· 导数的问题是,当输入相对较大或者较小时,求导计算之后,每次向上传递的梯度会变得很小

· 累乘起来之后,这个值可能就会变得更小

可能造成的问题:

· 梯度值非常接近0,使得模型无法训练,每次训练改变幅度非常小

· 在神经网络较深时,对于底部层尤为严重

        · 反向传播时,顶部的训练可能较好,拿到的梯度较正常

        · 越到底部,梯度越小,底部层无法训练,使得神经网络无法变深

三、梯度爆炸

假设我们使用ReLU函数作为隐藏层的激活函数

· ReLU激活函数的导数会使大于0的输出求导后都是1,小于等于0的输出求导后都是0

· 首先将链式法则的求导公式代入ReLU激活函数转化一下,得到下式

· 这时,h^{t-1} 与 w_t 相乘后再在ReLU函数里求导的结果就是0或1,那么每次传递的就是 w_t 转置值

· 如果中间层 d-t 很大,那么最后累乘的结果就会很大,最终导致梯度爆炸

可能造成的问题:

· 值超过上限(如16位浮点数,可能数值上溢)

· 对学习率非常敏感

        · 若学习率较大—大参数值—更大的梯度

        · 若学习率较小—训练效果小

        · 需要不断调整学习率

http://www.15wanjia.com/news/28810.html

相关文章:

  • 江苏城乡和住房建设厅网站厦门网络推广哪家强
  • 网站开发的基础知识百度网盘网站入口
  • 如何自己做一个app优化关键词排名哪家好
  • 用html5做的网站如何检测网站是否安全
  • excel做公司的小网站免费人脉推广
  • 做的网站每年都要交费吗2021年经典营销案例
  • 深圳网站建设设计sem代运营
  • 换空间网站备案吗杭州seo论坛
  • ui网页设计实训报告关键词优化seo优化排名
  • 品牌设计工作内容百色seo关键词优化公司
  • wordpress获取tag第一篇文章seo高手是怎样炼成的
  • 天元建设集团有限公司烟台分公司排名轻松seo 网站
  • 网站运营托管方案发帖推广平台
  • 网站源码大全免费腾讯广告平台
  • 为何网站打不开软文营销文章300字
  • 如何做旅游攻略网站企业seo
  • 网站引擎友好性分析百度联盟点击广告赚钱
  • 备案 网站名称怎么写中文搜索引擎
  • 网站的维护怎么做百度怎么投放广告
  • 天津网站大全百度上海分公司地址
  • 网站建设入门教程视频教程免费友情链接网页
  • 手机网站建设教程常用的营销策略
  • 网站会员注册怎么做站优化
  • 做网站公司yuanmus教育培训机构有哪些
  • 农业信息网站 建设网络营销实训总结报告
  • 风铃做的网站能否推广网站营销与推广
  • 郑州网站优化软件互联网电商平台有哪些
  • 做网站教程 第一课看seo
  • 淄博哪里有网站建设平台营销型网站制作建设
  • 怎么做像滴滴一样网站发布软文