当前位置: 首页 > news >正文

php网站开发程序学校模板

php网站开发程序,学校模板,wordpress反馈,本地网站搭建视频教程残差连接和层规范化 层规范化和批量规范化的目标相同,但层规范化是基于特征维度进行规范化。尽管批量规范化在计算机视觉中被广泛应用,但在自然语言处理任务中(输入通常是变长序列)批量规范化通常不如层规范化的效果好。 以下代…

残差连接和层规范化

层规范化和批量规范化的目标相同,但层规范化是基于特征维度进行规范化。尽管批量规范化在计算机视觉中被广泛应用,但在自然语言处理任务中(输入通常是变长序列)批量规范化通常不如层规范化的效果好。

以下代码对比不同维度的层规范化和批量规范化的效果。

ln = nn.LayerNorm(2)
bn = nn.BatchNorm1d(2)
X = torch.tensor([[1, 2], [2, 3]], dtype=torch.float32)
# 在训练模式下计算X的均值和方差
print('layer norm:', ln(X), '\nbatch norm:', bn(X))
layer norm: tensor([[-1.0000,  1.0000],[-1.0000,  1.0000]], grad_fn=<NativeLayerNormBackward0>)
batch norm: tensor([[-1.0000, -1.0000],[ 1.0000,  1.0000]], grad_fn=<NativeBatchNormBackward0>)

现在可以使用残差连接和层规范化来实现AddNorm类。暂退法也被作为正则化方法使用。

#@save
class AddNorm(nn.Module):"""残差连接后进行层规范化"""def __init__(self, normalized_shape, dropout, **kwargs):super(AddNorm, self).__init__(**kwargs)self.dropout = nn.Dropout(dropout)self.ln = nn.LayerNorm(normalized_shape)def forward(self, X, Y):return self.ln(self.dropout(Y) + X)

残差连接要求两个输入的形状相同,以便加法操作后输出张量的形状相同。 

add_norm = AddNorm([3, 4], 0.5)
add_norm.eval()
add_norm(torch.ones((2, 3, 4)), torch.ones((2, 3, 4))).shape

 torch.Size([2, 3, 4])

 

 

 

http://www.15wanjia.com/news/163102.html

相关文章:

  • 公司网站名词解释本地视频做成链接网址
  • 化妆品网站建设推广方案新乡网络推广外包
  • 小程序就是做网站建微网站需要购买官网主机吗
  • o2o网站建设公司排名邯郸房地产网站建设
  • 网站建设要注册哪些商标类别互联网技术对人力资源管理的影响有哪些
  • 做海报的网站有哪些内容qq营销网站源码
  • 英文wordpress建站村建站是什么部门
  • 赣县区建设局网站软件开发过程文档
  • 口碑好的福州网站建设pda智能巡检系统
  • 西安网站制作的公司网站用橙色
  • html网站搭建西安建站套餐
  • 网站开发自学流程企业所得税的优惠政策
  • 网站个人微信收款方案django做的网站
  • 电子商务网站建设的实训心得在门户网站上做推广
  • 温州 网站建设游戏网站建设表格
  • 深圳有哪些网站开发公司北京顺义网站建设
  • 深圳好的外贸网站建设公司宣传册模板图片
  • 昆明网站seo多少钱怎么把网站的标题做的炫酷
  • 英语做美食网站永久域名申请
  • 网站地图模板下载wordpress 做手机站
  • 网站备案换ip室内装修设计软件手机版
  • 网站备案归琼海在线
  • dedecms做中英文网站重庆企业网络推广价格
  • 陕西省建设信息网站网站开发后需要交接哪些材料
  • 怎么使用模板建设网站微信网页版手机登录入口
  • 合肥建站企业免费货源在线网站
  • 简洁大方的网站模板优秀网站建设哪家便宜
  • 云南省城乡建设厅网站网站如何做seo推广
  • 微信微网站开发百度云互换链接的方法
  • 网站中的公司地址怎么做天津网站建设wangzhii