当前位置: 首页 > news >正文

网站怎么做301定向东莞清溪妇产科医院

网站怎么做301定向,东莞清溪妇产科医院,北京app开发多少钱,wordpress 图片放大目录 1. 网络设计2. 代码实现2.1 网络代码2.2 train 3. 完整代码 1. 网络设计 输入是手写数字图片28x28,输出是10个分类0~9,有两个隐藏层,如下图所示: 2. 代码实现 2.1 网络代码 第一层将784降维到200,第二次使用…

目录

  • 1. 网络设计
  • 2. 代码实现
    • 2.1 网络代码
    • 2.2 train
  • 3. 完整代码

1. 网络设计

输入是手写数字图片28x28,输出是10个分类0~9,有两个隐藏层,如下图所示:
在这里插入图片描述

2. 代码实现

2.1 网络代码

第一层将784降维到200,第二次使用200不降维,输出层200降维到10,每一层之后加一个激活函数relu,每一层都需要梯度信息所以requires_grad=True;
forward函数最后不要加softmax,因为后面CrossEntropyLoss中包含了softmax操作。
在这里插入图片描述

2.2 train

优化目标是w1、b1、w2、b2、w3、b3,使用SGD优化器,使用CrossEntropyLoss计算loss
在这里插入图片描述

3. 完整代码

import  torch
import  torch.nn as nn
import  torch.nn.functional as F
import  torch.optim as optim
from    torchvision import datasets, transformsbatch_size=200
learning_rate=0.01
epochs=10train_loader = torch.utils.data.DataLoader(datasets.MNIST('../data', train=True, download=True,transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.1307,), (0.3081,))])),batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(datasets.MNIST('../data', train=False, transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.1307,), (0.3081,))])),batch_size=batch_size, shuffle=True)w1, b1 = torch.randn(200, 784, requires_grad=True),\torch.zeros(200, requires_grad=True)
w2, b2 = torch.randn(200, 200, requires_grad=True),\torch.zeros(200, requires_grad=True)
w3, b3 = torch.randn(10, 200, requires_grad=True),\torch.zeros(10, requires_grad=True)# torch.nn.init.kaiming_normal_(w1)
# torch.nn.init.kaiming_normal_(w2)
# torch.nn.init.kaiming_normal_(w3)def forward(x):x = x@w1.t() + b1x = F.relu(x)x = x@w2.t() + b2x = F.relu(x)x = x@w3.t() + b3x = F.relu(x)return xoptimizer = optim.SGD([w1, b1, w2, b2, w3, b3], lr=learning_rate)
criteon = nn.CrossEntropyLoss()for epoch in range(epochs):for batch_idx, (data, target) in enumerate(train_loader):data = data.view(-1, 28*28)logits = forward(data)loss = criteon(logits, target)optimizer.zero_grad()loss.backward()# print(w1.grad.norm(), w2.grad.norm())optimizer.step()if batch_idx % 100 == 0:print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(epoch, batch_idx * len(data), len(train_loader.dataset),100. * batch_idx / len(train_loader), loss.item()))test_loss = 0correct = 0for data, target in test_loader:data = data.view(-1, 28 * 28)logits = forward(data)test_loss += criteon(logits, target).item()pred = logits.data.max(1)[1]correct += pred.eq(target.data).sum()test_loss /= len(test_loader.dataset)print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(test_loss, correct, len(test_loader.dataset),100. * correct / len(test_loader.dataset)))

如下图:
未使用torch.nn.init.kaiming_normal_(w1)初始化参数的情况,可以看出Loss在2.302585后就不下降了。
在这里插入图片描述
如下图:使用了torch.nn.init.kaiming_normal_(w1)初始化参数的情况下,Loss下降还是比较快的。
在这里插入图片描述
因此使用好的初始化参数对网络的训练起到至关重要的作用

http://www.15wanjia.com/news/175155.html

相关文章:

  • 网站建设需要哪些软件wordpress内容查看
  • 周口网站优化网站系统关键字
  • 网站建设需要懂什么语言建设网站策划方案
  • phpmysql网站模板网站后台登入模板
  • 深圳哪些公司做网站青海城乡和住房建设厅网站
  • 网站建设的功能模型宁波网站开发制作
  • 网站开发运营成本房产中介网站开发模板
  • 网页设计与网站建设国航网站建设
  • 闽清县城乡建设局网站阿里企业邮箱申请
  • gta5中正在建设的网站广东省建设执业资格注册中心网站
  • 站长之家音效甘肃兰州美食
  • 嘉兴网站制作策划找做防水去那个网站
  • 乐平城市建设局网站霸榜seo
  • 网站加入购物车的代码网站开发建设推荐
  • 站长工具seo综合查询建设网站需要有什么特色
  • 自建网站做淘宝联盟建站网站设计
  • wordpress网站源码东莞网站设计评价
  • 成都优化网站哪家公司好域名不用了需要注销吗
  • 电商网站建设费用预算汽车之家二手车之家
  • 手表网站背景素材wordpress优秀免费主题
  • 杭州网站建设杭州惠州百度推广排名优化
  • 最新网站域名长春建设厅网站首页
  • 曲阜市古建设计院网站沧州网站改版优化
  • 在百度做网站推广怎么做建筑材料交易平台
  • 手机把网站做成软件ajax+jsp网站开发从入门到精通
  • 信息咨询公司网站源码网站部分频道完全不收录了怎么做
  • 信息科技公司网站怎么做wordpress 文本编辑器
  • 龙岗网站设计代理商容桂网站制作咨询
  • 网站建设做得好网站目录 index
  • 公司网站建设方案模板下载莆田哪里有做网站的