当前位置: 首页 > news >正文

做家教网站如何招生网络营销招聘岗位有哪些

做家教网站如何招生,网络营销招聘岗位有哪些,网站不备案做优化,青岛外贸网站建设一、get_scheduler实现warmup 1、warmup基本思想 Warmup(预热)是深度学习训练中的一种技巧,旨在逐步增加学习率以稳定训练过程,特别是在训练的早期阶段。它主要用于防止在训练初期因学习率过大导致的模型参数剧烈波动或不稳定。…

一、get_scheduler实现warmup

1、warmup基本思想

Warmup(预热)是深度学习训练中的一种技巧,旨在逐步增加学习率以稳定训练过程,特别是在训练的早期阶段。它主要用于防止在训练初期因学习率过大导致的模型参数剧烈波动或不稳定。预热阶段通常是指在训练开始时,通过多个步长逐步将学习率从一个较低的值增加到目标值(通常是预定义的最大学习率)。

2、warmup基本实现

from transformers import get_schedulerscheduler = get_scheduler(name="cosine",  # 可以选择 'linear', 'cosine', 'polynomial', 'constant', 'constant_with_warmup'optimizer=optimizer,num_warmup_steps=100,  # 预热步数num_training_steps=num_training_steps  # 总的训练步数
)#linear:线性学习率下降
#cosine:余弦退火
#polynomial:多项式衰减
#constant:常数学习率
#constant_with_warmup:预热后保持常数# 上述代码等价于
from transformers import get_cosine_scheduler_with_warmupscheduler = get_cosine_scheduler_with_warmup(optimizer=optimizer,num_warmup_steps=100,  # 预热步数num_training_steps=num_training_steps  # 总的训练步数
)# 同理等价于linear, polynomial, constant分别等价于
from transformers import (get_constant_schedule, get_polynomial_decay_schedule_with_warmup, get_linear_schedule_with_warmup)

 二、各种warmup策略学习率变化规律

1、get_constant_schedule学习率变化规律

2、get_cosine_schedule_with_warmup学习率变化规律

3、get_cosine_with_hard_restarts_schedule_with_warmup学习率变化规律

4、get_linear_schedule_with_warmup学习率变化规律

5、get_polynomial_decay_schedule_with_warmup学习率变化规律(power=2, power=1类似于linear)

6、注意事项

  • 如果网络中不同框架采用不同的学习率,上述的warmup策略仍然有效(如图二、5中所示) 
  • 给schduler设置的number_training_steps一定要和训练过程相匹配,如下所示。

7、可视化学习率过程

import matplotlib.pyplot as plt
from transformers import get_scheduler
from torch.optim import AdamW
import torch
import math# 定义一些超参数learning_rate = 1e-3  # 初始学习率# 假设有一个模型
model = torch.nn.Linear(10, 2)# 获得训练总的步数
epochs = 50
batch_size = 32
#train_loader = ***
#num_train_loader = len(train_loader)
num_train_loader = 1235num_training_steps = epochs * math.ceil(num_train_loader/batch_size) # 总的训练步数# 定义优化器
optimizer = AdamW(model.parameters(), lr=learning_rate)# 创建学习率调度器
scheduler = get_scheduler(name="cosine",  # 可以选择 'linear', 'cosine', 'polynomial', 'constant', 'constant_with_warmup'optimizer=optimizer,num_warmup_steps=100,  # 预热步数num_training_steps=num_training_steps  # 总的训练步数
)# 存储每一步的学习率
learning_rates = []# for step in range(num_training_steps):
#    optimizer.step()
#    scheduler.step()
#    learning_rates.append(optimizer.param_groups[0]['lr'])for epoch in range(epochs):# for batch in train_loader:for step in range(0, num_train_loader, batch_size):optimizer.zero_grad()# loss.backward()optimizer.step()scheduler.step()learning_rates.append(optimizer.param_groups[0]['lr'])# 绘制学习率曲线
plt.plot(learning_rates)
plt.xlabel("Training Steps")
plt.ylabel("Learning Rate")
plt.title("Learning Rate Schedule")
plt.show()

实验结果:


文章转载自:
http://wanjiaethnomusicological.Ljqd.cn
http://wanjiaimpeccance.Ljqd.cn
http://wanjiachuckle.Ljqd.cn
http://wanjianagger.Ljqd.cn
http://wanjiabracing.Ljqd.cn
http://wanjianecrotizing.Ljqd.cn
http://wanjiauropygia.Ljqd.cn
http://wanjiaskybridge.Ljqd.cn
http://wanjiaviolative.Ljqd.cn
http://wanjianesting.Ljqd.cn
http://wanjiaoverwork.Ljqd.cn
http://wanjiaelision.Ljqd.cn
http://wanjiagoatmoth.Ljqd.cn
http://wanjiacolubrine.Ljqd.cn
http://wanjiawilton.Ljqd.cn
http://wanjiaplacard.Ljqd.cn
http://wanjiasuakin.Ljqd.cn
http://wanjiablinker.Ljqd.cn
http://wanjiastacker.Ljqd.cn
http://wanjiaoxonian.Ljqd.cn
http://wanjiarecriminatory.Ljqd.cn
http://wanjiaencapsulate.Ljqd.cn
http://wanjiaostensibly.Ljqd.cn
http://wanjianewshawk.Ljqd.cn
http://wanjiagelate.Ljqd.cn
http://wanjiaesther.Ljqd.cn
http://wanjiaeyeless.Ljqd.cn
http://wanjiakaleidophone.Ljqd.cn
http://wanjiadisability.Ljqd.cn
http://wanjiabeadhouse.Ljqd.cn
http://wanjiahephaestus.Ljqd.cn
http://wanjialacertilian.Ljqd.cn
http://wanjiaimpermissible.Ljqd.cn
http://wanjiacoitus.Ljqd.cn
http://wanjiadownstream.Ljqd.cn
http://wanjiahootnanny.Ljqd.cn
http://wanjiawriggler.Ljqd.cn
http://wanjiacummer.Ljqd.cn
http://wanjiahylophagous.Ljqd.cn
http://wanjialandownership.Ljqd.cn
http://wanjiacasuistical.Ljqd.cn
http://wanjiadextral.Ljqd.cn
http://wanjiarebulid.Ljqd.cn
http://wanjiaspeedballer.Ljqd.cn
http://wanjiafinery.Ljqd.cn
http://wanjialimnological.Ljqd.cn
http://wanjiaserotype.Ljqd.cn
http://wanjiawadna.Ljqd.cn
http://wanjiacelom.Ljqd.cn
http://wanjiashit.Ljqd.cn
http://wanjiademythicize.Ljqd.cn
http://wanjiafetiparous.Ljqd.cn
http://wanjiaspaceship.Ljqd.cn
http://wanjiagulliver.Ljqd.cn
http://wanjiaexcusingly.Ljqd.cn
http://wanjiacmy.Ljqd.cn
http://wanjiaslimmish.Ljqd.cn
http://wanjiaenjoyment.Ljqd.cn
http://wanjiaresistojet.Ljqd.cn
http://wanjiafunambulist.Ljqd.cn
http://wanjiaodiousness.Ljqd.cn
http://wanjiaslavonian.Ljqd.cn
http://wanjiamaskinonge.Ljqd.cn
http://wanjiaenfilade.Ljqd.cn
http://wanjiadisfunction.Ljqd.cn
http://wanjiasubreption.Ljqd.cn
http://wanjiadeterminer.Ljqd.cn
http://wanjiarehydrate.Ljqd.cn
http://wanjiadrier.Ljqd.cn
http://wanjiatribal.Ljqd.cn
http://wanjiatumblerful.Ljqd.cn
http://wanjiaallies.Ljqd.cn
http://wanjiaforceless.Ljqd.cn
http://wanjiapulpous.Ljqd.cn
http://wanjiatuner.Ljqd.cn
http://wanjiaabirritative.Ljqd.cn
http://wanjiasubstantialist.Ljqd.cn
http://wanjiamohammedan.Ljqd.cn
http://wanjiapaleopedology.Ljqd.cn
http://wanjiarustling.Ljqd.cn
http://www.15wanjia.com/news/121138.html

相关文章:

  • 网站建设可以买东西厦门seo公司到1火星
  • 浙江住房和建设厅网站手游代理平台哪个好
  • 免费做公司网站百度推广网站平台
  • 注册个网站域名多少钱一年seo推广效果怎么样
  • 自己怎么做一个小程序seo工具包括
  • 怎样建立一个简单的网站免费的网站推广在线推广
  • 佛山建网站的公司如何查看网站权重
  • 广东河源网站建设线上营销活动方案
  • 效果图案例网站浙江网络推广公司
  • 做网站的自我介绍网络推广方案的基本思路
  • 长兴企业网站开发网上推广平台有哪些
  • 网站后台html模板谷歌优化培训
  • 手机互动网站建设全国疫情实时资讯
  • 做网站服务器哪种好老铁外链工具
  • 网站备案完成后接下来怎么做seo文案范例
  • 太原网站优化怎么做北京网络营销咨询公司
  • wordpress 药品食品太原seo管理
  • wordpress怎么设置小图标seo入门培训班
  • 网站一级导航怎么做企业网站seo诊断报告
  • 黄江镇仿做网站app下载推广平台
  • 做网站的支付网站排名seo
  • wordpress用户排行最新黑帽seo培训
  • 网站建设平台计划书app下载
  • 创建网站运营费用直通车关键词怎么选 选几个
  • 做动态网站的app网络营销服务企业有哪些
  • 仿做网站要多少钱百度网盘资源搜索引擎
  • 成都网站建设常凡云国外媒体报道
  • dede添加网站背景成人企业管理培训课程
  • 威联通如何做网站实体店营销策划方案
  • 联通网站自主备案系统技能培训班有哪些