当前位置: 首页 > news >正文

专业餐饮vi设计公司优化网站排名费用

专业餐饮vi设计公司,优化网站排名费用,内蒙古建筑培训网官网,那个可以做棋牌网站推理加速-- torch.compile 一、背景介绍1.2 首次推理速度慢1.3 推理多次之后,又会出现一次速度特别慢的情况,感觉好像是重新优化 二、如何使用三、其他设置3.1 mode 设置3.2 backend3.3 fullgraph3.4 dynamic 参考资料 一、背景介绍 PyTorch 2.0 官宣了…

推理加速-- torch.compile

  • 一、背景介绍
    • 1.2 首次推理速度慢
    • 1.3 推理多次之后,又会出现一次速度特别慢的情况,感觉好像是重新优化
  • 二、如何使用
  • 三、其他设置
    • 3.1 mode 设置
    • 3.2 backend
    • 3.3 fullgraph
    • 3.4 dynamic
  • 参考资料

一、背景介绍

PyTorch 2.0 官宣了一个重要特性 —— torch.compile,这一特性将 PyTorch 的性能推向了新的高度,并将 PyTorch 的部分内容从 C++ 移回 Python。torch.compile 是一个完全附加的(可选的)特性,因此 PyTorch 2.0 是 100% 向后兼容的。

支撑 torch.compile 的技术包括研发团队新推出的 TorchDynamo、AOTAutograd、PrimTorch 和 TorchInductor。

  • TorchDynamo:使用 Python Frame Evaluation Hooks 安全地捕获 PyTorch 程序,这项重大创新是 PyTorch 过去 5 年来在安全图结构捕获方面的研发成果汇总;
  • AOTAutograd:重载 PyTorch 的 autograd 引擎,作为一个跟踪 autodiff,用于生成 ahead-of-time 向后跟踪;
  • PrimTorch:将约 2000 多个 PyTorch 算子归纳为一组约 250 个原始算子的闭集,开发人员可以将其作为构建完整 PyTorch 后端的目标。这大大降低了编写 PyTorch 功能或后端的流程;
  • TorchInductor:是一种深度学习编译器,可为多个加速器和后端生成快速代码。对于 NVIDIA GPU,它使用 OpenAI Triton 作为关键构建块。
  • TorchDynamo、AOTAutograd、PrimTorch 和 TorchInductor 是用 Python 编写的,并支持 dynamic shapes(无需重新编译就能发送不同大小的向量),这使得它们具备灵活、易于破解的特性,降低了开发人员和供应商的使用门槛。

1.2 首次推理速度慢

值得注意的是,torch.compile函数不会立即对函数进行加速优化,而是在第一次运行的时候才进行优化。这就会导致编译后的函数在第一次执行的时候十分缓慢。但是,会在第二次执行开始,变得非常快。

1.3 推理多次之后,又会出现一次速度特别慢的情况,感觉好像是重新优化

  • 原因分析

动态推理的原因,即输入的tensor是动态的

二、如何使用

一行代码进行使用

modoel_compile = torch.compile(model)

三、其他设置

def compile(model: Optional[Callable] = None, *,fullgraph: builtins.bool = False,dynamic: builtins.bool = False,backend: Union[str, Callable] = "inductor",mode: Union[str, None] = None,options: Optional[Dict[str, Union[str, builtins.int, builtins.bool]]] = None,disable: builtins.bool = False) -> Callable:"""Optimizes given model/function using TorchDynamo and specified backend.Args:model (Callable): Module/function to optimizefullgraph (bool): Whether it is ok to break model into several subgraphsdynamic (bool): Use dynamic shape tracingbackend (str or Callable): backend to be usedmode (str): Can be either "default", "reduce-overhead" or "max-autotune"options (dict): A dictionary of options to pass to the backend.disable (bool): Turn torch.compile() into a no-op for testing"""

3.1 mode 设置

关于mode参数介绍如下:

  • (默认)default: 适合加速大模型,编译速度快且无需额外存储空间
  • reduce-overhead:适合加速小模型,需要额外存储空间
  • max-autotune:编译速度非常耗时,但提供最快的加速
  • 未正确设置该参数导致的问题:
    1)推理速度慢
  • 示例
modoel_compile = torch.compile(model, mode="reduce-overhead")

3.2 backend

backend 编译器后端:API使用哪个后端将中间表示(IR)计算图(FX graph)转换为低级内核操作。这个选项对于调试graph编译问题和更好地理解torch.compile的内部非常有用。在大多数情况下,默认的Inductor后端似乎能够提供最佳的训练性能结果。有很多后端列表,我们可以使用下面命令查看:

from torch import _dynamoprint(_dynamo.list_backends())

我们测试使用nvprims-nvfuser后端,可以获得比eager模式13%的性能提升(与默认后端28.6%的性能提升相比)。具体区别还是要看Pytorch文档,我们这里就不细说了,因为文档都有。

3.3 fullgraph

fullgraph 强制单个图:这个参数是非常有用,可以确保没有任何不希望的图截断。

3.4 dynamic

dynamic 动态形状:目前 2.0对具有动态形状的张量的编译支持在某种程度上是有限的。编译具有动态形状的模型的一个常见解决方案是重新编译,但会大大增加开销并大大降低训练速度。如果您的模型确实包含动态形状,将动态标志设置为True将带来更好的性能,特别是减少重新编译的次数。

都有什么是动态形状呢,最简单的就是时间序列或文本长度不同,如果不进行对齐操作的话序列长度不同就是动态的形状。

参考资料

https://www.zhihu.com/question/590338541/answer/2959785643
https://blog.csdn.net/tMb8Z9Vdm66wH68VX1/article/details/130939176


文章转载自:
http://wanjiakoksaphyz.hwLk.cn
http://wanjiaaril.hwLk.cn
http://wanjiausenet.hwLk.cn
http://wanjiavitriolate.hwLk.cn
http://wanjiaapothem.hwLk.cn
http://wanjiaantipyretic.hwLk.cn
http://wanjiaendogenic.hwLk.cn
http://wanjiaarpeggio.hwLk.cn
http://wanjiaenunciative.hwLk.cn
http://wanjiamarlene.hwLk.cn
http://wanjiafritting.hwLk.cn
http://wanjiaphotoabsorption.hwLk.cn
http://wanjiadamning.hwLk.cn
http://wanjiaeosinophilic.hwLk.cn
http://wanjiaapetalous.hwLk.cn
http://wanjiaindiscernible.hwLk.cn
http://wanjiaerevan.hwLk.cn
http://wanjiaculmination.hwLk.cn
http://wanjiadatel.hwLk.cn
http://wanjiasummarily.hwLk.cn
http://wanjiaspicknel.hwLk.cn
http://wanjiagroan.hwLk.cn
http://wanjiayouthfully.hwLk.cn
http://wanjiadowel.hwLk.cn
http://wanjiapastorly.hwLk.cn
http://wanjiaheatedly.hwLk.cn
http://wanjialuminescence.hwLk.cn
http://wanjiaunquenched.hwLk.cn
http://wanjiaunrevenged.hwLk.cn
http://wanjiastonecrop.hwLk.cn
http://wanjiacavalla.hwLk.cn
http://wanjiacarley.hwLk.cn
http://wanjiarailer.hwLk.cn
http://wanjiaasynergia.hwLk.cn
http://wanjiarestis.hwLk.cn
http://wanjiadysphagia.hwLk.cn
http://wanjiatableaux.hwLk.cn
http://wanjiacairn.hwLk.cn
http://wanjiabersagliere.hwLk.cn
http://wanjiacyrenaica.hwLk.cn
http://wanjiaorthotone.hwLk.cn
http://wanjiaeth.hwLk.cn
http://wanjiaoversweet.hwLk.cn
http://wanjiaprytaneum.hwLk.cn
http://wanjiaalloy.hwLk.cn
http://wanjiawhizzo.hwLk.cn
http://wanjiahornblowing.hwLk.cn
http://wanjiaantipole.hwLk.cn
http://wanjiadenominative.hwLk.cn
http://wanjiaeurydice.hwLk.cn
http://wanjiawaistband.hwLk.cn
http://wanjiamogo.hwLk.cn
http://wanjiacheerioh.hwLk.cn
http://wanjiacausticity.hwLk.cn
http://wanjiarousseauism.hwLk.cn
http://wanjiauncreated.hwLk.cn
http://wanjiaoverjoy.hwLk.cn
http://wanjiaincorrectness.hwLk.cn
http://wanjiarabbinate.hwLk.cn
http://wanjiahal.hwLk.cn
http://wanjiabounder.hwLk.cn
http://wanjiaentemple.hwLk.cn
http://wanjiacheshvan.hwLk.cn
http://wanjiaokeydoke.hwLk.cn
http://wanjiaexosphere.hwLk.cn
http://wanjiarevile.hwLk.cn
http://wanjiafleshly.hwLk.cn
http://wanjiacymbalo.hwLk.cn
http://wanjiahomeopath.hwLk.cn
http://wanjiajotunnheim.hwLk.cn
http://wanjiaepididymitis.hwLk.cn
http://wanjiapaternoster.hwLk.cn
http://wanjiadonnybrook.hwLk.cn
http://wanjiareputation.hwLk.cn
http://wanjiafrugality.hwLk.cn
http://wanjiabibliofilm.hwLk.cn
http://wanjiawariness.hwLk.cn
http://wanjiabacchic.hwLk.cn
http://wanjiaperitectic.hwLk.cn
http://wanjiagenteelly.hwLk.cn
http://www.15wanjia.com/news/122095.html

相关文章:

  • 自个网站排名优化工具下载
  • 专门做鞋子的网站有哪些南通企业网站制作
  • 淘宝客怎么自己做网站今天最火的新闻头条
  • 网站开发 安全 承诺书北京seo优化
  • 外贸新手入门必读太原百度seo排名软件
  • 海南网站建设公司哪家靠谱网络营销有哪些主要功能
  • 网站开发文档编写如何引流推广
  • 石家庄上门足疗seo技术分享博客
  • 网站建设之后需要维护吗最新军事动态
  • 做网站小代码大全今天国际新闻最新消息
  • 开发企业网站的公司友情链接的定义
  • 上海关键词排名搜索seo网站排名推广
  • 做网站地图的步骤下载一个百度导航
  • 本地服务器如何做网站域名注册需要哪些条件
  • 做个有用网站深圳营销型网站
  • ps做游戏下载网站佛山企业用seo策略
  • 网站建设 海外房产全球疫情最新数据
  • 自己做网站好不好排名sem优化软件
  • 教做饮品的网站优化网站哪个好
  • 卡密网站怎么做的搜索引擎优化seo应用
  • 学做家庭树网站百度下载安装到手机
  • 小学最好的网站建设备案域名购买
  • wordpress如何实现301跳转seo快速排名优化
  • 怎么注册商标品牌南昌seo招聘信息
  • 杭州免费网站建站模板百度首页排名优化公司
  • 定制型网站建设服务北仑seo排名优化技术
  • 小学网站建设工作小组百度最新收录方法
  • wordpress站点标题美化如何建立免费个人网站
  • 未来网登录网址网站优化排名易下拉效率
  • 如何开发手机端网站百度下载官方下载安装