当前位置: 首页 > news >正文

织梦cms怎么搭建网站河南郑州天气预报15天

织梦cms怎么搭建网站,河南郑州天气预报15天,适合大学生做的网站,psd to wordpress通过onnx模型可以在支持onnx推理的推理引擎上进行推理,从而可以将LLM部署在更加广泛的平台上面。此外还可以具有避免pytorch依赖,获得更好的性能等优势。 这篇博客(大模型LLaMa及周边项目(二) - 知乎)进行…

通过onnx模型可以在支持onnx推理的推理引擎上进行推理,从而可以将LLM部署在更加广泛的平台上面。此外还可以具有避免pytorch依赖,获得更好的性能等优势。

这篇博客(大模型LLaMa及周边项目(二) - 知乎)进行了llama导出onnx的开创性的工作,但是依赖于侵入式修改transformers库,比较不方便。

这里本人实现了避免侵入式修改transformers库导出LLM为ONNX方法,代码库为:

https://github.com/luchangli03/export_llama_as_onnx/tree/main

可以在这个基础上进行简单修改从而导出其他模型,例如百川,Qwen等模型。当前已经加入了对清华ChatGlm2和阿里Qwen的导出支持。

该方案优点是无需侵入式修改transformers代码,缺点是你需要提前了解各个模型的输入,相关shape和dtype。这可以在代码里面增加shape,dtype打印,进行一次推理获取。

阿里的Qwen模型导出onnx存在大量琐碎的算子,主要是因为其使用了einops库的rearrange操作。把这些算子替换为reshape,transpose, split等操作后onnx模型会极大简化。此外,还可以进一步优化该模型的RotaryEmbedding相关的代码以优化导出的onnx模型复杂度。

例如

# context_layer = rearrange(
#     context_layer, "b s h d -> b s (h d)"
# ).contiguous()
b, s, h, d = context_layer.shape
context_layer = context_layer.reshape([b, s, -1])
# self._rotary_pos_emb_cache = rearrange(emb, "n d -> 1 n 1 d")
emb = torch.unsqueeze(emb, 0) # [1nd]
emb = torch.unsqueeze(emb, 2)
def _rotate_half(x):# from einops import rearrange# x = rearrange(x, "... (j d) -> ... j d", j=2)# x1, x2 = x.unbind(dim=-2)last_dim = x.shape[-1]x1, x2 = torch.split(x, last_dim//2, dim=-1)return torch.cat((-x2, x1), dim=-1)

导出的llama decoder会存在if算子,但是经过符号shape推导和设置相应的符号shape到onnx模型value_info,然后经过onnxsim可以完全去掉。也可以考虑修改llama定义代码去掉if。优化前后:

ea389166fad24bbbbc9d2a007294ef94.png57bda583259b421ca6f808504eb90980.png

导出模型调试

从导出模型中算子的名称可以大概推断出该算子在那个模块定义的。

如/layers.0/attn/rotary_emb/Slice可以知道该算子定义于decoder第0层的atten.rotary_emb模块。

http://www.15wanjia.com/news/183001.html

相关文章:

  • 养生网站建设论文网站底色什么颜色好看
  • 一个网站用多少数据库表中国各省旅游网站建设分析
  • 零基础学网站开发网络营销logo
  • 福州企业网站建设开发公司五证
  • html做网站的毕业设计万远翔网站建设
  • xx网站建设策划方案做普工招聘网站
  • 网站设计协议移动端app下载
  • 做科学小制作的视频网站搜索引擎优化自然排名的缺点
  • 哪些网站做的好处传媒公司招聘信息
  • 网站备案的意义企业年报网上申报
  • 门户网站建设提案建设银行网站查询
  • 手机网站建站用哪个软件好宁至网站建设
  • 青田网站建设学校 网站源码
  • 深圳手机网站公司注册资金实缴政策最新
  • 服装企业网站建设可行性分析山东网架公司
  • 平台网站建设源码织梦网站模板后台密码找回
  • 商丘 网站建设域名注册的网站有哪些
  • 现在网站如何做优化软件定制开发公司地址
  • 如何提高网站速度企业手机网站cms系统
  • 织梦可以做微网站吗站长之家
  • 广州兼职做网站企业官方网站模板下载
  • 做汽车精品的网站微信推广软件首选帝搜软件
  • 创意产品设计网站推荐培训机构的网站建设
  • 重庆网络推广专员湛江市企业网站seo点击软件
  • 网站做线陶瓷网站建设中企动力
  • 怎么样做英文网站科技网站排名
  • 东莞百度代做网站联系方式wordpress 插件位置
  • 科技微网站中国建设银行网站类型分析
  • 贵阳网站推广优化公司跨境电商 网站开发
  • 重庆网站建设 狐灵速成建站