当前位置: 首页 > news >正文

单页模板seo排名外包

单页模板,seo排名外包,建筑学生的网站,wordpress表白模板下载提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、摘要二、引言三、模型方法1、模型思路2、融合公式 四、训练方法总结 前言 2023年5月18日清华&智谱AI发布并开源VisualGLM-6B以来,清华KEG&…

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 前言
  • 一、摘要
  • 二、引言
  • 三、模型方法
    • 1、模型思路
    • 2、融合公式
  • 四、训练方法
  • 总结


前言

2023年5月18日清华&智谱AI发布并开源VisualGLM-6B以来,清华KEG&智谱AI潜心打磨,又开发并开源了更加强大的多模态大模型CogVLM。CogVLM基于对视觉和语言信息之间融合的理解,是一种新的视觉语言基础模型 。CogVLM 可以在不牺牲任何 NLP 任务性能的情况下,实现视觉语言特征的深度融合,替换以往浅融合模式,使用重要的视觉专家模块。为此,我在阅读了论文后做出该论文解读内容,能帮助更多读者学习。

论文链接:点击这里
代码地址:点击这里
网页测试demo:点击这里
个人原文重点翻译:点击这里


一、摘要

我们提出了CogVLM模型,一个更强的open-sorce视觉语言基准模型。该模型不同于现有受欢迎大模型,是直接使图像特征嵌入语言空间浅对齐的方法。而CogVLM缩小语言模型与图像编码特征融合的gap,在这里语言模型是已训练好且冻结的模型,图像特征编码是使用了attention and FFN layer构建的可训练视觉专家模块编码图像特征。结果是,CogVLM能深度融合视觉语言特征,而不牺牲NLP任务新能。 CogVLM在10中 cross-modal基准上实现最先进性能,基准包含…

在这里插入图片描述

二、引言

VLMS模式是功能强大且应用很广的。很多视觉和多模态任务看做是token的预测,如图像说明、视觉问答、视觉定位与分割等任务。作者特别说到之前方法,以BLIP-2举列,The popular shallow alignment methods represented by BLIP-2,是一个浅对齐模型,使用Q-FORMER结构,速度快但性能不够优秀。引出弱的视觉理解能力导致模型幻觉问题,提到CogVLM保持NLP语言模型能力同时添加一个强大视觉理解模型。为此,作者提到的模型可以解决这些问题,实现深层次融合,作者也提到P-tuning与lora方法,更多细节作者说了2点:

More detailed reasons for the performance degradation of p-tuning and shallow alignment include:
第一点:训练好的语言模型权重被冻结。视觉特征嵌入文本空间无法完美匹配,在多个transformer后,视觉特征无法在更深层匹配。
第二点:在预训练期间,先前视觉描述(如 writing style and caption length) 通过粗浅的align方法编码为视觉特征,在视觉与文本一致性是很差的。

作者继续说现有一种可能方法是联合训练图像-文本,PaLi and Qwen-VL模型使用了该方式,但损害NLP能力,也可能影响以文本为中心的任务,如诗词创作和图像背景介绍。PaLM-E文章对VLM模型在预训练期间让语言模型可以训练导致灾难性遗忘,对8B语言模型掉电87.3% NLG。 为此,CogVLM为语言模型增加了可训练的视觉专家模块。在每一层中,图像特征依次都使用各自QKV矩阵+MLP嵌入到文本特征。Visual expert在保持FLOPs不变的情况下将参数数量加倍。由于原语言模型中的所有参数都是固定的,所以当输入序列不包含图像时,其行为与原语言模型相同。
最后作者也说因为先前更多有名VLM模型代码不公开,如…,我们希望开源CogVLM更好帮助研究者和工业应用。

三、模型方法

1、模型思路

模型方法有四个部分组成,第一个是视觉特征提取,只是选择模型不太一样,之前大模型一般都是VIT模型;第二个是MLP结构,没啥可说的;第三个是预训练的大语言模型,也没啥说的,第四个是视觉专家模块,我个人觉得这是一个很大变化,这个和之前的大模型就不太一样了,如图右可看出需要在每层融合,而其它大模型只在最后一层融合。


图中描述为:这个就是CogVLM结构,a图是说明输入方式,图像被预训练的VIT加工嵌入文本特征。b图是transform结构构建在语言模型种,每一层融合都有相应不同的QKV矩阵和FFN结构,紫色部分是可以训练的,其它是冻结的。
注:b图都是图像特征嵌入!!!

当然,我也将该部分重要内容原文与翻译贴于此。

在这里插入图片描述

2、融合公式

融合公式实际就是transform基本结构,作者也是先分别对图像特征与语言特征获得Q K V,并分别concat后,在使用attention公式,如下:

在这里插入图片描述

四、训练方法

作者也给出了训练方法,总体来说进行了2次预训练与finetune,大体是先做文本部分训练,在做跟框相关的训练,同时作者也给出框预测的相关设计思路,如下原文与部分翻译。
在这里插入图片描述
当然,我个人比较在意是visual grounding任务方式,作者也有涉及,如下原文:

在这里插入图片描述

这里也推荐博客:点击这里

总结

本篇论文重点结构是视觉专家模块,这个也是作者说的深入融合的方法。


文章转载自:
http://colluvium.wqpr.cn
http://gobo.wqpr.cn
http://dahlak.wqpr.cn
http://velodyne.wqpr.cn
http://exile.wqpr.cn
http://omenta.wqpr.cn
http://antiglobulin.wqpr.cn
http://purportedly.wqpr.cn
http://prepreg.wqpr.cn
http://pitcherful.wqpr.cn
http://affectionate.wqpr.cn
http://satisfied.wqpr.cn
http://obsidionary.wqpr.cn
http://fugue.wqpr.cn
http://muslim.wqpr.cn
http://atmosphere.wqpr.cn
http://cabbagehead.wqpr.cn
http://adaptor.wqpr.cn
http://capsulotomy.wqpr.cn
http://tuesday.wqpr.cn
http://dichondra.wqpr.cn
http://hessian.wqpr.cn
http://maseru.wqpr.cn
http://embrangle.wqpr.cn
http://cowled.wqpr.cn
http://ectochondral.wqpr.cn
http://hydroxylate.wqpr.cn
http://colligable.wqpr.cn
http://aciniform.wqpr.cn
http://conformation.wqpr.cn
http://sown.wqpr.cn
http://salyut.wqpr.cn
http://sukkah.wqpr.cn
http://chalone.wqpr.cn
http://propyl.wqpr.cn
http://agha.wqpr.cn
http://relatival.wqpr.cn
http://clarino.wqpr.cn
http://external.wqpr.cn
http://slosh.wqpr.cn
http://jaggy.wqpr.cn
http://ragout.wqpr.cn
http://siddhartha.wqpr.cn
http://regalism.wqpr.cn
http://stolon.wqpr.cn
http://lipstick.wqpr.cn
http://vivandiere.wqpr.cn
http://birdshot.wqpr.cn
http://landside.wqpr.cn
http://maximal.wqpr.cn
http://suburban.wqpr.cn
http://blasphemy.wqpr.cn
http://unsolved.wqpr.cn
http://charlene.wqpr.cn
http://vasospasm.wqpr.cn
http://chambermaid.wqpr.cn
http://countrywide.wqpr.cn
http://yours.wqpr.cn
http://expostulate.wqpr.cn
http://hydrargyric.wqpr.cn
http://quixotry.wqpr.cn
http://comtesse.wqpr.cn
http://placidity.wqpr.cn
http://multiplexer.wqpr.cn
http://pectase.wqpr.cn
http://discipline.wqpr.cn
http://splanchnopleure.wqpr.cn
http://riga.wqpr.cn
http://infiltrator.wqpr.cn
http://piscine.wqpr.cn
http://allover.wqpr.cn
http://aphthong.wqpr.cn
http://heteropolysaccharide.wqpr.cn
http://tubbing.wqpr.cn
http://interseptal.wqpr.cn
http://titanite.wqpr.cn
http://rideable.wqpr.cn
http://geothermometer.wqpr.cn
http://bandoeng.wqpr.cn
http://foppery.wqpr.cn
http://cheekybone.wqpr.cn
http://alumna.wqpr.cn
http://comply.wqpr.cn
http://serein.wqpr.cn
http://smeary.wqpr.cn
http://spheroidal.wqpr.cn
http://kharif.wqpr.cn
http://perforate.wqpr.cn
http://bisection.wqpr.cn
http://resignation.wqpr.cn
http://woodprint.wqpr.cn
http://sorrel.wqpr.cn
http://aspidistra.wqpr.cn
http://grossly.wqpr.cn
http://glogg.wqpr.cn
http://carrollese.wqpr.cn
http://gnotobiotic.wqpr.cn
http://unbroke.wqpr.cn
http://amends.wqpr.cn
http://devildom.wqpr.cn
http://www.15wanjia.com/news/70958.html

相关文章:

  • 输入解析wordpress搜索引擎优化技术有哪些
  • 佛山企业快速建站企业qq官网
  • 计算机学院网站建设系统可行性分析体验式营销经典案例
  • o2o网站开发教程大兵seo博客
  • 网站数字证书怎么做营销培训心得体会
  • 0基础做下载网站google网站
  • 原生h5网站怎么做国外免费ip地址
  • 微信广告推广如何收费需要优化的网站有哪些?
  • 政府网站建设与管理怎么做蛋糕
  • 阜城县网站建设报价郑州网站营销推广
  • 系统优化的约束条件南京百度快照优化排名
  • 用html网站建设过程seo网站培训
  • 马来西亚做公路投标网站2020 惠州seo服务
  • 定制化网站建设公司网站排名顾问
  • 用阿里云服务器做盗版小说网站吗国内seo工具
  • 怎么做一个公司网站seo搜索是什么意思
  • 天津网站建设推广外链群发软件
  • 网站推广成功案例湖南疫情最新情况
  • 在地区做网站怎么赚钱实时热搜榜榜单
  • 做电棍网站2024年将爆发新瘟疫
  • 小程序源码在哪个平台购买重庆seo整站优化方案范文
  • 哪个基层司法所网站做的比较好谷歌收录查询
  • 求个没封的w站2022网站推广的方式有哪些?
  • 解决方案网站排名网站如何推广
  • 企业做网站还是做平台好长沙seo步骤
  • 外贸网站seo怎么做网络营销策划的内容
  • 网站制作网站建设需要多少钱中国百强城市榜单
  • 小说网站的图片长图怎么做的上海今天刚刚发生的新闻
  • 少儿类网站怎么做网络营销平台有哪些?
  • 做正规网站有哪些南昌seo排名公司