当前位置: 首页 > news >正文

做网站服务器可以挂到外地么网络软文

做网站服务器可以挂到外地么,网络软文,企业网站制作模板免费下载,做视频网站视频的软件Vid2Seq 应该是目前为止,个人最中意得一篇能够实际解决对一段视频进行粗略理解得paper了。个人认为它能够真正能解决视频理解是因为它是对一个模型整体做了训练,而不仅仅是通过visual encoders(e.g BLIP/CLIP/…)和 其它multi modal 的encoder直接过了个projection,做一个…

Vid2Seq 应该是目前为止,个人最中意得一篇能够实际解决对一段视频进行粗略理解得paper了。个人认为它能够真正能解决视频理解是因为它是对一个模型整体做了训练,而不仅仅是通过visual encoders(e.g BLIP/CLIP/…)和 其它multi modal 的encoder直接过了个projection,做一个轻松的finetune 就好。光训练projection的路子,划算是划算,但是效果不好,比如video-llama, PG video llava…

例子:(PS:是吧,就比那种光projection的,描述上要更贴合实际,而不是轻飘飘的说个摸棱两可的话)
在这里插入图片描述

对于一段视频,time_input_token 为 (n, 2), text_input_token 为 (n,根据tokenize得到的长度),n为切分后的片段。
在这里插入图片描述
它就是直接concat 在前后(图例为语音)
在这里插入图片描述
模型输入有分视频画面和 拼好后的语音。
在这里插入图片描述
仔细观察结构,不管是视频画面还是语音内容,都经过了两个步骤的encoders。等两个内容准备好后,要将它们按照以下形式再次拼接。

 if self.use_video and self.use_speech:encoded.last_hidden_state = torch.cat([video, encoded.last_hidden_state
http://www.15wanjia.com/news/34229.html

相关文章:

  • 台州建设局网站信息价湖南seo快速排名
  • 软件开发就业前景如何seo的搜索排名影响因素有
  • web开发做电商网站的全过程谷歌网站
  • 自己做的网站怎么放上网网络推广工作怎么样
  • 电商网站模板醴陵网站制作
  • 快速判断网站开发语言百度一下百度一下你就知道
  • 中山高端网站建设模板网站哪个好
  • 做网站广告站长之家权重查询
  • 濮阳市网站建设职业培训机构资质
  • 网站 备案号网站站长
  • 有没有网站做lol赌博的微信小程序免费制作平台
  • 哪个网站建设好广州营销课程培训班
  • 艺术设计教学资源网站建设标准网上推广产品怎么做
  • 网站平台建设调研报告百度推广登录官网
  • 网站横幅怎做河南网站推广公司
  • 秦皇岛网站开发多少钱上海网站制作推广
  • 杭州市建委网站电商seo是指
  • 酒店预定网站建设方案seo排名优化软件有用
  • 怎么做网站在线客服网站统计系统
  • 中山皇冠建设开发有限公司网站优化网站推广
  • 网站怎么做关键词内链网络营销怎么做?
  • 试玩网站怎么做站长工具海角
  • 不用80端口做网站东莞seoseo关键词排名优化
  • 做网站反链企业新闻稿发布平台
  • 什么二手车网站做最好点击排名优化
  • 高端网站设计哪家好北京seo优化方案
  • 免费空间访客100个网站一个网站的seo优化有哪些
  • wordpress是php吗常德网站优化公司
  • 巴彦淖尔 网站建设以网红引流促业态提升
  • 一个人开淘宝店容易吗哈尔滨怎样关键词优化