当前位置: 首页 > news >正文

gofair外贸建站网站建设班

gofair外贸建站,网站建设班,办公室工装设计公司,网站位置导航一种通用的视觉点云预测预训练方法 开卷可扩展自动驾驶(OpenDriveLab) 自动驾驶新方向?ViDAR:开卷可扩展自动驾驶(OpenDriveLab)-CSDN博客 创新点 在这项工作中,本文探索了专为端到端视觉自动…

一种通用的视觉点云预测预训练方法

开卷可扩展自动驾驶(OpenDriveLab)

自动驾驶新方向?ViDAR:开卷可扩展自动驾驶(OpenDriveLab)-CSDN博客

创新点

在这项工作中,本文探索了专为端到端视觉自动驾驶应用量身定制的预训练方法,不仅包括感知,还包括预测和规划。本文构建了一个新的 pretext tasks ——视觉点云预测(见图2),以充分利用原始图像-激光雷达序列背后的语义、三维几何和时间动态信息,并考虑到可扩展性(being scalable)。它从历史视觉图像中预测未来的点云。

视觉点云预测的主要理念在于对语义、三维结构和时间建模的同时监督。通过迫使模型从历史数据预测未来,它监督了场景流和物体运动的提取,这对于时间建模和未来估计至关重要。同时,它涉及从图像重建点云,这监督了多视角几何和语义建模。因此,来自视觉点云预测的特征嵌入了几何和时间提示(geometric and temporal hints)的信息,这对于同时进行感知、跟踪和规划都是有益的。

为此,本文提出了 ViDAR,一种用于预训练的通用视觉点云预测方法(a general visual point cloud forecasting approach)(见图2)。ViDAR 包括三个部分:历史编码器(History Encoder)、潜在渲染操作符(Latent Rendering operator)和未来解码器(Future Decoder)。历史编码器是预训练的目标结构。它可以是任何视觉BEV编码器,用于将视觉序列嵌入到BEV空间。这些BEV特征被送入潜在渲染操作符。潜在渲染在使 ViDAR 提升下游性能方面发挥着至关重要的作用。它解决了 射线形状BEV特征问题(ray-shaped BEV features issue),建模三维几何潜在空间,并连接编码器与解码器。未来解码器是一个自回归 transformer ,它利用历史BEV特征迭代地预测任意时间戳的未来点云。

http://www.15wanjia.com/news/194081.html

相关文章:

  • 高端平面设计网站logo在线设计制作工具
  • 网站开发计入什么会计科目企业标识设计
  • php网站后台管理模板响应网官方网站
  • 商城网站模版代码wordpress怎么修改菜单栏关键词
  • 如何制作网站的步骤深圳企业网站建设专业
  • app模板下载网站中山网站建设文化
  • 手机端做的优秀的网站商城网站的运营
  • 威海做企业网站的公司撰写网站建设技术解决方案
  • 新手建设html5网站推荐一本学做网站的书
  • 扶风网站建设快速做效果图的网站叫什么
  • 广告设计制作公司网站辽宁建设工程信息网业绩录入规定
  • 建设企业网站需要注意的问题wordpress 用户管理
  • 互联网营销师是哪个部门发证seo标题优化是什么意思
  • 网络书城网站开发 需求分析广州建设网站的公司简介
  • 专业的上海网站建设公司排名网站制作进度表
  • 网站 东莞长安模板网站和定制网站后缀的区别
  • 网站前期基础建设 怎么写做网站三网多少钱
  • wordpress更新服务评论对网络平台的优化有哪些建议
  • 做网站界面多少钱快速网站优化哪家好
  • 可视化网站开发系统介绍台州 网站建设
  • 用凡科网做网站怎么保存到桌面网站建设部门
  • 新网站建设信息种子搜索神器在线搜
  • linode wordpress建站手机网站大全
  • 建设网站的费用吗网站建设实验小结
  • 网站项目建设目标深圳建网站需要多少钱
  • 赣州建设局网站wordpress调用文章列表
  • 广州住房与建设 网站福州做网站制作
  • 顺的网站建设精英郑州到安阳
  • 青岛网站开发工资象山网站优化公司
  • 成都龙泉建设有限公司网站酒店网站开发回扣