当前位置: 首页 > news >正文

物流官方网站东莞网络优化公司

物流官方网站,东莞网络优化公司,重庆网站页面优化,做课件最好的素材网站目录 1. 什么是MOCO2. MOCO是干吗用的3. MOCO的工作原理3.1 一些概念1. 无监督与有监督的区别2. 什么是对比学习3. 动量是什么 3.2 MOCO工作原理1. 字典查找2. 如何构建一个好的字典3. 工作流程 3.3 (伪)代码分析 4. 其他一些问题5. MOCO v2和MOCO v35.1…

目录

  • 1. 什么是MOCO
  • 2. MOCO是干吗用的
  • 3. MOCO的工作原理
    • 3.1 一些概念
      • 1. 无监督与有监督的区别
      • 2. 什么是对比学习
      • 3. 动量是什么
    • 3.2 MOCO工作原理
      • 1. 字典查找
      • 2. 如何构建一个好的字典
      • 3. 工作流程
    • 3.3 (伪)代码分析
  • 4. 其他一些问题
  • 5. MOCO v2和MOCO v3
    • 5.1 MOCO v2
    • 5.2 MOCO v3
  • 6. 实战部分
    • 6.1 数据
    • 6.2 模型与参数设置
    • 6.3 实验结果

(好久没更新了~~~准备分享一些paper笔记以及在公司分享的内容)
(还是要记录呀,很多东西过段时间再看都有点想不起来了)

1. 什么是MOCO

MOCO: Momentum Contrast for Unsupervised Visual Representation Learning
MOCO是标题前两个单词的首两个字符缩写组成,翻译过来就是动量对比,是一种无监督(或者说是自监督)的方法。
在这里插入图片描述

2. MOCO是干吗用的

从标题也可以看出是为了Unsupervised Visual Representation Learning,为了无监督视觉表征学习。即通过MOCO这种方法,学到有用的特征,可用于下游任务的使用。

3. MOCO的工作原理

3.1 一些概念

1. 无监督与有监督的区别

简单来说,有监督就是有标注信息,有X,有Y;对于无监督来说,只有X,没有Y。

2. 什么是对比学习

假设现在有两张dog的图片,一张cat的图片,首先提取图片的特征,利用提取的特征通过对比学习两张dog图片是同一类别,dog和cat的不同类别。
在这里插入图片描述
对比学习可以是有label的,如上述我们举的例子;也可以是无label的,如MOCO这篇文章所介绍的方法。

3. 动量是什么

在这里插入图片描述
当前时刻的状态,是由上一时刻的状态和当前时刻的更新状态共同得来的。其中α的取值范围是0~1,表示上一时刻的状态和当前时刻的更新状态对当前时刻状态影响的权重。

3.2 MOCO工作原理

1. 字典查找

在这里插入图片描述
无监督对比学习可以看成是一种字典查找的方法,通过构建一个字典,当有一个样本query来了,需要到字典里去匹配查找,query应该与匹配到的key相似,与不匹配的key不相似,通过这种对比的学习去最小化损失。

2. 如何构建一个好的字典

在这里插入图片描述

  • 学习的关键需要构建一个好的字典,好的字典包括两方面特点:
    (1)字典足够大
    学习到足够的差异性。
    (2)保持一致性
    字典里的keys(负样本的fetures)应该来自同一个或者相似的编码器。

  • 三种方法比较
    在这里插入图片描述
    (a)end-to-end
    batch_size和字典的大小一样,但是受显存影响,batch_size一般不会设置太大(通常设置为128或256),字典不够大
    (b)memory bank
    将所有的负样本存储在一个memory bank里,字典够大,但是无法保证特征的一致性
    (c)moco
    利用队列来充当字典,可以保证字典够大;同时利用momentum encoder,保证了特征的一致性

3. 工作流程

在这里插入图片描述

  1. 首先用encoder-q初始化encoder-k
  2. 输入图片x,x经过augmentation生成k+,x通过encoder-q生成特征向量query,k+通过encoder-k生成特征向量k0,query和k0构成一个正样本对,query和dictionary里的其他key都是负样本对
  3. 引入InfoNCE,计算loss,这里相当于对query作n+1分类,n为字典的大小,现在要做的就是把query分为第0类
  4. 计算梯度去更新encoder-q,用动量更新的方法去更新encoder-k;同时用最新的k0去更新dictionary
    在这里插入图片描述

3.3 (伪)代码分析

在这里插入图片描述

4. 其他一些问题

  1. 对于negative样本,应该使用哪个编码器?
    应该使用和positive一样的编码器,因为positive和negative样本都是相对于anchor而言,为了保持特征的一致性,应该让negative和positive样本使用同一个(或者相似的)编码器
  2. 为什么要使用队列当作字典?
    字典的作用是用来存储负样本,且要求字典要足够大,如果将这么多的负样本都导入计算机中,显存是吃不消的。使用队列当作字典的好处是,可以让字典足够大,且让字典的size和batch_size剥离开。
  3. 什么是代理任务pretext tasks?
    定义规则,规定什么是正样本、负样本。代理任务的作用就是去生成一个自监督的信号,从而去充当ground_truth这个标签信息。
  4. 选择的损失函数应该满足什么条件?
    (1)当选择的q和positive k+相似的时候,loss应该尽可能小
    (2)当选择的q和negative k不相似的时候,loss也应该尽可能小
  5. 什么是noise contrastive estimation
    对于对比学习来说,一张图片就是一个类别,当类别很多的时候,没法算softmax(没法算loss),NCE把问题简化为二分类问题,一个是数据类别,一个是噪声类别,每次拿两者做对比就行。estimation的意思是,从负样本中抽样一些数据去做计算(估计),而不是用所有的负样本。抽样的样本越多,与使用整个数据集的结果更相似,所以MOCO强调这个字典要够大。
    NCE loss就是把多分类问题变成二分类的问题,这样就可以继续使用softmax去计算。
  6. 什么是InfoNCE?
    在这里插入图片描述
  • InfoNCE是NCE的一种变体,InfoNCE还是把问题看成是多分类问题。(实际做的是K+1分类任务)
  • 从公式可以看出,InfoNCE loss实际上就是cross entropy loss,不同的是InfoNCE loss中的K是负样本的个数,而cross entropy loss中的K是分类的类别数。
  • 公式中的q·k就是logit,公式中的t是一个温度超参数,一般用来控制分布的形状。
    • t越大,分布里的值变小,整个分布曲线更加扁平;
    • t越小,分布里的值变大,整个分布曲线更加peak;

5. MOCO v2和MOCO v3

5.1 MOCO v2

  • MOCO v2在v1的基础上,增加了以下几个措施:在这里插入图片描述
    (1)在训练阶段,增加了MLP head;推理阶段去掉。
    在这里插入图片描述
    (2) Augmentation
    在这里插入图片描述
    (3)Cosine learning rate schedule
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

5.2 MOCO v3

  • MOCO v3引入了ViT(Vision Transformer)
  • (伪)代码分析
    在这里插入图片描述
  • 计算过程参考CLIP论文所示:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

6. 实战部分

  • 为了验证使用MOCO学习得来的特征是否更好,设计了一个4分类的图像分类实验(不是那么严谨),具体实验设置与结果如下所示:

6.1 数据

在这里插入图片描述

6.2 模型与参数设置

设置了4个模型,分别为resent、moco_resnet、vit、moco_vit,训练50个epochs

6.3 实验结果

  • resnet和moco_resnet
    在这里插入图片描述

在这里插入图片描述

  • vit和moco_vit
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • 实验小结
    • 准确率:resnet > moco_resnet50; vit < moco_vit
    • resnet和vit训练曲线振荡的比较厉害;而基于moco的预训练模型,训练曲线更加平滑
    • 该实验只是个初步实验,所用数据较少,且训练的epochs较少,只能用于简单参考
    • 可以看到,基于MOCO对比学习得到预训练模型,在下游分类任务中有一定优势

结束。


文章转载自:
http://smokily.rymd.cn
http://allonge.rymd.cn
http://mindful.rymd.cn
http://cantate.rymd.cn
http://isomorphism.rymd.cn
http://nitryl.rymd.cn
http://trifle.rymd.cn
http://mastitis.rymd.cn
http://much.rymd.cn
http://tetraspermous.rymd.cn
http://schillerize.rymd.cn
http://conkers.rymd.cn
http://britainic.rymd.cn
http://pectinaceous.rymd.cn
http://amorist.rymd.cn
http://nibble.rymd.cn
http://esne.rymd.cn
http://nymphean.rymd.cn
http://gushy.rymd.cn
http://literarily.rymd.cn
http://fatwa.rymd.cn
http://cadi.rymd.cn
http://efferent.rymd.cn
http://ladysnow.rymd.cn
http://aeromedical.rymd.cn
http://multivolume.rymd.cn
http://ebbet.rymd.cn
http://laevoglucose.rymd.cn
http://clunk.rymd.cn
http://ichnographic.rymd.cn
http://visceromotor.rymd.cn
http://logistic.rymd.cn
http://innutrition.rymd.cn
http://gaba.rymd.cn
http://ionize.rymd.cn
http://breakthrough.rymd.cn
http://ketone.rymd.cn
http://infect.rymd.cn
http://sermonology.rymd.cn
http://regosol.rymd.cn
http://coony.rymd.cn
http://fireside.rymd.cn
http://ziti.rymd.cn
http://alleviator.rymd.cn
http://refreshing.rymd.cn
http://bronchi.rymd.cn
http://ciao.rymd.cn
http://scv.rymd.cn
http://regrettable.rymd.cn
http://timbul.rymd.cn
http://mesc.rymd.cn
http://unnilquadium.rymd.cn
http://frag.rymd.cn
http://petulancy.rymd.cn
http://immedicable.rymd.cn
http://boccia.rymd.cn
http://eider.rymd.cn
http://polyphonous.rymd.cn
http://intensivism.rymd.cn
http://thrust.rymd.cn
http://ecumene.rymd.cn
http://unreservedly.rymd.cn
http://centripetal.rymd.cn
http://south.rymd.cn
http://ftpd.rymd.cn
http://scrootch.rymd.cn
http://unperceivable.rymd.cn
http://philologue.rymd.cn
http://evanish.rymd.cn
http://dentin.rymd.cn
http://separation.rymd.cn
http://windburn.rymd.cn
http://ntp.rymd.cn
http://bigger.rymd.cn
http://vertebrate.rymd.cn
http://barbicel.rymd.cn
http://foots.rymd.cn
http://promptbook.rymd.cn
http://tailfan.rymd.cn
http://odoriferous.rymd.cn
http://rubaboo.rymd.cn
http://seaside.rymd.cn
http://contessa.rymd.cn
http://hametz.rymd.cn
http://migration.rymd.cn
http://horse.rymd.cn
http://putative.rymd.cn
http://crises.rymd.cn
http://vamose.rymd.cn
http://chaldean.rymd.cn
http://pb.rymd.cn
http://telstar.rymd.cn
http://splenomegaly.rymd.cn
http://decrial.rymd.cn
http://astilbe.rymd.cn
http://lazyish.rymd.cn
http://ventromedial.rymd.cn
http://paraphysis.rymd.cn
http://bobachee.rymd.cn
http://mrbm.rymd.cn
http://www.15wanjia.com/news/99140.html

相关文章:

  • 石景山成都网站建设关键词seo
  • 弄淘宝招牌图什么网站可以做泰安做网站公司
  • 电商网站建设教程西安网站优化
  • 计算机培训机构培训出来好就业吗沧州搜索引擎优化
  • 建团购网站个人接外包的网站
  • 巩义企业网站托管服务商软文代写新闻稿
  • 香水网络营销策划方案seo怎么做?
  • bash做网站网络营销管理办法
  • 教育网站建站需求杭州seook优屏网络
  • 滑坡毕业设计代做网站优化快速排名公司
  • 刚做的单页网站怎么预览搜易网优化的效果如何
  • web网站开发用什么语言国外网站搭建
  • 外国做愛视频网站媒介星软文平台官网
  • 网站开发 需求网站优化推广外包
  • 湖南做网站 f磐石网络宁波最好的seo外包
  • 建筑行业培训苏州seo网络推广
  • wordpress相关网站广告推广费用
  • 网站开发 文件架构图seo营销名词解释
  • 新疆建设云网站怎么查询证书如何用手机免费创建网站
  • 网站开发简单百度网站怎么做
  • win7 做网站服务器广州抖音推广公司
  • 自己做交易网站吗深圳优化排名公司
  • 可以做我女朋友吗网站网络优化工程师是干什么的
  • 惠州建设厅网站北京百度搜索排名优化
  • 网站定制的公司武汉关键词包年推广
  • 网站的字体做多大合适房地产市场现状分析
  • 江西网站建设哪家专业百度推广手机app下载
  • wordpress转githubseo实战培训视频
  • 成都专业网站建设价格低关键词调整排名软件
  • 网站建设求职无锡网站关键词推广