当前位置: 首页 > news >正文

工信部网站黑名单查询wordpress 整站迁移

工信部网站黑名单查询,wordpress 整站迁移,怎样在赶集微网站做微招聘,中核二三建设有限公司关于SAM中decomposed Relative Positional Embeddings的理解。 relative positional embedding的一种实现方式是:先计算q和k的相对位置坐标,然后依据相对位置坐标从给定的table中取值。以q和k都是77为例,每个相对位置有两个索引对应x和y两个…

关于SAM中decomposed Relative Positional Embeddings的理解。

relative positional embedding的一种实现方式是:先计算q和k的相对位置坐标,然后依据相对位置坐标从给定的table中取值。以q和k都是7×7为例,每个相对位置有两个索引对应x和y两个方向,每个索引值的取值范围是[-6,6]。(第0行相对第6行,x索引相对值为-6;第6行相对第0行,x索引相对值为6;所以索引取值范围是[-6,6])。这个时候可以构建一个shape为[13,13, head_dim]的table,则当相对位置为(i,j)时,position embedding=table[i, j]。(i,j的取值范围都是[0, 12])具体可参考:有关swin transformer相对位置编码的理解

decomposed Relative Positional Embeddings的思想在于,分别计算x和y两个方向上计算相对位置坐标,并分别从两个table中取出对应的位置编码,再将两个方向的编码相加作为最终的编码。

以q为4×4和k是4×4为例,在x和y方向上,每个索引值的取值范围是[-3,3],所以需要构建两个shape为[7, head_dim]的table:

if use_rel_pos:assert (input_size is not None), "Input size must be provided if using relative positional encoding."# initialize relative positional embeddingsrel_pos_h = nn.Parameter(torch.zeros(2 * input_size[0] - 1, head_dim))rel_pos_w = nn.Parameter(torch.zeros(2 * input_size[1] - 1, head_dim))

然后依据q和k的shape来计算每个方向上对应的相对位置编码:

def get_rel_pos(q_size: int, k_size: int, rel_pos: torch.Tensor) -> torch.Tensor:# q_size和k_size分别为当前方向上,q和k的个数, rel_pos为当前方向上定义的tableq_coords = torch.arange(q_size)[:, None] # shape: [4, 1],给当前方向上每个q编号k_coords = torch.arange(k_size)[None, :]  # shape:[1, 4],给当前方向上每个k编号relative_coords = (q_coords - k_coords) + (k_size - 1) # q_coords - k_coords就是当前方向上每个q相对于k的位置,加上k_size - 1是为了让相对位置非负return rel_pos[relative_coords.long()] # 依据相对位置从预定义好的table中取值

依据q和每个方向上对应的位置编码来计算最终的编码:

    q_h, q_w = q_sizek_h, k_w = k_sizeRh = get_rel_pos(q_h, k_h, rel_pos_h) # 获取h方向的位置编码,shape:[4, 4, head_dim]Rw = get_rel_pos(q_w, k_w, rel_pos_w) # 获取w方向的位置编码,shape:[4, 4, head_dim]B, _, dim = q.shaper_q = q.reshape(B, q_h, q_w, dim)rel_h = torch.einsum("bhwc,hkc->bhwk", r_q, Rh) # r_q与Rh在h方向矩阵乘rel_w = torch.einsum("bhwc,wkc->bhwk", r_q, Rw)# attn是自注意力机制计算得到的注意力图attn = attn.view(B, q_h, q_w, k_h, k_w) + rel_h[:, :, :, :, None] + rel_w[:, :, :, None, :]).view(B, q_h * q_w, k_h * k_w)return attn
http://www.15wanjia.com/news/164840.html

相关文章:

  • 昆明公司做网站在线做爰直播网站
  • wordpress添加站点养老网站备案必须做前置审批吗
  • 农业科技公司网站案例大连知名互联网公司
  • 请人做ppt的网站什么是网络营销?网络营销有哪些内容?
  • 静态动漫网站模板在线作图加字图片
  • 入侵网站怎么做弹出网站备案修改域名ip
  • 福建省中城建设工程有限公司网站wordpress给文章设置标签
  • 衡阳营养师报考网站福田瑞沃es3报价及图片
  • 公司网站主页怎么做本地网站建设需要什么
  • 网站专题怎么做最美情侣免费观看完整版高清
  • 网站免费做链接友情链接有哪些展现形式
  • 网站建设中心稿定设计免费版
  • 制作一个专门浏览图片的网站企业宣传片文字稿
  • 网站开发属于什么经营范围企业网站的建设与流程
  • dw软件网站建设教程视频唐山的网站建设
  • 电子商务网站建设方案案例做的网站没有手机版
  • js 抽奖网站北京网站建设服务器维护
  • node怎么做网站正规优化公司哪家好
  • saas建站没有网站源代码么网站正在建设 敬请期待
  • 房产网站如何做手机商城毕业设计
  • 携程网站 建设平台分析如何做网页推广的网页
  • 专业福州网站建设在线页游
  • 江苏网站建设效果好iis 5 新建网站
  • 青岛市住房和城乡建设局网站查询做电影网站需要那种服务器
  • 电子购物网站设计关于建设网站的图片素材
  • 河北省和城乡住房建设厅网站北京手机软件开发
  • 学习网站开发培训廊坊网站推广
  • 网站开发语言有那些公众号同步到dede网站
  • 移动网站的开发流程图商城网站开发
  • 曲靖网站设计公司wordpress多租户