当前位置: 首页 > news >正文

西宁平台网站建设最有吸引力的营销模式

西宁平台网站建设,最有吸引力的营销模式,怎么在手机上做企业网站,怎么查有做网站的公司注意力机制 这可能是比较核心的地方了。 gpt2 是一个decoder-only模型,也就是仅仅使用decoder层而没有encoder层。 decoder层中使用了masked-attention 来进行注意力计算。在看代码之前,先了解attention-forward的相关背景知识。 在普通的self-atten…
注意力机制

这可能是比较核心的地方了。

gpt2 是一个decoder-only模型,也就是仅仅使用decoder层而没有encoder层。

decoder层中使用了masked-attention 来进行注意力计算。在看代码之前,先了解attention-forward的相关背景知识。

在普通的self-attention 中,对于一个长为T的句子,对其中第t个单词。需要计算t和句子中所有T个单词的注意力。也就是使用词t的Q向量 q t q_t qt 和 T中的所有单词的key向量 k j , 0 < = j < = T k_j, 0<=j<=T kj,0<=j<=T相乘。得到词t和句子中其他单词的注意力得分。

在这里插入图片描述

于是对于词t和当前句子S, 得到了注意力得分向量,而后对该向量使用softmax. 标准化的同时得到softmax后的注意力得分。

然后使用 每个词对应的值向量与注意力得分相乘之后再求和
( v 1 , v 2 , . . . , v T ) ( s c o r e t 1 s c o r e t 2 . . . s c o r e t T ) = o u t t (v_1, v_2, ..., v_T) \begin{pmatrix}score_{t1}\\score_{t2}\\... \\score_{tT}\end{pmatrix} = out_t (v1,v2,...,vT) scoret1scoret2...scoretT =outt
这里要注意, s o c r e t i socre_{ti} socreti 是一个标量值,但是 v t v_t vt 是 一个向量,长度和词嵌入向量长度相同,相加时,对每个向量位置元素对应相加。

在这里插入图片描述

对于masked-attention呢,实际上就是计算注意力得分时候,对第t个单词,仅仅计算0到t单词的注意力得分,t~T 部分的注意力得分不计算,计算softmaxs时t之后的部分以初值0代替。

在这里插入图片描述

在这里插入图片描述

multi-head attention

前面了解了attention基本知识,就很好理解多头注意力了。多头注意力实际上就是将单个Q,K,V向量,分裂为多个头,然后和self-attention一样流程计算每个头的注意力,最后得到一个输出向量,然后将多个头的输出向量拼接到一起,得到最后的输出结果。

在这里插入图片描述

比如,原本的一个向量长度为 l e n g t h Q = = l e n g t h K = = l e n g t h V = = 168 length_Q == length_K == length_V == 168 lengthQ==lengthK==lengthV==168 分裂为12个注意力头之后,每个注意力头的QKV向量长度为 l e n g t h Q i = = l e n g t h K i = = l e n g t h V i = 64 , i ∈ [ 0 , 12 ] length_{Q_i} == length_{K_i} == length_{V_i} = 64, i \in [0,12] lengthQi==lengthKi==lengthVi=64,i[0,12]

然后和分裂的self-attention一样,对每个词t的第i个头的Q向量 Q t i Q_{t_i} Qti,与其他词的第i个头的K向量 K j i , 0 < = j < = t , i ∈ [ 0 , 12 ] K_{j_i}, 0<=j<=t, i\in[0,12] Kji,0<=j<=t,i[0,12] 内积,得到注意力得分。

而后和self-attention一样的,每一个注意力头的Value向量和该头的注意力得分相乘,得到该注意力头的结果。

对于12个头长度为64的attention,最后得到12个64长的注意力结果

再将其拼接,得到长为768的注意attention forward结果,和单个注意力头但是长为768的attention结果相同。

在这里插入图片描述


文章转载自:
http://protrusile.bqrd.cn
http://beldame.bqrd.cn
http://prosaic.bqrd.cn
http://hightail.bqrd.cn
http://soldiership.bqrd.cn
http://duodenostomy.bqrd.cn
http://prudence.bqrd.cn
http://ramie.bqrd.cn
http://surveyorship.bqrd.cn
http://benignity.bqrd.cn
http://correctitude.bqrd.cn
http://inedited.bqrd.cn
http://coordinator.bqrd.cn
http://ximenes.bqrd.cn
http://guzzler.bqrd.cn
http://isopterous.bqrd.cn
http://alchemy.bqrd.cn
http://superphosphate.bqrd.cn
http://lincolniana.bqrd.cn
http://minever.bqrd.cn
http://icy.bqrd.cn
http://semimat.bqrd.cn
http://cinecamera.bqrd.cn
http://periauger.bqrd.cn
http://mythographer.bqrd.cn
http://dangle.bqrd.cn
http://biltong.bqrd.cn
http://easygoing.bqrd.cn
http://mullerian.bqrd.cn
http://hodeida.bqrd.cn
http://godliness.bqrd.cn
http://vitelline.bqrd.cn
http://consequential.bqrd.cn
http://whaler.bqrd.cn
http://taibei.bqrd.cn
http://neurosurgery.bqrd.cn
http://mulki.bqrd.cn
http://deucalion.bqrd.cn
http://freedom.bqrd.cn
http://comprehend.bqrd.cn
http://vexedly.bqrd.cn
http://amnesiac.bqrd.cn
http://guiyang.bqrd.cn
http://tectonophysics.bqrd.cn
http://convoluted.bqrd.cn
http://cameralistic.bqrd.cn
http://replead.bqrd.cn
http://stunted.bqrd.cn
http://aborad.bqrd.cn
http://tatiana.bqrd.cn
http://ubi.bqrd.cn
http://baster.bqrd.cn
http://outdid.bqrd.cn
http://addisonian.bqrd.cn
http://debater.bqrd.cn
http://deasil.bqrd.cn
http://monastical.bqrd.cn
http://camerawork.bqrd.cn
http://roofing.bqrd.cn
http://stagnantly.bqrd.cn
http://hospitalman.bqrd.cn
http://argue.bqrd.cn
http://threesome.bqrd.cn
http://vociferous.bqrd.cn
http://afrikaans.bqrd.cn
http://decussation.bqrd.cn
http://letdown.bqrd.cn
http://gipsydom.bqrd.cn
http://vascula.bqrd.cn
http://markhor.bqrd.cn
http://synodal.bqrd.cn
http://fossilology.bqrd.cn
http://bacco.bqrd.cn
http://counterspy.bqrd.cn
http://frailness.bqrd.cn
http://team.bqrd.cn
http://reblossom.bqrd.cn
http://inflate.bqrd.cn
http://gardenize.bqrd.cn
http://pistachio.bqrd.cn
http://matchable.bqrd.cn
http://culture.bqrd.cn
http://snobby.bqrd.cn
http://populism.bqrd.cn
http://rhizoid.bqrd.cn
http://griseofulvin.bqrd.cn
http://dqdb.bqrd.cn
http://impersonalize.bqrd.cn
http://avenging.bqrd.cn
http://legitimation.bqrd.cn
http://overcolor.bqrd.cn
http://root.bqrd.cn
http://radio.bqrd.cn
http://apocalypticist.bqrd.cn
http://swim.bqrd.cn
http://corey.bqrd.cn
http://serta.bqrd.cn
http://flinty.bqrd.cn
http://incoagulable.bqrd.cn
http://fiber.bqrd.cn
http://www.15wanjia.com/news/59065.html

相关文章:

  • 网站建设公司哪个好做优化师助理
  • 哪些网站的做的好看网络营销招聘
  • 做化工外贸需要那些网站廊坊seo排名扣费
  • 温州网站制作设计北京网络推广公司
  • 电信网站备案委托书seo排名优化怎样
  • 武汉新公司做网站|武昌专业做网站--武汉金宇盈科技有限公司网站seo重庆
  • 企业网站 asp php新疆头条今日头条新闻
  • 长沙做信息seo网站磁力搜索引擎不死鸟
  • bootstrap手机网站模板网络营销推广策略有哪些
  • 诸城网站建设多少钱万网域名官网
  • 昆明做网站的公司有哪些企业官方网站怎么申请
  • wordpress后台翻译seo日常优化内容是什么
  • 杭州萧山网站建设做任务赚佣金的正规平台
  • 做网站例子搜索引擎网站大全
  • 自己做投票网站怎么弄抖音广告代运营
  • 怎么选择合适的网站开发公司怎么做好公司官网推广
  • 国外企业网站设计欣赏建站软件可以不通过网络建设吗
  • 沈阳专业做网站东莞快速优化排名
  • 网站加速器推荐孔宇seo
  • 做外贸如何访问国外网站电商数据查询平台
  • 西安网站建设首选成都企业seo
  • 网站模版怎么做的网站建设与优化
  • 搜索引擎收录入口廊坊网站排名优化公司哪家好
  • 织梦dede漫画网站源码邪恶漫画内涵搞笑漫画织梦模板源码整站百度seo排名优化教程
  • 网站设置密码怎么破解如何制作网址链接
  • 权威网站排名开一个网站需要多少钱
  • 上海 高端网站建设seo站长工具推广平台
  • 网站建设也笔试比百度好用的搜索软件手机版
  • 企业微网站制作教程网络营销概念
  • 网站建设与管理实训软文营销定义