当前位置: 首页 > news >正文

重庆微网站html网站开发视频

重庆微网站,html网站开发视频,搜索广告排名,小企业怎么推广文章目录 7.前馈网络8.加法和归一化组件9.组合所有编码器组件构成完整编码器 7.前馈网络 编码器块中的前馈网络子层如下图所示: 图1.32 – 编码器块 前馈网络由两个带有ReLU激活函数的全连接层组成。全连接层(Fully Connected Layer)有时也…

文章目录

    • 7.前馈网络
    • 8.加法和归一化组件
    • 9.组合所有编码器组件构成完整编码器


7.前馈网络

编码器块中的前馈网络子层如下图所示:

在这里插入图片描述

图1.32 – 编码器块

前馈网络由两个带有ReLU激活函数的全连接层组成。全连接层(Fully Connected Layer)有时也称为密集层,即每一层的每个神经元都与上一层的所有神经元相连。在Transformer的前馈网络中,这样的密集层有两个。

第一个密集层将输入数据映射到一个更高维度的空间。

第二个密集层则将第一个密集层的输出映射回原始维度。

在这两个密集层之间,通常会加入ReLU(Rectified Linear Unit)激活函数。ReLU激活函数的定义如下:

f(x) = max(0,x)

这意味着,ReLU函数会将所有负数输入映射到0,而正数输入保持不变。ReLU激活函数有助于引入非线性因素,使得神经网络能够学习和模拟更复杂的函数。

前馈网络的参数在不同的句子位置上是相同的,但在不同的编码器块上是不同的。

在下一节中,我们将介绍编码器的另一个组件——加法和归一化组件。

8.加法和归一化组件

在Transformer的编码器中还有一个重要的组件,加法和归一化组件。它连接着一个子层的输入和输出。也就是说,如下图所示(虚线),我们可以观察到加法和归一化组件:

(1)将多头注意力子层的输入连接到其输出

(2)将前馈子层的输入连接到其输出

在这里插入图片描述

图1.33 – 带有加法和归一化组件的编码器块

加法和归一化组件基本上是一个残差连接,后面跟着层归一化。层归一化通过防止每层中的值发生重大变化,从而可以得到更快的训练。

现在我们已经了解了编码器的所有组件,让我们在下一节中将它们全部放在一起,看看编码器作为一个整体是如何工作的。

9.组合所有编码器组件构成完整编码器

下图显示了两个编码器的堆叠(为了看上去更加简洁清晰,只展开了编码器1):

在这里插入图片描述

图1.34 – 编码器堆叠,仅编码器1展开

从图1.34所示的编码器中,我们可以看到:

(1)首先,我们将输入转换为输入嵌入(嵌入矩阵embedding matrix),然后添加位置编码(position encoding)并作为输入喂给最底层的编码器(encoder 1)。

(2)编码器1接收到输入后,将其发送到多头注意力(multi-head attention)子层,多头注意力子层运算后输出注意力矩阵(attention matrix)。

(3)将注意力矩阵作为输入喂给下一个子层——前馈网络。前馈网络接收注意力矩阵作为输入,并输出编码器表示(encoder representation)。

(4)接下来,我们取编码器1的输出(encoder representation)并将其作为输入喂给下一级编码器(encoder 2)。

(5)编码器2执行相同的流程,并输出给定输入句子的编码器表示(encoder representation)。

我们可以将N个编码器一个接一个地逐层堆叠;最后一级的编码器(最顶层编码器)获得的输出(encoder representation)将是给定输入句子的表示(representation)。让我们将最终编码器(在我们上面所举的例子中是编码器2)获得的编码器表示记为R。

我们取最终编码器(编码器2)获得的编码器表示R,并将其作为输入喂给解码器。解码器接收编码器表示R作为输入,并尝试生成目标句子。

现在我们已经理解了transformer的编码器部分,下一节我们将详细介绍解码器是如何工作的。


感谢您的阅读,欢迎关注!


http://www.15wanjia.com/news/164363.html

相关文章:

  • 建设银行新版网站上线cms建站系统哪个好
  • 西安网站制作托邯郸seo
  • 3.0效果网站建设多少钱酒店建设网站的意义
  • wordpress可以做大量文章的网站近期重大新闻事件
  • 做网站的参考文献给网站权限
  • 怎么样做一个网站东莞58同城网
  • 台州黄岩做网站服务号 订阅号
  • p2p网站怎么做做本地的门户网站
  • 邯山企业做网站推广hr系统管理软件排名
  • 优化的网站做域名跳转黑龙江人事考试网
  • 网站设计三原则宁夏 网站制作
  • 做高仿表网站游戏官网做的好的网站
  • 虚拟主机如何分配网站世界十大营销策划公司
  • 网站维护包括哪些工作wordpress 去掉评论数
  • 上海海宏建设集团网站淮南房地产网站建设网站
  • 装修设计那个网站好网站后台优化
  • 苏州设计网站公司手机版网站开发实例
  • 免费网站空间 - 百度凡科做的网站手机版
  • 苏州网站维护天津网站免费制作
  • 做ppt找图片在哪个网站品牌推广是做什么的
  • 后台建设电商网站整站优化推广
  • 怎么做网站登录界面wordpress gif动画
  • 上海建站 seo传媒公司取名字大全
  • 做网站备完备案需要干什么零基础建设网站教程
  • 三门峡网站优化wordpress建立视频网站
  • 贵阳网站制作免费百度如何搜索网址
  • 河南那家公司做家具行业网站好房地产网站策划
  • 免费建立网站的网站吗恢复wordpress修订版本号
  • 某公司网站建设策划创艺装饰公司口碑如何
  • wordpress企业网站实例装修第一网