当前位置: 首页 > news >正文

咸宁做网站的公司网站开发开发需求

咸宁做网站的公司,网站开发开发需求,网站设计制作价钱,大连开发区网站开发公司电话优点 首先,bert的创新点在于利用了双向transformer,这就跟openai的gpt有区别,gpt是采用单向的transformer,而作者认为双向transformer更能够融合上下文的信息。这里双向和单向的区别在于,单向只跟当前位置之前的tocke…

优点

首先,bert的创新点在于利用了双向transformer,这就跟openai的gpt有区别,gpt是采用单向的transformer,而作者认为双向transformer更能够融合上下文的信息。这里双向和单向的区别在于,单向只跟当前位置之前的tocken相连,双向与当前位置之后的tocken也有连接。跟ELMo相比的优势在于,transformer对特征的提取能力比lstm要强得多。
在这里插入图片描述

模型输入

首先是对输入的句子做tocken embedding,也就是将句子映射为一维向量,可以是word2vec的结果,猜想一下,如果不是维度过高也可以是one-hot,第二部分segment embedding 是在模型训练过程中自动学习得到的,猜想这里可以用全连接,也可以用transformer,最后是position embedding,主要用以区别“我喜欢妈妈”和“妈妈喜欢我”,虽然这两句话的单词一样,但是因为位置不同,所以含义不同。
在这里插入图片描述

模型参数

BERTBASE (L=12, H=768, A=12, Total Parameters=110M)

BERTLARGE (L=24, H=1024,
A=16, Total Parameters=340M).

L表示层数,H为隐层维度,A为注意力头的数量

两种任务

Masked LM

这个任务主要是随机将某句话的某几个位置做处理,这里的处理可能是3种,80%的概率用[mask]代替,10%的概率保留原来的单词,10%的概率用其他单词代替。就像是英语考试中的完形填空
在这里插入图片描述

Next Sentence Prediction (NSP)

主要利用输入的第一个tocken[cls]和中间的tocken[sep],其中cls用来表示后面一句是否为前一句的下一句,sep表示两个句子的间隔。从文本语料库中随机选择 50% 正确语句对和 50% 错误语句对进行训练。就像是与语文中的句子排序。

参考:BERT模型的详细介绍

http://www.15wanjia.com/news/161069.html

相关文章:

  • 企业cms网站建设考试题域名购买成功后怎么做网站
  • 基于html5的购物商城网站晶鹰建设摩托车官网
  • 网站建设和商城有什么好处登录河北建设厅网站进入不了
  • 如何制作一个网站做淘宝券详情页设计思路怎么写
  • 网站域名空间网站整站模板
  • 正规网站建设空间哪个好wordpress插件 盗版
  • 安徽省建设工程安全+协会网站软件商店2023
  • 网站设计重要性网址打不开是啥原因
  • 传媒公司做网站条件爱辉网站建设
  • 建设银行广州支行网站备案号查询平台
  • 深圳网站建设前十名韶关网站建设第一品牌
  • 免费外贸网站制作中国建设银行官方网站网上银行
  • 济南轻电商网站建设公司wordpress 评论 图片不显示
  • 网站可以免费看怎么创建网站
  • 2023年二建报名网站官网登录宁波seo外包服务平台
  • 长城建设投资有限公司网站wordpress安装详细教程
  • 群辉怎么做网站服务器怎样看网站有没有做301
  • 做网站推广每天加班北京网站建设专家
  • 购买域名后怎么建网站城市建设法规考试网站
  • 南京网站搭建站长全网指数查询
  • 特定ip段访问网站代码WordPress侧滑手机菜单
  • 小店网站制作太原广告设计与制作公司
  • 拼多多网站的类型百度一下你就知道官网网址
  • 广州新业建设管理有限公司网站湖南网站建设推广优化
  • 为什么要建设档案网站建筑人才网官网入口
  • 淘宝网站建设那么便宜如何注册企业邮箱?
  • 东莞网站建设托管新闻热点大事件
  • 网站站外推广的内外链接怎么做无备案网站如何赚钱
  • wordpress 中文文件重命名东莞网站seo
  • 多语言企业网站建设费用银川做网站的 公司有哪些