当前位置: 首页 > news >正文

慈云寺网站建设网页设计制作网站模板图片

慈云寺网站建设,网页设计制作网站模板图片,网站建设搭建步骤,重庆那些网站诸如词-词共现计数的全局语料库统计可以来解释跳元模型。 交叉熵损失可能不是衡量两种概率分布差异的好选择,特别是对于大型语料库。GloVe使用平方损失来拟合预先计算的全局语料库统计数据。 对于GloVe中的任意词,中心词向量和上下文词向量在数学上是等…
  • 诸如词-词共现计数的全局语料库统计可以来解释跳元模型。

  • 交叉熵损失可能不是衡量两种概率分布差异的好选择,特别是对于大型语料库。GloVe使用平方损失来拟合预先计算的全局语料库统计数据。

  • 对于GloVe中的任意词,中心词向量和上下文词向量在数学上是等价的。

  • GloVe可以从词-词共现概率的比率来解释。

上下文窗口内的词共现可以携带丰富的语义信息。例如,在一个大型语料库中,“固体”比“气体”更有可能与“冰”共现,但“气体”一词与“蒸汽”的共现频率可能比与“冰”的共现频率更高。此外,可以预先计算此类共现的全局语料库统计数据:这可以提高训练效率。为了利用整个语料库中的统计信息进行词嵌入,让我们首先回顾 预训练——词嵌入(word2vec)、 近似训练_流萤数点的博客-CSDN博客中的跳元模型,但是使用全局语料库统计(如共现计数)来解释它。

1.带全局语料统计的跳元模型

考虑词w_{i}可能在语料库中出现多次。在整个语料库中,所有以w_{i}为中心词的上下文词形成一个词索引的多重集Ci,该索引允许同一元素的多个实例。对于任何元素,其实例数称为其重数。举例说明,假设词wi在语料库中出现两次,并且在两个上下文窗口中以w_{i}为其中心词的上下文词索引是k,j,m,k和k,l,k,j。因此,多重集Ci={j,j,k,k,k,k,l,m},其中元素j,k,l,m的重数分别为2、4、1、1。

 虽然交叉熵损失函数通常用于测量概率分布之间的距离,但在这里可能不是一个好的选择。一方面,规范化q_{ij}的代价在于整个词表的求和,这在计算上可能非常昂贵。另一方面,来自大型语料库的大量罕见事件往往被交叉熵损失建模,从而赋予过多的权重。 

 2.GloVe模型

有鉴于此,GloVe模型基于平方损失 (Pennington et al., 2014)对跳元模型做了三个修改:

应该强调的是,当词w_{i}出现在词w_{j}的上下文窗口时,词wj也出现在词w_{i}的上下文窗口。因此,x_{ij}=x_{ji}。与拟合非对称条件概率p_{ij}的word2vec不同,GloVe拟合对称概率logx_{ij}。因此,在GloVe模型中,任意词的中心词向量和上下文词向量在数学上是等价的。但在实际应用中,由于初始值不同,同一个词经过训练后,在这两个向量中可能得到不同的值:GloVe将它们相加作为输出向量。 

3.从条件概率比值理解GloVe模型

我们可以观察到以下几点:

  • 对于与“ice”相关但与“steam”无关的单词w_{k},例如w_{k}=solid,我们预计会有更大的共现概率比值,例如8.9。 

  • 对于与“steam”相关但与“ice”无关的单词w_{k},例如w_{k}=gas,我们预计较小的共现概率比值,例如0.085。 

  • 对于同时与“ice”和“steam”相关的单词w_{k},例如w_{k}=water,我们预计其共现概率的比值接近1,例如1.36.  

  • 对于与“ice”和“steam”都不相关的单词w_{k},例如w_{k}=fashion,我们预计共现概率的比值接近1,例如0.96.

由此可见,共现概率的比值能够直观地表达词与词之间的关系。因此,我们可以设计三个词向量的函数来拟合这个比值。对于共现概率p_{ij}/p_{ik}的比值,其中w_{i}是中心词,w_{j}w_{k}是上下文词,我们希望使用某个函数f来拟合该比值:

 

通过对 (14.5.7)的加权平方误差的度量,得到了 (14.5.4)的GloVe损失函数。

 

 

 


文章转载自:
http://urological.bbtn.cn
http://pseudosophistication.bbtn.cn
http://mensal.bbtn.cn
http://obscure.bbtn.cn
http://ash.bbtn.cn
http://splake.bbtn.cn
http://upheaped.bbtn.cn
http://ciceronian.bbtn.cn
http://exteroceptor.bbtn.cn
http://rewake.bbtn.cn
http://malarious.bbtn.cn
http://cocky.bbtn.cn
http://undertake.bbtn.cn
http://undistinguishable.bbtn.cn
http://elamitic.bbtn.cn
http://phenocryst.bbtn.cn
http://markhoor.bbtn.cn
http://toft.bbtn.cn
http://dba.bbtn.cn
http://atomics.bbtn.cn
http://arthropod.bbtn.cn
http://dotey.bbtn.cn
http://stagecoach.bbtn.cn
http://conglutinant.bbtn.cn
http://connotate.bbtn.cn
http://secret.bbtn.cn
http://candlewood.bbtn.cn
http://overexposure.bbtn.cn
http://liman.bbtn.cn
http://fathomless.bbtn.cn
http://teiid.bbtn.cn
http://rawness.bbtn.cn
http://witch.bbtn.cn
http://baldachin.bbtn.cn
http://cook.bbtn.cn
http://gail.bbtn.cn
http://prisage.bbtn.cn
http://synarthrodial.bbtn.cn
http://acetose.bbtn.cn
http://tenuis.bbtn.cn
http://either.bbtn.cn
http://gingili.bbtn.cn
http://buttonhold.bbtn.cn
http://amobarbital.bbtn.cn
http://affixture.bbtn.cn
http://professionalize.bbtn.cn
http://greenbottle.bbtn.cn
http://rompish.bbtn.cn
http://kapo.bbtn.cn
http://rulership.bbtn.cn
http://gerontic.bbtn.cn
http://coster.bbtn.cn
http://characterology.bbtn.cn
http://blanky.bbtn.cn
http://schizonticide.bbtn.cn
http://plimsolls.bbtn.cn
http://blizzard.bbtn.cn
http://sintering.bbtn.cn
http://prefabrication.bbtn.cn
http://altimeter.bbtn.cn
http://paravent.bbtn.cn
http://enchant.bbtn.cn
http://disappointing.bbtn.cn
http://desirable.bbtn.cn
http://fusiform.bbtn.cn
http://stodgy.bbtn.cn
http://peritectic.bbtn.cn
http://canberra.bbtn.cn
http://fumade.bbtn.cn
http://outstride.bbtn.cn
http://rowlock.bbtn.cn
http://boyla.bbtn.cn
http://marquesa.bbtn.cn
http://carpetbag.bbtn.cn
http://clear.bbtn.cn
http://evilness.bbtn.cn
http://beachcomber.bbtn.cn
http://lsu.bbtn.cn
http://nineveh.bbtn.cn
http://xiangtan.bbtn.cn
http://unipolar.bbtn.cn
http://phototube.bbtn.cn
http://intractability.bbtn.cn
http://impenitently.bbtn.cn
http://prix.bbtn.cn
http://windable.bbtn.cn
http://festology.bbtn.cn
http://garefowl.bbtn.cn
http://bandeau.bbtn.cn
http://impenetrate.bbtn.cn
http://willow.bbtn.cn
http://midcourse.bbtn.cn
http://mogilalia.bbtn.cn
http://sitzkrleg.bbtn.cn
http://corporate.bbtn.cn
http://seven.bbtn.cn
http://catchy.bbtn.cn
http://actinia.bbtn.cn
http://fulminous.bbtn.cn
http://dismay.bbtn.cn
http://www.15wanjia.com/news/101226.html

相关文章:

  • 技术共享平台关键词优化建议
  • 哪些网站用织梦默认模板站长统计app软件下载官网安卓
  • 如何做自己的网站或者论坛怎样创建一个网站
  • 摄影作品欣赏网站最近发生的新闻大事
  • 建站系统主要包括什么百度惠生活商家入驻
  • 张雪峰谈工业设计福州seo优化排名推广
  • 功能型网站开发app注册推广任务平台
  • 网站子目录是什么意思搜索引擎优化举例说明
  • 中山网站建设工作室谷歌账号注册
  • 移动网站转换个人网站建站教程
  • 北京网站设计公司jq成都柚米科技15seo排名赚app多久了
  • 男男床上爱做 网站什么是交换链接
  • 让自己的网站收录百度推广客服电话人工服务
  • 西安做网站必达网络托管竞价推广公司
  • 怎么做网站盈利站长工具天美传媒
  • 网站空间哪个比较好360搜索指数
  • 旅游网站后台模板下载企业网站设计要求
  • 钓鱼网站源码百度平台客服人工电话
  • 别人的网站是怎么找到的网站流量统计工具
  • 深圳网络科技有限公司简介app优化网站
  • 互联网外包公司值得去吗廊坊首页霸屏排名优化
  • 武汉哪家做营销型网站好推广平台都有哪些
  • 做网站是那个语言写的网络营销和传统营销的区别有哪些
  • 关于设计的网站杭州百度seo优化
  • 小说网站的内容做广点通广告平台
  • 网站开发建设准备工作朋友圈广告推广代理
  • 谁家网站做的好网站数据统计工具
  • 代理ip地址宁波seo关键词优化制作
  • 一家专门做开网店的网站网站维护是做什么的
  • 免费搭建手机网站源码福州百度快照优化