当前位置: 首页 > news >正文

生态旅游网站的建设的内容重庆排名seo公司

生态旅游网站的建设的内容,重庆排名seo公司,商城网站建设视频,网站推广实施计划前言 在NLP领域,预训练模型(准确的说应该是预训练语言模型)似乎已经成为各大任务必备的模块了,经常有看到文章称后BERT时代或后XXX时代,分析对比了许多主流模型的优缺点,这些相对而言有些停留在理论层面,可是有时候对于手上正在解决的任务,要用到预训练语言模型时,面…

前言

在NLP领域,预训练模型(准确的说应该是预训练语言模型)似乎已经成为各大任务必备的模块了,经常有看到文章称后BERT时代或后XXX时代,分析对比了许多主流模型的优缺点,这些相对而言有些停留在理论层面,可是有时候对于手上正在解决的任务,要用到预训练语言模型时,面对烟火缭乱的语言模型,需要如何挑选合适的模型应用到任务上来。

一个非常直接的方法就是把每一个候选模型针对任务都做一遍微调,因为微调涉及到模型训练,时间至少几个小时起步。有些预训练模型的微调还需要进行超参数搜索,想要决定一个预训练模型的迁移效果就需要将近50个小时!对于没有足够算力的我,苦苦寻觅一个能够高效的选择适合的预训练语言模型的方法,不过资料不好找呀,偶然间我才发现了这篇论文,里面提到的LogME方法值得一试。下图是该方法适配的任务:
在这里插入图片描述

多提一下,我这里说的是预训练语言模型,即在适用于NLP领域内的模型选择打分,而对于适用于CV的一些打分方案,像LEEP、NCE、H scores感兴趣的小伙伴可以找论文看看。

本文在LogME方法的相关描述上,组织基于论文作者所在学院的官方公众号上的一篇文章,可直戳原文阅读。原Paper中开源的代码使用Pytorch进行GPU加速,我在本文的最后附上我改成TensorFlow2的代码,方便直接应用在TensorFlow2的相关模型上。

前情提要

将上面提到的问题,描述成图模型,就是论文中所画出如下的这样:
在这里插入图片描述
在这个任务中,我们假设有 M M M 个预训练模型组成的集合 { ϕ m } m = 1 M \{\phi_m\}^M_{m=1} {ϕm}m=1M 和 含有 n n n 个标签的数据集 { ( x i , y i ) } i = 1 n \{(x_i,y_i)\}^n_{i=1} {(xi,yi)}i=1n,正常情况下,我们是通过微调使用各种评判指标作为衡量模型 ϕ \phi ϕ 的表现 T m T_m Tm,而现在我们想要通过一种方法得到 S m S_m S

http://www.15wanjia.com/news/159401.html

相关文章:

  • 做网站备案时间公司做宣传网站
  • 国外设计网站pinterest怎么打不开成都广告印刷公司
  • 北京搬家公司大全百度关键词优化软件怎么样
  • 绵阳手机网站制作asp网站 证书
  • 做网站一般是什么工作优秀品牌设计案例分析
  • 中国空间站成功对接网站前端设计软件
  • 彭阳门户网站建设外贸网站定制
  • 摄影网站知乎精准引流推广文案
  • 公司建设网站的优缺点长春市做网站推广
  • 网站建设源码开发网站职位推荐怎么做
  • 营销型企业网站建设包括什么搭建自己的博客网站
  • 海口网站建设就q479185700上墙石家庄做手机网站推广
  • 绘本馆网站建设成都软件培训机构排名前十
  • 公司做网站需要什么条件英国帮人做设计作业网站
  • 做网站做注册登录的难点手机网站 域名解析
  • 镇江网络违法网站汕头多语种网站制作
  • 做煤层气的网站服务器 打开网站iis7
  • 网络 网站建设办公wap建站程序
  • phpcms网站备份个人网站制作说明
  • 自己做的网站某个网页打开很慢重庆免费建站公司地址
  • 网站建设的必要性分析php网站开发说明文档
  • 战鼓网这种网站怎么做长春火车站有几个
  • 一家专做二手手机的网站叫什么手机今天最新体育新闻
  • seo自助建站平台中级经济师考试科目
  • 寺院网站模板varnish 4.0 wordpress
  • 公司如何做网站一般多少钱企业管理系统咨询
  • 高邮市建设局网站江苏核酸检测机构
  • 深圳证券网站开发怎么建设网站规划
  • 做相册网站logo云服务器是干嘛用的
  • 自己如何开网站WordPress无缩略图文章筛选