当前位置: 首页 > news >正文

网站app生成器下载婚恋网站排名前三

网站app生成器下载,婚恋网站排名前三,wordpress个性首页,广撒网网站1、masked_tokens[]、token_masks[]介绍 masked_tokens和token_masks两个列表用于存储mask处理后的token(分词)结果和对应的mask标志。 masked_tokens列表存储经过mask处理后的分词结果。 token_masks列表存储与每个分词结果对应的mask标志。 2、示例…

1、masked_tokens[]、token_masks[]介绍 

masked_tokenstoken_masks两个列表用于存储mask处理后的token(分词)结果和对应的mask标志。

  • masked_tokens列表存储经过mask处理后的分词结果。

  • token_masks列表存储与每个分词结果对应的mask标志。

2、示例说明:

例如一个 masked_tokens[0]是:

['C', 'N', '[C@H]', '(', 'c', '1', 'c', 'c', '(', 'Br', ')', 'c', 'c', 'c', '1', 'F', ')', '<MASK>', '(', '<MASK>', '<MASK>', '<MASK>', 'C', '1']

token_masks[0]是:

[False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, True, False, True, True, True, False, False]

它们的长度都是28 

3、代码示例:

下面代码就是先对句子进行了token处理,然后进行了mask处理:

# 通过正则匹配对第一个句子(sents1)进行分词,得到tokens。
tokens = self._regex_match(sents1)
# 对tokens进行mask处理
m_tokens, token_masks = self._mask_tokens(tokens, empty_mask=mask)

4、mask的类型

span mask

    def _mask_span(self, ts):curr_token = 0masked = []token_mask = []mask_bools = [True, False]weights = [self.mask_prob, 1 - self.mask_prob]sampled_mask = random.choices(mask_bools, weights=weights, k=len(ts))while curr_token < len(ts):# If mask, sample from a poisson dist to get length of maskif sampled_mask[curr_token]:mask_len = torch.poisson(torch.tensor(self.span_lambda)).long().item()masked.append(self.mask_token)token_mask.append(True)curr_token += mask_len# Otherwise don't maskelse:masked.append(ts[curr_token])token_mask.append(False)curr_token += 1return masked, token_mask

随机对某些位置进行mask,从泊松区取样得到mask的长度,mask前后序列的长度可能会发生变化

replace mask

    def _mask_replace(self, ts):mask_bools = [True, False]weights = [self.mask_prob, 1 - self.mask_prob]token_mask = random.choices(mask_bools, weights=weights, k=len(ts))masked = [self._mask_token(ts[i]) if m else ts[i] for i, m in enumerate(token_mask)]return masked, token_mask

根据权重Weight随机对某些位置进行mask,mask前后序列的长度不会发生变化

权重Weight:例如,如果设定 self.mask_prob = 0.7,则掩码标记 True 的权重为 0.7,掩码标记 False 的权重为 0.3

http://www.15wanjia.com/news/1601.html

相关文章:

  • 做网站的人联系电话网络营销主要是什么
  • 深圳 网站设计师 招聘客户关系管理系统
  • wordpress站凡科建站官网免费注册
  • 网站建设拷贝软件深圳网站设计三把火
  • 用vps做网站的流程广州网络推广选择
  • 网站建设需求调研表互联网营销做什么
  • 外包网站自己维护百度手机助手app下载官网
  • 企业建设网站的步骤是什么意思专业seo优化推广
  • 做网站 需要多少钱百度浏览器网页版入口
  • 网站如何快速被收录台湾新闻最新消息今天
  • 正品购物网站排行市场推广策略
  • 网站的 营销渠道的建设安卓优化大师手机版下载
  • 自己做网站开网店开网店3个月来亏了10万
  • 微商建立网站游戏推广怎么找玩家
  • 题材挖掘机网站怎么做刷评论网站推广
  • 北京旅游网站建设百度搜索广告收费标准
  • 阿克苏网站建设咨询免费做网站自助建站
  • 专门做动漫的网站有哪些公司的seo是什么意思
  • 贵阳市网站建设公司网络推广方法大全
  • 如何创做网站线上营销推广的公司
  • wordpress ico 上传百度seo可能消失
  • 公众号里的电影网站怎么做免费推广有哪些
  • 怎么做网站卖产品河南品牌网站建设
  • 现在用什么工具建网站百度推广代理商查询
  • 免费做相册video的网站百度推广图片
  • 又拍 wordpress成都网站排名生客seo怎么样
  • 深圳做网站建设的哪家效果好又便宜营销战略
  • WordPress博客手机主题南宁seo公司哪家好
  • 湖南省人民政府网seo服务外包
  • 武汉网站建设排行如何让百度快速收录