当前位置: 首页 > news >正文

分析网站示例快速提升网站关键词排名

分析网站示例,快速提升网站关键词排名,wordpress 插件 页面,做加盟的网站建设1、masked_tokens[]、token_masks[]介绍 masked_tokens和token_masks两个列表用于存储mask处理后的token(分词)结果和对应的mask标志。 masked_tokens列表存储经过mask处理后的分词结果。 token_masks列表存储与每个分词结果对应的mask标志。 2、示例…

1、masked_tokens[]、token_masks[]介绍 

masked_tokenstoken_masks两个列表用于存储mask处理后的token(分词)结果和对应的mask标志。

  • masked_tokens列表存储经过mask处理后的分词结果。

  • token_masks列表存储与每个分词结果对应的mask标志。

2、示例说明:

例如一个 masked_tokens[0]是:

['C', 'N', '[C@H]', '(', 'c', '1', 'c', 'c', '(', 'Br', ')', 'c', 'c', 'c', '1', 'F', ')', '<MASK>', '(', '<MASK>', '<MASK>', '<MASK>', 'C', '1']

token_masks[0]是:

[False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, True, False, True, True, True, False, False]

它们的长度都是28 

3、代码示例:

下面代码就是先对句子进行了token处理,然后进行了mask处理:

# 通过正则匹配对第一个句子(sents1)进行分词,得到tokens。
tokens = self._regex_match(sents1)
# 对tokens进行mask处理
m_tokens, token_masks = self._mask_tokens(tokens, empty_mask=mask)

4、mask的类型

span mask

    def _mask_span(self, ts):curr_token = 0masked = []token_mask = []mask_bools = [True, False]weights = [self.mask_prob, 1 - self.mask_prob]sampled_mask = random.choices(mask_bools, weights=weights, k=len(ts))while curr_token < len(ts):# If mask, sample from a poisson dist to get length of maskif sampled_mask[curr_token]:mask_len = torch.poisson(torch.tensor(self.span_lambda)).long().item()masked.append(self.mask_token)token_mask.append(True)curr_token += mask_len# Otherwise don't maskelse:masked.append(ts[curr_token])token_mask.append(False)curr_token += 1return masked, token_mask

随机对某些位置进行mask,从泊松区取样得到mask的长度,mask前后序列的长度可能会发生变化

replace mask

    def _mask_replace(self, ts):mask_bools = [True, False]weights = [self.mask_prob, 1 - self.mask_prob]token_mask = random.choices(mask_bools, weights=weights, k=len(ts))masked = [self._mask_token(ts[i]) if m else ts[i] for i, m in enumerate(token_mask)]return masked, token_mask

根据权重Weight随机对某些位置进行mask,mask前后序列的长度不会发生变化

权重Weight:例如,如果设定 self.mask_prob = 0.7,则掩码标记 True 的权重为 0.7,掩码标记 False 的权重为 0.3

http://www.15wanjia.com/news/28151.html

相关文章:

  • 网站开发要多长时间百度百科优化排名
  • 大兴网站开发网站建设seo发包软件
  • 典当行网站模板百度搜索如何去广告
  • 如何做阿里巴巴免费网站广告网站有哪些
  • 网站哪家做的好中国互联网域名注册服务机构
  • 邯郸市教育考试院网站网站搜索优化
  • 网站建设结课小论文搜索引擎关键词快速优化
  • html 门户网站模板百度人工服务在线咨询
  • 就要使用网页制作工具seo快速排名优化方法
  • 当前业界主流的网站建设宁波seo快速优化
  • 客户网站开发全流程图海口关键词优化报价
  • 怎么提升网站的流量吗百度网络营销的概念
  • 中国建筑网官网监理工程师网站怎样建立网站平台
  • 合作建网站西安网站seo价格
  • 杭州 做网站企业关键词优化最新报价
  • 营销型网站建设必备功能关键词优化排名软件s
  • wordpress图片素材主题seo网站优化方案书
  • asp动态网站开发案例教程 pdf珠海网站建设优化
  • 中英网站的设计1688关键词怎么优化
  • 前端案例的网站成都网络营销公司哪家好
  • vscode制作个人网站浏览器网址
  • 做电影分享网站违法吗一元手游平台app
  • 专业集团网站建设网络媒体
  • 宽屏网站模板莱阳seo排名
  • 芜湖市网站开发地推接单平台网
  • 网页设计网站开发关键词营销推广
  • 网站建设项目可行性分析seo网站排名优化工具
  • 玉林网站建设公司最新百度关键词排名
  • 太湖云建站网站建设上海关键词优化外包
  • 土特产网站建设专业seo关键词优化