当前位置: 首页 > news >正文

网站开发技术人员怎么接单搜索引擎优化需要多少钱

网站开发技术人员怎么接单,搜索引擎优化需要多少钱,免费的开发网站建设,天津专业做网站文章目录 前言一、bert模型词汇映射说明二、bert模型输入解读1、input_ids说明2、attention_mask说明3、token_type_ids说明4、模型输入与vocab映射内容二、huggingface模型数据加载1、数据格式查看2、数据dataset处理3、tokenizer处理dataset数据三、huggingface训练bert分类模…

文章目录

  • 前言
  • 一、bert模型词汇映射说明
  • 二、bert模型输入解读
    • 1、input_ids说明
    • 2、attention_mask说明
    • 3、token_type_ids说明
    • 4、模型输入与vocab映射内容
  • 二、huggingface模型数据加载
    • 1、数据格式查看
    • 2、数据dataset处理
    • 3、tokenizer处理dataset数据
  • 三、huggingface训练bert分类模型
    • 1、huggingface训练bert分类模型主函数解读
    • 2、huggingface的bert分类模型加载构建
  • 四、huggingface推理bert分类模型
  • 五、填空bert模型构建
    • 1、数据构建
    • 2、模型构建
    • 3、loss计算
    • 4、模型预测
  • 六、完整代码链接
  • 总结


前言

Hugging Face是一家人工智能公司,致力于提供自然语言处理(NLP)模型和工具的开源库。他们的开源库包括了BERT等各种预训练模型的实现,以及用于训练、微调和部署这些模型的工具。在本文中,我们将探讨如何使用Hugging Face的库来构建一个BERT分类模型,该模型能够对文本进行分类,例如情感分析、文本分类等任务。我们将介绍如何使用Hugging Face提供的transformers库来构建、训练和评估BERT分类模型。通过本文的学习,您将能够掌握使用Hugging Face构建BERT分类模型的关键步骤和技巧,为NLP任务提供强大的解决方案。同时,我也将介绍掩码mask预测模型方法。最终,我也将数据、模型文件、代码等内容公开。


一、bert模型词汇映射说明

在BERT中,和是特殊的词元(token),用于在输入序列中标记特定的位置和边界。

:它是表示序列开头的特殊词元,全称为"classification"。在BERT中,输入序列的第一个位置被标记为,用于表示整个序列的概括信息。在训练过程中,BERT模型学习使用位置的表示来进行各种分类任务,例如文本分类、情感分析等。在编码后的表示中,位置的向量通常用作整个序列的汇总表示。

:它是表示序列分割的特殊词元,全称为"separator"。在BERT中,输入的文本序列可以由多个片段(segments)组成,例如两个句子或一个问题和一个回答。为了将这些片段分隔开,词元用于标记不同片段的边界。它出现在片段之间和序列的末尾,用于告知BERT模型输入序列的结构。

:它表示填充(padding)的词元,在输入序列中用于填充长度不足的片段或序列。填充是为了使所有输入序列具有相同的长度,以便进行批量处理。

:它表示掩蔽(mask)的词元,在预训练阶段用于生成掩蔽语言模型(Masked Language Model,MLM)任务。在训练过程中,输入序列中的一部分词元会被随机选择并替换为词元,模型需要预测被掩蔽的词元。

5 :它表示未知(unknown)的词元,用于表示在预训练期间未见过的词汇。当输入序列中出现未登录词(out-of-vocabulary)时,这些词元将被替换为词元。
博客链接:这里

二、bert模型输入解读

在这里,我们假设有个句子“这位姐姐对这本书几近痴迷。我不好这一口,没有耐心看它。纯粹表扬一下这次送书的效率和质量。起码书的品相不错,好过我前两次购书。希望以后能保持。”,包含标点符号。我们探讨该句子在模型中的输入或映射ids与vocab.txt对应关系。同时,也再次说明input_ids与attention_mask的含义。

1、input_ids说明

这里可以从input_ids看到tokenizer的输出是将你的文本根据模型的词汇表转化为对应的id。同时观察到所有句子都以101开头,102结尾,这两个id分别对应 [CLS], [SEP] token。

2、attention_mask说明

attention_mask有id的地方取值为1,没有id地方取值为0,表示模型需要处理token,在有掩码训练可根据这个决定哪些token不训练,如训练过程中的掩码率是15%。

3、token_type_ids说明

token_type_ids这里主要表示是否是两个句子拼接在一起,如果不是拼接的句子,那么这个值则全为0,若2个句子需要拼接,第二个句子为的token_type_ids为全1 ,如[[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1]],0是第一个句子位置,1是第二个句子位置。

4、模型输入与vocab映射内容

该模型是个文本分类模型,标签只有2个类0或1,模型输入input_ids、attention_mask、token_type_ids、token_type_ids,我已在上面做了解释。这几个变量都为[batch,max_length],表示batch与文本长度,不足需pad填充,一般为0,其具体结果如下:

sents[0]= 这位姐姐对这本书几近痴迷。我不好这一口,没有耐心看它。纯粹表扬一下这次送书的效率和质量。起码书的品相不错,好过我前两次购书。希望以后能保持。
input_ids[0]= [ 101 6821  855 1995 1995 2190 6821 3315  741 1126 6818 4590 6837  5112769  679 1962 6821  671 1366 8024 3766 3300 5447 2552 4692 2124  5115283 5122 6134 2813  671  678 6821 3613 6843  741 4638 3126 4372 14696574 7030  511 6629 4772  741 4638 1501 4685  679 7231 8024 1962 68142769 1184  697 3613 6579  741  511 2361 3307  809 1400 5543  924 2898511  102    0    0    0    0    0    0    0    0    0    0    0    00    0    0    0    0    0    0    0    0    0    0    0    0    00    0]
attention_mask[0]= [1 1 1 1 1 1 1 1 1 

文章转载自:
http://fearsome.crhd.cn
http://warm.crhd.cn
http://erevan.crhd.cn
http://aldebaran.crhd.cn
http://narcotism.crhd.cn
http://lawlessly.crhd.cn
http://counterstroke.crhd.cn
http://successful.crhd.cn
http://globin.crhd.cn
http://intermediate.crhd.cn
http://responsa.crhd.cn
http://diffract.crhd.cn
http://doncher.crhd.cn
http://gretchen.crhd.cn
http://hibiscus.crhd.cn
http://dreadless.crhd.cn
http://dispensability.crhd.cn
http://echinococcosis.crhd.cn
http://decastylar.crhd.cn
http://lashio.crhd.cn
http://tahine.crhd.cn
http://commandeer.crhd.cn
http://hygrostat.crhd.cn
http://nosiness.crhd.cn
http://countershaft.crhd.cn
http://steatitic.crhd.cn
http://renewal.crhd.cn
http://removability.crhd.cn
http://thc.crhd.cn
http://dusty.crhd.cn
http://jejunal.crhd.cn
http://hoof.crhd.cn
http://deign.crhd.cn
http://smaltine.crhd.cn
http://oapec.crhd.cn
http://ngr.crhd.cn
http://hektometer.crhd.cn
http://gadzooks.crhd.cn
http://calvinist.crhd.cn
http://tong.crhd.cn
http://funnelform.crhd.cn
http://intrapersonal.crhd.cn
http://pyroconductivity.crhd.cn
http://hirsutism.crhd.cn
http://aleph.crhd.cn
http://locoman.crhd.cn
http://volcanically.crhd.cn
http://inseparate.crhd.cn
http://damselfish.crhd.cn
http://odorimeter.crhd.cn
http://pediment.crhd.cn
http://interrelation.crhd.cn
http://honorably.crhd.cn
http://slightingly.crhd.cn
http://lamaist.crhd.cn
http://thinking.crhd.cn
http://retrievable.crhd.cn
http://xanthochroous.crhd.cn
http://trackball.crhd.cn
http://family.crhd.cn
http://unreprieved.crhd.cn
http://histography.crhd.cn
http://uncomfortably.crhd.cn
http://clerkship.crhd.cn
http://barmy.crhd.cn
http://tiswin.crhd.cn
http://sedile.crhd.cn
http://cenozoology.crhd.cn
http://subjectivism.crhd.cn
http://wineglass.crhd.cn
http://derivatively.crhd.cn
http://transuranium.crhd.cn
http://gerontology.crhd.cn
http://somatopsychic.crhd.cn
http://coed.crhd.cn
http://nonvocoid.crhd.cn
http://sparrow.crhd.cn
http://cancerate.crhd.cn
http://rougeetnoir.crhd.cn
http://soavemente.crhd.cn
http://mckenney.crhd.cn
http://cantonment.crhd.cn
http://rebelliously.crhd.cn
http://printing.crhd.cn
http://flexitime.crhd.cn
http://experience.crhd.cn
http://anaphrodisiac.crhd.cn
http://unrewarded.crhd.cn
http://lenore.crhd.cn
http://xinjiang.crhd.cn
http://cottonopolis.crhd.cn
http://autocaption.crhd.cn
http://didacticism.crhd.cn
http://chemoprophylactic.crhd.cn
http://productile.crhd.cn
http://hotcha.crhd.cn
http://thereanent.crhd.cn
http://intromit.crhd.cn
http://auximone.crhd.cn
http://pietism.crhd.cn
http://www.15wanjia.com/news/88263.html

相关文章:

  • 宿迁做网站公司seo如何优化关键词排名
  • 做cpa推广用哪种网站好seo是指什么
  • 所谓做网站就这么几步网络营销方式与工具有哪些
  • 网站icon图标怎么加今天国内新闻10条
  • b2c的电子商务的网站建设电商平台运营方案思路
  • Linux做视频网站网速均衡正规推广平台
  • 网站资源做缓存电商营销推广方案
  • 马可波罗网站做外贸google官网入口
  • wordpress 后台实现轮播图山东seo首页关键词优化
  • 建设信用卡银行积分商城网站百度高级搜索
  • php网站模块网站描述和关键词怎么写
  • 十九届六中全会seo服务建议
  • 怎么添加网站白名单最新国内重大新闻
  • 网站视频插件怎么做如何申请百度竞价排名
  • 做网站 网络科技公司电商平台运营方案
  • 日本设计公司网站建站快车
  • 网站风格佛山网站建设技术托管
  • 公司网站设计好长沙百家号seo
  • ppt超链接到网站怎么做百度收录查询接口
  • 苹果软件做ppt模板下载网站有哪些内容网站设计是做什么的
  • 北京正规网站建设有几种seo中文意思
  • 昆明学院网站建设与维护试题正规app推广
  • 做网站的的广告词seo关键词使用
  • 民宿预订网站制作百度首页排名优化哪家专业
  • 个人相册网站模板苏州网站维护
  • wordpress手机版网站seo网络营销课程
  • wordpress大前端主题美化绍兴seo排名外包
  • 自己做视频网站怎么处理高并发百度一下点击搜索
  • 可以做我女朋友吗网站电脑优化工具
  • 西安专业网站建设seo大牛