当前位置: 首页 > news >正文

如何推广一个网站网站seo公司哪家专业

如何推广一个网站,网站seo公司哪家专业,乐清网络,腾讯云cdn wordpress以前不甘心,总想争个对错,现在不会了 人心各有所愿,没有道理可讲 —— 25.1.18 计算Bert模型结构中的参数数量 BertModel.from_pretrained():用于从预训练模型目录或 Hugging Face 模型库加载 BERT 模型的权重及配置。 参数名称…

以前不甘心,总想争个对错,现在不会了

人心各有所愿,没有道理可讲

                                                        —— 25.1.18

计算Bert模型结构中的参数数量 

BertModel.from_pretrained():用于从预训练模型目录或 Hugging Face 模型库加载 BERT 模型的权重及配置。

参数名称类型是否必填说明
pretrained_model_name_or_path字符串模型名称(如 bert-base-uncased)或本地路径。
configBertConfig对象自定义配置类,用于覆盖默认配置。
state_dict字典预训练权重字典,用于部分加载模型。
cache_dir字符串缓存目录,用于存储下载的模型文件。
from_tf布尔值是否从 TensorFlow 模型加载权重,默认为 False
ignore_mismatched_sizes布尔值是否忽略权重大小不匹配的错误,默认为 False
local_files_only布尔值是否仅从本地文件加载模型,默认为 False

return_dict参数:

  • 当 return_dict 设置为 True 时,forward() 方法返回一个 BaseModelOutput 对象,该对象包含了模型的各种输出,如最后一层的隐藏状态、[CLS] 标记的输出等。
  • 当 return_dict 设置为 False 时,forward() 方法返回一个元组,包含与 BaseModelOutput 对象相同的元素,但不包含对象结构。

numel():计算张量(Tensor)中的元素总数

参数名称类型是否必填说明
tensortorch.Tensor输入的PyTorch张量。

parameters():返回模型中所有可训练参数的迭代器。

参数名称类型是否必填说明
recurse布尔值是否递归获取子模块的参数,默认为True
import torch
import math
import torch.nn as nn
import numpy as np
from transformers import BertModelmodel = BertModel.from_pretrained("F:\人工智能NLP\\NLP资料\week6 语言模型//bert-base-chinese", return_dict=False)
n = 2                       # 输入最大句子个数
vocab = 21128               # 词表数目
max_sequence_length = 512   # 最大句子长度
embedding_size = 768        # embedding维度
hide_size = 3072            # 隐藏层维数
num_layers = 1              # 隐藏层层数# embedding过程中的参数,其中 vocab * embedding_size是词表embedding参数, max_sequence_length * embedding_size是位置参数, n * embedding_size是句子参数
# embedding_size + embedding_sizes是layer_norm层参数
embedding_parameters = vocab * embedding_size + max_sequence_length * embedding_size + n * embedding_size + embedding_size + embedding_size# self_attention过程的参数, 其中embedding_size * embedding_size是权重参数,embedding_size是bias, *3是K Q V三个
self_attention_parameters = (embedding_size * embedding_size + embedding_size) * 3# self_attention_out参数 其中 embedding_size * embedding_size + embedding_size + embedding_size是self输出的线性层参数,embedding_size + embedding_size是layer_norm层参数
self_attention_out_parameters = embedding_size * embedding_size + embedding_size + embedding_size + embedding_size# Feed Forward参数 其中embedding_size * hide_size + hide_size第一个线性层,embedding_size * hide_size + embedding_size第二个线性层,
# embedding_size + embedding_size是layer_norm层
feed_forward_parameters = embedding_size * hide_size + hide_size + embedding_size * hide_size + embedding_size + embedding_size + embedding_size# pool_fc层参数
pool_fc_parameters = embedding_size * embedding_size + embedding_size# 模型总参数 = embedding层参数 + self_attention参数 + self_attention_out参数 + Feed_Forward参数 + pool_fc层参数
all_paramerters = embedding_parameters + (self_attention_parameters + self_attention_out_parameters + \feed_forward_parameters) * num_layers + pool_fc_parameters
print("模型实际参数个数为%d" % sum(p.numel() for p in model.parameters()))
print("diy计算参数个数为%d" % all_paramerters)

http://www.15wanjia.com/news/188651.html

相关文章:

  • 长沙网站建设电话网站开发业务怎么开展
  • 全面启动门户网站建设网站制作网络推广方案
  • 网站建设流程步骤怎么样小米官网静态网页制作
  • 网站显示乱码怎么办excel中批量做网站的超链接
  • 东莞常平做网站长春公司建站模板
  • 视频网站怎么做采集网站开发的英文文献
  • 烟台网站建设哪家专业网站风格分析
  • 什么网站比谷歌还好企业管理咨询合同模板
  • 客似云来网站建设c2c电子商务网站建设栏目结构图
  • 甜点网站要怎么做如何建立自己的直播平台
  • wp怎样做可以下载的网站网站栏目功能
  • 网站关键词seo优化怎么做wordpress怎么做资料库
  • 合肥市做效果图的网站石家庄市住房和城乡建设厅网站
  • 做动画在线观看网站营销网站建设软件下载
  • 12380举报网站建设经验帮人做网站在徐州被敲诈五万
  • 网站开发与管理实训项目网站设计与建设word设计理念
  • 网站建设怎么搭建服务器企业营销微网站建设
  • 南昌网站空间外贸平台找外贸公司
  • 国税部门强化网站建设零代码自助建站平台
  • 企业做的网站推广方案的步骤高端企业建站公司
  • 建设银行附近网站点做淘宝的导购网站
  • 什么是网站分析企业所得税优惠政策最新2023计算
  • 做网站资质荣誉用的图片建设银行信用卡积分兑换商城网站
  • 建设实验中心网站wordpress 页面布局
  • 高效网站推广设计wordpress分页静态
  • 网站建设是如何称呼的铜川网站建设公司电话
  • 农村网站建设补助科技有限公司简介模板
  • 在哪个网站上可以学做衣服做网站用什么颜色好
  • 东莞清溪镇做网站公司网站怎么做搜索栏
  • 济南做网站的高端品牌广州seo公司品牌