当前位置: 首页 > news >正文

成都哪家做网站比较好短视频推广代理

成都哪家做网站比较好,短视频推广代理,做网站开发的公司销售,达令的网站建设GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等LLM模型? 文章目录 GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等LLM模型?P-Tuning微调训练概述1、预训练模型或者是torch模型2、训练器的超参数3、数据预处理工具4、加载数据5、分词处理6、数据预…

GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等LLM模型?

文章目录

  • GPT实战系列-如何使用P-Tuning本地化训练ChatGLM2等LLM模型?
      • P-Tuning微调训练概述
        • 1、预训练模型或者是torch模型
        • 2、训练器的超参数
        • 3、数据预处理工具
        • 4、加载数据
        • 5、分词处理
        • 6、数据预处理,如填充,前后缀
        • 7、训练参数配置
        • 8、执行训练
      • 软件依赖
      • 数据处理

P-Tuning v2 将 ChatGLM2-6B 模型需要微调的参数量,减少到原来的 0.1%,再通过模型量化、Gradient Checkpoint 等方法,最低只需要 7GB 显存即可运行。

本文试图分析程序结构和代码,解释序列转换生成模型的微调训练。为了篇幅不要过长,下期解读训练代码。

P-Tuning微调训练概述

训练过程函数分为五个部分:训练参数配置,训练数据预处理,训练数据加载,执行迭代训练,训练评估与测试。

训练参数配置
训练数据预处理
训练数据加载
训练执行迭代
训练评估与测试

把训练任务参数配置传递给Trainer:

1、预训练模型或者是torch模型
from transformers import AutoModelForSequenceClassification
model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased")
2、训练器的超参数

TrainingArguments包含可以更改的模型超参数,如学习率、批大小和要训练的epoch数量。如果不指定任何训练参数,则使用默认值:

from transformers import TrainingArguments
training_args = TrainingArguments(output_dir="path/to/save/folder/",learning_rate=2e-5,per_device_train_batch_size=8,per_device_eval_batch_size=8,num_train_epochs=2,
)
3、数据预处理工具

如分词器、图像处理器、特征提取器或处理器:

from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased")
4、加载数据
from datasets import load_dataset
dataset = load_dataset("rotten_tomatoes")  # doctest: +IGNORE_RESULT
5、分词处理

创建一个函数对数据集进行分词,并使用map将其应用到整个数据集上:

def tokenize_dataset(dataset):return tokenizer(dataset["text"])
dataset = dataset.map(tokenize_dataset, batched=True)
6、数据预处理,如填充,前后缀

使用DataCollatorWithPadding从数据集中创建一批示例:

from transformers import DataCollatorWithPadding
data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
7、训练参数配置

在Trainer中使用所有这些类:

from transformers import Trainer
trainer = Trainer(model=model,args=training_args,train_dataset=dataset["train"],eval_dataset=dataset["test"],tokenizer=tokenizer,data_collator=data_collator,
)  # doctest: +SKIP
8、执行训练

调用train()开始训练:

trainer.train()

对于使用序列到序列模型的任务(如翻译或摘要),请使用Seq2SeqTrainer和Seq2SeqTrainingArguments类。

可以通过继承Trainer中的方法来自定义训练循环。允许自定义特性,如损失函数、优化器和调度器(scheduler)。请查看 Trainer参考文档,了解哪些方法可以被子类化。

软件依赖

需要pip安装中文分词器,中文评价指标,数据集管理

pip install rouge_chinese nltk jieba datasets

数据处理

训练数据形式的转换,本训练测试以广告数据集作为样例讲解。

ADGEN数据集任务的数据形式,输入(content),生成输出(summary)

{"content": "类型#上衣*版型#宽松*版型#显瘦*图案#线条*衣样式#衬衫*衣袖型#泡泡袖*衣款式#抽绳","summary": "这件衬衫的款式非常的宽松,利落的线条可以很好的隐藏身材上的小缺点,穿在身上有着很好的显瘦效果。领口装饰了一个可爱的抽绳,漂亮的绳结展现出了十足的个性,配合时尚的泡泡袖型,尽显女性甜美可爱的气息。"
}

End



GPT专栏文章:

GPT实战系列-ChatGLM3本地部署CUDA11+1080Ti+显卡24G实战方案

GPT实战系列-ChatGLM2模型的微调训练参数解读

GPT实战系列-如何用自己数据微调ChatGLM2模型训练

GPT实战系列-ChatGLM2部署Ubuntu+Cuda11+显存24G实战方案

GPT实战系列-Baichuan2本地化部署实战方案

决策引擎:
Falcon构建轻量级的REST API服务

决策引擎-利用Drools实现简单防火墙策略

http://www.15wanjia.com/news/164013.html

相关文章:

  • 西安手机网站建设公司排名高端网站建设公司零零
  • 如何在godaddy空间做手机网站做推广网站需要商标吗
  • 网站建设的原因wordpress 建立数据库连接时出错 重启数据库
  • 韩国风格网站php源码为什么说做网站赚钱
  • 产品发布网站网站的分页做不好会影响主页
  • 免费学校网站模板html超市网站建设方案
  • 五合一网站做优化好用吗网站集群建设必要性
  • jsp ajax网站开发典型实例 pdfdw网站建设模板
  • 杭州网站公司设计网站定制的公司哪家好
  • 做网站一般按什么报价毕业生对于网站建设感受
  • 开发一个网站做公司内部用网站专栏怎么做漂亮
  • 重庆景点图片网站优化推广的方法
  • 营销方案 网站如何登录网站服务器
  • 建设工程安全备案网站装修设计软件哪个好用
  • 开发个微网站多少钱科技服务公司网站模版
  • 厦门企业网站开发南京设计网站
  • 北京珠宝网站建设莱芜网页定制
  • 做视频网站想用家庭网络宁波高端定制网站建设
  • 平面设计手绘网站中国企业公司网站建设
  • 学校网站建设方案论文旗舰店的网站怎么做
  • 广西网站建设证件查询医院网站制作公司
  • 杭州网站建设网页制作做一个网站需要到哪里做
  • 买的网站可做360广告联盟吗建立网站很重要的要素是什么
  • angular做的网站大全一条龙建设网站
  • 网站规范化建设使用net域名的大网站
  • 做美团团购网站wordpress数据插件
  • 集约化网站群建设情况asp网站后台模板
  • 佛山品牌网站设计制作怎么开网店淘宝
  • 什么网站做视频给钱手机网站代理
  • 怎么查那些人输入做网站网站策划报告怎么写