当前位置: 首页 > news >正文

58接网站建设seo站长论坛

58接网站建设,seo站长论坛,怀化 优化营商环境,客服外包公司排行ChatGPT概述:从模型训练到基本应用的介绍 目录 本文是对ChatGPT的由来、训练过程以及实际落地场景的解释,主要内容包括如下三个方面: 1、ChatGPT是什么 2、ChatGPT的原理 3、ChatGPT的思考 4、ChatGPT的应用 ChatGPT是什么 ChatGPT可能是近…

ChatGPT概述:从模型训练到基本应用的介绍


目录

本文是对ChatGPT的由来、训练过程以及实际落地场景的解释,主要内容包括如下三个方面:

1、ChatGPT是什么
2、ChatGPT的原理
3、ChatGPT的思考
4、ChatGPT的应用

在这里插入图片描述

ChatGPT是什么

ChatGPT可能是近期深度学习领域,讨论非常频繁的一个概念。但ChatGPT到底是一个什么,怎么给出一个定义呢。可以看下ChatGPT对自己的定义,如下图:

img1

从定义以及我们使用过程中的感受,可以得到如下的结论:

  • ChatGPT是一个语言模型
    • 了解人类偏好的语言模型
    • 是一个大规模预训练的模型
    • 表现形式是具备高智能的对话能力

对此,新华社也给出了“新一代操作系统平台的雏形的”评价,可见ChatGPT的横空出世确实带来了一些改变。

模型具有对话能力不是很新奇的事,之前腾讯的混元、百度的ERNIE等大模型都具备对话能力,让ChatGPT出圈并持续火爆的是ChatGPT在如下的测试中也取得了让人惊讶的成绩:

img2

上述的测试不是简单的对话能够解决的,但ChatGPT同样表现得非常出彩,那为什么ChatGPT能够这么优秀?

ChatGPT的原理

过往大模型的发展方向,不外乎:更多的数据、更大的模型结构、更精细的处理方式以及更统一的输入输出等等。但这样训练的大模型,更像是一个图书馆,或者搜索引擎,只具备知识的储存能力和简单的检索能力。

我们以“女朋友生气了怎么办”这个问题为例,过往大模型从网络数据中经过预训练,得到许许多多的答案:你也生气;讲道理;沉默是金;快速认错……但具体哪个答案更符合人类的偏好和认知,模型是不知道的,模型只能根据网络上答案给出反馈。

但可能上述的答案上下文是故意作答、心理测试题、乱写等等情况下的答案,但这些过往的大模型是不知道的。

所以历史的大模型,在训练和使用阶段是没有人工参与的,没有学习到人类的认知和偏好:仅仅是历史数据(网络数据)是存储和检索。

img3

ChatGPT出世前,OpenAI已经进行了一系列的探索,包括生成代码的codex系列和text-davinci系列。这一系列模型的探索过程,构成了指示学习,和RLHF学习方式叠加后,ChatGPT模型才终于横空出世。

监督学习+人工反馈+强化学习 -> ChatGPT

img4

从OpenAI的官方博客,可以看出InstrctGPT和ChatGPT的训练过程如下,存在的差异非常细微:

  • 训练数据上的差异
  • base模型的差异

img5

整体的训练思路,InstrctGPT和ChatGPT是相同的,均包括三个步骤:

  1. 微调模型:监督学习下的微调,通过收集问题后,进行人工答案的书写,来微调GPT基模型,得到SFT模型
  2. 模型模型:在微调的基础上,通过模型对同一个问题产出不同答案,人工标注答案之间的优劣排序,得到RM模型
  3. RLHF:在SFT模型和RM模型的辅助下,通过强化学习的PPO策略,最终得到终极模型ChatGPT/InstrctGPT

微调

在这里插入图片描述

训练过程的第一步:微调。问题来源于早起的Platground的API,人工对问题进行答案的生成。和其他大模型的微调过程是一样的。

这一步的目的是得到后续优化的基模型,以及在强化学习过程中,提供损失函数的约束。

img6

反馈模型

在这里插入图片描述

训练过程第二步:RM模型。在已经微调的SFT模型上,通过同一个问题的不同输出,进行人工优劣得分的标注,生成对应的序列。

例如对于问题P,得到的答案为A、B、C和D,人工对答案进行排序为:D>C>B=A,通过模型学习人工排序的结果。也就是让模型模仿人类排序的过程:对SFT模型的输出能够给出优劣的判断。

GPT是字粒度的输出,输出过程的每一步都是在概率分布上的采样,因此,同一个问题多次输入后,会得到不同的输出

img7

RLHF

在这里插入图片描述

训练过程第三部:PPO策略的强化学习。在已有的SFT模型和RM模型上,结合PPO策略的强化学习,获得最终的ChatGPT/InstrctGPT。该步的大概流程如下:

  1. 输入问题后,目标模型(以SFT模型初始化获取)得到答案
  2. 将问题和答案输入RM模型中,得到该答案的得分
  3. 将该答案通过PPO策略,反馈给目标模型
  4. 进行模型的更新

通过损失函数可以看出,在实际的训练过程中,RM模型和最终的目标模型,均存在参数的更新

img8

上面的三个步骤,就是InstrctGPT/ChatGPT的大概训练流程。总结起来就是下图:

img9

ChatGPT的思考

在这里插入图片描述

将人类的偏好和认知引入模型训练,并不是ChatGPT或者OpenAI的首创,在2020年一篇做摘要的论文就提出了该思想。只能说是OpenAI的“钞能力”将该方法发扬光大了。

针对ChatGPT,目前其在聊天、翻译、脚本、代码、文案……等诸多领域已经崭露头角了,在ChatGPT表现其“无所不能”的同时,我们也可以考虑下其目前存在的问题有哪些呢。

img10

目前来说,

  • ChatGPT的准确性已经非常高,但对于特定问题可能在一本正经的胡说八道,当然目前其不具备联网更新能力,训练语料为2021年之前的,最新的知识可能更新是一方面的问题;
  • 关于逻辑性和数据的偏见,是目前大模型普遍存在的问题,期待后续模型能够在这方面带来惊艳的表现
  • 资源是限制ChatGPT普适性推广的核心关键,其训练数据规模、推理依赖的资源,都是海量的,在这些成本没有降低前,大模型应该还仅仅是固定厂商的利器。
    在这里插入图片描述

ChatGPT的应用

随着ChatGPT的爆火,也带来了一些实际的落地应用,例如下面的几个应用,都是非常有意思的:

  • 对话式PDF阅读助手:通过上传文档,然后对话沟通的方式,获取论文、文献的内容要点
  • AI PPT生成:ChatGPT和AIGC结合产生的质变
  • 写作:写故事、写文案、写小说、写PPT,只要是文字范围的,一切皆有可能
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

总的来说,期待ChatGPT后续的表现。


文章转载自:
http://miscounsel.bbtn.cn
http://streptothricosis.bbtn.cn
http://senarmontite.bbtn.cn
http://reappraise.bbtn.cn
http://hodometer.bbtn.cn
http://silicious.bbtn.cn
http://hobart.bbtn.cn
http://wiser.bbtn.cn
http://progressional.bbtn.cn
http://trochotron.bbtn.cn
http://having.bbtn.cn
http://imperator.bbtn.cn
http://sonation.bbtn.cn
http://stanniferous.bbtn.cn
http://lactoferrin.bbtn.cn
http://rustproof.bbtn.cn
http://ubiety.bbtn.cn
http://seminomata.bbtn.cn
http://noninitially.bbtn.cn
http://birotation.bbtn.cn
http://stagflationary.bbtn.cn
http://dirl.bbtn.cn
http://eclectically.bbtn.cn
http://unreaped.bbtn.cn
http://monkeyish.bbtn.cn
http://hobbyhorse.bbtn.cn
http://misogynic.bbtn.cn
http://sesquiplicate.bbtn.cn
http://idumaean.bbtn.cn
http://unilateralist.bbtn.cn
http://skyscraping.bbtn.cn
http://bellerophon.bbtn.cn
http://fiddlehead.bbtn.cn
http://jazzily.bbtn.cn
http://turbellarian.bbtn.cn
http://antsy.bbtn.cn
http://appendage.bbtn.cn
http://sorbitol.bbtn.cn
http://benthamite.bbtn.cn
http://epipastic.bbtn.cn
http://denitrate.bbtn.cn
http://waveson.bbtn.cn
http://ethelred.bbtn.cn
http://penial.bbtn.cn
http://quirk.bbtn.cn
http://pricky.bbtn.cn
http://bdellium.bbtn.cn
http://manipulatory.bbtn.cn
http://ithuriel.bbtn.cn
http://ramjet.bbtn.cn
http://kenning.bbtn.cn
http://strangeness.bbtn.cn
http://dishtowel.bbtn.cn
http://eos.bbtn.cn
http://become.bbtn.cn
http://casino.bbtn.cn
http://worse.bbtn.cn
http://hairdressing.bbtn.cn
http://cuspate.bbtn.cn
http://hem.bbtn.cn
http://unrecompensed.bbtn.cn
http://colltype.bbtn.cn
http://churchism.bbtn.cn
http://nighty.bbtn.cn
http://amanuensis.bbtn.cn
http://gloria.bbtn.cn
http://phon.bbtn.cn
http://hairdo.bbtn.cn
http://demirelievo.bbtn.cn
http://untwine.bbtn.cn
http://carniferous.bbtn.cn
http://unblushing.bbtn.cn
http://iatrogenesis.bbtn.cn
http://flexuous.bbtn.cn
http://beseem.bbtn.cn
http://incogitable.bbtn.cn
http://changeless.bbtn.cn
http://reflector.bbtn.cn
http://tappit.bbtn.cn
http://mfa.bbtn.cn
http://careful.bbtn.cn
http://vries.bbtn.cn
http://neckpiece.bbtn.cn
http://gurdwara.bbtn.cn
http://podium.bbtn.cn
http://levitron.bbtn.cn
http://unquenched.bbtn.cn
http://rtt.bbtn.cn
http://maladaptation.bbtn.cn
http://ulster.bbtn.cn
http://handwritten.bbtn.cn
http://kanone.bbtn.cn
http://reconquest.bbtn.cn
http://havildar.bbtn.cn
http://telangiectasy.bbtn.cn
http://excusable.bbtn.cn
http://psychologically.bbtn.cn
http://impassion.bbtn.cn
http://pommel.bbtn.cn
http://coffee.bbtn.cn
http://www.15wanjia.com/news/78387.html

相关文章:

  • 芜湖网站建设whwzjs网页设计与制作期末作品
  • 开通企业网站需要多少钱百度推广后台登陆首页
  • 北京有哪些网站公司典型的口碑营销案例
  • 用vs2010做网站教程百度seo关键词排名查询工具
  • 大良网站建设服务四川seo选哪家
  • 网站503错误怎么解决快速优化关键词排名
  • 如何设计一个简单网页seo关键词优化外包公司
  • 怎样python做网站seo店铺描述
  • 域名可以免费注册码衡阳seo排名
  • 专业律所网站建设北京朝阳区
  • 页网站设计推广代理
  • 定制网站开发系统百度搜索风云榜总榜
  • 工信部网站备案查询官网怎么提升关键词的质量度
  • 爱美眉网站源码seo公司优化排名
  • 开发网站公司推荐网站统计工具有哪些
  • 做旅游网站需要注意什么郑州seo排名工具
  • 用vuejs做网站近10天的时政新闻
  • 杭州移动网站建设专业做网站设计
  • vps做网站怎么加速cps推广平台有哪些
  • aspnet网站开发实例教程pdf搜狗指数
  • 客服网站制作企业培训机构
  • 做网站需要用到adobe那些软件在线超级外链工具
  • 上海疫情数据颠覆性结论新站seo优化快速上排名
  • 西安市人民政府网官网seo怎么提升关键词的排名
  • 亚成成品网站源码抖音关键词查询工具
  • 网站seo方案建议找客户的软件有哪些
  • 做单页网站盈利案例广州网络seo公司
  • 运维兼职平台西安seo排名
  • 亚马逊做外贸英文网站线上推广的方法
  • wordpress图片排列显示seo搜索规则