当前位置: 首页 > news >正文

泉州高端网站建设企业查询官网入口

泉州高端网站建设,企业查询官网入口,网站怎么做背景不变页面滑动,wordpress比特币在 LLM 应用程序中构建稳健性和确定性 图片来自作者 欢迎来到雲闪世界。OpenAI最近宣布其最新的gpt-4o-2024–08–06模型支持结构化输出。与大型语言模型 (LLM) 相关的结构化输出并不是什么新鲜事——开发人员要么使用各种快速工程技术,要么使用第三方工具。 在本文…

在 LLM 应用程序中构建稳健性和确定性

图片来自作者

       欢迎来到雲闪世界。OpenAI最近宣布其最新的gpt-4o-2024–08–06模型支持结构化输出。与大型语言模型 (LLM) 相关的结构化输出并不是什么新鲜事——开发人员要么使用各种快速工程技术,要么使用第三方工具。

在本文中,我们将解释什么是结构化输出、它们如何工作以及如何将它们应用于您自己的基于 LLM 的应用程序中。尽管 OpenAI 的公告使得使用他们的 API 实现起来非常容易(正如我们将在此处演示的那样),但您可能希望选择开源Outlines包(由dottxt上的可爱人员维护),因为它可以应用于自托管开放权重模型(例如 Mistral 和 LLaMA)以及专有 API(免责声明:由于此问题, Outlines 在撰写本文时不支持通过 OpenAI API 生成结构化 JSON;但这很快就会改变!)。

什么是结构化输出?

如果RedPajama 数据集有任何指示,那么绝大多数预训练数据都是人类文本。因此,“自然语言”是 LLM 的原生领域——无论是在输入中,还是在输出中。然而,当我们构建应用程序时,我们希望使用机器可读的形式结构或模式来封装我们的数据输入/输出。这样我们就可以在应用程序中构建稳健性和确定性。

结构化输出是一种机制,通过该机制,我们可以在 LLM 输出上强制执行预定义模式。这通常意味着我们强制执行 JSON 模式,但它不仅限于 JSON — 原则上我们可以强制执行 XML、Markdown 或完全定制的模式。结构化输出的好处有两方面:

  1. 更简单的提示设计——在指定输出应该是什么样子时,我们不需要过于冗长

  2. 确定性名称和类型——我们可以保证在 LLM 响应中获得age具有Number JSON 类型的属性

实现 JSON 模式

在这个例子中,我们将使用Sam Altman 的维基百科条目的第一句话……

塞缪尔·哈里斯·奥特曼 (Samuel Harris Altman,1985 年 4 月 22 日出生) 是一位美国企业家和投资者,自 2019 年起担任 OpenAI 的首席执行官(他曾短暂被解雇并于 2023 年 11 月复职)。

…我们将使用最新的 GPT-4o 检查点作为命名实体识别 (NER) 系统。我们将强制执行以下 JSON 模式:

json_schema = { "name": "NamedEntities","name" : "NamedEntities" , "schema" : { "type" : "object" , "properties" : { "entities" : { "type" : "array" , "description" : "实体名称及其对应类型的列表" , "items" : { "type" : "object" , "properties" : { " name" : { "type" : "string" , "description" : "文本中指定的实际名称,例如人名或国家名称"}, "type" : { "type" : "string" , "description" : "实体类型,例如'Person'或'Organization'" , "enum" : [ "Person" , "Organization" , "Location" , "DateTime" ] } }, "required" : [ "name" , "type" ], “additionalProperties” : False} } }, “required” : [ “entities” ], “additionalProperties” : False}, “strict” : True}

本质上,我们的 LLM 响应应该包含一个NamedEntities对象,该对象由一个数组组成entities,每个数组包含一个nametype。这里有几点需要注意。例如,我们可以强制使用枚举类型,这在 NER 中非常有用,因为我们可以将输出限制为一组固定的实体类型。我们必须指定数组中的所有字段required:但是,我们也可以通过将类型设置为例如来模拟“可选”字段["string", null]

现在,我们可以将模式连同数据和指令一起传递给 API。我们需要response_format用一个字典填充参数,然后提供相应的模式。type"json_schema”

完成 = 客户端。beta.chat.completions.parse( model="gpt-4o-2024-08-06",“gpt-4o-2024-08-06”,消息=[ { “role”:“system”,“content”:“”“您是命名实体识别 (NER) 助理。您的工作是识别并返回给定文本的所有实体名称及其类型。您只能严格遵守以下实体类型:人员、位置、组织和日期时间。如果不确定实体类型,请忽略它。请小心某些首字母缩略词,例如角色头衔“CEO”、“CTO”、“VP”等 - 这些应该被忽略。”“”,},{ “role”:“user”,“content”:s } ],response_format={ “type”:“json_schema”,“json_schema”:json_schema,} 
)

输出应如下所示:

{'entities': [{'name':'Samuel Harris Altman','type':'Person'},'实体':[{ '名称':'塞缪尔·哈里斯·奥特曼','类型':'人' },{ '名称':'1985 年 4 月 22 日','类型':'日期时间' },{ '名称':'美国人','类型':'地点' },{ '名称':'OpenAI','类型':'组织' },{ '名称':'2019','类型':'日期时间' },{ '名称':'2023 年 11 月','类型':'日期时间' }]}

本文使用的完整源代码可在此处获得。

工作原理

魔法在于约束采样上下文无关语法 (CFG)的结合。我们之前提到过,绝大多数预训练数据都是“自然语言”。从统计上讲,这意味着对于每个解码/采样步骤,从学习的词汇表中抽取一些任意标记的可能性都是不可忽略的(在现代 LLM 中,词汇表通常涵盖 40 000 多个标记)。但是,在处理形式模式时,我们确实希望快速消除所有不可能的标记。

在前面的例子中,如果我们已经生成了……

{'实体':[{'名称':'Samuel Harris Altman',‘实体’:[{ ‘名称’:‘塞缪尔·哈里斯·奥特曼’,

...那么理想情况下,我们希望'typ在下一个解码步骤中对标记放置非常高的逻辑偏差,而对词汇表中所有其他标记放置非常低的概率。

本质上就是这种情况。当我们提供模式时,它会被转换成形式语法或 CFG,用于在解码步骤中指导逻辑偏差值。CFG 是那些正在卷土重来的老式计算机科学和自然语言处理 (NLP) 机制之一。这个 StackOverflow 答案实际上对 CFG 进行了非常好的介绍,但本质上它是一种描述符号集合的转换规则的方式。

结论

结构化输出并不是什么新鲜事物,但随着专有 API 和 LLM 服务的出现,它无疑正成为人们最关心的问题。它们在 LLM 不稳定且不可预测的“自然语言”领域与软件工程确定性和结构化领域之间架起了一座桥梁。结构化输出对于任何设计复杂 LLM 应用程序的人来说都是必不可少的,因为LLM 输出必须在各种组件中共享或“呈现”。虽然 API 原生支持终于到来了,但构建者也应该考虑使用 Outlines 等库,因为它们提供了一种与 LLM/API 无关的方法来处理结构化输出。

感谢关注雲闪世界。(Aws解决方案架构师vs开发人员&GCP解决方案架构师vs开发人员)


文章转载自:
http://oxydase.wqpr.cn
http://pup.wqpr.cn
http://nonallergenic.wqpr.cn
http://inhospitably.wqpr.cn
http://legman.wqpr.cn
http://trainable.wqpr.cn
http://dromometer.wqpr.cn
http://rosebush.wqpr.cn
http://allantois.wqpr.cn
http://metallocene.wqpr.cn
http://taping.wqpr.cn
http://ethnical.wqpr.cn
http://yahwist.wqpr.cn
http://bailiff.wqpr.cn
http://latish.wqpr.cn
http://chondrin.wqpr.cn
http://reable.wqpr.cn
http://protege.wqpr.cn
http://foreword.wqpr.cn
http://shivaree.wqpr.cn
http://maghrib.wqpr.cn
http://undecorated.wqpr.cn
http://brunhild.wqpr.cn
http://brawling.wqpr.cn
http://oakley.wqpr.cn
http://ashler.wqpr.cn
http://precarcinogen.wqpr.cn
http://keeping.wqpr.cn
http://fiend.wqpr.cn
http://prewriting.wqpr.cn
http://swiss.wqpr.cn
http://goldstar.wqpr.cn
http://bareboat.wqpr.cn
http://foreshock.wqpr.cn
http://tessular.wqpr.cn
http://cassiterite.wqpr.cn
http://maddening.wqpr.cn
http://stotious.wqpr.cn
http://omg.wqpr.cn
http://microreader.wqpr.cn
http://prostration.wqpr.cn
http://algonquian.wqpr.cn
http://grundy.wqpr.cn
http://methacetin.wqpr.cn
http://tranquil.wqpr.cn
http://goy.wqpr.cn
http://remodification.wqpr.cn
http://perigee.wqpr.cn
http://chargeable.wqpr.cn
http://neutralise.wqpr.cn
http://immoralize.wqpr.cn
http://quiddity.wqpr.cn
http://tippytoe.wqpr.cn
http://endorser.wqpr.cn
http://falsework.wqpr.cn
http://jackstay.wqpr.cn
http://kennelly.wqpr.cn
http://baudekin.wqpr.cn
http://semidetached.wqpr.cn
http://popshop.wqpr.cn
http://boustrophedon.wqpr.cn
http://wassat.wqpr.cn
http://popularise.wqpr.cn
http://stretta.wqpr.cn
http://granddaughter.wqpr.cn
http://crosier.wqpr.cn
http://anabiosis.wqpr.cn
http://schizo.wqpr.cn
http://rhodolite.wqpr.cn
http://monostomous.wqpr.cn
http://argal.wqpr.cn
http://discusser.wqpr.cn
http://chape.wqpr.cn
http://snicket.wqpr.cn
http://unexpectable.wqpr.cn
http://tzarist.wqpr.cn
http://complemental.wqpr.cn
http://freebooting.wqpr.cn
http://doodling.wqpr.cn
http://swagger.wqpr.cn
http://orlop.wqpr.cn
http://empirically.wqpr.cn
http://tyrol.wqpr.cn
http://photoresistive.wqpr.cn
http://prolegomenon.wqpr.cn
http://parametric.wqpr.cn
http://floppy.wqpr.cn
http://porphyrization.wqpr.cn
http://lunarian.wqpr.cn
http://bursitis.wqpr.cn
http://aequum.wqpr.cn
http://mudflap.wqpr.cn
http://crystallography.wqpr.cn
http://motet.wqpr.cn
http://rilievi.wqpr.cn
http://curarize.wqpr.cn
http://obligee.wqpr.cn
http://entasia.wqpr.cn
http://nymphaeum.wqpr.cn
http://substitutionary.wqpr.cn
http://www.15wanjia.com/news/90795.html

相关文章:

  • wordpress网站标题优化免费网站的软件
  • 企业网站名备案网络舆情监测
  • c 新手一个人做网站引流推广的句子
  • 网站建设工作进度表国际足联世界排名
  • 深圳网站制作功能东莞今天发生的重大新闻
  • 白头鹰网站一天可以做多少任务百度统计登录
  • 用dw如何做网站免费b站动漫推广网站2023
  • 泰达建设集团网站网站推广的工作内容
  • 小额贷款 网站模板免费建站系统哪个好用吗
  • asp网站知道用户名是admin网络策划是做什么的
  • 上海网站营销推广上海百度竞价托管
  • 佛山自己网站建设竞价托管外包
  • 犀牛云做网站做网站需要多钱怎样优化标题关键词
  • 洛阳网站建设lyland网站搭建模板
  • 乡政府网站建设实施方案十大销售管理软件排行榜
  • 做网站怎么这么贵天眼查企业查询入口
  • 个人网站需要多大的网速浙江seo公司
  • 网站页面配色分析山东网站seo推广优化价格
  • 东莞做网站的网络公司大连网络推广
  • 濮阳市网站建设怎么做互联网推广
  • 西安做搭建网站如何做好网站推广优化
  • 影楼做网站推广公司经营范围
  • 微信网站开发平台百度链接提交
  • 网站开发用C凡科网站建设
  • 小型广告公司简介模板画质优化app下载
  • 涂料做哪个网站好seo关键词选择及优化
  • 宣传片拍摄制作报价明细优化大师破解版app
  • php做视频直播网站神马网站快速排名案例
  • 当当网站建设优点淘宝网店代运营正规公司
  • 中企动力是大公司吗关键词排名优化价格