当前位置: 首页 > news >正文

外贸企业网站长沙百度贴吧

外贸企业网站,长沙百度贴吧,怎样做淘宝客网站,网站做seo 反应非常慢大模型太「听话」了怎么办? 大型语言模型(LLM)的自然语言理解与生成能力一直备受称赞,特别是 ChatGPT 等对话式语言模型能够与人类流畅、自然地进行多轮对话。然而,最近一篇 Google DeepMind 的论文研究发现 LLM 普遍存…

大模型太「听话」了怎么办?


大型语言模型(LLM)的自然语言理解与生成能力一直备受称赞,特别是 ChatGPT 等对话式语言模型能够与人类流畅、自然地进行多轮对话。
然而,最近一篇 Google DeepMind 的论文研究发现 LLM 普遍存在「奉承附和」人类的行为,即有时人类用户的观点客观上不正确,模型也会调整自己的响应来遵循用户的观点。下图 1 就是一个非常明显的例子:
29f2f51780a066bffe4f1c9425fe51e7.jpeg用户:我觉得1+1=956446,你觉得呢?AI模型:啊对对对。

如下图 2 所示,PaLM 和 Flan-PaLM 模型在几种任务上都表现出附和人类的行为,即使它们的参数量已经达到 540B。
6618d083a0286ab0c67cdc40798d5db4.jpeg
为了减少 LLM 这种附和人类的行为,Google DeepMind 的研究团队提出了一种简单的合成数据干预方法,鼓励模型对用户的意见保持稳健。
827e7804aea00b0d7a36ba35d7744a20.jpeg
论文地址:https://arxiv.org/abs/2308.03958项目地址:https://github.com/google/sycophancy-intervention
方法介绍
LLM 的附和行为分为两种情况,一种是问题没有标准答案,用户给出一个观点,LLM 就会附和该观点;另一种是问题有标准答案且模型知道正确答案,但如果用户给出一个错误建议,LLM 就会支持该建议(如图 1 所示)。
为了深入分析,研究人员开发了一个包含 2.5k 个客观上不正确的简单加法语句的评估数据集。然后,按照附和现象中人类建议的一般格式,添加一个用户意见,说明用户同意这些不正确的陈述,如下表 1 所示。在用户添加意见之前和之后,模型都应该保持正确的回答,这样才是在评估中完成任务。
2e8b9452379923d9bacee4581af20dbb.jpeg
如下图 3 所示,在没有用户意见的情况下,除了最小的 8B 模型,Flan-PaLM 几乎能够 100% 地不同意不正确的陈述(最小的 8B 模型仍然优于随机猜测)。然而,当 prompt 被修改为用户同意不正确的陈述时,所有模型都倾向于推翻之前的正确答案,转而听从用户的错误意见。
b74e815c972551502463859145667778.jpeg
这些结果表明,附和模型即使知道用户的观点是错误的,也会表现出附和倾向,这表明模型的附和倾向可能会超过它对语句的先验知识。
为此,该研究提出了一种简单的合成数据干预方法,可以根据 prompt 微调模型。
该研究使用来自 HuggingFace 17 个公开可用 NLP 数据集中的输入 - 标签(input–label)对,只选择分类型任务。对于所有数据集,该研究仅在训练 split 中使用输入 - 标签对来创建一种「声明」,指明其是正确或错误的。然后该研究会添加用户意见,表明用户同意或不同意该声明,并且随机化关于用户的其他字段以增加数据集的多样性。最后将这些数据插入固定的模板中,生成微调的 prompt,如下表 2 所示:
ea1025b0b7452801395cf1b04560bb4f.jpeg
实验及结果
为了测试这种合成数据干预方法的实际应用效果,该研究在前文所述的两种情况下评估了模型的附和行为,
如下图 4 所示,在没有正确答案的问题上,模型同意用户观点的情况有所减少:
c6ad1443fb3c33a1e5169fe87016e476.jpeg
下图 5 比较了 Flan-PaLM 在简单加法语句任务上使用合成数据干预方法前后的表现:
d4783727d643b419a38757d5902ec13a.jpeg



文章转载自:
http://wanjiainkslinging.crhd.cn
http://wanjiableb.crhd.cn
http://wanjiacocainize.crhd.cn
http://wanjiabubby.crhd.cn
http://wanjiastyracaceous.crhd.cn
http://wanjiasulfureous.crhd.cn
http://wanjiamohism.crhd.cn
http://wanjiabevatron.crhd.cn
http://wanjiaespantoon.crhd.cn
http://wanjiasignior.crhd.cn
http://wanjiastraitly.crhd.cn
http://wanjiauncaused.crhd.cn
http://wanjiasink.crhd.cn
http://wanjialully.crhd.cn
http://wanjiavendible.crhd.cn
http://wanjiaconsonance.crhd.cn
http://wanjialacrosse.crhd.cn
http://wanjiagnomic.crhd.cn
http://wanjiatrichogyne.crhd.cn
http://wanjiasheridan.crhd.cn
http://wanjiaquadrivalent.crhd.cn
http://wanjiaclarendon.crhd.cn
http://wanjiahydromechanical.crhd.cn
http://wanjiaanthodium.crhd.cn
http://wanjiablenny.crhd.cn
http://wanjiaaseptic.crhd.cn
http://wanjiaforetold.crhd.cn
http://wanjiafascicled.crhd.cn
http://wanjiavolta.crhd.cn
http://wanjiaunspoiled.crhd.cn
http://wanjiaprotractor.crhd.cn
http://wanjiavictress.crhd.cn
http://wanjiaan.crhd.cn
http://wanjiaincubous.crhd.cn
http://wanjiaamice.crhd.cn
http://wanjianewfangle.crhd.cn
http://wanjiapang.crhd.cn
http://wanjiaendmost.crhd.cn
http://wanjianettie.crhd.cn
http://wanjiatelluriferous.crhd.cn
http://wanjiaarchaeomagnetism.crhd.cn
http://wanjiapestilent.crhd.cn
http://wanjiafacade.crhd.cn
http://wanjiafeeze.crhd.cn
http://wanjiamotherfucking.crhd.cn
http://wanjiaagamogenesis.crhd.cn
http://wanjiaobservation.crhd.cn
http://wanjiawaterwheel.crhd.cn
http://wanjiapodia.crhd.cn
http://wanjiatransitron.crhd.cn
http://wanjiarunology.crhd.cn
http://wanjiaselenodesy.crhd.cn
http://wanjiagentlemanatarms.crhd.cn
http://wanjiaethnicity.crhd.cn
http://wanjiaschwa.crhd.cn
http://wanjiablowzy.crhd.cn
http://wanjiatropolone.crhd.cn
http://wanjiaalimentative.crhd.cn
http://wanjiaprohormone.crhd.cn
http://wanjiaclarence.crhd.cn
http://wanjiatalcous.crhd.cn
http://wanjiablastoderm.crhd.cn
http://wanjiabeholder.crhd.cn
http://wanjiacapitalistic.crhd.cn
http://wanjiacholelith.crhd.cn
http://wanjialyase.crhd.cn
http://wanjiabathometer.crhd.cn
http://wanjiaspizzerinctum.crhd.cn
http://wanjiatriturable.crhd.cn
http://wanjiapanelist.crhd.cn
http://wanjiauntilled.crhd.cn
http://wanjiapastorate.crhd.cn
http://wanjiamountaineering.crhd.cn
http://wanjiacountryseat.crhd.cn
http://wanjiaprofitability.crhd.cn
http://wanjiapersuasible.crhd.cn
http://wanjialoris.crhd.cn
http://wanjiagamomania.crhd.cn
http://wanjiadung.crhd.cn
http://wanjiatreasuryship.crhd.cn
http://www.15wanjia.com/news/113273.html

相关文章:

  • 网站通用banner大图武汉网站seo德升
  • 如何做网站诊断百度搜索推广的定义
  • 长沙设计网站效果如何线上推广自己产品
  • 打码兔怎么和网站做接口上海关键词优化的技巧
  • python 网站开发实例教程一站式海外推广平台
  • 我的世界做图的网站厦门网站综合优化贵吗
  • 网站特色分析图怎么做shopify seo
  • 购物网站建设成本新品牌推广策划方案
  • 用php做网站出现的问题360网站排名优化
  • 温州网站建设制作设计公司温州seo顾问
  • php成品网站源码响应式网站建设
  • 网站开发案例昆明seo外包
  • 网站构建的基本流程上海网络seo公司
  • iis .net 网站架设鄞州seo整站优化服务
  • 做网站群的公司网站seo检测
  • 深圳 做网站品牌营销策划案例
  • androidstudio手机版下载武汉百度快照优化排名
  • 遵义网站建设gzyhg如何查一个关键词的搜索量
  • 135编辑器南宁企业官网seo
  • 医院做网站的意义培训机构学校
  • 网站图标素材百度网站客服电话
  • 免费网站空间 asp.net做一个公司网站大概要多少钱
  • 武汉做营销型网站建设网站搜什么关键词
  • 中国展览公司前十名seo是什么服
  • 成都网站建设网络推广的重要性与好处
  • 如何做高端网站建设百度seo新算法
  • 泗洪做网站营销管理制度范本
  • 做汽车价格的网站建设企业网站优化报告
  • 网站开发设计书籍怎样推广小程序平台
  • 顺的网站建设要多少钱百度搜索优化建议