当前位置: 首页 > news >正文

深圳网站多少钱一年青岛专业网站制作

深圳网站多少钱一年,青岛专业网站制作,wordpress 雄欲圣殿,自己搭建wordpress图床系列文章目录 玩转大语言模型——使用langchain和Ollama本地部署大语言模型 玩转大语言模型——三分钟教你用langchain提示词工程获得猫娘女友 玩转大语言模型——ollama导入huggingface下载的模型 玩转大语言模型——langchain调用ollama视觉多模态语言模型 玩转大语言模型—…

系列文章目录

玩转大语言模型——使用langchain和Ollama本地部署大语言模型
玩转大语言模型——三分钟教你用langchain+提示词工程获得猫娘女友
玩转大语言模型——ollama导入huggingface下载的模型
玩转大语言模型——langchain调用ollama视觉多模态语言模型
玩转大语言模型——使用GraphRAG+Ollama构建知识图谱
玩转大语言模型——完美解决GraphRAG构建的知识图谱全为英文的问题
玩转大语言模型——配置图数据库Neo4j(含apoc插件)并导入GraphRAG生成的知识图谱
玩转大语言模型——本地部署带聊天界面deepseek R1的小白教程
玩转大语言模型——本地部署deepseek R1和本地数据库的小白教程(Ollama+AnythingLLM)
玩转大语言模型——使用Kiln AI可视化环境进行大语言模型微调数据合成


文章目录

  • 系列文章目录
  • 前言
  • 下载安装
    • 下载
    • 安装
  • 模型支持
  • 初次使用
  • 合成数据
    • 生成单条数据
    • 批量生成数据
  • 导出数据/微调


前言

Kiln AI是一个强大的工具,主要用于微调大型语言模型(LLM)、生成合成数据以及协作数据集。Kiln AI提供了一整套无需编程、可视化操作的解决方案,帮助用户从零开始构建微调后的模型。用户可以通过Kiln UI创建任务,明确需求、初始提示和输入输出结构,然后选择合适的模型并配置参数,即可发起微调任务。Kiln支持多种主流模型,如OpenAI的GPT-4o系列、Meta的Llama 3.1与Llama 3.2以及Mistral的Mixtral等。众所周知人为去制作标签代价很大,对于学习微调或者仅作微调测试,Kiln是一个非常合适的应用,可以帮助我们通过大语言模型合成微调数据,辅助我们对模型进行微调,还可以导出生成的数据,以供其他训练和微调方式使用。

下载安装

下载

前往官网下载kiln
地址:https://docs.getkiln.ai/docs/quickstart
在这里插入图片描述
点击下载后会自动跳转到GitHub地址,选择适合自己系统的版本即可。
在这里插入图片描述

安装

下载后,安装应用程序:

  • macOS:打开 .dmg 文件,然后将应用程序拖到 Applications 目录。
  • Windows:双击安装程序,然后按照指南进行安装。
  • Linux:保存应用程序并从终端启动它。
    在这里插入图片描述

模型支持

Kiln 基本上可以使用来自许多提供商的任何 LLM 模型:

  • 使用 Ollama 在本地运行。
  • 连接 OpenAI、Groq、OpenRouter、AWS、Fireworks 等云提供商。您提供自己的 API 密钥,我们永远无法访问您的数据集。
  • 连接到任何 OpenAI 兼容服务器,例如用于 vLLM 的 LiteLLM。

初次使用

首次使用需要进行一些设置,到以下设置界面点Skip
在这里插入图片描述
到这一界面后不需要提交邮箱,直接Continue
在这里插入图片描述
然后我们选择Ollama,Ollama的使用我们已经在前面的文章中配置过很多次了,不再赘述,可以翻翻前面的文章。选好后拉到下面点continue
在这里插入图片描述
首次进入时需要新建一个项目,我这里就随便输了。
在这里插入图片描述
为了更方便的演示,创建的任务我是直接用他生成的例子(点右上角的Try an example)。
在这里插入图片描述
读者可以通过给出的提示参考改成自己需要的数据类型,然后点Create Task创建任务。
在这里插入图片描述
随后进入以下界面。
在这里插入图片描述

合成数据

生成单条数据

在当前界面,选择模型后输入相关信息后执行。
在这里插入图片描述
运行结果如下:
在这里插入图片描述
右侧可以为生成的数据评分,并且可以直接判断他是否通过。
在这里插入图片描述
如果评分低还可以对模型的输出设定要求。
在这里插入图片描述
当输出达到满意的时候,保存退出后,点Dataset可以看到刚才生成的数据。
在这里插入图片描述

批量生成数据

点击左侧Synthetic Data然后点击Add Top Level Topics

在这里插入图片描述

点击之后选择合适的模型直接点generate即可,这里推荐的是deepseek蒸馏的qwen14b
在这里插入图片描述
稍等一会就会生成若干topics,也可以点击Add subtopics新建子主题,在生成子主题时也要选用好一点的模型,经过笔者测试使用qwen2.5:14b可以保证正常生成。
在这里插入图片描述
点击Add data,可以直接生成合成数据,亲测使用deepseek R1:14b即可。
在这里插入图片描述
生成后的结果如下:
在这里插入图片描述
全部生成后点击Save All保存数据。
在这里插入图片描述
这一过程也需要使用模型生成,笔者还是选用的deepseek R1:14b
在这里插入图片描述
出现进度条是正常的,不用管他,等一会就好了。
在这里插入图片描述
随后我们返回Dataset可以看到生成的数据全都添加上了。
在这里插入图片描述

导出数据/微调

点击左侧Fine Tune,然后点击Create Fine-Tune
在这里插入图片描述
由于我没有使用API Key,所以我这里并不能直接微调,所以在此笔者选的是下面的Download版本,读者可以根据下面的提示选择合适的数据格式。
在这里插入图片描述
然后选择New Dataset
在这里插入图片描述
然后选择过滤方式,可以通过此设置过滤掉低质量的数据,但为了节约时间,笔者用到的是不进行过滤。
在这里插入图片描述
然后选择数据划分,同样的也需要读者根据自己需求选择数据划分。
在这里插入图片描述
在这里插入图片描述
随后下载创建好的数据集
在这里插入图片描述
下载后可以使用Axolotl或Unsloth进行微调

在这里插入图片描述

http://www.15wanjia.com/news/23069.html

相关文章:

  • wordpress图片无法居中显示优化网站搜索排名
  • 数据库查询网站模板seo网站页面优化包含
  • 台州网站制作开发百度大全
  • 昆明企业网站开发百度指数的数据来源
  • 网站数据包如何做架构吸引人的软文标题例子
  • 突发武汉再传大消息学seo推广
  • 在线购物网站开发郑州发布最新通告
  • 宿迁做网站 宿迁网站建设营销网络图
  • 网站二维码怎么做的网站推广计划书
  • 网站建设制度人工智能培训班收费标准
  • 企业网站建设收费标准注册公司流程和费用
  • 邯郸国外网站建设费用磁力猫最佳搜索引擎入口
  • 政务网站优化最新国际新闻50条简短
  • 做一个中英文网站的价格天津关键词优化平台
  • 公众号怎么建网站广告
  • 怎么说服企业做网站优质网站
  • 怎么做网站内的搜索百度推广有效果吗
  • 山东东营建设网官方网站今日头条国际新闻
  • 坂田的做网站公司昆明seo关键词
  • 有什么有趣的网站emlog友情链接代码
  • 贵州建设厅网站官网网站推广服务报价表
  • 香港做批发的网站有哪些河南网站建设制作
  • 徐州做汽车销售的公司网站网络营销策略的特点
  • 网站迁移建设方案营销推广的特点
  • b2c网站管理情感网站seo
  • 怎么让百度搜索到自己的网站在线域名解析ip地址
  • 哪些网站可以做问卷调查赚钱灰色行业关键词优化
  • 网站导航做多大重庆镇海seo整站优化价格
  • 做ppt的网站兼职网页制作教程
  • 工信部isp申请网站杭州网站建设书生商友