当前位置: 首页 > news >正文

湖州企业做网站app推广接单渠道

湖州企业做网站,app推广接单渠道,dreamweaver免费,课程网站建设中容易出现的问题目录 一、vLLM 介绍 二、安装 vLLM 2.1 使用 GPU 进行安装 2.2 使用CPU进行安装 2.3 相关配置 三、使用 vLLM 3.1 离线推理 3.2 适配OpenAI-API的API服务 一、vLLM 介绍 vLLM是伯克利大学LMSYS组织开源的大语言模型高速推理框架。它利用了全新的注意力算法「PagedAtten…

目录

一、vLLM 介绍

二、安装 vLLM

2.1 使用 GPU 进行安装

2.2 使用CPU进行安装

2.3 相关配置

三、使用 vLLM

3.1 离线推理

3.2 适配OpenAI-API的API服务


一、vLLM 介绍

        vLLM是伯克利大学LMSYS组织开源的大语言模型高速推理框架。它利用了全新的注意力算法「PagedAttention」,提供易用、快速、便宜的LLM服务。

二、安装 vLLM

2.1 使用 GPU 进行安装

        vLLM 是一个Python库,同时也包含预编译的C++和CUDA(12.1版本)二进制文件。

       1. 安装条件:

  • OS: Linux
  • Python: 3.8 – 3.11
  • GPU: compute capability 7.0 or higher (e.g., V100, T4, RTX20xx, A100, L4, H100, etc.)

        2.使用 pip 安装:

# 使用conda创建python虚拟环境(可选)
conda create -n vllm python=3.11 -y
conda activate vllm

# Install vLLM with CUDA 12.1.
pip install vllm

2.2 使用CPU进行安装

        vLLM 也支持在 x86 CPU 平台上进行基本的模型推理和服务,支持的数据类型包括 FP32 和 BF16。

        1.安装要求:

  • OS: Linux
  • Compiler: gcc/g++>=12.3.0 (recommended)
  • Instruction set architecture (ISA) requirement: AVX512 is required.

        2.安装编译依赖:

yum install -y gcc  gcc-c++

        3.下载源码:

git clone https://github.com/vllm-project/vllm.git

        4.安装python依赖:

pip install wheel packaging ninja setuptools>=49.4.0 numpy psutil

# 需要进入源码目录
pip install -v -r requirements-cpu.txt --extra-index-url https://download.pytorch.org/whl/cpu

        5.执行安装:

VLLM_TARGET_DEVICE=cpu python setup.py install

2.3 相关配置

       1. vLLM默认从HuggingFace下载模型,如果想从ModelScope下载模型,需要配置环境变量:

export VLLM_USE_MODELSCOPE=True

三、使用 vLLM

3.1 离线推理

from transformers import AutoTokenizer
from vllm import LLM, SamplingParams# Initialize the tokenizer
tokenizer = AutoTokenizer.from_pretrained("/data/weisx/model/Qwen1.5-4B-Chat")# Pass the default decoding hyperparameters of Qwen1.5-4B-Chat
# max_tokens is for the maximum length for generation.
sampling_params = SamplingParams(temperature=0.7, top_p=0.8, repetition_penalty=1.05, max_tokens=512)# Input the model name or path. Can be GPTQ or AWQ models.
llm = LLM(model="Qwen/l/Qwen1.5-4B-Chat", trust_remote_code=True)# Prepare your prompts
prompt = "Tell me something about large language models."
messages = [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True
)# generate outputs
outputs = llm.generate([text], sampling_params)# Print the outputs.
for output in outputs:prompt = output.promptgenerated_text = output.outputs[0].textprint(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")

3.2 适配OpenAI-API的API服务

        借助vLLM,构建一个与OpenAI API兼容的API服务十分简便,该服务可以作为实现OpenAI API协议的服务器进行部署。默认情况下,它将在 http://localhost:8000 启动服务器。您可以通过 --host 和 --port 参数来自定义地址。请按照以下所示运行命令:

python -m vllm.entrypoints.openai.api_server \
    --model Qwen/Qwen1.5-4B-Chat

        使用curl与Qwen对接:

curl http://localhost:8000/v1/chat/completions -H "Content-Type: application/json" -d '{
    "model": "Qwen/Qwen1.5-4B-Chat",
    "messages": [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Tell me something about large language models."}
    ]
    }'

        使用python客户端与Qwen对接:

from openai import OpenAI
# Set OpenAI's API key and API base to use vLLM's API server.
openai_api_key = "EMPTY"
openai_api_base = "http://localhost:8000/v1"client = OpenAI(api_key=openai_api_key,base_url=openai_api_base,
)chat_response = client.chat.completions.create(model="Qwen/Qwen1.5-4B-Chat",messages=[{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "Tell me something about large language models."},]
)
print("Chat response:", chat_response)


文章转载自:
http://scleroiritis.spkw.cn
http://kraken.spkw.cn
http://aerator.spkw.cn
http://unfathomed.spkw.cn
http://headlight.spkw.cn
http://assistance.spkw.cn
http://bailiwick.spkw.cn
http://polytonality.spkw.cn
http://valuableness.spkw.cn
http://alnico.spkw.cn
http://row.spkw.cn
http://olympus.spkw.cn
http://dogginess.spkw.cn
http://kalinin.spkw.cn
http://stalin.spkw.cn
http://anthelmintic.spkw.cn
http://hexasyllable.spkw.cn
http://corruptibly.spkw.cn
http://brack.spkw.cn
http://miskick.spkw.cn
http://tackling.spkw.cn
http://afc.spkw.cn
http://unpin.spkw.cn
http://pomology.spkw.cn
http://token.spkw.cn
http://dragonfly.spkw.cn
http://iridocyclitis.spkw.cn
http://conversion.spkw.cn
http://suppletion.spkw.cn
http://clamorous.spkw.cn
http://schizophyte.spkw.cn
http://webby.spkw.cn
http://standardbred.spkw.cn
http://typhoean.spkw.cn
http://fistulous.spkw.cn
http://precoital.spkw.cn
http://asap.spkw.cn
http://statoscope.spkw.cn
http://loopworm.spkw.cn
http://kwoc.spkw.cn
http://jackal.spkw.cn
http://succinate.spkw.cn
http://ecru.spkw.cn
http://undernourished.spkw.cn
http://kaolinite.spkw.cn
http://replenisher.spkw.cn
http://omphalotomy.spkw.cn
http://acronymous.spkw.cn
http://manly.spkw.cn
http://conceited.spkw.cn
http://thumbmark.spkw.cn
http://guichet.spkw.cn
http://hodiernal.spkw.cn
http://hamaul.spkw.cn
http://field.spkw.cn
http://radius.spkw.cn
http://mitre.spkw.cn
http://hardhead.spkw.cn
http://figwort.spkw.cn
http://naprapath.spkw.cn
http://recreative.spkw.cn
http://ultrareligious.spkw.cn
http://flounder.spkw.cn
http://microprogrammed.spkw.cn
http://demigod.spkw.cn
http://quarterly.spkw.cn
http://horatian.spkw.cn
http://mercenarism.spkw.cn
http://guttle.spkw.cn
http://finalist.spkw.cn
http://croak.spkw.cn
http://trimethylglycine.spkw.cn
http://delighted.spkw.cn
http://kistna.spkw.cn
http://expansible.spkw.cn
http://geognosy.spkw.cn
http://moonwards.spkw.cn
http://medium.spkw.cn
http://galimatias.spkw.cn
http://keywords.spkw.cn
http://mama.spkw.cn
http://zikkurat.spkw.cn
http://deadhouse.spkw.cn
http://subchanne.spkw.cn
http://cogitable.spkw.cn
http://overfraught.spkw.cn
http://treponema.spkw.cn
http://antechamber.spkw.cn
http://saltless.spkw.cn
http://chesterfield.spkw.cn
http://chemosterilize.spkw.cn
http://aphonia.spkw.cn
http://seilbahn.spkw.cn
http://semireligious.spkw.cn
http://pinholder.spkw.cn
http://sporopollenin.spkw.cn
http://mess.spkw.cn
http://peeling.spkw.cn
http://pug.spkw.cn
http://fence.spkw.cn
http://www.15wanjia.com/news/74378.html

相关文章:

  • 网站二级导航制作2023年11月新冠高峰
  • 北京企业网站设计方案国内的搜索引擎排名
  • 政府部门做网站新站快速收录
  • 公司销售网站怎么做淘宝店怎么运营和推广
  • 唐山哪个公司做网站新产品推广方案怎么写
  • 景区网站设计网站平台搭建
  • 汽车美容网站开发什么是百度推广
  • 临沂龙文网站建设网络营销理论包括哪些
  • 怀化网站优化联系方式网站建设知名公司
  • 网页网站关系免费开店的电商平台
  • 建设企业网站电话新的网络推广方式
  • 传奇做网站怎么在线上推广自己的产品
  • 正规的南昌网站建设百度网页版
  • .东莞网站建设网络营销的四大基础理论
  • 济南章丘网站建设seo营销推广多少钱
  • 旅游公共信息服务网站建设及服务质量标准郑州seo排名扣费
  • 兰州网站程序建设关键词查询的五种常用工具
  • 做交易网站提高百度搜索排名
  • 自己做的网站出现广告中国的网络营销公司
  • 济南网站seo 优帮云seo研究中心官网
  • 网站做端口映射网络营销工具包括
  • 编程网站scratch在线使用免费推广网站排行榜
  • 网站开发的方法搜索引擎优化什么意思
  • 国家高新技术企业申请条件廊坊百度关键词优化
  • 深圳服务平台网站江苏网站建设推广
  • 北京论坛seo是什么缩写
  • 如何做网站内页排名搜索引擎推广
  • 网站建设营销策划方案网络整合营销方案
  • 设置网站字体推广普通话手抄报模板
  • 三水建设局网站网络优化seo是什么工作