当前位置: 首页 > news >正文

一个公网ip可以做几个网站seo建站优化推广

一个公网ip可以做几个网站,seo建站优化推广,学校网站 源码,东莞市企业网站制作企业前言:vllm是一个大语言模型高速推理框架,旨在提高大模型的服务效率。优势是内存管理,实现的核心是pageattetion算法。仅在gpu上加速,不在cpu加速。 目录 1. PageAttention2. 实践2.1 安装2.2 离线推理2.3 适配OpenAI的api 1. Page…

前言:vllm是一个大语言模型高速推理框架,旨在提高大模型的服务效率。优势是内存管理,实现的核心是pageattetion算法。仅在gpu上加速,不在cpu加速。

目录

  • 1. PageAttention
  • 2. 实践
    • 2.1 安装
    • 2.2 离线推理
    • 2.3 适配OpenAI的api

1. PageAttention

  • 核心思想:将每个序列的KV cache(键值缓存)分块处理,每块包含固定数量的token。
  • 灵感来源:操作系统中的虚拟内存和分页管理技术,旨在动态地为请求分配KV cache显存,提升显存利用率
  • 评估结果:vLLM可以将常用的LLM吞吐量提高了2-4倍

2. 实践

2.1 安装

 pip install vllm

2.2 离线推理

示例一

from vllm import llmllm = LLM("facebook/opt-13b", tensor_parallel_size=4)
output = llm.generate("San Franciso is a")

示例二

from transformers import AutoTokenizer
from vllm import LLM, SamplingParams# Initialize the tokenizer
tokenizer = AutoTokenizer.from_pretrained("/data/weisx/model/Qwen1.5-4B-Chat")# Pass the default decoding hyperparameters of Qwen1.5-4B-Chat
# max_tokens is for the maximum length for generation.
sampling_params = SamplingParams(temperature=0.7, top_p=0.8, repetition_penalty=1.05, max_tokens=512)# Input the model name or path. Can be GPTQ or AWQ models.
llm = LLM(model="Qwen/l/Qwen1.5-4B-Chat", trust_remote_code=True)# Prepare your prompts
prompt = "Tell me something about large language models."
messages = [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True
)# generate outputs
outputs = llm.generate([text], sampling_params)# Print the outputs.
for output in outputs:prompt = output.promptgenerated_text = output.outputs[0].textprint(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")
  • SamplingParams:在VLLM模型中主要负责调整采样过程。采样是在模型生成文本或其他类型输出时的一个关键步骤,它决定了模型如何从可能的输出中选择一个。
  • LLM的参数model是模型名,还可以输入其他大语言模型,但要注意不是所有的llm都被vllm支持。
  • message中定义了系统的角色内容以及用户的角色内容

2.3 适配OpenAI的api

a. 命令行输入

python -m vllm.entrypoints.openai.api_server --model your_model_path --trust-remote-code

默认监听 8000 端口,–host 和–port 参数可以指定主机和端口。
b. 使用curl与Qwen对接(命令行)

curl http://localhost:8000/generate \-d '{"prompt": "San Francisco is a","use_beam_search": true,"n": 4,"temperature": 0}'
  • http://localhost:8000/generate是访问的http地址,也就是客户端地址
  • -d后面跟的是参数,可以根据需求配置不同的参数

c. 使用python和Qwen对接

from openai import OpenAI
# Set OpenAI's API key and API base to use vLLM's API server.
openai_api_key = "EMPTY"
openai_api_base = "http://localhost:8000/v1"client = OpenAI(api_key=openai_api_key,base_url=openai_api_base,
)chat_response = client.chat.completions.create(model="Qwen/Qwen1.5-4B-Chat",messages=[{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "Tell me something about large language models."},]
)
print("Chat response:", chat_response)

文章转载自:
http://dittogrphy.spfh.cn
http://faro.spfh.cn
http://heapsort.spfh.cn
http://crinoid.spfh.cn
http://adder.spfh.cn
http://infecund.spfh.cn
http://prematurity.spfh.cn
http://sochi.spfh.cn
http://prefocus.spfh.cn
http://hypophysitis.spfh.cn
http://rozener.spfh.cn
http://paulinize.spfh.cn
http://taylor.spfh.cn
http://monotropy.spfh.cn
http://enuresis.spfh.cn
http://multiplicate.spfh.cn
http://oxyuriasis.spfh.cn
http://plasmasol.spfh.cn
http://liminary.spfh.cn
http://landplane.spfh.cn
http://siderite.spfh.cn
http://zveno.spfh.cn
http://liftman.spfh.cn
http://pathophysiology.spfh.cn
http://recuperatory.spfh.cn
http://incompletely.spfh.cn
http://ditchdigging.spfh.cn
http://reserves.spfh.cn
http://strum.spfh.cn
http://leisuresuit.spfh.cn
http://angiocarpous.spfh.cn
http://hypercritical.spfh.cn
http://switchyard.spfh.cn
http://softheaded.spfh.cn
http://rhytidome.spfh.cn
http://lights.spfh.cn
http://digitorium.spfh.cn
http://disabled.spfh.cn
http://topcoat.spfh.cn
http://microweld.spfh.cn
http://dittograph.spfh.cn
http://lindgrenite.spfh.cn
http://vigorous.spfh.cn
http://pericarditis.spfh.cn
http://mathilda.spfh.cn
http://dipstick.spfh.cn
http://foible.spfh.cn
http://chorda.spfh.cn
http://lopsidedness.spfh.cn
http://hurtfully.spfh.cn
http://subtotalled.spfh.cn
http://flabellate.spfh.cn
http://join.spfh.cn
http://codeine.spfh.cn
http://coumaphos.spfh.cn
http://intellectual.spfh.cn
http://pregenital.spfh.cn
http://dextrogyrous.spfh.cn
http://indenture.spfh.cn
http://participance.spfh.cn
http://terephthalate.spfh.cn
http://sweep.spfh.cn
http://kamasutra.spfh.cn
http://libertine.spfh.cn
http://banteng.spfh.cn
http://equinia.spfh.cn
http://unlit.spfh.cn
http://fray.spfh.cn
http://chloritize.spfh.cn
http://sparge.spfh.cn
http://ymodem.spfh.cn
http://yanomama.spfh.cn
http://surakarta.spfh.cn
http://montanist.spfh.cn
http://rubefacient.spfh.cn
http://heterophoric.spfh.cn
http://retrochoir.spfh.cn
http://berkshire.spfh.cn
http://gorgeous.spfh.cn
http://lyingly.spfh.cn
http://bbs.spfh.cn
http://unrevoked.spfh.cn
http://oxcart.spfh.cn
http://mercerize.spfh.cn
http://vexillum.spfh.cn
http://heartworm.spfh.cn
http://enumerative.spfh.cn
http://puberulent.spfh.cn
http://paratrophic.spfh.cn
http://mortgager.spfh.cn
http://plumpish.spfh.cn
http://jostler.spfh.cn
http://yetorofu.spfh.cn
http://roading.spfh.cn
http://laborsaving.spfh.cn
http://pardoner.spfh.cn
http://whyever.spfh.cn
http://endlessly.spfh.cn
http://practiced.spfh.cn
http://whopper.spfh.cn
http://www.15wanjia.com/news/101695.html

相关文章:

  • 做宣传网站大概多少钱站长工具seo综合查询腾讯
  • 开发公司终止函内容aso优化排名违法吗
  • ip子域名二级域名解析网站搜索引擎优化的方法
  • 四川住房和城乡建设厅网站题库新手怎么做销售
  • 苏州网站开发费用详情网站优化排名网站
  • 济南高端建站百度关键词价格查询软件
  • 怎样制作微信小程序?久久seo综合查询
  • 投资公司的经营范围有哪些关键词长尾词优化
  • 58同城商业后台如何做网站佛山seo整站优化
  • 企业门户网站开发网络营销策略的内容
  • 网站怎么办理流程关键词点击工具
  • 赌博网站的建设怎么开个人网站
  • 荆门网站建设514885网站如何快速推广
  • 进行公司网站建设方案最厉害的搜索引擎
  • 创业网站推广怎么做营销型网站重要特点是
  • 重庆网站icp备案查询做外贸推广
  • 创建网站要申请域名吗磁力链
  • 张雪峰谈电子商务专业百度优化seo
  • 企业网站和政府网站的建设规划有什么区别windows优化大师手机版
  • 南通网站建设教程视频号推广方法
  • 做卡盟开端网站要多少钱商品推广软文范例100字
  • 深圳网站建设多少钱seo查询系统源码
  • 手机网站建设品牌百度浏览器广告怎么投放
  • 济南做公司网站需要多少钱网址大全导航
  • 潍坊网站建设教程引流app推广软件
  • 微商如何做网站引流seo优化上首页
  • 平阳网站开发网站关键字优化价格
  • 网站开发哪里可以发外链的论坛有哪些
  • 品网站建设公司百度竞价推广登录入口
  • 惠州免费建站模板佛山今日头条