news 2026/6/10 2:47:00

【vLLM 学习】Reproduciblity

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【vLLM 学习】Reproduciblity

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。

更多 vLLM 中文文档及教程可访问 →vllm.hyper.ai/

*在线运行 vLLM 入门教程:零基础分步指南

源码 examples/offline_inference/reproduciblity.py

# SPDX-License-Identifier: Apache-2.0importos from vllmimportLLM, SamplingParams# 为了性能考虑,vllm 不能保证结果的默认情况下可重复性,# 您需要做以下事情才能实现# 可复现结果:# 1.关闭多处理以使计划确定性。# Note (Woosuk) :这是不需要的,对于 V0而言,这将被忽略。os.environ["VLLM_ENABLE_V1_MULTIPROCESSING"]="0"# 2.修复五十年据种子以获得可重复性。默认种子为 None,不可复现。SEED=42# Note (Woosuk) :即使使用上述两个设置,vLLM 也仅提供# 当它在相同的硬件和相同的 vLLM 版本上运行时,它的可重复性。# 此外,在线服务 API ( "vLLM 服务") 不支持可重复性# 因为几乎不可能在在线服务设置。llm=LLM(model="facebook/opt-125m",seed=SEED)prompts=["Hello, my name is","The president of the United States is","The capital of France is","The future of AI is",]sampling_params=SamplingParams(temperature=0.8,top_p=0.95)outputs=llm.generate(prompts, sampling_params)foroutputinoutputs: prompt=output.prompt generated_text=output.outputs[0].text print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 11:25:32

基于Miniconda-Python3.9部署Llama、ChatGLM等大模型推理环境

基于 Miniconda-Python3.9 部署 Llama、ChatGLM 等大模型推理环境 在当前 AI 技术飞速演进的背景下,大型语言模型(LLMs)如 Llama、ChatGLM 已从研究实验室走向实际应用。无论是科研复现、产品原型开发,还是企业级服务部署&#xf…

作者头像 李华
网站建设 2026/6/9 23:10:54

Miniconda-Python3.9环境下实现PyTorch服务熔断与降级

Miniconda-Python3.9环境下实现PyTorch服务熔断与降级 在现代AI系统中,模型推理服务早已不再是“训练完模型、部署API”这么简单。随着线上请求量的激增和系统复杂度的提升,一个看似稳定的PyTorch服务可能因为一次GPU内存溢出、一次网络抖动或某个依赖组…

作者头像 李华
网站建设 2026/6/10 11:23:01

PyTorch DataLoader性能瓶颈排查:从Miniconda环境入手

PyTorch DataLoader性能瓶颈排查:从Miniconda环境入手 在深度学习训练过程中,你是否曾遇到这样的场景?GPU 利用率长期徘徊在 20% 以下,而 CPU 却满载运行、磁盘 I/O 持续飙高——明明模型不复杂,训练速度却始终上不去。…

作者头像 李华
网站建设 2026/6/10 11:58:29

sourcefare速成手册(2) - 使用Git方式克隆代码代码扫描

sourcefare是一款开源免费的代码扫描工具,支持免费私有化部署,一键安装、零配置,包含安全漏洞、编码缺陷和合规性问题扫描,页面操作简洁明了,本文将介绍如何创建项目,使用服务端Git方式获取代码进行代码扫描…

作者头像 李华
网站建设 2026/6/10 11:58:36

从LangGraph到PydanticAI:AI Agent开发框架全方位解析与选择指南!

AI Agent开发框架的涌现‌,让开发者在框架选择上陷入困惑。 本文通过翻译整理项目文档,梳理了当前主流的AI Agent开发框架:LangGraph、AutoGen、CrewAI、OpenAI Agents SDK、Google Agent Development Kit (ADK)、MetaGPT和PydanticAI。 研…

作者头像 李华