news 2026/6/10 12:48:22

MiniCPM4-0.5B-QAT-Int4-GPTQ-format 小显存llm

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MiniCPM4-0.5B-QAT-Int4-GPTQ-format 小显存llm

MiniCPM4-0.5B-QAT-Int4-GPTQ-format · 模型库

from modelscope import AutoTokenizer from vllm import LLM, SamplingParams model_name = "OpenBMB/MiniCPM4-0.5B-QAT-Int4-GPTQ-format" prompt = [{"role": "user", "content": "推荐5个北京的景点。"}] tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True) input_text = tokenizer.apply_chat_template(prompt, tokenize=False, add_generation_prompt=True) llm = LLM( model=model_name, quantization="gptq_marlin", trust_remote_code=True, max_num_batched_tokens=32768, dtype="bfloat16", gpu_memory_utilization=0.8, ) sampling_params = SamplingParams(top_p=0.7, temperature=0.7, max_tokens=1024, repetition_penalty=1.02) outputs = llm.generate(prompts=input_text, sampling_params=sampling_params) print(outputs[0].outputs[0].text)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/4 23:55:35

基于51单片机的智能药盒 定时吃药远程GSM短信 嵌入式开发

目录 51单片机智能药盒概述硬件组成软件设计要点功能实现流程应用场景与扩展 源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式! 51单片机智能药盒概述 基于51单片机的智能药盒是一种结合定时提醒、远程监控功能的嵌入式系统,…

作者头像 李华
网站建设 2026/5/27 17:35:51

http请求完整的tcpdump抓包解读

这个过程包括 TCP 三次握手、HTTP 请求/响应 和 TCP 四次挥手。 我们使用以下命令来捕获与 httpbin.org 网站进行的一次简单 HTTP 交互: sudo tcpdump -i any -n -s0 host httpbin.org 然后,在另一个终端使用 curl 发送一个请求: curl ht…

作者头像 李华
网站建设 2026/6/8 22:47:58

AI Agent开发实践:关键步骤和最佳实践

AI Agent开发实践:关键步骤和最佳实践 关键词:AI Agent、开发实践、关键步骤、最佳实践、人工智能 摘要:本文围绕AI Agent开发实践展开,深入探讨其关键步骤和最佳实践。首先介绍了AI Agent开发的背景,包括目的、预期读者、文档结构和相关术语。接着阐述了AI Agent的核心概…

作者头像 李华
网站建设 2026/6/10 8:02:27

信奥赛C++提高组csp-s之倍增算法思想及应用案例(3)

信奥赛C提高组csp-s之倍增算法思想及应用案例(3) 题目描述 小 A 的工作不仅繁琐,更有苛刻的规定,要求小 A 每天早上在 6:006:006:00 之前到达公司,否则这个月工资清零。可是小 A 偏偏又有赖床的坏毛病。于是为了保住自己的工资,小…

作者头像 李华
网站建设 2026/6/10 2:59:55

【递归算法】快速幂解决 pow(x,n)

题目链接:pow(x,n) 一、题目解析 题目很简单,要求x的n次幂。 要注意n的取值范围:n可能是负数,这时候我们要利用数学中 x⁻ⁿ 1 / xⁿ 来转换;n可能是 -2,若转换成正数则会超过 int 类型的最大取值 2-1。…

作者头像 李华
网站建设 2026/6/9 15:24:35

基于51单片机的智能水表检测水流量计流量报警器 水表 嵌入式diy

目录 硬件组成软件设计功能扩展注意事项参考方案 源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式! 硬件组成 51单片机(如STC89C52)作为核心控制器,搭配霍尔传感器或涡轮流量计检测水流速,…

作者头像 李华