news 2026/4/18 7:27:39

读取本地图像数据传递给多模态大模型进行处理并返回结果

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
读取本地图像数据传递给多模态大模型进行处理并返回结果

读取本地图像数据传递给多模态大模型进行处理并返回结果

读取本地图像数据传递给多模态大模型进行处理并返回结果

importbase64fromopenaiimportOpenAIfromPILimportImageimportioimportos# =========================# 配置# =========================API_BASE="http://192.168.8.221:9024/v1"MODEL_NAME="Qwen2-5-VL-72B-Instruct-quantized-w8a8"IMAGE_PATH="/home/data/project/customer_AAA/ultralytics-yolov5-student/6all/000339.jpg"# ← 替换为你的本地图像路径# =========================# 初始化 OpenAI Client# =========================client=OpenAI(base_url=API_BASE,api_key="EMPTY"# vLLM 不校验 key,填任意值即可)# =========================# 读取并编码图片(Base64)# =========================defload_image_base64(image_path:str)->str:withopen(image_path,"rb")asf:image_bytes=f.read()returnbase64.b64encode(image_bytes).decode("utf-8")image_base64=load_image_base64(IMAGE_PATH)# =========================# 构造 Prompt(严格控制格式)# =========================prompt_text=""" 请根据给定图片进行分析,并严格按照以下格式输出: --- ## 一、场景特点 (分点说明) ## 二、预期检测难点 (分点说明) --- 只输出上述结构,不要输出多余内容。 """# =========================# 调用多模态模型# =========================response=client.chat.completions.create(model=MODEL_NAME,messages=[{"role":"user","content":[{"type":"text","text":prompt_text},{"type":"image_url","image_url":{"url":f"data:image/jpeg;base64,{image_base64}"}}]}],temperature=0.2,max_tokens=800)# =========================# 输出结果# =========================print("="*60)print("模型输出结果:")print(response.choices[0].message.content)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 12:50:12

Python 中装饰器和内存回收的说明

文章目录前言Python 中装饰器和内存回收的说明1. Python 中的装饰器1.1. 说明1.2. 装饰器示例2. Python 内存回收前言 如果您觉得有用的话,记得给博主点个赞,评论,收藏一键三连啊,写作不易啊^ _ ^。   而且听说点赞的人每天的运…

作者头像 李华
网站建设 2026/4/12 15:03:12

AI浪潮冲击职场:企业倾向自动化而非招聘新人

Gen Z面临“就业末日”:全球企业优先考虑AI而非招聘新人,报告指出 年轻职场新人正面临一场“就业末日”,因为商业领袖们正在投资人工智能(AI),而不是招聘新员工。这是根据一项针对全球商业领袖的研究得出的…

作者头像 李华
网站建设 2026/4/3 5:59:48

别被榜单骗了:Gemini 3 Pro 的实战避坑指南

1M 上下文:是生产力神器还是账单刺客? 2025 年底了,如果你还在纠结怎么写 Prompt 让 AI 吐出更准的代码,那你已经掉队了。Google 发布的 Gemini 3 Pro 拿了 LMArena 第一(1501 Elo),但这分值最…

作者头像 李华
网站建设 2026/4/9 12:45:24

(独家)Open-AutoGLM总体框架设计内幕:高可用与自进化如何兼得

第一章:Open-AutoGLM总体框架设计内幕:高可用与自进化如何兼得在构建大规模语言模型自动化系统时,Open-AutoGLM 面临的核心挑战是如何在保障服务高可用的同时,实现模型与系统的持续自进化。该框架采用“双环协同”架构&#xff0c…

作者头像 李华
网站建设 2026/4/18 3:35:38

门店共享:零成本开启额外收入

今天分享一种正在多个城市试点的创新模式——“门店共享系统”,它能让你的店铺在原有业务基础上,轻松开辟额外收入渠道。简单来说,就是让你的门店同时销售多个品牌的商品或服务。比如便利店可以销售早餐套餐,文具店可以代收快递&a…

作者头像 李华