news 2026/4/18 3:23:09

KeyError: ‘sdpa‘

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
KeyError: ‘sdpa‘

问题描述

model=AutoModelForCausalLM.from_pretrained(^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File"C:\Users\wh109\AppData\Roaming\Python\Python312\site-packages\transformers\models\auto\auto_factory.py",line597,infrom_pretrainedreturnmodel_class.from_pretrained(^^^^^^^^^^^^^^^^^^^^^^^^^^^^File"C:\Users\wh109\AppData\Roaming\Python\Python312\site-packages\transformers\modeling_utils.py",line277,in_wrapperreturnfunc(*args,**kwargs)^^^^^^^^^^^^^^^^^^^^^File"C:\Users\wh109\AppData\Roaming\Python\Python312\site-packages\transformers\modeling_utils.py",line4971,infrom_pretrained model=cls(config,*model_args,**model_kwargs)^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File"C:\Users\wh109\.cache\huggingface\modules\transformers_modules\Youtu_hyphen_VL_hyphen_4B_hyphen_Instruct\modeling_youtu_vl.py",line1173,in__init__ self.siglip2=Siglip2VisionModel._from_config(config.vision_config)^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File"C:\Users\wh109\AppData\Roaming\Python\Python312\site-packages\transformers\modeling_utils.py",line277,in_wrapperreturnfunc(*args,**kwargs)^^^^^^^^^^^^^^^^^^^^^File"C:\Users\wh109\AppData\Roaming\Python\Python312\site-packages\transformers\modeling_utils.py",line2311,in_from_config model=cls(config,**kwargs)^^^^^^^^^^^^^^^^^^^^^File"C:\Users\wh109\.cache\huggingface\modules\transformers_modules\Youtu_hyphen_VL_hyphen_4B_hyphen_Instruct\modeling_siglip2.py",line1284,in__init__ self.vision_model=Siglip2VisionTransformer(config)^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File"C:\Users\wh109\.cache\huggingface\modules\transformers_modules\Youtu_hyphen_VL_hyphen_4B_hyphen_Instruct\modeling_siglip2.py",line817,in__init__ self.encoder=Siglip2Encoder(config)^^^^^^^^^^^^^^^^^^^^^^File"C:\Users\wh109\.cache\huggingface\modules\transformers_modules\Youtu_hyphen_VL_hyphen_4B_hyphen_Instruct\modeling_siglip2.py",line604,in__init__ self.layers=nn.ModuleList([Siglip2EncoderLayer(config)for_inrange(config.num_hidden_layers)])^^^^^^^^^^^^^^^^^^^^^^^^^^^File"C:\Users\wh109\.cache\huggingface\modules\transformers_modules\Youtu_hyphen_VL_hyphen_4B_hyphen_Instruct\modeling_siglip2.py",line534,in__init__ self.self_attn=VISION_ATTENTION_CLASSES[config._attn_implementation](config=config)~~~~~~~~~~~~~~~~~~~~~~~~^^^^^^^^^^^^^^^^^^^^^^^^^^^^^KeyError:'sdpa'

解决方法

将attn_implementation设置为eager,

attn_implementation="eager",# 关键参数

代码如下:

fromtransformersimportAutoModelForCausalLM,AutoProcessor,AutoConfigimporttorch# 方法1:通过 config 设置config=AutoConfig.from_pretrained("Youtu-VL-4B-Instruct")config._attn_implementation="eager"# 使用标准注意力机制model=AutoModelForCausalLM.from_pretrained("Youtu-VL-4B-Instruct",config=config,torch_dtype=torch.bfloat16,# 或者 torch.float16device_map="auto")# 方法2:在 from_pretrained 中直接指定model=AutoModelForCausalLM.from_pretrained("Youtu-VL-4B-Instruct",torch_dtype=torch.bfloat16,attn_implementation="eager",# 关键参数device_map="auto")
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 3:50:42

开题报告 基于微信小程序的运动健身服务平台

目录 开题报告的定义核心内容结构撰写注意事项常见误区 项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作 开题报告的定义 开题报告是学术研究或学位论文撰写前的正式文档,用于阐明研究课题的背…

作者头像 李华
网站建设 2026/4/6 15:57:05

开题报告_大学生公寓管理系统

目录 大学生公寓管理系统概述核心功能模块技术实现特点应用价值 项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作 大学生公寓管理系统概述 大学生公寓管理系统是针对高校学生宿舍管理需求设计的数字化平台…

作者头像 李华
网站建设 2026/4/18 3:51:16

Flutter艺术探索-Flutter自定义渲染:CustomPainter绘制指南

Flutter自定义渲染:用CustomPainter绘制你的专属UI 引言 日常的Flutter开发中,我们习惯组合各式各样的Widget来搭建界面,这通常高效又省心。但你是否遇到过这样的窘境:设计稿里有一个酷炫的环形进度条,或者一个风格独…

作者头像 李华
网站建设 2026/4/16 17:09:05

《把脉行业与技术趋势》-114-系统存在的普遍本质与演化谱系

万物皆是一个有序、自动、受控的系统,由无数个(开环或闭环)子环构成,旨在完成特定功能与性能;所有系统均需能量以维持自身存在并实现功能与信息的转换。典型如企业、通信系统、网络、软件系统、产品、生物体等。系统可…

作者头像 李华
网站建设 2026/4/8 10:47:13

AI围棋分析:智能复盘如何解决围棋学习者三大核心痛点

AI围棋分析:智能复盘如何解决围棋学习者三大核心痛点 【免费下载链接】lizzieyzy LizzieYzy - GUI for Game of Go 项目地址: https://gitcode.com/gh_mirrors/li/lizzieyzy 你是否曾在复盘时陷入这样的困境:面对一盘棋的失误百思不得其解&#x…

作者头像 李华
网站建设 2026/4/13 6:18:55

如何突破硬件限制?打造零延迟家庭游戏云

如何突破硬件限制?打造零延迟家庭游戏云 【免费下载链接】Sunshine Sunshine: Sunshine是一个自托管的游戏流媒体服务器,支持通过Moonlight在各种设备上进行低延迟的游戏串流。 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 家庭游…

作者头像 李华