CVPR 2026 A2A-MML开启征稿，邀您共探任意模态新范式-程序员充电站

随着多模态大模型的飞速发展，我们正处于从“固定模态对”向“任意模态转换”跨越的关键节点。

我们诚邀您参加 CVPR 2026 A2A-MML Workshop！本次研讨会旨在汇聚视觉、语言、音频、3D、机器人及认知科学领域的专家，共同绘制任意模态智能（Any-to-Any Multimodal Intelligence）的未来蓝图。

研讨会简介

（Workshop Introduction）

近年来，大模型在 Vision-Language-Audio 等多模态领域取得了巨大突破，但现有系统仍受限于固定模态组合，难以实现真正的灵活推理与泛化。A2A-MML Workshop 旨在推动：

从 “固定模态对” → “任意模态组合（Any-to-Any）” 的范式转变

构建具备统一理解、转换与协作能力的多模态智能系统

我们的核心愿景是：

Bridging Representation, Transformation, and Collaboration
Toward Any-to-Any Multimodal Intelligence

核心信息

（Core Information）

Workshop 简称

A2A-MML

会议地点

Denver, Colorado（Hybrid Mode）

截稿日期（Deadline）

March 01, 2026（AOE）

录用通知（Notification）

March 19, 2026（AOE）

官方网站

https://a2a-mml-2026.vercel.app/

征稿主题

（Topics & Themes）

我们欢迎所有与多模态学习相关的投稿，特别关注以下前沿方向：

Multimodal Representation Learning（多模态表示学习）：解耦模态特定因素、学习泛化对齐空间及增强表示的可解释性。
Multimodal Transformation（多模态转换）：探索 text-to-image, image-to-video, video-to-audio 等跨模态生成机制及 Diffusion Transformer 框架。
Multimodal Synergistic Collaboration（多模态协同合作）：研究模态间的交互、补充与补偿机制，如协作注意力机制与跨模态反馈环路。
Benchmarking and Evaluation（基准测试与评估）：开发评估任意模态组合、转换保真度及推理一致性的新指标。
Other Emerging Topics（其他主题）：统一模态基座模型、具身智能中的表示学习、以及 3D/触觉/生理信号等稀缺模态的集成。

顶尖讲师阵容

（Keynote Speakers）

本次 Workshop 邀请到了多位学术界的领军人物分享最新洞察：

Paul Liang (MIT)
Manling Li (Northwestern University)
Mohit Bansal (UNC Chapel Hill)
Zhedong Zheng (University of Macau)
Yossi Gandelsman (Reve / TTIC)
Georgia Gkioxari (Caltech)
Saining Xie (NYU)

投稿指南

（Submission Guidelines）

Regular Papers

最多 8 页，介绍原始方法或新颖愿景。

Tiny/Short Papers

2-4 页，欢迎未发表的洞察、理论分析或实验复现。

奖励

所有录用论文将以 Poster 形式展示，其中 6-8 篇将被选为 Short Oral。研讨会还将评选出 Best Paper Award。

投稿系统

OpenReview

（https://openreview.net/group?id=thecvf.com/CVPR/2026/Workshop/A2A-MML#tab-recent-activity）

（Double-blind policy）

组织委员会

（Organizers）

由来自 Oxford, MIT, UNC, EPFL 和 University of Trento 的研究者共同组织：Shengqiong Wu, Wei Dai, Han Lin, Chenyu（Monica）Wang, Yichen Li, Sharut Gupta, Roman Bachmann, Elisa Ricci, Hao Fei.

期待在 Denver 与您共同探讨 A2A 的无限可能！

🔍

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

如何用Qwen3-ForcedAligner制作精准字幕？详细教程

如何用Qwen3-ForcedAligner制作精准字幕？详细教程 1. 为什么你需要一个真正“听得懂话”的对齐工具？ 你有没有遇到过这样的情况：花一小时剪辑好一段采访视频，却卡在字幕环节——手动敲字耗时、语音转文字错漏多、时间轴拖来拖去…

李华

yz-女生-角色扮演-造相Z-Turbo入门：从零开始生成角色图片

yz-女生-角色扮演-造相Z-Turbo入门：从零开始生成角色图片你是否想过，只需输入几句话，就能生成一位栩栩如生的二次元角色？不需要绘画功底，不用安装复杂软件，更不必等待数小时渲染——现在，这一…

李华

解锁音乐自由：NCMconverter的5大核心功能解析

解锁音乐自由：NCMconverter的5大核心功能解析【免费下载链接】NCMconverter NCMconverter将ncm文件转换为mp3或者flac文件项目地址: https://gitcode.com/gh_mirrors/nc/NCMconverter 为什么付费音乐无法真正属于你？当你在音乐平台购买了喜爱的…

李华

2025抢红包神器揭秘：自动抢红包工具让你红包拿到手软

2025抢红包神器揭秘：自动抢红包工具让你红包拿到手软【免费下载链接】WeChatLuckyMoney :money_with_wings: WeChats lucky money helper (微信抢红包插件) by Zhongyi Tong. An Android app that helps you snatch red packets in WeChat groups. 项目地址: ht…

李华

SMBus协议PEC校验在STM32上的实现：详细说明

SMBus PEC校验在STM32上的落地实践：从协议陷阱到工业级鲁棒通信你有没有遇到过这样的场景？一台部署在变频器旁的边缘网关，连续三天凌晨两点准时上报“CPU温度170℃”，继而触发误关机；工程师现场用万用表一测&#xff0…

李华

采用MOSFET的理想二极管应用实战案例

MOSFET理想二极管：从原理陷阱到工业级落地的实战手记你有没有遇到过这样的现场问题？——一台48 V服务器双电源冗余系统，在主电源突然掉电的瞬间，母线电压跌落超过200 mV，触发了下游FPGA的复位；或者一块锂…

李华