阿里大模型算法工程师社招面经：高频考点+答题技巧，助你轻松应对大模型面试（建议收藏）-程序员充电站

本文详细记录了阿里大模型算法工程师社招面试的技术问题，包括self-attention、MoE、推理性能指标、vLLM优化等。文章强调从latency、throughput和并发量三方面思考优化，从框架、算法、算子三方向回答问题，展现对大模型推理场景的深入理解，助你面试通关。

今天分享的是阿里的大模型算法工程师社招面经。

背景：211硕，5年，面着面着hc没了…后面被别的组又捞起来了

自我介绍——5min

项目相关细节提问——10min

项目相关技术提问——20min * 2

（与之前的面经贴中重复的技术问题不在展示）

讲讲self-attention。（这是最高频的基础问题，既可以从结构来说，也可以从代码来说，就最普通的MHA即可）
讲讲对MoE的理解。
DeepSeek-MTP是用在训练阶段还是推理阶段的，具体过程是怎样的？（论文里是用在训练的，不过现在推理中也用的很多了，都可以说）
常见的衡量大模型推理性能的指标都有哪些？
都知道哪些vllm的优化技术？（这也是个高频问题，把你知道的vllm中所有的算法，框架优化技术都讲，千万不要只说page attention，这个问题你答的时间比较长的话，技术部分基本就结束了，直接手撕代码了）
针对真实推理场景，你都能想到哪些性能优化手段？（这种也是比较综合的问题，比较考察你对推理场景的理解）

前面已经提问了性能指标和vllm了，其实这里就可以结合前面的思路再做一些总结（重复的可以简单简述）和补充（前面遗漏的）。

不要东一嘴西一句，如果你能从整体逻辑上先分析优化点，然后再详细展开一些优化的技术，那么将是非常加分的。我提供几个方向供大家参考：

从latency这个方面来思考：

TTFT：说到延迟，最重要的一定是首字延迟，这个指标最影响用户体验，比如TP
mean latancy：比如针对PP中存在的大量bubble，采用chunked prefill，比如prefix caching
…

从throughput这个方面来思考：

比如continuous batching
比如量化

…

从并发量这个方面来思考：

比如使用MLA来减小所需显存
比如使用3d并行
…

当然了，上面提到的很多技术都是可以同时优化很多指标的。

你也可以从框架，算法，算子这3个方向去回答。这样既能展现你对技术的理解，也能衬托你对推理场景的理解。

手撕算法：二叉树的先序遍历板子题目，阿里不是太注重手撕代码，不像字节。

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习和面试资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。