今天分享的是阿里的大模型算法工程师社招面经。
背景:211硕,5年,面着面着hc没了…后面被别的组又捞起来了
自我介绍——5min
项目相关细节提问——10min
项目相关技术提问——20min * 2
(与之前的面经贴中重复的技术问题不在展示)
- 讲讲self-attention。(这是最高频的基础问题,既可以从结构来说,也可以从代码来说,就最普通的MHA即可)
- 讲讲对MoE的理解。
- DeepSeek-MTP是用在训练阶段还是推理阶段的,具体过程是怎样的?(论文里是用在训练的,不过现在推理中也用的很多了,都可以说)
- 常见的衡量大模型推理性能的指标都有哪些?
- 都知道哪些vllm的优化技术?(这也是个高频问题,把你知道的vllm中所有的算法,框架优化技术都讲,千万不要只说page attention,这个问题你答的时间比较长的话,技术部分基本就结束了,直接手撕代码了)
- 针对真实推理场景,你都能想到哪些性能优化手段?(这种也是比较综合的问题,比较考察你对推理场景的理解)
前面已经提问了性能指标和vllm了,其实这里就可以结合前面的思路再做一些总结(重复的可以简单简述)和补充(前面遗漏的)。
不要东一嘴西一句,如果你能从整体逻辑上先分析优化点,然后再详细展开一些优化的技术,那么将是非常加分的。我提供几个方向供大家参考:
从latency这个方面来思考:
TTFT:说到延迟,最重要的一定是首字延迟,这个指标最影响用户体验,比如TP
mean latancy:比如针对PP中存在的大量bubble,采用chunked prefill,比如prefix caching
…
从throughput这个方面来思考:
- 比如continuous batching
- 比如量化
…
从并发量这个方面来思考:
比如使用MLA来减小所需显存
比如使用3d并行
…
当然了,上面提到的很多技术都是可以同时优化很多指标的。
你也可以从框架,算法,算子这3个方向去回答。这样既能展现你对技术的理解,也能衬托你对推理场景的理解。
手撕算法:二叉树的先序遍历板子题目,阿里不是太注重手撕代码,不像字节。
最后唠两句
为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选
很简单,这些岗位缺人且高薪
智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200% ,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。
AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。
那0基础普通人如何学习大模型 ?
深耕科技一线十二载,亲历技术浪潮变迁。我见证那些率先拥抱AI的同行,如何建立起效率与薪资的代际优势。如今,我将积累的大模型面试真题、独家资料、技术报告与实战路线系统整理,分享于此,为你扫清学习困惑,共赴AI时代新程。
我整理出这套 AI 大模型突围资料包【允许白嫖】:
- ✅从入门到精通的全套视频教程
- ✅AI大模型学习路线图(0基础到项目实战仅需90天)
- ✅大模型书籍与技术文档PDF
- ✅各大厂大模型面试题目详解
- ✅640套AI大模型报告合集
- ✅大模型入门实战训练
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
①从入门到精通的全套视频教程
包含提示词工程、RAG、Agent等技术点
② AI大模型学习路线图(0基础到项目实战仅需90天)
全过程AI大模型学习路线
③学习电子书籍和技术文档
市面上的大模型书籍确实太多了,这些是我精选出来的
④各大厂大模型面试题目详解
⑤640套AI大模型报告合集
⑥大模型入门实战训练
如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!
应届毕业生:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能 突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。
👉获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓