面完Anthropic的MLE,整个人直接被代码量和工程细节按在地上摩擦。之前听朋友说这家极其看重infra和hands-on能力,面下来才发现,他们真的对“调包侠”零容忍。面试风格跟传统LeetCode厂完全不同,写起来巨爽但也巨耗心智。
.
第一轮coding就不按常理出牌,不像别的厂扔个算法题,Anthropic直接给你一个接近真实场景的small engineering task。比如让你底层implement一个Transformer的核心组件,或手动实现带top-p的sampler。你不能光想着跑通,它会疯狂考察你的矩阵运算效率、memory profile和edge case。平时习惯用PyTorch调现成API的话,现场手撕底层的tensor manipulation绝对瞬间流汗。面试官看代码极细,还会追问为什么要这样管理内存。
.
到了后期的ML System Design和deep dive,基本就是对着Claude背后的技术栈贴脸开大了。不仅聊大模型架构,还会垂直深入到scalability上。面试官特别务实,会问你如何设计支持high throughput和low latency的LLM serving system,怎么做KV cache optimization,以及遇到集群node failure怎么做fault tolerance。整个讨论非常colloquial但直击痛点,不是背八股文能糊弄的。感觉他们要的是懂research原理又能上手改底层infra的full-stack AI engineer。
.
总的来说,Anthropic的MLE岗核心就在于“落地”。你对大模型底层原理理解多深,代码写得有多clean,现场矩阵操作多稳,都会暴露出来。为了帮大家避坑,我把这次面试的底层coding题型、ML系统设计高频考点和LLM工程落地细节全都整 理了。在准备美国MLE面试的同学可以对照补一下,🙌【ant】就行