Anthropic MLE面试回顾与复盘

面完Anthropic的MLE，整个人直接被代码量和工程细节按在地上摩擦。之前听朋友说这家极其看重infra和hands-on能力，面下来才发现，他们真的对“调包侠”零容忍。面试风格跟传统LeetCode厂完全不同，写起来巨爽但也巨耗心智。

第一轮coding就不按常理出牌，不像别的厂扔个算法题，Anthropic直接给你一个接近真实场景的small engineering task。比如让你底层implement一个Transformer的核心组件，或手动实现带top-p的sampler。你不能光想着跑通，它会疯狂考察你的矩阵运算效率、memory profile和edge case。平时习惯用PyTorch调现成API的话，现场手撕底层的tensor manipulation绝对瞬间流汗。面试官看代码极细，还会追问为什么要这样管理内存。

到了后期的ML System Design和deep dive，基本就是对着Claude背后的技术栈贴脸开大了。不仅聊大模型架构，还会垂直深入到scalability上。面试官特别务实，会问你如何设计支持high throughput和low latency的LLM serving system，怎么做KV cache optimization，以及遇到集群node failure怎么做fault tolerance。整个讨论非常colloquial但直击痛点，不是背八股文能糊弄的。感觉他们要的是懂research原理又能上手改底层infra的full-stack AI engineer。

总的来说，Anthropic的MLE岗核心就在于“落地”。你对大模型底层原理理解多深，代码写得有多clean，现场矩阵操作多稳，都会暴露出来。为了帮大家避坑，我把这次面试的底层coding题型、ML系统设计高频考点和LLM工程落地细节全都整理了。在准备美国MLE面试的同学可以对照补一下，🙌【ant】就行

1 小时前发布