
2025年11月3日金马小记:
几天前约达峰一起聊天,他分享了一件事情让我印象特别深。达峰说:“如果你真的想明白 LLM(大语言模型)是怎么回事,最好的方法不是读论文,也不是看别人写的总结,而是——从零实现一个 ChatGPT。”
听起来有点疯狂,但现在的时代不同了,我们已经有 AI 了,你完全可以让 AI 教你从零开始。他推荐我去看 Andrej Karpathy 的系列视频,我连续学了几天,收获真的非常大。

比如,Karpathy 在第一个视频里讲了很多关于导数和反向传播的内容。老实说,我已经很多年没碰这些数学了,但现在完全不怕——因为有 AI,我随时可以问它“这个怎么算来着?”、“链式法则到底怎么推?”AI 会不厌其烦地一步步教我,还能结合代码帮我演示。那种“重新点亮理解力”的感觉很神奇。
其实这让我重新认识了学习,尤其在计算机领域,真正的理解从来都不是“看懂别人怎么做”,而是“自己动手做一遍”。
比如:
- 从零实现一个 Docker,你就真的理解了虚拟化和隔离;
 - 从零实现一个 编程语言解释器,你才体会“代码运行”这四个字的含义;
 - 从零实现一个 操作系统,那就是上帝视角——你能看到 CPU、内存、调度的一切;
 - 从 0 到 1 实现一个LLM大语言模型,像斯坦福 CS336 那样,你就会明白 GPT 背后的每一层逻辑;
 - 从 0 到 1 实现一个 CLI Coding Agent,你就真正知道 Claude Code 或 Codex 是怎么工作的。
 
过去,这些听起来像天方夜谭。但现在我们有了 AI,这些“高门槛的知识”都能一步步被拆解出来。AI 可以帮你规划学习路线、讲解数学原理、生成代码、甚至帮你 debug。你不是一个人在写,而是和一位永远耐心、知识渊博的导师一起“共创”。
所以我越来越相信:如果你真想搞明白大语言模型,最值得做的一件事,就是从零实现一个 ChatGPT。别怕,不需要天才,也不需要博士。你只需要一颗愿意学、愿意试的心。因为在这个时代,任何一个人都能做到这件事。