经得住时间的部分
1. LLM 的本质隐喻——“有损压缩互联网”
Karpathy 把训练过程描述为对人类知识的有损压缩,权重是压缩结果,推理是解压。这个比喻至今没有更好的替代,是建立正确直觉的起点,比”AI在思考”这类拟人化描述精确得多。
2. Hallucination 的根源解释
他把幻觉解释为”模型在做梦”——训练让它学会了生成连贯文本的模式,但它无法区分”记住的事实”和”合理的续写”。关键是他指出:finetuning 无法修复幻觉,只是把梦引导成助手风格的梦。
3. System 1/2 的预言性
用 Kahneman 框架解释为什么模型需要”慢思考”,这直接预示了 o1 系列的路线。入门者看这段再对照现在的 reasoning model,会有很强的”原来这是必然”的理解感。
4. Prompt Injection 的结构性威胁
这一段今天不仅没过时,反而更紧迫。他举的例子——网页里藏指令劫持浏览器 agent——现在是真实的攻击面。对新人来说,这是理解为什么 agentic AI 的安全问题和传统软件安全不一样的最好入口。