LLM入门

经得住时间的部分

1. LLM 的本质隐喻——“有损压缩互联网”

Karpathy 把训练过程描述为对人类知识的有损压缩，权重是压缩结果，推理是解压。这个比喻至今没有更好的替代，是建立正确直觉的起点，比”AI在思考”这类拟人化描述精确得多。

2. Hallucination 的根源解释

他把幻觉解释为”模型在做梦”——训练让它学会了生成连贯文本的模式，但它无法区分”记住的事实”和”合理的续写”。关键是他指出：finetuning 无法修复幻觉，只是把梦引导成助手风格的梦。

3. System 1/2 的预言性

用 Kahneman 框架解释为什么模型需要”慢思考”，这直接预示了 o1 系列的路线。入门者看这段再对照现在的 reasoning model，会有很强的”原来这是必然”的理解感。

4. Prompt Injection 的结构性威胁

这一段今天不仅没过时，反而更紧迫。他举的例子——网页里藏指令劫持浏览器 agent——现在是真实的攻击面。对新人来说，这是理解为什么 agentic AI 的安全问题和传统软件安全不一样的最好入口。