Grape's Infra Blog
AI算法拆解笔记

AI算法拆解笔记:开篇 — 为什么从第一性原理出发

1 分钟阅读

为什么要从第一性原理出发?

在 AI 技术日新月异的今天,我们每天都在接触新模型、新架构、新论文。但真正的深度理解,往往需要回归到数学本质。

$$ \min_{\theta} \frac{1}{N} \sum_{i=1}^{N} L(f_{\theta}(x_i), y_i) $$

这只是最基础的损失函数,但理解它的每一个组成部分——\(f_\theta\) 代表什么假设空间、\(L\) 衡量什么距离、\(\theta\) 如何更新——是理解一切复杂模型的基础。

本系列的写作框架

每一篇拆解笔记会遵循以下结构:

  1. 直觉先行 — 用一句话描述算法的核心思想
  2. 数学推导 — 从目标函数出发,逐步推导
  3. 代码实现 — 用 Python/PyTorch 从零实现核心逻辑
  4. 工程视角 — 讨论实现中的坑和优化技巧

阅读路线

线性模型 → 神经网络基础 → CNN → RNN → Transformer → Diffusion

💡 本系列面向有一定编程基础但对数学推导不够自信的读者。每个公式都会有详细的推导过程。


下一篇我们将从最简单的线性回归开始,看看梯度下降的本质是什么。

相关文章