CS229 线性代数复习

650 字约 2 分钟

2026-05-20

这页把 CS229 线性代数复习材料整理成机器学习视角的知识骨架。原始材料中的公式排版较密，已保留在 archive/organise 作为来源备份；这里重点保留复习路径和核心概念。

学习目标

线性代数的价值在于把大量样本、特征和参数写成向量与矩阵，从而让模型训练可以被统一表示和高效计算。机器学习里最常见的对象是样本矩阵、特征向量、参数向量、权重矩阵和协方差矩阵。

线性回归可以写成矩阵形式：样本矩阵乘以参数向量，得到预测值。这样做的好处是可以一次性处理所有样本，并把损失函数和梯度写得更紧凑。

PCA 本质上依赖协方差矩阵、特征值和特征向量。特征值越大，说明对应方向保留的数据方差越多。

神经网络的线性层就是矩阵乘法加偏置，非线性激活负责打破纯线性组合的表达限制。

向量内积、余弦相似度和欧氏距离经常用于检索、聚类、推荐和 embedding 相似度计算。

机器学习中最容易出错的是维度。每写一个公式，都先检查矩阵形状是否能相乘、输出维度是什么、每一行或每一列对应什么业务含义。