机器学习

422 字约 1 分钟

2025-01-23

机器学习是数据能力从“解释过去”走向“预测未来”的阶段。它适合用于分类、回归、聚类、推荐、排序、异常检测等任务，但前提是问题定义清楚、数据质量可靠、评估指标合理。

学习顺序

先理解监督学习、无监督学习、训练集、验证集、测试集。
再学习线性回归、逻辑回归、决策树、随机森林、梯度提升、K-Means 等经典模型。
同时补齐特征工程、标准化、缺失值处理、类别变量编码。
用准确率、召回率、精确率、F1、AUC、RMSE、MAE 等指标评估模型。
最后关注模型解释、过拟合、数据泄漏、上线监控和业务收益。

推荐路线

可以先从吴恩达的 Machine Learning Specialization 入门，再结合自己的业务数据做小项目。学习时不要只追求算法公式，更要理解每个模型适合解决什么问题、输入数据需要什么条件、错误结果会带来什么业务风险。

当前页面

机器学习基础：经典模型、评估方法、特征工程和面试式问题。
吴恩达机器学习笔记：课程体系笔记，适合从零建立概念框架。

和 AI 章节的关系

数据章节里的机器学习偏“数据分析师/数据科学家视角”，强调业务数据、模型评估和落地风险；AI 章节里的机器学习偏“AI 基础视角”，用于衔接深度学习、大语言模型和应用实践。