机器学习
422 字约 1 分钟
2025-01-23
机器学习是数据能力从“解释过去”走向“预测未来”的阶段。它适合用于分类、回归、聚类、推荐、排序、异常检测等任务,但前提是问题定义清楚、数据质量可靠、评估指标合理。
学习顺序
- 先理解监督学习、无监督学习、训练集、验证集、测试集。
- 再学习线性回归、逻辑回归、决策树、随机森林、梯度提升、K-Means 等经典模型。
- 同时补齐特征工程、标准化、缺失值处理、类别变量编码。
- 用准确率、召回率、精确率、F1、AUC、RMSE、MAE 等指标评估模型。
- 最后关注模型解释、过拟合、数据泄漏、上线监控和业务收益。
推荐路线
可以先从吴恩达的 Machine Learning Specialization 入门,再结合自己的业务数据做小项目。学习时不要只追求算法公式,更要理解每个模型适合解决什么问题、输入数据需要什么条件、错误结果会带来什么业务风险。
当前页面
和 AI 章节的关系
数据章节里的机器学习偏“数据分析师/数据科学家视角”,强调业务数据、模型评估和落地风险;AI 章节里的机器学习偏“AI 基础视角”,用于衔接深度学习、大语言模型和应用实践。