Python 爬虫与网络

227 字小于 1 分钟

2026-05-20

爬虫与网络专题放数据获取、网页解析、浏览器自动化、Scrapy 框架和逆向加密。它和数据分析章节的关系是：这里关注“如何稳定拿到数据”，数据章节关注“拿到之后如何清洗、建模和表达”。

当前页面

Requests 请求：HTTP 请求、响应对象和编码处理。
爬虫基础：抓取流程、循环、数据提取和存储思路。
网页解析：正则和页面内容提取。
Selenium：浏览器自动化和动态页面抓取。
Scrapy 框架：工程化爬虫流程和组件。
Python 逆向加密：JS 执行、加密特征和逆向入口。

学习顺序

Requests -> 解析库/正则 -> Selenium -> Scrapy -> 逆向加密。先建立稳定抓取流程，再处理复杂动态站点。