Python 爬虫与网络
227 字小于 1 分钟
2026-05-20
爬虫与网络专题放数据获取、网页解析、浏览器自动化、Scrapy 框架和逆向加密。它和数据分析章节的关系是:这里关注“如何稳定拿到数据”,数据章节关注“拿到之后如何清洗、建模和表达”。
当前页面
- Requests 请求:HTTP 请求、响应对象和编码处理。
- 爬虫基础:抓取流程、循环、数据提取和存储思路。
- 网页解析:正则和页面内容提取。
- Selenium:浏览器自动化和动态页面抓取。
- Scrapy 框架:工程化爬虫流程和组件。
- Python 逆向加密:JS 执行、加密特征和逆向入口。
学习顺序
Requests -> 解析库/正则 -> Selenium -> Scrapy -> 逆向加密。先建立稳定抓取流程,再处理复杂动态站点。