网络爬虫
Python网络数据采集 豆瓣
Web Scraping with Python: Collecting Data from the Modern Web
作者: [美] 米切尔 译者: 陶俊杰 / 陈小莉 人民邮电出版社 2016 - 3
本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第一部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。
Python 3网络爬虫开发实战 豆瓣
8.4 (5 个评分) 作者: 崔庆才 人民邮电出版社 2018 - 4
本书介绍了如何利用Python 3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib、requests、正则表达式、Beautiful Soup、XPath、pyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,后介绍了pyspider框架、Scrapy框架和分布式爬虫。
本书适合Python程序员阅读。
2020年6月20日 已读
写得太好了太适合爬虫国内网站了,但是我看到redis到底怎么实现的那一部分已经昏古七了......只能无脑跟步骤走了....
Python 网络爬虫