基于Python的爬虫系统设计与实现

吕定辉

随着互联网技术发展,网络所承载的数据逐渐体现其价值,且网络数据体量日益倍增,对网络数据的利用越来越受到各行各业的重视。该网络爬虫系统以基于Python语言的Scrapy网络爬虫框架技术为基础,综合考虑对反爬机制的应对措施及相关系统优化,满足一定的爬取效率要求,便于数据挖掘等数据研究利用。系统主要实现了实体管道模块、爬虫业务模块、中间件模块、Cookies池模块。过程中涉及到的关键技术主要包括Cookies池服务、反爬虫策略、页面解析、Selenium+ChromeDriver实现模拟访问、MongoDB实现数据持久化存储等 (共1页)
~~ 试读结束 ~~
全文下载 0.5

相关文章

目录

PDF在线阅读

《基于Python的爬虫系统设计与实现》

价格:0.5

Copyright © 2021-2024 全科互知 | 赣ICP备2021006197号-4 | 新出网证(赣)字20417号
赣公网安备 36012102000372号 | 赣B2-20210313 | 技术支持:道然科技

sasa 互知学术
sasa 全科互知