全部
期刊
文献
标题
作者
单位
摘要
关键词
栏目
基金
文献检索
包含全部检索词
包含精确检索词
包含至少一个检索词
作者
出版物
发表时间
-

基于Python的爬虫系统设计与实现

吕定辉

濮阳职业技术学院

随着互联网技术发展,网络所承载的数据逐渐体现其价值,且网络数据体量日益倍增,对网络数据的利用越来越受到各行各业的重视。该网络爬虫系统以基于Python语言的Scrapy网络爬虫框架技术为基础,综合考虑对反爬机制的应对措施及相关系统优化,满足一定的爬取效率要求,便于数据挖掘等数据研究利用。系统主要实现了实体管道模块、爬虫业务模块、中间件模块、Cookies池模块。过程中涉及到的关键技术主要包括Cookies池服务、反爬虫策略、页面解析、Selenium+ChromeDriver实现模拟访问、MongoDB实现数据持久化存储等
【栏 目】 信息技术
【分 类】 经济
【出 处】 《商业2.0·市场与监管》2020年04期 第206页 (共1页)

相关文献

导出/参考文献
[1]吕定辉. 基于Python的爬虫系统设计与实现[J]. 商业2.0·市场与监管 . 2020(04): 206.

PDF在线阅读

《基于Python的爬虫系统设计与实现》

价格:0.00

Copyright © 2021-2024 全科互知 | 赣ICP备2021006197号-4 | 新出网证(赣)字20417号
赣公网安备 36012102000372号 | 赣B2-20210313 | 技术支持:道然科技

sasa 互知学术
sasa 全科互知