目的:功能就是翻页请求
步骤:如下
文章图片
爬取职位名,职位链接等
文章图片
? 职位名:
? 职位详情链接:
? 职位类别:
? 人数:
? 地点:
? 发布时间:
文章图片
文章图片
下一步骤:写爬虫 :tencent.py文件写
文章图片
文章图片
方法一:
文章图片
文章图片
或者这样写
文章图片
文章图片
获取职位名
文章图片
获取链接
文章图片
文章图片
文章图片
再传给管道:
文章图片
文章图片
设置settings函数
文章图片
开始翻页(提取第二页的链接)
文章图片
以上只是构建了请求但是没有发出去请求,因此需要用yield
文章图片
排错一:
因为有的没有类别,所以要判断:
文章图片
排错二:
文章图片
方法二:用scrapy提取链接
文章图片
总结:一个项目的大致流程 【python爬虫(四)---scrapy框架之腾讯招聘项目实战】
文章图片
推荐阅读
- Python爬虫|逆向系列 | AES逆向加密案例分析
- python爬虫|关于使用python 动态爬虫Selenium 下载文件,文件类型的设置
- 教你如何使用Python破解WIFI密码
- python爬虫|【python爬虫教程】请求模块urllib的基本使用
- python爬虫|爬虫基础知识(web前端,请求模块urllib,重构user_agent)
- 尚硅谷|Python爬虫 urllib -- 爬虫的相关概念介绍、urllib库的基本使用、urllib(1个类型和6个方法)
- Python|玩游戏怎么能没有皮肤,Python一键采集王某耀游戏所有皮肤,这波就很舒服
- Python|自从学会了用python解析视频,都不用去找下载按钮在哪了,是真的方便
- python爬pixiv排行榜