详解基于pycharm的requests库使用教程详解基于pycharm的requests库使用

requests库安装和导入
requests库的get请求
requests库的post请求
requests库的代理
requests库的cookie
自动识别验证码

requests库安装和导入第一步：cmd打开命令行，使用如下命令安装requests库。

pip install requests

由于我的安装过了，所以如下：

文章图片

如果提示你pip版本需要更新，按照提示的指令输入即可更新。
第二步：cmd使用如下命令，验证requests库安装完成。

pip list

文章图片

第三步：在pycharm中，点击file——settings——project——python interpreter——点击+号——搜索requests——install package！

文章图片

第四步：在你写的.py文件中，使用如下命令导入即可。

import requests

requests库的一个类型六个属性

import requestsurl = "https://www.baidu.com"response = requests.get(url=url)# 一个类型六个属性# 类型print(type(response))# 设置响应的编码格式response.encoding = 'utf-8'# 以字符串的形式返回网页的源码print(response.text)# 返回一个url地址print(response.url)# 返回的是二进制数据print(response.content)# 返回相应的状态码print(response.status_code)# 返回的响应头print(response.headers)

输出结果如下：

百度一下，你就知道 - 锐客网
文章图片

post一般是表单请求，如果你直接在百度搜一个东西，那是get请求奥！

requests库的get请求首先将代码写出来，然后根据代码给大家将对应的知识点，算是入门。

import requestsurl = "https://www.baidu.com/s?"headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'}data = https://www.it610.com/article/{'wd': '北京'}# url请求路径 params参数 kwargs字典response = requests.get(url=url, params=data, headers=headers)# 参数使用params传递，且参数无需url encode编码，且参数也不需要对象定制，请求资源路径中的?可加可不加print(response.text)

文章图片

第一步：首先来看requests库的get方法使用及参数含义。

response = requests.get(url=url, params=data, headers=headers)

url表示请求路径，params表示参数，kwargs表示字典。
参数使用params传递，且参数无需url encode编码，且参数也不需要对象定制，请求资源路径中的?可加可不加。
第二步：下面演示一下，这三个参数怎么传递。
接下来的讲解，学过前端的应该都知道怎么弄吧？
右键检查——选择如下——然后刷新
这个地方是我们请求的url！

文章图片

这个地方是我们传递的数据params！
可能很多人会找From Data，这个地方应该是PayLoad，注意一下！

文章图片

这个地方是我们传递的字典！
【详解基于pycharm的requests库使用教程】选择下面的user agent，其中有我们的浏览器相关信息。

文章图片

在上述中，应该注意，由于get的后两个其实都是用python中的字典的形式存储的，所以获取数据后，注意一下格式。
第三步：我们来看看有没有数据，可以在输出地方，使用ctrl + f来搜索验证我们想要的内容在不在。

文章图片

requests库的post请求首先将代码写出来，然后根据代码给大家将对应的知识点，算是入门。

import requestsurl = "https://fanyi.baidu.com/sug"headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'}data = https://www.it610.com/article/{'kw': 'eye'}# url请求路径 data请求参数 kwargs字典response = requests.post(url=url, data=https://www.it610.com/article/data, headers=headers)# 参数使用data传递，且参数无需url encode编码，且参数也不需要对象定制print(response.text)

输出结果：

{"errno":0,"data":[{"k":"eye","v":"n. \u773c\u775b; \u89c6\u529b; \u773c\u72b6\u7269; \u98ce\u7eaa\u6263\u6263\u773c vt. \u5b9a\u775b\u5730\u770b; \u6ce8\u89c6; \u5ba1\u89c6; \u7ec6\u770b"},{"k":"Eye","v":"[\u4eba\u540d] \u827e; [\u5730\u540d] [\u82f1\u56fd] \u827e\u4f0a"},{"k":"EYE","v":"abbr. European Year of the Environment \u6b27\u6d32\u73af\u5883\u5e74; Iwas"},{"k":"eyed","v":"adj. \u6709\u773c\u7684"},{"k":"eyer","v":"n. \u6ce8\u89c6\u7684\u4eba"}]}

第一步：首先来看requests库的post方法使用及参数含义。

response = requests.post(url=url, data=https://www.it610.com/article/data, headers=headers)

这里的参数和get方法还有点不同，我们想看详细的话可以这样看，在pycharm中选中方法，即可看到提示。

文章图片

url表示的是请求路径，data表示的是请求参数，kwargs表示的是字典。
其实难点在于怎么找这个url奥！！即哪一个是我们想要的url！！下面以百度翻译为例！！

文章图片

我圈起来的这些地方，一定要注意，选中Preserve log！！
就在左边的Name中找，如果其对应的这个PayLoad中的kw和我们搜索的一致，那就是的啦！！！
第二步，可能返回的数据我们也看不懂，那就转换成json的格式来看就行啦！！

import requestsimport jsonurl = "https://fanyi.baidu.com/sug"headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'}data = https://www.it610.com/article/{'kw': 'eye'}# url请求路径 data请求参数 kwargs字典response = requests.post(url=url, data=https://www.it610.com/article/data, headers=headers)obj = json.loads(response.text, encoding='utf-8')print(obj)

输出结果：

{'errno': 0, 'data': [{'k': 'eye', 'v': 'n. 眼睛; 视力; 眼状物; 风纪扣扣眼 vt. 定睛地看; 注视; 审视; 细看'}, {'k': 'Eye', 'v': '[人名] 艾; [地名] [英国] 艾伊'}, {'k': 'EYE', 'v': 'abbr. European Year of the Environment 欧洲环境年; Iwas'}, {'k': 'eyed', 'v': 'adj. 有眼的'}, {'k': 'eyer', 'v': 'n. 注视的人'}]}

requests库的代理代理主要处理的是，我们在模拟浏览器给服务器发送请求的时候，我们高速的快速的高频次的访问某个网站，那样的话网站会崩溃的，所以会把我们的ip封掉，那我们怎么办呢？换ip地址就好啦！

import requestsurl = "https://www.baidu.com/s?"headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'}data = https://www.it610.com/article/{'wd': 'ip'}response = requests.get(url=url, params=data, headers=headers)with open('daili.html', 'w', encoding='utf-8') as fp:fp.write(response.text)

就会发现写了这个文件！

文章图片

文章图片

requests库的cookie 我们是以古诗文网为例！
我们现在想要实现的功能就是，不用登录，直接进入内部的页面。

# 通过登录进入主页面# 通过找登录接口我们发现需要的参数很多"""__VIEWSTATE: 9Y4yHRQS2k2z739MJJ/8Z0sKfZNltkFId83Z8jCtY3g00xYgg9bsv5oK+KT5DypNl37KWa0IyB+uOwrRPBvTybqGLDdd0chyrWLxhhlHBeAGWL/SLTGYfOh5L1M=__VIEWSTATEGENERATOR: C93BE1AEfrom: http://so.gushiwen.cn/user/collect.aspxemail: 13237153218pwd: wxm20010428code: PDBGdenglu: 登录"""# 我们观察到__VIEWSTATE __VIEWSTATEGENERATOR code是一个可以变化的量# __VIEWSTATE __VIEWSTATEGENERATOR 看不到的数据一般都是在页面的源码中# 我们观察到其在页面源码中所以我们需要获取页面源码然后进行解析就可以获取了# code是验证码import requests# 登录url页面url = 'https://so.gushiwen.cn/user/login.aspx?from=http://so.gushiwen.cn/user/collect.aspx'headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36'}response = requests.get(url=url, headers=headers)# print(response.text)# 解析页面源码然后获取__VIEWSTATE __VIEWSTATEGENERATORfrom bs4 import BeautifulSoupsoup = BeautifulSoup(response.text, 'lxml')# 获取__VIEWSTATEviewstate = soup.select('#__VIEWSTATE')[0].attrs.get('value')# 获取__VIEWSTATEGENERATORviewstategenerator = soup.select('#__VIEWSTATEGENERATOR')[0].attrs.get('value')# print(viewstate)# print(viewstategenerator)# 获取验证码图片code = soup.select('#imgCode')[0].attrs.get('src')# print(code)code_url = 'https://so.gushiwen.cn' + code# print(code_url)# 获取验证码的图片后下载到本地然后观察验证码观察之后然后在控制台输入这个验证码就将这个值给code# 怎么下载？？？# import urllib.request# 此处和后面的请求不是同一个请求验证码就变了# urllib.request.urlretrieve(url=code_url, filename='code.jpg')# request里面有一个方法session() 通过session的返回值就能使请求变成一个对象session = requests.session()response_code = session.get(code_url)# 注意此处使用二进制数据因为我们要是图片的下载content_code = response_code.contentwith open('code.jpg', 'wb') as fp:fp.write(content_code)code_name = input('请输入验证码：')# 点击登录url_post = 'https://so.gushiwen.cn/user/login.aspx?from=http%3a%2f%2fso.gushiwen.cn%2fuser%2fcollect.aspx'data_post = {'__VIEWSTATE': viewstate,'__VIEWSTATEGENERATOR': viewstategenerator,'from': 'http://so.gushiwen.cn/user/collect.aspx','email': '13237153218','pwd': 'wxm20010428','code': code_name,'denglu': '登录',}response_post = session.post(url=url_post, headers=headers, data=https://www.it610.com/article/data_post)with open('gushiwen.html', 'w', encoding='utf-8') as fp:fp.write(response_post.text)

首先我们打开这个古诗文网的登录页面（假设已经都注册过了），现在我们要输入正确的账号，错误的密码，正确的验证码，点击登录，但是在提示后不要点击确定，否则页面会跳转，然后抓到这个登录所需要的参数。

文章图片

观察参数后，先找到变化的参数，再试图去获取变化的参数，而且一般这种看不见的参数，一般就是在源码中，我们点击查看源码，然后ctrl+F搜索看不见的参数，找到其位置。
然后我们模拟浏览器给服务器发送请求，获取网页源代码后，使用bs4解析源代码，然后相应变化的参数后，再发送请求即可！

文章图片

此处会生成两个文件，并且code.jpg，在运行的时候如果加载不出来，那就去项目的文件夹中查找。

自动识别验证码超级鹰！下载python开发文档，并且将.py和一个图片复制到项目中！

文章图片

打开后，看一下.py文件，更改用户名和密码上去！

文章图片

根据其中的提示更改这个用户ID

文章图片

但是由于我没有充钱，没给我返回哈哈哈哈哈！

文章图片

大家可以去第三方平台搞验证码识别平台！！
到此这篇关于详解基于pycharm的requests库使用教程的文章就介绍到这了,更多相关pycharm requests库内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

推荐阅读

《时生》

中国为何不承认科索沃北约轰炸南联盟

空调内外机通风口是什么

羊肉变质了煮熟还能吃吗

FGO贝奥武夫三技能强化简评 FGO圣诞六期贝奥武夫技能本

秦时明月世界测试福利有什么秦时明月世界测试福利介绍

redis connect time out redis连接超时功能

穿衬衫要不要穿外套穿衬衫里面还需要穿衣服吗

藜麦碳水化合物含量高吗

爱目者护眼贴关爱儿童眼部健康公益活动|爱目者护眼贴关爱儿童眼部健康公益活动共筑美好未来

sp如何调玻璃材质 sp如何diy，sp如何diy更疼

鼻毛|鼻毛外露不美观，拔了完事？鼻毛好处很多，劝你手下留情

你们看过后觉得最好的小说是什么？有哪些“高干文”和“糙汉文”推荐？

美丽加

电商什么都卖好吗怎么说电商什么都卖好吗，电商什么都卖好吗知乎

地不容价格地不容

八月瓜种植技术及条件

笼养八哥怎么训练怎样饲养和调教八哥

佳能A4000 IS价格是多少钱？佳能A4000 IS的佳能A4000 IS说明书

天天吃咸鸭蛋好吗会胖吗天天吃咸鸭蛋好吗

Spring依赖注入的三种方式详解之三（工厂方法注入）

基于图的 Affinity Propagation 聚类计算公式详解和代码示例

GoFrame实现顺序性校验示例详解

优雅使用GoFrame共享变量Context示例详解

CMU15445|CMU15445 (Fall 2019) 之 Project#1 - Buffer Pool 详解

基于开源流批一体数据同步引擎ChunJun数据还原—DDL解析模块的实战分享

Python|Python Pandas数据处理高频操作详解

基于 K8s 的交付难题退退退！| 独家交付秘籍（第三回）

MindSpore|项目经验分享（基于昇思MindSpore实现手写汉字识别）

Git远程删除某个历史提交记录方法详解