网络爬虫与信息提取(一)

Requests库入门 安装 网站:www.python-requests.org
1.管理员身份打开cmd

pip install requests

进行安装
2.查看安装效果
IDLE(python自带的)查看:
访问百度网站

网络爬虫与信息提取(一)
文章图片
image.png
状态码为200,访问成功
utf-8编码,打印网页内容

网络爬虫与信息提取(一)
文章图片
image.png Requests库的7个主要方法 网络爬虫与信息提取(一)
文章图片
image.png get()方法
r=requets.get(url)

【网络爬虫与信息提取(一)】返回的r是一个Reponse对象,包含从服务器返回的所有资源
正式形式

网络爬虫与信息提取(一)
文章图片
image.png
Reponse对象的五个类型

网络爬虫与信息提取(一)
文章图片
image.png 两种编码方式的区别:
r.enconding:如果header中不村子啊charset,则认为编码为ISO-8859-1
r.apparent_encoding:根据网页的内容分析出的编码方式

    推荐阅读