基本是按照甲鱼老师的代码敲的,但是有报错。
代码如下:
import urllib.request
url = 'http://www.ip138.com'
proxy_support = urllib.request.ProxyHandler({'http':'1.198.73.139:9999'})
opener = urllib.request.build_opener(proxy_support)
urllib.request.install_opener(opener)
# head = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0;
WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}
req = urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0;
WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36')
response = urllib.request.urlopen(req)
html = response.read().decode('GB2312')
print(html)
报错:
urllib.error.URLError:
解决办法:
有点碰巧我感觉,这个我只是把协议改了一下:
‘http’-》‘https’,我感觉有了https的协议,应该都用https了吧。有必要了解一下这些协议。
【Python|urllib.error.URLError(urlopen error [WinError 10060])】增加一点别的知识:
https就是http和TCP之间有一层SSL层,这一层的实际作用是防止钓鱼和加密。防止钓鱼通过网站的证书,网站必须有CA证书,证书类似于一个解密的签名。另外是加密,加密需要一个密钥交换算法,双方通过交换后的密钥加解密。
希望对你有帮助
推荐阅读
- 推荐系统论文进阶|CTR预估 论文精读(十一)--Deep Interest Evolution Network(DIEN)
- Python专栏|数据分析的常规流程
- Python|Win10下 Python开发环境搭建(PyCharm + Anaconda) && 环境变量配置 && 常用工具安装配置
- Python绘制小红花
- Pytorch学习|sklearn-SVM 模型保存、交叉验证与网格搜索
- OpenCV|OpenCV-Python实战(18)——深度学习简介与入门示例
- python|8. 文件系统——文件的删除、移动、复制过程以及链接文件
- 爬虫|若想拿下爬虫大单,怎能不会逆向爬虫,价值过万的逆向爬虫教程限时分享
- 分布式|《Python3网络爬虫开发实战(第二版)》内容介绍
- java|微软认真聆听了开源 .NET 开发社区的炮轰( 通过CLI 支持 Hot Reload 功能)