aiohttp|aiohttp - Python编写异步代理服务器
简介
aiohttp
是Python3
下的一个异步的HTTP
库,它可以作为客户端请求数据也可以作为服务器使用。安装很简单。。
pip3 install aiohttp
使用 作为客户端的使用
#! /usr/bin/env python3
# -*- coding: utf-8 -*-import asyncio
from aiohttp import ClientSessionurl = "http://www.shuiyueyue.com"
headers = { "User-Agent": "Hi!Pretty!" }async def darling(loop):
async with ClientSession(loop=loop) as session:
async with session.get(url, headers=headers) as resp:
print(await resp.text())if __name__ == "__main__":
loop = asyncio.get_event_loop()
loop.run_until_complete(darling(loop))
【aiohttp|aiohttp - Python编写异步代理服务器】作为服务器的使用
#! /usr/bin/env python3
# -*- coding: utf-8 -*-import asyncio
from aiohttp import webasync def yoyoyo(request):
body = "Yo!Yo!Yo! - 锐客网 脑子有壳???
"
resp = web.Response(body=body.encode("utf-8"))
resp.content_type= "text/html;
charset=utf-8"
return respasync def init(loop):
app = web.Application(loop=loop)
app.router.add_get("/", yoyoyo)
return await loop.create_server(app.make_handler(), "", 8080)if __name__ == "__main__":
loop = asyncio.get_event_loop()
loop.run_until_complete(init(loop))
loop.run_forever()
代理 所谓代理,就是相当于帮一对小情侣传纸条的一个中间人的角色,当小花想要将小纸条传给小明的时候,却发现中间站着个老师,这时最好的方法就是让小花把小纸条给老师,然后让老师把小纸条传给小明。同理,当一个客户端想要通信一个连接不到的服务器的时候,简单的方法就是找一个能连接到那个服务器的机子作为代理服务器,过程一般如下:
- 客户端发送请求
- 代理服务器接收来自客户端的请求
- 代理服务器将客户端的请求发送给服务器
- 服务器接收来自代理服务器的请求并响应
- 代理服务器接收来自服务器的响应
- 代理服务器将响应发送回客户端
- 客户端接收响应
- 接收客户端请求
- 发送客户端请求至服务器
- 接收服务器响应
- 发送服务器响应至客户端
-
Content-Encoding
,Accept-Encoding
这两个交给代理服务器自己去处理,省得出现什么压缩错误 -
Transfer-Encoding
去掉分块传输的响应头,由代理服务器自身处理 -
Content-Length
内容字节数也交给服务器处理,否则如果修改了内容会导致长度不一 -
Proxy-Connection
这个是使用代理服务器才会出现的,恩,怎么能让人知道你在使用代理服务器呢 -
Connection
替换掉Proxy-Connection
并将值修改为close
,否则如果使用keep-alive
可能会导致分块传输 -
Host
尝试过几次因为没有去掉这个导致无法连接,所以让代理服务器自己处理这个就好了
bad_headers = ("accept-encoding", "content-encoding", "transfer-encoding", "content-length", "proxy-connection", "connection", "host")async def fuckheaders(headers):
h = {}
for name, value in headers.items():
if name.lower() not in bad_headers:
h[name] = value
h['Connection'] = 'close'
return h
现在需要编写一个接收客户端请求的小型服务器,
aiohttp.web
通过middlewares
来处理请求或响应的信息,要编写middlewares
处理函数需要将处理函数封装到一个函数中,如下:async def factory(app, handler):
async def resp_handler(request):
# 做点啥...也可以不做...取决于你决定什么时候处理信息
results = await handler(request)
# 做点啥...也可以不做...取决于你决定什么时候处理信息
# 如果是作为最后的处理函数最后需要返回响应数据
response = web.Response(body=results.text)
return response
return resp_handler
现在编写这个小型服务器:
async def factory(app, handler):
async def fuck(request):
print("==> %s" % request.host)
method = request.method
url = str(request.url)
headers = await fuckheaders(request.headers)
data = https://www.it610.com/article/await request.read()
return await getresp(app.loop, method, url, headers, data)
return fuck
上面的
getresp
函数其实就是代理服务器向服务器发送请求的处理函数,现在开始编写:async def getresp(loop, method, url, headers, data):
async with ClientSession(loop=loop) as session:
async with session.request(method, url, headers=headers, data=https://www.it610.com/article/data) as resp:
print("<== %s" % resp.host)
body = await resp.read()
headers = await fuckheaders(resp.headers)
response = web.Response(body=body, status=resp.status, reason=resp.reason, headers=headers)
return reponse
初始化函数:
async def init(loop, port):
app = web.Application(loop=loop, middlewares=[factory])
return await loop.create_server(app.make_handler(), "", port)
完成啦,快夸夸自己!几十行代码就能完成一个简单的异步代理服务器,以下是完整代码:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-import sys
import asyncio
from aiohttp import web, ClientSessionbad_headers = ("accept-encoding", "content-encoding", "transfer-encoding", "content-length", "proxy-connection", "connection", "host")async def fuckheaders(headers):
h = {}
for name, value in headers.items():
if name.lower() not in bad_headers:
h[name] = value
h['Connection'] = "close"
return hasync def factory(app, handler):
async def fuck(request):
print("==> %s" % request.host)
method = request.method
url = str(request.url)
headers = await fuckheaders(request.headers)
data = await request.read()
return await getresp(app.loop, method, url, headers, data)
return fuckasync def getresp(loop, method, url, headers={}, data={}):
async with ClientSession(loop=loop) as session:
async with session.request(method, url, headers=headers, data=https://www.it610.com/article/data) as resp:
print("<== %s" % resp.host)
body = await resp.read()
headers = await fuckheaders(resp.headers)
response = web.Response(body=body, status=resp.status, reason=resp.reason, headers=headers)
return responseasync def init(loop, port):
app = web.Application(loop=loop, middlewares=[factory])
return await loop.create_server(app.make_handler(), "", port)def main():
if len(sys.argv) < 2:
print("Usage: %s " % sys.argv[0])
sys.exit(1)
port = int(sys.argv[1])
loop = asyncio.get_event_loop()
loop.run_until_complete(init(loop, port))
loop.run_forever()if __name__ == "__main__":
main()
完事儿 GitHub: https://github.com/maoyouxiao/AioProxy
Blog: http://www.shuiyueyue.com
推荐阅读
- python学习之|python学习之 实现QQ自动发送消息
- 标签、语法规范、内联框架、超链接、CSS的编写位置、CSS语法、开发工具、块和内联、常用选择器、后代元素选择器、伪类、伪元素。
- 逻辑回归的理解与python示例
- python自定义封装带颜色的logging模块
- 【Leetcode/Python】001-Two|【Leetcode/Python】001-Two Sum
- Python基础|Python基础 - 练习1
- Python爬虫|Python爬虫 --- 1.4 正则表达式(re库)
- Python(pathlib模块)
- python青少年编程比赛_第十一届蓝桥杯大赛青少年创意编程组比赛细则
- Python数据分析(一)(Matplotlib使用)