Base64编码
Base64是一种基于64个可打印字符来表示二进制数据的表示方法。它已经成为网络上常见的传输8Bit字节代码的编码方式之一。
我们都知道ASCII字符集由95个可打印字符(0x20-0x7E)和33个控制字符(0x00-0x1F,0x7F)组成。可打印字符可显示在输出设备上,例如荧屏或者打印纸上而控制字符没法打印出来,但是每个字符,都对应着一个特殊的控制功能的字符,因此这些字符简称功能字符或功能码 Function Code 。如用记事本打开exe、jpg、pdf这些文件时,我们都会看到一大堆乱码,因为二进制文件包含很多无法显示和打印的字符,所以如果要让记事本这样的文本处理软件能处理二进制数据,就需要一个二进制到字符串的转换方法。
Base64编码原理
Base64协议选用了”A-Z、a-z、0-9、+、/” 64个可打印字符构成了Base64的索引表,如下
文章图片
数值代表字符的索引,这个是标准Base64协议规定的,不能更改。
Base64的码表只有64个字符,如果要表达64个字符的话,使用6的bit即可完全表示(2的6次方为64)。
因为Base64的编码只有6个bit即可表示,而正常的字符是使用8个bit表示, 8和6的最小公倍数是24,所以4个Base64字符可以表示3个标准的ascll字符。如果是字符串转换为Base64码,会先把对应的字符串转换为ascll码表对应的数字,然后再把数字转换为二进制,取8位二进制的前6位,剩下的2个二进制位和后面的二进制继续拼接,依次类推,最后再把6个二进制码转换为Base64对应的编码,如
字符串abc
ASCII979899
8bit01100001 01100010 01100011
6bit011000010110001001100011
十进制2422935
对应编码YWJj
3个ASCII字符刚好转换成对应的4个Base64字符。但是,当需要转换的字符数不是3的倍数的情况下该怎么办呢?Base64规定,当需要转换的字符不是3的倍数时,一律采用补0的方式凑足3的倍数,如:
文章图片
对于文本A,每6个Bit为一组,第一组转换后为字符“Q”,第二组末尾补4个0转换后为字符“Q”。剩下的使用“=”替代。即字符“A”通过Base64编码后为“QQ==”。这就是Base64的编码过程。
在python2中运行如下命令查看
>>> import base64
>>> a=base64.b64encode('A')
>>> a
'QQ=='
>>>
b64encode函数的参数为byte类型,如果字符为unicode编码,需要先进行转码,如
>>> a=base64.b64encode(u'中文'.encode('utf-8'))
>>> a
'5Lit5paH'
>>>
解码命令为
>>> base64.b64decode(a)
'\xe4\xb8\xad\xe6\x96\x87'#“中文”的utf-8编码格式
>>>
>>> print base64.b64decode(a)
中文
Base64编码的应用
Base64编码的应用场景有
1、实现简单的数据加密,使用户一眼望去完全看不出真实数据内容,base64算法的复杂程度要小,效率要高相对较高。
很多下载类网站都提供“下载”的链接,其地址通常是加密的专用下载地址,如
文章图片
其中旋风地址就是由原始地址在其前后分别添加AA和ZZ,再经过base64编码后得到的。如
>>> a=base64.b64encode('www.baidu.com/img/sslm1_logo.gif')
>>> a
'd3d3LmJhaWR1LmNvbS9pbWcvc3NsbTFfbG9nby5naWY='
>>>
2、编码的主要的作用不在于安全性,而在于让内容能在各个网关间无错的传输,这才是Base64编码的核心作用。在计算机中任何数据都是按ascii码存储的,而ascii码的128~255之间的值是不可见字符。而在网络上交换数据时,比如说从A地传到B地,往往要经过多个路由设备,由于不同的设备对字符的处理方式有一些不同,这样那些不可见字符就有可能被处理错误,这是不利于传输的。所以就先把数据先做一个Base64编码,统统变成可见字符,这样出错的可能性就大降低了。
3、应用在url中,url中&a=b是会作为参数名(a)和参数值(b)发送的,如果你发送的参数b中有&,那就会被浏览器认为是另一个参数名了,而这不是你的本意。所以,这时候你就可以把参数值b通过Base64进行编码,而你的服务器在获取到b后再解码b,就得到了原本带有&的b值了。
【Base64编码】 FYI,delete immediately if any infringements declared.
推荐阅读
- swift|swift 编码规范收集
- python深度学习实现自编码器Autoencoder神经网络异常检测心电图ECG时间序列
- Android|Android 寻找极限编码的「快感」
- protobuf编码详解
- 初入eclipse配置环境的第一个坑(sun.misc.BASE64Encoder)
- 理解|理解 RGB & YUV 颜色编码
- 换行格式的Base64转换报错 "Illegal base64 character a"
- gpushare.com_基于去噪Transformer的无监督句子编码【EMNLP 2021】
- PyTorch之对类别张量进行one-hot编码
- 程序员编码加速器,代码智能补全工具盘点