怎样写代码 编码是什么意思( 三 )


Unicode使用唯一的16位模式来表示每个符号 。因此,Unicode由65,536种不同的位模式组成——足以表示用中文、日文、希伯来文和其他语言编写的文档 , 这是Unicode相对于ASCII的最大优势 。
Unicode Unicode Unicode又称通用码 , 是为满足跨语言、跨平台的文本转换和处理要求而设计的计算机字符编码 。它为每种语言中的每个字符设置了统一且唯一的二进制代码 。Unicode编码方式对应ISO10646通用字符集(也叫通用字符集)的概念 , 使用16位编码空 。也就是说,每个字符占用2个字节 。
对于中文,Unicode16已经包含了GB18030中的所有中文字符(27,484个单词) 。
Unicode是从ASCII字符集扩展而来的 。它采用16位编码,并可扩展至32位 , 这使得Unicode可以代表世界上所有书面语言中可能用于计算机通信的字符、象形文字和其他符号 , 这使得它有可能成为ASCII的替代品 。
UTF-8是互联网上使用最广泛的Unicode实现之一 。其他实现还有UTF-16(字符用两个字节或四个字节表示)和UTF-32(字符用四个字段表示),但在互联网上基本不用 。同样,这里的关系是UTF-8是Unicode的实现之一 。
UTF-8最大的特点之一是它是一种可变长度的编码方法 。它可以用1~4个字节来表示一个符号,字节长度根据符号的不同而不同 。
UTF-8的编码规则很简单,只有两条:
1)对于单字节符号,字节的第一位设置为0 , 后7位为该符号的Unicode编码 。因此,对于英文字母,UTF-8编码和ASCII编码是相同的 。
2)对于n字节(n > 1)的符号 , 第一个字节的前n位全部设置为1,第n+1位设置为0,后面字节的前两位全部设置为10 。其余未提及的二进制位都是该符号的Unicode编码 。
5静止图像编码静态图像是与动态图像相对应的概念,指的是单张图片 。它是计算机广泛使用的一种主要信息形式 。
表示电脑静止图像的两种方式:
位图图像
矢量图
由于静态图像数据包含的信息量大 , 其信息具有一定的规律,一般不采用直接编码的方式进行编码,而是经常采用一些压缩算法来表示图像信息 。
5.1位图图像
在位图图像表示方法中,图像被分成像素矩阵,也称为点阵,每个像素是一个点 。像素大小取决于分辨率 。
将图像分成像素后,每个像素被分配一个位模式 。图案的大小和值取决于图像 。
比如 , 对于一个只由黑白点组成的图像(比如棋盘),1位的图案就足以代表一个像素的 。0模式表示黑色像素,1模式表示白色像素 。如果使用8位,可以表示256种颜色信息 。
位图文件的基本编码格式是BMP(位图的缩写)文件 。BMP是一种独立于硬件设备的图像文件格式 。
TaggedImageFileFormat (TIFF)格式是图像领域广泛使用的编码形式,主要用于存储照片、艺术图纸等对图像质量要求较高的平面图像 。它也是一种位图文件格式 。
位图文件的方法,体积太大,给计算机的存储和传输带来很大压力 。
静态图像文件信息有一定的规律 。在保证其基本信息正确的前提下,可以通过一定的算法适当减小图像文件的大小 。
为了存储和传输数据,在保持原始内容的同时减少所涉及的数据的大小是有益的(有时是必要的) 。这项技术被称为数据压缩 。有两种类型的数据压缩方案 。一个是无损压缩,一个是有损压缩 。
无损压缩:指压缩后信息表达质量不降低,但文件大小减小 。
有损压缩是指在不影响信息表达质量的前提下,尽可能减小文件大小 , 以提高压缩效率 。
5.2矢量图
位图表示的问题是,在用精确的位模式表示后,特定的图像必须存储在计算机中 。然后,如果你想调整图像的大小,你必须改变像素的大?。?这将动摇屏幕 。
矢量表示法不存储位模式 , 而是将图像分解成一些曲线和直线的组合,其中每条曲线或直线用一个数学公式表示 。
当要显示或打印图像时 , 图像的大小作为输入被传输到系统 。系统重新设计图像尺寸,用同样的公式绘制图像 。
每次调整矢量图片时 , 计算机都会重新评估绘制公式,并根据新的公式绘制图像 。由于重估公式的计算量远小于调整后的像素,因此可以有效避免屏幕抖动 。
6动态数据的编码随着计算机使用的深入,涉及的信息类型越来越广泛,不仅包括静态信息,还包括声音、动画、图像等动态信息 。
计算机动态信息根据其表达方式可分为两类:

推荐阅读