文件编码, vim 修改编码

文件编码问题
【文件编码, vim 修改编码】概念:呈现再我们眼前的所有文字字符都是unicode 字符集, unicode 字符集如何保存?通常是用不同的编码编码成字节来存储,常见的有utf-8, gb2312等

  • windows 默认编码是gb2312
  • latin-1 兼容 ascii
文件乱码问题
乱码通常是我们无法用正确的解码方式来将字节解码成unicode, 而出现乱码
  • unicode 经过编码方式1 编码成字节存储,我们用编码方式2 将字节解码成unicode
  • 编码1与编码2 不一致就会出现乱码问题;
vim 编码的几个配置
  • encoding: vim 软件本身的编码方式,通常不用修改;
  • fileencoding: 设置vim 保存文件的编码方式;
  • fileencodings: vimrc 配置中候选的编码方式,当开打一个文件时,会从中选择合适的编码方式打开文件(将字节解码成unicode 呈现再我们眼前)
    通常配置成这个 set fileencodings=ucs-bom,utf-8,utf-16,gbk,big5,gb18030,latin1
如何用特定的编码打开文件
当文件的编码不在fileencodings中,就会出现乱码
  • 如果我们知道文件的编码,可以用 edit ++enc=gb2312 这种方式修改文件打开的编码;
latin-1 的作用
因为latin-1 兼容 ascii, 所以在代码中不了解文件的编码方式时,可用此编码打开文件,虽然会出现乱码,但不会出现错误;

    推荐阅读