Vim 乱码原因及解决方法

然后今天在windows下使用GVIM打开一个文件时又悲剧了。感觉太操蛋了,于是花了1个小时研究了一下VIM乱码原因,然后发现:so easy。以后再遇到乱码,应该分分钟就可以秒杀了。







  • windows:开始-控制面板-时钟、语言和区域-区域和语言-管理-更改系统区域设置
  • windows:在cmd输入chcp
  • windows:在cmd输入systeminfo
  • linux:locale


  • windows:简体中文,也就是gb2312或者gb18030
  • windows:输出936就是简体中文
  • windows:zh-ch,也相当于zh_CN,简体中文
  • linux:en_US.UTF-8,也就是utf8




  • encoding:VIM内部编码
  • fillencoding:文件本身的编码(用于告知VIM文件的编码)
  • fillencodings:VIM可处理的文件编码列表
  • termencoding:VIM用于显示的编码

VIM help中的详细描述:

####1. encoding:

Sets the character encoding used inside Vim.  It applies to text in the buffers, registers, Strings in expressions, text stored in the viminfo file, etc. ** It sets the kind of characters which Vim can work with**. Normally ‘encoding’ will be equal to your current locale.  This will be the default if Vim recognizes your environment settings.  If ‘encoding’ is not set to the current locale, ‘termencoding’ must be set to convert typed and displayed text.

####2. fillencoding:

Sets the character encoding for the file of this buffer. When ‘fileencoding’ is different from ‘encoding’, conversion will be done when reading and writing the file. When ‘fileencoding’ is empty, the same value as ‘encoding’ will be used (no conversion when reading or writing a file). When reading a file ‘fileencoding’ will be set from ‘fileencodings’

####3. fillencodings:

This is a list of character encodings considered when starting to edit an existing file.  When a file is read, Vim tries to use the first mentioned character encoding.  If an error is detected, the next one in the list is tried.  When an encoding is found that works, ‘fileencoding’ is set to it.  If all fail, ‘fileencoding’ is set to an empty string, which means the value of ‘encoding’ is used.

####4. termencoding:

Encoding used for the terminal.  This specifies what character encoding the keyboard produces and the display will understand.  For the GUI it only applies to the keyboard (‘encoding’ is used for the display). When empty, the same encoding is used as for the ‘encoding’ option. This is the normal value.


####1. encoding:


####2. fillencodings:


####3. fillencoding:


####4. termencoding:

termencoding是 Vim 用于屏幕显示的编码,在显示的时候,Vim 会把内部编码(encoding)转换为屏幕编码(termencoding)后,再用于输出。内部编码中含有无法转换为屏幕编码的字符时,该字符会变成问号,但不会影响对它的编辑操作。如果termencoding没有设置,则直接使用encoding,不进行转换。比如:当你在 Windows 下通过 telnet 登录 Linux 工作站时,由于 Windows 的 telnet 是 GBK 编码的,而 Linux 下使用 UTF-8 编码,你在 telnet 下的 Vim 中就会乱码。此时有两种消除乱码的方式:一是把 Vim 的encoding改为gbk,另一种方法是保持encoding为utf8,把termencoding改为gbk,让 Vim 在显示的时候转码。显然,使用前一种方法时,如果遇到编辑的文件中含有 GBK 无法表示的字符时,这些字符就会丢失。但如果使用后一种方法,虽然由于终端所限,这些字符无法显示,但在编辑过程中这些字符是不会丢失的。


  1. 你在linux下有一个big5编码的文件,你的操作系统使用的是utf8编码。当你用VIM打开这个文件时:
  2. VIM查看encoding,如果没有设置,就使用locale的utf8作为内部编码,如果设置为big5,就使用big5作为内部编码
  3. VIM读入文件时,从fillencodings依次查看是否有big5,如果有就设置fillencoding为big5,如果没有,就设置为空
  4. 用户从终端输入hello,VIM查看termencoding,比如设置为gb2312,那么hello就从gb2312转为encoding格式的hello
  5. VIM处理完毕,退出时,将文件的内容从encoding转为fillencoding




  1. 操作系统的编码locale
  2. VIM内部编码encoding
  3. termencoding


locale = encoding = termencoding

只要你把这3个编码的格式都统一,保证手到乱码除 :-)

