js的字符编码

(1)JavaScript的Global对象的encodeURI()/decodeURI()和encodeURIComponent()/decodeURIComponent()
encodeURI(),encodeURIComponent()方法用于编码传递给浏览器的URI(统一资源标识符)。
encodeURI()方法用于处理完整的URI(如:http://www.wrox.com/illegal.value.htm)
encodeURIComponent()用于处理URI的片段
两者的区别是:
encodeURI()方法不对URI中的特殊字符进行编码,如冒号,前斜杠,问号和英镑符号,而encodeURIComponent()则对它发现的所有非标准字符进行编码。
如:
var sUri = “http://www.wrox.com/illegal value.html#start”;
alert(encodeURI(sUri));
alert(encodeURIComponent(sUri));

这段代码输出两个值:
http://www.wrox.com/illegal%20value.html#start
http%3A%2F%2Fwww.wrox.com%2Fillegal%20value.htm%23start

可以看出,第二个地址中的所有非字母数字字符都被替换成它们对应的编码,基本上使这个URI变得无用。因此说encodeURI()可以处理完整的URI,而encodeURIComponent()只能处理附加在已有URI末尾的字符串的原因。
对应decodeURI()和decodeURIComponent()进行解码


(2)BOM方法escape()和unescape()
区别:
encodeURI()、encodeURIComponent()、decodeURI()、decodeURIComponent()只会对所有Unicode符号编码,解码。
而BOM方法escape()、unescape()只能对ASCII符号正确编码。
因此,尽量避免使用escape()和unescape()方法


小结:
下面简单介绍一下它们的区别:
1、 escape()函数
对字符串进行编码,这样就可以在所有的计算机上读取该字符串。
语法 : escape(string)//string:必需。要被转义或编码的字符串。返回值 :已编码的 string 的副本。其中某些字符被替换成了十六进制的转义序列。
注意:该方法不会对 ASCII 字母和数字进行编码,也不会对下面这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。其他所有的字符都会被转义序列替换。


2、encodeURI()函数
encodeURI() 函数可把字符串作为 URI 进行编码。
语法 :encodeURI(URIstring)//URIstring:必需,一个字符串,含有 URI 或其他要编码的文本。返回值:URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。
注意:该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。该方法的目的是对 URI 进行完整的编码,因此对以下在 URI 中具有特殊含义的 ASCII 标点符号,encodeURI() 函数是不会进行转义的:; /?:@&=+$,#


3、encodeURIComponent()函数
encodeURIComponent() 函数可把字符串作为 URI 组件进行编码。
语法:encodeURIComponent(URIstring) //URIstring必需。一个字符串,含有 URI 组件或其他要编码的文本。 返回值:URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。
注意:该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。
其他字符(比如 :; /?:@&=+$,# 这些用于分隔 URI 组件的标点符号),都是由一个或多个十六进制的转义序列替换的。
提示和注释
提示:请注意 encodeURIComponent() 函数 与 encodeURI() 函数的区别之处,前者假定它的参数是 URI 的一部分(比如协议、主机名、路径或查询字符串)。因此 encodeURIComponent() 函数将转义用于分隔 URI 各个部分的标点符号。


4 总结:
通过对三个函数的分析,我们可以知道:escape()除了 ASCII 字母、数字和特定的符号外,对传进来的字符串全部进行转义编码,因此如果想对URL编码,最好不要使用此方法。而encodeURI() 用于编码整个URI,因为URI中的合法字符都不会被编码转换。encodeURIComponent方法在编码单个URIComponent(指请求参数)应当是最常用的,它可以讲参数中的中文、特殊字符进行转义,而不会影响整个URL。





5 示例:


(1) escape()

输出:


http%3A//www.w3school.com.cn


%3F%21%3D%28%29%23%25%26

【js的字符编码】

(2) encodeURI()


输出:


http://www.w3school.com.cn/


http://www.w3school.com.cn/My%20first/


,/?:@&=+$#


对整个URL进行编码,而URL的特定标识符不会被转码。




(3) encodeURIComponent()


例1:





对URL中的参数进行编码,因为参数也是一个URL,如果不编码会影响整个URL的跳转。



    推荐阅读