Tomcat的中文處理(三): 数据挖掘实验室
前面废话讲过了,现在我们来分析几个例子:
数据挖掘研究院
数据挖掘工具
1)jsp中如果使用了: 数据挖掘工具
<%@ page contentType="text/html; charset=Shift_JIS" %>
他其实就是指定了response的类型和字符的编码方式,上面指定了response的字符编码是是Shift_JIS。
数据挖掘研究院
在jsp中构造String的时候,如果没有明确指定String的编码,String使用的编码就是charset指定的;如果charset沒有指定字符的编码的话,那么話,就使用ISO-8859-1
注意的是如果沒有指定requset的编码,那么从request得到的String都是iso-8859-1编码的。(上一篇已经讲过了。),他和charset是没有关系的。 数据挖掘实验室
如果要输出的String的编码和response的编码不一样的话,就很可能出现乱码的情況。
数据挖掘工具
举个例子: 数据挖掘交友
<%@ page contentType="text/html; charset=GB2312" %>///////////////指定response的编码为中文简体,那么所有的要输出的字符都要使用和GB2312相适应的编码 数据挖掘工具
<html>
数据挖掘实验室
<head><title></title> 数据挖掘工具
</head>
数据挖掘工具
<body>
数据挖掘论坛
<%
String name=request.getParameter("name");////////得到客户端的參數值,沒有指定request的编码,所以它是编码为iso-8859-1的String的。 数据挖掘实验室
String name1=new String(name.getBytes("ISO-8859-1"),"GB2312");//////////转化为中文简体的编码
String name2="你好";/////直接定義String,使用reponse的编码,这里是GB2312的。
数据挖掘交友
String name21=new String(name2.getBytes("ISO-8859-1")," GB2312");////////从name2转化
System.out.println("name1 is GB2312"+name1); 数据挖掘工具
System.out.println("name is ISO-8859-1"+name);
数据挖掘研究院
System.out.println("name21 is 直接"+name21); 数据挖掘实验室
System.out.println("我们大家");
数据挖掘工具
%> 数据挖掘工具
<form action="./B.jsp" method="POST">
<input type="text" name="name" value="<%=name1%>">
<input type="submit">
</form>
<hr> 数据挖掘工具
name1 is GB2312 <%=name1%><br> 数据挖掘实验室
数据挖掘论坛
name is ISO-8859-1 <%=name%><br> 数据挖掘论坛
数据挖掘实验室
name21 is 直接<%=name21%><br> 数据挖掘研究院
数据挖掘工具
<%="我们大家"%></body> 数据挖掘实验室
</html>
結果:
console中:(他对应response的编码是GB2312的,日文系統是MS932)
数据挖掘工具
name1 is GB2312 你好//////////name1是name转化来的,是GB2312的,所以正常顯示
数据挖掘实验室
name is ISO-8859-1????/////////////name是ISO-8859-1的不能正常顯示的 数据挖掘工具
name21 is 直接???????????????????////////////////由於name2是GB2312編碼的,在name21 =new String(name2.getBytes("GB2312"),"MS932"))發生了錯誤的轉化,所以不能正常的現實,如果將ISO-8859-1換為GB2312就可以了。 数据挖掘研究院
我们大家//////////////////////////////////jsp中定義的string是採用<%@ page contentType="text/html; charset= GB2312" %>指定的編碼,如果沒有指定,就使用iso-8859-1的。 数据挖掘工具
可以看到我們在ie中看到的結果是一樣的。
下面我們將<%@ page contentType="text/html; charset=Shift_JIS" %>去掉。
数据挖掘交友
結果:
console (这个时候,Console的編碼是GB2312,所以编码为GB2312的字符能显示,由于在jsp中构造的String此時使用的iso-8859-1,所以不能显示)
name1 is GB2312你好
name is ISO-8859-1???? 数据挖掘论坛
name21 is ???? 你好/////////////////name2的编码此时为iso-8859-1,所以转化来的name21是正确的
数据挖掘实验室
???????? 数据挖掘交友
ie (这个时候,response的编码是iso-8859-1,所以编码为iso-8859-1的能显示,由于在jsp中构造的String此時使用的iso-8859-1,所以也能显示) 数据挖掘交友
name1 is GB2312??
数据挖掘研究院
name is ISO-8859-1 你好 数据挖掘交友
name21 is 直接 ???????????????????
数据挖掘论坛
我们大家
数据挖掘研究院
数据挖掘工具
顯然不一樣了結果!!!!
数据挖掘实验室