在项目中总是遇到乱码问题,有时候在网上查找到了解决方案,但是没有记录下来为什么出现的乱码。因为出现乱码的方式有好几种,我简单总结一下吧,为以后留着用,也算总结学习一下。 
一般来讲,为了处理乱码问题,在javaweb中我们需要注意哪些地方? 
1、java文件的编码格式 
2、jsp页面的编码格式 
3、在servlet中对request、response对象的编码格式的设定 
4、浏览器中查看页面的字符集编码格式 
前提: 
1.开发和编译代码时指定字符集,JBuilder和Eclipse都可以在项目属性中设置。页面的编码格式一致: 
所有页面的编码格式应该尽量一样,因为有时候在两个页面之间跳转的时候,如果编码格式不一,那么服务器不知道该用哪一种编码格式。 
2.页面编码格式和tomcat配置文件中的编码格式保持一致: 
tomcat/conf/server.xml配置文件中Connector(连接器)标签URIEncoding(统一资源标示符编码)的属性为GBK或UTF-8。 
3.使用过滤器,如果所有请求都通过一个servlet控制分配器,那么使用servlet的filter的执行语句,将浏览器发送过来的请求都设置编码为utf-8. 
在web.xml文件中: 
Xml代码 


- <filter>
 - <filter-name>SetCharacterEncodingFilter</filter-name>
 - <filter-class>com.struts.beans.SetCharacterEncodingFilter</filter-class>
 - <init-param>
 - <param-name>encoding</param-name>
 - <param-value>utf-8</param-value>
 - </init-param>
 - </filter>
 - <filter-mapping>
 - <filter-name>SetCharacterEncodingFilter</filter-name>
 - <url-pattern>/*</url-pattern>
 - </filter-mapping> 
 
 <filter>
<filter-name>SetCharacterEncodingFilter</filter-name>
<filter-class>com.struts.beans.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>utf-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>SetCharacterEncodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
在类中: 
Java代码 



- public class SetCharacterEncodingFilter implements Filter {
 -       private String encoding;
 -       public void init(FilterConfig filterConfig) throws ServletException {
 -             // TODO Auto-generated method stub 
 -             this.encoding = filterConfig.getInitParameter(encoding);
 -       }
 -       public void doFilter(ServletRequest request, ServletResponse response,
 -       FilterChain chain) throws IOException, ServletException {
 -             
 -             request.setCharacterEncoding(this.encoding);
 -             chain.doFilter(request, response);
 -       }} 
 
public class SetCharacterEncodingFilter implements Filter {
      private String encoding;
      public void init(FilterConfig filterConfig) throws ServletException {
            // TODO Auto-generated method stub
            this.encoding = filterConfig.getInitParameter(encoding);
      }
      public void doFilter(ServletRequest request, ServletResponse response,
      FilterChain chain) throws IOException, ServletException {
            request.setCharacterEncoding(this.encoding);
            chain.doFilter(request, response);
      }}
4.设定数据库连接方式是utf-8. 
易出现乱码的方式: 
1.通过<a>超链接传递中文乱码。超链接地址栏传参和form表单的get方法,都是以get()方式向服务器提交的数据。这个时候我们会发现地址栏中出现的是中文被编码之后的一串%的东东, 
Java代码 



- <a href=some.jsp?key=<%=java.net.URLEncoder.encode(可能包含中文的参数,UTF-8)%>>联结</a> 
 
<a href=some.jsp?key=<%=java.net.URLEncoder.encode(可能包含中文的参数,UTF-8)%>>联结</a> 
2.通过javascript传递中文乱码 
Java代码 



- function getName(){
 - var name=jQuery(#name).val(); 
 - name= encodeURI(encodeURI(name));//需要经过两次编码 
 - window.location.href=user.action?name=+name;
 - } 
 
function getName(){
var name=jQuery(#name).val();
name= encodeURI(encodeURI(name));//需要经过两次编码
window.location.href=user.action?name=+name;
}
在后台Action类中需要解码: 
Java代码 



- String name= request.getParameter(name);
 - try {
 - name= URLDecoder.decode(name, UTF-8);
 - } catch (UnsupportedEncodingException e) {
 - e.printStackTrace();
 - } 
 
String name= request.getParameter(name);
try {
      name= URLDecoder.decode(name, UTF-8);
} catch (UnsupportedEncodingException e) {
      e.printStackTrace();
}
因为iso-8859-1是Java中网络传输使用的标准字符集,request.getParameter(name)得到的还是ISO-8859-1字符集,所以要转换一下才不会是乱码。 
3.通过表单get提交中文乱码 
第一:先解码然后转码 
第二:get走的是url提交方式,而在进入url之前已经进行了iso-8859-1的编码。要想影响这个编码可以在server.xml文件中Connector节点中添加userBodyEncodingURI=true,就可以控制tomcat对get方式的汉字编码。 
4.通过表单post提交中文乱码 
第一:其实这也和tomcat的内置编码有关,如果没有设置URIEncoding=UTF-8,那么默认的编码是iso8859-1,需要在servlet中String str=new String(request.getParameter(name).getBytes(ISO-8859-1),UTF-8).每一个汉字都需要这样编码,很麻烦。 
第二:设定执行请求编码的格式request.setCharactorEncoding(UTF-8); 
String str=request.getParameter(name);但是这种方法只针对post提交的参数有效,对于get和上传的方式则是无能为力的。 
该贴由koei转至本版2014-5-2 16:22:00