[转帖]     java web 中文乱码相关问题总结_Android, Python及开发编程讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  Android, Python及开发编程讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 13083 | 回复: 0   主题: [转帖]     java web 中文乱码相关问题总结        下一篇 
    本主题由 522080330 于 2013-1-24 15:14:50 置为精华
522080330
注册用户
等级:少校
经验:1478
发帖:79
精华:20
注册:2013-1-18
状态:离线
发送短消息息给522080330 加好友    发送短消息息给522080330 发消息
发表于: IP:您无权察看 2013-1-24 15:11:15 | [全部帖] [楼主帖] 楼主

在项目中总是遇到乱码问题,有时候在网上查找到了解决方案,但是没有记录下来为什么出现的乱码。因为出现乱码的方式有好几种,我简单总结一下吧,为以后留着用,也算总结学习一下。
一般来讲,为了处理乱码问题,在javaweb中我们需要注意哪些地方?
1、java文件的编码格式
2、jsp页面的编码格式
3、在servlet中对request、response对象的编码格式的设定
4、浏览器中查看页面的字符集编码格式
前提:
1.开发和编译代码时指定字符集,JBuilder和Eclipse都可以在项目属性中设置。页面的编码格式一致:
所有页面的编码格式应该尽量一样,因为有时候在两个页面之间跳转的时候,如果编码格式不一,那么服务器不知道该用哪一种编码格式。
2.页面编码格式和tomcat配置文件中的编码格式保持一致:
tomcat/conf/server.xml配置文件中Connector(连接器)标签URIEncoding(统一资源标示符编码)的属性为"GBK"或"UTF-8"。
3.使用过滤器,如果所有请求都通过一个servlet控制分配器,那么使用servlet的filter的执行语句,将浏览器发送过来的请求都设置编码为utf-8.
在web.xml文件中:
Xml代码 北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. <filter>
  2. <filter-name>SetCharacterEncodingFilter</filter-name>
  3. <filter-class>com.struts.beans.SetCharacterEncodingFilter</filter-class>
  4. <init-param>
  5. <param-name>encoding</param-name>
  6. <param-value>utf-8</param-value>
  7. </init-param>
  8. </filter>
  9. <filter-mapping>
  10. <filter-name>SetCharacterEncodingFilter</filter-name>
  11. <url-pattern>/*</url-pattern>
  12. </filter-mapping>

<filter>
<filter-name>SetCharacterEncodingFilter</filter-name>
<filter-class>com.struts.beans.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>utf-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>SetCharacterEncodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>


在类中:
Java代码 北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. public class SetCharacterEncodingFilter implements Filter { 
  2.       private String encoding; 
  3.       public void init(FilterConfig filterConfig) throws ServletException { 
  4.             // TODO Auto-generated method stub 
  5.             this.encoding = filterConfig.getInitParameter("encoding"); 
  6.       } 
  7.       public void doFilter(ServletRequest request, ServletResponse response, 
  8.       FilterChain chain) throws IOException, ServletException { 
  9.             
  10.             request.setCharacterEncoding(this.encoding); 
  11.             chain.doFilter(request, response); 
  12.       }} 

public class SetCharacterEncodingFilter implements Filter {
       private String encoding;
      public void init(FilterConfig filterConfig) throws ServletException {
             // TODO Auto-generated method stub
             this.encoding = filterConfig.getInitParameter("encoding");
       }
      public void doFilter(ServletRequest request, ServletResponse response,
       FilterChain chain) throws IOException, ServletException {
            request.setCharacterEncoding(this.encoding);
            chain.doFilter(request, response);
      }}
      


4.设定数据库连接方式是utf-8.
易出现乱码的方式:
1.通过<a>超链接传递中文乱码。超链接地址栏传参和form表单的get方法,都是以get()方式向服务器提交的数据。这个时候我们会发现地址栏中出现的是中文被编码之后的一串%的东东,

Java代码 北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. <a href="some.jsp?key=<%=java.net.URLEncoder.encode("可能包含中文的参数","UTF-8")%>">联结</a>

<a href="some.jsp?key=<%=java.net.URLEncoder.encode("可能包含中文的参数","UTF-8")%>">联结</a>


2.通过javascript传递中文乱码
Java代码 北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. function getName(){
  2. var name=jQuery("#name").val();
  3. name= encodeURI(encodeURI(name));//需要经过两次编码
  4. window.location.href="user.action?name="+name;
  5. }

function getName(){
       var name=jQuery("#name").val();
       name= encodeURI(encodeURI(name));//需要经过两次编码
       window.location.href="user.action?name="+name;
}


在后台Action类中需要解码:
Java代码 北京联动北方科技有限公司北京联动北方科技有限公司北京联动北方科技有限公司

  1. String name= request.getParameter("name");
  2. try {
  3. name= URLDecoder.decode(name, "UTF-8");
  4. } catch (UnsupportedEncodingException e) {
  5. e.printStackTrace();
  6. }

String name= request.getParameter("name");
try {
      name= URLDecoder.decode(name, "UTF-8");
} catch (UnsupportedEncodingException e) {
      e.printStackTrace();
}


因为iso-8859-1是Java中网络传输使用的标准字符集,request.getParameter("name")得到的还是ISO-8859-1字符集,所以要转换一下才不会是乱码。
3.通过表单get提交中文乱码
第一:先解码然后转码
第二:get走的是url提交方式,而在进入url之前已经进行了iso-8859-1的编码。要想影响这个编码可以在server.xml文件中Connector节点中添加userBodyEncodingURI="true",就可以控制tomcat对get方式的汉字编码。
4.通过表单post提交中文乱码
第一:其实这也和tomcat的内置编码有关,如果没有设置URIEncoding="UTF-8",那么默认的编码是iso8859-1,需要在servlet中String str=new String(request.getParameter("name").getBytes("ISO-8859-1"),"UTF-8").每一个汉字都需要这样编码,很麻烦。
第二:设定执行请求编码的格式request.setCharactorEncoding("UTF-8");
String str=request.getParameter("name");但是这种方法只针对post提交的参数有效,对于get和上传的方式则是无能为力的。




赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论