solaris上开发J2EE应用中文问题解决_Tomcat, WebLogic及J2EE讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛

总帖数

每页帖数

1/1页

返回列表

发起投票

查看: 3204 | 回复: 0

主题： solaris上开发J2EE应用中文问题解决

jfl

注册用户

等级：少校
经验：1112
发帖：95
精华：0
注册：2012-8-10
状态：离线
发送短消息息给jfl

加好友发送短消息息给jfl

发消息

发表于：

2012-8-31 13:42:16 | [全部帖] [楼主帖]

楼主

关于JSP和J2EE的中文问题和处理方法，网上已经有很多文章。一般在中文内核的操作系统（如中文NT，windows2000）上，该问题不是很突出，而在其他一些系统（如linux，solaris）中就比较明显了。近日在solaris上开发一个J2EE的应用系统，环境是solaris 2.7+minij2ee+mysql。系统在windows和linux下均没有出现中文处理的问题，但部署到solaris上面后所有中文显示为？。

后来经过分析，发现原因出在系统编码上。由于安装solaris时默认的系统编码为ASCII，因此以默认的系统编码处理字符串时汉字高位信息丢失。下面一段简单的jsp程序说明了这个问题：

在浏览器中输入foo.jsp？i=中文，结果显示为？？。如果将byte［］ b=str.getBytes（）;换成上面注释掉的byte［］ b=str.getBytes（“iso-8859-1”）;，则正常显示出“中文”二字。查阅了mysql JDBC的驱动程序，问题相同。

考虑解决的方法有两个，一个是修改JDBC驱动程序，另一个是将汉字编码成7位，从实现方便的角度选择了后者。不过后者的缺点是字符串长度增加，并且无法直接通过sql工具来修改数据库了。网上有一种汉字编码的方法，是将汉字高位去1，英文则补一个0表示。这种方法有缺陷，因为特定的汉字编码后会出现“‘”等SQL语句中有歧义的字符，导致sql失败。我摘取了minij2ee中uniString的编码方法，该方法将字节表示为其16进制编码，下面是源代码：

public String encode（）
{
      try
      {
            StringBuffer sb=new StringBuffer（）;
            byte［］ bytes=m_enc.compareTo（“”）==0？m_str.getBytes（）：m_str.getBytes（m_enc）;
            for（int i =0;i {
                  char ch;
                  ch=Character.forDigit（（bytes［i］》》4）&0xF，16）;
                  sb.append（ch）;
                  ch=Character.forDigit（bytes［i］&0xF，16）;
                  sb.append（ch）;
            }
            return sb.toString（）;
      }
      catch（java.io.UnsupportedEncodingException e）
      {
            throw new RuntimeException（“Unsupported encoding type.”）;
      }
}
public void decode（String encodestr）
{
      StringBuffer sb=new StringBuffer（）;
      int i=0;
      while（i！=encodestr.length（））
      {
            sb.append（（char）Integer.parseInt（encodestr.substring（i，i+2），16））;
            i+=2;
      }
      m_str=new uniString（sb.toString（），“iso-8859-1”）.cvt（m_enc）;
}

使用编码后，问题解决。

另外提一下，minij2ee最新版本中提供了一个uniString类，解决了在所有操作系统上的中文问题。使用uniString对象，无需关心字符串本身编码，使用时只要调用函数来获得需要的编码即可，如在jsp里调用uniString.gb（）即可以以gb2312输出字符串，在数据库存储时调用uniString.iso（）即可以以iso-8859-1编码输出字符串，无论在中文内核还是英文内核的操作系统上均通用。

本版精华
热门帖子

操作引用/回复

总帖数

每页帖数

1/1页

返回列表

用户登录

Weblogic中间件技术论坛

Tuxedo中间件技术论坛

数据库论坛

Java论坛

Linux/unix论坛

网站地图