网管联盟 | 网管论坛 | 网管u家 | 网管博客 | 网管软件 | 网管求职 | 小游戏 | 网管搜索 | 网管原创 | 网管聚合 | 网管读摘 | 网管焦点 | 世界素材 | 会员投稿 | 会员中心 
中国网管联盟
Windows Linux Cisco 网络技术 数据库 黑客攻防 DotNet Java PHP 认证 新闻资讯 服务器 存储资讯 网络设备 网管学堂 技术专题 焦点 网吧频道
 当前位置: > bitsCN.com > JAVA > J2EE > J2ee核心 > Java/J2EE中文问题终极解决之道  

Java/J2EE中文问题终极解决之道

2005-12-14  作者:BitsCN整理  来源:中国网管联盟  点评 投稿 收藏

  Java中文问题一直困扰着很多初学者,如果了解了Java系统的中文问题原理,我们就可以对中文问题能够采取根本的解决之道。 网管网www_bitscn_com

  最古老的解决方案是使用String的字节码转换,这种方案问题是不方便,我们需要破坏对象封装性,进行字节码转换。

中国网管联盟bitsCN.com

  还有一种方式是对J2EE容器进行编码设置,如果J2EE应用系统脱离该容器,则会发生乱码,而且指定容器配置不符合J2EE应用和容器分离的原则。

网管u家u.bitscn@com

  在Java内部运算中,涉及到的所有字符串都会被转化为UTF-8编码来进行运算。那么,在被Java转化之前,字符串是什么样的字符集? Java总是根据操作系统的默认编码字符集来决定字符串的初始编码,而且Java系统的输入和输出的都是采取操作系统的默认编码。

网管u家u.bitscn@com

  因此,如果能统一Java系统的输入、输出和操作系统3者的编码字符集合,将能够使Java系统正确处理和显示汉字。这是处理Java系统汉字的一个原则,但是在实际项目中,能够正确抓住和控制住Java系统的输入和输出部分是比较难的。J2EE中,由于涉及到外部浏览器和数据库等,所以中文问题乱码显得非常突出。

网管u家u.bitscn@com

  J2EE应用程序是运行在J2EE容器中。在这个系统中,输入途径有很多种:一种是通过页面表单打包成请求(request)发往服务器的;第二种是通过数据库读入;还有第3种输入比较复杂,JSP在第一次运行时总是被编译成Servlet,JSP中常常包含中文字符,那么编译使用javac时,Java将根据默认的操作系统编码作为初始编码。除非特别指定,如在Jbuilder/eclipse中可以指定默认的字符集。 中国网管论坛bbs.bitsCN.com

  输出途径也有几种:第一种是JSP页面的输出。由于JSP页面已经被编译成Servlet,那么在输出时,也将根据操作系统的默认编码来选择输出编码,除非指定输出编码方式;还有输出途径是数据库,将字符串输出到数据库。 网管联盟bitsCN_com

  由此看来,一个J2EE系统的输入输出是非常复杂,而且是动态变化的,而Java是跨平台运行的,在实际编译和运行中,都可能涉及到不同的操作系统,如果任由Java自由根据操作系统来决定输入输出的编码字符集,这将不可控制地出现乱码。 中国网管联盟bitsCN.com

  正是由于Java的跨平台特性,使得字符集问题必须由具体系统来统一解决,所以在一个Java应用系统中,解决中文乱码的根本办法是明确指定整个应用系统统一字符集。 网管下载dl.bitscn.com

  指定统一字符集时,到底是指定ISO8859_1 、GBK还是UTF-8呢? 网管u家u.bitscn@com

  (1)如统一指定为ISO8859_1,因为目前大多数软件都是西方人编制的,他们默认的字符集就是ISO8859_1,包括操作系统Linux和数据库MySQL等。这样,如果指定Jive统一编码为ISO8859_1,那么就有下面3个环节必须把握: 网管联盟bitsCN_com

  开发和编译代码时指定字符集为ISO8859_1。 网管联盟bitsCN_com

  运行操作系统的默认编码必须是ISO8859_1,如Linux。 网管u家u.bitscn@com

  在JSP头部声明:<%@ page contentType=\"text/html;charset=ISO8859_1\" %>。

网管u家u.bitsCN.com

  (2)如果统一指定为GBK中文字符集,上述3个环节同样需要做到,不同的是只能运行在默认编码为GBK的操作系统,如中文Windows。 网管联盟bitsCN@com

  统一编码为ISO8859_1和GBK虽然带来编制代码的方便,但是各自只能在相应的操作系统上运行。但是也破坏了Java跨平台运行的优越性,只在一定范围内行得通。例如,为了使得GBK编码在linux上运行,设置Linux编码为GBK。

中国网管论坛bbs.bitsCN.com

  那么有没有一种除了应用系统以外不需要进行任何附加设置的中文编码根本解决方案呢? 中国网管论坛bbs.bitsCN.com

  将Java/J2EE系统的统一编码定义为UTF-8。UTF-8编码是一种兼容所有语言的编码方式,惟一比较麻烦的就是要找到应用系统的所有出入口,然后使用UTF-8去“结扎”它。

网管论坛bbs_bitsCN_com

  一个J2EE应用系统需要做下列几步工作:

网管bitscn_com

  开发和编译代码时指定字符集为UTF-8。JBuilder和Eclipse都可以在项目属性中设置。 中国网管联盟bitsCN.com

  使用过滤器,如果所有请求都经过一个Servlet控制分配器,那么使用Servlet的filter执行语句,将所有来自浏览器的请求(request)转换为UTF-8,因为浏览器发过来的请求包根据浏览器所在的操作系统编码,可能是各种形式编码。关键一句: 网管联盟bitsCN_com

    request.setCharacterEncoding(\"UTF-8\")。 网管网www_bitscn_com

    网上有此filter的源码,Jdon框架源码中com.jdon.util.SetCharacterEncodingFilter 中国网管论坛bbs.bitsCN.com

    需要配置web.xml 激活该Filter。 中国网管论坛bbs.bitsCN.com

    在JSP头部声明:<%@ page contentType=\"text/html;charset= UTF-8\" %>。

中国网管论坛bbs.bitsCN.com

    在Jsp的html代码中,声明UTF-8: 中国网管论坛bbs.bitsCN.com

    <meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">

网管u家u.bitsCN.com

    设定数据库连接方式是UTF-8。例如连接MYSQL时配置URL如下:

网管bitscn_com

    jdbc:mysql://localhost:3306/test?useUnicode=true&characterEncoding=UTF-8 网管论坛bbs_bitsCN_com

    一般数据库都可以通过管理设置设定UTF-8

网管u家u.bitscn@com

    其他和外界交互时能够设定编码时就设定UTF-8,例如读取文件,操作XML等。

网管网www_bitscn_com

  笔者以前在Jsp/Servlet时就采取这个原则,后来使用Struts、Tapestry、EJB、Hibernate、Jdon等框架时,从未被乱码困扰过,可以说适合各种架构。希望本方案供更多初学者分享,减少Java/J2EE的第一个拦路虎,也避免因为采取一些临时解决方案,导致中文问题一直出现在新的技术架构中。 网管论坛bbs_bitsCN_com


TAGs解决   终极   问题   中文   编码   Java   UTF-8   操作系统   指定    
 上一篇:成功规划面向服务的架构SOA实施   下一篇:J2ME三种低级用户界面事件处理比较
相关文章列表
Java/J2EE中文问题终极解决之道 评论:
loading.. 评论加载中…
评论:请自觉遵守互联网相关政策法规,评论不得超过250字。

验证码: 注册用户
本类热门排行:
1.Myeclipse4.0 Tomcat5.0 j2sdk
2.Axis2 中的工具wsdl2Java 的使用点滴
3.J2EE体系结构
4.介绍关于IBM MQSeries的使用指南
5.怎么样配置Weblogic的数据源
6.struts+spring+ibatis轻量级J2EE开发
7.你能过关吗?J2EE面试题集锦(附答案)
8.使用Socket连接穿越CMWAP代理
9.Java/J2EE中文问题终极解决之道
10.用OSCache提升J2EE系统运行性能
最新推荐文章:
1.J2EE中SQL语句自动构造方法
2.J2EE系统优化之对象与循环
3.经验交流:学习J2EE流程中的经验和教训
4.基于NetBeans 比较Java EE 5平台和J2EE 1
5.初学者如何开发出一个高质量J2EE系统
6.编写JSR-168 Portlet指南
7.基于J2EE的电子商务开发模型及其实现
8.JNI调用C/C++方法从控制台输入密码
9.在NetBeans 4.1中使用Swing组件
10.Java EE/J2EE面向对象编程之道
网管论坛交流:
·不疯魔不成活
·令你大开眼界的真正标准化机房,已整理重
·为赈灾,女孩舍身拍“裸照”
·Windows Server 2003服务器群集创建和配
·exchange2k3全套官方资料
·双儿一周岁了。。。特殊的礼物来啦。。
·存储备份技术版块守则
·无盘技术交流区守则
·DOS命令基础大全之命令详解<作者吐血
·Windows XP 操作系统默认设置需要注意的