·您的位置: 首页 » 资源教程 » 编程开发 » JAVA、JSP » java中文问题-浅析

java中文问题-浅析

类别: JAVA教程  评论数:0 总得分:0
jsp之中什么问题最难处理?小弟在几天前想安装jsp+javabean论坛acjspbbs,研究了3天之后,明白了答案就是java中处理中文的问题。

acjspbbs采用的字符编码是GBK,我采用的是WIN2k系统,正常来说应该是水到渠成的,但是,竟然被我发现,它的javabean中保存入数据库语句是使用的是ISO8859-1编码,直接导致所以从数据库取出的资料全部乱码,包括:论坛名等常量、用户发的帖子标题和内容等等。

其实,java系统内部会把全部的字符串统一使用UTF-8编码,而在内部转化之前会使用操作系统默认的编码,其中包括输入和输出。要想不乱码,只需要“统一java系统的输入、输出以及操作系统的字符集”,这也是处理java系统汉字的一个原则。原因是由于java的跨平台特性,字符集必须由具体的操作系统给出。

由此可以得到一个最简单的解决jsp乱码的办法,其中主要需要把握三个环节:
1、开发和编译代码时就指定一个字符集,比如ISO-8859-1(西方的系统多数使用这个)
2、确定操作系统的字符集跟1统一,比如也用ISO-8859-1,这样的OS有很多,linux就是啦
3、如果开发jsp,每个页面都明确指定字符集:
<%@ page contentType="text/html;charSet=ISO8859-1" %>

这样就达到了前面的目标,统一了三者的字符编码。

这样的系统虽然很好,没有乱码问题,但是显然是以破坏跨平台特性为代价换取来的。想要根本解决问题,看来只有将java系统统一为UTF-8编码,这需要找到所有的出入口。

具体需要注意以下几个环节:
1、开发和编译时候指定字符集为UTF-8
2、用过滤器将所有请求转为UTF-8字符集编码
如果是用一个servlet控制分配的就在servlet的filter中写
request.setCharacterEncoding("UTF-8")
如果是用jsp页面,就在头部定义
<%@ page contentType="text/html;charSet=UTF-8" %>
3、在所有的输出上包括数据库连接上都指定使用字符集UTF-8

另外:如果你在做二次开放,就需要重新编译包,指定使用UTF-8编码

附:在编译时指定字符集的语法是javac -encoding <encoding> <sourcefile>

说明:这里很多观点是引用他人的,但是我自己使用过,是绝对有效的解决办法。




-= 资 源 教 程 =-
文 章 搜 索
关键词:
类型:
范围:
纯粹空间 softpure.com
Copyright © 2006-2008 暖阳制作 版权所有
QQ: 15242663 (拒绝闲聊)  Email: faisun@sina.com
 纯粹空间 - 韩国酷站|酷站欣赏|教程大全|资源下载|免费博客|美女壁纸|设计素材|技术论坛   Valid XHTML 1.0 Transitional
百度搜索 谷歌搜索 Alexa搜索 | 粤ICP备19116064号-1