Servlet使用get方法在控制台返回信息中文字符出现乱码;具体代码如下 String queryString=request.getQueryString(); System.out.println("QueryString="+ queryString); //把接收的信息通过函数split进行分割 String queryStrings[]=queryString.split("&"); for(String s:queryStrings){ //System.out.println(s); String [] name_value=s.split("="); System.out.println(name_value[0]+"="+myTools.getNewString((name_value[1]))); } ******************myTools.getNewString( )方法是利用String(str.getBytes(“iso-8859-1″),”GB2312”)构造的一个方法************* ****在浏览器输入http://localhost:8080/ServletRequest/getInfo?unsername=刘强&password=123
|
|
对于GET方式,我们知道它的提交是将请求数据附加到URL后面作为参数,这样依赖乱码就会很容易出现,因为数据name和value很有可能就是传递的为非ASCII码。
当URL拼接后,浏览器对其进行encode,然后发送到服务器。具体规则见URL编码规则。 这里详细说一下encode的过程中容易出现的问题,在这个过程中我们要明白需要URL encode的字符一般都是非ASCII码字符,所以我们就能知道出现乱码主要是URL中附加了中文或特殊字符做成的,另一个要知道URL encode到底是以什么样的编码方式对字符进行编码的,其实这个编码方式是由浏览器决定的,不同的浏览器和同一浏览器的不同设置影响了URL的编码,所以为了避免我们不需要的编码,我们可以通过java代码或javaspcript代码统一进行控制。 完成了URL encode之后URL就成了ASCII范围内的字符了,然后就以iso-8859-1的编码方式转换为二进制随着请求头一起发送出去。 到了服务器之后,首先服务器会先用iso-8859-1进行解码,服务器获取的数据都是ASCII范围内的请求头字符,其中请求URL里面带有参数数据,如果是中卫或特殊字符,那么encode后的%XY(编码规则中的十六进制数)通过request.setCharacterEncoding()是不管用的。这时候我们就能发现出现乱码的根本原因就是客户端一般是通过用UTF-8或GBK等对数据进行encode的,到了服务器却用iso-8859-1方式decoder显然不行。 这里的解决方式有两种, 一种:是通过String类的getBytes方法进行编码转换,具体java代码是: new String(request.getParameter(“name”).getBytes(“iso-8859-1”),“客户端编码方式”) 第二种:在服务器xml代码中改配置信息: |
|
20分 |
这个不是乱码,是被编码了
转向就可以了 String username=URLDecoder.decode("%E5%88%98%E5%BC%BA","UTF-8") |
针对中文字段进行decode 。向楼上这样
|