栏目:Java8基础 作者:admin 日期:2015-09-20 评论:0 点击: 3,850 次
字符主要包括以下几种类型:
数字类型,如1、2、3等。
字符类型,如a、b、c等。
特殊字符,如#、$、%、^、&等
不可见字符,如\n(换行符)、\r(回车符)、\t(Tab字符)等。
【注意】\n(换行符)和\r(回车符)在windows系统中没有什么区别,都可以当做回车符。但是在linux系统中则是两种效果。在linux系统中,\n表示换到下一行,却不会回到行首;而\r表示光标回到行首,但仍然在本行。
在 JVM中,字符是使用 Unicode编码的。Unicode编码指的是UCS-2编码方式,即直接用两个字节存入字符的Unicode码。Unicode是一个很大的集合,将世界上所有的符号都纳入其中,每一个符号都给予一个独一无二的编码。需要注意的是,Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。基本多文种平面是Unicode中的一个编码区段。编码从U+0000至U+FFFF。常用汉字在此区间对应。常用字占用2个字节,在多文种平面区。冷僻字占用4个字节,在其它平面。所以,冷僻的汉子无法在Java中使用。
因为一个字符可以使用多种编码方式进行表示,所以在不同的编码方式直接可以进行自由的转换。如下面的小例子:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
import java.io.UnsupportedEncodingException; public class Test1 { public static void main(String[] args) throws UnsupportedEncodingException { String web = "金丝燕网"; byte[] bytegbk = web.getBytes("gbk"); String result = new String(bytegbk, "gbk"); System.out.println(result); bytegbk = result.getBytes("utf-8"); result = new String(bytegbk, "utf-8"); System.err.println(result); } } |
------====== 本站公告 ======------
金丝燕网,一个严谨的网站!