Java 字符集 ASCII ISO-8859-1 GBK UTF8 UnicodeASCII用来表示英文字母、数字、标点符号一个字符占 1 个字节。ISO-8859-1欧洲国家语言使用的字符集一个字符占 1 个字节。GBK用来表示简体中文、繁体中文、英文字母、数字、标点符号。其中汉字占 2 个字节中文标点符号占 2 个字节。英文字母、数字、英文标点符号占 1 个字节。UTF8用来表示常见国家的语言使用 1 到 4 个字节表示字符其中汉字占 3 个字节中文标点符号占 2 个字节。英文字母、数字、英文标点符号占 1 个字节。Unicode内存中使用的字符集也称万国码一个字符占两个字节。ASCII ISO-8859-1 GBK UTF8 是把数据写入文件时使用的字符集。为什么 Unicode 可以用两个字节标识汉字UTF8 却用三个字节