在 Java 中,Unicode、ASCII、UTF-16 和 UTF-8 字符用多少位表示?

java 8object oriented programmingprogramming

一般来说,数据以位(1 或 0)的形式存储在计算机中。有各种可用的编码方案来指定每个字符所代表的字节集。

ASCII − 代表美国信息交换标准代码。它由美国标准协会开发,是最常用的编码系统。它使用 7 位表示字符,包括 128 个字符:大写和小写拉丁字母、数字 0-9 和一些额外字符)。

Unicode (UTF) − 代表 Unicode 翻译格式。它由 Unicode 联盟开发。如果您想要创建使用来自多个字符集的字符的文档,则可以使用单个 Unicode 字符编码来实现。它提供了 3 种类型的编码。

  • UTF-8 − 它以 8 位为单位(字节),UTF8 中的字符长度可以是 1 到 4 个字节,从而使 UTF8 的宽度可变。
  • UTF-16 − 它以 16 位为单位(短字符),长度可以是 1 或 2 个短字符,从而使 UTF16 的宽度可变。
  • UTF-32 − 它以 32 位为单位(长字符)。它是一种固定宽度格式,并且始终为 1"长"长度。

Java 中的表示

下表列出了 Java 中用于表示各种编码标准的位数。

表示使用的位数
ASCII7 位(表示为 8 位)。
UTF-88、16 和 18 位模式。
UTF-1616 位及更大的位模式。

相关文章