字符编码
字符编码 | |
---|---|
术语名称 | 字符编码 |
英语名称 | character encoding |
字符编码(character encoding)广义上指从字符到二进制串的相互映射过程,狭义上其中指编码字符集中的码位和二进制串间相互映射的转换算法。
字符本身通过编码字符集被对应到编码空间中的码位,狭义上的字符编码将编码空间中的码位映射到某种定长或变长的二进制编码。 从同一种编码字符集开始的映射也存在不同的映射,比如字节序以及加入纠错码、需要填充位等不同场景,在具体编码同时还会使用不同的具体策略。
因为一般说到字符编码时也包括了前面的字符集中字符到码位的部分,这一策略根据不同字符编码有所不同,因此具体的字符编码中的细节需要看具体编码指定。
常见字符编码 | |
---|---|
早期编码 | 电报码、 BCD 、ASCII (ISO 646) |
ISO 8859 | ISO 8859-1 、 ISO 8859-2 、…… |
各国国家标准及代码页 | GB 2312 、 GBK 、 GB 18030 |
Unicode / ISO 10646 | UTF-7 、 UTF-8、 UTF-16 、 UTF-32 |