IBM 代码页
IBM代码页 | |
---|---|
术语名称 | IBM代码页 |
英语名称 | IBM code page |
代码页是编码字符集的别名,指码位到字符的映射关系。 IBM 代码页(IBM code page)是
这一词汇来自 IBM 公司基于 EBCDIC 的使用多字符集的大型机系统,每个字符集用数字进行编号(最初为手册页码[1])。后来,微软和 SAP 、 Oracle 等也使用代码页这一词汇指称字符集,但是互相之间的编码并不相通。
本 wiki 仅收录四个常见代码页: IBM 代码页 936 、微软代码页 936 、微软代码页 54936、微软代码页 65001 。
常见字符集与字符编码 | |||
---|---|---|---|
原始编码 | 电报码( Morse 电码) | BCD 码、 IBM 卡编码 | - |
早期二进制码位分配的编码 | - | BCDIC、EBCDIC | ASCII (ISO 646-US 、 ISO 646-IRV) |
地区字符编码 | - | - | ISO 8859 : ISO 8859-1 、 ISO 8859-2 、…… |
- | - | EUC 类编码,含第一个国标字符集 GB 2312 , 其编码 EUC-CN(IBM 代码页 936)也称 GB 2312 | |
多地区字符编码通过切换串兼容 | - | - | 通用框架: ISO 4873、ISO 2022 ,含 ISO-2022-CN ISO-2022-CN 的简化: HZ 编码 |
无需切换串的自同步编码 | - | UTF-EDCBIC | 字符集 Unicode / ISO 10646 ,有常见编码 UTF-8、 UTF-16 、 UTF-32 及废弃编码 UTF-1 、 UTF-7 |
地区字符编码扩充 | - | - | 国标系列后续:GBK(微软代码页 936)、 GB 18030(微软代码页 54936) |