ISO 646
ISO646 | |
---|---|
术语名称 | ISO646 |
英语名称 | ISO646 |
ISO/IEC 646 是最初的跨地区兼容 ASCII 的系列字符编码标准。最初是国际标准化组织推行的 7 比特编码标准。其规定了除字母与数字应保持字符编码与 ASCII 兼容外,部分标点也应保持一致(其中部分标点的使用方法有扩充),其余部分允许不同地区分配给不同字符。
ISO 646 是一个系列标准,其中基准版本被称为 IRV (International Reference Version, 国际参照版本),其他地区版本则使用各个地区进行标记。如 ISO 646-IRV 、 ISO 646-US 、 ISO 646-CN 等。
GB/T 1988-1998 采纳了其中的 ISO 646-IRV 作为标准。
初版于 1965 年,是 ISO 与 IEC 的标准。
ISO 646 现被 ISO 8859 取代。
码表
IRV 码表。其中正常背景的是不变字符(invariant character),青色背景是该字符可以兼作附加符号与其他字母组合在一起,灰色背景是该字符可以在具体国别编码中发生替换。
ISO/IEC 646-IRV (1991)[1] | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
- | _0 ??? 0000
|
_1 ??? 0001
|
_2 ??? 0010
|
_3 ??? 0011
|
_4 ??? 0100
|
_5 ??? 0101
|
_6 ??? 0110
|
_7 ??? 0111
|
_8 ??? 1000
|
_9 ??? 1001
|
_A ??? 1010
|
_B ??? 1011
|
_C ??? 1100
|
_D ??? 1101
|
_E ??? 1110
|
_F ??? 1111
|
0_ 000 ????
|
NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
1_ 001 ????
|
DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2_ 010 ????
|
SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3_ 011 ????
|
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4_ 100 ????
|
@ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5_ 101 ????
|
P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6_ 110 ????
|
` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7_ 111 ????
|
p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
最初的 ISO 646-IRV 中, 0x24 $
处符号为 ¤
,0x75 ~
处符号为 ‾
,但是在 1991 年后 ISO 646-IRV 与 ISO 646-US 成为相同编码。
但实际国别编码中并不一定完全遵守这一规则,有的语言中部分不变字符也是被替换的。
使用
ISO 646 可以看作一种跨国家版本的 ASCII ,只约束了一部分字符的相同性以保证信息交流,而且仅使用了 7 比特。后续随着 8 比特编码受到广泛接受,以及宽字符编码广泛使用,被 ISO 8859 系列编码代替。随着 1991 年后 Unicode 与 ISO/IEC 10646: USC 逐渐开始发展,仅使用单字节且无法完全在国际通用的小字符集基本被这些大字符集淘汰,现代其生态位已经几乎完全被这些系列下的编码代替。
ISO 646-CN 中替换了部两个可替换码位: 0x24 $
处符号为 ¥
,0x75 ~
处符号为 ‾
。但是这一标准并未得到广泛使用,国标 GB/T 1988-1998 等同于 ISO 646-IRV 。
ISO 646 仍然对现在有一些影响,比如 ISO 646-KR 和 ISO 646-JP 中,反斜杠 \
的位置分别被 ₩
和 ¥
替代,即使被转换到现代编码中,也只能使用各自货币符号对应的码位。这使得现代 windows 中韩、日两国的系统仍然将作为路径分隔符的反斜线 \
(U+005C)展示为对应的货币符号,而无法使用支持的对应 Unicode 码位 U+00A5 ¥
和 U+20A9 ₩
。
常见字符集与字符编码 | |||
---|---|---|---|
原始编码 | 电报码( Morse 电码) | BCD 码、 IBM 卡编码 | - |
早期二进制码位分配的编码 | - | BCDIC、EBCDIC | ASCII (ISO 646-US 、 ISO 646-IRV) |
地区字符编码 | - | - | ISO 8859 : ISO 8859-1 、 ISO 8859-2 、…… |
- | - | EUC 类编码,含第一个国标字符集 GB 2312 , 其编码 EUC-CN(IBM 代码页 936)也称 GB 2312 | |
多地区字符编码通过切换串兼容 | - | - | 通用框架: ISO 4873、ISO 2022 ,含 ISO-2022-CN ISO-2022-CN 的简化: HZ 编码 |
无需切换串的自同步编码 | - | UTF-EDCBIC | 字符集 Unicode / ISO 10646 ,有常见编码 UTF-8、 UTF-16 、 UTF-32 及废弃编码 UTF-1 、 UTF-7 |
地区字符编码扩充 | - | - | 国标系列后续:GBK(微软代码页 936)、 GB 18030(微软代码页 54936) |