ISO 646
ISO646 | |
---|---|
术语名称 | ISO646 |
英语名称 | ISO646 |
ISO/IEC 646 是最初的跨地区兼容 ASCII 的系列字符编码标准。最初是国际标准化组织推行的 7 比特编码标准。其规定了除字母与数字应保持字符编码与 ASCII 兼容外,部分标点也应保持一致(其中部分标点的使用方法有扩充),其余部分允许不同地区分配给不同字符。
ISO 646 是一个系列标准,其中基准版本被称为 IRV (International Reference Version),其他地区版本则使用各个地区进行标记。如 ISO 646-IRV 、 ISO 646-US 、 ISO 646-CN 等。
初版于 1965 年,是 ISO 与 IEC 的标准。
ISO 646 现被 ISO 8859 取代。
码表
IRV 码表。其中正常背景的是不变字符(invariant character),青色背景是该字符可以兼作附加符号与其他字母组合在一起,灰色背景是该字符可以在具体国别编码中发生替换。
ISO/IEC 646-IRV (1991)[1] | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
- | _0 ??? 0000
|
_1 ??? 0001
|
_2 ??? 0010
|
_3 ??? 0011
|
_4 ??? 0100
|
_5 ??? 0101
|
_6 ??? 0110
|
_7 ??? 0111
|
_8 ??? 1000
|
_9 ??? 1001
|
_A ??? 1010
|
_B ??? 1011
|
_C ??? 1100
|
_D ??? 1101
|
_E ??? 1110
|
_F ??? 1111
|
0_ 000 ????
|
NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
1_ 001 ????
|
DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2_ 010 ????
|
SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3_ 011 ????
|
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4_ 100 ????
|
@ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5_ 101 ????
|
P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6_ 110 ????
|
` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7_ 111 ????
|
p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
最初的 ISO 646-IRV 中, $
处符号为 ¤
,~
处符号为 ‾
,但是在 1991 年后 ISO 646-IRV 与 ISO 646-US 成为相同编码。
但实际国别编码中并不一定完全遵守这一规则,有的语言中部分不变字符也是被替换的。
使用
ISO 646 可以看作一种跨国家版本的 ASCII ,只约束了一部分字符的相同性以保证信息交流,而且仅使用了 7 比特。后续随着 8 比特编码受到广泛接受,以及宽字符编码广泛使用,被 ISO 8859 系列编码代替。随着 1991 年后 Unicode 与 ISO/IEC 10646: USC 逐渐开始发展,仅使用单字节且无法完全在国际通用的小字符集基本被这些大字符集淘汰,现代其生态位已经几乎完全被这些系列下的编码代替。
ISO 646 仍然对现在有一些影响,比如 ISO 646-KR 和 ISO 646-JP 中,反斜杠 \
的位置分别被 ₩
和 ¥
替代,即使被转换到现代编码中,也只能使用各自货币符号对应的码位。这使得现代 windows 中韩、日两国的系统仍然将作为路径分隔符的反斜线 \
(U+005C)展示为对应的货币符号,而无法使用支持的对应 Unicode 码位 U+00A5 ¥
和 U+20A9 ₩
。
常见字符编码 | |
---|---|
早期编码 | 电报码、 BCD 、ASCII (ISO 646) |
ISO 8859 | ISO 8859-1 、 ISO 8859-2 、…… |
各国国家标准及代码页 | GB 2312 、 GBK 、 GB 18030 |
Unicode / ISO 10646 | UTF-7 、 UTF-8、 UTF-16 、 UTF-32 |