ISO 646

来自GSXAB的知识库
ISO646
术语名称 ISO646
英语名称 ISO646

ISO/IEC 646 是最初的跨地区兼容 ASCII 的系列字符编码标准。最初是国际标准化组织推行的 7 比特编码标准。其规定了除字母与数字应保持字符编码与 ASCII 兼容外,部分标点也应保持一致(其中部分标点的使用方法有扩充),其余部分允许不同地区分配给不同字符。

ISO 646 是一个系列标准,其中基准版本被称为 IRV (International Reference Version),其他地区版本则使用各个地区进行标记。如 ISO 646-IRV 、 ISO 646-US 、 ISO 646-CN 等。

初版于 1965 年,是 ISO 与 IEC 的标准。

ISO 646 现被 ISO 8859 取代。

码表

IRV 码表。其中正常背景的是不变字符(invariant character),青色背景是该字符可以兼作附加符号与其他字母组合在一起,灰色背景是该字符可以在具体国别编码中发生替换。

ISO/IEC 646-IRV (1991)[1]
- _0
??? 0000
_1
??? 0001
_2
??? 0010
_3
??? 0011
_4
??? 0100
_5
??? 0101
_6
??? 0110
_7
??? 0111
_8
??? 1000
_9
??? 1001
_A
??? 1010
_B
??? 1011
_C
??? 1100
_D
??? 1101
_E
??? 1110
_F
??? 1111
0_
000 ????
NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1_
001 ????
DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2_
010 ????
SP ! " # $ % & ' ( ) * + , - . /
3_
011 ????
0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4_
100 ????
@ A B C D E F G H I J K L M N O
5_
101 ????
P Q R S T U V W X Y Z [ \ ] ^ _
6_
110 ????
` a b c d e f g h i j k l m n o
7_
111 ????
p q r s t u v w x y z { | } ~ DEL

最初的 ISO 646-IRV 中, $ 处符号为 ¤~ 处符号为 ,但是在 1991 年后 ISO 646-IRV 与 ISO 646-US 成为相同编码。

但实际国别编码中并不一定完全遵守这一规则,有的语言中部分不变字符也是被替换的。

使用

ISO 646 可以看作一种跨国家版本的 ASCII ,只约束了一部分字符的相同性以保证信息交流,而且仅使用了 7 比特。后续随着 8 比特编码受到广泛接受,以及宽字符编码广泛使用,被 ISO 8859 系列编码代替。随着 1991 年后 Unicode 与 ISO/IEC 10646: USC 逐渐开始发展,仅使用单字节且无法完全在国际通用的小字符集基本被这些大字符集淘汰,现代其生态位已经几乎完全被这些系列下的编码代替。

ISO 646 仍然对现在有一些影响,比如 ISO 646-KR 和 ISO 646-JP 中,反斜杠 \ 的位置分别被 ¥ 替代,即使被转换到现代编码中,也只能使用各自货币符号对应的码位。这使得现代 windows 中两国的系统仍然将作为路径分隔符的反斜线 \ (U+005C)展示为对应的货币符号,而无法使用支持的对应 Unicode 码位 U+00A5 ¥ 和 U+20A9


常见字符编码
早期编码 电报码、 BCD 、ASCIIISO 646
ISO 8859 ISO 8859-1 、 ISO 8859-2 、……
各国国家标准及代码页 GB 2312GBKGB 18030
Unicode / ISO 10646 UTF-7 、 UTF-8、 UTF-16 、 UTF-32