微软代码页 1252
微软代码页 1252 | |
---|---|
术语名称 | 微软代码页 1252 |
英语名称 | Microsoft code page 1252 |
别名 | MS-1252, CP1252, Windows 1252 |
微软代码页 1252 是微软在 Windows 系列上使用的字符集和字符编码,是 ISO 8859-1(即 Latin-1)的一个扩展。和 Latin-1 一样, 代码页 1252 也是常见的默认编码。
代码页 1252 将 ISO 8859-1 中留作控制字符的 0x80-0x9F 范围改为了可打印字符。
代码表
Windows 1252[1] | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
- | _0 ???? 0000
|
_1 ???? 0001
|
_2 ???? 0010
|
_3 ???? 0011
|
_4 ???? 0100
|
_5 ???? 0101
|
_6 ???? 0110
|
_7 ???? 0111
|
_8 ???? 1000
|
_9 ???? 1001
|
_A ???? 1010
|
_B ???? 1011
|
_C ???? 1100
|
_D ???? 1101
|
_E ???? 1110
|
_F ???? 1111
|
0_ 0000 ????
|
NUL 空字符 |
SOH 标题开始[2] |
STX 正文开始[3] |
ETX 正文结束[3] |
EOT 传输结束 |
ENQ 查询 |
ACK 确认 收到应答 |
BEL 响铃[4] |
BS 退格[5] |
HT 水平制表 TAB 制表符[6] |
LF NL EOL 换行[7] |
VT 垂直制表[8] |
FF NP 换页[9] |
CR 回车[10] |
SO LS1 移出[11] |
SI LS0 移入[11] |
1_ 0001 ????
|
DLE 数据链路转义[12] |
DC1 设备控制 1 XON 传输开始 |
DC2 设备控制 2 |
DC3 设备控制 3 XOFF 传输中断 |
DC4 设备控制 4 |
NAK 拒绝 否定应答 |
SYN 同步空闲 |
ETB 传输块结束 |
CAN 取消 |
EM 介质结束[13] |
SUB 代替 |
ESC 换码 转义字符 溢出 |
FS 文件分隔符[14] |
GS 组分隔符[14] |
RS 记录分隔符[14] |
US 单元分隔符[14] |
2_ 0010 ????
|
SP 空格 |
! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3_ 0011 ????
|
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4_ 0100 ????
|
@ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5_ 0101 ????
|
P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6_ 0110 ????
|
` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7_ 0111 ????
|
p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL 擦除字符 |
8_ 1000 ????
|
€ | ‚ | ƒ | „ | … | † | ‡ | ˆ | ‰ | Š | ‹ | Œ | Ž | |||
9_ 1001 ????
|
‘ | ’ | “ | ” | • | – | — | ˜ | ™ | š | › | œ | ž | Ÿ | ||
A_ 1010 ????
|
NBSP 不换行空格 |
¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | SHY 软连字符[15] |
® | ¯ |
B_ 1011 ????
|
° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
C_ 1100 ????
|
À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
D_ 1101 ????
|
Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
E_ 1110 ????
|
à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
F_ 1111 ????
|
ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
常见字符集与字符编码 | |||
---|---|---|---|
原始编码 | 电报码( Morse 电码) | BCD 码、 IBM 卡编码 | - |
早期二进制码位分配的编码 | - | BCDIC、EBCDIC | ASCII (ISO 646-US 、 ISO 646-IRV) |
地区字符编码 | - | - | ISO 8859 : ISO 8859-1 、 ISO 8859-2 、…… |
- | - | EUC 类编码,含第一个国标字符集 GB 2312 , 其编码 EUC-CN(IBM 代码页 936)也称 GB 2312 | |
多地区字符编码通过切换串兼容 | - | - | 通用框架: ISO 4873、ISO 2022 ,含 ISO-2022-CN ISO-2022-CN 的简化: HZ 编码 |
无需切换串的自同步编码 | - | UTF-EDCBIC | 字符集 Unicode / ISO 10646 ,有常见编码 UTF-8、 UTF-16 、 UTF-32 及废弃编码 UTF-1 、 UTF-7 |
地区字符编码扩充 | - | - | 国标系列后续:GBK(微软代码页 936)、 GB 18030(微软代码页 54936) |
- ↑ https://en.wikipedia.org/wiki/Windows-1252
- ↑ 消息的开始。
- ↑ 3.0 3.1 正文的开始和结束。
- ↑ 使蜂鸣器发出声音。一般是打字机外设的蜂鸣器,现在主板不一定安装此类外设。
- ↑ 打印头向左回退一个位置。打字机上用于将同一个字符重复打印以强调,或将附加符号打印到字母同一个位置上。在 CRT 时代无效,现代则演变变为了回退位置并删除这个位置字符的退格键。
- ↑ 打印头移动到下一个水平制表位。控制输出设备到下一个预定义的表格位置,具体位置是灵活的,通常为左侧起每 4 个空格的位置。
- ↑ 打印头移动到下一行。打字机时代只将打印头向下一行,而不移动到行首(CR)。现代在部分系统中代替 CRLF 。
- ↑ 打印头移动到下一个垂直制表位。
- ↑ 打字机打印头移动到下一页,或者换纸。
- ↑ 打印头移动到行首,但是不移动到下一行(LF)。现代在部分系统中代替 CRLF 。
- ↑ 11.0 11.1 移出、移入打字机的彩色纸带、备用字符集等。
- ↑ 标记需要对接下来的数据流做某种转义。
- ↑ 指存储介质逻辑上到达末端,已被写满。
- ↑ 14.0 14.1 14.2 14.3 最初用于打孔纸带、磁带等顺序存储介质中分隔数据控制字符。分别对应于分割文件、数据表、数据记录、数据单元(单元格,今称字段)。
- ↑ 在长单词内布置的连字符候选位置,在支持的软件中,如果行内空间不足可以在这里插入真正的连字符并重新换行。