跳转到内容
主菜单
主菜单
移至侧栏
隐藏
导航
首页
最近更改
随机页面
MediaWiki帮助
GSXAB的知识库
搜索
搜索
外观
登录
个人工具
登录
Advertising:
查看“︁ISO 8859”︁的源代码
页面
讨论
简体中文
阅读
查看源代码
查看历史
工具
工具
移至侧栏
隐藏
操作
阅读
查看源代码
查看历史
刷新
常规
链入页面
相关更改
特殊页面
页面信息
外观
移至侧栏
隐藏
←
ISO 8859
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
[[分类:字符集实例]] [[分类:字符编码实例]] [[分类: ISO 标准]] {{InfoBox |name=ISO8859 |eng_name=ISO8859 }} {{#seo: |keywords=ISO 8859, ISO 8859-1, Latin-1 |description=介绍了 ISO 8859 系列字符集及其别名等,并列出了 ISO 8859-1 即 Latin-1 的码位表作为参考。 |modified_time={{REVISIONYEAR}}-{{REVISIONMONTH}}-{{REVISIONDAY2}} |published_time=2025-02-01 }} '''ISO/IEC 8859''' 是完全的跨地区兼容 [[ASCII]] 的[[字符编码]]标准,是 8 比特的字符编码标准。与其前身的 [[ISO 646]] 将 7 比特划分为不变区并变化部分字符不同, ISO 8859 中与 ASCII 重叠的部分(最高位为 0 ,即 0~127)中字符均不允许变化,而使用其他部分(最高位为 1 ,即 128~255)编码其他字符。 ISO 8859 标准分为 15 个标准,分别对应一套不同编码,且有通用别名,通常则使用序号或别名进行标记。如 ISO 8859-1 或 Latin-1 、 ISO 8859-2 或 Latin-2 等。 ISO 8859-1 即 Latin-1 是常见的默认编码。 初版于 1987 年,是 ISO 与 IEC 的标准。 ISO 8859 取代了 [[ISO 646]] ,后续被 [[ISO 10646]] 取代。 == 具体编码名称 == {| class="wikitable" |- ! colspan=3 | ISO 8859<ref>https://en.wikipedia.org/wiki/ISO/IEC_8859</ref><ref>https://baike.baidu.com/item/ISO%2FIEC%208859/916777</ref> |- ! 编码名称 ! 常用别名 ! 说明 |- | ISO 8859-1 | Latin-1 | 西欧语言 |- | ISO 8859-2 | Latin-2 | 中欧语言 |- | ISO 8859-3 | Latin-3 | 南欧语言 |- | ISO 8859-4 | Latin-4 | 北欧语言 |- | ISO 8859-5 | Cyrillic 或 Latin/Cyrillic | 斯拉夫语言 |- | ISO 8859-6 | Arabic 或 Latin/Arabic | 阿拉伯语 |- | ISO 8859-7 | Greek 或 Latin/Greek | 希腊语 |- | ISO 8859-8 | Hebrew 或 Latin/Hebrew | 希伯来语 |- | ISO 8859-9 | Latin-5 或 Turkish | 土耳其语 |- | ISO 8859-10 | Latin-6 或 Nordic | 北日耳曼语支 |- | ISO 8859-11 | Thai | 泰语 |- | ISO 8859-13 | Latin-7 或 Baltic Rim | 波罗的语族 |- | ISO 8859-14 | Latin-8 或 Celtic | 凯尔特语族 |- | ISO 8859-15 | Latin-9 | 西欧语言(ISO 8859-1 的调整版) |- | ISO 8859-16 | Latin-10 | 东南欧语言 |} == 编码特征 == 最高位为 0 的部分与 ASCII 编码相同。其中 {{Hex|00}} 到 {{Hex|1F}} 是控制字符,后续 {{Hex|20}} 到 {{Hex|7E}} 是可打印字符,而后续 {{Hex|7F}} 是控制字符。 为兼容一些 ASCII 处理逻辑, ISO 8859 系列编码中,对[[位值制记数法|位权]]为 <math>2^5</math> 和 <math>2^6</math> 的两位均为 0 的编码都没有实际分配字符。换句话说,把 {{Hex|7F}} 到 {{Hex|9F}} 都保留,实际通过 ISO 6429 或 ISO 6630 等将其分配具体的控制字符。 但是, ISO 8859 中并没有明确所有上述控制字符的内容,只是标记为“其不代表图形字符”,可以认为就是保留为控制字符,符合 [[ISO 4873]] 规则。 对剩余的打印字符部分,字符安排在编码之间没有太大的一致性。对几种拉丁字母, {{Hex|C0}} 到 {{Hex|DF}} 和 {{Hex|E0}} 到 {{Hex|FF}} 和 ASCII 部分对应的 {{Hex|40}}~{{Hex|5F}} 与 {{Hex|60}}~{{Hex|7E}} 一样,分配给各字符集中需要的不属于 ASCII 的大写字母和小写字母,且大小写间保持对 {{Hex|20}} 取反可以互相得到,而 {{Hex|A0}}~{{Hex|B0}} 分配给多出来的字母(如果有,以 {{Hex|10}} 取反对应分配大小写)或标点符号。但是对于其他字母体系,由于需要包括各体系中的标准和变体字母,基本上都是把剩余部分全部分配给普通字母。 但是可能是由于 ISO 8859 的年代已经不需要保留全 1 字符给打孔纸带的擦除含义了, {{Hex|FF}} 的位置并不是保留为[[擦除字符]] EO 而是分配给了普通的打印字符。 == ISO 8859-1 码位表 == {| class='wikitable' style='text-align:center;margin:0 auto;border-width:2px' width='100%' ! colspan=17 | ISO 8859-1 <ref>https://en.wikipedia.org/wiki/ISO/IEC_8859-1</ref> |- ! - ! _0 <br/> <code>???? 0000</code> ! _1 <br/> <code>???? 0001</code> ! _2 <br/> <code>???? 0010</code> ! _3 <br/> <code>???? 0011</code> ! _4 <br/> <code>???? 0100</code> ! _5 <br/> <code>???? 0101</code> ! _6 <br/> <code>???? 0110</code> ! _7 <br/> <code>???? 0111</code> ! _8 <br/> <code>???? 1000</code> ! _9 <br/> <code>???? 1001</code> ! _A <br/> <code>???? 1010</code> ! _B <br/> <code>???? 1011</code> ! _C <br/> <code>???? 1100</code> ! _D <br/> <code>???? 1101</code> ! _E <br/> <code>???? 1110</code> ! _F <br/> <code>???? 1111</code> |- ! 0_ <br/> <code>0000 ????</code> | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | |- ! 1_ <br/> <code>0001 ????</code> | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | |- ! 2_ <br/> <code>0010 ????</code> | <small style="font-size:0.6em"><span title="SPACE">SP</span><br/>[[空白字符|空格]]</small> | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |- ! 3_ <br/> <code>0011 ????</code> | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |- ! 4_ <br/> <code>0100 ????</code> | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |- ! 5_ <br/> <code>0101 ????</code> | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |- ! 6_ <br/> <code>0110 ????</code> | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |- ! 7_ <br/> <code>0111 ????</code> | p | q | r | s | t | u | v | w | x | y | z | { | <nowiki>|</nowiki> | } | ~ | <small style="font-size:0.6em"><span title="DELETE">DEL</span><br/>[[擦除字符]]</small> |- ! 8_ <br/> <code>1000 ????</code> | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | |- ! 9_ <br/> <code>1001 ????</code> | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | | style="background-color:gray" | |- ! A_ <br/> <code>1010 ????</code> | <small style="font-size:0.6em"><span title="NON-BREAKING SPACE">NBSP</span><br/>[[空白字符|不换行空格]]</small> | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | <small style="font-size:0.6em"><span title="SOFT HYPHEN">SHY</span><br/>软连字符<ref>在长单词内布置的连字符候选位置,在支持的软件中,如果行内空间不足可以在这里插入真正的连字符并重新换行。</ref></small> | ® | ¯ |- ! B_ <br/> <code>1011 ????</code> | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |- ! C_ <br/> <code>1100 ????</code> | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |- ! D_ <br/> <code>1101 ????</code> | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |- ! E_ <br/> <code>1110 ????</code> | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |- ! F_ <br/> <code>1111 ????</code> | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |} 可以看到其实新增部分还是对应了原来 ASCII 的布局,在 0x30 对应的 0xB0 行以数字符号为主,然后最后的 0xC0-FF 对应 0x40-7E 编码字母,且大小写关系也是对应的。 == 使用 == ISO 8859 尽管在规范上被 ISO 10646 取代,但是仍然在实际中被广泛使用。常见的 [[Windows 代码页]]中的一部分仍然是 ISO 8859 的遗留,只是名字被更换为代码页的编码。 很多时候,如果多字节编码不能正常处理,其乱码仍然是 ISO 8859-1 / Latin-1 的形式。主要是经常出现多字节编码使用自动编码探测时失败,被误用 ISO 8859-1 解析。 {{常见字符编码}}
返回
ISO 8859
。
Advertising: