跳转到内容
主菜单
主菜单
移至侧栏
隐藏
导航
首页
最近更改
随机页面
MediaWiki帮助
GSXAB的知识库
搜索
搜索
外观
登录
个人工具
登录
Advertising:
查看“︁UTF-7”︁的源代码
页面
讨论
简体中文
阅读
查看源代码
查看历史
工具
工具
移至侧栏
隐藏
操作
阅读
查看源代码
查看历史
刷新
常规
链入页面
相关更改
特殊页面
页面信息
外观
移至侧栏
隐藏
←
UTF-7
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
[[分类:字符编码实例]] [[分类: RFC 文档]] {{InfoBox |name=UTF-7 |eng_name=UTF-7 }} {{#seo: |keywords=UTF-7 |description=介绍了 Unicode 传输格式中的一种历史格式UTF-7。UTF-7将其他编码转换为7位字节流,以便用于电子邮件等仅允许7位字节的场景中。 |modified_time={{REVISIONYEAR}}-{{REVISIONMONTH}}-{{REVISIONDAY2}} |published_time=2025-09-11 }} '''UTF-7''' 是一个将 [[Unicode]] 字符集编码为 [[ASCII]] 字符流的字符编码方法。该方法已过时。 UTF 即 Unicode Transformation Format , Unicode 传输格式。但是在严格含义上, UTF 需要能够编码全部 Unicode 码位, UTF-7 的部分实现只能表示其中的 BMP ,因此不严格算是一种 UTF 。 UTF-7 编码受此在 RFC 1642 中作为实验性协议提出,并随后被 RFC 2152 标记为过时。这一编码从未被视为 Unicode 联盟的官方标准。而且目前这一编码已发现具有安全性问题,因此现今大多数软件禁止使用, HTML5 中也已禁止使用这一编码。 == 编码规则 == 在 UTF-7 中,文本中的字符被分为两类。一类包括 62 个对应数字和 ISO 基本拉丁字母的字符,以及 <code>' ( ) , - . / : ?</code> 等字符,这些字符的含义不会修改,可以安全地直接使用。第二类是其他字符,需要进行[[转义]]。首先是加号 <code>+</code> 需要被转义为 <code>+-</code> ,其他字符则考虑连续的字符串,首先使用 [[UTF-16]] 编码,也就是说将 <code>U+0000-FFFF</code> 用双字节编码,然后 <code>U+10000-10FFFF</code> 被表达为一对代理对,然后将其使用不带有填充字符的 [[base64]] 编码,并使用 <code>+</code> 和 <code>-</code> 括起来。 比如: * <code>Hello, World!</code> 编码为 <code>Hello, World+ACE-</code> * <code>1 + 1 = 2</code> 编码为 <code>1 +- 1 +AD0- 2</code> === BOM === 带有 [[BOM 字符]]的 UTF-7 总是会把 BOM 编码为 <code>0x2B.2F.76 +/v</code> 开头的内容,可以用于判定编码(不过 UTF-7 是单字节编码,不需要判断字节序)。 {{常见字符编码}} == 参考资料 == https://en.wikipedia.org/wiki/UTF-7
返回
UTF-7
。
Advertising: