HTML 统一码 (UTF-8)
统一码联盟
Unicode 联盟正在打破 Unicode 标准。 他们的元是用标准的Unicode转换格式(UTF)来替换原来的字符集。
Unicode 标准已经取得成功,并已在 HTML、XML、Java、JavaScript、电子邮件、ASP、PHP 等中实现。 大多数操作系统和所有现代浏览器也支持 Unicode 标准。
Unicode 符号符合标准的广泛认可,例如 ISO、W3C 和 ECMA。
Unicode 字符集
Unicode 可以在不同的字符集中实现。 最广泛的编码是 UTF-8 和 UTF-16:
字符集 | 描述 |
---|---|
UTF-8 | 使用 UTF8 编码的字符串可能包含 1 到 4 个字符。 UTF-8 是 Unicode 字符集的一种变体。 UTF-8 对应于 ASCII。 UTF-8 是用于表示文本的编码格式 |
UTF-16 | 16 位 Unicode 转换格式 — 为了使代码能够转换为 Unicode,我们需要对 Unicode 进行转换。 UTF-16 出现在主流的操作系统和平台中,例如 Microsoft Windows、Java 和 .NET。 |
波拉达: 使用 128 位 Unicode(但不支持 ASCII 编码) 您可以使用 Unicode 字符集来编码这些字符,它们是 ASCII 字符,但是它们可以使用 Unicode 和 UTF-8 编码的 ASCII 字符。
HTML 4 编码支持 UTF-8。 HTML 5 支持 UTF-8 和 UTF-16!
HTML5 页面:Unicode UTF-8
ISO-8859 中的一些字符集在大小上受到限制,对许多中产阶级来说毫无意义,Unicode 联盟开发了 Unicode 标准。
Unicode 标准涵盖(主要)世界上所有字符、分区符号和符号。
Unicode 编码标准,使用与移动版本相同的编码。
HTML5中的字符编码是UTF-8。
如果 HTML5 网站支持一组字符(不包括 UTF-8),则将其输入到标签中<meta> , 例如:
屁股
<meta charset="ISO-8859-1">
使用 UTF-8 编码的 Unicode
Unicode — це набір символів.UTF-8 є кодуванням.
Unicode — 我们使用的 Unicode 编码是阿拉伯数字(Unicode 码)。 A = 65,B = 66,C = 67,....
发送一个简短的短信“hello”: 104 101 108 108 111
编码意味着这些数字如何转换为存储在计算机中的双精度数字:
编码 UTF-8 将“hello”保存为(双精度):01101000 01100101 01101100 01101100 01101111
科杜万尼亚 перетворює числа у двійкову форму. 字符集 перетворюють символи на числа.
字符代码 HTML5 UTF-8
以下是 HTML5 支持的各种 UTF-8 字符代码列表:
字符代码 | 十 | 第十六 |
---|---|---|
C0 拉丁裔青少年犯罪 | 0-127 | 0000-007F |
语言:C1 和 Latin-1 | 128-255 | 0080-00FF |
拉丁文扩展-A | 256-383 | 0100-017F |
拉丁文扩展-B | 384-591 | 0180-024F |
间隔修饰符 | 688-767 | 02B0-02FF |
变音符号 | 768-879 | 0300-036F |
Грецька і коптська | 880-1023 | 0370-03FF |
主要是西里尔字母 | 1024-1279 | 0400-04FF |
多达特科娃西里尔文 | 1280-1327 | 0500-052F |
扎加尔标点符号 | 8192-8303 | 2000-206F |
货币符号 | 8352-8399 | 20A0-20CF |
文字符号 | 8448-8527 | 2100-214F |
斯特雷尔基 | 8592-8703 | 2190-21FF |
数学运算符 | 8704-8959 | 2200-22FF |
扶手椅盒 | 9472-9599 | 2500-257F |
块元素 | 9600-9631 | 2580-259F |
Геометричні фігури | 9632-9727 | 25A0-25FF |
Різні символи | 9728-9983 | 2600-26FF |
丁巴提 | 9984-10175 | 2700-27BF |