网络零售商的终极网站
 HTML 字符集。  W3Schools 乌克兰语初学者课程

HTML 统一码 (UTF-8)


统一码联盟

Unicode 联盟正在打破 Unicode 标准。 他们的元是用标准的Unicode转换格式(UTF)来替换原来的字符集。

Unicode 标准已经取得成功,并已在 HTML、XML、Java、JavaScript、电子邮件、ASP、PHP 等中实现。 大多数操作系统和所有现代浏览器也支持 Unicode 标准。

Unicode 符号符合标准的广泛认可,例如 ISO、W3C 和 ECMA。


Unicode 字符集

Unicode 可以在不同的字符集中实现。 最广泛的编码是 UTF-8 和 UTF-16:

字符集 描述
UTF-8 使用 UTF8 编码的字符串可能包含 1 到 4 个字符。 UTF-8 是 Unicode 字符集的一种变体。 UTF-8 对应于 ASCII。 UTF-8 是用于表示文本的编码格式
UTF-16 16 位 Unicode 转换格式 — 为了使代码能够转换为 Unicode,我们需要对 Unicode 进行转换。 UTF-16 出现在主流的操作系统和平台中,例如 Microsoft Windows、Java 和 .NET。

波拉达: 使用 128 位 Unicode(但不支持 ASCII 编码) 您可以使用 Unicode 字符集来编码这些字符,它们是 ASCII 字符,但是它们可以使用 Unicode 和 UTF-8 编码的 ASCII 字符。

HTML 4 编码支持 UTF-8。 HTML 5 支持 UTF-8 和 UTF-16!


HTML5 页面:Unicode UTF-8

ISO-8859 中的一些字符集在大小上受到限制,对许多中产阶级来说毫无意义,Unicode 联盟开发了 Unicode 标准。

Unicode 标准涵盖(主要)世界上所有字符、分区符号和符号。

Unicode 编码标准,使用与移动版本相同的编码。

HTML5中的字符编码是UTF-8。

如果 HTML5 网站支持一组字符(不包括 UTF-8),则将其输入到标签中<meta> , 例如:

屁股

<meta charset="ISO-8859-1">

使用 UTF-8 编码的 Unicode

Unicode — це набір символів.UTF-8 є кодуванням.

Unicode — 我们使用的 Unicode 编码是阿拉伯数字(Unicode 码)。 A = 65,B = 66,C = 67,....

发送一个简短的短信“hello”: 104 101 108 108 111

编码意味着这些数字如何转换为存储在计算机中的双精度数字:

编码 UTF-8 将“hello”保存为(双精度):01101000 01100101 01101100 01101100 01101111

科杜万尼亚 перетворює числа у двійкову форму. 字符集 перетворюють символи на числа.


字符代码 HTML5 UTF-8

以下是 HTML5 支持的各种 UTF-8 字符代码列表:

字符代码 第十六
C0 拉丁裔青少年犯罪 0-127 0000-007F
语言:C1 和 Latin-1 128-255 0080-00FF
拉丁文扩展-A 256-383 0100-017F
拉丁文扩展-B 384-591 0180-024F
间隔修饰符 688-767 02B0-02FF
变音符号 768-879 0300-036F
Грецька і коптська 880-1023 0370-03FF
主要是西里尔字母 1024-1279 0400-04FF
多达特科娃西里尔文 1280-1327 0500-052F
扎加尔标点符号 8192-8303 2000-206F
货币符号 8352-8399 20A0-20CF
文字符号 8448-8527 2100-214F
斯特雷尔基 8592-8703 2190-21FF
数学运算符 8704-8959 2200-22FF
扶手椅盒 9472-9599 2500-257F
块元素 9600-9631 2580-259F
Геометричні фігури 9632-9727 25A0-25FF
Різні символи 9728-9983 2600-26FF
丁巴提 9984-10175 2700-27BF