Як виглядає кодування UTF-8?

Номер символу береться із стандарту Юнікоду. Для символів Юнікоду з номерами від U+0000 до U+007F (що займають один байт з нулем у старшому биті) кодування UTF-8 повністю відповідає 7-бітовому кодуванню US-ASCII.Схожі

Найбільш поширеними кодуваннями з підтримкою російської мови (з використанням символів Кирилиці) є: UTF-8, Windows-1251, CP-866, KOI-8R, ISO-8859-5.

Що таке UTF-8 UTF-8 (Unicode Transformation Format, 8-bit) – це система кодування, що працює за стандартом Unicode. У бібліотеці Юнікоду зберігається понад мільйон символів. Кожному з них надається унікальний код — кодова точка. Наприклад, для "!" кодовою точкою буде U+0021.