Эта функция кодирует строку data в
UTF-8 и возвращает кодированную версию. UTF-8 это стандартный механизм Unicode
для кодирования wide character-значений в байтовый поток.
UTF-8 прозрачна для обычных ASCII-символов, самосинхронизируется (т.е. программа может указать, где начинаются
символы байтового потока) и может использоваться с функциями сравнения нормальных строк для сортировки их как таковых. PHP кодирует
UTF-8 символы в блоки до 4 байтов, как здесь:
Таблица 1. Кодирование UTF-8
байтов
битов
представление
1
7
0bbbbbbb
2
11
110bbbbb 10bbbbbb
3
16
1110bbbb 10bbbbbb 10bbbbbb
4
21
11110bbb 10bbbbbb 10bbbbbb 10bbbbbb
Каждый b представляет бит, который может использоваться для хранения данных символа.