(PHP 3 >= 3.0.6, PHP 4, PHP 5)
utf8_encode -- Convertit une chaîne ISO-8859-1 en UTF-8
Description
string
utf8_encode ( string data )
utf8_encode() code la chaîne data au format
UTF-8, et retourne la version codée.
UTF-8 est un mécanisme standardisé
utilisé par Unicode pour coder les caractère de grande
taille dans des flux d'octets. UTF-8 est transparent
pour les caractères ASCII, il est
auto-synchronisé (c'est à
dire qu'un programme peut toujours savoir dans un flux d'octet où
un caractère commence), et peut être utilisé pour
faire des comparaisons de chaînes standard, comme pour le tri. PHP
utilise l'UTF-8 pour coder les caractères
jusqu'à 4 octets comme ceci :
Tableau 1. UTF-8 encoding
octets | bits | représentation |
---|
1 | 7 | 0bbbbbbb |
2 | 11 | 110bbbbb 10bbbbbb |
3 | 16 | 1110bbbb 10bbbbbb 10bbbbbb |
4 | 21 | 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb |
Chaque
b représente un bit qui peut
être utilisé pour enregistrer un caractère.