(PHP 3 >= 3.0.6, PHP 4, PHP 5)
utf8_encode -- Koduje ciąg znaków w ISO-8859-1 do UTF-8
Opis
string
utf8_encode ( string dane )
Ta funkcja koduje data do UTF-8,
po czym zwraca je zakodowane. UTF-8 jest standardowym
mechanizmem używanym przez Unicode do zakodowania
wartości szerokich znaków w ciągu bajtów.
UTF-8 jest przeźroczyste dla znaków w czystym
ASCII, samozsynchronizowane (w znaczeniu posiadania
możliwości aby program mógł znaleźć gdzie w ciągu bajtów zaczynają się
znaki) jak również może być używane w normalnym porównywaniu znaków
na potrzeby sortowania itp. PHP potrafi zakodować znaki UTF-8
do maksymalnie czterech bajtów, w podany poniżej sposób:
Tabela 1. Kodowanie UTF-8
bajtów | bitów | reprezentacja |
---|
1 | 7 | 0bbbbbbb |
2 | 11 | 110bbbbb 10bbbbbb |
3 | 16 | 1110bbbb 10bbbbbb 10bbbbbb |
4 | 21 | 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb |
Każda litera
b reprezentuje bit, który może być
użyty do przechowywania danych znaku.