(PHP 3 >= 3.0.6, PHP 4, PHP 5)
utf8_encode -- codifica una cadena ISO-8859-1 a UTF-8
Descripción
string
utf8_encode ( string data )
Esta función codifica la cadena data a
UTF-8, y devuelve la versión codificada.
UTF-8 es un mecanismo estándar usado por
Unicodepara codificar valores de
caracteres amplios en un chorro de bytes.
UTF-8 es transparente a caracteres de
ASCII plano, es auto-sincronizado (significa
que es posible para un programa averiguar dónde comienzan los
caracteres en el chorro de bytes) y se puede usar con funciones de
comparación de cadenas normales para ordenar y otros fines.
PHP codifica caracteres UTF-8 en hasta cuatro bytes,
como esto:
Tabla 1. Codificación UTF-8
bytes | bits | representación |
---|
1 | 7 | 0bbbbbbb |
2 | 11 | 110bbbbb 10bbbbbb |
3 | 16 | 1110bbbb 10bbbbbb 10bbbbbb |
4 | 21 | 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb |
Cada
b representa un bit que puede ser
usado para almacenar datos de caracteres.