Cadenas de caracteres multibyte
PHP Manual

Resumen de codificaciones soportadas

Resumen de codificaciones soportadas
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-10646-UCS-4
Conjunto de Caracteres:ISO 10646
Descripción: Conjunto Universal de Caracteres con 31 bits de codificación, estandarizado como UCS-4 por ISO/IEC 10646. Forma parte de la última versión de Unicode.
Notas adicionales: Si se utiliza este nombre con la utilidad de conversión de codificación, el convertidor intentará identificar, mediante el byte de marca de orden (BOM), en qué formato (little-endian o big-endian) están representados los siguientes bytes.
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-10646-UCS-4
Conjunto de Caracteres:UCS-4
Descripción: Ver más arriba.
Notas adicionales: En contraste con UCS-4, las cadenas de caracteres siempre apareceran en formato big-endian.
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-10646-UCS-4
Conjunto de Caracteres:UCS-4
Descripción: Ver más arriba.
Notas adicionales: En contraste con UCS-4, las cadenas de caracteres siempre apareceran en formato little-endian.
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-10646-UCS-2
Conjunto de Caracteres:UCS-2
Descripción: Conjunto Universal de Caracteres con 16 bits de codificación, estandarizado como UCS-2 por ISO/IEC 10646. Forma parte de la última versión de Unicode.
Notas adicionales: Si se utiliza este nombre con la utilidad de conversión de codificación, el convertidor intentará identificar, mediante el byte de marca de orden (BOM), en qué formato (little-endian o big-endian) están representados los siguientes bytes.
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-10646-UCS-2
Conjunto de Caracteres:UCS-2
Descripción: Ver más arriba.
Notas adicionales: En contraste con UCS-2, las cadenas de caracteres siempre apareceran en formato big-endian.
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-10646-UCS-2
Conjunto de Caracteres:UCS-2
Descripción: Ver más arriba.
Notas adicionales: En contraste con UCS-2, las cadenas de caracteres siempre apareceran en formato little-endian.
Nombre en el registro de conjuntos de caracteres de la IANA:UTF-32
Conjunto de Caracteres:Unicode
Descripción: Formato de Transformación UCS de 32 bits de ancho, cuya espacio de codificación está incluido en el estándar Unicode. Esta codificación no es igual a UCS-4, porque el espacio de codificación de Unicode está limitado a 21 bits.
Notas adicionales: Si se utiliza este nombre con la utilidad de conversión de codificación, el convertidor intentará identificar, mediante el byte de marca de orden (BOM), en qué formato (little-endian o big-endian) están representados los siguientes bytes.
Nombre en el registro de conjuntos de caracteres de la IANA:UTF-32BE
Conjunto de Caracteres:Unicode
Descripción:Ver más arriba
Notas adicionales: En contraste con UTF-32, las cadenas de caracteres siempre apareceran en formato big-endian.
Nombre en el registro de conjuntos de caracteres de la IANA:UTF-32LE
Conjunto de Caracteres:Unicode
Descripción:Ver más arriba
Notas adicionales: En contraste con UTF-32, las cadenas de caracteres siempre apareceran en formato little-endian.
Nombre en el registro de conjuntos de caracteres de la IANA:UTF-16
Conjunto de Caracteres:Unicode
Descripción: Formato de Transformación UCS de 16 bits de ancho. Hay que tener en cuenta que es muy parecido a UCS-2, gracias al mecanismo de subrogación introducido en Unicode 2.0 y UTF-16, por lo que se requiere un máximo de 21 bits para la representación de cualquier carácter.
Notas adicionales: Si se utiliza este nombre con la utilidad de conversión de codificación, el convertidor intentará identificar, mediante el byte de marca de orden (BOM), en qué formato (little-endian o big-endian) están representados los siguientes bytes.
Nombre en el registro de conjuntos de caracteres de la IANA:UTF-16BE
Conjunto de Caracteres:Unicode
Descripción: Ver más arriba.
Notas adicionales: En contraste con UTF-16, las cadenas de caracteres siempre apareceran en formato big-endian.
Nombre en el registro de conjuntos de caracteres de la IANA:UTF-16LE
Conjunto de Caracteres:Unicode
Descripción: Ver más arriba.
Notas adicionales: En contraste con UTF-16, las cadenas de caracteres siempre apareceran en formato little-endian.
Nombre en el registro de conjuntos de caracteres de la IANA:UTF-8
Conjunto de Caracteres:Unicode / UCS
Descripción: Formato de Transformación UCS de 8 bits de ancho..
Notas adicionales:Ninguna
Nombre en el registro de conjuntos de caracteres de la IANA:UTF-7
Conjunto de Caracteres:Unicode
Descripción: Formato de transformación UCS para el envío de correo electrónico seguro, especificado en » RFC2152.
Notas adicionales:Ninguno
Nombre en el registro de conjuntos de caracteres de la IANA:(Ninguno)
Conjunto de Caracteres:Unicode
Descripción: Variante de UTF-7 recomendado para usar con el » protocolo IMAP.
Notas adicionales:Ninguno
Nombre en el registro de conjuntos de caracteres de la IANA: US-ASCII (preferred MIME name) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII
Conjunto de Caracteres:ASCII / ISO 646
Descripción: Código Estándar Americano para el Intercambio de Información, de utilización muy extendida con una codifiación de 7 bits. Estandarizado a nivel Internacional, ISO 646.
Notas adicionales:(Ninguno)
Nombre en el registro de conjuntos de caracteres de la IANA: EUC-JP (nombre preferido por MIME) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese
Conjunto de Caracteres: Compuesto de US-ASCII / JIS X0201:1997 (hankaku kana part) / JIS X0208:1990 / JIS X0212:1990
Descripción: Derivado de la abreviación de Formato de Código UNIX Extendido para Japonés, la codificación más utilizada en UNIX y plataformas afines. Esta original codifiación, Código UNIX Extendido, se diseñó sobre la base de ISO 2022.
Notas adicionales: El conjunto de caracteres llamado EUC-JP es diferente a IBM932 / CP932, que son utilizados por OS/2® y Microsoft® Windows®. Para el intercambio de información con estas plataformas es mejor utilizar EUCJP-WIN.
Nombre en el registro de conjuntos de caracteres de la IANA:Shift_JIS (nombre preferido por MIME) / MS_Kanji / csShift_JIS
Conjunto de Caracteres:Compuesto de JIS X0201:1997 / JIS X0208:1997
Descripción: Shift_JIS fue desarrollado a principios de los 80, al mismo tiempo que los procesadores de textos en Japonés llegaban al mercado para mantener la compatibilidad con los antiguos esquemas de codifiación JIS X 0201:1976. De acuerdo con la definición de la IANA, el conjunto de caracteres Shift_JIS es ligeramente diferente a IBM932 / CP932. Sin embargo, los nombres "SJIS" / "Shift_JIS" son utilizados de forma incorrecta para referirse a este conjunto de caracteres.
Notas adicionales:Para la codificación CP932, es recomendable utilizar SJIS-WIN.
Nombre en el registro de conjuntos de caracteres de la IANA:(Ninguno)
Conjunto de Caracteres: Compuesto de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
Descripción: Aunque esta "codificación" utiliza el mismo esquema de codificación que EUC-JP, el conjunto de caracteres es diferente. Esto es así porque algunos códigos del mapa apuntan a diferentes caracteres del conjunto de caracteres EUC-JP.
Notas adicionales:none
Nombre en el registro de conjuntos de caracteres de la IANA:Windows-31J / csWindows31J
Conjunto de Caracteres: Compuesto de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
Descripción: Aunque esta "codificación" utiliza el mismo esquema de codificación que Shift-JIS, el conjunto de caracteres es diferente. Esto es así porque algunos códigos del mapa apuntan a diferentes caracteres del conjunto de caracteres Shift-JIS.
Notas adicionales:(none)
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-2022-JP (nombre preferido por MIME) / csISO2022JP
Conjunto de Caracteres: US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983
Descripción:» RFC1468
Notas adicionales:(Ninguno)
Nombre en el registro de conjuntos de caracteres de la IANA:JIS
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-1
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-2
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-3
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-4
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-5
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-6
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-7
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-8
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-9
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-10
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-13
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-14
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-8859-15
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:byte2be
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:byte2le
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:byte4be
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:byte4le
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:BASE64
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:HTML-ENTITIES
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:7bit
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:8bit
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:EUC-CN
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:CP936
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:HZ
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:EUC-TW
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:CP950
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:BIG-5
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:EUC-KR
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:UHC (CP949)
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:ISO-2022-KR
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:Windows-1251 (CP1251)
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:Windows-1252 (CP1252)
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:CP866 (IBM866)
Conjunto de Caracteres:
Descripción:
Notas adicionales:
Nombre en el registro de conjuntos de caracteres de la IANA:KOI8-R
Conjunto de Caracteres:
Descripción:
Notas adicionales: