Codificaciones de caracteres admitidas
Actualmente, el módulo mbstring admite las siguientes condificaciones
de caracteres. Cualquiera de estas codificaciones de caracteres
se puede especificar en el parámetro encoding de las funciones de
mbstring.
Esta extensión de PHP admite las siguientes codificaciones de
caracteres:
- UCS-4*
- UCS-4BE
- UCS-4LE*
- UCS-2
- UCS-2BE
- UCS-2LE
- UTF-32*
- UTF-32BE*
- UTF-32LE*
- UTF-16*
- UTF-16BE*
- UTF-16LE*
- UTF-7
- UTF7-IMAP
- UTF-8*
- ASCII*
- EUC-JP*
- SJIS*
- eucJP-win*
- SJIS-win*
- ISO-2022-JP
- ISO-2022-JP-MS
- CP932
- CP51932
- SJIS-mac** (alias: MacJapanese)
- SJIS-Mobile#DOCOMO** (alias: SJIS-DOCOMO)
- SJIS-Mobile#KDDI** (alias: SJIS-KDDI)
- SJIS-Mobile#SOFTBANK** (alias: SJIS-SOFTBANK)
- UTF-8-Mobile#DOCOMO** (alias: UTF-8-DOCOMO)
- UTF-8-Mobile#KDDI-A**
- UTF-8-Mobile#KDDI-B** (alias: UTF-8-KDDI)
- UTF-8-Mobile#SOFTBANK** (alias: UTF-8-SOFTBANK)
- ISO-2022-JP-MOBILE#KDDI** (alias: ISO-2022-JP-KDDI)
- JIS
- JIS-ms
- CP50220
- CP50220raw
- CP50221
- CP50222
- ISO-8859-1*
- ISO-8859-2*
- ISO-8859-3*
- ISO-8859-4*
- ISO-8859-5*
- ISO-8859-6*
- ISO-8859-7*
- ISO-8859-8*
- ISO-8859-9*
- ISO-8859-10*
- ISO-8859-13*
- ISO-8859-14*
- ISO-8859-15*
- byte2be
- byte2le
- byte4be
- byte4le
- BASE64
- HTML-ENTITIES
- 7bit
- 8bit
- EUC-CN*
- CP936
- GB18030**
- HZ
- EUC-TW*
- CP950
- BIG-5*
- EUC-KR*
- UHC (CP949)
- ISO-2022-KR
- Windows-1251 (CP1251)
- Windows-1252 (CP1252)
- CP866 (IBM866)
- KOI8-R*
* denota codificaciones que pueden ser utilizadas en expresiones regulares también.
** denota codificaciones que están disponibles desde PHP 5.4.0.
Cualquier entrada en php.ini que acepte un nombre de codificación
también puede utilizar los valores "auto" y
"pass".
Las funciones de mbstring que aceptan un nombre de codificación
también pueden utilizar el valor "auto".
Si se establece el valor "pass", no se utilizará ninguna
conversión de la codificación de caracteres.
Si se establece el valor "auto", se utilizará la lista
de codificaciones definida por el NLS.
Por ejemplo, si el NLS está configurado como Japanese,
el valor que se asume será
"ASCII,JIS,UTF-8,EUC-JP,SJIS".
Véase también mb_detect_order()