サポートされる文字エンコーディング
現在、以下の文字エンコーディングが mbstring
モジュールによりサポートされています。文字エンコーディングは、
mbstring 関数の encoding
パラメータで指定することが可能です。
以下の文字エンコーディングがこの PHP 拡張モジュールでサポートされています。
- UCS-4*
- UCS-4BE
- UCS-4LE*
- UCS-2
- UCS-2BE
- UCS-2LE
- UTF-32*
- UTF-32BE*
- UTF-32LE*
- UTF-16*
- UTF-16BE*
- UTF-16LE*
- UTF-7
- UTF7-IMAP
- UTF-8*
- ASCII*
- EUC-JP*
- SJIS*
- eucJP-win*
- SJIS-win*
- ISO-2022-JP
- ISO-2022-JP-MS
- CP932
- CP51932
- SJIS-mac** (エイリアス: MacJapanese)
- SJIS-Mobile#DOCOMO** (エイリアス: SJIS-DOCOMO)
- SJIS-Mobile#KDDI** (エイリアス: SJIS-KDDI)
- SJIS-Mobile#SOFTBANK** (エイリアス: SJIS-SOFTBANK)
- UTF-8-Mobile#DOCOMO** (エイリアス: UTF-8-DOCOMO)
- UTF-8-Mobile#KDDI-A**
- UTF-8-Mobile#KDDI-B** (エイリアス: UTF-8-KDDI)
- UTF-8-Mobile#SOFTBANK** (エイリアス: UTF-8-SOFTBANK)
- ISO-2022-JP-MOBILE#KDDI** (エイリアス: ISO-2022-JP-KDDI)
- JIS
- JIS-ms
- CP50220
- CP50220raw
- CP50221
- CP50222
- ISO-8859-1*
- ISO-8859-2*
- ISO-8859-3*
- ISO-8859-4*
- ISO-8859-5*
- ISO-8859-6*
- ISO-8859-7*
- ISO-8859-8*
- ISO-8859-9*
- ISO-8859-10*
- ISO-8859-13*
- ISO-8859-14*
- ISO-8859-15*
- byte2be
- byte2le
- byte4be
- byte4le
- BASE64
- HTML-ENTITIES
- 7bit
- 8bit
- EUC-CN*
- CP936
- GB18030**
- HZ
- EUC-TW*
- CP950
- BIG-5*
- EUC-KR*
- UHC (CP949)
- ISO-2022-KR
- Windows-1251 (CP1251)
- Windows-1252 (CP1252)
- CP866 (IBM866)
- KOI8-R*
* は、正規表現でも使えるエンコーディングであることを表します。
** は、PHP 5.4.0 以降で使えるエンコーディングであることを表します。
エンコーディング名を指定する php.ini エントリには、
"auto" および
"pass" を指定することもできます。
エンコーディング名を指定する mbstring
関数にも、"auto" を指定することができます。
"pass" が指定された場合、
文字エンコーディングの変換は行われません。
"auto" が指定された場合、この文字列は
言語設定 (NLS)
ごとに定義されたエンコーディングのリストに変換されます。たとえば、言語設定が
Japanese の場合は
"ASCII,JIS,UTF-8,EUC-JP,SJIS"
です。
mb_detect_order() も参照ください。