サポートされるエンコーディングの概要

IANA 文字セット登録名:ISO-10646-UCS-4

依存する文字集合:ISO 10646

説明: 31 ビットコード空間を使用するユニバーサル文字セットで、 ISO/IEC 10646 によって UCS-4 として標準化されています。最新版の Unicode コードマップと連動しています。

注記: この名前をエンコーディング変換の際に使用すると、先頭の BOM (バイトオーダーマーク) にもとづいてそれ以降のバイト列のエンディアンを識別します。

IANA 文字セット登録名:ISO-10646-UCS-4

依存する文字集合:UCS-4

説明: 上を参照ください。

注記: UCS-4 とは対照的に、文字列が常にビッグエンディアン形式とみなされます。

IANA 文字セット登録名:ISO-10646-UCS-4

依存する文字集合:UCS-4

説明: 上を参照ください。

注記: UCS-4 とは対照的に、文字列が常にリトルエンディアン形式とみなされます。

IANA 文字セット登録名:ISO-10646-UCS-2

依存する文字集合:UCS-2

説明: 16 ビットコード空間を使用するユニバーサル文字セットで、 ISO/IEC 10646 によって UCS-2 として標準化されています。最新版の Unicode コードマップと連動しています。

注記: この名前をエンコーディング変換の際に使用すると、先頭の BOM (バイトオーダーマーク) にもとづいてそれ以降のバイト列のエンディアンを識別します。

IANA 文字セット登録名:ISO-10646-UCS-2

依存する文字集合:UCS-2

説明: 上を参照ください。

注記: UCS-2 とは対照的に、文字列が常にビッグエンディアン形式とみなされます。

IANA 文字セット登録名:ISO-10646-UCS-2

依存する文字集合:UCS-2

説明: 上を参照ください。

注記: UCS-2 とは対照的に、文字列が常にリトルエンディアン形式とみなされます。

IANA 文字セット登録名:UTF-32

依存する文字集合:Unicode

説明: 32 ビット幅の Unicode 変換フォーマットで、そのエンコーディング空間は Unicode のコードセット標準を参照します。このエンコーディング体系は UCS-4 とは異なります。なぜなら、Unicode のコード空間は 21 ビットまでに制限されるからです。

注記: この名前をエンコーディング変換の際に使用すると、先頭の BOM (バイトオーダーマーク) にもとづいてそれ以降のバイト列のエンディアンを識別します。

IANA 文字セット登録名:UTF-32BE

依存する文字集合:Unicode

説明:上を参照ください。

注記: UTF-32 とは対照的に、文字列が常にビッグエンディアン形式とみなされます。

IANA 文字セット登録名:UTF-32LE

依存する文字集合:Unicode

説明:上を参照ください。

注記: UTF-32 とは対照的に、文字列が常にリトルエンディアン形式とみなされます。

IANA 文字セット登録名:UTF-16

依存する文字集合:Unicode

説明: 16 ビット幅の Unicode 変換フォーマットです。注意すべき点は、UTF-16 の仕様が UCS-2 とは異なることです。なぜなら、Unicode 2.0 より導入されたサロゲート機能により、 UTF-16 は現在 21 ビットコード空間を参照しているからです。

注記: この名前をエンコーディング変換の際に使用すると、先頭の BOM (バイトオーダーマーク) にもとづいてそれ以降のバイト列のエンディアンを識別します。

IANA 文字セット登録名:UTF-16BE

依存する文字集合:Unicode

説明: 上を参照ください。

注記: UTF-16 とは対照的に、文字列が常にビッグエンディアン形式とみなされます。

IANA 文字セット登録名:UTF-16LE

依存する文字集合:Unicode

説明: 上を参照ください。

注記: UTF-16 とは対照的に、文字列が常にリトルエンディアン形式とみなされます。

IANA 文字セット登録名:UTF-8

依存する文字集合:Unicode / UCS

説明: 8 ビット幅の Unicode 変換フォーマットです。

注記:none

IANA 文字セット登録名:UTF-7

依存する文字集合:Unicode

説明: メールで安全に使用できる Unicode 変換フォーマットです。 » RFC2152 で定義されています。

注記:none

IANA 文字セット登録名:(none)

依存する文字集合:Unicode

説明: UTF-7 の変化形です。 » IMAP プロトコルでの使用に特化しています。

注記:none

IANA 文字セット登録名: US-ASCII (推奨される MIME 名) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII

依存する文字集合:ASCII / ISO 646

説明: American Standard Code for Information Interchange は、一般的に使用される 7 ビットエンコーディングです。国際標準規格 ISO 646 として標準化されています。

注記:(none)

IANA 文字セット登録名: EUC-JP (推奨される MIME 名) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese

依存する文字集合: US-ASCII / JIS X0201:1997 (半角カナの部分) / JIS X0208:1990 / JIS X0212:1990 を合成したもの

説明: この名前が Extended UNIX Code Packed Format for Japanese を短縮したものであることからわかるように、一般的に UNIX 系のプラットフォームで用いられます。もととなるエンコーディング方式である Extended UNIX Code は、ISO 2022 にもとづいて設計されています。

注記: EUC-JP が参照している文字セットは IBM932 / CP932 のものとは異なります。これらはそれぞれ OS/2® および Microsoft® Windows® で用いられています。これらのプラットフォームとの間で情報をやり取りする場合は、代わりに EUCJP-WIN を使用してください。

IANA 文字セット登録名:Shift_JIS (推奨される MIME 名) / MS_Kanji / csShift_JIS

依存する文字集合:JIS X0201:1997 / JIS X0208:1997 を合成したもの

説明: Shift_JIS が開発されたのは 80 年代初期です。当時は日本語ワープロが普及していたため、旧来のエンコーディング方式である JIS X 0201:1976 との互換性を保つために開発されました。 IANA の定義によると、Shift_JIS のコードセットは IBM932 / CP932 とは微妙に異なります。しかし、"SJIS" / "Shift_JIS" という名前は、これらのコードセットを表すものとしてしばしば誤用されています。

注記:CP932 コードマップを使用するには、代わりに SJIS-WIN を使用してください。

IANA 文字セット登録名:(none)

依存する文字集合: JIS X0201:1997 / JIS X0208:1997 / IBM 拡張文字 / NEC 拡張文字を合成したもの

説明: この "エンコーディング" は EUC-JP と同じエンコーディング方式を使用しますが、もととなる文字セットが異なります。つまり、EUC-JP とは異なる文字に対応するコードポイントがあるということです。

注記:none

IANA 文字セット登録名:Windows-31J / csWindows31J

依存する文字集合: JIS X0201:1997 / JIS X0208:1997 / IBM 拡張文字 / NEC 拡張文字を合成したもの

説明: この "エンコーディング" は Shift_JIS と同じエンコーディング方式を使用しますが、もととなる文字セットが異なります。つまり、Shift_JIS とは異なる文字に対応するコードポイントがあるということです。

注記:(none)

IANA 文字セット登録名:ISO-2022-JP (推奨される MIME 名) / csISO2022JP

依存する文字集合: US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983

説明:» RFC1468

注記:(none)

IANA 文字セット登録名:JIS

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-1

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-2

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-3

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-4

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-5

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-6

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-7

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-8

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-9

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-10

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-13

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-14

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-8859-15

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:byte2be

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:byte2le

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:byte4be

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:byte4le

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:BASE64

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:HTML-ENTITIES

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:7bit

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:8bit

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:EUC-CN

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:CP936

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:HZ

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:EUC-TW

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:CP950

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:BIG-5

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:EUC-KR

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:UHC (CP949)

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:ISO-2022-KR

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:Windows-1251 (CP1251)

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:Windows-1252 (CP1252)

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:CP866 (IBM866)

依存する文字集合:

説明:

注記:

IANA 文字セット登録名:KOI8-R

依存する文字集合:

説明:

注記: