Ruby 1.9.2 リファレンスマニュアル > ライブラリ一覧 > 組み込みライブラリ > Encodingクラス

class Encoding

クラスの継承リスト: Encoding < Object < Kernel < BasicObject

要約

文字エンコーディング(文字符号化方式)のクラスです。Rubyの多言語対応(M17N)機能において利用されます。

例えば文字列オブジェクトは、文字列のバイト表現の他にそのバイト表現がどのエンコーディングによるものであるかも併せて保持しています。この情報は String#encoding により取得できます。 Encoding オブジェクトを返すメソッドにはこの他に IO#internal_encoding, IO#external_encoding などがあります。

@see 多言語化

目次

特異メソッド
aliases compatible? default_external default_external= default_internal default_internal= find list locale_charmap name_list
インスタンスメソッド
ascii_compatible? dummy? inspect name to_s names replicate
定数
ANSI_X3_4_1968 ASCII US_ASCII ASCII_8BIT BINARY BIG5 Big5 BIG5_HKSCS Big5_HKSCS BIG5_UAO Big5_UAO CP1250 WINDOWS_1250 Windows_1250 CP1251 WINDOWS_1251 Windows_1251 CP1252 WINDOWS_1252 Windows_1252 CP1253 WINDOWS_1253 Windows_1253 CP1254 WINDOWS_1254 Windows_1254 CP1255 WINDOWS_1255 Windows_1255 CP1256 WINDOWS_1256 Windows_1256 CP1257 WINDOWS_1257 Windows_1257 CP1258 WINDOWS_1258 Windows_1258 CP437 IBM437 CP50220 CP50221 CP51932 CP65000 UTF_7 CP65001 UTF_8 CP737 IBM737 CP775 IBM775 CP850 IBM850 CP852 IBM852 CP855 IBM855 CP857 IBM857 CP860 IBM860 CP861 IBM861 CP862 IBM862 CP863 IBM863 CP864 IBM864 CP865 IBM865 CP866 IBM866 CP869 IBM869 CP874 WINDOWS_874 Windows_874 CP878 KOI8_R CP932 CSWINDOWS31J CsWindows31J WINDOWS_31J Windows_31J CP936 GBK CP949 CP950 CP951 EMACS_MULE Emacs_Mule EUCCN EUC_CN EucCN EUCJP EUC_JP EucJP EUCJP_MS EUC_JP_MS EucJP_ms EUCKR EUC_KR EucKR EUCTW EUC_TW EucTW GB12345 GB18030 GB1988 ISO2022_JP ISO_2022_JP ISO2022_JP2 ISO_2022_JP_2 ISO8859_1 ISO_8859_1 ISO8859_10 ISO_8859_10 ISO8859_11 ISO_8859_11 ISO8859_13 ISO_8859_13 ISO8859_14 ISO_8859_14 ISO8859_15 ISO_8859_15 ISO8859_16 ISO_8859_16 ISO8859_2 ISO_8859_2 ISO8859_3 ISO_8859_3 ISO8859_4 ISO_8859_4 ISO8859_5 ISO_8859_5 ISO8859_6 ISO_8859_6 ISO8859_7 ISO_8859_7 ISO8859_8 ISO_8859_8 ISO8859_9 ISO_8859_9 ISO_2022_JP_KDDI KOI8_U MACCENTEURO MacCentEuro MACCROATIAN MacCroatian MACCYRILLIC MacCyrillic MACGREEK MacGreek MACICELAND MacIceland MACJAPAN MACJAPANESE MacJapan MacJapanese MACROMAN MacRoman MACROMANIA MacRomania MACTHAI MacThai MACTURKISH MacTurkish MACUKRAINE MacUkraine SHIFT_JIS SJIS Shift_JIS SJIS_DOCOMO SJIS_DoCoMo SJIS_KDDI SJIS_SOFTBANK SJIS_SoftBank STATELESS_ISO_2022_JP Stateless_ISO_2022_JP STATELESS_ISO_2022_JP_KDDI Stateless_ISO_2022_JP_KDDI TIS_620 UCS_2BE UTF_16BE UCS_4BE UTF_32BE UCS_4LE UTF_32LE UTF8_DOCOMO UTF8_DoCoMo UTF8_KDDI UTF8_MAC UTF_8_HFS UTF_8_MAC UTF8_SOFTBANK UTF8_SoftBank UTF_16LE

特異メソッド

aliases -> Hash[permalink][rdoc]

エンコーディングの別名に対して元の名前を対応づけるハッシュを返します。

例:

p Encoding.aliases
#=> {"BINARY"=>"ASCII-8BIT", "ASCII"=>"US-ASCII", "ANSI_X3.4-1986"=>"US-ASCII",
    "SJIS"=>"Shift_JIS", "eucJP"=>"EUC-JP", "CP932"=>"Windows-31J"}
compatible?(obj1, obj2) -> Encoding | nil[permalink][rdoc]

2つのオブジェクトのエンコーディングに関する互換性をチェックします。 互換性がある場合はそのエンコーディングを、 ない場合は nil を返します。

引数が両方とも文字列である場合、互換性があるならば その文字列を結合できます。この場合返り値のエンコーディングは 結合した文字列が取るであろう Encoding オブジェクトを返します。

Encoding.compatible?("\xa1".force_encoding("iso-8859-1"), "b")
#=> #<Encoding:ISO-8859-1>

Encoding.compatible?(
  "\xa1".force_encoding("iso-8859-1"),
  "\xa1\xa1".force_encoding("euc-jp"))
#=> nil

引数が文字列でない場合でも、両方のオブジェクトが encoding を持つ場合には 互換性を判定することができます。

Encoding.compatible?(Encoding::UTF_8, Encoding::CP932)
# => nil
Encoding.compatible?(Encoding::UTF_8, Encoding::US_ASCII)
# => #<Encoding:UTF-8>
[PARAM] obj1:
チェック対象のオブジェクト
[PARAM] obj2:
チェック対象のオブジェクト
default_external -> Encoding[permalink][rdoc]

規定の外部エンコーディングを返します。

入出力において、外部エンコーディングが指定されていない場合の規定値として利用されます。Rubyはロケールまたは -E オプションに従って default_external を決定します。ロケールの確認・設定方法については各システムのマニュアルを参照してください。

default_external は必ず設定されます。Encoding.locale_charmap が nil を返す場合には US-ASCII が、 ロケールにRubyが扱えないエンコーディングが指定されている場合には ASCII-8BIT が、default_external に設定されます。

[SEE_ALSO] locale(1), Encoding.locale_charmap

default_external=(encoding)[permalink][rdoc]

規定の外部エンコーディングを設定します。

default_internal -> Encoding | nil[permalink][rdoc]

規定の内部エンコーディングを返します。

default_internal=(encoding)[permalink][rdoc]

規定の内部エンコーディングを設定します。

find(name) -> Encoding[permalink][rdoc]

指定された name という名前を持つ Encoding オブジェクトを返します。

[PARAM] name:
エンコーディング名を表す String を指定します。
[RETURN]
発見された Encoding オブジェクトを返します。
[EXCEPTION] ArgumentError:
指定した名前のエンコーディングが発見できないと発生します。

特殊なエンコーディング名として、ロケールエンコーディングを表す locale、default_external を表す external、default_internal を表す internal、ファイルシステムエンコーディングを表す filesystem があります。

例:

p Encoding.find("utf-8")       #=> #<Encoding:UTF-8>
list -> [Encoding][permalink][rdoc]

現在ロードされているエンコーディングのリストを返します。

例:

Encoding.list
=> [#<Encoding:ASCII-8BIT>, #<Encoding:EUC-JP>,
    #<Encoding:Shift_JIS>, #<Encoding:UTF-8>,
    #<Encoding:ISO-2022-JP (dummy)>]

Encoding.find("US-ASCII")
=> #<Encoding:US-ASCII>

Encoding.list
=> [#<Encoding:ASCII-8BIT>, #<Encoding:EUC-JP>,
    #<Encoding:Shift_JIS>, #<Encoding:UTF-8>,
    #<Encoding:US-ASCII>, #<Encoding:ISO-2022-JP (dummy)>]
locale_charmap -> String | nil[permalink][rdoc]

ロケールエンコーディングを決定するために用いる、locale charmap 名を返します。nl_langinfo 等がない環境では nil を、miniruby では ASCII_8BIT を返します。

Debian GNU/Linux
  LANG=C
    Encoding.locale_charmap  => "ANSI_X3.4-1968"
LANG=ja_JP.EUC-JP
    Encoding.locale_charmap  => "EUC-JP"

SunOS 5
  LANG=C
    Encoding.locale_charmap  => "646"
  LANG=ja
    Encoding.locale_charmap  => "eucJP"

[SEE_ALSO] charmap(5)

name_list -> [String][permalink][rdoc]

利用可能なエンコーディングの名前を文字列の配列で返します。

例:

p Encoding.name_list
#=> ["US-ASCII", "ASCII-8BIT", "UTF-8",
     "ISO-8859-1", "Shift_JIS", "EUC-JP",
     "Windows-31J",
     "BINARY", "CP932", "eucJP", ...]

インスタンスメソッド

ascii_compatible? -> bool[permalink][rdoc]

自身が ASCII 互換のエンコーディングである場合真返します。 そうでない場合は偽を返します。

例:

Encoding::UTF_8.ascii_compatible?     #=> true
Encoding::UTF_16BE.ascii_compatible?  #=> false
dummy? -> bool[permalink][rdoc]

自身がダミーエンコーディングである場合に true を返します。 そうでない場合に false を返します。

ダミーエンコーディングとは Ruby が名前を知っているものの実質的には対応していないエンコーディングのことです。例えば、ダミーエンコーディングで符号化された文字列の場合、 String#length はマルチバイト文字を考慮せずにバイト列の長さを返します。

ダミーエンコーディングも IO の外部エンコーディングに指定できます。また Ruby はサポートしていないが拡張ライブラリがサポートしているエンコーディングを扱う場合にも 用います。

例:

Encoding::ISO_2022_JP.dummy?       #=> true
Encoding::UTF_8.dummy?             #=> false
inspect -> String[permalink][rdoc]

プログラマにわかりやすい表現の文字列を返します。

例:

Encoding::UTF_8.inspect       #=> "#<Encoding:UTF-8>"
Encoding::ISO_2022_JP.inspect #=> "#<Encoding:ISO-2022-JP (dummy)>"
name -> String[permalink][rdoc]
to_s -> String

エンコーディングの名前を返します。

Encoding::UTF_8.name       => "UTF-8"
names -> String[permalink][rdoc]

エンコーディングの名前とエイリアス名の配列を返します。

Encoding::UTF_8.names      => ["UTF-8", "CP65001"]
replicate(name) -> Encoding[permalink][rdoc]

レシーバのエンコーディングを複製(replicate)します。 複製されたエンコーディングは元のエンコーディングと同じバイト構造を持たなければなりません。 name という名前のエンコーディングが既に存在する場合は ArgumentError を発生します。

定数

US_ASCII -> Encoding[permalink][rdoc]
ASCII -> Encoding
ANSI_X3_4_1968 -> Encoding

US-ASCII、いわゆる ASCII のことで、ISO 646 IRV と一致します。

7bit の範囲のみを含み、8bit 目の立っている文字 (たとえば \x80 など) が含まれる場合は正しいエンコーディングであるとみなしません。

ASCII_8BIT -> Encoding[permalink][rdoc]
BINARY -> Encoding

ASCII-8BIT、ASCII互換オクテット列用のエンコーディングです。

もっぱら文字エンコーディングを持たないデータ、文字を符号化したのではない単なるバイトの列を表現するために用いますが、このエンコーディングは ASCII 互換であることがポイントです。

Big5 -> Encoding[permalink][rdoc]
BIG5 -> Encoding

Big5 エンコーディングです。

台湾で使われている繁体字中国語のエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Big5

Big5_HKSCS -> Encoding[permalink][rdoc]
BIG5_HKSCS -> Encoding

Big5-HKSCS エンコーディングです。

香港で使われている Big5 の亜種です。

[SEE_ALSO] http://www.iana.org/assignments/charset-reg/Big5-HKSCS, http://www.ogcio.gov.hk/en/business/tech_promotion/ccli/hkscs/

BIG5_UAO -> Encoding[permalink][rdoc]
Big5_UAO -> Encoding

Big5_UAO エンコーディングです。

Big5 の亜種(非公式的拡張)です。

Unicodeとの対応表が http://moztw.org/docs/big5/table/big5_2003-b2u.txt にあります。

Windows_1250 -> Encoding[permalink][rdoc]
CP1250 -> Encoding
WINDOWS_1250 -> Encoding

Windows-1250 エンコーディング。

ISO8859-2 の亜種です。

[SEE_ALSO] http://www.microsoft.com/globaldev/reference/sbcs/1250.mspx, http://en.wikipedia.org/wiki/Windows-1250

Windows_1251 -> Encoding[permalink][rdoc]
CP1251 -> Encoding
WINDOWS_1251 -> Encoding

Windows-1251 エンコーディング。

キリル文字を用いる言語を取り扱う8bit single-byteエンコーディングです。

[SEE_ALSO] http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1251.mspx, http://en.wikipedia.org/wiki/Windows-1251

Windows_1252 -> Encoding[permalink][rdoc]
CP1252 -> Encoding
WINDOWS_1252 -> Encoding

Windows-1252 エンコーディングです。

ISO8859-1 の亜種です。

[SEE_ALSO] Encoding::ISO_8859_1 http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1252.mspx, http://en.wikipedia.org/wiki/Windows-1252

Windows_1253 -> Encoding[permalink][rdoc]
CP1253 -> Encoding
WINDOWS_1253 -> Encoding

Windows-1253 エンコーディング。

ISO8859-7 の亜種です。

[SEE_ALSO] Encoding::ISO_8859_7, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1253.mspx, http://en.wikipedia.org/wiki/Windows-1253

Windows_1254 -> Encoding[permalink][rdoc]
CP1254 -> Encoding
WINDOWS_1254 -> Encoding

Windows-1254 エンコーディング。

ISO8859-9 の亜種です。

[SEE_ALSO] Encoding::ISO_8859_9, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1254.mspx, http://en.wikipedia.org/wiki/Windows-1254

Windows_1255 -> Encoding[permalink][rdoc]
CP1255 -> Encoding
WINDOWS_1255 -> Encoding

Windows-1255 エンコーディング。

ISO8859-8 の亜種です。

[SEE_ALSO] Encoding::ISO_8859_8, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1255.mspx, http://en.wikipedia.org/wiki/Windows-1255,

Windows_1256 -> Encoding[permalink][rdoc]
CP1256 -> Encoding
WINDOWS_1256 -> Encoding

Windows-1256 エンコーディング。

Windowsで用いられる、アラビア文字を扱う 8bit single-byte エンコーディングです。

[SEE_ALSO] Encoding::ISO_8859_6, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1256.mspx, http://en.wikipedia.org/wiki/Windows-1256

Windows_1257 -> Encoding[permalink][rdoc]
CP1257 -> Encoding
WINDOWS_1257 -> Encoding

Windows-1257 エンコーディング。

ISO8859-13 の亜種です。

[SEE_ALSO] Encoding::ISO8859_13, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1257.mspx, http://en.wikipedia.org/wiki/Windows-1257,

Windows_1258 -> Encoding[permalink][rdoc]
CP1258 -> Encoding
WINDOWS_1258 -> Encoding

WINDOWS-1258 エンコーディング。

ベトナム語を扱う 8bit single-byteエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Windows-1258

IBM437 -> Encoding[permalink][rdoc]
CP437 -> Encoding

CP437 エンコーディング。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_437, Encoding::CP869

CP50220 -> Encoding[permalink][rdoc]

CP50220 エンコーディング、 Windows で用いられる ISO-2022-JP 亜種です。

CP50221 とほぼ同様のエンコーディングですが、 他のエンコーディングへの変換テーブルが少し異なります。

[SEE_ALSO] http://legacy-encoding.osdn.jp/wiki/index.php?cp50220

CP50221 -> Encoding[permalink][rdoc]

Windows で用いられる、ISO-2022-JP 亜種です。

ISO-2022-JP に加え、ESC ( I でいわゆる半角カナを許し、Windows の機種依存文字を扱うことができます。

[SEE_ALSO] http://legacy-encoding.osdn.jp/wiki/index.php?cp50221

CP51932 -> Encoding[permalink][rdoc]

Windows で用いられる、日本語 EUC 亜種です。

G0 が US-ASCII、G1 が JIS X 0201 片仮名図形文字集合、G2 が JIS X 0208 + Windows の機種依存文字となっており、G3 は未割り当てになっています。

[SEE_ALSO] http://legacy-encoding.osdn.jp/wiki/index.php?cp51932

UTF_7 -> Encoding[permalink][rdoc]
CP65000 -> Encoding

UTF-7 です。

7ビットの範囲内で表現される、Unicode のエンコーディングの一種です。 ダミーエンコーディングです。

UTF_8 -> Encoding[permalink][rdoc]
CP65001 -> Encoding

UTF-8。Unicode や ISO 10646 を ASCII 互換な形で符号化するための方式です。

BOM を含みません。

[SEE_ALSO] http://tools.ietf.org/html/rfc3629

IBM737 -> Encoding[permalink][rdoc]
CP737 -> Encoding

CP437 エンコーディング。

ギリシャ語を取り扱う 8bit single-byteエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_737

IBM775 -> Encoding[permalink][rdoc]
CP775 -> Encoding

CP775 エンコーディング。

バルト語派の言語を扱うための 8bit single-byteエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_775

CP850 -> Encoding[permalink][rdoc]
IBM850 -> Encoding

CP850 エンコーディング。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_850

IBM852 -> Encoding[permalink][rdoc]
CP852 -> Encoding

CP852 エンコーディング。

ラテンアルファベットを用いる中欧の言語のための 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_852

IBM855 -> Encoding[permalink][rdoc]
CP855 -> Encoding

CP855 エンコーディング。

キリル文字を用いる言語のための 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_855

IBM857 -> Encoding[permalink][rdoc]
CP857 -> Encoding

CP857 エンコーディング。

トルコ語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_857

IBM860 -> Encoding[permalink][rdoc]
CP860 -> Encoding

CP860 エンコーディング。

ポルトガル語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_860

IBM861 -> Encoding[permalink][rdoc]
CP861 -> Encoding

CP861 エンコーディング。

アイスランド語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_861

IBM862 -> Encoding[permalink][rdoc]
CP862 -> Encoding

CP862 エンコーディング。

ヘブライ語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_861

IBM863 -> Encoding[permalink][rdoc]
CP863 -> Encoding

CP863 エンコーディング。

フランス語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_863

IBM864 -> Encoding[permalink][rdoc]
CP864 -> Encoding

CP864 エンコーディング。

アラビア語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_864

IBM865 -> Encoding[permalink][rdoc]
CP865 -> Encoding

CP865 エンコーディング。

北欧の諸言語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_865

IBM866 -> Encoding[permalink][rdoc]
CP866 -> Encoding

CP866 エンコーディング。

キリル文字を使う諸言語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_866

IBM869 -> Encoding[permalink][rdoc]
CP869 -> Encoding

CP869 エンコーディング。

ギリシャ語を取り扱う 8bit single-byteエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_869, Encoding::CP737

Windows_874 -> Encoding[permalink][rdoc]
CP874 -> Encoding
WINDOWS_874 -> Encoding

Windows-874 エンコーディング。

タイ語を扱うエンコーディングで、ISO8859-11の亜種です。

[SEE_ALSO] Encoding::TIS_620, Encoding::ISO_8859_11, http://www.microsoft.com/globaldev/reference/sbcs/874.mspx

KOI8_R -> Encoding[permalink][rdoc]
CP878 -> Encoding

KOI8-R エンコーディング。

ロシア語のキリル文字で使われる8bit single-byteエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/KOI8-R

Windows_31J -> Encoding[permalink][rdoc]
CP932 -> Encoding
CSWINDOWS31J -> Encoding
CsWindows31J -> Encoding
WINDOWS_31J -> Encoding

Windows-31J、Windows で用いられる、シフトJIS亜種で、CP932とも言います。

7bit 部分が論理的には US-ASCIIであり、また Windows の機種依存文字を扱うことができます。

[SEE_ALSO] http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/index.html, http://legacy-encoding.osdn.jp/wiki/index.php?cp932

GBK -> Encoding[permalink][rdoc]
CP936 -> Encoding

GBK エンコーディング

中国で用いられる簡体字中国語のエンコーディングです。

[SEE_ALSO] http://www.iana.org/assignments/character-sets, http://www.iana.org/assignments/charset-reg/GBK, http://www.microsoft.com/globaldev/reference/dbcs/936.mspx

CP949 -> Encoding[permalink][rdoc]

CP949 エンコーディング。

EUC-KR に近い、韓国語を取り扱う multi-byte エンコーディングです。

[SEE_ALSO] Encoding::EUC_KR, http://www.microsoft.com/globaldev/reference/dbcs/949.mspx, http://en.wikipedia.org/wiki/EUC-KR#EUC-KR,

CP950 -> Encoding[permalink][rdoc]

CP950 エンコーディングです。

Windows で使われる Big5 の亜種です。

[SEE_ALSO] http://msdn.microsoft.com/en-us/goglobal/cc305155.aspx

CP951 -> Encoding[permalink][rdoc]

CP951 エンコーディングです。

Windows で使われる Big5-HKSCS の亜種です。

[SEE_ALSO] http://www.microsoft.com/hk/hkscs/default.aspx, http://www.microsoft.com/downloads/en/details.aspx?FamilyID=0e6f5ac8-7baa-4571-b8e8-78b3b776afd7&DisplayLang=en, http://blogs.msdn.com/b/shawnste/archive/2007/03/12/cp-951-hkscs.aspx

EMACS_MULE -> Encoding[permalink][rdoc]
Emacs_Mule -> Encoding

Emacs-Mule エンコーディングです。

Emacsの多言語化(Mule)で使われているステートレスのエンコーディングです。

[SEE_ALSO] http://web.archive.org/web/20100714080650/http://www.m17n.org/mule/pricai96/mule.en.html

EUC_CN -> Encoding[permalink][rdoc]
EUCCN -> Encoding
EucCN -> Encoding

ENC-CN エンコーディングです。

中国で用いられる簡体字中国語 EUCのエンコーディングです。 GB2312 と呼ばれることも多いです。

EUC_JP -> Encoding[permalink][rdoc]
EucJP -> Encoding
EUCJP -> Encoding

IANA Character Sets にある EUC-JP のことです。

日本語 EUC 亜種で、G0 が US-ASCII、G1 が JIS X 0201 片仮名図形文字集合、G2 が JIS X 0208、G3 が JIS X 0212 となっています。 EUC-JP を指定する場合は、それが実際には CP51932 のことである可能性を考えなければなりません。

EUCJP_MS -> Encoding[permalink][rdoc]
EucJP_ms -> Encoding
EUC_JP_MS -> Encoding

eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。

EUC-JPに加え、Windowsの機種依存文字とユーザ定義文字を扱うことができます。

[SEE_ALSO] http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/eucJP-ms.html, http://legacy-encoding.osdn.jp/wiki/index.php?eucJP-ms, http://blog.livedoor.jp/numa2666/archives/50980727.html

EUC_KR -> Encoding[permalink][rdoc]
EUCKR -> Encoding
EucKR -> Encoding

EUC-KR エンコーディングです。

韓国語 EUC のエンコーディングです。

EUC_TW -> Encoding[permalink][rdoc]
EUCTW -> Encoding
EucTW -> Encoding

EUC-TW エンコーディングです。

台湾で用いられる繁体字中国語 EUCのエンコーディングです。

GB12345 -> Encoding[permalink][rdoc]

GB 12345 エンコーディング。

GB 2312 から派生したもので、繁体字中国語を取り扱うエンコーディングです。

GB18030 -> Encoding[permalink][rdoc]

GBK エンコーディング

中国で用いられる中国語のエンコーディングです。

[SEE_ALSO] http://www.iana.org/assignments/charset-reg/GB18030

GB1988 -> Encoding[permalink][rdoc]

GB1988 エンコーディング。

ISO/IEC 646 の中国版です。

ISO_2022_JP -> Encoding[permalink][rdoc]
ISO2022_JP -> Encoding

ISO 2022-JP エンコーディングです。

[SEE_ALSO] http://tools.ietf.org/html/rfc1468

ISO_2022_JP_2 -> Encoding[permalink][rdoc]
ISO2022_JP2 -> Encoding

ISO-2022-JP-2 エンコーディングです。

ISO-2022-JP の拡張版です。

[SEE_ALSO] Encoding::ISO_2022_JP

ISO_8859_1 -> Encoding[permalink][rdoc]
ISO8859_1 -> Encoding

ISO-8859-1 エンコーディングです。

多くの西欧言語を含むさまざまなラテン文字言語を表現するための 8bitエンコーディングです。

Latin-1 とも呼ばれます。

ISO_8859_10 -> Encoding[permalink][rdoc]
ISO8859_10 -> Encoding

ISO 8859-10 エンコーディング。

北欧の言語を扱う 8bit single-byte エンコーディングです。

ISO_8859_11 -> Encoding[permalink][rdoc]
ISO8859_11 -> Encoding

ISO8859-11 エンコーディング。

タイ語を扱う 8bit single-byte エンコーディングです。

[SEE_ALSO] Encoding::TIS_620

ISO_8859_13 -> Encoding[permalink][rdoc]
ISO8859_13 -> Encoding

ISO8859-13 エンコーディング。

バルト語派の言語を扱う8bit single-byteエンコーディングです。

[SEE_ALSO] Encoding::Windows_1257

ISO_8859_14 -> Encoding[permalink][rdoc]
ISO8859_14 -> Encoding

ISO8859-14 エンコーディング。

ケルト語派の言語を扱う8bit single-byteエンコーディングです。

[SEE_ALSO] Encoding::Windows_1257

ISO_8859_15 -> Encoding[permalink][rdoc]
ISO8859_15 -> Encoding

ISO 8859-15 エンコーディング。

ISO 8859-1 の改訂版です。

ISO_8859_16 -> Encoding[permalink][rdoc]
ISO8859_16 -> Encoding

ISO 8859-16 エンコーディング。

東欧を中心とした地域の諸語を扱う 8bit single-byte エンコーディングです。

ISO_8859_2 -> Encoding[permalink][rdoc]
ISO8859_2 -> Encoding

ISO8859-2 エンコーディング。

中東欧の言語を扱う 8bit single-byte エンコーディングです。

ISO_8859_3 -> Encoding[permalink][rdoc]
ISO8859_3 -> Encoding

ISO8859-3 エンコーディング。

トルコ語、マルタ語、エスペラントを扱う 8bit single-byte エンコーディングです。

ISO_8859_4 -> Encoding[permalink][rdoc]
ISO8859_4 -> Encoding

ISO 8859-4 エンコーディング。

北欧の言語を扱う 8bit single-byte エンコーディングです。

ISO_8859_5 -> Encoding[permalink][rdoc]
ISO8859_5 -> Encoding

ISO 8859-5 エンコーディング。

キリル文字を用いる言語を扱う 8bit single-byte エンコーディングです。

ISO_8859_6 -> Encoding[permalink][rdoc]
ISO8859_6 -> Encoding

ISO8859-6 エンコーディング。

アラビア文字を扱う 8bit single-byte エンコーディングです。

[SEE_ALSO] Encoding::Windows_1256

ISO_8859_7 -> Encoding[permalink][rdoc]
ISO8859_7 -> Encoding

ISO8859-7 エンコーディング。

ギリシャ語を扱う 8bit single-byte エンコーディングです。

[SEE_ALSO] Encoding::Windows_1253

ISO_8859_8 -> Encoding[permalink][rdoc]
ISO8859_8 -> Encoding

ISO8859-8 エンコーディング。

ヘブライ語を扱う 8bit single-byte エンコーディングです。

[SEE_ALSO] Encoding::Windows_1255

ISO_8859_9 -> Encoding[permalink][rdoc]
ISO8859_9 -> Encoding

ISO8859-9 エンコーディング。

ISO8859-1 に近い、 トルコ語を扱うことができる8bit single-byteエンコーディングです。

[SEE_ALSO] Encoding::Windows_1254

ISO_2022_JP_KDDI -> Encoding[permalink][rdoc]

ISO-2022-JP-KDDI エンコーディングです。

ISO-2022-JP の亜種です。 KDDI の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf

KOI8_U -> Encoding[permalink][rdoc]

KOI8-U エンコーディング。

ウクライナ語のキリル文字で使われる8bit single-byteエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/KOI8-U

MacCentEuro -> Encoding[permalink][rdoc]
MACCENTEURO -> Encoding

MacCentEuro エンコーディング。

Mac OSで使われる 8bit single-byteエンコーディングで、 中欧および南東欧の言語を取り扱うものです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Macintosh_Central_European_encoding

MacCroatian -> Encoding[permalink][rdoc]
MACCROATIAN -> Encoding

MacCroatian エンコーディング。

Mac OS で使われる 8bit single-byteエンコーディングで、 クロアチア語、スベロニア語を取り扱うものです。

[SEE_ALSO] http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/CROATIAN.TXT

MacCyrillic -> Encoding[permalink][rdoc]
MACCYRILLIC -> Encoding

MacCyrillic エンコーディング。

Mac OS で使われる 8bit single-byte エンコーディングで、 キリル文字を取り扱うものです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Macintosh_Cyrillic_encoding

MacGreek -> Encoding[permalink][rdoc]
MACGREEK -> Encoding

MacGreek エンコーディング。

Mac OSで使われる 8bit single-byte エンコーディングで、 ギリシャ語のために使われます。

[SEE_ALSO] http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/GREEK.TXT

MacIceland -> Encoding[permalink][rdoc]
MACICELAND -> Encoding

MacIceland エンコーディング。

Mac OSで使われる 8bit single-byte エンコーディングで、 アイスランド語のために使われます

[SEE_ALSO] http://en.wikipedia.org/wiki/Mac_Icelandic_encoding

MacJapanese -> Encoding[permalink][rdoc]
MACJAPAN -> Encoding
MACJAPANESE -> Encoding
MacJapan -> Encoding

MacJapanese エンコーディング。

Mac OS の 9.x までで用いられていた Shift_JIS 亜種です。

[SEE_ALSO] http://unicode.org/Public/MAPPINGS/VENDORS/APPLE/JAPANESE.TXT, http://ja.wikipedia.org/wiki/MacJapanese

MacRoman -> Encoding[permalink][rdoc]
MACROMAN -> Encoding

MacRoman エンコーディング。

Mac OSで使われる 8bit single-byte エンコーディングで、 西欧を中心としたラテン文字を用いる諸語を取り扱うためのものです。

IANA character-sets で "macintosh" で表現されるものです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Mac_OS_Roman

MacRomania -> Encoding[permalink][rdoc]
MACROMANIA -> Encoding

MacRoman エンコーディング。

Mac OSで使われる 8bit single-byte エンコーディングで、 ルーマニア語のために使われます。

[SEE_ALSO] http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/ROMANIAN.TXT

MacThai -> Encoding[permalink][rdoc]
MACTHAI -> Encoding

MacThai エンコーディング。

タイ語を扱うエンコーディングで、ISO8859-11の亜種です。

[SEE_ALSO] Encoding::TIS_620, Encoding::ISO_8859_11

MacTurkish -> Encoding[permalink][rdoc]
MACTURKISH -> Encoding

MacTurkish エンコーディング。

Mac OSで使われる 8bit single-byte エンコーディングで、 トルコ語のために使われます。

[SEE_ALSO] http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/TURKISH.TXT

MacUkraine -> Encoding[permalink][rdoc]
MACUKRAINE -> Encoding

MacUkraine エンコーディング。

Mac OS で使われる、ウクライナ語キリル文字を取り扱うエンコーディング。 MacCyrillic の亜種です。

[SEE_ALSO] http://en.wikipedia.org/wiki/Macintosh_Ukrainian_encoding

Shift_JIS -> Encoding[permalink][rdoc]
SHIFT_JIS -> Encoding
SJIS -> Encoding

IANA Character Sets にある Shift_JIS のことです。

基本的にはJIS X 0208:1997の付属書1にある「シフト符号化表現」のことですが、 Ruby M17N では 7bit 部分が US-ASCII になっています。

SJIS_DOCOMO -> Encoding[permalink][rdoc]
SJIS_DoCoMo -> Encoding

SJIS-DoCoMo エンコーディングです。

Shift_JIS, CP932 の亜種です。 DoCoMo の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] https://www.nttdocomo.co.jp/english/service/developer/make/content/pictograph/basic/index.html, https://www.nttdocomo.co.jp/english/service/developer/make/content/pictograph/extention/index.html

SJIS_KDDI -> Encoding[permalink][rdoc]

SJIS-KDDI エンコーディングです。

Shift_JIS, CP932 の亜種です。 KDDI の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf

SJIS_SOFTBANK -> Encoding[permalink][rdoc]
SJIS_SoftBank -> Encoding

SJIS-SoftBank エンコーディングです。

Shift_JIS, CP932 の亜種です。 SoftBank の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://creation.mb.softbank.jp/mc/tech/tech_pic/pic_index.html

STATELESS_ISO_2022_JP -> Encoding[permalink][rdoc]
Stateless_ISO_2022_JP -> Encoding

stateless-ISO-2022-JP エンコーディングです。

ISO-2022-JPをステートレスに扱うための方式です。 Emacs-Mule エンコーディングを元にしています。

STATELESS_ISO_2022_JP_KDDI -> Encoding[permalink][rdoc]
Stateless_ISO_2022_JP_KDDI -> Encoding

stateless-ISO-2022-JP-KDDI エンコーディングです。

stateless-ISO-2022-JP の亜種です。 KDDI の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf

TIS_620 -> Encoding[permalink][rdoc]

TIS-620 エンコーディング。

タイ語を扱うためのエンコーディングで、 ISO8859-11 とほぼ 同一のエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Thai_Industrial_Standard_620-2533

UTF_16BE -> Encoding[permalink][rdoc]
UCS_2BE -> Encoding

UTF-16BE (ビッグエンディアン) です。

BOM を含みません。

UTF_32BE -> Encoding[permalink][rdoc]
UCS_4BE -> Encoding

UTF-32BE (ビッグエンディアン) です。

BOM を含みません。

UTF_32LE -> Encoding[permalink][rdoc]
UCS_4LE -> Encoding

UTF-32LE (リトルエンディアン) です。

BOM を含みません。

UTF8_DOCOMO -> Encoding[permalink][rdoc]
UTF8_DoCoMo -> Encoding

UTF8-DoCoMo エンコーディングです。

UTF-8 の亜種です。 DoCoMo の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] https://www.nttdocomo.co.jp/english/service/developer/make/content/pictograph/basic/index.html, https://www.nttdocomo.co.jp/english/service/developer/make/content/pictograph/extention/index.html

UTF8_KDDI -> Encoding[permalink][rdoc]

UTF8-KDDI エンコーディングです。

UTF8 の亜種です。 KDDI の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf

UTF8_MAC -> Encoding[permalink][rdoc]
UTF_8_MAC -> Encoding
UTF_8_HFS -> Encoding

UTF8-MAC、アップルによって修正された Normalization Form D(分解済み)という形式のUTF-8です。

[SEE_ALSO] http://developer.apple.com/jp/technotes/tn1150.html, http://developer.apple.com/jp/technotes/tn2078.html

UTF8_SOFTBANK -> Encoding[permalink][rdoc]
UTF8_SoftBank -> Encoding

UTF8-SoftBank エンコーディングです。

UTF-8 の亜種です。 SoftBank の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://creation.mb.softbank.jp/mc/tech/tech_pic/pic_index.html

UTF_16LE -> Encoding[permalink][rdoc]

UTF-16LE (リトルエンディアン) です。

BOM を含みません。