GNU Emacs Manual(Japanese Translation): Charsets

22.18 文字セット

Emacsでは“文字セット(character set)”を縮めて、charsetと呼びます。Emacsは、ほとんどの有名なcharsets(ascii、iso-8859-1、cp1250、big5、unicodeなど)に加えて、Emacs自身のcharsets(emacs、unicode-bmp、eight-bitなど)をサポートします。すべてのサポートされた文字は、1つ以上のcharsetsに属します。

Emacsは通常、charsetsにたいして“正しいことを行う(does the right thing)”ので、あなたはそれらを心配する必要はありません。しかし、charsetsの背景の詳細を知ることが助けになる場合もあります。

1つの例はフォント選択です(Fontsを参照してください)。それぞれの言語環境(Language Environmentsを参照してください)は、さまざまな文字にたいする“優先リスト(priority list)”を定義します。フォントを検索するとき、Emacsは最初に一番優先度の高いcharsetsを表示できるものを探すことを試みます。たとえばJapanese言語環境では、charsets japanese-jisx0208は一番高い優先度をもっているので、Emacsはregistryプロパティーが‘JISX0208.1983-0’のフォントの使用を試みます。

charsetsに関する情報を得るのに使うことができるコマンドが2つあります。コマンドM-x list-charset-charsはcharset名の入力を求め、その文字セットのすべての文字を表示します。コマンドM-x describe-character-setはcharset名の入力を求め、Emacsでの内部表現も含めたそのcharsetに関する情報を表示します。

M-x list-character-setsは、すべてのサポートされたcharsetsを表示します。このリストはcharsetsの名前と、各charsetを識別する追加の情報を与えます。詳細は、International Register of Coded Character Setsを参照してください。このリストでは、charsetsは2つのカテゴリーに分かれています。通常のcharsets(normal charsets)が最初にリストされ、その後に追加のcharsets(supplementary charsets)が続きます。追加のcharsetは他のcharsetを定義するのに(サブセットの親として)使用されるか、古いバージョンのEmacsとの互換性のために提供されます。

バッファーの文字がどのcharsetに属するか探すには、ポイントをその文字の前において、C-u C-x =をタイプします(International Charsを参照してください)。