Emacsでは“文字セット(character
set)”を縮めて、charsetと呼びます。Emacsは、ほとんどの有名なcharsets(ascii
、iso-8859-1
、cp1250
、big5
、unicode
など)に加えて、Emacs自身のcharsets(emacs
、unicode-bmp
、eight-bit
など)をサポートします。すべてのサポートされた文字は、1つ以上のcharsetsに属します。
Emacsは通常、charsetsにたいして正しいことを行う(does the right thing)ので、あなたはそれらを心配する必要はありません。しかし、charsetsの背景の詳細を知ることが助けになる場合もあります。
1つの例はフォント選択です(フォントを参照してください)。それぞれの言語環境(言語環境を参照してください)は、さまざまな文字にたいする優先リスト(priority
list)を定義します。フォントを検索するとき、Emacsは最初に一番優先度の高いcharsetsを表示できるものを探すことを試みます。たとえばJapanese言語環境では、charsets
japanese-jisx0208
は一番高い優先度をもっているので、Emacsはregistry
プロパティが‘JISX0208.1983-0’のフォントの使用を試みます。
charsetsに関する情報を得るのに使うことができるコマンドが2つあります。コマンドM-x list-charset-charsはcharset名の入力を求め、その文字セットのすべての文字を表示します。コマンドM-x describe-character-setはcharset名の入力を求め、Emacsでの内部表現も含めたそのcharsetに関する情報を表示します。
M-x list-character-setsは、すべてのサポートされたcharsetsを表示します。このリストはcharsetsの名前と、各charsetを識別する追加の情報を与えます。詳細については、Information Processing Society of Japan/Information Technology Standards Commission of Japan (IPSJ/ITSCJ)により保守されている、ISO International Register of Coded Character Sets to be Used with Escape Sequences (ISO-IR)を参照してください。このリストでは、charsetsは2つのカテゴリーに分かれています。通常のcharsets(normal charsets)が最初にリストされ、その後に追加のcharsets(supplementary charsets)が続きます。追加のcharsetは他のcharsetを定義するのに(サブセットの親として)使用されるか、古いバージョンのEmacsとの互換性のために提供されます。
バッファーの文字がどのcharsetに属するか探すには、ポイントをその文字の前において、C-u C-x =をタイプします(国際化文字セットのイントロダクションを参照してください)。