Charsets (GNU Emacs Manual (Japanese Translation))

Next: 双方向の編集, Previous: Unibyte編集モード, Up: 国際化文字セットのサポート [Contents][Index]

24.19 文字セット ¶

Emacsでは“文字セット(character set)”を縮めて、charsetと呼びます。Emacsは、ほとんどの有名なcharsets(ascii、iso-8859-1、cp1250、big5、unicodeなど)に加えて、Emacs自身のcharsets(emacs、unicode-bmp、eight-bitなど)をサポートします。すべてのサポートされた文字は、1つ以上のcharsetsに属します。

Emacsは通常、charsetsにたいして正しいことを行う(does the right thing)ので、あなたはそれらを心配する必要はありません。しかし、charsetsの背景の詳細を知ることが助けになる場合もあります。

1つの例はフォント選択です(フォントを参照してください)。それぞれの言語環境(言語環境を参照してください)は、さまざまな文字にたいする優先リスト(priority list)を定義します。フォントを検索するとき、Emacsは最初に一番優先度の高いcharsetsを表示できるものを探すことを試みます。たとえばJapanese言語環境では、charsets japanese-jisx0208は一番高い優先度をもっているので、Emacsはregistryプロパティが‘JISX0208.1983-0’のフォントの使用を試みます。

charsetsに関する情報を得るのに使うことができるコマンドが2つあります。コマンドM-x list-charset-charsはcharset名の入力を求め、その文字セットのすべての文字を表示します。コマンドM-x describe-character-setはcharset名の入力を求め、Emacsでの内部表現も含めたそのcharsetに関する情報を表示します。

M-x list-character-setsは、すべてのサポートされたcharsetsを表示します。このリストはcharsetsの名前と、各charsetを識別する追加の情報を与えます。詳細については、Information Processing Society of Japan/Information Technology Standards Commission of Japan (IPSJ/ITSCJ)により保守されている、ISO International Register of Coded Character Sets to be Used with Escape Sequences (ISO-IR)を参照してください。このリストでは、charsetsは2つのカテゴリーに分かれています。通常のcharsets(normal charsets)が最初にリストされ、その後に追加のcharsets(supplementary charsets)が続きます。追加のcharsetは他のcharsetを定義するのに(サブセットの親として)使用されるか、古いバージョンのEmacsとの互換性のために提供されます。

バッファーの文字がどのcharsetに属するか探すには、ポイントをその文字の前において、C-u C-x =をタイプします(国際化文字セットのイントロダクションを参照してください)。