GNU Emacs Manual(Japanese Translation): Unibyte Mode

22.17 Unibyte編集モード

ISO 8859 Latin-n文字セットは、さまざまなEuropean言語で必要とされるアクセント文字と区切り文字を扱うために、8進の0240から0377(10進の160から250)の範囲の文字コードを定義しています。Emacsはこの範囲のバイトを、たとえunibyteバッファー(たとえばマルチバイト文字を無効にしている場合)でも、それらを文字としてではなく、rawバイトとみなします。しかし、それでもEmacsはこれらの文字コードを、あたかも1つも1バイト文字セットに属するかのように1度に扱うことができます。これらのコードのどれを使うかを指定するには、M-x set-language-environmentを呼び出して、‘Latin-n’のような適切な言語環境を指定します。Disabling Multibyte Characters in GNU Emacs Lisp Reference Manualを参照してください。

端末や使っているフォントがこれらの文字をサポートしている場合、Emacsは160から255の文字を読み取り可能な文字として表示できます。これは自動的に行われます。グラフィカルなディスプレーでは、Emacsはフォントセットを通じて1バイト文字として表示できます。これは現在の言語環境で、それらに対応するマルチバイト文字を表示することにより行われます。これを行うには、変数unibyte-display-via-language-environmentに非nil値を設定します。このセッティングは、これらのバイトを表示する方法だけに影響しますが、Emacsがそれらを文字としてではなくrawバイトとして扱うという基礎事実は変わらないことに注意して下さい。

端末でLatin-1文字セットを表示できない場合、Emacsはこれらの文字をその文字が少なくとも何であるかを明確に理解できるような、ASCIIシーケンスとして表示できます。これを行うには、ライブラリーiso-asciiをロードします。他のLatin-n文字セットに対しても似たようなライブラリを実装できますが、これはまだ行われていません。

通常、非ISO 8859文字セット(10進文字の128から159のコードも含む)は、8進でエスケープ表示されます。ライブラリーdisp-tableの関数standard-display-8bitを使うことにより、非標準の“拡張”バージョンのISO 8859文字セットに変更できます。

1バイトの非ASCII文字を入力する2つの方法があります:

選択した言語環境のインプットメソッドを使用することができます。Input Methodsを参照してください。unibyteバッファーでインプットメソッドを使用した場合、入力した非ASCII文字は、ユニバイトに変換されます。
キーボードが、非ASCII文字を表現する(10進の)128以上の文字コードを生成できるならば、それらの文字コードを直接タイプすることができます。
グラフィカルなディスプレーでは、これらのキーを使うのに特別なことをする必要はありません。それらは単純に機能するでしょう。テキスト端末では、コマンドM-x set-keyboard-coding-systemを使うか、変数keyboard-coding-systemをカスタマイズして、キーボードが使用するコーディングシステムを指定します(Terminal Codingを参照してください)。この機能を有効にすることにより、おそらくMeta文字を入力するためにESCを使う必要が生じるでしょう。しかし、コンソール端末、またはxtermでは、MetaをESCにアレンジすることが可能です。また8ビット文字を直接キーボードから入力したり、ComposeキーやAltGrキーを使うこともできます。User Inputを参照してください。
Latin-1にたいしてだけですが、非ASCIIのLatin-1のプリント文字入力の“合成文字”プレフィックスとしてC-x 8を使用できます。C-x 8は、(ミニバッファーや他のバッファーでの)挿入、検索、キーシーケンスが許される他のコンテキストなどで使用できます。
ライブラリーiso-translをロードすることによりC-x 8は機能します。1度ライブラリーをロードすると、Alt修飾キーがある場合は、C-x 8と同じ目的で使用できます。後続の文字を修飾するには、アクセント文字と一緒にAltを使用します。さらにLatin-1の“専用アクセント文字”キーがあると、1度iso-translをロードした後は、それらのキーも後続の文字を合成するように定義されます。

C-x 8 C-hを使用すると、利用可能なすべてのC-x 8翻訳を一覧します。