Unibyte Mode (GNU Emacs Manual (Japanese Translation))

Next: 文字セット, Previous: 表示できない文字, Up: 国際化文字セットのサポート [Contents][Index]

24.18 Unibyte編集モード ¶

ISO 8859 Latin-n文字セットは、さまざまなEuropean言語で必要とされるアクセント文字と区切り文字を扱うために、8進の0240から0377(10進の160から250)の範囲の文字コードを定義しています。Emacsはこの範囲のバイトを、たとえunibyteバッファー(たとえばマルチバイト文字を無効にしている場合)でも、それらを文字としてではなく、rawバイトとみなします。しかし、それでもEmacsはこれらの文字コードを、あたかも1つも1バイト文字セットに属するかのように1度に扱うことができます。これらのコードのどれを使うかを指定するには、M-x set-language-environmentを呼び出して、‘Latin-n’のような適切な言語環境を指定します。Disabling Multibyte Characters in GNU Emacs Lisp Reference Manualを参照してください。

端末や使っているフォントがこれらの文字をサポートしている場合、Emacsは160から255の文字を読み取り可能な文字として表示できます。これは自動的に行われます。グラフィカルなディスプレイでは、Emacsはフォントセットを通じて1バイト文字として表示できます。これは現在の言語環境で、それらに対応するマルチバイト文字を表示することにより行われます。これを行うには、変数unibyte-display-via-language-environmentに非nil値を設定します。このセッティングは、これらのバイトを表示する方法だけに影響しますが、Emacsがそれらを文字としてではなくrawバイトとして扱うという基礎事実は変わらないことに注意して下さい。

端末でLatin-1文字セットを表示できない場合、Emacsはこれらの文字をその文字が少なくとも何であるかを明確に理解できるような、ASCIIシーケンスとして表示できます。これを行うには、ライブラリーiso-asciiをロードします。他のLatin-n文字セットに対しても似たようなライブラリを実装できますが、これはまだ行われていません。

通常、非ISO 8859文字セット(10進文字の128から159のコードも含む)は、8進でエスケープ表示されます。ライブラリーdisp-tableの関数standard-display-8bitを使うことにより、非標準の拡張バージョンのISO 8859文字セットに変更できます。

1バイトの非ASCII文字を入力する2つの方法があります:

選択した言語環境のインプットメソッドを使用することができます。インプットメソッドを参照してください。unibyteバッファーでインプットメソッドを使用した場合、入力した非ASCII文字は、ユニバイトに変換されます。
キーボードが、非ASCII文字を表現する(10進の)128以上の文字コードを生成できるならば、それらの文字コードを直接タイプすることができます。
グラフィカルなディスプレイでは、これらのキーを使うのに特別なことをする必要はありません。それらは単純に機能するでしょう。テキスト端末では、コマンドM-x set-keyboard-coding-systemを使うか、変数keyboard-coding-systemをカスタマイズして、キーボードが使用するコーディングシステムを指定します(端末入出力にたいするコーディングシステムを参照してください)。この機能を有効にすることにより、おそらくMeta文字を入力するためにESCを使う必要が生じるでしょう。しかし、コンソール端末、またはxtermのような端末エミュレータでは、MetaをESCにアレンジすることが可能です。また8ビット文字を直接キーボードから入力したり、ComposeキーやAltGrキーを使うこともできます。ユーザー入力の種類を参照してください。

モダンなシステムの多くが独自にキーボードのキーを割り当てられていない文字をもつ多くの言語にたいして、ネイティブインプットメソッド: native input methodsを提供しています。これらのネイティブインプットメソッドのサポート付きでEmacsがビルドされていれば、そのようなインプットメソッドをアクティブにして、それらがサポートしている文字をタイプできます。これらのインプットメソッドをどのようにアクティブにして使用するかはシステムとそのインプットメソッドに依存する問題であり、ここでは説明しません。あなたのシステムのドキュメントを参照してください。ここではネイティブインプットメソッドの使用を制御するための、Emacsの機能について説明します。

GTKツールキットとともにビルドされたEmacsではかな、EmacsがGTKインプットメソッドが生成した文字を受け取るかどうかを変数x-gtk-use-native-inputが制御します。Emacsはこの変数がnil(デフォルト)ならXインプットメソッド、それ以外ならGTKインプットメソッドを使用します。XリソースuseXIMはXIMを使うかどうか、XリソースinputStyleはネイティブインプットメソッドが生成したテキストプレビューの表示を制御します。EmacsにたいするXリソースの表を参照してください。

MS-WindowsのEmacsではIMM(Input Method Manager)が提供するネイティブインプットメソッドがサポートされていますが、必要であればオフに切り替えることができます。MS-Windowsでのキーボードの使用方法を参照してください。
非ASCIIのLatin-1、および他のプリント文字の合成文字(compose-character)プレフィックスとしてC-x 8を使用できます。C-x 8は、(ミニバッファーや他のバッファーでの)挿入、検索、キーシーケンスが許される他のコンテキストなどで使用できます。
ライブラリーiso-translをロードすることによりC-x 8は機能します。1度ライブラリーをロードすると、Alt修飾キーがある場合は、C-x 8と同じ目的で使用できます。後続の文字を修飾するには、アクセント文字と一緒にAltを使用します。さらにLatin-1の専用アクセント文字キー(dead accent characters)があると、1度iso-translをロードした後は、それらのキーも後続の文字を合成するように定義されます。

C-x 8 C-hを使用すると、利用可能なすべてのC-x 8翻訳をリストします。

M-x iso-transl-set-languageコマンドを使えば言語特有な文字により利用可能な翻訳セットを拡張できます。カレントでサポートされているのは‘French’、‘German’、‘Portuguese’、‘Spanish’、‘Esperanto’です。詳細についてはiso-transl-language-alistを参照してください。