特に重要なコントロール文字にたいする特別なエスケープシーケンスに加えて、Emacsは非ASCIIテキスト文字の指定に使用できる、何種類かのエスケープ構文を提供します。
?\N{NAME}
はNAMEという名前のUnicode文字を表す。したがって‘?\N{LATIN
SMALL LETTER A WITH
GRAVE}’は?à
と等価でありUnicode文字のU+00E0を意味する。名前中のスペースを空白文字(改行)の非空のシーケンスにして複数行文字列の入力を簡略化できる。
?\N{U+X}
はUnicodeコードポイントX
(16進数値)を表す。また?\uxxxx
と?\Uxxxxxxxx
はそれぞれコードポイントxxxxとxxxxxxxxを表すxは(1つの16進数字)。たとえば?\N{U+E0}
、?\u00e0
、?\U000000E0
は?à
と‘?\N{LATIN
SMALL LETTER A WITH
GRAVE}’に等しい。Unicode標準は‘U+10ffff’以下のコードポイントだけを定義するので、これより大きいコードポイントではEmacsはエラーをシグナルする。
?\xe0
は文字à
(グレイブアクセントつきのa)になる。‘x’の後に1つ以上の16進数を使用できるので、この方法で任意の文字を表すことができる。
?\002
は文字C-bを表す。この方法で指定できるのは8進コード777までの文字のみ。
これらのエスケープシーケンスは文字列内でも使用されます。文字列内の非ASCII文字を参照してください。