CHARMAP(5) | Linux User Manual | CHARMAP(5) |
名前¶
charmap - 文字符号化を定義するための文字シンボル
書式¶
文字集合記述 (charmap) は使用できる文字集合とその符号化を定義する。 サポートされる全ての文字集合は妥当なサブセットとして 共通文字集合 (portable character set) を持たなければならない。
文法¶
charmap ファイルは以下のキーワードからなるヘッダーで始まる:
- <codeset>
- はコードセットの名前を指定する。
- <mb_cur_max>
- は複数バイト文字の一文字あたりの最大バイト数を指定する。 複数バイト文字は現在のところサポートされていない。デフォルトは 1 である。
- <mb_cur_min>
- は一文字あたりの最低バイト数を指定する。この値は mb_cur_max 以下でなければならない。 もし指定されなければデフォルトは mb_cur_max と同じである。
- <escape_char>
- ファイルの残りの部分でエスケープ・キャラクターとして使用する文字 を指定する。これで特殊な意味に解釈される文字をエスケープする。 デフォルトはバックスラッシュ (\) である。
- <comment_char>
- はファイルの残りの部分でコメント・キャラクターとして使用する文字 を指定する。デフォルトではシャープ (#) である。
charmap の定義そのものは第一カラムにキーワード CHARMAP を置くことで始める。
以下の行は文字の符号化を定義するための二つの方法である:
- <symbolic-name> <encoding> <comments>
- これは一つの文字とその符号化を定義する。
- <symbolic-name>...<symbolic-name> <encoding> <comments>
- この形式は複数の文字を定義する。これは複数バイト文字 (現在は実装されていない) のみで有用である。
charmap の定義の最後の行は END CHARMAP を置く。
シンボル名¶
文字の シンボル名 (symbolic name) は 共通文字集合(portable character set) の文字のみを含んでいる。 この名前はかぎかっこ < > で挟む。 <escape_char> に続く文字はそれ自身として解釈される。例えば <\\\>> のような文字列は \> というシンボル名をかぎかっこで狭んで表現している。
文字符号化¶
符号化は以下の三つの形式のどれかで表す:
- <escape_char>d<数字>
- は 10 進の数値を表す。
- <escape_char>x<数字>
- は 16 進の数値を表す。
- <escape_char><数字>
- は 8 進の数値を表す。
ファイル¶
/usr/share/i18n/charmaps/*
準拠¶
POSIX.2.
関連項目¶
locale(1), localedef(1), localeconv(3), setlocale(3), locale(5)
1994-11-28 |