日本-日本語 |
|
|
|
OpenVMS マニュアル |
|
日本語 HP OpenVMS
|
目次 | 索引 |
第 4 章
この章では,日本語 OpenVMS で使用される文字について説明します。
日本語 OpenVMS で使用される文字4.1 文字集合とコードセット
ここでは,文字集合とコードセットの用語について説明します。
4.1.1 文字集合(文字セット)
文字集合とは,一般的に,ある目的を満たす異なる文字の集合をいいます。日本語 OpenVMS では,標準で定められた以下の文字集合を使用します。
文字集合名称 | 規定する標準 |
---|---|
ASCII 文字集合 | ISO 646 |
JIS ローマ字文字集合 | JIS X0201 |
JIS カタカナ文字集合 | JIS X0201 |
JIS 漢字文字集合 | JIS X0208 - 1983,
JIS X0213 - 2000 (I64/Alpha のみ) |
DEC 拡張漢字文字集合 | なし |
コードセットとは,文字集合の文字を一定の手順によって符号化し,各文字に対応する数値を割り振ったものです。符号化の規約はそれぞれのコードセットによって違うため,同一の文字が,異なるコードセットでは異なる数値に割り振られることがあります。また,コードセットによって表現できる文字集合が違います。日本語 OpenVMS では, DEC 漢字コードセットおよび Super DEC 漢字コードセットを使うことができます。
DEC漢字コードセット,SuperDEC漢字コードセットで使用する日本語文字(JIS漢字)のコードは,日本語EUCの漢字コードです。一般の漢字コード表で日本語EUCのコードを参照してください。ドキュメントによっては EUCやGR(8-bit JIS) と表記している場合もあります。
JIS規格票にもコード,部首索引,音訓索引は載っています。 JIS規格票は,日本工業標準調査会(JISC)のサイト (http://www.jisc.go.jp/) のJIS検索 (JIS規格番号:X0208) で PDFファイルを閲覧することができます。日本規格協会のサイト (http://www.jsa.or.jp/) では購入することができます。また『JIS漢字字典 (増補改訂版)』(芝野耕司編著,日本規格協会発行,2002)は規格票のデータなどを漢字コード表としたのもので,規格票本文も含まれています。
日本語 OpenVMS では,標準で規定された文字集合を再規定し,次のような文字の種類を使うことができます。
図 4-1 漢字文字集合の構成および関連
4.1.3 漢字コード表
4.2 日本語 OpenVMS で使う文字の種類
4.3 日本語 OpenVMS で使うコードセット
日本語 OpenVMS では, 第 4.1.1 項 で述べた文字集合にコード付けして,DEC 漢字コードセットと Super DEC 漢字コードセットを定義しています。
4.3.1 DEC 漢字コードセット
DEC 漢字コードセットは ASCII( または JIS ローマ字 ) と JIS X0208-1983 を組み合わせたコードセットです。このコードセットでは漢字と ASCII ( または JIS ローマ字 ) を,第 1 バイトの最上位ビット (8 ビット目 ) で識別することができます。
文字集合 | ビット表現 | 16 進表現 |
---|---|---|
ASCII/JIS X0201 LH | (0xxxxxxx) | 20 - 7F |
JIS X0208 | (1xxxxxxx 1xxxxxxx) | A1A1 - FEFE |
DEC 拡張漢字 | (1xxxxxxx 0xxxxxxx) | A121 - FE7E |
C0 Control | (000xxxxx) | 00 - 1F |
C1 Control | (100xxxxx) | 80 - 9F |
ユーザ定義領域として DEC 拡張漢字領域の 1 〜 31 区 (2914 文字位置 ) を使用します。32 区〜 94 区は DEC 確保領域となっています。
図 4-2 は,DEC 漢字コードセットの漢字コードが, 2 バイト・コード空間でどのように定義されているかを示しています。
図 4-2 DEC漢字コードセットの漢字の割り当て
4.3.2 Super DEC 漢字コードセット |
Super DEC 漢字コードセットは, DEC 漢字コードセットを SS2 ( 16 進数で 8E ) と SS3 ( 16 進数で 8F ) を用いて拡張し,JIS カタカナと JIS 補助漢字を扱えるようにしたものです。 DEC 漢字コードセットとは異なり Super DEC 漢字コードセットは,スクリーン上での見かけの長さと実際に記憶領域に占める文字列の長さが違うので,プログラミング等の際には,十分な長さの領域を用意するように注意する必要があります。
文字集合 | ビット表現 | 16 進表現 |
---|---|---|
ASCII/JIS X0201 LH | (0xxxxxxx) | 20 - 7F |
JIS X0208 | (1xxxxxxx 1xxxxxxx) | A1A1 - FEFE |
DEC 拡張漢字 | (1xxxxxxx 0xxxxxxx) | A121 - FE7E |
JIS X0201 RH | (SS2 1xxxxxxx) | 8EA1 - 8EDF |
JIS X0212 (未サポート) | (SS3 1xxxxxxx 1xxxxxxx) | 8FA1A1 - 8FFEFE |
C0 Control | (000xxxxx) | 00 - 1F |
C1 Control | (100xxxxx) | 80 - 9F |
ユーザ定義領域として DEC 拡張漢字領域の 1 〜 31 区 (2914 文字位置 ) を使用します。32 区〜 94 区は DEC 確保領域となっています。
図 4-3 は,SuperDEC 漢字コードセットの漢字コードが,どのように定義されているかを示しています。
注意 Super DEC 漢字コードセットの JIS 補助漢字領域 は,現在サポートされていません。 |
図 4-3 Super DEC 漢字コードセットの漢字コードの割り当て
4.3.3 DEC 漢字 2000 コードセット(I64/Alpha のみ) |
DEC 漢字 2000 コードセットは, DEC 漢字コードセットを SS2(16 進数で 8E) と SS3(16 進数で 8F) を用いて拡張し, JIS カタカナと JIS X 0213 を扱えるようにしたものです。 DEC 漢字コードセットとは異なり DEC 漢字 2000 コードセットは,スクリーン上での見かけの長さと実際に記憶領域に占める文字列の長さが違うので,プログラミング等の際には,十分な長さの領域を用意するように注意する必要があります。
文字集合 | ビット表現 | 16 進表現 |
---|---|---|
ASCII/JIS X0201 LH | (0xxxxxxx) | 20 - 7F |
JIS 第 1 〜第 3 水準 | (1xxxxxxx 1xxxxxxx) | A1A1 - FEFE |
DEC 拡張漢字 | (1xxxxxxx 0xxxxxxx) | A121 - FE7E |
JIS X0201 RH | (SS2 1xxxxxxx) | 8EA1 - 8EDF |
JIS 第 4 水準 (未サポート) | (SS3 1xxxxxxx 1xxxxxxx) | 8FA1A1 - 8FFEFE |
C0 Control | (000xxxxx) | 00 - 1F |
C1 Control | (100xxxxx) | 80 - 9F |
ユーザ定義領域として HP 拡張漢字領域の 1 〜 31 区 ( 2914 文字位置 ) を使用します。32 区〜 94 区は HP 確保領域となっています。
図 4-3 は,DEC 漢字 2000 コードセットの漢字コードが,どのように定義されているかを示しています。
注意 DEC 漢字 2000 コードセットの JIS 第 4 水準 領域はサポートされていません。 |
図 4-4 DEC 漢字 2000 コードセットの漢字コードの割り当て
目次 | 索引 |
|