このドキュメントでは,日本語入力システム「Wnn」によるかな漢字変換について,概要を説明します。
1.1 Wnn によるかな漢字変換
Tru64 UNIXでは従来の端末ドライバによるかな漢字変換機能に加えて,
日本語入力システム「Wnn」によるかな漢字変換機能を提供しています。
「Wnn」は,自立語・付属語辞書,辞書ユーティリティ,かな漢字変換ルーチン,ローマ字かな変換ルーチン,フロントエンドプロセッサ(uum),かな漢字変換サーバ(jserver),初期設定ファイル,によって構成され,入力された文字列をかな漢字変換し画面に
出力します。
1.2 Wnn の仕組み
「Wnn」が行うかな漢字変換のうち,この章で説明する「uum」と「jserver」を用いた漢字変換の作業の概略は以下のとおりです。
ユーザーによる uum の起動。
起動時に初期設定ファイルにもとずいて uum の環境設定が行われます。
ユーザーによる uum へのローマ字入力。
入力されたローマ字文字列をローマ字かな変換ルーチンにより,かな文字列に変換。
かな漢字変換ルーチンにより,変換されたかな文字列を uum から,かな漢字変換サーバ(jserver)へ送信,変換要求。
変換要求を受けたかな漢字変換サーバによる,自立語・付属語辞書の参照,かな漢字変換,学習(頻度ファイルの変更)。
かな漢字変換ルーチンにより,変換結果を かな漢字変換サーバ から uum へ送信。
uum により,変換結果を画面に表示。
次に,実際にかな漢字変換を行う方法を説明します。
注意
以下の解説は,コマンド・サーチ・パスの中に
/usr/i18n/bin/Wnn4
が含まれているものとして記述しています。 もしこの設定をしないで uum を起動する場合は,コマンド行に絶対パス名/usr/i18n/bin/Wnn4/uum
を入力してください 。
Wnn を使ってかな漢字変換をするためには,コマンドラインから次のように入力し uum を起動します。
%
uum
しばらくすると画面は
図 1-1
のようになります (初めて起動する場合には,頻度ファイルおよび辞書
を作成するかどうかを聞いてきますので
Y
[Return]
と入力します)。
図 1-1: uum の起動
この状態で,日本語の入力が可能になります。
注意
uum を起動した際,画面の一番下の行,つまり
[---]
の表示されている行を「変換行」とよび,左端に現れる文字列,つまり[---]
の表示のことを「ローマ字かな変換のモード」とよびます。
uum を終了する際には,変換行になにも入っていない状態で,コマンド行で [Ctrl/d] または exit を入力します。 画面にというメッセージが表示され,uum が終了します。
%
uumを終わります。
uum を起動し,日本語を入力するためにはまず
[Ctrl/ \]
を入力し,モードをローマ字かな入力モードにします。
[Ctrl/ \]
を入力するとモード表示が
[あr]
に変わります。
%
[あr]
ここでたとえば,kyouhaisogashii などとしてください。 変換行では,入力された文字がかな変換され次のように表示されます。
%
[あr]
きょうはいそがしい
この文字列を本文 (この場合はプロンプト行) に送るには, [Ctrl/l] を入力し変換を確定します。 確定すると,変換行の文字列がプロンプト行へ送られ,変換行の文字列が消えます。
% きょうはいそがしい
入力したかな文字列をかな漢字交じりの文字列に変換するには, [Ctrl/w] を使用します。 かな変換された
%
[あr]
きょうはいそがしい
に対して, [Ctrl/w] を入力してください。以下のような文字列が,変換行に表示されます。
%
[あr]
今日は忙しい
もしこの変換が,意図するものであるならば,変換を確定 ([Ctrl/l] を入力) します。 確定された文字列はプロンプト行に送られ,次のように表示されます。
% 今日は忙しい
1.4.3 かな変換の変更
1.4.3.1 漢字変換前の変更
変換行に表示されている,かな変換後の文字列の変更をしたい(たとえば「きょう はいそがしい」ではなく「きょうはとくにいそがしい」としたい)場合には, [Ctrl/b] [Ctrl/f] [Delete] などを使い,文字列の編集を行います。
次のように表示されている状態で, [Ctrl/b] を入力してください。
[あr]きょうはいそがしい
ここで [Ctrl/b] を1回入力するとカーソルが1つ左へ移動します。 [Ctrl/f] を入力すると同様にカーソルが1つ右へ移動します。
[Ctrl/b] および [Ctrl/f] を使ってカーソルを「い」のうえに移動させ,その後で「tokuni」と入力すると,結果は次のようになります。
[あr]きょうはとくにいそがしい
さらに漢字変換を行うには,[Ctrl/w] を入力します。
[あr]今日は特に忙しい
漢字変換を実行した後で,文字列の変更をする(たとえば「今日は忙しい」でなく「今日も忙しい」にしたい)場合には,先程のコマンドの他に,[Ctrl/k] を使い,文字列の編集を行います。
次のように表示されている状態で,[Ctrl/k] を入力してください。
[あr]今日は忙しい
[Ctrl/k] を入力すると,かなのみの文字列に戻ります (反転部分が文字列の先頭に来ていない時には,最初に [Ctrl/a] を入力し,反転部分を文字列の先頭に移動させてから [Ctrl/k] を入力してください)。
[あr]きょうのしごとはいそがしい
ここで,[Ctrl/f] を4回入力し「い」のうえにカーソルを合わせ,[Delete] を1回入力します。 結果は次のようになります。
[あr]きょういそがしい
次に「mo」と入力してください。
[あr]きょうもいそがしい
この状態で,[Ctrl/w] を入力するとかな漢字変換され, 次のようになります。
[あr]今日も忙しい
注意
1.10 節 に,uum を使用する際の「コマンド一覧表」があります。コマンド入力が確かでないときなどに参照してください。
かな漢字変換の結果を修正する時は,漢字変換候補の選択,文節の縮小,拡大,移動を使います。
1.4.4.1 漢字変換候補の選択
かな漢字変換をするとき,[Ctrl/w] を入力しても,意図する漢字に変換されないことがあります。 同音異義語が数多く存在するような単語の場合には,漢字変換候補の中から意図する漢字を選択し,漢字変換を行います。 たとえば「感性」を得るために,次の様に入力します。
[あr]
かんせい
ここで,[Ctrl/w] を入力すると,次のように漢字変換されます。
[あr]完成
このように,一度 [Ctrl/w] を入力しただけでは意図する漢字が得られない時には,もう一度,[Ctrl/w] を入力してください。入力結果は次のようになり,漢字変換候補の一覧が表示されます。
この漢字候補の一覧から意図する候補を選択する方法には以下の2種類があります。
ひとつ先の(番号のひとつ大きい)候補を反転表示させる [Ctrl/f] と,ひとつ前の(番号のひとつ若い)候補を反転表示させる [Ctrl/b] を使い反転部分を目的の候補にあわせ,[Return] を入力する。
候補の一覧が表示されたの直後に目的の候補の番号を入力する。
上記の例の場合は,反転表示を「感性」にあわせて [Return] を入力するか,「2」を入力します。 実行結果は次のようになります。
[あr]感性
漢字変換候補一覧が表示された際,画面の右端に表示された「8/192」は,「かんせい」の漢字変換候補が 192 個あるという意味です。 [Ctrl/f] を何度か入力することにより,9個目以降の変換候補が表示され,[Ctrl/n] を1度入力することにより次の画面が表示されます。
なお,候補の一覧が表示されている状態で
[Ctrl/g]
を入力すると変換候補の一覧表示を中断し2度目の
[Ctrl/w]
を入力する前の状態に戻ります。
1.4.4.2 前候補,次候補の選択
漢字変換の際,前節で説明した方法の他に,[Ctrl/n][Ctrl/p] を使う方法があります。 先程と同様に,次のように変換した状態で,[Ctrl/n] を入力してください,
[あr]感性
uum は辞書に登録されている次候補 (番号のひとつ大きい候補) を表示します。
[あr]喚声
同様に,[Ctrl/p] を入力すると,uum は辞書に登録されている,前候補 (番号のひとつ若い候補) を表示します。
注意
uum では,辞書に登録されている最後の漢字変換候補の後ろに,カタカナとひらがなの候補が登録されているので,0番の候補のところで,[Ctrl/p] を入力するとひらがなの候補が,そこでもう一度 [Ctrl/p] を入力すると カタカナの候補が表示されます。
uum によるかな漢字変換では,入力した文字列が解析され自動的にいくつかの文節に区切られますが,このとき,自分が望んでいる文節に区切られないことがあります。
現在,漢字変換の対象になっている文節の区切り方を変更する場合には,「注目している文節」の縮小および拡大機能を使用します。 また,漢字変換の対象となる文節を変えるには,「注目している文節」の移動機能を使用します。
「今日花が咲き」を得るために,「きょうはながさき」とし [Ctrl/w] を入力,漢字変換してください。
反転している部分,つまり「今日は」の部分を「注目している文節」といいます。
ここで [Ctrl/f] を入力してください。 「注目している文節」は 「長崎」に移ります。同様に, [Ctrl/b] を入力してください。 「注目している文節」は 「今日は」に戻ります。 このように, [Ctrl/f] [Ctrl/b] で「注目している文節」の移動を行います。
[Ctrl/f] および [Ctrl/b] を使い,「今日は」に反転部分をあわせ,[Ctrl/i] を入力してください。 「注目している文節」は縮小され「きょう」が反転表示されます。
次に何度か [Ctrl/o] を入力してください。 [Ctrl/o] は「注目している文節」を拡大します。
[Ctrl/i] [Ctrl/o] を使い分け「注目している文節」を 「きょう」にあわせて [Ctrl/w] を入力してください。
「注目している文節」を縮小したことによって,現在,漢字変換の対象になっていない文節の区切りも変更されます。 次に,[Ctrl/f] で「注目している文節」を「さき」にあわせ, [Ctrl/n] 又は, [Ctrl/w] で「咲き」を選択すると,次のように表示され,変換が完了します。
英文字を入力するには「q」を入力して モードを [ q ](クォート)にします。 たとえば,「かな漢字変換は uum で」という文を得たいとします。 まず,次のような状態にします。
[あr]
かなかんじへんかんは
ここで「q」を入力すると次のような状態になります。
[ q ]かなかんじへんかんは
この状態で「uum」と入力します。
[ q ]かなかんじへんかんはuum
実行結果は上記のようになり,英文字「uum」はかな変換されません。 もとのモードにもどるには,[Ctrl/g] を使います。 モード表示が [ q ] となっている状態で [Ctrl/g] を入力すると,モード [あr] に戻ります。 ここで「で」を入力して,[Ctrl/w] を入力すると,次のように表示されます。
[あr]かな漢字変換はuumで
また,「注目している文節」を「uumで」にあわせて [Ctrl/n] を入力してください。 「uum」が全角変換されて次のようになります。
[あr]かな漢字変換はuumで
注意
英文字の変換は,直前で使った文字種(全角か半角か)が優先的に選択されます。
uumを使っている際に,コマンドを入力したい時などには, [Ctrl/ \] を使い uum を一時停止させることが できます。 たとえば
%
[あr]かな漢字変換は
という状態で,cal コマンドを実行したいとします。この場合はまず
[Ctrl/ \]
を入力し
,uum を一時停止させます。
この時キーボードからの入力は変換されずにプロンプトの後ろに直接表示され
[Return]
の入力でコマンドとして実行されます。
ここでは,cal
[Return]
と入力してください。画面は
図 1-2
のように通常の
cal
コマンドが実行されます。
図 1-2: uum 一時停止
また,ここでもう一度 [Ctrl/ \] を入力すると,
%
[あr]かな漢字変換は
となり,以前と同じ状態から編集をすることができます。
1.4.7 カタカナ変換
カタカナ変換には,
[Ctrl/w]
でマッチする変換を捜す方法の他にも,[アr]
モードを使用する方法と
[Ctrl/z]
を使用する方法があります。
%
[あr]
の状態で,左矢印キーを押してください。
モード表示は
[アr]
となり,カタカナが直接変換行に変換されます。
また,「カタカナは」のように,「カタカナ + 付属語」の変換をしたいときに,
[あr]かたかなは
とし, [Ctrl/z] を入力すると uum は単文節変換を行い,
[あr]カタカナは
と一度で変換します。
1.5 コード入力
1.5.1 コード入力
uum では,JISコード(DEC 漢字コード)のコード入力が可能です。 変換行に未変換の文字列が入力されている状態
[あr]お
などで,[Ctrl/_ ] を入力してください。 画面は次のようになります。
ここで反転している部分に,コードを入力してください (コードについては,『漢字コード表』を参照してください。 なお,Tru64 UNIXでは,JISコード,DEC漢字コードの両方をコードとして入力できます)。
ここで [Return] を入力すると,画面は次のようになります。
区点入力をするには,「JISコード:」の表示の後に,「212」(DEC漢字コードでは「A1A」)と入力し [Return] を入力してください。 画面は,次のようになります。
区点の選択方法は,漢字の前・次候補の選択と同様です。
1.5.2 区点入力
区点のみを入力する目的の時には,変換行で未変換の文字列が入力されている状態で, [Ctrl/]] を入力すると便利です。 入力後画面は,
となりますので,JISコード(DEC漢字コード)入力の場合と同様に,区点コードを入力してください。
[Return] の入力で,
となります。
区点コードの詳細については,『漢字コード表』を参照してください。
注意
コード入力,区点入力を中断する際には, [Ctrl/g] を入力してください。
man
(1)
コマンドによって,リファレンス・ページを端末で参照したり,参照中のテキストの中から指定した文字列を検索することができます。
しかし,
man
(1)
コマンド自身は日本語機能を備えていません。
そこで,検索する文字列に日本語を指定する場合に,uum を使うと便利です。
まず,man を起動する前に,uum を起動し,引き続いてman を起動します。
%
uum
%
man ls
画面は,
図 1-3
のようになります。
図 1-3: man コマンド実行
ここで 検索のコマンド
/
を入力し,コマンドラインでのかな漢字変換と同様に
[Ctrl/ \]
を入力します。
画面は
図 1-4
のようになります。
図 1-4: Wnn による man page の日本語検索 1
ここで次のように入力し,続いて変換行の文字列を [Ctrl/l] で確定してください。
[あr]環境変数
画面は
図 1-5
のようになります。
図 1-5: Wnn による man page の日本語検索 2
ここで
[Return]
を入力すると,図 1-6
のように文字「環境変数」が検索されます。
図 1-6: Wnn による man page の日本語検索 3
uum を使い vi エディタ内でかな漢字変換を行うことができます。 ここでは henkan というファイルを作成します。
%
uum
%
vi henkan
図 1-7: Wnn による vi エディタでの日本語入力 1
まず,テキストを入力するための i コマンドを入力し,
続いて
[Ctrl/ \]
を入力します。画面は
図 1-8
のようになります。
図 1-8: Wnn による vi エディタでの日本語入力 2
ここで日本語を入力してください。たとえば
[あr]かな漢字
とします。ここで確定
[Ctrl/l]
すると画面は
図 1-9
のようになります。
図 1-9: Wnn による vi エディタでの日本語入力 3
続けて
[あr]変換は
と入力し,同様に操作すると
図 1-10
のようになります。
図 1-10: Wnn による vi エディタでの日本語入力 4
ここで,
[Ctrl/\]
を入力するとモード表示が
[---]
になり,図 1-11
のように英文字の入力が可能になります。
図 1-11: Wnn による vi エディタでの日本語入力 5
また,vi エディタのコマンドを入力する際にも,変換モードを
[---]
の状態にして,行います。エスケープキー
[Ctrl/[]
を入力した後,:q!
などのコマンドを入力してください。
1.8 単語の登録
Wnn ではかな漢字変換を行う際に「辞書」を参照しています。この「辞書」に登録されていない単語を変換すると,求めている結果が得られない場合があります。
たとえば,「えいりあすのせってい」という文字列を変換すると,
[あr]営利明日の設定
となってしまいます。 このような場合,単語を辞書に登録しておけば次から 「エイリアス」という変換が可能になります。
では,以下に「エイリアス」という単語の登録する例を示します。
まず,上の文を正しく変換してください。
[あr]エイリアスの設定
ここで, [Ctrl/t] を入力すると変換行は,
となります。次に「エ」の上にカーソルをあわせ,スペースキーを押します。 画面は
となります。必要な場合,カーソルを移動させ単語の長さを指定してください。 登録したい部分が反転したら,再度スペースキーを押します。画面は
となり,読みの設定を行います。
変更の必要がない場合は,
[Return]
キーを押します。(必要な場合は読みを入力してください)
更に該当する品詞のを選択し
[Return]
キーを入力すると,単語登録は終わります。
以上の作業が完了すると,次からその単語が使用できます。
1.9 jdic2wnndic による辞書の変換
Tru64 UNIXでは
jdic2wnndic
コマンドによる辞書の変換機能が提供されています。
jdic2wnndic
コマンドには2つの機能があります。
1つは
jvi
エディタなどの「かな漢字変換」で使用されているバイナリ形式で記述された「個人辞書」を Wnn 用の UJIS 形式(テキストファイル)に変換し内容をユーザに示す機能,もう1つは,実行する際に
atod
コマンドを呼び出し UJIS 形式で書かれた辞書を Wnn 用のバイナリ辞書形式に変換し,指定されたファイルに出力する機能です。
このコマンドにより システム・レベルかな漢字変換などで使用していた「個人辞書」の内容を確認した上で,Wnn の「個人辞書」にその内容を移行させることができます。
使用方法は以下の通りです。
jdic2wnndic [atodへのオプション] jsyの辞書 Wnnの辞書
オプションなどの詳細については,
jdic2wnndic
(1)
リファレンス・ページを参照してください。
1.10 Wnn コマンド一覧表
[Ctrl/\] : かな漢字変換オン・オフ
[あr] : ローマ字入力
[ q ] : クォート
[Aあ] : かな直接入力
[あ ] : 全角入力
[ア ] : カタカナ入力
[アr] : カタカナローマ字入力
右矢印キー : [あr] ← → [Aあ]
左矢印キー : [あr] ← → [アr]
下矢印キー : 辞書ユーティリティー
q : [あr] → [ q ]
[Ctrl/g] : [あr] ← [ q ]
[Ctrl/w] : かな漢字変換
[Ctrl/l] : 確定(変換行にある文字列を上の画面に送る)
[Ctrl/d] : 終了(uum 終了。ただし,変換行に何も文字が入っていないとき)
[Ctrl/c] : 漢字かな変換
[Ctrl/p] : uum の history (previous)
[Ctrl/n] : uum の history (next)
漢字変換前の変換行の編集
[Ctrl/b] : 文字カーソルを1文字前へ
[Ctrl/f] : 文字カーソルを1文字先へ
[Ctrl/d] : カーソルの指している文字を消去する
[Delete] : カーソルの指している文字の前の文字を消去する
[Ctrl/a] : カーソルを変換行の先頭に移動させる
[Ctrl/e] : カーソルを変換行の最後に移動させる
[Ctrl/k] : カーソルより右の部分を全て消去する
[Ctrl/y] : [Ctrl/k] によって消去された文字列をカーソルの位置に挿入する
[Ctrl/u] : 前に入力した文字列を変換行に呼び出す
[Ctrl/v] : リテラルネクスト文字
[Ctrl/^] : 辞書操作の一覧を表示する
[Ctrl/c] : 変換された結果をバッファに入れて入力モードに戻す
[Ctrl/_ ] : JIS コード入力
[Ctrl/]] : 区点入力
漢字変換後の変換行の編集
[Ctrl/b] : 前の文節へ移動
[Ctrl/f] : 次の文節へ移動
[Ctrl/n] : 注目している文節の次候補を表示
[Ctrl/p] : 注目している文節の前候補を表示
[Ctrl/z] : 単文節変換
[Ctrl/o] : 注目している文節を拡大する。
[Ctrl/i] : 注目している文節を縮小する。
[Ctrl/k] : 変換をキャンセルし,変換前の状態に戻す
[Ctrl/v] : インスペクトモードに入る
[Ctrl/t] : 単語登録モードへ入る
[Ctrl/w] : 注目している文節の候補を全て表示
[Ctrl/f] : 注目している候補を次に移動
[Ctrl/b] : 注目している候補を前に移動
[Ctrl/n] : 次の候補行を表示
[Ctrl/p] : 前の候補行を表示
[Ctrl/g] : 一覧表示を中止
参考文献
この章の記述は,岩波書店 『 Wnn + GMW 入門 Wnn 解説編 』( KABA著 ) を参照しています。 Wnn についてのより深い知識をお求めの方は上記の解説書を講読されることをおすすめします。