JPH0498449A

JPH0498449A - 単漢字変換装置

Info

Publication number: JPH0498449A
Application number: JP2213304A
Authority: JP
Inventors: Tsuneaki Kato; 加藤　恒昭; Yoshiji Oyama; 芳史大山; Muneyuki Horii; 統之堀井
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: NTT Inc
Priority date: 1990-08-10
Filing date: 1990-08-10
Publication date: 1992-03-31
Anticipated expiration: 2010-05-24
Also published as: JPH0748212B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野Ｊこの発明は、入力装置から入力される平仮名（ローマ字
）文字列を、カナ漢字変換して出力する文書作成装置！
！（ワードプロセッサ等）や、上記入力された平板名文
字列をカナ漢字変換して処理装置に送る日本語フロント
エンド等に用いられ、入力文字列を単漢字に変換する単
漢字変換装置に関する。

「従来の技術」カナ漢字変換装置において、姓名・地名等の固有名詞を
入力する場合、単語辞書にその固を名詞が登録されてい
ないことが多く、この場合、利用者は漢字を一文字ずつ
カナ漢字変換して入力することが必要となる０例えば、
ｒ恒昭（つねあき）コと入力したい場合、「つねあきＪ
をカナ漢字変換しても所望の変換結果は得られないこと
が多く、「恒Ｊ、「昭」を一文字ずつ変換する必要があ
る。

固有名詞の数は膨大で、その全てを辞書に登録しておく
ことは不可能であるため、このような単漢字の変換は必
ず生じる事態である。従来のカナ漢字変換装置において
は、この様な単漢字入力の手段として以下のものが主に
提供されている。

コード入カニ入力したい漢字のコード（ＪＩＳコードや
句点コード）を入力して変換する２ストローク法：漠字
毎に特殊なコードを決め、それを入力する読み人カニ入力したい漢字の音読み（Ｆ昭」であれば、
「しよう」）を入力して変換する「発明が解決しようと
する課題」上記コード入力は、入力したい漢字のコードをコードブ
ック等で調べる必要があり、手間のかかる手法である。

上記２ストローク法は、特殊なコードを暗記する必要が
あり、軌線を要する手法である。上記読み入力は、−４
には同音異語（「シょう」については、章、冨、小、竿
、等）が多く、所望の漢字を得るまでに、多数回、次候
補キイを押下するなどの操作が必要であり、使い勝手の
良いものではなかった。つまり、単漢字を変換するため
の簡便な手段が、従来、提供されていなかった。

「課題を解決するための手段Ｊこの発明によれば、漢字の形状を記述した形状辞書と、
部首の読み方を記述した部首辞書と、漢字の読み方と形
状を記述した漢字辞書と、与えられた文字列を文節とみ
なして仮名漢字変換を行う仮名漢字変換部と、その仮名
漢字変化部が利用する仮名漢字変換辞書とを備え、入力文字例解析部で、入力された文字列について、以下
の１〜４のどの指定形式であるかを判定し、その結果に
応して、形状指定処理、熟語指定処理、単語指定処理の
いずれかを呼び出し、入力文字列を渡す。

１　当該漢字を構成する漢字もしくは部首名とそれらの
位置関係による指定２　当該漢字が含まれている熟語の読みと、その熟語に
おける当該漢字の読みによる指定３　当該漢字の訓読を
含む用言終止形による指定４　当該漢字が一文字で単語となる場合にその単語の読
みによる指定形状指定処理部は指定の形式が１の時に呼び出され、与
えられた文字列から部分となる漢字もしくは部首名を表
現している文字列である部分文字列と、下、右などの位
置関係の情報を抽出する。

これらの部分文字列が部首名であるかを部首辞書によっ
て確認する０部首名でない文字列については、それをこ
の単漢字変換装置の入力として処理し、漢字候補の集合
を得る。これらによって得られた部首名もしくは漢字候
補と先の関係情報を用いて上記形状辞書と上記漢字情報
辞書を検索し、入力文字列の漢字候補を得て、出力とす
る。

熟語指定処理部は指定の形式が２の時に呼び出され、与
えられた文字列から、熟語の読みである文字列と、当該
漢字の読みがその熟語の読みのどの部分に相当するかと
いう位置情報を抽出する。

次に、仮名漢字変換部を利用して、熟語の読みを仮名漢
字変換し、漢字熟語文字列を得る。これと先の位置情報
とから、入力文字列の漢字候補を得て、それら漢字候補
のうち、当該漢字の読みとして指定された文字列を読み
として持つものを漢字情報辞書を検索して選び出し、入
力文字列の漢字候補とする。

単語指定処理部は指定の形式が３．４の時に呼び出され
、仮名漢字変換部を利用して与えられた文字列を仮名漢
字変換し、単語を表現する漢字一文字もしくは漢字一文
字を含む用言文節を得る。

それらから、そこに含まれる一文字の漢字のうち、入力
文字列を読みとして持つものを漢字情報辞書を検索して
選び出し、入力７字列の漢字候補として、出力する。

このように構成されているから入力したい単漢字を次の
４種類の何れかで指定できる。

１　形状による指定変換したい漢字を、当該漢字を構成する漢字もしくは部
首名とそれらの位置関係によって指定する例　くさかんむりにほうこうのほう→芳ちからのみぎに
くち　　　　　→加２　熟語による指定変換したい漢字を、当該漢字が含まれている熟語の読み
と、その熟語における当該漢字の読みによって指定する例　れきしのし　　　→史しょうわのしょう→昭３　訓読による指定変換したい漢字を、当該漢字の訓読を含む用言終止形に
よって指定する。

例　おおきい　→大くわえる　→加４　単語による指定当該漢字が一文字で単語となる場合には、変換したい漢
字を、その単語の読みによって指定する例　やま　→山単漢字指定のこれらの方式は、従来の方式に比べて熟練
を必要としない上、コードブック等も不要である。また
、これらの形式で指定された場合、候補となる漢字の数
は単なる読みで指定された場合に比べて極めて少ないた
め、次候補キイ押下等の候補選択の手間も削減すること
ができる。特にこれらの形式は人間が言葉を用いて漢字
を説明するときに用いる説明に類似しており、ユーザは
普段用いている説明と同しような入力をするだけで必要
な漢字を入力することができるため、その知的負荷を軽
減することにつながる。

「実施例」第１図は、この発明の実施例の構成を示す、この装置は
入力文字列解析部１、形状指定処理部２、熟語指定処理
部３、単語指定処理部４、仮名漢字変換部５、部首辞書
６、形状辞書７、漢字情報辞書８、仮名漢字変換辞書９
よりなる。仮名漢字変換部５と仮名漢字変換辞書９はワ
ープロ等に利用されている一般の仮名漢字変換装置で、
与えられた文字列を文節と見做して仮名漢字変換を行な
い、変換結果を返すという機能を持つものである。この
発明においではこの仮名漢字変換部５と仮名漢字変換辞
書９の内部構成は規定しない。

入力される文字列は以下のいずれかの形式を持っている
。

形式１　文字列１＋（（の１区切り記号）＋（下１右１
中１間））＋（に１区切り記号）十文字列２０は省略可能、（））は選択を示す。

ここで、文字列１、文字列２は部首名もしくは以下に示
すこの単漢字変換の入力であり、この入力は、文字列１
、文字列２で、部首名もしくは漢字を指定し、それらの
部分が下、右等の位置関係で組み合わされて構成される
漢字を指定している。

形式２　文字列１＋（の１区切り記号）十文字列ｌの部
分ここで、文字列１は熟語の読みであり、この入力は、文
字列−１で指定された熟語を構成する漢字の内、文字列
１の部分の読みを持つ漢字を指定している。

形式３　上記１，２以外の文字列文字列は、用言終止形−文節、もしくは、漢字一文字か
らなる単語の読みであり、この入力は、そこに現われる
漢字を指定している。

入力された文字列は、入力文字列解析部１によって解析
される。入力文字列解析部１の処理の流れは第２図に示
す通りで、入力文字列が上に示したどの形式であるかを
判定し、必要な処理を呼び出す、入力文字列の形式決定
は、形式１の場合、入力文字列が（（の１区切り記号）
＋（下Ｉ在中１間））＋（に１区切り記号）と言う文字
列を含むかによって、形式２の場合、入力文字列が（の
１区切り記号）を含み、かつ、その後の文字が前の文字
列の部分となっているかによって行なわれる。形式１．
２に合わない文字列は形式３であると判定される。

入力文字列が形式１であると判定されると、形状指定処
理部２が呼び出される。形状指定処理部２の処理の流れ
を第３図に示す、ここでは、まず、入力文字列から文字
列（（の１区切り記号）＋（下１右１中１間））＋１に
１区切り記号）の前後の文字列を取りだし、文字列ｌ、
文字列２とする。また、関係情報として、下、右、中、
間、任意のいずれかを抽出する８文字列１．２が、部首
辞書６に含まれているかを検索することによって、それ
ぞれの文字列が部首名であるかが判定される。

ここで、部首辞書６は第４図に示すように部首の名称を
列挙したものである０部首名でない文字列については、
これを再びこの単漢字変換装置の入力として再帰的な処
理が行なわれる。これらの処理によって得られた部首、
もしくは、漢字をキイとして、形状辞書７を検索する。

形状辞書７は第５図に示すような構成となっており、部
首名もしくは漢字がキイとなっており、その内容として
、そのキイを部分として含む漢字が記述されている。

この形状辞書７を検索し、検索結果に共通した文字をと
ることによって、文字列１が表現する漢字もしくは部首
名と、文字列２が表現する漢字もしくは部首名との両方
を含む漢字が得られる。これらの漢字をキイに漢字情報
辞書８を検索する。漢字情報辞書８は、各漢字について
、その音読み、訓読み、単紐読み、形状が、音項目、訓
項目、単項目、形項目に整理されて記述されている第６
図に示すような辞書である。得られた漢字候補について
、この漢字情報辞書８を検索し、その形項目を得て、関
係情報が指定されたものと一致するかを！！認し、一致
するものを候補として出力する。

入力文字列が形式２であると判定されると、熟語指定処
理部３が呼び出される。ここでは、（の区切り記号）の
前後の文字列をそれぞれ文字列ｌ、及び文字列１０部分
として取りだす、後者の文字列１の部分が前者の文字列
１の先頭部分と一致する部分文字列であるとき、位置情
報を「左」、末尾部分と一致する部分文字列であるとき
、位置情報を「右」、それ以外の部分文字列であるとき
位置情報を「中」とする、この後、文字例１を仮名漢字
変換部５を利用して仮名漢字変換し、文字列１を読みと
する熟語の漢字表記を得る。この熟語がｎ文字の漢字か
らなる熟語であるとする０位置情報が「左」の時、この
熟語の第一文字目を漢字候補とする０位置情報が「右ｊ
の時、この熟語の第ｎ文字目を漢字候補とする０位置情
報が「中」の時、この熟語の第２文字目からｎ−１文字
目までを漢字候補とする。これらの漢字候補のうち、文
字列１の部分で示された読みを持つものを、漢字情報辞
書８の音項目、訓項目を用いて選択し、これを漢字候補
として出力する。

入力文字列が形式３であると判定されると、単結指定処
理部４が呼び出される。ここでは、入力文字列を仮名漢
字変換部５を用いて仮名漢字変換し、得られた結果に含
まれる漢字を漢字候補とする。これらの漢字候補のうち
、入力文字列で示された読みを持つものを、漢字情報辞
書８の訓項目、単項目を用いて選択し、これを漢字候補
として出力する。

次にｒ＜、さかんむりのしたにほうこうのほう」という
文字列が入力された場合を例に装置の動作を具体的に岐
明する。この文字列が形式１を満たすことが入力文字列
解析部１によって判定され、形状指定処理部２が呼び出
される。形状指定処理部２は、この入力を解析し、文字
列１＝「くさかんむり」、文字例２＝「はうこうのほう
」、関係情報＝「下Ｊを得る０部首辞書６を検索するこ
とで、文字列１は部首名であることがわかる０文字列２
は部首辞書６の中に存在しないので、これを新たに入力
としてこの単漢字変換が再帰的に呼び出される。

従ってこの単漢字変換装置に「はうこうのほう」という
文字列が入力され、この文字列が形式１であるかが調べ
られるが、この文字列は形式１でないことがわかり、次
に形式２であるかが調べられる。この文字列は形式２で
あると判定され、熟語指定処理部３が呼び出される。熟
語指定処理部３は文字列を解析し、文字列１＝１はうこ
う」、位置情報＝「左」を得る。その文字列Ｉを仮名漢
字変換することにより、その結果として、ｒ方向Ｊ「奉
公」　「彷徨」　「放校」等が得られる。これと位置情
報＝「左」から漢字候補として、「方」「奉」　「彷」
　「放」が得られる。これらの漢字について漢字情報辞
書８を検索−し、それぞれの漢字の読みとして「はう」
が存在することを確認し、これを出力する。

文字列２の漢字変換結果として、「方Ｊ　「奉」「彷」
　「放」を受は取った形状指定処理部２は、まず、「く
さかんむり」をキイとして、形状辞書７を検索し、文字
列「・・・草・・・芳・・・」を得る０次に、「方」を
キイとして形状辞書７を検索し、文字列「・・・芳・・
・旗・・・ｊを得る６次に、この２つの文字列に共通す
る文字を抽出することで、漢字候補「芳」を得る。この
操作を「奉」　「彷」　「放」についても行ない、全て
の漢字候補を得る。この例では、漢字候補として「芳」
だけが得られたものとする。

最後に、この得られた候補「芳」について、漢字情報辞
書８を検索し、その形項目「草冠−下一方」から、関係
情報が「下」であることを確認し、漢字候補として出力
する。

これにより、形状指定処理部２の出力として、漢字候補
［芳づが得られ、単漢字変換の処理が終了する０以上の
処理により、文字列「くさかんむりのしたにほうこうの
ほう）の単漢字変換結果として、「芳」が得られる。

もう一つの例として、「たいようのよう」という文字列
が入力された場合の装置の動作を説明する。「たいよう
のよう」という文字列が入力されると、まず、この文字
列が形式ｌであるかが調べられるが、この文字列は形式
１でないことがわかり、次に形式２であるかが調べられ
る。この文字列は形式２であると判定され、熟語指定処
理部３が呼び出される。熟語指定処理部３は文字列を解
析し、文字列１＝ｒたいようＪ、位置情報−「右」を得
る０文字列１を仮名漢字変換することにより、その結果
として、「太陽Ｊ　「大洋Ｊ　「大要Ｊが得られる。こ
れと位置情報＝「右」から、漢字候補として、「陽」　
「洋」　「要」が得られる。これらの漢字について漢字
情報辞書８を検索し、それぞれの漢字の読みとして「よ
う」が存在することを確認し、これら「陽Ｊ　「洋Ｊ　
「要」を出力とする。

なお、ここに示した例では、形状辞書７の構成を部首名
もしくは漢字一文字をキイとし、これを含む漢字からな
る文字列を内容とするものとしたが、形状辞書７の構成
として、部首名もしくは漢字と、位置情報の全てをキイ
として、それらによって構成される漢字を内容とするこ
とも可能である。

Ｆ発明の効果」以上で説明したように、この発明によれば、従来に較べ
て、簡便で使い勝手の良い単漢字変換機能が実現できる
。つまり、単漢字指定が、従来の方式に比べて熟練を必
要としない上、コードブック等も不要である。また、こ
れらの形式で指定された場合、候補となる漢字の数は単
なる読みで指定された場合りこ比べて極めて少ないため
、次候補キイ押下等の候補選択の手間も削減することが
できる。特にこれらの形式は人間が言葉を用いて漢字を
説明するときに用いる説明に類似しており、ユーザは普
段用いている説明と同じような入力をするだけで必要な
漢字を入力することができるため、その知的負荷を軽減
することにつながる。

【図面の簡単な説明】

第１図は、この発明の実施例の構成を示すブロック図、
第２図は、第１図中の入力文字列解析部１の処理の流れ
を示す図、第３図は第１図中の形状指定処理部２の処理
の流れを示す図、第４図は部首辞書６の内容の例を示す
図、第５図は形状辞書７の内容の例を示す図、第６図は
漢字情報辞書Ｂの内容の例を示す図である。特許出願人　　日本電信電話株式会社

Claims

【特許請求の範囲】

（１）漢字の形状を記述した形状辞書と、部首の読み方を記述した部首辞書と、漢字の読み方と形状を記述した漢字情報辞書と、与えら
れた文字列を文節とみなして仮名漢字変換を行う仮名漢
字変換部と、上記仮名漢字変換部が利用する仮名漢字変換辞書と、漢字一文字を指定して入力された文字列が、１、当該漢
字を構成する漢字もしくは部首名とそれらの位置関係に
よる指定、２、当該漢字が含まれている熟語の読みと、
その熟語における当該漢字の読みによる指定、３、当該
漢字の訓読を含む用言終止形による指定、４、当該漢字
が一文字で単語となる場合にその単語の読みによる指定
、の何れであるかを判定し、その判定結果に応じて形状
指定処理部、熟語指定処理部、単語指定処理部の何れか
の処理を呼び出す入力文字列解析部と、入力された文字列が上記１による指定である時に呼び出
され、与えられた文字列から部分となる漢字もしくは部
首名を表現している文字列である部分文字列と、下、右
などの位置関係の情報を抽出し、これら部分文字列が部
首名であるかを上記部首辞書によって確認し、そうでな
ければ、それら部分文字列をこの単漢字変換装置の入力
として漢字候補の集合を得て、これらによって得られた
部首名もしくは漢字候補と先の関係情報を用いて上記形
状辞書と上記漢字情報辞書とを検索し、入力文字列の漢
字候補を得る上記形状指定処理部と、入力された文字列
が上記２による指定である時に呼び出され、与えられた
文字列から、熟語の読みである文字列と、当該漢字の読
みがその熟語の読みのどの部分に相当するかという位置
情報を抽出し、上記仮名漢字変換部を利用して得られる
熟語の読みの仮名漢字変換結果である漢字熟語文字列と
上記の位置情報とから、入力文字列の漢字候補を得て、
それら漢字候補のうち、当該漢字の読みとして指定され
た文字列を読みとして持つものを上記漢字情報辞書を検
索して選び出し、入力文字列の漢字候補とする上記熟語
指定処理部と、入力された文字列が上記３、４による指
定である時に呼び出され、与えられた文字列を上記仮名
漢字変換部を利用して変換し、そこに含まれる一文字の
漢字を漢字候補とし、それら漢字候補のうち、入力文字
列を読みとして持つものを上記漢字情報辞書を検索して
選び出し、入力文字列の漢字候補とする上記単語指定処
理部と、を有することを特徴とする単漢字変換装置。