JPH01228058A

JPH01228058A - かな漢字変換装置

Info

Publication number: JPH01228058A
Application number: JP63054666A
Authority: JP
Inventors: Masako Bosu; 雅子望主
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1988-03-08
Filing date: 1988-03-08
Publication date: 1989-09-12

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】技術分野本発明は、日本語ワードプロセッサ等のかな漢字変換装
置に関する。

従来技術一般に、この種のかな漢字変換装置では、入力されたか
な文字列に対し可能な変換候補を複数表示し選択させる
ようにしている。

この際、接頭辞や接尾辞を構成要素とする複合語の場合
、その複合語そのものが登録されているか、単に接続だ
けを調べて変換候補を生成するようにしている。ここに
、複合語そのものを登録、即ち正しい組合せだけを辞書
に登録しておくとなると、登録語数が膨大に増えてしま
い、全てを登録することは不可能に近く、また、効率的
でない。

一方、接続だけを調べて可能な変換候補を生成する方式
によれば、個々の複合語自体は登録しなくてよいので、
辞書の記憶容量を節約できる。しかし、単に接続のみに
基づき候補を生成する場合、意味的に全く正しくない組
合せの複合語までの変換候補として出力されてしまうこ
とが多い。この結果、オペレータにとって選択に手間が
ががったり誤りである語が優先選択されて文書中に書込
まれるといったことがあり、煩わしく操作性が悪い。

目的本発明は、このような点に鑑みなされたもので、辞書の
記憶容量を増すことなく、意味的に誤ったものを複合語
変換候補として出力させるようなことがなく、操作性を
向上させることができるかな漢字変換装置を得ることを
目的とする。

構成本発明は、上記目的を達成するため、漢語及び漢語相当
語についてその意味分類を記憶した漢語意味分類辞書と
、接頭辞、接尾辞及び接辞相当語についてこれらと共起
する意味分類と意味分類毎の評価値を記憶した接辞共起
辞書と、これらの漢語意味分類辞書及び接辞共起辞書を
用い接頭辞や接尾辞を構成要素とする複合語の内部の意
味関係を調べ、その意味関係に基づき正しい語から優先
的に変換候補として表示し選択する複合語処理手段とか
らなることを特徴とする。

以下、本発明の一実施例を図面に基づいて説明する。ま
ず、概略的には、キーボード等の入力装置１と、ＣＲＴ
等の出力装置２と、入力された読みから表記を引く単語
辞書３と、本実施例で特に特徴とする複合語処理を行な
うために意味情報を付与した漢語意味分類辞書４及び接
辞共起辞書５とを、かな漢字変換装置本体６に接続して
システム構成してなる。

前記単語辞書３は、例えば第２図に示すように読み、品
詞、頻度、同−読みの場合に出力する優先順位、表記な
る情報を格納してなる。

また、漢語意味分類辞ｓ４は、２字以上の漢字を組合せ
てなる漢語や、接頭辞、接尾辞とともに漢語を構成する
カタカナ等（即ち、複合語を構成する語であり、漢語相
当語と称する）を、第３図に示すように、その意味分類
を記憶させてなる。

二の漢語意味分類辞書４中の意味分類によって複合語の
意味関係をチエツクするものである。

接辞共起辞書５は、第４図に示すように、接辞の表記と
、その接辞に共起する意味分類と意味分類毎の評価値と
の組みを記憶したものである。この際、各意味分類に対
する評価値は、意味的に正しく、また、よく使用される
もの程、高く設定される。

さらに、かな漢字変換装置本体６はこれらの辞書３，４
．５等を用いて実際にかな漢字変換処理を行なうもので
あり、漢語記憶部７、接辞記憶部８及び候補記憶部９な
るメモリを内蔵している。

ここに、漢語記憶部７は前の語が接頭辞である時、変換
候補中の２字以上の漢語類を候補記憶部９がら抽出して
記憶する部分である。第５図はその一例を示す。即ち、
漢語意味分類辞書４中に記憶されている意味分類とのマ
ツチングをとるエリアである。また、接辞記憶部８は変
換候補中から接頭辞又は接尾辞なる接辞だけを候補記憶
部９から抽出して記憶する部分である。第６図はその一
例を示す。即ち、接辞共起辞書５中に記憶されている共
起意味分類（評価値を含む）とのマツチングをとるエリ
アである。さらに、候補記憶部９は辞書検索し、接続の
検定をも行なった後、漢字変換候補となり得る語を保持
するもので、その−例を第７図に示す。複合語処理の対
象とならない語もこの候補記憶部９に保持される。

そして、かな漢字変換装置本体６では、辞書検索部１０
、単語評価部１１、単語選択部１２、確定処理部１３な
る流れにてかな漢字変換処理を行なうように構成されて
いる。本実施例は、この中で、特に辞書検索部１０によ
る検索後の単語評価部ｌｌ内の処理に特徴を持つ。この
単語評価部１１は、接続検定部１４、複合語処理手段と
なる複合語処理部１５、評価値算出部１６等からなる処
理部を持ち、第８図に示すフローチャートに従い処理を
実行する。１７はバックトラックである。

概略的には、辞書検索部１０による辞書検索の後、接続
検定部１４で前の語との接続をチエツクし、接続可能な
ものだけを候補記憶部９に保持する。この候補記憶部９
に保持された語に対し複合語処理部１５により複合語処
理を施す。この複合語処理の後、各変換候補の各々につ
いて評価値算出部１６で評価値を算出する。この単語評
価部１１による処理後、単語選択部１２に処理を進め、
これらの変換候補と評価値とから単語を選択し、確定処
理部１３に渡す。

しかして、第８図のフローチャートを参照しつつ、具体
例を用いて、本実施例の処理を説明する。

例１）［未こうこうやみしゆっこうのものは」なる入力文字列
があり、文頭の「未」まで確定しているものとする。

まず、［未」の後から辞書検索すると、読み「こうこう
」から「孝行」　「高校」　「口腔」　「航行」、読み
「こうこうや」から「好好爺」が検索され、これらを候
補記憶部９に登録する。そして、複合語処理に移行する
が、これらの候補には接尾辞がなく、かつ、直前は「未
」なる接頭辞であるので、２字以上の漢語を漢語記憶部
７に抽出する。

第５図の漢語記憶部７はこの場合の状態を示す。

そして、抽出されなかった残りの候補を候補記憶部９に
保持するが、この場合、前述した候補は全て抽出され、
残りの候補がなくなり、候補記憶部９は空となる。つい
で、接頭辞と漢語記憶部７中に抽出された漢語の意味分
類とのマツチングをとる。本例であれば、接頭辞「未」
の共起意味分類は第４図に示すように［動作」であるの
で、漢語記憶部７中に抽出された上記漢語中、「動作」
なる意味分類を持つ「航行」のみがマツチングする。

そこで、この「航行」なる漢語を抽出し、当該候補の「
航行」を候補記憶部９の先頭に挿入する。

そして、候補記憶部９中に語を持つので、複合語処理を
終了し、「航行」なる候補とその評価値「３」を持って
、評価値算出部１６の処理に移行することになる。この
ようにして、「未航行」なる正しい複合語が候補として
選択される。

例２）「合格てんがとれないとき」なる入力文字列があり、文頭のｒ合格」まで確定してい
るものとする。

まず、「合格」の後から辞書検索すると、読み「てん」
から「店」　「展」　「天」　「点」　「転」「典」が
得られ、読み「てんが」から「典雅」が検索され、これ
らを候補記憶部９に登録する。第７図はこの時の候補記
憶部９の状態を例に示すものである。そして、複合語処
理に移行するが、これらの候補には接尾辞があるので、
候補記憶部９から接尾辞を抽出し、接辞記憶部８に登録
する。

第６図はこの時の接辞記憶部８の状態を示す。そして、
接尾辞でない残りの候補「典雅」は候補記憶部９に保持
したままとする。ついで、直前の漢語「合格」と抽出さ
れた各接尾辞候補との意味分類のマツチングをとる。こ
の場合、共起する意味分類から「合格」にマツチングし
得るのは１店」「展」　１点」であり、これらを接辞記
憶部８中から抽出する。複数の候補があるので、これら
を評価値の降順に並べ（本例であれば、１点」　「店」
「展」の順）、この順に候補記憶部９の先頭に押入する
。よって、この処理後の候補記憶部９には１点」　「店
」　「展」　「典雅」の順に記憶される。

このように候補記憶部９に候補を持つ状態で処理を終了
し、評価値算出部１６による処理に移行する。この場合
でも、「合格点」を筆頭に「合格店」「合格展」の如く
、意味的に正しいものが候補となる。つまり、「合格転
」や「合格具」の如く、意味的に誤っているものが複合
語の候補とされることはない。

本実施例によれば、複合語について、単に接続だけでな
く、その内部の意味まで調べ、意味的に誤りでない語だ
けを変換候補として出力するので、オペレータにとって
所望の複合語候補が選択される確率が高く、意味的に誤
っているものに惑わされることもなく、操作性のよいも
のとなる。このために、複合語の状態で登録しておくわ
けではなく、各漢語毎の情報と接辞毎の情報とを各々辞
書４．５に記憶させておけばよく、記憶容量が少なくて
済むものでもある。

なお、本実施例のシステムは、入力文字列が漢字かな混
じり文であっても、同様の辞書とマツチング方法とを用
いいることにより、その校正支援システム、機械翻訳シ
ステムに応用できる。

効果本発明は、上述したように漢語等についてその意味分類
を記憶した漢語意味分類辞書と、接辞について接辞と共
起する意味分類とそれらの評価値を記憶した接辞共起辞
書とを用い、複合語処理手段では接頭辞や接尾辞を構成
要素とする複合語の内部の意味関係をも調べ、その意味
関係に基づき正しい語から優先的に変換候補として表示
し選択させるようにしたので、単に接続関係により候補
を生成する場合のように意味的に誤っているものを候補
とすることがなく、意味的に正しいもののみを複合語候
補とすることができ、選択時のオペレータの操作性を向
上させることができ、このためにも、漢語意味分類辞書
及び接辞共起辞書を設ければよく、複合語の形で記憶さ
せる場合のように記憶容量が増えることはないものであ
る。

【図面の簡単な説明】

図面は本発明の一実施例を示し、第１図はブロック図、
第２図は単語辞書の説明図、第３図は漢語意味分類辞書
の説明図、第４図は接辞共起辞書の説明図、第５図は漢
語記憶部の説明図、第６図は接辞記憶部の説明図、第７
図は候補記憶部の説明図、第８図は複合語処理を示すフ
ローチャートである。４・・・漢語意味分類辞書、５・・・接辞共起辞書、１
５・・・複合語処理手段

Claims

【特許請求の範囲】

漢語及び漢語相当語についてその意味分類を記憶した漢
語意味分類辞書と、接頭辞、接尾辞及び接辞相当語につ
いてこれらと共起する意味分類と意味分類毎の評価値を
記憶した接辞共起辞書と、これらの漢語意味分類辞書及
び接辞共起辞書を用い接頭辞や接尾辞を構成要素とする
複合語の内部の意味関係を調べ、その意味関係に基づき
正しい語から優先的に変換候補として表示し選択する複
合語処理手段とからなることを特徴とするかな漢字変換
装置。