JPH01228058A - かな漢字変換装置 - Google Patents
かな漢字変換装置Info
- Publication number
- JPH01228058A JPH01228058A JP63054666A JP5466688A JPH01228058A JP H01228058 A JPH01228058 A JP H01228058A JP 63054666 A JP63054666 A JP 63054666A JP 5466688 A JP5466688 A JP 5466688A JP H01228058 A JPH01228058 A JP H01228058A
- Authority
- JP
- Japan
- Prior art keywords
- word
- dictionary
- meaning
- chinese
- affix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
技術分野
本発明は、日本語ワードプロセッサ等のかな漢字変換装
置に関する。
置に関する。
従来技術
一般に、この種のかな漢字変換装置では、入力されたか
な文字列に対し可能な変換候補を複数表示し選択させる
ようにしている。
な文字列に対し可能な変換候補を複数表示し選択させる
ようにしている。
この際、接頭辞や接尾辞を構成要素とする複合語の場合
、その複合語そのものが登録されているか、単に接続だ
けを調べて変換候補を生成するようにしている。ここに
、複合語そのものを登録、即ち正しい組合せだけを辞書
に登録しておくとなると、登録語数が膨大に増えてしま
い、全てを登録することは不可能に近く、また、効率的
でない。
、その複合語そのものが登録されているか、単に接続だ
けを調べて変換候補を生成するようにしている。ここに
、複合語そのものを登録、即ち正しい組合せだけを辞書
に登録しておくとなると、登録語数が膨大に増えてしま
い、全てを登録することは不可能に近く、また、効率的
でない。
一方、接続だけを調べて可能な変換候補を生成する方式
によれば、個々の複合語自体は登録しなくてよいので、
辞書の記憶容量を節約できる。しかし、単に接続のみに
基づき候補を生成する場合、意味的に全く正しくない組
合せの複合語までの変換候補として出力されてしまうこ
とが多い。この結果、オペレータにとって選択に手間が
ががったり誤りである語が優先選択されて文書中に書込
まれるといったことがあり、煩わしく操作性が悪い。
によれば、個々の複合語自体は登録しなくてよいので、
辞書の記憶容量を節約できる。しかし、単に接続のみに
基づき候補を生成する場合、意味的に全く正しくない組
合せの複合語までの変換候補として出力されてしまうこ
とが多い。この結果、オペレータにとって選択に手間が
ががったり誤りである語が優先選択されて文書中に書込
まれるといったことがあり、煩わしく操作性が悪い。
目的
本発明は、このような点に鑑みなされたもので、辞書の
記憶容量を増すことなく、意味的に誤ったものを複合語
変換候補として出力させるようなことがなく、操作性を
向上させることができるかな漢字変換装置を得ることを
目的とする。
記憶容量を増すことなく、意味的に誤ったものを複合語
変換候補として出力させるようなことがなく、操作性を
向上させることができるかな漢字変換装置を得ることを
目的とする。
構成
本発明は、上記目的を達成するため、漢語及び漢語相当
語についてその意味分類を記憶した漢語意味分類辞書と
、接頭辞、接尾辞及び接辞相当語についてこれらと共起
する意味分類と意味分類毎の評価値を記憶した接辞共起
辞書と、これらの漢語意味分類辞書及び接辞共起辞書を
用い接頭辞や接尾辞を構成要素とする複合語の内部の意
味関係を調べ、その意味関係に基づき正しい語から優先
的に変換候補として表示し選択する複合語処理手段とか
らなることを特徴とする。
語についてその意味分類を記憶した漢語意味分類辞書と
、接頭辞、接尾辞及び接辞相当語についてこれらと共起
する意味分類と意味分類毎の評価値を記憶した接辞共起
辞書と、これらの漢語意味分類辞書及び接辞共起辞書を
用い接頭辞や接尾辞を構成要素とする複合語の内部の意
味関係を調べ、その意味関係に基づき正しい語から優先
的に変換候補として表示し選択する複合語処理手段とか
らなることを特徴とする。
以下、本発明の一実施例を図面に基づいて説明する。ま
ず、概略的には、キーボード等の入力装置1と、CRT
等の出力装置2と、入力された読みから表記を引く単語
辞書3と、本実施例で特に特徴とする複合語処理を行な
うために意味情報を付与した漢語意味分類辞書4及び接
辞共起辞書5とを、かな漢字変換装置本体6に接続して
システム構成してなる。
ず、概略的には、キーボード等の入力装置1と、CRT
等の出力装置2と、入力された読みから表記を引く単語
辞書3と、本実施例で特に特徴とする複合語処理を行な
うために意味情報を付与した漢語意味分類辞書4及び接
辞共起辞書5とを、かな漢字変換装置本体6に接続して
システム構成してなる。
前記単語辞書3は、例えば第2図に示すように読み、品
詞、頻度、同−読みの場合に出力する優先順位、表記な
る情報を格納してなる。
詞、頻度、同−読みの場合に出力する優先順位、表記な
る情報を格納してなる。
また、漢語意味分類辞s4は、2字以上の漢字を組合せ
てなる漢語や、接頭辞、接尾辞とともに漢語を構成する
カタカナ等(即ち、複合語を構成する語であり、漢語相
当語と称する)を、第3図に示すように、その意味分類
を記憶させてなる。
てなる漢語や、接頭辞、接尾辞とともに漢語を構成する
カタカナ等(即ち、複合語を構成する語であり、漢語相
当語と称する)を、第3図に示すように、その意味分類
を記憶させてなる。
二の漢語意味分類辞書4中の意味分類によって複合語の
意味関係をチエツクするものである。
意味関係をチエツクするものである。
接辞共起辞書5は、第4図に示すように、接辞の表記と
、その接辞に共起する意味分類と意味分類毎の評価値と
の組みを記憶したものである。この際、各意味分類に対
する評価値は、意味的に正しく、また、よく使用される
もの程、高く設定される。
、その接辞に共起する意味分類と意味分類毎の評価値と
の組みを記憶したものである。この際、各意味分類に対
する評価値は、意味的に正しく、また、よく使用される
もの程、高く設定される。
さらに、かな漢字変換装置本体6はこれらの辞書3,4
.5等を用いて実際にかな漢字変換処理を行なうもので
あり、漢語記憶部7、接辞記憶部8及び候補記憶部9な
るメモリを内蔵している。
.5等を用いて実際にかな漢字変換処理を行なうもので
あり、漢語記憶部7、接辞記憶部8及び候補記憶部9な
るメモリを内蔵している。
ここに、漢語記憶部7は前の語が接頭辞である時、変換
候補中の2字以上の漢語類を候補記憶部9がら抽出して
記憶する部分である。第5図はその一例を示す。即ち、
漢語意味分類辞書4中に記憶されている意味分類とのマ
ツチングをとるエリアである。また、接辞記憶部8は変
換候補中から接頭辞又は接尾辞なる接辞だけを候補記憶
部9から抽出して記憶する部分である。第6図はその一
例を示す。即ち、接辞共起辞書5中に記憶されている共
起意味分類(評価値を含む)とのマツチングをとるエリ
アである。さらに、候補記憶部9は辞書検索し、接続の
検定をも行なった後、漢字変換候補となり得る語を保持
するもので、その−例を第7図に示す。複合語処理の対
象とならない語もこの候補記憶部9に保持される。
候補中の2字以上の漢語類を候補記憶部9がら抽出して
記憶する部分である。第5図はその一例を示す。即ち、
漢語意味分類辞書4中に記憶されている意味分類とのマ
ツチングをとるエリアである。また、接辞記憶部8は変
換候補中から接頭辞又は接尾辞なる接辞だけを候補記憶
部9から抽出して記憶する部分である。第6図はその一
例を示す。即ち、接辞共起辞書5中に記憶されている共
起意味分類(評価値を含む)とのマツチングをとるエリ
アである。さらに、候補記憶部9は辞書検索し、接続の
検定をも行なった後、漢字変換候補となり得る語を保持
するもので、その−例を第7図に示す。複合語処理の対
象とならない語もこの候補記憶部9に保持される。
そして、かな漢字変換装置本体6では、辞書検索部10
、単語評価部11、単語選択部12、確定処理部13な
る流れにてかな漢字変換処理を行なうように構成されて
いる。本実施例は、この中で、特に辞書検索部10によ
る検索後の単語評価部ll内の処理に特徴を持つ。この
単語評価部11は、接続検定部14、複合語処理手段と
なる複合語処理部15、評価値算出部16等からなる処
理部を持ち、第8図に示すフローチャートに従い処理を
実行する。17はバックトラックである。
、単語評価部11、単語選択部12、確定処理部13な
る流れにてかな漢字変換処理を行なうように構成されて
いる。本実施例は、この中で、特に辞書検索部10によ
る検索後の単語評価部ll内の処理に特徴を持つ。この
単語評価部11は、接続検定部14、複合語処理手段と
なる複合語処理部15、評価値算出部16等からなる処
理部を持ち、第8図に示すフローチャートに従い処理を
実行する。17はバックトラックである。
概略的には、辞書検索部10による辞書検索の後、接続
検定部14で前の語との接続をチエツクし、接続可能な
ものだけを候補記憶部9に保持する。この候補記憶部9
に保持された語に対し複合語処理部15により複合語処
理を施す。この複合語処理の後、各変換候補の各々につ
いて評価値算出部16で評価値を算出する。この単語評
価部11による処理後、単語選択部12に処理を進め、
これらの変換候補と評価値とから単語を選択し、確定処
理部13に渡す。
検定部14で前の語との接続をチエツクし、接続可能な
ものだけを候補記憶部9に保持する。この候補記憶部9
に保持された語に対し複合語処理部15により複合語処
理を施す。この複合語処理の後、各変換候補の各々につ
いて評価値算出部16で評価値を算出する。この単語評
価部11による処理後、単語選択部12に処理を進め、
これらの変換候補と評価値とから単語を選択し、確定処
理部13に渡す。
しかして、第8図のフローチャートを参照しつつ、具体
例を用いて、本実施例の処理を説明する。
例を用いて、本実施例の処理を説明する。
例1)
[未こうこうやみしゆっこうのものは」なる入力文字列
があり、文頭の「未」まで確定しているものとする。
があり、文頭の「未」まで確定しているものとする。
まず、[未」の後から辞書検索すると、読み「こうこう
」から「孝行」 「高校」 「口腔」 「航行」、読み
「こうこうや」から「好好爺」が検索され、これらを候
補記憶部9に登録する。そして、複合語処理に移行する
が、これらの候補には接尾辞がなく、かつ、直前は「未
」なる接頭辞であるので、2字以上の漢語を漢語記憶部
7に抽出する。
」から「孝行」 「高校」 「口腔」 「航行」、読み
「こうこうや」から「好好爺」が検索され、これらを候
補記憶部9に登録する。そして、複合語処理に移行する
が、これらの候補には接尾辞がなく、かつ、直前は「未
」なる接頭辞であるので、2字以上の漢語を漢語記憶部
7に抽出する。
第5図の漢語記憶部7はこの場合の状態を示す。
そして、抽出されなかった残りの候補を候補記憶部9に
保持するが、この場合、前述した候補は全て抽出され、
残りの候補がなくなり、候補記憶部9は空となる。つい
で、接頭辞と漢語記憶部7中に抽出された漢語の意味分
類とのマツチングをとる。本例であれば、接頭辞「未」
の共起意味分類は第4図に示すように[動作」であるの
で、漢語記憶部7中に抽出された上記漢語中、「動作」
なる意味分類を持つ「航行」のみがマツチングする。
保持するが、この場合、前述した候補は全て抽出され、
残りの候補がなくなり、候補記憶部9は空となる。つい
で、接頭辞と漢語記憶部7中に抽出された漢語の意味分
類とのマツチングをとる。本例であれば、接頭辞「未」
の共起意味分類は第4図に示すように[動作」であるの
で、漢語記憶部7中に抽出された上記漢語中、「動作」
なる意味分類を持つ「航行」のみがマツチングする。
そこで、この「航行」なる漢語を抽出し、当該候補の「
航行」を候補記憶部9の先頭に挿入する。
航行」を候補記憶部9の先頭に挿入する。
そして、候補記憶部9中に語を持つので、複合語処理を
終了し、「航行」なる候補とその評価値「3」を持って
、評価値算出部16の処理に移行することになる。この
ようにして、「未航行」なる正しい複合語が候補として
選択される。
終了し、「航行」なる候補とその評価値「3」を持って
、評価値算出部16の処理に移行することになる。この
ようにして、「未航行」なる正しい複合語が候補として
選択される。
例2)
「合格てんがとれないとき」
なる入力文字列があり、文頭のr合格」まで確定してい
るものとする。
るものとする。
まず、「合格」の後から辞書検索すると、読み「てん」
から「店」 「展」 「天」 「点」 「転」「典」が
得られ、読み「てんが」から「典雅」が検索され、これ
らを候補記憶部9に登録する。第7図はこの時の候補記
憶部9の状態を例に示すものである。そして、複合語処
理に移行するが、これらの候補には接尾辞があるので、
候補記憶部9から接尾辞を抽出し、接辞記憶部8に登録
する。
から「店」 「展」 「天」 「点」 「転」「典」が
得られ、読み「てんが」から「典雅」が検索され、これ
らを候補記憶部9に登録する。第7図はこの時の候補記
憶部9の状態を例に示すものである。そして、複合語処
理に移行するが、これらの候補には接尾辞があるので、
候補記憶部9から接尾辞を抽出し、接辞記憶部8に登録
する。
第6図はこの時の接辞記憶部8の状態を示す。そして、
接尾辞でない残りの候補「典雅」は候補記憶部9に保持
したままとする。ついで、直前の漢語「合格」と抽出さ
れた各接尾辞候補との意味分類のマツチングをとる。こ
の場合、共起する意味分類から「合格」にマツチングし
得るのは1店」「展」 1点」であり、これらを接辞記
憶部8中から抽出する。複数の候補があるので、これら
を評価値の降順に並べ(本例であれば、1点」 「店」
「展」の順)、この順に候補記憶部9の先頭に押入する
。よって、この処理後の候補記憶部9には1点」 「店
」 「展」 「典雅」の順に記憶される。
接尾辞でない残りの候補「典雅」は候補記憶部9に保持
したままとする。ついで、直前の漢語「合格」と抽出さ
れた各接尾辞候補との意味分類のマツチングをとる。こ
の場合、共起する意味分類から「合格」にマツチングし
得るのは1店」「展」 1点」であり、これらを接辞記
憶部8中から抽出する。複数の候補があるので、これら
を評価値の降順に並べ(本例であれば、1点」 「店」
「展」の順)、この順に候補記憶部9の先頭に押入する
。よって、この処理後の候補記憶部9には1点」 「店
」 「展」 「典雅」の順に記憶される。
このように候補記憶部9に候補を持つ状態で処理を終了
し、評価値算出部16による処理に移行する。この場合
でも、「合格点」を筆頭に「合格店」「合格展」の如く
、意味的に正しいものが候補となる。つまり、「合格転
」や「合格具」の如く、意味的に誤っているものが複合
語の候補とされることはない。
し、評価値算出部16による処理に移行する。この場合
でも、「合格点」を筆頭に「合格店」「合格展」の如く
、意味的に正しいものが候補となる。つまり、「合格転
」や「合格具」の如く、意味的に誤っているものが複合
語の候補とされることはない。
本実施例によれば、複合語について、単に接続だけでな
く、その内部の意味まで調べ、意味的に誤りでない語だ
けを変換候補として出力するので、オペレータにとって
所望の複合語候補が選択される確率が高く、意味的に誤
っているものに惑わされることもなく、操作性のよいも
のとなる。このために、複合語の状態で登録しておくわ
けではなく、各漢語毎の情報と接辞毎の情報とを各々辞
書4.5に記憶させておけばよく、記憶容量が少なくて
済むものでもある。
く、その内部の意味まで調べ、意味的に誤りでない語だ
けを変換候補として出力するので、オペレータにとって
所望の複合語候補が選択される確率が高く、意味的に誤
っているものに惑わされることもなく、操作性のよいも
のとなる。このために、複合語の状態で登録しておくわ
けではなく、各漢語毎の情報と接辞毎の情報とを各々辞
書4.5に記憶させておけばよく、記憶容量が少なくて
済むものでもある。
なお、本実施例のシステムは、入力文字列が漢字かな混
じり文であっても、同様の辞書とマツチング方法とを用
いいることにより、その校正支援システム、機械翻訳シ
ステムに応用できる。
じり文であっても、同様の辞書とマツチング方法とを用
いいることにより、その校正支援システム、機械翻訳シ
ステムに応用できる。
効果
本発明は、上述したように漢語等についてその意味分類
を記憶した漢語意味分類辞書と、接辞について接辞と共
起する意味分類とそれらの評価値を記憶した接辞共起辞
書とを用い、複合語処理手段では接頭辞や接尾辞を構成
要素とする複合語の内部の意味関係をも調べ、その意味
関係に基づき正しい語から優先的に変換候補として表示
し選択させるようにしたので、単に接続関係により候補
を生成する場合のように意味的に誤っているものを候補
とすることがなく、意味的に正しいもののみを複合語候
補とすることができ、選択時のオペレータの操作性を向
上させることができ、このためにも、漢語意味分類辞書
及び接辞共起辞書を設ければよく、複合語の形で記憶さ
せる場合のように記憶容量が増えることはないものであ
る。
を記憶した漢語意味分類辞書と、接辞について接辞と共
起する意味分類とそれらの評価値を記憶した接辞共起辞
書とを用い、複合語処理手段では接頭辞や接尾辞を構成
要素とする複合語の内部の意味関係をも調べ、その意味
関係に基づき正しい語から優先的に変換候補として表示
し選択させるようにしたので、単に接続関係により候補
を生成する場合のように意味的に誤っているものを候補
とすることがなく、意味的に正しいもののみを複合語候
補とすることができ、選択時のオペレータの操作性を向
上させることができ、このためにも、漢語意味分類辞書
及び接辞共起辞書を設ければよく、複合語の形で記憶さ
せる場合のように記憶容量が増えることはないものであ
る。
図面は本発明の一実施例を示し、第1図はブロック図、
第2図は単語辞書の説明図、第3図は漢語意味分類辞書
の説明図、第4図は接辞共起辞書の説明図、第5図は漢
語記憶部の説明図、第6図は接辞記憶部の説明図、第7
図は候補記憶部の説明図、第8図は複合語処理を示すフ
ローチャートである。 4・・・漢語意味分類辞書、5・・・接辞共起辞書、1
5・・・複合語処理手段
第2図は単語辞書の説明図、第3図は漢語意味分類辞書
の説明図、第4図は接辞共起辞書の説明図、第5図は漢
語記憶部の説明図、第6図は接辞記憶部の説明図、第7
図は候補記憶部の説明図、第8図は複合語処理を示すフ
ローチャートである。 4・・・漢語意味分類辞書、5・・・接辞共起辞書、1
5・・・複合語処理手段
Claims (1)
- 漢語及び漢語相当語についてその意味分類を記憶した漢
語意味分類辞書と、接頭辞、接尾辞及び接辞相当語につ
いてこれらと共起する意味分類と意味分類毎の評価値を
記憶した接辞共起辞書と、これらの漢語意味分類辞書及
び接辞共起辞書を用い接頭辞や接尾辞を構成要素とする
複合語の内部の意味関係を調べ、その意味関係に基づき
正しい語から優先的に変換候補として表示し選択する複
合語処理手段とからなることを特徴とするかな漢字変換
装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63054666A JPH01228058A (ja) | 1988-03-08 | 1988-03-08 | かな漢字変換装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63054666A JPH01228058A (ja) | 1988-03-08 | 1988-03-08 | かな漢字変換装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01228058A true JPH01228058A (ja) | 1989-09-12 |
Family
ID=12977103
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63054666A Pending JPH01228058A (ja) | 1988-03-08 | 1988-03-08 | かな漢字変換装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01228058A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03167657A (ja) * | 1989-11-28 | 1991-07-19 | Canon Inc | 文字処理装置 |
| JPH03168864A (ja) * | 1989-11-29 | 1991-07-22 | Canon Inc | 文字処理装置 |
| JPH04343163A (ja) * | 1991-05-20 | 1992-11-30 | Sharp Corp | 用例辞書及びこの用例辞書を備えた文章処理装置 |
-
1988
- 1988-03-08 JP JP63054666A patent/JPH01228058A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03167657A (ja) * | 1989-11-28 | 1991-07-19 | Canon Inc | 文字処理装置 |
| JPH03168864A (ja) * | 1989-11-29 | 1991-07-22 | Canon Inc | 文字処理装置 |
| JPH04343163A (ja) * | 1991-05-20 | 1992-11-30 | Sharp Corp | 用例辞書及びこの用例辞書を備えた文章処理装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6263329B1 (en) | Method and apparatus for cross-linguistic database retrieval | |
| US5794177A (en) | Method and apparatus for morphological analysis and generation of natural language text | |
| WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
| JP4502114B2 (ja) | データベース検索装置 | |
| JPH01228058A (ja) | かな漢字変換装置 | |
| JPH07306858A (ja) | 辞書編集装置 | |
| JP2785692B2 (ja) | 辞書検索表示装置 | |
| KR20020015100A (ko) | 웹 브라우저를 이용한 정보 검색 시스템 | |
| JP2000090110A (ja) | 全文検索方法、装置、および全文検索プログラムを記録した記録媒体 | |
| JPH0785040A (ja) | 表記不統一検出方法およびかな漢字変換方法 | |
| JPH0736903A (ja) | 翻訳支援装置 | |
| JP2655711B2 (ja) | 同形語読み分け方式 | |
| JPS60247756A (ja) | デ−タベ−ス装置 | |
| JP2001051992A (ja) | 日本語統計データ作成装置および方法、並びにディクテーションシステム | |
| JPH03123971A (ja) | 索引付け支援装置 | |
| JPH07281879A (ja) | アプリケーションプログラム編集装置 | |
| JPH03111965A (ja) | 仮名漢字変換方法及び仮名漢字変換装置 | |
| JP2000112970A (ja) | 情報検索装置 | |
| JPS5835306B2 (ja) | 単語情報検索出力装置 | |
| JPH01185766A (ja) | かな漢字変換装置 | |
| JPH06124279A (ja) | 文章作成支援装置および文章作成支援方法 | |
| JPH08329081A (ja) | 機械翻訳方法及び機械翻訳装置 | |
| JPH04365166A (ja) | 文章検査装置 | |
| JPH0264859A (ja) | 文章処理装置 | |
| JPH0795321B2 (ja) | 形態素解析装置 |