JPH01181154A

JPH01181154A - かな漢字変換装置

Info

Publication number: JPH01181154A
Application number: JP63006354A
Authority: JP
Inventors: Masahiro Ishiba; 石場　正大; Takayuki Kowada; 古和田　孝之; Tetsuo Takeyama; 竹山　哲夫; Masuo Kondo; 益生近藤
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 1988-01-14
Filing date: 1988-01-14
Publication date: 1989-07-19

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（イ）　産業上の利用分野本発明はかな漢字変換装置に関する。

（ロ）従来の技術従来のかな漢字変換では、入力された読みを単語単位に
分割し、斯る単語単位に分割された読み毎に対応する漢
字を国語辞書から抽出すると共に斯る抽出単語の品詞、
使用頻度等の文法情報に基づいて接続関係の最適なもの
を選択し、かな漢字混り文として出力する方法が一般的
であった。

然るに、上記方法では接続関係を品詞、使用頻度等の文
法情報だけで判断していたため、文法上は正しい変換が
行なわれるものの、意味解釈の点からは全く無意味な変
換結果となってしまうことが頻繁に生じていた。

例えば、読み入力として「がいとうえんぜっ」を入力し
た場合、「外燈演説」というような変換結果が生じる。

斯る結果は文法上誤変換ではないが、意味解釈の点から
は明らかに誤変換と言わざるを得ない。

そこで、従来の文法的解析に加えて意味的解析を用いる
ことにより意味解釈上の点からも正しい変換が行なえる
方法が提案された（情報処理学会論文誌Ｖｏ＃、２７　
　Ｎｏ、１１　　ＮＯＶ、１９８６）。

斯る方法は一般に連語解析と呼ばれる方法であって、具
体的には、任意の単語同士か意味解釈上接続が可能か否
かを判断するための連語辞書もしくはテーブルを有し、
斯る辞書もしくはテーブルを用いて最適な接続関係を判
断し変換を行なうものである。

即ち、今、「あかいはし」という読みが入力されたとす
ると、斯る読みは文法解析上「あかい」という単語と「
はし」という単語とに分解され、各文節に対して夫々国
語辞書より変換候補として「赤い」及び「橋、箸、端」
が抽出される。またこのとき、当然「赤い橋」及び「赤
い箸」という連語は意味解釈上からも、接続可能である
ので連語辞書には「赤い」という単語と「橋」もしくは
「箸」という単語とは接続可能である旨の情報は格納さ
れるものの、一般に「赤い」と「端」との接続は意味解
釈上適切ではないため連語辞書中には後続可能である旨
の情報は格納されない。従って、「あかいはし」という
読みに対しては「赤い橋」もしくは「赤い箸」が漫先的
に出力されることとなる。

（ハ）発明が解決しようとする課題また、上記公知文献には、上述した如く隣接する文ｍ間
だけではなく、「赤い秋の花」の様に「赤い」と「花」
とのように離間した単語間の意味解釈上の接続可否を判
定し、正しい変換を行なうことが提案されている。

然るに、従来は斯る方法を実現するための具体的装置が
なかった。

に）課題を解決するための手段本発明は斯る点に鑑みてなされたもので、その構成的特
徴は、読み入力を文法的解析及び意味的解析を用いて漢
字表記に変換するための装置であって、単語単位の読み
に対応して漢字表記が格納された国語辞書と、意味解釈
上接続が可能な漢字表記同士を対にして格納された連語
辞書と、上記国語辞書と連語辞書とを用いて上記読み入
力を漢字表記に変換する手段と、該手段より出力された
変換結果をその出力順に格納するテキストメモリと、上
記変換手段より出力された又換結果及び斯る結果のテキ
ストメモリ中での格納位置が格納される管理テーブルと
、該テーブル中に既に格納されている漢字表２の中から
新たに上記変換手段で変換された漢字表記を修飾可能な
ものを検索し斯る修飾可能な漢字表記と同音異義語であ
る漢字表記を上記国語辞書より読出すと共に上記連語辞
書を用いて上記読出しにより得られた漢字表記の中から
上記新たに変換された漢字表記と意味解釈上段も接続性
が高いと判断される漢字表記を選出し、その後上記修飾
可能な漢字表記に対応して管理テーブル中に格納された
位置情報に基づいて上ε選出された漢字表記を上記テキ
ストメモリに書込む手段とを備えたことにある。

し羽咋　用斯る装置では、テキストメモリ中に格納済の漢字表記が
その漢字表記毎に管理テーブルに格納されているので、
斯る管理テーブルを検索することにより、新たに変換し
得られた漢字表記に対して修飾可能な既変換済の漢字表
記を得ることができる。

（へ）実施例第１図は、本発明の実施例を示し、（１）は例えばキー
ボードからなる入力部であり、該入力部からかな漢字′
ｇ、換されるべき読みが入力される。（２）は入力バッ
ファであり、該入力バッファに一入方部（１）より入力
された一単語分の読みが格納される。

（３）は国語辞書であり、該辞書には第２図に示す如く
単語単位の読みに対応して、その漢字表記（かな漢字混
り表記も含む）品詞及び使用頻度等の情報が格納される
。（４）はかな漢字変換部であり、該変換部は入力バッ
ファ（２）中の一単語分の読みに対応した漢字表記及び
これに付随する品詞、使用頻度等の情報を国語辞書から
読み出す。このとき、上記単語の読みに対して複数の漢
字表記（同音異義語）が存在するときには上記品詞、使
用頻度等の情報に基づいて各漢字表記の得点を計算し、
その得点の大きい順に上記漢字表記その読み及び品詞を
出力する。尚、上記得点計算とは予め品詞の種類及び使
用頻度によって得点を付けておき、斯る得点合計を計算
するものである。

（５）は単語テーブルであり、該テーブルにはかな漢字
変換部（４）より出力された漢字表記等がその出力順に
格納される。（６）は連語辞書であり、該辞書には意味
解釈上において接続可能である単語同士の漢字表記が一
対となって格納されている。（７）はテキストメモリで
あり、該メモリには入力部（１）より入力された読みを
変換処理することにより得られた変換結果を逐次格納す
る。（８）は管理テーブルであり、該テーブルにはテキ
ストメモリ（７）に逐次格納された変換結果と同一の漢
字表記を斯る表記の読み、その品詞情報及びその表記の
テキストメモリ（７）上での格納位置（以下テキスト位
置と称す）と共に上記テキストメモリ中への格納順に格
納する。

（９）は候補検索部であり、該検索部は、まず、単語テ
ーブル（５）に格納された各漢字表記と管理テーブル（
８）中に最も近い時点で格納された漢字表記（以下、最
後尾の漢字表記と称す）とについて夫々の品詞情報に基
づく文法解析及び連語辞書（６）を用いての意味解析を
行ない単語テーブル（５）中に格納された漢字表記の中
で、上記管理テーブル（８）中の最後尾の漢字表記と最
も接続し易いものを選択し、出力する。

具体的には、まず、管理テーブル（８）がクリアされ、
漢字表記等が格納されていない状態であるか否かが判定
され、クリアされている状態であると判明すると、単語
テーブル（５）中の漢字表ξのなかで最も得点の高いも
のを変換結果としてテキストメモリ（７）に出力すると
共に斯る漢字表記、この表記の読み及び品詞情報、上記
漢字表記のテキスト位置（以下、これらをまとめて管理
情報と称す）を管理テーブル（８）に出力し、格納する
。

また、クリア状態でないと判明すると、単語テーブル（
５）中の各漢字表記の品詞と管理テーブル（８）中の最
後尾の漢字表記の品詞とに基づいて文法上の接続可否を
判定し、接続不可能と判定された単語テーブル（５）中
の漢字表記を削除する。次いで、削除されなかった上記
単語テーブル（５）中の漢字表ξ毎に斯る各漢字表記と
管理テーブル（８）中の最後尾の漢字表記とからなる対
が連語辞書（６）中に存在するか否かを判定する。その
結果、単語テーブル（５）中の漢字表記の一つと上ε最
後尾の漢字表記とからなる対が連語辞書（６）中に格納
されている際には、斯る単語テーブル（５）中の漢字表
記を変換結果としてテキストメモリ（７）に出力すると
共に上記漢字表記とその管理情報とを管理テーブル（８
）に出力し、格納する。また、上ξ判定において、上記
最後尾の漢字表記と対をなして連語辞書中に格納されて
いる漢字表記と同一の漢字表記が単語テーブル（５）中
に複数存在する際には、単語テーブル（５）中の上記漢
字表記のなかで最も得点の高いものを変換結果としてテ
キストメモリ（７）に出力すると共に斯る漢字表記とそ
の管理情報とを管理テーブル（８）に出力し、格納する
。更に、上記判定において、単語テーブル（５）中の漢
字表記と管理テーブル（８）中の最後尾の漢字表記とか
らなる対が連語辞書（６）中に存在しないと判明すると
、単語テーブル（５）中の漢字表記のなかで最も得点の
高いものを変換結果としてテキストメモリ（７）に出力
すると共に斯る漢字表記とこの管理情報とを管理テーブ
ル（８）に出力し、格納する。

αＯは候補バッファ、［１１は再変換部であり、該再変
換部は候補検索部（９）から出力された変換結果に基づ
いて既に変換され、テキストメモリ（７）中に格納され
ている漢字表記を再変換する。

具体的には、まず上記変換結果が入力されると斯る変換
結果である漢字表記（以下、単に変換結果と称す）と共
に管理テーブル（８）中に格納された上記変換結果の品
詞情報を読出す。次いで、斯る品詞情報と管理テーブノ
呟８）中に格納された各漢字表記に対応した品詞情報と
を基に、文法上変換結果の修飾語となる漢字表記が管理
テーブル（８）中に存在するか否かを判定する。例えば
、上記変換結果が名詞である場合には、形容詞、形容動
詞等である漢字表２が管理テーブノ喧８）中にあるか否
かを判定する。尚、斯る判定における管理テーブル（８
）中の漢字表ξの検索は、管理テーブル（８）中の最後
尾及びその直前の位置に格納されているものを除くその
他のものが下から順に検索されることとなる。これは、
最後尾に格納されている漢字表記は判定対象となる変換
結果自身であり、またその直ｉ■に格納されている漢字
表記は上記変換結果を得るために候補変換部（９）にお
ける判定で用いられた漢字表記であるためである。

上記判定において、管理テーブル（８）中に修飾語とな
る漢字表記が存在しないと判定すると、再変換部（１１
１はそこで処理を終了する。また、上記判定において、
管理テーブル（８）中に修飾語となる漢字表記が存在す
ると判定すると、上記修飾語となる漢字表記に対応して
管理テーブル（８）に格納された読み及び品詞情報を読
み出すと共に、上記読みに対応し、かつ上記品詞情報と
同一の品詞情報を有する漢字表記を国語辞書（３）より
読出し、候補バッファαＯに格納する。次いで、斯る候
補バッファαＯに格納された各漢字表記と上記変換結果
である漢字表記とからなる対が連語辞書（６）中に存在
するか否かを判定し、存在しないと判定した時には、こ
の時点で処理を終了する。また、上記判定において、存
在すると判定した時には、上記変換結果と対となって連
語辞書（６）中に格納されている漢字表記と同一の漢字
表記（以下、候補表記と称す）を候補バッフアミＯ中よ
り読出し、斯る候補表記を管理テーブル（８）中の上記
修飾語となる漢字表記が格納されていた位置に書込むと
共に、斯る候補表記の書込み位置と対応した管理テーブ
ル（８）中のテキスト位置格納領域からテキスト位置情
報を読出し斯る情報と対応したテキストメモリ（７）中
の位置に上ε候補表記を書込む。更に、上記候補表記の
長さが、管理テーブル（８）中で書替えられる元の漢字
表記の長さと異なる際には、テキストメモリ（７）中に
おいて書替えられる元の漢字表記より後に位置する漢字
表記の位置が挿入・削除等により変更され、かつ斯る変
更に伴なって管理テーブル（８）中のテキスト位置情報
も書替えられる。上記テキストメモリ（７）中への候補
表記の書込みが終ると再変換部（１１１の処理は終了す
る。尚、上記判定において存在すると判定した際に候補
表記が複数存在するときには得点が高いものを候補表記
として選択する。

［１２＋は出力制御部、αりは表示部としてのＣＲＴで
あり、上記出力別ａ部は、テキストメモリ（７）中に格
納された漢字表記をその格納順にＣＲＴ（１：ｉ上に表
゛示する。

次に、斯る本実施例の動作を「あつい」、「くろい」及
び「かべ」という３つの読みが、その順に入力された場
合について説明する。尚、このとき、国語辞書（３）及
び連語辞書（６）の内容は第２図及び第３図に示す如き
であり、かつ管理テーブル（８）及びテキストメモリ（
７）は共にクリアされている状態であるものとする。

斯る状態において、まず、入力部（１）より一単語分の
読み「あつい」が入力され、入力バッファ（２）に格納
されると、かな漢字変換部（４）は上述した如く国語辞
書（３）を検索することにより入力バッファ（２）中の
読みに対応した漢字表記及びその品詞情報を読み出し、
単語テーブル（５）に格納する。

具体的には、今、入力バッフ７（２）には「あつぃ」と
いう読みが格納されているので、かな漢字変換部（４）
は国語辞書（３）より漢字表記「厚い」、「熱い」及び
それらの品詞情報を読出し、出力することとなるが、上
ε読みに対応して２つの漢字表記が存在するので、上記
各漢字表記の夫々の得点を計算し、高得点順に出力する
こととなる。説明の都合上、漢字表記「厚い」の得点よ
り漢字表記「熱い」の得点の方が高いとすると、第４図
１ａＪに示す如く漢字表記「熱い」とその品詞情報が単
語テーブル（５）中の第１行目に格納され、続く第２行
目に漢字表記「厚い」とその品詞情報が格納されること
となる。

単語テーブル（５）中への格納が終了すると候補検京都
（９）において、単語テーブル（５）中の漢字表記の中
から管理テーブル（８）中の最後尾の漢字表記と最も接
続し易いものを選択し、出力するが、今管理テーブル（
８）はクリアされているため、上記接続性の判定を行な
う対象がない。従って、候補検索部（９）は単語テーブ
ル（５）に格納されている漢字表記の中で得点が高い「
熱い」という漢字表記を変換結果としてテキストメモリ
（７）に出力する。従って、テキストメモリ（７）には
第５図１ｂ＋に示す如く、その先頭（１，１）より漢字
表記「熱い」が格納される。また、このとき候補検索部
（９）は上ε漢字表記「熱い」及びその管理情報を管理
テーブル（８）に出力する。従って、管理テーブル（８
）には第６図（ａｌに示す如く、漢字表記「熱い」及び
その管理情報が格納される。

上記管理情報の格納が終了すると、続いて再変換部συ
が上述した如き再変換処理を行なうが、今管理テーブル
（８）内には第６図１ａｌに示す如く１つの漢字表記に
対応した情報しか格納されていないので修飾語となる漢
字表記は存在しないと判定し、処理を終了する。

以上で、読み「あつい」に対する処理は終了する。また
、このとき、単語テープＩ呟５）及び候補バッファαＯ
の内容はクリアされる。

次いで、入力部（１）より読み「くろい」が入力され、
へカバッフ７（２）に格納されると、かな漢字変換部（
４）は上記読みに対応した漢字表記及びその品詞情報を
国語辞ｉ！Ｆ（３）から読み出す。今、第２図より明ら
かな様に、国語辞書（３）中には読み「くろい」に対応
した漢字表記は「黒い」しかないので、単語テーブル（
５）中には第４図（旬に示す如く漢字表記「黒い」及び
この読みと品詞情報が格納される。

斯る格納が終了すると、候補検索部（９）においてまず
上ε単語テーブル（５）中の漢字表記「黒い」と管理テ
ーブル（８）の最後尾の漢字表記「熱い」との文法的な
接続関係が調べられるが、上ε両漢字表記共に形容詞で
あるため、これらは接続可能であることが判明する。従
って、単語テーブル（５）中の漢字表記「黒い」は削除
されない。次いで、上記両漢字表記の意味解釈上の接続
可否を連語辞書（６）を用いて検討するが、単語テーブ
ル（５）中には漢字表記「黒い」しか格納されていない
ため、上ε検討結果に係わりなく、漢字表記「黒い」が
変換結果としてテキストメモリ（７）に出力される。従
って第５図１ｂ＋に示す如くテキストメモリ（７）の位
置（１，３）より「黒い」という漢字表記が格納される
こととなる。また、このとき管理テーブル（８）には漢
字表記「黒い」及びその管理情報が出力される。

従って管理テーブル（８）の内容は第６図（１）ｌに示
す様になる。

上記管理情報の格納が終了すると続いて再変換部（１１
１が再変換処理を行なうが、今管理テーブル（８）内に
は第６図（旬に示す如く２つの漢字表記に対応した情報
しか格納されていないので、修飾語となる漢字表記は存
在しないと判定し、処理を終了する。

以上で、読み「くろい」に対する処理は終了する。また
、このとき、単語テーブル（５）及び候補バッファαＯ
の内容はクリアされる。

次いで、入力部（１）より読み「かべ」が入力され入力
バッファ（２）に格納されると、かな漢字変換部（４）
は上記読みに対応した漢字表記及びその品詞情報を国語
辞書（３）から読み出す。今、第２図より明らかな様に
、国語辞書（３）中には読み「かべ」に対応した漢字表
記は「壁」しかないので、単語テーブル（５）中には第
４図（Ｑｌに示す如く漢字表記「壁」及びこの読みと品
詞情報が格納される。

斯る格納が終了すると、候補検索部（９）においてまず
、上記単語テーブル（５）中の漢字表記「壁」と管理テ
ーブル（８）の最後尾の漢字表記「黒い」との文法的な
接続関係が調べられるが、上記両漢字表記は夫々名詞及
び形容詞であるため、これらは接続可能であることが判
明する。従って、単語テーブル（５）中の漢字表記「壁
」は削除されない。次いで、上記両漢字表記の意味解釈
上の接続可否を連語辞書（６）を用いて検索するが、第
３図より明らかな如く、上記辞書（６）中には漢字表記
「黒い」と漢字表記「壁」とが対となって格納されてい
るため上記単語テーブル（５）中の漢字表記「壁」が変
換結果としてテキストメモリ（７）に出力されることと
なる。従って、１６５図（Ｃ）に示す如くテキストメモ
リ（７）の位置（１，５）に「壁」という漢字表記が格
納されることとなる。また、このとき管理テーブル（８
）には漢字表記「壁」及びその管理情報が出力されるの
で、管理テーブル（８）の内容は第６図（Ｃ１に示す様
になる。

上記管理情報の格納が終了すると、再変換部０Ｄが再変
換処理を行なうが、今管理テーブル（８）内には第６図
（Ｃ）に示す如く３つの漢字表記に対応した情報が格納
されているので、一番先頭に格納された漢字表記「熱い
」の情報に基づいて上記変換結果「壁」の修飾語となる
か否かを判定する。このとき、変換結果「壁」の品詞種
別は名詞であり、また管理テーブル（８）中の先頭に格
納されている品詞情報は形容詞であるため、文法上、上
記漢字表記ｒ熱い」は上記変換結果「壁」の修飾語とな
り得ることが判明する。そこで、再変換部Ｃ１１ｌは管
理テーブル（８）中で漢字表記「熱い」に対応して格納
されている読み「ありい」の同音異義語で、かつ漢字表
記「熱い」と同様に形容詞であるものを国語辞書（３）
より読出し、候補バッファα０に格納する口従って、候
補バッファαＯには漢字表記「厚い」と「熱い」とが格
納されることとなる。次いで、斯る候補バッファ（９）
に格納された各漢字表記と上記変換結果「壁」とからな
る対が連語辞書（６）中に存在するか否かを判定するが
、第３図より明らかな如く、「厚い」と「壁」とからな
る対は上記辞書（６）に存在するものの「熱い」と「壁
」とからなる対は存在しない。従って、再変換部口りは
管理テーブル（８）中の漢字表記「熱い」に替えて、漢
字表記「厚い」を格納すると共に、上記漢字表記「熱い
」に対応して管理テーブル（８）中に格納されているテ
キスト位量情報で示されるテキストメモリ（７）中の位
置（１，１）より漢字表記「厚い」を書込む。

従って、管理テーブル（８）及びテキストメモリ（７）
の内容は夫々第６図（■及び第５図（ｄＪに示す如く変
更されることとなる。尚、このとき、漢字表記「熱い」
と「厚い」とはその長さが共に２語と等しいため、上記
「厚い」のテキストメモリ（７）への書込み時、挿入、
削除等の処理が不要となり、従って管理テーブル（８）
中のテキスト位置の変更も不要となる。

以上のように、本実施例では「厚い黒い壁」という文を
作成するために、「あつい」「くろい」「かべ」と入力
した際、まず「あつい」という読みが読み「かべＪＩＪ
ｄする漢字表記「壁」に対して意味解釈上適切でない「
熱い」という漢字表記に変換されたとしても、「かべ」
という読みが入力されることにより所る読み「かべ」に
対応した漢字表記「壁」に対して意味解釈上適切な「厚
い」という漢字表記に再変換されることとなる。

尚、本実施例では、入力部（１）からの読み入力を単語
単位で行なう様に構成したが、入力部（１）から複数の
単語に対する読みを連続的に入力させ、周知の最長一致
法等を用いて入力された読みを単語単位に分割し、入力
バッファ（２）に入力するように構成しても良い。

また、修飾四係にある複数の単語は句点で区切られる２
つの文章にまたがって存在することは決してないので、
管理テーブル（８）の内容は句点が入力された時点でク
リアすることが好ましい。

更に、本実施例では連語辞書（６）を漢字表記の対で構
成したが、例えば漢字表記を複数のカテゴリに分類し、
斯るカテゴリ毎に意味解釈上の接続可否を示すテーブル
として構成したが、例えば漢字表記を複数のカテゴリに
分類し、斯るカテゴリ毎に意味解釈上の接続可否を示す
テーブルとして構成しても良い。

（ト）発明の効果本発明によれば、離間した単語間の意味解釈上の接続可
否を判定し、正しい変換結果を得ることができる。

【図面の簡単な説明】

第１図乃至第６図は本発明の実施例を示し、第１図は本
実施例の全体を示すブロック図、第２図は国語辞書の内
容を示す模式図、第３図は連語辞書の内容を示す模式図
、第４図ｔａｌ〜（Ｃｉｌは単語テーブルの内容を示す
模式図、第５図（ａｌ〜（ｄｌはテキストメモリの内容
を示す模式図、第６図四〜（ｄＪは管理テーブルの内容
を示す模式図である。（３）・・・国語辞書、（４）・・・かな漢字変換部、
（６）・・・連語辞書、（７）・・・テキストメモリ、
（８）・・・管理テーブル、（９）・・・候補検索部、
αＯ・・・再変換部。

Claims

【特許請求の範囲】

（１）読み入力を、文法的解析及び意味的解析を用いて
漢字表記に変換するための装置であって、単語単位の読
みに対応して漢字表記が格納された国語辞書と、意味解
釈上接続が可能な漢字表記同士を対にして格納された連
語辞書と、上記国語辞書と連語辞書とを用いて上記読み
入力を漢字表記に変換する手段と、該手段より出力され
た変換結果をその出力順に格納するテキストメモリと、
上記変換手段より出力された変換結果及び斯る結果のテ
キストメモリ中での格納位置が格納される管理テーブル
と、該テーブル中に既に格納されている漢字表記の中か
ら新たに上記変換手段で変換された漢字表記を修飾可能
なものを検索し、斯る修飾可能な漢字表記と同音異義語
である漢字表記を上記国語辞書より読出すと共に上記連
語辞書を用いて上記読出しにより得られた漢字表記の中
から上記新たに変換された漢字表記と意味解釈上最も接
続性が高いと判断される漢字表記を選出し、その後上記
修飾可能な漢字表記に対応して管理テーブル中に格納さ
れた位置情報に基づいて上記選出された漢字表記を上記
テキストメモリに書込む手段とを備えたことを特徴とす
るかな漢字変換装置。