JPH01181154A - かな漢字変換装置 - Google Patents
かな漢字変換装置Info
- Publication number
- JPH01181154A JPH01181154A JP63006354A JP635488A JPH01181154A JP H01181154 A JPH01181154 A JP H01181154A JP 63006354 A JP63006354 A JP 63006354A JP 635488 A JP635488 A JP 635488A JP H01181154 A JPH01181154 A JP H01181154A
- Authority
- JP
- Japan
- Prior art keywords
- kanji
- kanji notation
- notation
- stored
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 240000000220 Panda oleosa Species 0.000 title abstract description 3
- 235000016496 Panda oleosa Nutrition 0.000 title abstract description 3
- 238000006243 chemical reaction Methods 0.000 claims abstract description 61
- 238000004458 analytical method Methods 0.000 claims description 11
- 102100039445 Cortexin-3 Human genes 0.000 abstract 4
- 101100061721 Homo sapiens CTXN3 gene Proteins 0.000 abstract 4
- 238000000034 method Methods 0.000 description 11
- 239000003607 modifier Substances 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(イ) 産業上の利用分野
本発明はかな漢字変換装置に関する。
(ロ)従来の技術
従来のかな漢字変換では、入力された読みを単語単位に
分割し、斯る単語単位に分割された読み毎に対応する漢
字を国語辞書から抽出すると共に斯る抽出単語の品詞、
使用頻度等の文法情報に基づいて接続関係の最適なもの
を選択し、かな漢字混り文として出力する方法が一般的
であった。
分割し、斯る単語単位に分割された読み毎に対応する漢
字を国語辞書から抽出すると共に斯る抽出単語の品詞、
使用頻度等の文法情報に基づいて接続関係の最適なもの
を選択し、かな漢字混り文として出力する方法が一般的
であった。
然るに、上記方法では接続関係を品詞、使用頻度等の文
法情報だけで判断していたため、文法上は正しい変換が
行なわれるものの、意味解釈の点からは全く無意味な変
換結果となってしまうことが頻繁に生じていた。
法情報だけで判断していたため、文法上は正しい変換が
行なわれるものの、意味解釈の点からは全く無意味な変
換結果となってしまうことが頻繁に生じていた。
例えば、読み入力として「がいとうえんぜっ」を入力し
た場合、「外燈演説」というような変換結果が生じる。
た場合、「外燈演説」というような変換結果が生じる。
斯る結果は文法上誤変換ではないが、意味解釈の点から
は明らかに誤変換と言わざるを得ない。
は明らかに誤変換と言わざるを得ない。
そこで、従来の文法的解析に加えて意味的解析を用いる
ことにより意味解釈上の点からも正しい変換が行なえる
方法が提案された(情報処理学会論文誌Vo#、27
No、11 NOV、1986)。
ことにより意味解釈上の点からも正しい変換が行なえる
方法が提案された(情報処理学会論文誌Vo#、27
No、11 NOV、1986)。
斯る方法は一般に連語解析と呼ばれる方法であって、具
体的には、任意の単語同士か意味解釈上接続が可能か否
かを判断するための連語辞書もしくはテーブルを有し、
斯る辞書もしくはテーブルを用いて最適な接続関係を判
断し変換を行なうものである。
体的には、任意の単語同士か意味解釈上接続が可能か否
かを判断するための連語辞書もしくはテーブルを有し、
斯る辞書もしくはテーブルを用いて最適な接続関係を判
断し変換を行なうものである。
即ち、今、「あかいはし」という読みが入力されたとす
ると、斯る読みは文法解析上「あかい」という単語と「
はし」という単語とに分解され、各文節に対して夫々国
語辞書より変換候補として「赤い」及び「橋、箸、端」
が抽出される。またこのとき、当然「赤い橋」及び「赤
い箸」という連語は意味解釈上からも、接続可能である
ので連語辞書には「赤い」という単語と「橋」もしくは
「箸」という単語とは接続可能である旨の情報は格納さ
れるものの、一般に「赤い」と「端」との接続は意味解
釈上適切ではないため連語辞書中には後続可能である旨
の情報は格納されない。従って、「あかいはし」という
読みに対しては「赤い橋」もしくは「赤い箸」が漫先的
に出力されることとなる。
ると、斯る読みは文法解析上「あかい」という単語と「
はし」という単語とに分解され、各文節に対して夫々国
語辞書より変換候補として「赤い」及び「橋、箸、端」
が抽出される。またこのとき、当然「赤い橋」及び「赤
い箸」という連語は意味解釈上からも、接続可能である
ので連語辞書には「赤い」という単語と「橋」もしくは
「箸」という単語とは接続可能である旨の情報は格納さ
れるものの、一般に「赤い」と「端」との接続は意味解
釈上適切ではないため連語辞書中には後続可能である旨
の情報は格納されない。従って、「あかいはし」という
読みに対しては「赤い橋」もしくは「赤い箸」が漫先的
に出力されることとなる。
(ハ)発明が解決しようとする課題
また、上記公知文献には、上述した如く隣接する文m間
だけではなく、「赤い秋の花」の様に「赤い」と「花」
とのように離間した単語間の意味解釈上の接続可否を判
定し、正しい変換を行なうことが提案されている。
だけではなく、「赤い秋の花」の様に「赤い」と「花」
とのように離間した単語間の意味解釈上の接続可否を判
定し、正しい変換を行なうことが提案されている。
然るに、従来は斯る方法を実現するための具体的装置が
なかった。
なかった。
に)課題を解決するための手段
本発明は斯る点に鑑みてなされたもので、その構成的特
徴は、読み入力を文法的解析及び意味的解析を用いて漢
字表記に変換するための装置であって、単語単位の読み
に対応して漢字表記が格納された国語辞書と、意味解釈
上接続が可能な漢字表記同士を対にして格納された連語
辞書と、上記国語辞書と連語辞書とを用いて上記読み入
力を漢字表記に変換する手段と、該手段より出力された
変換結果をその出力順に格納するテキストメモリと、上
記変換手段より出力された又換結果及び斯る結果のテキ
ストメモリ中での格納位置が格納される管理テーブルと
、該テーブル中に既に格納されている漢字表2の中から
新たに上記変換手段で変換された漢字表記を修飾可能な
ものを検索し斯る修飾可能な漢字表記と同音異義語であ
る漢字表記を上記国語辞書より読出すと共に上記連語辞
書を用いて上記読出しにより得られた漢字表記の中から
上記新たに変換された漢字表記と意味解釈上段も接続性
が高いと判断される漢字表記を選出し、その後上記修飾
可能な漢字表記に対応して管理テーブル中に格納された
位置情報に基づいて上ε選出された漢字表記を上記テキ
ストメモリに書込む手段とを備えたことにある。
徴は、読み入力を文法的解析及び意味的解析を用いて漢
字表記に変換するための装置であって、単語単位の読み
に対応して漢字表記が格納された国語辞書と、意味解釈
上接続が可能な漢字表記同士を対にして格納された連語
辞書と、上記国語辞書と連語辞書とを用いて上記読み入
力を漢字表記に変換する手段と、該手段より出力された
変換結果をその出力順に格納するテキストメモリと、上
記変換手段より出力された又換結果及び斯る結果のテキ
ストメモリ中での格納位置が格納される管理テーブルと
、該テーブル中に既に格納されている漢字表2の中から
新たに上記変換手段で変換された漢字表記を修飾可能な
ものを検索し斯る修飾可能な漢字表記と同音異義語であ
る漢字表記を上記国語辞書より読出すと共に上記連語辞
書を用いて上記読出しにより得られた漢字表記の中から
上記新たに変換された漢字表記と意味解釈上段も接続性
が高いと判断される漢字表記を選出し、その後上記修飾
可能な漢字表記に対応して管理テーブル中に格納された
位置情報に基づいて上ε選出された漢字表記を上記テキ
ストメモリに書込む手段とを備えたことにある。
し羽咋 用
斯る装置では、テキストメモリ中に格納済の漢字表記が
その漢字表記毎に管理テーブルに格納されているので、
斯る管理テーブルを検索することにより、新たに変換し
得られた漢字表記に対して修飾可能な既変換済の漢字表
記を得ることができる。
その漢字表記毎に管理テーブルに格納されているので、
斯る管理テーブルを検索することにより、新たに変換し
得られた漢字表記に対して修飾可能な既変換済の漢字表
記を得ることができる。
(へ)実施例
第1図は、本発明の実施例を示し、(1)は例えばキー
ボードからなる入力部であり、該入力部からかな漢字′
g、換されるべき読みが入力される。(2)は入力バッ
ファであり、該入力バッファに一入方部(1)より入力
された一単語分の読みが格納される。
ボードからなる入力部であり、該入力部からかな漢字′
g、換されるべき読みが入力される。(2)は入力バッ
ファであり、該入力バッファに一入方部(1)より入力
された一単語分の読みが格納される。
(3)は国語辞書であり、該辞書には第2図に示す如く
単語単位の読みに対応して、その漢字表記(かな漢字混
り表記も含む)品詞及び使用頻度等の情報が格納される
。(4)はかな漢字変換部であり、該変換部は入力バッ
ファ(2)中の一単語分の読みに対応した漢字表記及び
これに付随する品詞、使用頻度等の情報を国語辞書から
読み出す。このとき、上記単語の読みに対して複数の漢
字表記(同音異義語)が存在するときには上記品詞、使
用頻度等の情報に基づいて各漢字表記の得点を計算し、
その得点の大きい順に上記漢字表記その読み及び品詞を
出力する。尚、上記得点計算とは予め品詞の種類及び使
用頻度によって得点を付けておき、斯る得点合計を計算
するものである。
単語単位の読みに対応して、その漢字表記(かな漢字混
り表記も含む)品詞及び使用頻度等の情報が格納される
。(4)はかな漢字変換部であり、該変換部は入力バッ
ファ(2)中の一単語分の読みに対応した漢字表記及び
これに付随する品詞、使用頻度等の情報を国語辞書から
読み出す。このとき、上記単語の読みに対して複数の漢
字表記(同音異義語)が存在するときには上記品詞、使
用頻度等の情報に基づいて各漢字表記の得点を計算し、
その得点の大きい順に上記漢字表記その読み及び品詞を
出力する。尚、上記得点計算とは予め品詞の種類及び使
用頻度によって得点を付けておき、斯る得点合計を計算
するものである。
(5)は単語テーブルであり、該テーブルにはかな漢字
変換部(4)より出力された漢字表記等がその出力順に
格納される。(6)は連語辞書であり、該辞書には意味
解釈上において接続可能である単語同士の漢字表記が一
対となって格納されている。(7)はテキストメモリで
あり、該メモリには入力部(1)より入力された読みを
変換処理することにより得られた変換結果を逐次格納す
る。(8)は管理テーブルであり、該テーブルにはテキ
ストメモリ(7)に逐次格納された変換結果と同一の漢
字表記を斯る表記の読み、その品詞情報及びその表記の
テキストメモリ(7)上での格納位置(以下テキスト位
置と称す)と共に上記テキストメモリ中への格納順に格
納する。
変換部(4)より出力された漢字表記等がその出力順に
格納される。(6)は連語辞書であり、該辞書には意味
解釈上において接続可能である単語同士の漢字表記が一
対となって格納されている。(7)はテキストメモリで
あり、該メモリには入力部(1)より入力された読みを
変換処理することにより得られた変換結果を逐次格納す
る。(8)は管理テーブルであり、該テーブルにはテキ
ストメモリ(7)に逐次格納された変換結果と同一の漢
字表記を斯る表記の読み、その品詞情報及びその表記の
テキストメモリ(7)上での格納位置(以下テキスト位
置と称す)と共に上記テキストメモリ中への格納順に格
納する。
(9)は候補検索部であり、該検索部は、まず、単語テ
ーブル(5)に格納された各漢字表記と管理テーブル(
8)中に最も近い時点で格納された漢字表記(以下、最
後尾の漢字表記と称す)とについて夫々の品詞情報に基
づく文法解析及び連語辞書(6)を用いての意味解析を
行ない単語テーブル(5)中に格納された漢字表記の中
で、上記管理テーブル(8)中の最後尾の漢字表記と最
も接続し易いものを選択し、出力する。
ーブル(5)に格納された各漢字表記と管理テーブル(
8)中に最も近い時点で格納された漢字表記(以下、最
後尾の漢字表記と称す)とについて夫々の品詞情報に基
づく文法解析及び連語辞書(6)を用いての意味解析を
行ない単語テーブル(5)中に格納された漢字表記の中
で、上記管理テーブル(8)中の最後尾の漢字表記と最
も接続し易いものを選択し、出力する。
具体的には、まず、管理テーブル(8)がクリアされ、
漢字表記等が格納されていない状態であるか否かが判定
され、クリアされている状態であると判明すると、単語
テーブル(5)中の漢字表ξのなかで最も得点の高いも
のを変換結果としてテキストメモリ(7)に出力すると
共に斯る漢字表記、この表記の読み及び品詞情報、上記
漢字表記のテキスト位置(以下、これらをまとめて管理
情報と称す)を管理テーブル(8)に出力し、格納する
。
漢字表記等が格納されていない状態であるか否かが判定
され、クリアされている状態であると判明すると、単語
テーブル(5)中の漢字表ξのなかで最も得点の高いも
のを変換結果としてテキストメモリ(7)に出力すると
共に斯る漢字表記、この表記の読み及び品詞情報、上記
漢字表記のテキスト位置(以下、これらをまとめて管理
情報と称す)を管理テーブル(8)に出力し、格納する
。
また、クリア状態でないと判明すると、単語テーブル(
5)中の各漢字表記の品詞と管理テーブル(8)中の最
後尾の漢字表記の品詞とに基づいて文法上の接続可否を
判定し、接続不可能と判定された単語テーブル(5)中
の漢字表記を削除する。次いで、削除されなかった上記
単語テーブル(5)中の漢字表ξ毎に斯る各漢字表記と
管理テーブル(8)中の最後尾の漢字表記とからなる対
が連語辞書(6)中に存在するか否かを判定する。その
結果、単語テーブル(5)中の漢字表記の一つと上ε最
後尾の漢字表記とからなる対が連語辞書(6)中に格納
されている際には、斯る単語テーブル(5)中の漢字表
記を変換結果としてテキストメモリ(7)に出力すると
共に上記漢字表記とその管理情報とを管理テーブル(8
)に出力し、格納する。また、上ξ判定において、上記
最後尾の漢字表記と対をなして連語辞書中に格納されて
いる漢字表記と同一の漢字表記が単語テーブル(5)中
に複数存在する際には、単語テーブル(5)中の上記漢
字表記のなかで最も得点の高いものを変換結果としてテ
キストメモリ(7)に出力すると共に斯る漢字表記とそ
の管理情報とを管理テーブル(8)に出力し、格納する
。更に、上記判定において、単語テーブル(5)中の漢
字表記と管理テーブル(8)中の最後尾の漢字表記とか
らなる対が連語辞書(6)中に存在しないと判明すると
、単語テーブル(5)中の漢字表記のなかで最も得点の
高いものを変換結果としてテキストメモリ(7)に出力
すると共に斯る漢字表記とこの管理情報とを管理テーブ
ル(8)に出力し、格納する。
5)中の各漢字表記の品詞と管理テーブル(8)中の最
後尾の漢字表記の品詞とに基づいて文法上の接続可否を
判定し、接続不可能と判定された単語テーブル(5)中
の漢字表記を削除する。次いで、削除されなかった上記
単語テーブル(5)中の漢字表ξ毎に斯る各漢字表記と
管理テーブル(8)中の最後尾の漢字表記とからなる対
が連語辞書(6)中に存在するか否かを判定する。その
結果、単語テーブル(5)中の漢字表記の一つと上ε最
後尾の漢字表記とからなる対が連語辞書(6)中に格納
されている際には、斯る単語テーブル(5)中の漢字表
記を変換結果としてテキストメモリ(7)に出力すると
共に上記漢字表記とその管理情報とを管理テーブル(8
)に出力し、格納する。また、上ξ判定において、上記
最後尾の漢字表記と対をなして連語辞書中に格納されて
いる漢字表記と同一の漢字表記が単語テーブル(5)中
に複数存在する際には、単語テーブル(5)中の上記漢
字表記のなかで最も得点の高いものを変換結果としてテ
キストメモリ(7)に出力すると共に斯る漢字表記とそ
の管理情報とを管理テーブル(8)に出力し、格納する
。更に、上記判定において、単語テーブル(5)中の漢
字表記と管理テーブル(8)中の最後尾の漢字表記とか
らなる対が連語辞書(6)中に存在しないと判明すると
、単語テーブル(5)中の漢字表記のなかで最も得点の
高いものを変換結果としてテキストメモリ(7)に出力
すると共に斯る漢字表記とこの管理情報とを管理テーブ
ル(8)に出力し、格納する。
αOは候補バッファ、[11は再変換部であり、該再変
換部は候補検索部(9)から出力された変換結果に基づ
いて既に変換され、テキストメモリ(7)中に格納され
ている漢字表記を再変換する。
換部は候補検索部(9)から出力された変換結果に基づ
いて既に変換され、テキストメモリ(7)中に格納され
ている漢字表記を再変換する。
具体的には、まず上記変換結果が入力されると斯る変換
結果である漢字表記(以下、単に変換結果と称す)と共
に管理テーブル(8)中に格納された上記変換結果の品
詞情報を読出す。次いで、斯る品詞情報と管理テーブノ
呟8)中に格納された各漢字表記に対応した品詞情報と
を基に、文法上変換結果の修飾語となる漢字表記が管理
テーブル(8)中に存在するか否かを判定する。例えば
、上記変換結果が名詞である場合には、形容詞、形容動
詞等である漢字表2が管理テーブノ喧8)中にあるか否
かを判定する。尚、斯る判定における管理テーブル(8
)中の漢字表ξの検索は、管理テーブル(8)中の最後
尾及びその直前の位置に格納されているものを除くその
他のものが下から順に検索されることとなる。これは、
最後尾に格納されている漢字表記は判定対象となる変換
結果自身であり、またその直i■に格納されている漢字
表記は上記変換結果を得るために候補変換部(9)にお
ける判定で用いられた漢字表記であるためである。
結果である漢字表記(以下、単に変換結果と称す)と共
に管理テーブル(8)中に格納された上記変換結果の品
詞情報を読出す。次いで、斯る品詞情報と管理テーブノ
呟8)中に格納された各漢字表記に対応した品詞情報と
を基に、文法上変換結果の修飾語となる漢字表記が管理
テーブル(8)中に存在するか否かを判定する。例えば
、上記変換結果が名詞である場合には、形容詞、形容動
詞等である漢字表2が管理テーブノ喧8)中にあるか否
かを判定する。尚、斯る判定における管理テーブル(8
)中の漢字表ξの検索は、管理テーブル(8)中の最後
尾及びその直前の位置に格納されているものを除くその
他のものが下から順に検索されることとなる。これは、
最後尾に格納されている漢字表記は判定対象となる変換
結果自身であり、またその直i■に格納されている漢字
表記は上記変換結果を得るために候補変換部(9)にお
ける判定で用いられた漢字表記であるためである。
上記判定において、管理テーブル(8)中に修飾語とな
る漢字表記が存在しないと判定すると、再変換部(11
1はそこで処理を終了する。また、上記判定において、
管理テーブル(8)中に修飾語となる漢字表記が存在す
ると判定すると、上記修飾語となる漢字表記に対応して
管理テーブル(8)に格納された読み及び品詞情報を読
み出すと共に、上記読みに対応し、かつ上記品詞情報と
同一の品詞情報を有する漢字表記を国語辞書(3)より
読出し、候補バッファαOに格納する。次いで、斯る候
補バッファαOに格納された各漢字表記と上記変換結果
である漢字表記とからなる対が連語辞書(6)中に存在
するか否かを判定し、存在しないと判定した時には、こ
の時点で処理を終了する。また、上記判定において、存
在すると判定した時には、上記変換結果と対となって連
語辞書(6)中に格納されている漢字表記と同一の漢字
表記(以下、候補表記と称す)を候補バッフアミO中よ
り読出し、斯る候補表記を管理テーブル(8)中の上記
修飾語となる漢字表記が格納されていた位置に書込むと
共に、斯る候補表記の書込み位置と対応した管理テーブ
ル(8)中のテキスト位置格納領域からテキスト位置情
報を読出し斯る情報と対応したテキストメモリ(7)中
の位置に上ε候補表記を書込む。更に、上記候補表記の
長さが、管理テーブル(8)中で書替えられる元の漢字
表記の長さと異なる際には、テキストメモリ(7)中に
おいて書替えられる元の漢字表記より後に位置する漢字
表記の位置が挿入・削除等により変更され、かつ斯る変
更に伴なって管理テーブル(8)中のテキスト位置情報
も書替えられる。上記テキストメモリ(7)中への候補
表記の書込みが終ると再変換部(111の処理は終了す
る。尚、上記判定において存在すると判定した際に候補
表記が複数存在するときには得点が高いものを候補表記
として選択する。
る漢字表記が存在しないと判定すると、再変換部(11
1はそこで処理を終了する。また、上記判定において、
管理テーブル(8)中に修飾語となる漢字表記が存在す
ると判定すると、上記修飾語となる漢字表記に対応して
管理テーブル(8)に格納された読み及び品詞情報を読
み出すと共に、上記読みに対応し、かつ上記品詞情報と
同一の品詞情報を有する漢字表記を国語辞書(3)より
読出し、候補バッファαOに格納する。次いで、斯る候
補バッファαOに格納された各漢字表記と上記変換結果
である漢字表記とからなる対が連語辞書(6)中に存在
するか否かを判定し、存在しないと判定した時には、こ
の時点で処理を終了する。また、上記判定において、存
在すると判定した時には、上記変換結果と対となって連
語辞書(6)中に格納されている漢字表記と同一の漢字
表記(以下、候補表記と称す)を候補バッフアミO中よ
り読出し、斯る候補表記を管理テーブル(8)中の上記
修飾語となる漢字表記が格納されていた位置に書込むと
共に、斯る候補表記の書込み位置と対応した管理テーブ
ル(8)中のテキスト位置格納領域からテキスト位置情
報を読出し斯る情報と対応したテキストメモリ(7)中
の位置に上ε候補表記を書込む。更に、上記候補表記の
長さが、管理テーブル(8)中で書替えられる元の漢字
表記の長さと異なる際には、テキストメモリ(7)中に
おいて書替えられる元の漢字表記より後に位置する漢字
表記の位置が挿入・削除等により変更され、かつ斯る変
更に伴なって管理テーブル(8)中のテキスト位置情報
も書替えられる。上記テキストメモリ(7)中への候補
表記の書込みが終ると再変換部(111の処理は終了す
る。尚、上記判定において存在すると判定した際に候補
表記が複数存在するときには得点が高いものを候補表記
として選択する。
[12+は出力制御部、αりは表示部としてのCRTで
あり、上記出力別a部は、テキストメモリ(7)中に格
納された漢字表記をその格納順にCRT(1:i上に表
゛示する。
あり、上記出力別a部は、テキストメモリ(7)中に格
納された漢字表記をその格納順にCRT(1:i上に表
゛示する。
次に、斯る本実施例の動作を「あつい」、「くろい」及
び「かべ」という3つの読みが、その順に入力された場
合について説明する。尚、このとき、国語辞書(3)及
び連語辞書(6)の内容は第2図及び第3図に示す如き
であり、かつ管理テーブル(8)及びテキストメモリ(
7)は共にクリアされている状態であるものとする。
び「かべ」という3つの読みが、その順に入力された場
合について説明する。尚、このとき、国語辞書(3)及
び連語辞書(6)の内容は第2図及び第3図に示す如き
であり、かつ管理テーブル(8)及びテキストメモリ(
7)は共にクリアされている状態であるものとする。
斯る状態において、まず、入力部(1)より一単語分の
読み「あつい」が入力され、入力バッファ(2)に格納
されると、かな漢字変換部(4)は上述した如く国語辞
書(3)を検索することにより入力バッファ(2)中の
読みに対応した漢字表記及びその品詞情報を読み出し、
単語テーブル(5)に格納する。
読み「あつい」が入力され、入力バッファ(2)に格納
されると、かな漢字変換部(4)は上述した如く国語辞
書(3)を検索することにより入力バッファ(2)中の
読みに対応した漢字表記及びその品詞情報を読み出し、
単語テーブル(5)に格納する。
具体的には、今、入力バッフ7(2)には「あつぃ」と
いう読みが格納されているので、かな漢字変換部(4)
は国語辞書(3)より漢字表記「厚い」、「熱い」及び
それらの品詞情報を読出し、出力することとなるが、上
ε読みに対応して2つの漢字表記が存在するので、上記
各漢字表記の夫々の得点を計算し、高得点順に出力する
こととなる。説明の都合上、漢字表記「厚い」の得点よ
り漢字表記「熱い」の得点の方が高いとすると、第4図
1aJに示す如く漢字表記「熱い」とその品詞情報が単
語テーブル(5)中の第1行目に格納され、続く第2行
目に漢字表記「厚い」とその品詞情報が格納されること
となる。
いう読みが格納されているので、かな漢字変換部(4)
は国語辞書(3)より漢字表記「厚い」、「熱い」及び
それらの品詞情報を読出し、出力することとなるが、上
ε読みに対応して2つの漢字表記が存在するので、上記
各漢字表記の夫々の得点を計算し、高得点順に出力する
こととなる。説明の都合上、漢字表記「厚い」の得点よ
り漢字表記「熱い」の得点の方が高いとすると、第4図
1aJに示す如く漢字表記「熱い」とその品詞情報が単
語テーブル(5)中の第1行目に格納され、続く第2行
目に漢字表記「厚い」とその品詞情報が格納されること
となる。
単語テーブル(5)中への格納が終了すると候補検京都
(9)において、単語テーブル(5)中の漢字表記の中
から管理テーブル(8)中の最後尾の漢字表記と最も接
続し易いものを選択し、出力するが、今管理テーブル(
8)はクリアされているため、上記接続性の判定を行な
う対象がない。従って、候補検索部(9)は単語テーブ
ル(5)に格納されている漢字表記の中で得点が高い「
熱い」という漢字表記を変換結果としてテキストメモリ
(7)に出力する。従って、テキストメモリ(7)には
第5図1b+に示す如く、その先頭(1,1)より漢字
表記「熱い」が格納される。また、このとき候補検索部
(9)は上ε漢字表記「熱い」及びその管理情報を管理
テーブル(8)に出力する。従って、管理テーブル(8
)には第6図(alに示す如く、漢字表記「熱い」及び
その管理情報が格納される。
(9)において、単語テーブル(5)中の漢字表記の中
から管理テーブル(8)中の最後尾の漢字表記と最も接
続し易いものを選択し、出力するが、今管理テーブル(
8)はクリアされているため、上記接続性の判定を行な
う対象がない。従って、候補検索部(9)は単語テーブ
ル(5)に格納されている漢字表記の中で得点が高い「
熱い」という漢字表記を変換結果としてテキストメモリ
(7)に出力する。従って、テキストメモリ(7)には
第5図1b+に示す如く、その先頭(1,1)より漢字
表記「熱い」が格納される。また、このとき候補検索部
(9)は上ε漢字表記「熱い」及びその管理情報を管理
テーブル(8)に出力する。従って、管理テーブル(8
)には第6図(alに示す如く、漢字表記「熱い」及び
その管理情報が格納される。
上記管理情報の格納が終了すると、続いて再変換部συ
が上述した如き再変換処理を行なうが、今管理テーブル
(8)内には第6図1alに示す如く1つの漢字表記に
対応した情報しか格納されていないので修飾語となる漢
字表記は存在しないと判定し、処理を終了する。
が上述した如き再変換処理を行なうが、今管理テーブル
(8)内には第6図1alに示す如く1つの漢字表記に
対応した情報しか格納されていないので修飾語となる漢
字表記は存在しないと判定し、処理を終了する。
以上で、読み「あつい」に対する処理は終了する。また
、このとき、単語テープI呟5)及び候補バッファαO
の内容はクリアされる。
、このとき、単語テープI呟5)及び候補バッファαO
の内容はクリアされる。
次いで、入力部(1)より読み「くろい」が入力され、
へカバッフ7(2)に格納されると、かな漢字変換部(
4)は上記読みに対応した漢字表記及びその品詞情報を
国語辞i!F(3)から読み出す。今、第2図より明ら
かな様に、国語辞書(3)中には読み「くろい」に対応
した漢字表記は「黒い」しかないので、単語テーブル(
5)中には第4図(旬に示す如く漢字表記「黒い」及び
この読みと品詞情報が格納される。
へカバッフ7(2)に格納されると、かな漢字変換部(
4)は上記読みに対応した漢字表記及びその品詞情報を
国語辞i!F(3)から読み出す。今、第2図より明ら
かな様に、国語辞書(3)中には読み「くろい」に対応
した漢字表記は「黒い」しかないので、単語テーブル(
5)中には第4図(旬に示す如く漢字表記「黒い」及び
この読みと品詞情報が格納される。
斯る格納が終了すると、候補検索部(9)においてまず
上ε単語テーブル(5)中の漢字表記「黒い」と管理テ
ーブル(8)の最後尾の漢字表記「熱い」との文法的な
接続関係が調べられるが、上ε両漢字表記共に形容詞で
あるため、これらは接続可能であることが判明する。従
って、単語テーブル(5)中の漢字表記「黒い」は削除
されない。次いで、上記両漢字表記の意味解釈上の接続
可否を連語辞書(6)を用いて検討するが、単語テーブ
ル(5)中には漢字表記「黒い」しか格納されていない
ため、上ε検討結果に係わりなく、漢字表記「黒い」が
変換結果としてテキストメモリ(7)に出力される。従
って第5図1b+に示す如くテキストメモリ(7)の位
置(1,3)より「黒い」という漢字表記が格納される
こととなる。また、このとき管理テーブル(8)には漢
字表記「黒い」及びその管理情報が出力される。
上ε単語テーブル(5)中の漢字表記「黒い」と管理テ
ーブル(8)の最後尾の漢字表記「熱い」との文法的な
接続関係が調べられるが、上ε両漢字表記共に形容詞で
あるため、これらは接続可能であることが判明する。従
って、単語テーブル(5)中の漢字表記「黒い」は削除
されない。次いで、上記両漢字表記の意味解釈上の接続
可否を連語辞書(6)を用いて検討するが、単語テーブ
ル(5)中には漢字表記「黒い」しか格納されていない
ため、上ε検討結果に係わりなく、漢字表記「黒い」が
変換結果としてテキストメモリ(7)に出力される。従
って第5図1b+に示す如くテキストメモリ(7)の位
置(1,3)より「黒い」という漢字表記が格納される
こととなる。また、このとき管理テーブル(8)には漢
字表記「黒い」及びその管理情報が出力される。
従って管理テーブル(8)の内容は第6図(1)lに示
す様になる。
す様になる。
上記管理情報の格納が終了すると続いて再変換部(11
1が再変換処理を行なうが、今管理テーブル(8)内に
は第6図(旬に示す如く2つの漢字表記に対応した情報
しか格納されていないので、修飾語となる漢字表記は存
在しないと判定し、処理を終了する。
1が再変換処理を行なうが、今管理テーブル(8)内に
は第6図(旬に示す如く2つの漢字表記に対応した情報
しか格納されていないので、修飾語となる漢字表記は存
在しないと判定し、処理を終了する。
以上で、読み「くろい」に対する処理は終了する。また
、このとき、単語テーブル(5)及び候補バッファαO
の内容はクリアされる。
、このとき、単語テーブル(5)及び候補バッファαO
の内容はクリアされる。
次いで、入力部(1)より読み「かべ」が入力され入力
バッファ(2)に格納されると、かな漢字変換部(4)
は上記読みに対応した漢字表記及びその品詞情報を国語
辞書(3)から読み出す。今、第2図より明らかな様に
、国語辞書(3)中には読み「かべ」に対応した漢字表
記は「壁」しかないので、単語テーブル(5)中には第
4図(Qlに示す如く漢字表記「壁」及びこの読みと品
詞情報が格納される。
バッファ(2)に格納されると、かな漢字変換部(4)
は上記読みに対応した漢字表記及びその品詞情報を国語
辞書(3)から読み出す。今、第2図より明らかな様に
、国語辞書(3)中には読み「かべ」に対応した漢字表
記は「壁」しかないので、単語テーブル(5)中には第
4図(Qlに示す如く漢字表記「壁」及びこの読みと品
詞情報が格納される。
斯る格納が終了すると、候補検索部(9)においてまず
、上記単語テーブル(5)中の漢字表記「壁」と管理テ
ーブル(8)の最後尾の漢字表記「黒い」との文法的な
接続関係が調べられるが、上記両漢字表記は夫々名詞及
び形容詞であるため、これらは接続可能であることが判
明する。従って、単語テーブル(5)中の漢字表記「壁
」は削除されない。次いで、上記両漢字表記の意味解釈
上の接続可否を連語辞書(6)を用いて検索するが、第
3図より明らかな如く、上記辞書(6)中には漢字表記
「黒い」と漢字表記「壁」とが対となって格納されてい
るため上記単語テーブル(5)中の漢字表記「壁」が変
換結果としてテキストメモリ(7)に出力されることと
なる。従って、165図(C)に示す如くテキストメモ
リ(7)の位置(1,5)に「壁」という漢字表記が格
納されることとなる。また、このとき管理テーブル(8
)には漢字表記「壁」及びその管理情報が出力されるの
で、管理テーブル(8)の内容は第6図(C1に示す様
になる。
、上記単語テーブル(5)中の漢字表記「壁」と管理テ
ーブル(8)の最後尾の漢字表記「黒い」との文法的な
接続関係が調べられるが、上記両漢字表記は夫々名詞及
び形容詞であるため、これらは接続可能であることが判
明する。従って、単語テーブル(5)中の漢字表記「壁
」は削除されない。次いで、上記両漢字表記の意味解釈
上の接続可否を連語辞書(6)を用いて検索するが、第
3図より明らかな如く、上記辞書(6)中には漢字表記
「黒い」と漢字表記「壁」とが対となって格納されてい
るため上記単語テーブル(5)中の漢字表記「壁」が変
換結果としてテキストメモリ(7)に出力されることと
なる。従って、165図(C)に示す如くテキストメモ
リ(7)の位置(1,5)に「壁」という漢字表記が格
納されることとなる。また、このとき管理テーブル(8
)には漢字表記「壁」及びその管理情報が出力されるの
で、管理テーブル(8)の内容は第6図(C1に示す様
になる。
上記管理情報の格納が終了すると、再変換部0Dが再変
換処理を行なうが、今管理テーブル(8)内には第6図
(C)に示す如く3つの漢字表記に対応した情報が格納
されているので、一番先頭に格納された漢字表記「熱い
」の情報に基づいて上記変換結果「壁」の修飾語となる
か否かを判定する。このとき、変換結果「壁」の品詞種
別は名詞であり、また管理テーブル(8)中の先頭に格
納されている品詞情報は形容詞であるため、文法上、上
記漢字表記r熱い」は上記変換結果「壁」の修飾語とな
り得ることが判明する。そこで、再変換部C11lは管
理テーブル(8)中で漢字表記「熱い」に対応して格納
されている読み「ありい」の同音異義語で、かつ漢字表
記「熱い」と同様に形容詞であるものを国語辞書(3)
より読出し、候補バッファα0に格納する口従って、候
補バッファαOには漢字表記「厚い」と「熱い」とが格
納されることとなる。次いで、斯る候補バッファ(9)
に格納された各漢字表記と上記変換結果「壁」とからな
る対が連語辞書(6)中に存在するか否かを判定するが
、第3図より明らかな如く、「厚い」と「壁」とからな
る対は上記辞書(6)に存在するものの「熱い」と「壁
」とからなる対は存在しない。従って、再変換部口りは
管理テーブル(8)中の漢字表記「熱い」に替えて、漢
字表記「厚い」を格納すると共に、上記漢字表記「熱い
」に対応して管理テーブル(8)中に格納されているテ
キスト位量情報で示されるテキストメモリ(7)中の位
置(1,1)より漢字表記「厚い」を書込む。
換処理を行なうが、今管理テーブル(8)内には第6図
(C)に示す如く3つの漢字表記に対応した情報が格納
されているので、一番先頭に格納された漢字表記「熱い
」の情報に基づいて上記変換結果「壁」の修飾語となる
か否かを判定する。このとき、変換結果「壁」の品詞種
別は名詞であり、また管理テーブル(8)中の先頭に格
納されている品詞情報は形容詞であるため、文法上、上
記漢字表記r熱い」は上記変換結果「壁」の修飾語とな
り得ることが判明する。そこで、再変換部C11lは管
理テーブル(8)中で漢字表記「熱い」に対応して格納
されている読み「ありい」の同音異義語で、かつ漢字表
記「熱い」と同様に形容詞であるものを国語辞書(3)
より読出し、候補バッファα0に格納する口従って、候
補バッファαOには漢字表記「厚い」と「熱い」とが格
納されることとなる。次いで、斯る候補バッファ(9)
に格納された各漢字表記と上記変換結果「壁」とからな
る対が連語辞書(6)中に存在するか否かを判定するが
、第3図より明らかな如く、「厚い」と「壁」とからな
る対は上記辞書(6)に存在するものの「熱い」と「壁
」とからなる対は存在しない。従って、再変換部口りは
管理テーブル(8)中の漢字表記「熱い」に替えて、漢
字表記「厚い」を格納すると共に、上記漢字表記「熱い
」に対応して管理テーブル(8)中に格納されているテ
キスト位量情報で示されるテキストメモリ(7)中の位
置(1,1)より漢字表記「厚い」を書込む。
従って、管理テーブル(8)及びテキストメモリ(7)
の内容は夫々第6図(■及び第5図(dJに示す如く変
更されることとなる。尚、このとき、漢字表記「熱い」
と「厚い」とはその長さが共に2語と等しいため、上記
「厚い」のテキストメモリ(7)への書込み時、挿入、
削除等の処理が不要となり、従って管理テーブル(8)
中のテキスト位置の変更も不要となる。
の内容は夫々第6図(■及び第5図(dJに示す如く変
更されることとなる。尚、このとき、漢字表記「熱い」
と「厚い」とはその長さが共に2語と等しいため、上記
「厚い」のテキストメモリ(7)への書込み時、挿入、
削除等の処理が不要となり、従って管理テーブル(8)
中のテキスト位置の変更も不要となる。
以上のように、本実施例では「厚い黒い壁」という文を
作成するために、「あつい」「くろい」「かべ」と入力
した際、まず「あつい」という読みが読み「かべJIJ
dする漢字表記「壁」に対して意味解釈上適切でない「
熱い」という漢字表記に変換されたとしても、「かべ」
という読みが入力されることにより所る読み「かべ」に
対応した漢字表記「壁」に対して意味解釈上適切な「厚
い」という漢字表記に再変換されることとなる。
作成するために、「あつい」「くろい」「かべ」と入力
した際、まず「あつい」という読みが読み「かべJIJ
dする漢字表記「壁」に対して意味解釈上適切でない「
熱い」という漢字表記に変換されたとしても、「かべ」
という読みが入力されることにより所る読み「かべ」に
対応した漢字表記「壁」に対して意味解釈上適切な「厚
い」という漢字表記に再変換されることとなる。
尚、本実施例では、入力部(1)からの読み入力を単語
単位で行なう様に構成したが、入力部(1)から複数の
単語に対する読みを連続的に入力させ、周知の最長一致
法等を用いて入力された読みを単語単位に分割し、入力
バッファ(2)に入力するように構成しても良い。
単位で行なう様に構成したが、入力部(1)から複数の
単語に対する読みを連続的に入力させ、周知の最長一致
法等を用いて入力された読みを単語単位に分割し、入力
バッファ(2)に入力するように構成しても良い。
また、修飾四係にある複数の単語は句点で区切られる2
つの文章にまたがって存在することは決してないので、
管理テーブル(8)の内容は句点が入力された時点でク
リアすることが好ましい。
つの文章にまたがって存在することは決してないので、
管理テーブル(8)の内容は句点が入力された時点でク
リアすることが好ましい。
更に、本実施例では連語辞書(6)を漢字表記の対で構
成したが、例えば漢字表記を複数のカテゴリに分類し、
斯るカテゴリ毎に意味解釈上の接続可否を示すテーブル
として構成したが、例えば漢字表記を複数のカテゴリに
分類し、斯るカテゴリ毎に意味解釈上の接続可否を示す
テーブルとして構成しても良い。
成したが、例えば漢字表記を複数のカテゴリに分類し、
斯るカテゴリ毎に意味解釈上の接続可否を示すテーブル
として構成したが、例えば漢字表記を複数のカテゴリに
分類し、斯るカテゴリ毎に意味解釈上の接続可否を示す
テーブルとして構成しても良い。
(ト)発明の効果
本発明によれば、離間した単語間の意味解釈上の接続可
否を判定し、正しい変換結果を得ることができる。
否を判定し、正しい変換結果を得ることができる。
第1図乃至第6図は本発明の実施例を示し、第1図は本
実施例の全体を示すブロック図、第2図は国語辞書の内
容を示す模式図、第3図は連語辞書の内容を示す模式図
、第4図tal〜(Cilは単語テーブルの内容を示す
模式図、第5図(al〜(dlはテキストメモリの内容
を示す模式図、第6図四〜(dJは管理テーブルの内容
を示す模式図である。 (3)・・・国語辞書、(4)・・・かな漢字変換部、
(6)・・・連語辞書、(7)・・・テキストメモリ、
(8)・・・管理テーブル、(9)・・・候補検索部、
αO・・・再変換部。
実施例の全体を示すブロック図、第2図は国語辞書の内
容を示す模式図、第3図は連語辞書の内容を示す模式図
、第4図tal〜(Cilは単語テーブルの内容を示す
模式図、第5図(al〜(dlはテキストメモリの内容
を示す模式図、第6図四〜(dJは管理テーブルの内容
を示す模式図である。 (3)・・・国語辞書、(4)・・・かな漢字変換部、
(6)・・・連語辞書、(7)・・・テキストメモリ、
(8)・・・管理テーブル、(9)・・・候補検索部、
αO・・・再変換部。
Claims (1)
- (1)読み入力を、文法的解析及び意味的解析を用いて
漢字表記に変換するための装置であって、単語単位の読
みに対応して漢字表記が格納された国語辞書と、意味解
釈上接続が可能な漢字表記同士を対にして格納された連
語辞書と、上記国語辞書と連語辞書とを用いて上記読み
入力を漢字表記に変換する手段と、該手段より出力され
た変換結果をその出力順に格納するテキストメモリと、
上記変換手段より出力された変換結果及び斯る結果のテ
キストメモリ中での格納位置が格納される管理テーブル
と、該テーブル中に既に格納されている漢字表記の中か
ら新たに上記変換手段で変換された漢字表記を修飾可能
なものを検索し、斯る修飾可能な漢字表記と同音異義語
である漢字表記を上記国語辞書より読出すと共に上記連
語辞書を用いて上記読出しにより得られた漢字表記の中
から上記新たに変換された漢字表記と意味解釈上最も接
続性が高いと判断される漢字表記を選出し、その後上記
修飾可能な漢字表記に対応して管理テーブル中に格納さ
れた位置情報に基づいて上記選出された漢字表記を上記
テキストメモリに書込む手段とを備えたことを特徴とす
るかな漢字変換装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63006354A JPH01181154A (ja) | 1988-01-14 | 1988-01-14 | かな漢字変換装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63006354A JPH01181154A (ja) | 1988-01-14 | 1988-01-14 | かな漢字変換装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01181154A true JPH01181154A (ja) | 1989-07-19 |
Family
ID=11636033
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63006354A Pending JPH01181154A (ja) | 1988-01-14 | 1988-01-14 | かな漢字変換装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01181154A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6808197B2 (en) | 1989-07-14 | 2004-10-26 | Tip Engineering Group, Inc. | Preweakened automotive interior trim piece for covering an air bag installation in an automotive vehicle |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS592125A (ja) * | 1982-06-29 | 1984-01-07 | Comput Basic Mach Technol Res Assoc | 仮名漢字変換方法 |
| JPS6022226A (ja) * | 1983-07-18 | 1985-02-04 | Matsushita Electric Ind Co Ltd | かな漢字変換装置 |
| JPS60124774A (ja) * | 1983-12-09 | 1985-07-03 | Ricoh Co Ltd | 同音語判別装置 |
-
1988
- 1988-01-14 JP JP63006354A patent/JPH01181154A/ja active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS592125A (ja) * | 1982-06-29 | 1984-01-07 | Comput Basic Mach Technol Res Assoc | 仮名漢字変換方法 |
| JPS6022226A (ja) * | 1983-07-18 | 1985-02-04 | Matsushita Electric Ind Co Ltd | かな漢字変換装置 |
| JPS60124774A (ja) * | 1983-12-09 | 1985-07-03 | Ricoh Co Ltd | 同音語判別装置 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6808197B2 (en) | 1989-07-14 | 2004-10-26 | Tip Engineering Group, Inc. | Preweakened automotive interior trim piece for covering an air bag installation in an automotive vehicle |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH10326275A (ja) | 形態素解析方法および装置、並びに日本語形態素解析方法および装置 | |
| JPH01181154A (ja) | かな漢字変換装置 | |
| JP2595934B2 (ja) | 仮名漢字変換処理装置 | |
| JPS62197864A (ja) | 言語情報提供装置 | |
| JP2621999B2 (ja) | 文書処理装置 | |
| JP3388153B2 (ja) | 機械翻訳装置および機械翻訳プログラムを記録したコンピュータ読取可能な記録媒体 | |
| JPH07104861B2 (ja) | かな漢字変換装置及びその方法 | |
| JPS60195664A (ja) | 仮名漢字変換方式 | |
| JPH0350668A (ja) | 文字処理装置 | |
| JP3537888B2 (ja) | かな漢字変換装置 | |
| JPH0267676A (ja) | 漢数字変換処理装置 | |
| JPS60207948A (ja) | カナ漢字変換処理装置 | |
| JPS6198475A (ja) | 日本語文章入力装置 | |
| JPH0719254B2 (ja) | カナ漢字変換装置 | |
| JPS63118975A (ja) | かな漢字変換装置 | |
| JPH05151194A (ja) | 文書作成支援装置 | |
| JPH07129568A (ja) | 文字処理方法及び装置 | |
| JPS60142468A (ja) | 文書作成装置 | |
| JPS61282966A (ja) | 仮名漢字変換方式 | |
| JPH03296856A (ja) | 文書処理装置 | |
| JPH0727526B2 (ja) | かな漢字変換装置 | |
| JPH10154141A (ja) | かな漢字変換装置 | |
| JPH0610804B2 (ja) | かな漢字変換装置 | |
| JPH01114973A (ja) | 文書作成・校正支援装置 | |
| JPH0477951A (ja) | 熟語変換方式 |