JPH0628060B2 - 文字処理装置 - Google Patents
文字処理装置Info
- Publication number
- JPH0628060B2 JPH0628060B2 JP1255494A JP25549489A JPH0628060B2 JP H0628060 B2 JPH0628060 B2 JP H0628060B2 JP 1255494 A JP1255494 A JP 1255494A JP 25549489 A JP25549489 A JP 25549489A JP H0628060 B2 JPH0628060 B2 JP H0628060B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- dictionary
- address
- stored
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】 [産業上の利用分野] 本発明は仮名漢字変換により漢字仮名混り文を入力する
文字処理装置に関する。
文字処理装置に関する。
[従来の技術] 現在、日本ワードプロセッサなどの文字処理装置は漢字
仮名混り文の入力を仮名漢字変換を使って行なうことが
一般的である。
仮名混り文の入力を仮名漢字変換を使って行なうことが
一般的である。
従来、仮名漢字変換用辞書は外部メモリ(フロッピーデ
ィスク、ハードディスク)に格納することが多かった。
ところが、一括変換等の変換方式面での改良が進むこと
により辞書アクセスの回数が増大し、また、そうでなく
ても、変換のスピードアップ要求が高まってきたことか
ら、辞書を高速アクセス可能な内部メモリに格納する方
式が主流となっている。
ィスク、ハードディスク)に格納することが多かった。
ところが、一括変換等の変換方式面での改良が進むこと
により辞書アクセスの回数が増大し、また、そうでなく
ても、変換のスピードアップ要求が高まってきたことか
ら、辞書を高速アクセス可能な内部メモリに格納する方
式が主流となっている。
内部メモリには、読込/書込ともに可能で揮発性(電源
を切ると記憶内容が消えてしまう)のRAMと、書込が
不可能であるが不揮発性(電源を切っても記憶内容が消
えない)のROMの2種類が一般に広く使用されてい
る。
を切ると記憶内容が消えてしまう)のRAMと、書込が
不可能であるが不揮発性(電源を切っても記憶内容が消
えない)のROMの2種類が一般に広く使用されてい
る。
辞書をRAMに持つ場合、仮名漢字変換する前の準備と
して辞書を外部メモリからRAMにロードすることにな
るが、ロード時間がかかるという欠点があり、更に、R
AMの方がROMよりも高価であるためコストが高くな
るという欠点もある。このため、辞書はROMに記憶す
るのが一般的である。
して辞書を外部メモリからRAMにロードすることにな
るが、ロード時間がかかるという欠点があり、更に、R
AMの方がROMよりも高価であるためコストが高くな
るという欠点もある。このため、辞書はROMに記憶す
るのが一般的である。
また、最近は、仮名漢字変換の変換率に対する要求も高
度化しているため、辞書が大容量化する傾向がある。
度化しているため、辞書が大容量化する傾向がある。
[発明が解決しようとしている問題点] このように辞書が大容量化されてくると、個人個人にと
ってみれば、絶対に使用しないと思われる単語が相当多
く辞書に記憶されていることになる。このような無駄な
単語は、単に無駄でメモリが勿体ないのは仕方がないこ
とであるが、誤変換の原因ともなり、オペレータによっ
ては存在しない方が有難い単語もある。
ってみれば、絶対に使用しないと思われる単語が相当多
く辞書に記憶されていることになる。このような無駄な
単語は、単に無駄でメモリが勿体ないのは仕方がないこ
とであるが、誤変換の原因ともなり、オペレータによっ
ては存在しない方が有難い単語もある。
例えば、単語数が増えた結果、「神戸(こうべ)」とい
う姓が辞書に格納され、また「功(こう)」という名前
も辞書に格納されたとする。そのような辞書でオペレー
タが「神戸港」を変換しようとして「こうべこう」と打
鍵したとすると、仮名漢字変換には通常「姓+名前」の
パターンを優先して変換する処理が組み込まれているの
で、オペレータの意図に反し「神戸功」と変換する可能
性が高い。
う姓が辞書に格納され、また「功(こう)」という名前
も辞書に格納されたとする。そのような辞書でオペレー
タが「神戸港」を変換しようとして「こうべこう」と打
鍵したとすると、仮名漢字変換には通常「姓+名前」の
パターンを優先して変換する処理が組み込まれているの
で、オペレータの意図に反し「神戸功」と変換する可能
性が高い。
このような場合、「功」を「港」に変更すれば、学習機
能が働き、次回から「神戸港」は正しく変換されるが、
「神戸」という姓が辞書上に存在する限り、「神戸市」
のつもりが「神戸氏」、「神戸産」のつもりが「神戸さ
ん」になるなど、あちこちで誤変換が生じ、操作性を阻
害する。
能が働き、次回から「神戸港」は正しく変換されるが、
「神戸」という姓が辞書上に存在する限り、「神戸市」
のつもりが「神戸氏」、「神戸産」のつもりが「神戸さ
ん」になるなど、あちこちで誤変換が生じ、操作性を阻
害する。
そもそも、「神戸」という姓は普通の人にとっては馴染
の薄い姓であり、辞書から削除するという解決策が手間
がなく最も効果が高い。ところが、通常、辞書はROM
上に存在するので従来は単語の削除を行なうことができ
なかった。そのため、オペレータは誤変換の発生する度
に、候補選択を行なわなうという不便を強いられてい
た。
の薄い姓であり、辞書から削除するという解決策が手間
がなく最も効果が高い。ところが、通常、辞書はROM
上に存在するので従来は単語の削除を行なうことができ
なかった。そのため、オペレータは誤変換の発生する度
に、候補選択を行なわなうという不便を強いられてい
た。
[問題点を解決するための手段(及び作用)] 本発明によれば、文字処理装置に、仮名文字列を入力す
るための入力手段と、単語の読みと表記とを含む単語情
報を、単語毎に異なるアドレスに記憶した書き換え不可
能な辞書手段と、該辞書手段を参照して、前記入力手段
より入力された仮名文字列を、該仮名文字列を読みとす
る単語の表記に変換する変換手段と、前記辞書手段に記
憶された単語のうち、前記変換手段による変換において
無効とすべき単語の当該辞書手段上のアドレスを記憶す
る無効単語アドレス記憶手段と、前記変換手段による変
換において、前記入力された仮名文字列を読みとする単
語の前記辞書手段におけるアドレスを求め、求められた
アドレスが前記無効単語アドレス記憶手段に記憶されて
いるかを判定し、記憶されていると判定された場合に
は、前記辞書手段上の前記求められたアドレスに記憶さ
れた単語の表記を変換候補から除外するように制御する
制御手段とを具えることにより、入力された仮名文字列
を変換手段によって変換する際に、前記入力された仮名
文字列を読みとする単語の前記辞書手段におけるアドレ
スを求め、求められたアドレスが前記無効単語アドレス
記憶手段に記憶されているかを判定し、記憶されている
と判定された場合には、前記辞書手段上の前記求められ
たアドレスに記憶された単語の表記を変換候補から除外
する。
るための入力手段と、単語の読みと表記とを含む単語情
報を、単語毎に異なるアドレスに記憶した書き換え不可
能な辞書手段と、該辞書手段を参照して、前記入力手段
より入力された仮名文字列を、該仮名文字列を読みとす
る単語の表記に変換する変換手段と、前記辞書手段に記
憶された単語のうち、前記変換手段による変換において
無効とすべき単語の当該辞書手段上のアドレスを記憶す
る無効単語アドレス記憶手段と、前記変換手段による変
換において、前記入力された仮名文字列を読みとする単
語の前記辞書手段におけるアドレスを求め、求められた
アドレスが前記無効単語アドレス記憶手段に記憶されて
いるかを判定し、記憶されていると判定された場合に
は、前記辞書手段上の前記求められたアドレスに記憶さ
れた単語の表記を変換候補から除外するように制御する
制御手段とを具えることにより、入力された仮名文字列
を変換手段によって変換する際に、前記入力された仮名
文字列を読みとする単語の前記辞書手段におけるアドレ
スを求め、求められたアドレスが前記無効単語アドレス
記憶手段に記憶されているかを判定し、記憶されている
と判定された場合には、前記辞書手段上の前記求められ
たアドレスに記憶された単語の表記を変換候補から除外
する。
[実施例] 以下図面を参照しながら本発明を詳細に説明する。
第1図は本発明の全体構成の一例である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送す
る。コントロールバスCBはマイクロプロセッサCPU
の制御の対象とする各構成要素のコントロール信号を転
送して印加する。データバスDBは各構成機器相互間の
データの転送を行なう。
対象とする構成要素を指示するアドレス信号を転送す
る。コントロールバスCBはマイクロプロセッサCPU
の制御の対象とする各構成要素のコントロール信号を転
送して印加する。データバスDBは各構成機器相互間の
データの転送を行なう。
つぎにROMは、読出し専用の固定メモリであり、第1
0図〜第14図につき後述するマイクロプロセッサCP
Uによる制御の手順、及び、仮名漢字変換用辞書DIC
を記憶させておく。
0図〜第14図につき後述するマイクロプロセッサCP
Uによる制御の手順、及び、仮名漢字変換用辞書DIC
を記憶させておく。
また、RAMは、1ワード16ビットの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。DELDは削除単語
辞書であり、辞書DICから削除した単語を記憶する。
SWTBLはサーチ単語テーブルであり、仮名漢字変換
中に必要な単語の存在位置を一時的に記憶するためのテ
ーブルである。
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。DELDは削除単語
辞書であり、辞書DICから削除した単語を記憶する。
SWTBLはサーチ単語テーブルであり、仮名漢字変換
中に必要な単語の存在位置を一時的に記憶するためのテ
ーブルである。
KBはキーボードであって、アルファベットキー、ひら
かなキー、カタカナキー等の文字記号入力キー、及び、
変換キー、単語削除キー、実行キー等の本文字処理装置
に対する各種機能を指示するための各種のファンクショ
ンキーを備えている。
かなキー、カタカナキー等の文字記号入力キー、及び、
変換キー、単語削除キー、実行キー等の本文字処理装置
に対する各種機能を指示するための各種のファンクショ
ンキーを備えている。
DISKは文書データ、削除単語辞書DELDを記憶す
るための外部メモリである。文書、削除単語辞書DEL
Dは必要に応じて保管され、また、保管されたデータは
キーボードの指示により必要な時呼び出される。
るための外部メモリである。文書、削除単語辞書DEL
Dは必要に応じて保管され、また、保管されたデータは
キーボードの指示により必要な時呼び出される。
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。後述するCRTコ
ントローラCRTCは、ここに蓄えられたアドレスに対
応する表示装置CRT上の位置にカーソルを表示する。
ルレジスタの内容を読み書きできる。後述するCRTコ
ントローラCRTCは、ここに蓄えられたアドレスに対
応する表示装置CRT上の位置にカーソルを表示する。
DBUFは表示用バッファメモリで、表示すべきデータ
のパターンを蓄える。
のパターンを蓄える。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担
う。
に蓄えられた内容を表示器CRTに表示する役割を担
う。
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドット構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。
表示装置CRTにおけるドット構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。
装置CRTに表示する文字、記号のパターンを記憶する
ものである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラプト信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶してある各種の制御信号を読出し、それらの制御
信号に従って各種の制御が行なわれる。
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラプト信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶してある各種の制御信号を読出し、それらの制御
信号に従って各種の制御が行なわれる。
第2図は本発明装置による変換操作の例を示した図であ
る。2−1はまず、読み列「こうべこう」を入力した時
の画面を示している。カーソルは入力読み列の次に表示
されている。ここで変換キーを打鍵すると2−2の画面
になる。2−2では読み列「こうべこう」が「神戸功」
と変換されている。これは望む変換ではないので、「神
戸」(姓)を辞書から単語削除するという操作を行なっ
て、その後もう一度「こうべこう」と入力すると2−3
の画面になる。ここで変換キーを再度打鍵すると2−4
の画面になり、今度は正しく「神戸港」と変換されてい
る。
る。2−1はまず、読み列「こうべこう」を入力した時
の画面を示している。カーソルは入力読み列の次に表示
されている。ここで変換キーを打鍵すると2−2の画面
になる。2−2では読み列「こうべこう」が「神戸功」
と変換されている。これは望む変換ではないので、「神
戸」(姓)を辞書から単語削除するという操作を行なっ
て、その後もう一度「こうべこう」と入力すると2−3
の画面になる。ここで変換キーを再度打鍵すると2−4
の画面になり、今度は正しく「神戸港」と変換されてい
る。
第3図は単語削除の操作を説明した図である。3−1は
初期画面を示しており、この状態で単語削除キーを打鍵
すると3−2の画面になる。3−2で単語削除が起動さ
れ、削除単語の入力ウインドウが表示されている。ここ
で削除すべき単語の読み「こうべ」をオペレータが入力
すると、ウインドウ中に削除単語の読みが表示され、3
−3の画面になる。更に変換キーを打鍵すると、「こう
べ」が「神戸」に変換されてウインドウ中に表示され、
3−4の画面となる。ここで実行キーを打鍵すると「神
戸」の表記と読みが取り込まれ、品詞の入力ウインドウ
が開き、3−5の画面になる。ここで品詞「姓」をオペ
レータが入力すると3−6の画面になる。ここで実行キ
ーを打鍵すると、読み「こうべ」表記「神戸」品詞
「姓」の単語が辞書より削除され、終了メッセージが3
−7に示すように表示される。
初期画面を示しており、この状態で単語削除キーを打鍵
すると3−2の画面になる。3−2で単語削除が起動さ
れ、削除単語の入力ウインドウが表示されている。ここ
で削除すべき単語の読み「こうべ」をオペレータが入力
すると、ウインドウ中に削除単語の読みが表示され、3
−3の画面になる。更に変換キーを打鍵すると、「こう
べ」が「神戸」に変換されてウインドウ中に表示され、
3−4の画面となる。ここで実行キーを打鍵すると「神
戸」の表記と読みが取り込まれ、品詞の入力ウインドウ
が開き、3−5の画面になる。ここで品詞「姓」をオペ
レータが入力すると3−6の画面になる。ここで実行キ
ーを打鍵すると、読み「こうべ」表記「神戸」品詞
「姓」の単語が辞書より削除され、終了メッセージが3
−7に示すように表示される。
第4図は辞書DICの構成を示した図である。辞書はR
OM上に存在する。従って、内容を変更することはでき
ない。
OM上に存在する。従って、内容を変更することはでき
ない。
辞書は先頭に「辞書バージョン」が格納される。これは
辞書の内容に変更があった時に更新されるようなデータ
であり、全く同じ内容を持つ辞書は同じ辞書バージョン
を持つ。後述するように削除単語のアドレス部を更新す
る必要があるかどうかはこの辞書バージョンで管理され
る。
辞書の内容に変更があった時に更新されるようなデータ
であり、全く同じ内容を持つ辞書は同じ辞書バージョン
を持つ。後述するように削除単語のアドレス部を更新す
る必要があるかどうかはこの辞書バージョンで管理され
る。
辞書バージョンに引き続いて、単語データが格納され
る。各単語データは「読み」「表記」「品詞」からな
る。
る。各単語データは「読み」「表記」「品詞」からな
る。
「読み」には単語の読み情報、例えば、「神戸」であれ
ば「こうべ」が記憶される。コードはJIS X 0208コード
の下位バイトなどを使用し、1文字1バイトで格納され
る。
ば「こうべ」が記憶される。コードはJIS X 0208コード
の下位バイトなどを使用し、1文字1バイトで格納され
る。
「表記」には単語の表記情報、例えば、「神戸」であれ
ば、「神戸」という字面が1文字2バイトでJIS X 0208
コード等を使用して格納される。
ば、「神戸」という字面が1文字2バイトでJIS X 0208
コード等を使用して格納される。
「品詞」は単語の品詞、例えば、「神戸」であれば、
「姓」「地名」などが格納される。
「姓」「地名」などが格納される。
第5図は辞書DICに格納されるデータの例を示した図
である。図に示すように辞書の単語データが読みの昇順
(辞書式配列)で格納される。
である。図に示すように辞書の単語データが読みの昇順
(辞書式配列)で格納される。
第6図は削除単語辞書DELDの構成を示した図であ
る。
る。
削除単語辞書は外部記憶に保存されている。電源立ち上
げ時に必要部分が外部記憶から読み込まれ、RAMにロ
ードされる。
げ時に必要部分が外部記憶から読み込まれ、RAMにロ
ードされる。
削除単語辞書は3つの部分に分かれる。
6−1は「辞書バージョン」を記憶する部分である。辞
書バージョンは削除単語辞書のアドレス部が作成された
時の辞書DICの辞書バージョンがそのまま記憶され
る。
書バージョンは削除単語辞書のアドレス部が作成された
時の辞書DICの辞書バージョンがそのまま記憶され
る。
6−2は実体部であり、第7図に詳述するように削除単
語の読み、表記、品詞が記憶される。
語の読み、表記、品詞が記憶される。
6−3はアドレス部であり、第8図に詳述するように削
除単語が辞書DIC上のどこに存在するかを示すポイン
タを記憶する。
除単語が辞書DIC上のどこに存在するかを示すポイン
タを記憶する。
なお、RAM上に常に存在するのは6−1の辞書バージ
ョンと6−3のアドレス部のみである。6−2の実体部
は普段は外部メモリにのみ存在する。アドレス部を再作
成する必要が生じた時に6−2の実体部が外部メモリよ
り一時的にRAMにロードされる。それ以外の状況で
は、実体部に相当するメモリは開放されており、別の目
的のために有効利用されている。
ョンと6−3のアドレス部のみである。6−2の実体部
は普段は外部メモリにのみ存在する。アドレス部を再作
成する必要が生じた時に6−2の実体部が外部メモリよ
り一時的にRAMにロードされる。それ以外の状況で
は、実体部に相当するメモリは開放されており、別の目
的のために有効利用されている。
第7図は削除単語辞書実体部の詳細構成を示した図であ
る。
る。
「読み」「表記」「品詞」の3つのフィールドからな
り、削除単語の読み、表記、品詞が記憶される。
り、削除単語の読み、表記、品詞が記憶される。
削除単語は、通常、辞書DICに存在するはずであり、
存在する時は辞書DIC上の読み、表記、品詞がそのま
ま記憶されることになる。
存在する時は辞書DIC上の読み、表記、品詞がそのま
ま記憶されることになる。
図中では削除単語1は「神戸」(姓)、削除単語2は
「内閣」(名詞)となっている。
「内閣」(名詞)となっている。
なお、削除単語として辞書DICに存在しない単語が記
述されていても一向に差し支えない。存在しない削除単
語は単に無視されるだけである。
述されていても一向に差し支えない。存在しない削除単
語は単に無視されるだけである。
第8図は削除単語辞書アドレス部の詳細構成を示した図
である。
である。
削除単語辞書アドレス部には削除単語実体部に格納され
ている削除単語一つ一つに対して、その単語が辞書DI
Cのどこに存在するかを記憶している。
ている削除単語一つ一つに対して、その単語が辞書DI
Cのどこに存在するかを記憶している。
削除単語辞書アドレス部は仮名漢字変換処理の高速化の
ために存在するデータであり、このデータがなくても、
実体部と、辞書DICとからいつでも再作成できる。
ために存在するデータであり、このデータがなくても、
実体部と、辞書DICとからいつでも再作成できる。
例えば、削除単語1は第7図によると「神戸」(姓)で
あるので、辞書DIC上の「神戸」(姓)の存在するア
ドレスを第1エントリーとして格納する。同様に削除単
語2については「内閣」(名詞)の存在するアドレスを
第2エントリーとして格納する。
あるので、辞書DIC上の「神戸」(姓)の存在するア
ドレスを第1エントリーとして格納する。同様に削除単
語2については「内閣」(名詞)の存在するアドレスを
第2エントリーとして格納する。
削除単語辞書アドレス部は、辞書DICのバージョンに
依存するデータであり、作成された時の辞書DICの辞
書バージョンが削除単語辞書の先頭に格納される。ま
た、辞書DICのバージョンが変更した時は、削除単語
辞書実体部のデータを参照して再作成される。
依存するデータであり、作成された時の辞書DICの辞
書バージョンが削除単語辞書の先頭に格納される。ま
た、辞書DICのバージョンが変更した時は、削除単語
辞書実体部のデータを参照して再作成される。
第9図はサーチ単語テーブルSWTBLの構成を示した
図である。
図である。
サーチ単語テーブルは仮名漢字変換処理を行なう過程に
おいて、入力読み列の解析を行なうのに必要な単語が辞
書DICのどこに存在するかを一時的に記憶したテーブ
ルである。
おいて、入力読み列の解析を行なうのに必要な単語が辞
書DICのどこに存在するかを一時的に記憶したテーブ
ルである。
例えば、入力読み列が「こうべこう」であったときは、
その解析のために「こ」「こう」「こうべ」「う」「う
べ」「べこ」「こう」などの単語が必要であり、それら
の単語の辞書DIC上の存在位置がフィールド「ポイン
タ」に記憶される。
その解析のために「こ」「こう」「こうべ」「う」「う
べ」「べこ」「こう」などの単語が必要であり、それら
の単語の辞書DIC上の存在位置がフィールド「ポイン
タ」に記憶される。
上述の実施例の動作をフローに従って説明する。
第10図はキー入力を取り込み、処理を行なう部分のフ
ローチャートである。
ローチャートである。
ステップ10−1はアドレス作成処理であり、第11図
に示すように削除単語辞書の初期設定を行なう。この処
理は通常、電源ON直後に1回だけ実行される。
に示すように削除単語辞書の初期設定を行なう。この処
理は通常、電源ON直後に1回だけ実行される。
ステップ10−2はキーボードからのデータを取り込む
処理である。ステップ10−3で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。
処理である。ステップ10−3で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。
変換キーが入力されたときはステップ10−4に分岐
し、ステップ10−4において第12図に詳述するよう
に仮名漢字変換の変換処理が行なわれる。その後ステッ
プ10−2に分岐する。
し、ステップ10−4において第12図に詳述するよう
に仮名漢字変換の変換処理が行なわれる。その後ステッ
プ10−2に分岐する。
単語削除キーが入力されたときはステップ10−5に分
岐し、ステップ10−5において第14図に詳述する単
語削除補処理が行なわれる。その後ステップ10−2に
分岐する。
岐し、ステップ10−5において第14図に詳述する単
語削除補処理が行なわれる。その後ステップ10−2に
分岐する。
その他のキーのときはステップ10−6に分岐し、挿
入、削除等の通常の文字処理装置において行なわれるそ
の他の処理が行なわれる。その後ステップ10−2に分
岐する。
入、削除等の通常の文字処理装置において行なわれるそ
の他の処理が行なわれる。その後ステップ10−2に分
岐する。
第11図はステップ10−1の「アドレス作成処理」を
詳細化したフローチャートである。
詳細化したフローチャートである。
ステップ11−1において削除単語辞書の「辞書バージ
ョン」「アドレス部」を外部メモリからRAMにロード
する。
ョン」「アドレス部」を外部メモリからRAMにロード
する。
ステップ11−2において削除単語辞書の辞書バージョ
ンと辞書DICの辞書バージョンを比較する。一致した
時はそのままリターンするが、一致しない時は削除単語
辞書アドレス部を再作成する必要があるので、ステップ
11−3に進む。
ンと辞書DICの辞書バージョンを比較する。一致した
時はそのままリターンするが、一致しない時は削除単語
辞書アドレス部を再作成する必要があるので、ステップ
11−3に進む。
ステップ11−3において、再作成のためにまずアドレ
ス部を初期化し、辞書DICの辞書バージョンを辞書バ
ージョンとして削除単語辞書に設定する。また、削除単
語辞書実体部を外部メモリからRAMに読み込む。
ス部を初期化し、辞書DICの辞書バージョンを辞書バ
ージョンとして削除単語辞書に設定する。また、削除単
語辞書実体部を外部メモリからRAMに読み込む。
ステップ11−4において、削除単語を実体部から1単
語取り出す。
語取り出す。
ステップ11−5において全ての削除単語について処理
が終了したかどうか判定し、処理が終了している時はリ
ターンする。処理が終了していない時はステップ11−
6の削除単語アドレス決定に進む。
が終了したかどうか判定し、処理が終了している時はリ
ターンする。処理が終了していない時はステップ11−
6の削除単語アドレス決定に進む。
ステップ11−6において、取り出された削除単語と同
じものが辞書DIC上のどこに存在するかサーチし、そ
のアドレスを求める。
じものが辞書DIC上のどこに存在するかサーチし、そ
のアドレスを求める。
ステップ11−7において、上記求めたアドレスを削除
単語辞書アドレス部に設定する。
単語辞書アドレス部に設定する。
ついで、次の削除単語の処理を行なわないといけないの
でステップ11−4に分岐する。
でステップ11−4に分岐する。
第12図はステップ10−4の「変換処理」を詳細化し
たフローチャートである。
たフローチャートである。
ステップ12−1において入力読み列の解析に必要な単
語をサーチ単語テーブルSWTBLに登録するために第
13に詳述する単語サーチ処理を行なう。
語をサーチ単語テーブルSWTBLに登録するために第
13に詳述する単語サーチ処理を行なう。
ステップ12−2において、形態素解析、構文解析等を
行なって入力読み列を解析し、文節候補を作成する。
行なって入力読み列を解析し、文節候補を作成する。
ステップ12−3において、各文節候補の尤度を計算
し、どの文節を変換するのが最も尤もらしいかを判断
し、第1候補として決定する。
し、どの文節を変換するのが最も尤もらしいかを判断
し、第1候補として決定する。
ステップ12−4において、決定された第1候補に基づ
いて変換結果を作成し、出力する。
いて変換結果を作成し、出力する。
第13図はステップ12−1の「単語サーチ処理」を詳
細化したフローチャートである。
細化したフローチャートである。
ステップ13−1において、辞書DICより入力読み列
の解析に必要な単語の読み(サーチすべき読み)を1つ
決定する。
の解析に必要な単語の読み(サーチすべき読み)を1つ
決定する。
ステップ13−2においてサーチすべき読みがなくなっ
たかどうか判定し、なくなった時はリターンする。
たかどうか判定し、なくなった時はリターンする。
ステップ13−3においてサーチすべき読みについて実
際に辞書DICをサーチし、アドレスを求める。
際に辞書DICをサーチし、アドレスを求める。
ステップ13−4において見つかったアドレスが削除単
語辞書アドレス部に記載されているかどうかを判定する
ため削除単語辞書アドレス部をサーチする。
語辞書アドレス部に記載されているかどうかを判定する
ため削除単語辞書アドレス部をサーチする。
ステップ13−5において一致するアドレスがあったか
どうか判定し、もし、存在すれば、その単語は削除され
たと見なされるから、そのまま、ステップ13−1に分
岐し、次のサーチ読みの処理に移る。存在しない時はそ
の単語は削除されていないからステップ13−6に進
み、サーチ単語テーブルにそのアドレスを登録する。
どうか判定し、もし、存在すれば、その単語は削除され
たと見なされるから、そのまま、ステップ13−1に分
岐し、次のサーチ読みの処理に移る。存在しない時はそ
の単語は削除されていないからステップ13−6に進
み、サーチ単語テーブルにそのアドレスを登録する。
第14図はステップ10−5の「単語削除処理」を詳細
化したフローチャートである。
化したフローチャートである。
ステップ14−1において、画面上に単語削除のための
表記入力のウインドウを表示する。
表記入力のウインドウを表示する。
ステップ14−2において、削除単語の表記をオペレー
タから受付ける処理を行なう。オペレータが入力した読
み、選択した表記は内部メモリに一時的に取り込まれ
る。オペレータが表記を入力し、実行キーを打鍵した時
にステップ14−3に移ることになる。
タから受付ける処理を行なう。オペレータが入力した読
み、選択した表記は内部メモリに一時的に取り込まれ
る。オペレータが表記を入力し、実行キーを打鍵した時
にステップ14−3に移ることになる。
ステップ14−3において、品詞入力のウインドウが表
示される。ここでオペレータの入力する品詞が内部メモ
リに取り込まれることになる。オペレータが品詞を入力
し、実行キーを打鍵すると次のステップ14−4に移
る。
示される。ここでオペレータの入力する品詞が内部メモ
リに取り込まれることになる。オペレータが品詞を入力
し、実行キーを打鍵すると次のステップ14−4に移
る。
ステップ14−4において、これまでの処理の結果得ら
れた読み、表記、品詞を削除単語データ実体部に登録す
る。実体部は通常RAM上に存在しないから外部メモリ
から読み込まれ登録されることになる。
れた読み、表記、品詞を削除単語データ実体部に登録す
る。実体部は通常RAM上に存在しないから外部メモリ
から読み込まれ登録されることになる。
ステップ14−5において、今削除された単語の辞書D
IC上でのアドレスを求める。
IC上でのアドレスを求める。
ステップ14−6において、求められたアドレスを削除
単語データアドレスにも登録する。
単語データアドレスにも登録する。
ステップ14−7において、単語削除の終了処理を行な
う。すなわち、削除単語辞書全体を外部メモリに保存
し、RAM上にある実体部の領域を開放し、終了メッセ
ージをウインドウ上に表示する。適当なタイミングでウ
インドウを消去してからリターンする。
う。すなわち、削除単語辞書全体を外部メモリに保存
し、RAM上にある実体部の領域を開放し、終了メッセ
ージをウインドウ上に表示する。適当なタイミングでウ
インドウを消去してからリターンする。
[他の実施例] 以上の説明において、辞書の格納されるメモリとしてR
OMの場合を説明したが、書込不可なメモリであれば事
情は全て同じであり、本発明を適用可能である。例え
ば、光ディスク、CDROMなどであっても、書込がで
きないため直接単語を削除することはできないが、本発
明の原理で削除することができる。
OMの場合を説明したが、書込不可なメモリであれば事
情は全て同じであり、本発明を適用可能である。例え
ば、光ディスク、CDROMなどであっても、書込がで
きないため直接単語を削除することはできないが、本発
明の原理で削除することができる。
また、削除単語辞書の持ち方としてアドレスを持つよう
にしたが、アドレス以外であっても辞書のバージョンに
依存するような持ち方であれば、やはり事情が同じであ
るので、本発明を適用できる。例えば、辞書の先頭から
の単語の連番で記憶するようにしても同様の構成で処理
することができる。
にしたが、アドレス以外であっても辞書のバージョンに
依存するような持ち方であれば、やはり事情が同じであ
るので、本発明を適用できる。例えば、辞書の先頭から
の単語の連番で記憶するようにしても同様の構成で処理
することができる。
[発明の効果] 以上の説明から明らかなように本発明によれば、仮名漢
字変換用辞書が書込不可なメモリ、例えば、ROMに存
在しても、辞書の単語を無効とすることができるので、
オペレータごとに仮名漢字変換率を向上させることがで
きるため、候補選択の手間が軽減された操作性の高い文
字処理装置を実現することができる。
字変換用辞書が書込不可なメモリ、例えば、ROMに存
在しても、辞書の単語を無効とすることができるので、
オペレータごとに仮名漢字変換率を向上させることがで
きるため、候補選択の手間が軽減された操作性の高い文
字処理装置を実現することができる。
また、本発明によれば、無効とすべき単語を該単語の辞
書上のアドレスにより記憶するようにしたので、無効と
すべき単語を特定するための情報が少なくて済み、か
つ、ある単語が無効であるか否かの判定を、その単語の
辞書上のアドレスと記憶された無効とすべき単語のアド
レスとの比較により行うようにしたので、この判定を高
速に処理できるという効果がある。
書上のアドレスにより記憶するようにしたので、無効と
すべき単語を特定するための情報が少なくて済み、か
つ、ある単語が無効であるか否かの判定を、その単語の
辞書上のアドレスと記憶された無効とすべき単語のアド
レスとの比較により行うようにしたので、この判定を高
速に処理できるという効果がある。
第1図は本発明の全体構成のブロック図、 第2図は本発明における仮名漢字変換の操作例を示した
図、 第3図は本発明における単語削除の操作の例を示した
図、 第4図は本発明における辞書DICの構成を示した図、 第5図は本発明における辞書DICに格納される単語の
例を示した図、 第6図は本発明における削除単語辞書の全体構成をを示
した図、 第7図は本発明における削除単語辞書実体部の構成を示
した図、 第8図は本発明における削除単語辞書アドレス部の構成
を示した図、 第9図は本発明におけるサーチ単語テーブルの構成を示
した図、 第10図〜第14図は本発明に係る文字処理装置の動作
を示すフローチャートである。 DISK…外部メモリ CPU…マイクロプロセッサ ROM…読出し専用メモリ RAM…ランダムアクセスメモリ DIC…仮名漢字変換用辞書 DELD…削除単語辞書 SWTBL…サーチ単語テーブル
図、 第3図は本発明における単語削除の操作の例を示した
図、 第4図は本発明における辞書DICの構成を示した図、 第5図は本発明における辞書DICに格納される単語の
例を示した図、 第6図は本発明における削除単語辞書の全体構成をを示
した図、 第7図は本発明における削除単語辞書実体部の構成を示
した図、 第8図は本発明における削除単語辞書アドレス部の構成
を示した図、 第9図は本発明におけるサーチ単語テーブルの構成を示
した図、 第10図〜第14図は本発明に係る文字処理装置の動作
を示すフローチャートである。 DISK…外部メモリ CPU…マイクロプロセッサ ROM…読出し専用メモリ RAM…ランダムアクセスメモリ DIC…仮名漢字変換用辞書 DELD…削除単語辞書 SWTBL…サーチ単語テーブル
Claims (1)
- 【請求項1】仮名文字列を入力するための入力手段と、 単語の読みと表記とを含む単語情報を、単語毎に異なる
アドレスに記憶した書き換え不可能な辞書手段と、 該辞書手段を参照して、前記入力手段より入力された仮
名文字列を、該仮名文字列を読みとする単語の表記に変
換する変換手段と、 前記辞書手段に記憶された単語のうち、前記変換手段に
よる変換において無効とすべき単語の当該辞書手段上の
アドレスを記憶する無効単語アドレス記憶手段と、 前記変換手段による変換において、前記入力された仮名
文字列を読みとする単語の前記辞書手段におけるアドレ
スを求め、求められたアドレスが前記無効単語アドレス
記憶手段に記憶されているかを判定し、記憶されている
と判定された場合には、前記辞書手段上の前記求められ
たアドレスに記憶された単語の表記を変換候補から除外
するように制御する制御手段とを有することを特徴とす
る文字処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1255494A JPH0628060B2 (ja) | 1989-09-29 | 1989-09-29 | 文字処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1255494A JPH0628060B2 (ja) | 1989-09-29 | 1989-09-29 | 文字処理装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03116368A JPH03116368A (ja) | 1991-05-17 |
| JPH0628060B2 true JPH0628060B2 (ja) | 1994-04-13 |
Family
ID=17279534
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1255494A Expired - Lifetime JPH0628060B2 (ja) | 1989-09-29 | 1989-09-29 | 文字処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0628060B2 (ja) |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6010349A (ja) * | 1983-06-30 | 1985-01-19 | Fujitsu Ltd | スキヤン方式 |
| JPH0652524B2 (ja) * | 1986-03-28 | 1994-07-06 | 株式会社日立製作所 | 文書作成装置 |
| JPS63238661A (ja) * | 1987-03-26 | 1988-10-04 | Nec Corp | かな漢字変換方式 |
-
1989
- 1989-09-29 JP JP1255494A patent/JPH0628060B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH03116368A (ja) | 1991-05-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5418718A (en) | Method for providing linguistic functions of English text in a mixed document of single-byte characters and double-byte characters | |
| JPH0628060B2 (ja) | 文字処理装置 | |
| JPH0630104B2 (ja) | 文字処理装置 | |
| JPH0628059B2 (ja) | 文字処理装置 | |
| JPH03116366A (ja) | 文字処理装置 | |
| JPS59100941A (ja) | 仮名漢字変換装置 | |
| JP3278148B2 (ja) | 文字処理装置及びその方法 | |
| JP2786260B2 (ja) | かな漢字変換装置 | |
| JP3809238B2 (ja) | 文書処理方法及びその装置 | |
| JP2862236B2 (ja) | 文字処理装置 | |
| JPH0576066B2 (ja) | ||
| JP2744241B2 (ja) | 文字処理装置 | |
| JPH0447451A (ja) | 文字処理装置 | |
| JPH05135010A (ja) | 文字処理方法及び装置 | |
| JPH0351959A (ja) | 電子辞書 | |
| JPH0447446A (ja) | 文字処理装置 | |
| JPH01204174A (ja) | 文字処理装置 | |
| JPS62198957A (ja) | 文字処理装置 | |
| JPH0628061B2 (ja) | 文字処理装置及びその方法 | |
| JPH0769907B2 (ja) | 文字処理装置 | |
| JPH0816908B2 (ja) | 文字処理装置及び文字処理方法 | |
| JPS62198954A (ja) | 文字処理装置 | |
| JPH02165270A (ja) | 文字処理装置 | |
| JPH0769906B2 (ja) | 文字処理装置 | |
| JPH0731679B2 (ja) | 文字処理装置 |