JPH05242074A - 仮名漢字変換処理装置 - Google Patents
仮名漢字変換処理装置Info
- Publication number
- JPH05242074A JPH05242074A JP4041652A JP4165292A JPH05242074A JP H05242074 A JPH05242074 A JP H05242074A JP 4041652 A JP4041652 A JP 4041652A JP 4165292 A JP4165292 A JP 4165292A JP H05242074 A JPH05242074 A JP H05242074A
- Authority
- JP
- Japan
- Prior art keywords
- foreign language
- spelling
- dictionary
- kana
- bunsetsu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【構成】 文字の入力と変換の指示をする入力手段と、
文字列および変換結果を記憶する文字記憶手段と、文節
に分割するための文節わかち手段と、外国語の読みと外
国語表記スペルとこの外国語表記スペルを検索するため
のアドレスを示す連番インデックスを格納している外国
語スペル辞書と、漢字表記と共起情報と外国語表記スペ
ルを検索するためのアドレスを示す制御コードと数値情
報を格納している仮名漢字変換辞書と、文節の中に外国
語があれば、仮名漢字変換辞書の制御コードと数値情報
と外国語スペル辞書の連番インデックスに基づいて外国
語表記スペルに変換する変換手段と、文字列あるいは変
換結果を表示画面に表示する表示手段から構成されてい
る。 【効果】 外国語スペル辞書の外国語表記データと、仮
名漢字変換辞書の外国語表記データと有効に連結させて
仮名漢字変換辞書の容量圧縮が図られる。
文字列および変換結果を記憶する文字記憶手段と、文節
に分割するための文節わかち手段と、外国語の読みと外
国語表記スペルとこの外国語表記スペルを検索するため
のアドレスを示す連番インデックスを格納している外国
語スペル辞書と、漢字表記と共起情報と外国語表記スペ
ルを検索するためのアドレスを示す制御コードと数値情
報を格納している仮名漢字変換辞書と、文節の中に外国
語があれば、仮名漢字変換辞書の制御コードと数値情報
と外国語スペル辞書の連番インデックスに基づいて外国
語表記スペルに変換する変換手段と、文字列あるいは変
換結果を表示画面に表示する表示手段から構成されてい
る。 【効果】 外国語スペル辞書の外国語表記データと、仮
名漢字変換辞書の外国語表記データと有効に連結させて
仮名漢字変換辞書の容量圧縮が図られる。
Description
【0001】
【産業上の利用分野】この発明は仮名漢字変換処理装置
に関し、詳しくは、外国語表記スペルに変換あるいはス
ペルチェック機能を有する仮名漢字変換処理装置に関す
る。
に関し、詳しくは、外国語表記スペルに変換あるいはス
ペルチェック機能を有する仮名漢字変換処理装置に関す
る。
【0002】
【従来の技術】従来、日本語ワードプロセッサを含むこ
の種の仮名漢字変換処理装置において、今日、ワードプ
ロセッサの機能が充実してくることにより、外国語スペ
ルに変換、あるいはスペルチェックのための外国語スペ
ル辞書も標準装備されていることも多くなってきてい
る。例えば、英語の同音表記文字列を英字表記スペルに
変換するための英字表記スペルが仮名漢字変換辞書に、
スペルチェックのための英字表記スペルが外国語スペル
辞書に、同じ英字表記スペルが別々の辞書に登録して仮
名英字変換あるいは英字表記スペルのスペルチェックを
する方法が知られている。
の種の仮名漢字変換処理装置において、今日、ワードプ
ロセッサの機能が充実してくることにより、外国語スペ
ルに変換、あるいはスペルチェックのための外国語スペ
ル辞書も標準装備されていることも多くなってきてい
る。例えば、英語の同音表記文字列を英字表記スペルに
変換するための英字表記スペルが仮名漢字変換辞書に、
スペルチェックのための英字表記スペルが外国語スペル
辞書に、同じ英字表記スペルが別々の辞書に登録して仮
名英字変換あるいは英字表記スペルのスペルチェックを
する方法が知られている。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
日本語ワードプロセッサや仮名漢字変換処理装置では、
同じ英字表記スペル(英字表記データ)が別々の辞書に
登録されているため、外国語スペル辞書と仮名漢字変換
辞書は、共存することはあっても、有機的に結ばれてい
ないため、容量に冗長が発生している。即ち、いつまで
も別々に同じ英字表記スペル(データ)を格納しておく
のは、容量的にムダである。
日本語ワードプロセッサや仮名漢字変換処理装置では、
同じ英字表記スペル(英字表記データ)が別々の辞書に
登録されているため、外国語スペル辞書と仮名漢字変換
辞書は、共存することはあっても、有機的に結ばれてい
ないため、容量に冗長が発生している。即ち、いつまで
も別々に同じ英字表記スペル(データ)を格納しておく
のは、容量的にムダである。
【0004】この発明は以上の事情を考慮してなされた
もので、外国語スペル辞書の外国語表記データと仮名漢
字変換辞書で表記データが外国語表記スペルのものを制
御コードと数値情報に置き換え外国語スペル辞書の連番
インデックスと連結させて、仮名漢字変換辞書のデータ
容量圧縮を図る仮名漢字変換処理装置を提供するもので
ある。
もので、外国語スペル辞書の外国語表記データと仮名漢
字変換辞書で表記データが外国語表記スペルのものを制
御コードと数値情報に置き換え外国語スペル辞書の連番
インデックスと連結させて、仮名漢字変換辞書のデータ
容量圧縮を図る仮名漢字変換処理装置を提供するもので
ある。
【0005】
【課題を解決するための手段】連文節変換機能を有する
仮名漢字変換処理装置において、文字列の入力と文字列
の変換の指示をする入力手段101と、入力手段101
から入力された文字列および変換結果を記憶する記憶手
段102と、この文字列を文節に分割するための文節わ
かち手段103と、文節に含まれる外国語の読みを外国
語表記スペルもしくは外国語表記交じりスペルに変換す
るための外国語表記スペルとこの外国語表記スペルを検
索するためのアドレスを示す連番インデックスを格納し
ている外国語スペル辞書104と、文節を漢字もしくは
漢字交じり文節に変換するための漢字表記および連文節
の共起情報を格納するとともに外国語スペル辞書104
を検索するためのアドレスを示す制御コードと数値情報
を格納している仮名漢字変換辞書105と、入力手段1
01の指示により、文節わかち手段103によって分割
された文節の中に外国語の読みがあれば、仮名漢字変換
辞書105の制御コードと数値情報と外国語スペル辞書
104の連番インデックスに基づいて外国語スペル辞書
104に格納されている外国語表記スペルに変換する変
換手段106と、入力された文字列あるいは変換結果を
表示画面に表示する表示手段107を備えてなる仮名漢
字変換処理装置である。
仮名漢字変換処理装置において、文字列の入力と文字列
の変換の指示をする入力手段101と、入力手段101
から入力された文字列および変換結果を記憶する記憶手
段102と、この文字列を文節に分割するための文節わ
かち手段103と、文節に含まれる外国語の読みを外国
語表記スペルもしくは外国語表記交じりスペルに変換す
るための外国語表記スペルとこの外国語表記スペルを検
索するためのアドレスを示す連番インデックスを格納し
ている外国語スペル辞書104と、文節を漢字もしくは
漢字交じり文節に変換するための漢字表記および連文節
の共起情報を格納するとともに外国語スペル辞書104
を検索するためのアドレスを示す制御コードと数値情報
を格納している仮名漢字変換辞書105と、入力手段1
01の指示により、文節わかち手段103によって分割
された文節の中に外国語の読みがあれば、仮名漢字変換
辞書105の制御コードと数値情報と外国語スペル辞書
104の連番インデックスに基づいて外国語スペル辞書
104に格納されている外国語表記スペルに変換する変
換手段106と、入力された文字列あるいは変換結果を
表示画面に表示する表示手段107を備えてなる仮名漢
字変換処理装置である。
【0006】なお、この発明において入力手段101と
しては、キーボード装置やタブレット装置、あるいはポ
インティングデバイス等の入力装置が用いられる。記憶
手段102、文節わかち手段103、外国語スペル辞書
104、仮名漢字変換辞書105、変換手段106とし
ては、CPU、ROM、RAM、I/Oポートからなる
マイクロコンピュータシステムを用いるのが便利であ
る。特に、記憶手段103としては、通常RAMが用い
られ、外国語スペル辞書104、仮名漢字変換辞書10
5としては、ROMおよび外部記憶装置が用いられる。
表示手段107としては、CRTディスプレイ装置、L
CD(液晶表示装置)、あるいはELディスプレイ装置
が用いられる。
しては、キーボード装置やタブレット装置、あるいはポ
インティングデバイス等の入力装置が用いられる。記憶
手段102、文節わかち手段103、外国語スペル辞書
104、仮名漢字変換辞書105、変換手段106とし
ては、CPU、ROM、RAM、I/Oポートからなる
マイクロコンピュータシステムを用いるのが便利であ
る。特に、記憶手段103としては、通常RAMが用い
られ、外国語スペル辞書104、仮名漢字変換辞書10
5としては、ROMおよび外部記憶装置が用いられる。
表示手段107としては、CRTディスプレイ装置、L
CD(液晶表示装置)、あるいはELディスプレイ装置
が用いられる。
【0007】
【作用】この発明に従えば、図1に示すように、連文節
変換機能を有する仮名漢字変換処理装置において、入力
手段101は文字列の入力と文字列の変換の指示をす
る。記憶手段102は入力手段101から入力された文
字列および変換結果を記憶する。文節わかち手段103
はこの文字列を文節に分割する。
変換機能を有する仮名漢字変換処理装置において、入力
手段101は文字列の入力と文字列の変換の指示をす
る。記憶手段102は入力手段101から入力された文
字列および変換結果を記憶する。文節わかち手段103
はこの文字列を文節に分割する。
【0008】外国語スペル辞書104は文節に含まれる
外国語の読みを外国語表記スペルもしくは外国語表記交
じりスペルに変換するための外国語表記スペルとこの外
国語表記スペルを検索するためのアドレスを示す連番イ
ンデックスを格納している。仮名漢字変換辞書105は
文節を漢字もしくは漢字交じり文節に変換するための漢
字表記および連文節の共起情報を格納するとともに外国
語スペル辞書104を検索するためのアドレスを示す制
御コードと数値情報を格納している。
外国語の読みを外国語表記スペルもしくは外国語表記交
じりスペルに変換するための外国語表記スペルとこの外
国語表記スペルを検索するためのアドレスを示す連番イ
ンデックスを格納している。仮名漢字変換辞書105は
文節を漢字もしくは漢字交じり文節に変換するための漢
字表記および連文節の共起情報を格納するとともに外国
語スペル辞書104を検索するためのアドレスを示す制
御コードと数値情報を格納している。
【0009】変換手段106は入力手段101の指示に
より、文節わかち手段103によって分割された文節の
中に外国語の読みがあれば、仮名漢字変換辞書105の
制御コードと数値情報と外国語スペル辞書104の連番
インデックスに基づいて外国語スペル辞書104に格納
されている外国語表記スペルに変換する。表示手段10
7は入力された文字列あるいは変換結果を表示画面に表
示する。
より、文節わかち手段103によって分割された文節の
中に外国語の読みがあれば、仮名漢字変換辞書105の
制御コードと数値情報と外国語スペル辞書104の連番
インデックスに基づいて外国語スペル辞書104に格納
されている外国語表記スペルに変換する。表示手段10
7は入力された文字列あるいは変換結果を表示画面に表
示する。
【0010】従って、外国語スペル辞書の外国語表記デ
ータと仮名漢字変換辞書で表記データが外国語表記スペ
ルのものを制御コードと数値情報に置き換え外国語スペ
ル辞書のインデックスと連結させているので、仮名漢字
変換辞書のデータ容量圧縮を図ることができる。
ータと仮名漢字変換辞書で表記データが外国語表記スペ
ルのものを制御コードと数値情報に置き換え外国語スペ
ル辞書のインデックスと連結させているので、仮名漢字
変換辞書のデータ容量圧縮を図ることができる。
【0011】
【実施例】以下図に示す実施例に基づいてこの発明を詳
述する。なお、これによってこの発明は限定されるもの
ではない。図2はこの発明を仮名漢字変換処理装置に適
用した一実施例を示すブロック図である。この図におい
て1は仮名文字キーや数値キー、変換キー、ファンクシ
ョンキーを備えたキーボードなどの入力部であり、この
入力部1から仮名漢字変換、外国語スペル変換およびス
ペルチェックのための文字列の入力と変換の指示を入力
する。2は制御部であり、外国語スペル変換とスペルチ
ェックを行う制御プログラムと本来の仮名漢字変換処理
を行う制御プログラムと各部の制御を実行するCPUや
テーブル等のROM(リード・オンリ・メモリ)及びR
AM(リード・オンリ・メモリ)及び外部記憶装置から
構成されている。
述する。なお、これによってこの発明は限定されるもの
ではない。図2はこの発明を仮名漢字変換処理装置に適
用した一実施例を示すブロック図である。この図におい
て1は仮名文字キーや数値キー、変換キー、ファンクシ
ョンキーを備えたキーボードなどの入力部であり、この
入力部1から仮名漢字変換、外国語スペル変換およびス
ペルチェックのための文字列の入力と変換の指示を入力
する。2は制御部であり、外国語スペル変換とスペルチ
ェックを行う制御プログラムと本来の仮名漢字変換処理
を行う制御プログラムと各部の制御を実行するCPUや
テーブル等のROM(リード・オンリ・メモリ)及びR
AM(リード・オンリ・メモリ)及び外部記憶装置から
構成されている。
【0012】3は入力された文字列、外国語表記スペル
や仮名漢字交じり文に変換されたデータを表示する表示
部であり、CRTディスプレイ装置やLCD(液晶表示
装置)等が用いらる。4は仮名漢字変換用の意味コード
を含んだ自立語辞書、固有名詞辞書、接辞語辞書、ユー
ザ辞書の各辞書と外国語スペル辞書の外国語表記スペル
を検索するためのアドレスを示す制御コードと数値情報
を格納している辞書部、5は文節間の共起関係(複合用
例、意味用例)を蓄えた共起関係辞書である。6は外国
語スペル変換およびスペルチェック用とコレクト用の外
国語表記スペルとこの外国語表記スペルのアドレスを示
す連番インデックスを蓄えた外国語スペル辞書である。
や仮名漢字交じり文に変換されたデータを表示する表示
部であり、CRTディスプレイ装置やLCD(液晶表示
装置)等が用いらる。4は仮名漢字変換用の意味コード
を含んだ自立語辞書、固有名詞辞書、接辞語辞書、ユー
ザ辞書の各辞書と外国語スペル辞書の外国語表記スペル
を検索するためのアドレスを示す制御コードと数値情報
を格納している辞書部、5は文節間の共起関係(複合用
例、意味用例)を蓄えた共起関係辞書である。6は外国
語スペル変換およびスペルチェック用とコレクト用の外
国語表記スペルとこの外国語表記スペルのアドレスを示
す連番インデックスを蓄えた外国語スペル辞書である。
【0013】7はバッファであり、文字バッファ71と
学習バッファ72と同音語バッファ73から構成されて
いる。文字バッファ71は入力部1から入力された文字
列を蓄えておくバッファである。学習バッファ72は単
語の学習処理を行うバッファである。同音語バッファ7
3は仮名漢字変換の際の同音語の候補を蓄えておくバッ
ファである。
学習バッファ72と同音語バッファ73から構成されて
いる。文字バッファ71は入力部1から入力された文字
列を蓄えておくバッファである。学習バッファ72は単
語の学習処理を行うバッファである。同音語バッファ7
3は仮名漢字変換の際の同音語の候補を蓄えておくバッ
ファである。
【0014】入力部1から入力された仮名文字列は文字
バッファ71に蓄えられる。次にユーザが変換の指示を
するか、あるいは変換のタイミングになった時、制御部
2は辞書部4及び共起関係辞書5及びその他のテーブル
等を参照して仮名漢字変換を行い同音語バッファ73に
変換結果を蓄える。第1候補が表示部3に表示されるが
第一候補以外の候補も入力部1の操作によって同音語の
選択を行うと、その結果が学習バッファ72に蓄えられ
る。
バッファ71に蓄えられる。次にユーザが変換の指示を
するか、あるいは変換のタイミングになった時、制御部
2は辞書部4及び共起関係辞書5及びその他のテーブル
等を参照して仮名漢字変換を行い同音語バッファ73に
変換結果を蓄える。第1候補が表示部3に表示されるが
第一候補以外の候補も入力部1の操作によって同音語の
選択を行うと、その結果が学習バッファ72に蓄えられ
る。
【0015】図3はこの発明の仮名漢字変換の処理内容
を示すフローチャートである。図4は従来の仮名漢字変
換辞書の表記部を示す説明図である。図5は辞書部4の
表記部の制御コードと数値情報を示す説明図である。図
6は外国語スペル辞書6の表記部と連番インデックスを
示す説明図である。図3において、以下入力された仮名
文字列の読み「すいみんぐすくーるにいった」を例に、
図4,図5,図6の説明図を用いてその処理内容の流れ
に従って説明する。
を示すフローチャートである。図4は従来の仮名漢字変
換辞書の表記部を示す説明図である。図5は辞書部4の
表記部の制御コードと数値情報を示す説明図である。図
6は外国語スペル辞書6の表記部と連番インデックスを
示す説明図である。図3において、以下入力された仮名
文字列の読み「すいみんぐすくーるにいった」を例に、
図4,図5,図6の説明図を用いてその処理内容の流れ
に従って説明する。
【0016】ステップ201では「すいみんぐすくーる
にいった」の仮名文字列を文字バッファ71に取り込
む。ステップ202では、入力された仮名文字列に対し
て先行文節の抽出を行う。ここでは「すいみんぐ」、
「すいみん」、「すい」が先行文節として抽出される。
にいった」の仮名文字列を文字バッファ71に取り込
む。ステップ202では、入力された仮名文字列に対し
て先行文節の抽出を行う。ここでは「すいみんぐ」、
「すいみん」、「すい」が先行文節として抽出される。
【0017】ステップ203では、ステップ202で抽
出された先行文節に続く仮名文字列で始まる文節の抽出
を行う。ここでは先行文節「すいみんぐ」に対して後続
文節「すくーる」、「すくーるに」が、先行文節「すい
みん」に対しては後続文節「ぐ」が、先行文節「すい」
に対して後続文節「みんぐ」、「みん」、「み」が抽出
される。このようにして先行文節と後続文節の抽出が終
了する。
出された先行文節に続く仮名文字列で始まる文節の抽出
を行う。ここでは先行文節「すいみんぐ」に対して後続
文節「すくーる」、「すくーるに」が、先行文節「すい
みん」に対しては後続文節「ぐ」が、先行文節「すい」
に対して後続文節「みんぐ」、「みん」、「み」が抽出
される。このようにして先行文節と後続文節の抽出が終
了する。
【0018】ステップ204では、先行文節、後続文節
の2文節間の関係を共起関係辞書5で調査し、先行文節
と後続文節を決定する。ここでは先行文節が「すいみん
ぐ」後続文節「すくーる」、「すくーるに」となる。ス
テップ205では文が終了したかどうか判断して終了し
ていなければステップ203へ戻り、文が終了していれ
ばステップ206へ進み同音語選択の処理を行う。
の2文節間の関係を共起関係辞書5で調査し、先行文節
と後続文節を決定する。ここでは先行文節が「すいみん
ぐ」後続文節「すくーる」、「すくーるに」となる。ス
テップ205では文が終了したかどうか判断して終了し
ていなければステップ203へ戻り、文が終了していれ
ばステップ206へ進み同音語選択の処理を行う。
【0019】LOOP1の処理を繰り返すことで入力さ
れた仮名列を文節にわける処理が終了する。文節に分け
られた候補は、各文節毎にその結果を同音語バッファ7
3に蓄える。同音語バッファ73は各文節毎に個別のバ
ッファを有する。この例では後文節「すくーる」、「す
くーるに」等の候補が格納される。入力仮名文字列「す
いみんぐすくーるにいった」は「すいみんぐ」、「すく
ーるに」、「いった」に文節にわけられる。さらに、
「すくーるに」は「すくーる」と「に」の文節にわけら
れる。
れた仮名列を文節にわける処理が終了する。文節に分け
られた候補は、各文節毎にその結果を同音語バッファ7
3に蓄える。同音語バッファ73は各文節毎に個別のバ
ッファを有する。この例では後文節「すくーる」、「す
くーるに」等の候補が格納される。入力仮名文字列「す
いみんぐすくーるにいった」は「すいみんぐ」、「すく
ーるに」、「いった」に文節にわけられる。さらに、
「すくーるに」は「すくーる」と「に」の文節にわけら
れる。
【0020】ステップ206では、各文節毎に分けられ
た同音語候補の絞り込みの同音語選択処理が行われる。
ここでは「すいみんぐ」「すくーる」「に」「いった」
の各文節について同音語選択を行う。
た同音語候補の絞り込みの同音語選択処理が行われる。
ここでは「すいみんぐ」「すくーる」「に」「いった」
の各文節について同音語選択を行う。
【0021】例えば、「すくーる」の文節について同音
語を選択する場合、図4に示すように、同音語バッファ
73の読み情報「すくーる」、又は実行番号からそれと
対応する仮名漢字変換辞書の表記データを検索し、仮名
漢字変換辞書の該当表記部から読み情報「すくーる」に
対応する表記データ「SCHOOL」を読み出すのが従
来の方法であった。
語を選択する場合、図4に示すように、同音語バッファ
73の読み情報「すくーる」、又は実行番号からそれと
対応する仮名漢字変換辞書の表記データを検索し、仮名
漢字変換辞書の該当表記部から読み情報「すくーる」に
対応する表記データ「SCHOOL」を読み出すのが従
来の方法であった。
【0022】次に、この発明による外国語表記スペル変
換の例を説明する。上述の例では、読み情報「すくー
る」の場合、そのまま表記データ「SCHOOL」を仮
名漢字変換辞書から読み出してきたが、この例として、
読み情報「すくーる」は図5に示す辞書部4の表記部の
制御コードと数値情報に置き換えられている。この図に
示すように表記部の先頭が制御コード、この例では、
「カタカナのヲ」とこれに続く数値情報に基づいて図6
に示す外国語スペル辞書の連番インデックスを検索す
る。
換の例を説明する。上述の例では、読み情報「すくー
る」の場合、そのまま表記データ「SCHOOL」を仮
名漢字変換辞書から読み出してきたが、この例として、
読み情報「すくーる」は図5に示す辞書部4の表記部の
制御コードと数値情報に置き換えられている。この図に
示すように表記部の先頭が制御コード、この例では、
「カタカナのヲ」とこれに続く数値情報に基づいて図6
に示す外国語スペル辞書の連番インデックスを検索す
る。
【0023】即ち、外国語スペル変換、スペルチェック
用の連番インデックスにはそれに対応する表記データ
(単語)が50番目ごとに外国語スペル辞書本体に登録
している単語のアドレスに該当する情報(連番インデッ
クス)が入っており、表記部の数値情報に一番近い(大
小関係は以下の数値)アドレスから辞書本体に格納され
ている表記データを検索し、その該当番号のところにあ
る表記部の表記データ「SCHOOL」を読出して表示
部3に出力する。
用の連番インデックスにはそれに対応する表記データ
(単語)が50番目ごとに外国語スペル辞書本体に登録
している単語のアドレスに該当する情報(連番インデッ
クス)が入っており、表記部の数値情報に一番近い(大
小関係は以下の数値)アドレスから辞書本体に格納され
ている表記データを検索し、その該当番号のところにあ
る表記部の表記データ「SCHOOL」を読出して表示
部3に出力する。
【0024】図7は図6における表記部と1次インデッ
クスと2次インデックスを示す説明図である。スペルチ
ェック機能としての外国語スペル辞書としては、スペル
チェックを行う場合は先頭文字がa〜z、A〜Zに分か
れた1次インデックスと2文字目以降の文字がどのよう
にあってスペルチェックのどのアドレスかを示す2次イ
ンデックスとそれに対応する外国語表記スペルの表記部
から構成されている。
クスと2次インデックスを示す説明図である。スペルチ
ェック機能としての外国語スペル辞書としては、スペル
チェックを行う場合は先頭文字がa〜z、A〜Zに分か
れた1次インデックスと2文字目以降の文字がどのよう
にあってスペルチェックのどのアドレスかを示す2次イ
ンデックスとそれに対応する外国語表記スペルの表記部
から構成されている。
【0025】例えば、“barrel”という単語のス
ペルチェックを行う場合は、図7に示すように、まず、
1次インデックスのbから始まるアドレスに示されてい
る2次インデックスのポインタを検索しにいき、2次イ
ンデックスに格納されている“文字、重複フラッグ”を
検索する。この例では、1列目は“a,1"なのでba…
から始まるアドレ2列目は“r,2“なのでbar…から
始まるアドレス、3列目は“r,3"なのでbarr…か
ら始まるアドレス、4列目は“b,1"なのでbb…から
始まるアドレスなので、3列目のbarrのアドレスに
示されている表記部のデータからさらに残りの“el”
を順次見つけていき、“el”がなければスペルミスと
判定される。
ペルチェックを行う場合は、図7に示すように、まず、
1次インデックスのbから始まるアドレスに示されてい
る2次インデックスのポインタを検索しにいき、2次イ
ンデックスに格納されている“文字、重複フラッグ”を
検索する。この例では、1列目は“a,1"なのでba…
から始まるアドレ2列目は“r,2“なのでbar…から
始まるアドレス、3列目は“r,3"なのでbarr…か
ら始まるアドレス、4列目は“b,1"なのでbb…から
始まるアドレスなので、3列目のbarrのアドレスに
示されている表記部のデータからさらに残りの“el”
を順次見つけていき、“el”がなければスペルミスと
判定される。
【0026】従来、図4に示す仮名漢字変換辞書の表記
部は全ての文字に対し1文字×2バイトを有していたも
のが、この方式を用いれば、図5に示す辞書部4の表記
部の制御コード「ヲ」(1バイト)+数値情報(2バイ
ト)で置き換えられるので、どんなに長い表記データ
(文字列)でも、3バイトで済む。ここで、外国語スペ
ル辞書を英語スペル辞書に置き換えらると、この辞書に
格納される英単語が6万語あれば,スペル変換の連番イ
ンデックスは、1200種として、1200種×2バイ
ト=2400バイトである。実際に評価使用中の英単語
6万語の中にある英字表記スペル(データ)を7000
語と仮定して、平均7文字×2バイト=14バイトとす
れば、従来の英字表記データ分は、14バイト×700
0語=98000バイトである。制御コードと数値情報
を3バイトとして、この方式のアドレスデータ分は、3
バイト×7000語=21000バイト である。 増加分 連番インデックス分 2400バイト 減少分 英字表記データ分 98000−21000
=77000バイト よって、77000−2400=74600バイトの容
量圧縮が図られることになる。
部は全ての文字に対し1文字×2バイトを有していたも
のが、この方式を用いれば、図5に示す辞書部4の表記
部の制御コード「ヲ」(1バイト)+数値情報(2バイ
ト)で置き換えられるので、どんなに長い表記データ
(文字列)でも、3バイトで済む。ここで、外国語スペ
ル辞書を英語スペル辞書に置き換えらると、この辞書に
格納される英単語が6万語あれば,スペル変換の連番イ
ンデックスは、1200種として、1200種×2バイ
ト=2400バイトである。実際に評価使用中の英単語
6万語の中にある英字表記スペル(データ)を7000
語と仮定して、平均7文字×2バイト=14バイトとす
れば、従来の英字表記データ分は、14バイト×700
0語=98000バイトである。制御コードと数値情報
を3バイトとして、この方式のアドレスデータ分は、3
バイト×7000語=21000バイト である。 増加分 連番インデックス分 2400バイト 減少分 英字表記データ分 98000−21000
=77000バイト よって、77000−2400=74600バイトの容
量圧縮が図られることになる。
【0027】従って、外国語スペル辞書の外国語表記デ
ータと仮名漢字変換辞書で表記データが外国語表記スペ
ルのものを制御コードと数値情報に置き換え、外国語ス
ペル辞書の連番インデックスと連結させて、仮名漢字変
換辞書の外国語表記データの容量圧縮が図られる。
ータと仮名漢字変換辞書で表記データが外国語表記スペ
ルのものを制御コードと数値情報に置き換え、外国語ス
ペル辞書の連番インデックスと連結させて、仮名漢字変
換辞書の外国語表記データの容量圧縮が図られる。
【0028】
【発明の効果】この発明によれば、外国語スペル辞書の
外国語表記データと、仮名漢字変換辞書の外国語表記デ
ータと有効に連結させて仮名漢字変換辞書の容量圧縮が
図られる。
外国語表記データと、仮名漢字変換辞書の外国語表記デ
ータと有効に連結させて仮名漢字変換辞書の容量圧縮が
図られる。
【図1】この発明の構成を示すブロック図。
【図2】この発明を仮名漢字変換処理装置に適用したー
実施例を示すブロック図。
実施例を示すブロック図。
【図3】この発明の仮名漢字変換の処理内容を示すフロ
ーチャートである。
ーチャートである。
【図4】従来の仮名漢字変換辞書の表記部を示す説明
図。
図。
【図5】辞書部4の表記部の制御コードと数値情報を示
す説明図。
す説明図。
【図6】外国語スペル辞書6の表記部と連番インデック
スを示す説明図
スを示す説明図
【図7】図6における表記部と1次インデックスと2次
インデックスを示す説明図。
インデックスを示す説明図。
1 入力部 2 制御部 3 表示部 4 辞書部 5 共起関係辞書 6 外国語スペル辞書 7 バッファ
Claims (1)
- 【請求項1】 連文節変換機能を有する仮名漢字変換処
理装置において、文字列の入力と文字列の変換の指示を
する入力手段と、入力手段から入力された文字列および
変換結果を記憶する記憶手段と、この文字列を文節に分
割するための文節わかち手段と、文節に含まれる外国語
の読みを外国語表記スペルもしくは外国語表記交じりス
ペルに変換するための外国語表記スペルとこの外国語表
記スペルを検索するためのアドレスを示す連番インデッ
クスを格納している外国語スペル辞書と、文節を漢字も
しくは漢字交じり文節に変換するための漢字表記および
連文節の共起情報を格納するとともに外国語スペル辞書
の外国語表記スペルを検索するためのアドレスを示す制
御コードと数値情報を格納している仮名漢字変換辞書
と、入力手段の指示により、文節わかち手段によって分
割された文節の中に外国語の読みがあれば、仮名漢字変
換辞書の制御コードと数値情報と外国語スペル辞書の連
番インデックスに基づいて外国語スペル辞書に格納され
ている外国語表記スペルに変換する変換手段と、入力さ
れた文字列あるいは変換結果を表示画面に表示する表示
手段を備えてなる仮名漢字変換処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4041652A JPH05242074A (ja) | 1992-02-27 | 1992-02-27 | 仮名漢字変換処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4041652A JPH05242074A (ja) | 1992-02-27 | 1992-02-27 | 仮名漢字変換処理装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH05242074A true JPH05242074A (ja) | 1993-09-21 |
Family
ID=12614298
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4041652A Pending JPH05242074A (ja) | 1992-02-27 | 1992-02-27 | 仮名漢字変換処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH05242074A (ja) |
-
1992
- 1992-02-27 JP JP4041652A patent/JPH05242074A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5418718A (en) | Method for providing linguistic functions of English text in a mixed document of single-byte characters and double-byte characters | |
| JPS619753A (ja) | 文書処理装置における頻発熟語の自動登録方法 | |
| JPH08314910A (ja) | 異種コード文字列転記装置および電子辞書 | |
| JPH05242074A (ja) | 仮名漢字変換処理装置 | |
| JP2621999B2 (ja) | 文書処理装置 | |
| JPS6246029B2 (ja) | ||
| JPS628259A (ja) | かな漢字変換方式 | |
| JPS5998236A (ja) | 日本文入力装置 | |
| JP2698192B2 (ja) | 電子辞書における第2言語検索方法 | |
| JP2837010B2 (ja) | 仮名漢字変換処理装置 | |
| JPH0623973B2 (ja) | 文字処理装置の頻度変更方式 | |
| JPS63657A (ja) | 日本語ワ−ドプロセツサ | |
| JPH0785040A (ja) | 表記不統一検出方法およびかな漢字変換方法 | |
| JP2008059169A (ja) | 中国語例文検索装置および中国語例文検索処理プログラム | |
| JP3273778B2 (ja) | 仮名漢字変換装置及び仮名漢字変換方法 | |
| JP3537888B2 (ja) | かな漢字変換装置 | |
| JP3049502B2 (ja) | かな漢字変換装置 | |
| JPH0335349A (ja) | 用例表示機能付き文書処理装置 | |
| JP2005293069A (ja) | 電子辞書 | |
| JP2004038869A (ja) | 文章表示変換装置 | |
| JPH0385669A (ja) | 送りがな解析機能付き検索置換装置 | |
| JPS5814688B2 (ja) | 同音異義語順次表示を行なう漢字まじり文入力装置 | |
| JPH0877160A (ja) | かな漢字変換方法及び装置 | |
| JPH05174018A (ja) | かな漢字変換装置 | |
| JPH0520303A (ja) | 日本語文書処理装置 |