JP2000293635A - 文字認識装置及び方法並びに文字認識プログラム記録媒体 - Google Patents
文字認識装置及び方法並びに文字認識プログラム記録媒体Info
- Publication number
- JP2000293635A JP2000293635A JP11102584A JP10258499A JP2000293635A JP 2000293635 A JP2000293635 A JP 2000293635A JP 11102584 A JP11102584 A JP 11102584A JP 10258499 A JP10258499 A JP 10258499A JP 2000293635 A JP2000293635 A JP 2000293635A
- Authority
- JP
- Japan
- Prior art keywords
- character
- word
- stored
- similarity
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000001186 cumulative effect Effects 0.000 claims abstract description 87
- 230000002542 deteriorative effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】 1単語データの各1文字分が細分化された文
字パターンデータを1単語分として認識する文字認識装
置において、累積類似度計算の時間を削減すると同時に
認識精度を低下させず、高速に認識結果を得る。 【解決手段】 単語辞書記憶部13及び文字パターン記
憶部12の情報を順次読出し、記憶部12に記憶されて
いる有効単語文字数と単語辞書より順次読出された単語
文字数との比較結果が文字数範囲内でない場合は、次単
語を読出す。記憶部12に記憶されている各文字パター
ンデータの各文字接続数と文字パターンの各文字に対す
る類似度と比較部15の比較結果により、単語辞書の各
単語と類似しているか累積類似度を計算する。この累積
類似度を前回計算したものと比較し、単語候補として記
憶するかどうか判断し、記憶する。この記憶された累積
類似度を順に並べ換える。
字パターンデータを1単語分として認識する文字認識装
置において、累積類似度計算の時間を削減すると同時に
認識精度を低下させず、高速に認識結果を得る。 【解決手段】 単語辞書記憶部13及び文字パターン記
憶部12の情報を順次読出し、記憶部12に記憶されて
いる有効単語文字数と単語辞書より順次読出された単語
文字数との比較結果が文字数範囲内でない場合は、次単
語を読出す。記憶部12に記憶されている各文字パター
ンデータの各文字接続数と文字パターンの各文字に対す
る類似度と比較部15の比較結果により、単語辞書の各
単語と類似しているか累積類似度を計算する。この累積
類似度を前回計算したものと比較し、単語候補として記
憶するかどうか判断し、記憶する。この記憶された累積
類似度を順に並べ換える。
Description
【0001】
【発明の属する技術分野】本発明は文字認識装置及び文
字認識方法並びに文字認識プログラム記録媒体に関し、
1単語単位の単語データの各1文字分が細分化された文
字パターンデータを1単語分として認識する文字認識装
置及び文字認識方法並びに文字認識プログラム記録媒体
に関するものである。
字認識方法並びに文字認識プログラム記録媒体に関し、
1単語単位の単語データの各1文字分が細分化された文
字パターンデータを1単語分として認識する文字認識装
置及び文字認識方法並びに文字認識プログラム記録媒体
に関するものである。
【0002】
【従来の技術】従来より開発されている文字認識装置で
は、1単語データの各1文字分が細分化された文字パタ
ーンデータから様々な認識手段を用いて1文字分を認識
し、更に1単語を認識することで、単語辞書内のどの単
語ともっとも類似しているか判断し、その結果を出力し
ている。この場合、認識精度を向上させるために複雑な
認識処理をすることにより処理時間が増大し、認識処理
速度が低下してしまうという問題がある。
は、1単語データの各1文字分が細分化された文字パタ
ーンデータから様々な認識手段を用いて1文字分を認識
し、更に1単語を認識することで、単語辞書内のどの単
語ともっとも類似しているか判断し、その結果を出力し
ている。この場合、認識精度を向上させるために複雑な
認識処理をすることにより処理時間が増大し、認識処理
速度が低下してしまうという問題がある。
【0003】このような問題を解決する従来の文字認識
装置の1つとして、例えば、特開平7−239917号
公報に記載されているような文字認識装置がある。同公
報に記載されている文字認識装置について図3を参照し
て説明する。
装置の1つとして、例えば、特開平7−239917号
公報に記載されているような文字認識装置がある。同公
報に記載されている文字認識装置について図3を参照し
て説明する。
【0004】同図において、従来の文字認識装置は、文
字画像から1文字ごとの文字画像を切出す文字切出し部
1と、文字画像同士を比較する文字画像比較部2と、文
字認識を行う文字認識部3と、文字画像を記憶する文字
画像記憶部4と、各部を制御する制御部6と、文字属性
同士を比較して類似度を計算する文字属性比較部7とを
含んで構成されている。文字画像記憶部4内の記憶単位
5は、文字属性、文字画像に関する情報、文字コード及
び頻度情報からなるものとする。
字画像から1文字ごとの文字画像を切出す文字切出し部
1と、文字画像同士を比較する文字画像比較部2と、文
字認識を行う文字認識部3と、文字画像を記憶する文字
画像記憶部4と、各部を制御する制御部6と、文字属性
同士を比較して類似度を計算する文字属性比較部7とを
含んで構成されている。文字画像記憶部4内の記憶単位
5は、文字属性、文字画像に関する情報、文字コード及
び頻度情報からなるものとする。
【0005】かかる構成において、文字切出し部1は、
文字画像から1文字ごとの文字画像を切出し、文字画像
比較部2、文字認識部3、文字画像記憶部4に渡すとと
もに、切出した文字画像の文字属性を文字属性比較部7
及び文字画像記憶部4に渡す。
文字画像から1文字ごとの文字画像を切出し、文字画像
比較部2、文字認識部3、文字画像記憶部4に渡すとと
もに、切出した文字画像の文字属性を文字属性比較部7
及び文字画像記憶部4に渡す。
【0006】文字属性比較部7は、文字切出し部1から
渡される文字属性と、制御部6によって読出された文字
画像記憶部4に記憶されている文字属性とを比較し、類
似度を計算する。そして、予め定められた値より類似度
が大きい場合には、文字画像比較部2と文字認識部3の
計算を継続するように制御部6に通知する。予め定めら
れた値より類似度が小さい場合には、文字画像比較部2
で行われている文字画像に関する情報との類似度計算を
中止するように、制御部6に通知し、文字切出し部1よ
り新たな文字画像が出力されるまで、動作を停止する。
渡される文字属性と、制御部6によって読出された文字
画像記憶部4に記憶されている文字属性とを比較し、類
似度を計算する。そして、予め定められた値より類似度
が大きい場合には、文字画像比較部2と文字認識部3の
計算を継続するように制御部6に通知する。予め定めら
れた値より類似度が小さい場合には、文字画像比較部2
で行われている文字画像に関する情報との類似度計算を
中止するように、制御部6に通知し、文字切出し部1よ
り新たな文字画像が出力されるまで、動作を停止する。
【0007】
【発明が解決しようとする課題】上述した構成では、類
似度の計算を行った後、改めて類似度の大小を判断し、
計算の続行か中止かを判断しているため、次の単語に移
るまでの処理時間が増大するという欠点がある。
似度の計算を行った後、改めて類似度の大小を判断し、
計算の続行か中止かを判断しているため、次の単語に移
るまでの処理時間が増大するという欠点がある。
【0008】また、上述した構成では、既に1文字分の
文字を認識していることを仮定しているが、1文字が細
分化された文字パターンデータの場合は、判断不可能で
ある。このような場合、従来では、隣り合った各文字デ
ータを予め定められた接続組み合わせ分の累積類似度計
算をすることで1文字となる組み合わせ数を導き出して
いた。この従来の構成では、時として余分な接続組み合
わせの累積類似度計算を強いられ、処理時間の増大を招
くという欠点がある。
文字を認識していることを仮定しているが、1文字が細
分化された文字パターンデータの場合は、判断不可能で
ある。このような場合、従来では、隣り合った各文字デ
ータを予め定められた接続組み合わせ分の累積類似度計
算をすることで1文字となる組み合わせ数を導き出して
いた。この従来の構成では、時として余分な接続組み合
わせの累積類似度計算を強いられ、処理時間の増大を招
くという欠点がある。
【0009】さらにまた、上述した構成では、毎回1文
字分の認識結果を出力するようになっており、最も類似
している結果がどの結果であるか、改めて処理しなけれ
ばならないという欠点がある。
字分の認識結果を出力するようになっており、最も類似
している結果がどの結果であるか、改めて処理しなけれ
ばならないという欠点がある。
【0010】本発明は上述した従来技術の欠点を解決す
るためになされたものであり、その目的は累積類似度計
算の時間を短縮すると同時に、認識精度を低下させず
に、高速に単語認識結果を得ることができる文字認識装
置を提供することである。
るためになされたものであり、その目的は累積類似度計
算の時間を短縮すると同時に、認識精度を低下させず
に、高速に単語認識結果を得ることができる文字認識装
置を提供することである。
【0011】
【課題を解決するための手段】本発明による文字認識装
置は、1単語データの各1文字分が細分化された切出し
文字パターンデータを1単語分として認識する文字認識
装置において、単語が記憶されている単語辞書と、切出
された文字パターンデータの切出し文字数、各文字類似
度、各文字接続数、有効単語文字数を記憶する文字パタ
ーン記憶手段と、前記単語辞書と前記文字パターン記憶
手段の情報を順次読出すアドレス制御手段と、前記文字
パターン記憶手段に記憶されている有効単語文字数と単
語辞書より順次読出された単語文字数との比較結果が文
字数範囲内でない場合は、前記単語辞書に記憶されてい
る次単語を読出すように前記アドレス制御手段を制御す
る文字数比較手段と、前記文字パターン記憶手段に記憶
されている各文字パターンデータの各文字接続数及び文
字パターンの各文字に対する類似度である各文字類似度
並びに前記文字数比較手段の比較結果に基づいて、切出
された文字パターンデータがどれだけ単語辞書の各単語
と類似しているか累積類似度計算する累積類似度計算手
段と、累積類似度を記憶する単語候補記憶手段と、前記
累積類似度計算手段で計算された累積類似度と前記単語
候補記憶手段に記憶されている累積類似度とを比較し単
語候補とする場合には前記単語候補記憶手段に記憶させ
る計算結果比較手段と、前記単語候補記憶手段に記憶さ
れた累積類似度を順に並べ換える順位付け手段とを有す
ることを特徴とする。そして、前記累積類似度計算手段
は、前記文字パターン記憶手段に記憶されている1文字
が細分化された各文字パターンデータの文字接続数に従
い隣り合った各文字データを1文字として接続し、前記
文字パターン記憶手段に記憶されている各文字類似度か
らどれだけ単語辞書の各単語と類似しているか計算処理
することを特徴とする。また、前記文字数比較手段は、
前記文字パターン記憶手段に記憶されている有効単語文
字数と単語辞書より順次読出された単語文字数を比較
し、結果が文字数範囲内でない場合は、上記累積類似度
計算手段の計算処理をせずに前記単語辞書に記憶されて
いる次単語を読出すように前記アドレス制御手段にを制
御することを特徴とする。さらに、前記順位付け手段
は、前記単語候補記憶手段の結果である累積類似度につ
いて予め決められた数の最有力候補のみを順に並べ変え
ることを特徴とする。
置は、1単語データの各1文字分が細分化された切出し
文字パターンデータを1単語分として認識する文字認識
装置において、単語が記憶されている単語辞書と、切出
された文字パターンデータの切出し文字数、各文字類似
度、各文字接続数、有効単語文字数を記憶する文字パタ
ーン記憶手段と、前記単語辞書と前記文字パターン記憶
手段の情報を順次読出すアドレス制御手段と、前記文字
パターン記憶手段に記憶されている有効単語文字数と単
語辞書より順次読出された単語文字数との比較結果が文
字数範囲内でない場合は、前記単語辞書に記憶されてい
る次単語を読出すように前記アドレス制御手段を制御す
る文字数比較手段と、前記文字パターン記憶手段に記憶
されている各文字パターンデータの各文字接続数及び文
字パターンの各文字に対する類似度である各文字類似度
並びに前記文字数比較手段の比較結果に基づいて、切出
された文字パターンデータがどれだけ単語辞書の各単語
と類似しているか累積類似度計算する累積類似度計算手
段と、累積類似度を記憶する単語候補記憶手段と、前記
累積類似度計算手段で計算された累積類似度と前記単語
候補記憶手段に記憶されている累積類似度とを比較し単
語候補とする場合には前記単語候補記憶手段に記憶させ
る計算結果比較手段と、前記単語候補記憶手段に記憶さ
れた累積類似度を順に並べ換える順位付け手段とを有す
ることを特徴とする。そして、前記累積類似度計算手段
は、前記文字パターン記憶手段に記憶されている1文字
が細分化された各文字パターンデータの文字接続数に従
い隣り合った各文字データを1文字として接続し、前記
文字パターン記憶手段に記憶されている各文字類似度か
らどれだけ単語辞書の各単語と類似しているか計算処理
することを特徴とする。また、前記文字数比較手段は、
前記文字パターン記憶手段に記憶されている有効単語文
字数と単語辞書より順次読出された単語文字数を比較
し、結果が文字数範囲内でない場合は、上記累積類似度
計算手段の計算処理をせずに前記単語辞書に記憶されて
いる次単語を読出すように前記アドレス制御手段にを制
御することを特徴とする。さらに、前記順位付け手段
は、前記単語候補記憶手段の結果である累積類似度につ
いて予め決められた数の最有力候補のみを順に並べ変え
ることを特徴とする。
【0012】本発明による文字認識方法は、単語が記憶
されている単語辞書と、切出された文字パターンデータ
の切出し文字数、各文字類似度、各文字接続数、有効単
語文字数を記憶する文字パターン記憶部とを含み、1単
語データの各1文字分が細分化された切出し文字パター
ンデータを1単語分として認識する文字認識装置におけ
る文字認識方法であって、前記文字パターン記憶部に記
憶されている有効単語文字数と単語辞書より順次読出さ
れた単語文字数との比較結果が文字数範囲内でない場合
は、前記単語辞書に記憶されている次単語を読出す文字
数比較ステップと、前記文字パターン記憶部に記憶され
ている各文字パターンデータの各文字接続数及び文字パ
ターンの各文字に対する類似度である各文字類似度並び
に前記文字数比較ステップの比較結果に基づいて、切出
された文字パターンデータがどれだけ単語辞書の各単語
と類似しているか累積類似度計算する累積類似度計算ス
テップと、この計算された累積類似度と単語候補記憶部
に記憶されている累積類似度とを比較し単語候補とする
場合には前記単語候補記憶部に記憶させる計算結果比較
ステップと、前記単語候補記憶部に記憶された累積類似
度を順に並べ換える順位付けステップとを含むことを特
徴とする。
されている単語辞書と、切出された文字パターンデータ
の切出し文字数、各文字類似度、各文字接続数、有効単
語文字数を記憶する文字パターン記憶部とを含み、1単
語データの各1文字分が細分化された切出し文字パター
ンデータを1単語分として認識する文字認識装置におけ
る文字認識方法であって、前記文字パターン記憶部に記
憶されている有効単語文字数と単語辞書より順次読出さ
れた単語文字数との比較結果が文字数範囲内でない場合
は、前記単語辞書に記憶されている次単語を読出す文字
数比較ステップと、前記文字パターン記憶部に記憶され
ている各文字パターンデータの各文字接続数及び文字パ
ターンの各文字に対する類似度である各文字類似度並び
に前記文字数比較ステップの比較結果に基づいて、切出
された文字パターンデータがどれだけ単語辞書の各単語
と類似しているか累積類似度計算する累積類似度計算ス
テップと、この計算された累積類似度と単語候補記憶部
に記憶されている累積類似度とを比較し単語候補とする
場合には前記単語候補記憶部に記憶させる計算結果比較
ステップと、前記単語候補記憶部に記憶された累積類似
度を順に並べ換える順位付けステップとを含むことを特
徴とする。
【0013】本発明による文字認識プログラムを記録し
た記録媒体は、単語が記憶されている単語辞書と、切出
された文字パターンデータの切出し文字数、各文字類似
度、各文字接続数、有効単語文字数を記憶する文字パタ
ーン記憶部とを含み、1単語データの各1文字分が細分
化された切出し文字パターンデータを1単語分として認
識する文字認識装置を制御するための文字認識プログラ
ムを記録した記録媒体であって、該文字認識プログラム
は、前記文字パターン記憶部に記憶されている有効単語
文字数と単語辞書より順次読出された単語文字数との比
較結果が文字数範囲内でない場合は、前記単語辞書に記
憶されている次単語を読出す文字数比較ステップと、前
記文字パターン記憶部に記憶されている各文字パターン
データの各文字接続数及び文字パターンの各文字に対す
る類似度である各文字類似度並びに前記文字数比較ステ
ップの比較結果に基づいて、切出された文字パターンデ
ータがどれだけ単語辞書の各単語と類似しているか累積
類似度計算する累積類似度計算ステップと、この計算さ
れた累積類似度と単語候補記憶部に記憶されている累積
類似度とを比較して単語候補とする場合には前記単語候
補記憶部に記憶させる計算結果比較ステップと、前記単
語候補記憶部に記憶された累積類似度を順に並べ換える
順位付けステップとを含むことを特徴とする。
た記録媒体は、単語が記憶されている単語辞書と、切出
された文字パターンデータの切出し文字数、各文字類似
度、各文字接続数、有効単語文字数を記憶する文字パタ
ーン記憶部とを含み、1単語データの各1文字分が細分
化された切出し文字パターンデータを1単語分として認
識する文字認識装置を制御するための文字認識プログラ
ムを記録した記録媒体であって、該文字認識プログラム
は、前記文字パターン記憶部に記憶されている有効単語
文字数と単語辞書より順次読出された単語文字数との比
較結果が文字数範囲内でない場合は、前記単語辞書に記
憶されている次単語を読出す文字数比較ステップと、前
記文字パターン記憶部に記憶されている各文字パターン
データの各文字接続数及び文字パターンの各文字に対す
る類似度である各文字類似度並びに前記文字数比較ステ
ップの比較結果に基づいて、切出された文字パターンデ
ータがどれだけ単語辞書の各単語と類似しているか累積
類似度計算する累積類似度計算ステップと、この計算さ
れた累積類似度と単語候補記憶部に記憶されている累積
類似度とを比較して単語候補とする場合には前記単語候
補記憶部に記憶させる計算結果比較ステップと、前記単
語候補記憶部に記憶された累積類似度を順に並べ換える
順位付けステップとを含むことを特徴とする。
【0014】要するに本文字認識装置では、文字認識処
理の中で処理時間が多くかかる累積類似度計算をする前
段階で、認識すべき単語の文字パターン情報の文字数を
比較することで処理時間を短縮し、更に、1文字が細分
化された文字パターンデータにおいて、認識すべき単語
の文字パターン情報の各文字接続数を参照することで、
1文字となる組み合わせ数を導き出す処理時間を短縮す
ることができる。また、多数の単語を納めた単語辞書よ
り、予め定められた単語数の上位候補を並び換えてその
結果を出力することができる。
理の中で処理時間が多くかかる累積類似度計算をする前
段階で、認識すべき単語の文字パターン情報の文字数を
比較することで処理時間を短縮し、更に、1文字が細分
化された文字パターンデータにおいて、認識すべき単語
の文字パターン情報の各文字接続数を参照することで、
1文字となる組み合わせ数を導き出す処理時間を短縮す
ることができる。また、多数の単語を納めた単語辞書よ
り、予め定められた単語数の上位候補を並び換えてその
結果を出力することができる。
【0015】
【発明の実施の形態】次に、本発明の実施の一形態につ
いて図面を参照して説明する。図1は本発明による文字
認識装置の実施の一形態を示すブロック図である。
いて図面を参照して説明する。図1は本発明による文字
認識装置の実施の一形態を示すブロック図である。
【0016】同図において本装置は、文字パターン記憶
部11及び単語辞書記憶部13に対して、データ読出し
のための制御信号を与えるアドレス制御部10と、切出
し文字数、各文字類似度、各文字接続数、有効単語文字
数を文字パターン記憶単位12として記憶する文字パタ
ーン記憶部11と、各単語についての辞書単語番号、単
語文字情報、単語文字数を記憶する単語辞書記憶部13
と、文字パターン記憶単位12の有効単語文字数及び単
語記憶単位14の単語文字数から計算対象の単語である
かどうかの比較判断を行う文字数比較部15と、計算処
理の指示と文字比較部6からの単語文字数を受取り、文
字パターン記憶単位12の切出し文字数、各文字類似
度、各文字接続数を基に累積類似度を計算する累積類似
度計算部16と、累積類似度計算部16で計算された計
算結果と単語候補記憶部18に記憶されている計算結果
とを比較する計算結果比較部17と、単語候補を記憶す
る単語候補記憶部18と、単語候補記憶部18に記憶さ
れた単語候補について累積類似度の大きいものから順に
順位付けする結果順位付け部19とを含んで構成されて
いる。
部11及び単語辞書記憶部13に対して、データ読出し
のための制御信号を与えるアドレス制御部10と、切出
し文字数、各文字類似度、各文字接続数、有効単語文字
数を文字パターン記憶単位12として記憶する文字パタ
ーン記憶部11と、各単語についての辞書単語番号、単
語文字情報、単語文字数を記憶する単語辞書記憶部13
と、文字パターン記憶単位12の有効単語文字数及び単
語記憶単位14の単語文字数から計算対象の単語である
かどうかの比較判断を行う文字数比較部15と、計算処
理の指示と文字比較部6からの単語文字数を受取り、文
字パターン記憶単位12の切出し文字数、各文字類似
度、各文字接続数を基に累積類似度を計算する累積類似
度計算部16と、累積類似度計算部16で計算された計
算結果と単語候補記憶部18に記憶されている計算結果
とを比較する計算結果比較部17と、単語候補を記憶す
る単語候補記憶部18と、単語候補記憶部18に記憶さ
れた単語候補について累積類似度の大きいものから順に
順位付けする結果順位付け部19とを含んで構成されて
いる。
【0017】アドレス制御部10は、制御信号100に
より文字パターン記憶部11と、単語辞書記憶部13に
対して、データ読出しのための制御信号を与える。これ
により、文字パターン記憶部11から信号線101によ
って文字比較部6に文字パターン記憶単位12の有効単
語文字数が送られ、同時に文字パターン記憶部11から
信号線105によって累積類似度計算部16に文字パタ
ーン記憶単位12の切出し文字数、各文字類似度、各文
字接続数が送られる。
より文字パターン記憶部11と、単語辞書記憶部13に
対して、データ読出しのための制御信号を与える。これ
により、文字パターン記憶部11から信号線101によ
って文字比較部6に文字パターン記憶単位12の有効単
語文字数が送られ、同時に文字パターン記憶部11から
信号線105によって累積類似度計算部16に文字パタ
ーン記憶単位12の切出し文字数、各文字類似度、各文
字接続数が送られる。
【0018】また、単語辞書記憶部13から信号線10
2によって文字比較部6に単語記憶単位14の単語文字
数が送られ、同時に単語辞書記憶部13から信号線10
6によって累積類似度計算部16に単語辞書記憶部13
の単語記憶単位14の辞書単語番号、単語文字情報が送
られる。
2によって文字比較部6に単語記憶単位14の単語文字
数が送られ、同時に単語辞書記憶部13から信号線10
6によって累積類似度計算部16に単語辞書記憶部13
の単語記憶単位14の辞書単語番号、単語文字情報が送
られる。
【0019】文字数比較部15は、信号線101によっ
て送られた、文字パターン記憶単位12の有効単語文字
数と信号線102によって送られた単語記憶単位14の
単語文字数から計算対象の単語であるかどうかの比較判
断をする。また、アドレス制御部10は、制御信号10
3によっても同様の動作をし、単語辞書記憶部13に対
しては、次単語の情報を読出すように制御信号100を
制御する。
て送られた、文字パターン記憶単位12の有効単語文字
数と信号線102によって送られた単語記憶単位14の
単語文字数から計算対象の単語であるかどうかの比較判
断をする。また、アドレス制御部10は、制御信号10
3によっても同様の動作をし、単語辞書記憶部13に対
しては、次単語の情報を読出すように制御信号100を
制御する。
【0020】文字パターン記憶部11には、認識すべき
単語の文字パターン情報として、切出し文字数、各文字
類似度、各文字接続数及び有効単語文字数が、文字パタ
ーン記憶単位12として記憶されている。
単語の文字パターン情報として、切出し文字数、各文字
類似度、各文字接続数及び有効単語文字数が、文字パタ
ーン記憶単位12として記憶されている。
【0021】文字パターン記憶単位12の切出し文字数
は、認識すべき単語がいくつの文字パターンとして切出
されたかを数値で示す。その各切出された文字パターン
は、1文字パターンで1文字として認識できるものもあ
れば、いくつかの文字パターンで1文字として認識され
るものもある。つまり、「切出し文字数」とは、文字認
識処理において切出された文字の数をいう。例えば、
「bum」という文字を認識する場合、本装置に入力さ
れる文字パターンデータが、「bum」や「burn」
である可能性がある。この場合の切出し文字数は、「3
文字」か「4文字」である。
は、認識すべき単語がいくつの文字パターンとして切出
されたかを数値で示す。その各切出された文字パターン
は、1文字パターンで1文字として認識できるものもあ
れば、いくつかの文字パターンで1文字として認識され
るものもある。つまり、「切出し文字数」とは、文字認
識処理において切出された文字の数をいう。例えば、
「bum」という文字を認識する場合、本装置に入力さ
れる文字パターンデータが、「bum」や「burn」
である可能性がある。この場合の切出し文字数は、「3
文字」か「4文字」である。
【0022】文字パターン記憶単位12の各文字類似度
は、上記で説明した文字パターンが1文字として認識で
きる類似度が類似度として数値で示される。類似度は、
1文字パターンで1文字として認識されるのか、隣り合
ったいくつかの文字パターンで1文字として認識される
のかを数値で示す。本例では、各文字類似度が大きいほ
ど類似度が高く、小さいほど類似度が小さいものとす
る。
は、上記で説明した文字パターンが1文字として認識で
きる類似度が類似度として数値で示される。類似度は、
1文字パターンで1文字として認識されるのか、隣り合
ったいくつかの文字パターンで1文字として認識される
のかを数値で示す。本例では、各文字類似度が大きいほ
ど類似度が高く、小さいほど類似度が小さいものとす
る。
【0023】つまり、「文字類似度」とは、切出された
文字それぞれがどんな文字と似ているかを数値で表した
ものである。例えば、「a」という文字が1文字目であ
る可能性が数値として表される。また、2文字目である
可能性が数値として表され、同様にn文字目である可能
性が数値として表される。この「n」は、有効単語文字
数の値によって変化する。
文字それぞれがどんな文字と似ているかを数値で表した
ものである。例えば、「a」という文字が1文字目であ
る可能性が数値として表される。また、2文字目である
可能性が数値として表され、同様にn文字目である可能
性が数値として表される。この「n」は、有効単語文字
数の値によって変化する。
【0024】文字パターン記憶単位12における各文字
接続数は、本発明で特徴となる構成要素であり、上記で
説明した文字パターンがいくつまでの接続範囲内で1文
字として認識されるかを数値で示す。
接続数は、本発明で特徴となる構成要素であり、上記で
説明した文字パターンがいくつまでの接続範囲内で1文
字として認識されるかを数値で示す。
【0025】従来、累積類似度の計算は予め決められた
回数分の計算をし、その中から類似度が一番最大になる
文字パターンの接続文字数を選んでいた。一方、文字パ
ターン記憶単位12の各文字接続数は、認識すべき単語
の文字パターンごとに付けられており、最大の類似度は
この文字接続数分だけ計算を実行することで求めること
が可能となる。
回数分の計算をし、その中から類似度が一番最大になる
文字パターンの接続文字数を選んでいた。一方、文字パ
ターン記憶単位12の各文字接続数は、認識すべき単語
の文字パターンごとに付けられており、最大の類似度は
この文字接続数分だけ計算を実行することで求めること
が可能となる。
【0026】つまり「文字接続数」とは、切出された文
字それぞれが隣合った文字からいくつ接続する可能性が
あるかを示す数である。例えば、「burn」という文
字であれば、後ろから順に着目すると、4文字目の
「n」は3文字目の「r」と接続し「m」となる可能性
がある。次に、「r」は「u」と接続する可能性はな
い。また、「u」は「b」と接続する可能性はない。し
たがって、この「burn」の場合、「b」,「r」及
び「u」の文字接続数は「0」、「n」の文字接続数は
「1」となる。
字それぞれが隣合った文字からいくつ接続する可能性が
あるかを示す数である。例えば、「burn」という文
字であれば、後ろから順に着目すると、4文字目の
「n」は3文字目の「r」と接続し「m」となる可能性
がある。次に、「r」は「u」と接続する可能性はな
い。また、「u」は「b」と接続する可能性はない。し
たがって、この「burn」の場合、「b」,「r」及
び「u」の文字接続数は「0」、「n」の文字接続数は
「1」となる。
【0027】文字パターン記憶単位12における有効単
語文字数は、本発明で特徴となる構成要素であり、認識
すべき単語が何文字で構成されうるか、文字数の有効範
囲を数値で示す。この有効単語文字数は、認識すべき単
語の文字数を最小値と最大値で示している。例えば、最
小値が3、最大値が6である場合、認識すべき単語は、
3文字から6文字の文字数範囲内の単語でありうる可能
性を数値で示す。
語文字数は、本発明で特徴となる構成要素であり、認識
すべき単語が何文字で構成されうるか、文字数の有効範
囲を数値で示す。この有効単語文字数は、認識すべき単
語の文字数を最小値と最大値で示している。例えば、最
小値が3、最大値が6である場合、認識すべき単語は、
3文字から6文字の文字数範囲内の単語でありうる可能
性を数値で示す。
【0028】つまり「有効単語文字数」とは、文字認識
処理中に必要とされるデータであり、何文字の単語であ
る可能性が高いかを最小値から最大値で設定される文字
数である。単語辞書に登録されている単語のどれと似て
いるかを本装置で算出する場合、最初に入力される文字
パターンデータの状態では、何文字の単語であるのかわ
からないので、その可能性を示す数が有効単語文字数で
ある。
処理中に必要とされるデータであり、何文字の単語であ
る可能性が高いかを最小値から最大値で設定される文字
数である。単語辞書に登録されている単語のどれと似て
いるかを本装置で算出する場合、最初に入力される文字
パターンデータの状態では、何文字の単語であるのかわ
からないので、その可能性を示す数が有効単語文字数で
ある。
【0029】また、単語辞書記憶部13には、予め用意
された各単語の情報として、辞書単語番号と、単語文字
情報、単語文字数が、単語記憶単位14として記憶され
ている。単語辞書記憶部13には、単語数分の単語記憶
単位14を記憶している。
された各単語の情報として、辞書単語番号と、単語文字
情報、単語文字数が、単語記憶単位14として記憶され
ている。単語辞書記憶部13には、単語数分の単語記憶
単位14を記憶している。
【0030】単語記憶単位14の辞書単語番号は、各単
語に予め順次付けられた番号である。単語記憶単位14
の単語文字情報は、どんな文字によって構成された単語
であるかを示す情報である。例えば、アルファベットの
どの文字が1番目の文字で、どの文字が2番目の文字で
あるかという情報が記憶されている。
語に予め順次付けられた番号である。単語記憶単位14
の単語文字情報は、どんな文字によって構成された単語
であるかを示す情報である。例えば、アルファベットの
どの文字が1番目の文字で、どの文字が2番目の文字で
あるかという情報が記憶されている。
【0031】単語記憶単位14の単語文字数は、各単語
が何文字で構成された単語であるかを数値で示す。
が何文字で構成された単語であるかを数値で示す。
【0032】文字数比較部15は、従来の構成要素には
ないものであり、信号線101によって送られた、文字
パターン記憶単位12の有効単語文字数と信号線102
によって送られた単語記憶単位14の単語文字数とから
計算対象の単語であるかどうかの比較判断をし、計算対
象の単語でなければアドレス制御部10に単語辞書記憶
部13の次単語を読出すように制御信号103を出力す
る。
ないものであり、信号線101によって送られた、文字
パターン記憶単位12の有効単語文字数と信号線102
によって送られた単語記憶単位14の単語文字数とから
計算対象の単語であるかどうかの比較判断をし、計算対
象の単語でなければアドレス制御部10に単語辞書記憶
部13の次単語を読出すように制御信号103を出力す
る。
【0033】例えば、文字パターン記憶単位12の有効
単語文字数が3文字から6文字で、現在読出されている
単語記憶単位14の単語文字数が8文字である場合、ア
ドレス制御部10に単語辞書記憶部13の次単語を読出
すように指示し、単語辞書記憶部13より次の新たな単
語文字数が読出された時、再度、計算対象の単語である
かどうかの比較判断し、計算対象の単語が読出されるか
単語辞書記憶部13の全ての単語と比較されるまで繰返
す。
単語文字数が3文字から6文字で、現在読出されている
単語記憶単位14の単語文字数が8文字である場合、ア
ドレス制御部10に単語辞書記憶部13の次単語を読出
すように指示し、単語辞書記憶部13より次の新たな単
語文字数が読出された時、再度、計算対象の単語である
かどうかの比較判断し、計算対象の単語が読出されるか
単語辞書記憶部13の全ての単語と比較されるまで繰返
す。
【0034】累積類似度計算部16は、制御信号104
によって送られる、計算処理の指示と文字比較部6から
の単語文字数とを受取り、アドレス制御部10により読
出された文字パターン記憶単位12の切出し文字数と、
各文字類似度と、各文字接続数が信号線105によって
送られ、単語記憶単位14の辞書番号と、単語文字情報
が信号線106によって送られたデータを元に周知のよ
うに累積類似度を計算する。
によって送られる、計算処理の指示と文字比較部6から
の単語文字数とを受取り、アドレス制御部10により読
出された文字パターン記憶単位12の切出し文字数と、
各文字類似度と、各文字接続数が信号線105によって
送られ、単語記憶単位14の辞書番号と、単語文字情報
が信号線106によって送られたデータを元に周知のよ
うに累積類似度を計算する。
【0035】この累積類似度を計算する場合、「文字類
似度」を「文字接続数」及び「単語辞書」にしたがって
加算していく。例えば、「bum」という文字を認識す
る場合、文字データパターンが「bum」や「bur
n」である可能性があるので、3文字か4文字であるこ
とを仮定して計算する。「b」の1文字目としての文字
類似度+「u」の2文字目としての文字類似度+「m」
の3文字目としての文字類似度の累積類似度と、「b」
の1文字目としての文字類似度+「u」の2文字目とし
ての文字類似度+「r」の3文字目としての文字類似度
+「n」の4文字目としての文字類似度の累積類似度と
を比較し、累積類似度の大きい方(最も似ている方)を
候補とする。
似度」を「文字接続数」及び「単語辞書」にしたがって
加算していく。例えば、「bum」という文字を認識す
る場合、文字データパターンが「bum」や「bur
n」である可能性があるので、3文字か4文字であるこ
とを仮定して計算する。「b」の1文字目としての文字
類似度+「u」の2文字目としての文字類似度+「m」
の3文字目としての文字類似度の累積類似度と、「b」
の1文字目としての文字類似度+「u」の2文字目とし
ての文字類似度+「r」の3文字目としての文字類似度
+「n」の4文字目としての文字類似度の累積類似度と
を比較し、累積類似度の大きい方(最も似ている方)を
候補とする。
【0036】計算結果比較部17は、制御線107から
送られる累積類似度計算部16で計算された計算結果と
制御線108から送られる単語候補記憶部18に記憶さ
れている計算結果とを比較し、予め定められた数のみ制
御線109より単語候補記憶部18に記憶する。例え
ば、予め10個の単語候補を記憶するのであれば、単語
候補記憶部18には、計算結果として累積類似度がもっ
とも大きいものから10個の累積類似度と辞書単語番号
が記憶される。
送られる累積類似度計算部16で計算された計算結果と
制御線108から送られる単語候補記憶部18に記憶さ
れている計算結果とを比較し、予め定められた数のみ制
御線109より単語候補記憶部18に記憶する。例え
ば、予め10個の単語候補を記憶するのであれば、単語
候補記憶部18には、計算結果として累積類似度がもっ
とも大きいものから10個の累積類似度と辞書単語番号
が記憶される。
【0037】単語候補記憶部18は、累積類似度計算の
計算結果と辞書単語番号を予め定められた数分、記憶す
る部分である。
計算結果と辞書単語番号を予め定められた数分、記憶す
る部分である。
【0038】結果順位付け部19は、単語候補記憶部1
8に記憶された単語候補を制御線110により読取り、
累積類似度の大きいものから順に順位付けするものであ
る。この順位付け結果は制御線111により単語候補記
憶部18に送られ、単語候補情報の記憶をやり直すこと
になる。
8に記憶された単語候補を制御線110により読取り、
累積類似度の大きいものから順に順位付けするものであ
る。この順位付け結果は制御線111により単語候補記
憶部18に送られ、単語候補情報の記憶をやり直すこと
になる。
【0039】
【実施例】以下、本発明のより詳細な実施例について図
1を参照して説明する。
1を参照して説明する。
【0040】ここでは、説明を簡単にするために信号線
101によって送られた文字パターン記憶単位12の有
効単語文字数が3文字から6文字であるものとする。ま
た、信号線102によって送られた単語記憶単位14の
単語文字数が8文字とする。すると現在読み込まれた辞
書単語は計算対象文字数でないため、制御信号103に
より、アドレス制御部10に次単語の読出しを指示す
る。それにより、新たに次の単語の情報が単語辞書記憶
部13から信号線102によって文字比較部6に単語記
憶単位14の単語文字数が送られ、同時に単語辞書記憶
部13から信号線106によって累積類似度計算部16
に単語辞書記憶部13の単語記憶単位14の辞書単語番
号、単語文字情報が送られる。そして、文字数比較部1
5は、再度、計算対象の単語であるかどうかの比較判断
し、計算対象の単語数である3文字から6文字の単語数
の単語が読出されるか単語辞書記憶部13の全ての単語
と比較されるまで繰返す。
101によって送られた文字パターン記憶単位12の有
効単語文字数が3文字から6文字であるものとする。ま
た、信号線102によって送られた単語記憶単位14の
単語文字数が8文字とする。すると現在読み込まれた辞
書単語は計算対象文字数でないため、制御信号103に
より、アドレス制御部10に次単語の読出しを指示す
る。それにより、新たに次の単語の情報が単語辞書記憶
部13から信号線102によって文字比較部6に単語記
憶単位14の単語文字数が送られ、同時に単語辞書記憶
部13から信号線106によって累積類似度計算部16
に単語辞書記憶部13の単語記憶単位14の辞書単語番
号、単語文字情報が送られる。そして、文字数比較部1
5は、再度、計算対象の単語であるかどうかの比較判断
し、計算対象の単語数である3文字から6文字の単語数
の単語が読出されるか単語辞書記憶部13の全ての単語
と比較されるまで繰返す。
【0041】もし、単語文字数が3文字から6文字であ
れば、累積類似度計算部16に制御信号104によっ
て、計算処理の指示と単語文字数を送る。
れば、累積類似度計算部16に制御信号104によっ
て、計算処理の指示と単語文字数を送る。
【0042】累積類似度計算部16は、制御信号104
によって送られる、計算処理の指示と文字比較部6から
の単語文字数を受取り、アドレス制御部10により、読
出された文字パターン記憶単位12の切出し文字数と、
各文字類似度と、各文字接続数が信号線105によって
送られ、単語記憶単位14の辞書番号と、単語文字情報
が信号信号106によって送られたデータを元に累積類
似度を計算する。累積類似度計算部16は、信号線10
5によって送られた情報と信号線106によって送られ
た情報により累積類似度を周知のようにして算出する回
路である。この算出された累積類似度は、信号線106
によって送られた単語記憶単位14の辞書番号と共に信
号線107を介して計算結果比較部17に送られる。
によって送られる、計算処理の指示と文字比較部6から
の単語文字数を受取り、アドレス制御部10により、読
出された文字パターン記憶単位12の切出し文字数と、
各文字類似度と、各文字接続数が信号線105によって
送られ、単語記憶単位14の辞書番号と、単語文字情報
が信号信号106によって送られたデータを元に累積類
似度を計算する。累積類似度計算部16は、信号線10
5によって送られた情報と信号線106によって送られ
た情報により累積類似度を周知のようにして算出する回
路である。この算出された累積類似度は、信号線106
によって送られた単語記憶単位14の辞書番号と共に信
号線107を介して計算結果比較部17に送られる。
【0043】計算結果比較部17は、信号線107から
送られた累積類似度と制御線108を介して読出した単
語候補記憶部18に記憶されている計算結果を比較す
る。単語候補記憶部18の計算結果は、10個の計算結
果が記憶される。計算結果比較部17は、毎単語ごとに
単語候補記憶部18の計算結果の中から最小の計算結果
(最も似ていないもの)を検索し、その検索された値と
信号線107から送られる計算結果の累積類似度と、辞
書単語番号を置き換え、制御線信号線109を介して記
憶する。
送られた累積類似度と制御線108を介して読出した単
語候補記憶部18に記憶されている計算結果を比較す
る。単語候補記憶部18の計算結果は、10個の計算結
果が記憶される。計算結果比較部17は、毎単語ごとに
単語候補記憶部18の計算結果の中から最小の計算結果
(最も似ていないもの)を検索し、その検索された値と
信号線107から送られる計算結果の累積類似度と、辞
書単語番号を置き換え、制御線信号線109を介して記
憶する。
【0044】結果順位付け部19は、単語候補記憶部1
8に記憶された10個の単語候補を制御線110により
読取り、累積類似度の大きいものから順に順位付けし、
制御線111により単語候補記憶部18に単語候補情報
の記憶をやり直す部分である。単語候補記憶部18に累
積類似度がもっとも大きいものから順に10個の累積類
似度と辞書単語番号が記憶される。
8に記憶された10個の単語候補を制御線110により
読取り、累積類似度の大きいものから順に順位付けし、
制御線111により単語候補記憶部18に単語候補情報
の記憶をやり直す部分である。単語候補記憶部18に累
積類似度がもっとも大きいものから順に10個の累積類
似度と辞書単語番号が記憶される。
【0045】この結果順位付け部19による順位付け
は、単語辞書内のすべての単語照合が終了した後に行わ
れる。本例では、単語候補記憶部18に最終的に10候
補の単語が残ることになるが、最初は単語候補記憶部1
8に何も記憶されていない。つまり最初は最低値が初期
値として単語候補記憶部18に記憶されている。計算結
果比較部17によって「最小の計算結果」を検索して値
を置き換えた後、結果順位付け部19で最後に順位付け
するのである。
は、単語辞書内のすべての単語照合が終了した後に行わ
れる。本例では、単語候補記憶部18に最終的に10候
補の単語が残ることになるが、最初は単語候補記憶部1
8に何も記憶されていない。つまり最初は最低値が初期
値として単語候補記憶部18に記憶されている。計算結
果比較部17によって「最小の計算結果」を検索して値
を置き換えた後、結果順位付け部19で最後に順位付け
するのである。
【0046】例えば、最低値を「−9999」とした場
合、初期値は、 候補0:−9999 候補1:−9999 候補2:−9999 候補3:−9999 候補4:−9999 候補5:−9999 候補6:−9999 候補7:−9999 候補8:−9999 候補9:−9999 である。そして、累積類似度計算部16による計算の結
果が、 候補0:+100 候補1:+4000 候補2:+800 候補3:−20 候補4:+6000 候補5:+200 候補6:−50 候補7:+5500 候補8:+3800 候補9:+4500 であるものとする。
合、初期値は、 候補0:−9999 候補1:−9999 候補2:−9999 候補3:−9999 候補4:−9999 候補5:−9999 候補6:−9999 候補7:−9999 候補8:−9999 候補9:−9999 である。そして、累積類似度計算部16による計算の結
果が、 候補0:+100 候補1:+4000 候補2:+800 候補3:−20 候補4:+6000 候補5:+200 候補6:−50 候補7:+5500 候補8:+3800 候補9:+4500 であるものとする。
【0047】この計算結果について結果順位付け部19
による順位付けを行うと、 候補0:+6000 候補1:+5500 候補2:+4500 候補3:+4000 候補4:+3800 候補5:+800 候補6:+200 候補7:+100 候補8:−20 候補9:−50 となる。
による順位付けを行うと、 候補0:+6000 候補1:+5500 候補2:+4500 候補3:+4000 候補4:+3800 候補5:+800 候補6:+200 候補7:+100 候補8:−20 候補9:−50 となる。
【0048】本発明の一実施例を上記に説明したが、本
発明においては上記の実施例のみに限らず、各種の付加
変更が可能である。例えば、文字パターン記憶単位12
の有効単語文字数を3文字から6文字としたり、単語候
補記憶部18に記憶される単語の候補数は10個とした
が、その数を増減することも可能である。また、これら
は、固定値である必要はなく、例えば、レジスタやメモ
リ等の記憶手段を他に付加し、数値を変化させることも
可能である。また、結果順位付け部19では、最大値の
累積類似度から順番に並べ換えているが、最小値から並
べ換えることも可能である。その他、本発明が上記実施
例に限定されず、本発明の技術思想の範囲内において、
各実施例は適宜変更され得ることは明らかである。
発明においては上記の実施例のみに限らず、各種の付加
変更が可能である。例えば、文字パターン記憶単位12
の有効単語文字数を3文字から6文字としたり、単語候
補記憶部18に記憶される単語の候補数は10個とした
が、その数を増減することも可能である。また、これら
は、固定値である必要はなく、例えば、レジスタやメモ
リ等の記憶手段を他に付加し、数値を変化させることも
可能である。また、結果順位付け部19では、最大値の
累積類似度から順番に並べ換えているが、最小値から並
べ換えることも可能である。その他、本発明が上記実施
例に限定されず、本発明の技術思想の範囲内において、
各実施例は適宜変更され得ることは明らかである。
【0049】ところで、本文字認識装置においては、単
語が記憶されている単語辞書と、切出された文字パター
ンデータの切出し文字数、各文字類似度、各文字接続
数、有効単語文字数を記憶する文字パターン記憶部とを
含み、1単語データの各1文字分が細分化された切出し
文字パターンデータを1単語分として認識する文字認識
装置における文字認識方法が実現されている。この文字
認識方法について図2を参照して説明する。
語が記憶されている単語辞書と、切出された文字パター
ンデータの切出し文字数、各文字類似度、各文字接続
数、有効単語文字数を記憶する文字パターン記憶部とを
含み、1単語データの各1文字分が細分化された切出し
文字パターンデータを1単語分として認識する文字認識
装置における文字認識方法が実現されている。この文字
認識方法について図2を参照して説明する。
【0050】同図において、まず最初に、文字パターン
記憶部に記憶されている有効単語文字数と単語辞書より
順次読出された単語文字数との比較結果が文字数範囲内
でない場合は、前記単語辞書に記憶されている次単語を
読出す(ステップS21)。次に、文字パターン記憶部
12に記憶されている各文字パターンデータの各文字接
続数及び文字パターンの各文字に対する類似度である各
文字類似度並びにステップS21の比較結果に基づい
て、切出された文字パターンデータがどれだけ単語辞書
の各単語と類似しているか累積類似度計算する(ステッ
プS22)。さらに、この計算された累積類似度と単語
候補記憶部18の記憶内容とを比較して単語候補として
記憶するかどうか判断する(ステップS23)。この場
合、前回計算した累積類似度が単語候補記憶部18に記
憶されていれば、その記憶されている累積類似度と比較
される。ただし、累積類似度が単語候補記憶部18に記
憶されておらず、上述した「−9999」等の初期値が
記憶されている場合は、その初期値と比較される。
記憶部に記憶されている有効単語文字数と単語辞書より
順次読出された単語文字数との比較結果が文字数範囲内
でない場合は、前記単語辞書に記憶されている次単語を
読出す(ステップS21)。次に、文字パターン記憶部
12に記憶されている各文字パターンデータの各文字接
続数及び文字パターンの各文字に対する類似度である各
文字類似度並びにステップS21の比較結果に基づい
て、切出された文字パターンデータがどれだけ単語辞書
の各単語と類似しているか累積類似度計算する(ステッ
プS22)。さらに、この計算された累積類似度と単語
候補記憶部18の記憶内容とを比較して単語候補として
記憶するかどうか判断する(ステップS23)。この場
合、前回計算した累積類似度が単語候補記憶部18に記
憶されていれば、その記憶されている累積類似度と比較
される。ただし、累積類似度が単語候補記憶部18に記
憶されておらず、上述した「−9999」等の初期値が
記憶されている場合は、その初期値と比較される。
【0051】そして、ステップS23で判断された累積
類似度を記憶する(ステップS24)。最後に、この記
憶された累積類似度を順に並べ換えるのである(ステッ
プS25)。
類似度を記憶する(ステップS24)。最後に、この記
憶された累積類似度を順に並べ換えるのである(ステッ
プS25)。
【0052】ここで、ステップS22においては、文字
パターン記憶部12に記憶されている1文字が細分化さ
れた各文字パターンデータの文字接続数に従い隣り合っ
た各文字データを1文字として接続し、文字パターン記
憶部12に記憶されている各文字類似度からどれだけ単
語辞書の各単語と類似しているか計算処理しているので
ある。
パターン記憶部12に記憶されている1文字が細分化さ
れた各文字パターンデータの文字接続数に従い隣り合っ
た各文字データを1文字として接続し、文字パターン記
憶部12に記憶されている各文字類似度からどれだけ単
語辞書の各単語と類似しているか計算処理しているので
ある。
【0053】また、ステップS21においては、文字パ
ターン記憶部に記憶されている有効単語文字数と単語辞
書より順次読出された単語文字数を比較した結果が文字
数範囲内でない場合は、ステップS22の計算処理をせ
ずに単語辞書に記憶されている次単語を読出すように制
御しているのである。
ターン記憶部に記憶されている有効単語文字数と単語辞
書より順次読出された単語文字数を比較した結果が文字
数範囲内でない場合は、ステップS22の計算処理をせ
ずに単語辞書に記憶されている次単語を読出すように制
御しているのである。
【0054】さらにまた、ステップS25においては、
ステップS24において記憶された累積類似度について
予め決められた数の最有力候補のみを順に並べ変えてい
るのである。
ステップS24において記憶された累積類似度について
予め決められた数の最有力候補のみを順に並べ変えてい
るのである。
【0055】なお、以上説明した図2の処理を実現する
ためのプログラムを記録した記録媒体を用意し、これを
用いて図1の各部を制御すれば、上述と同様の動作を行
うことができることは明白である。この記録媒体には、
図1中に示されていない半導体メモリ、磁気ディスク装
置の他、種々の記録媒体を用いることができる。
ためのプログラムを記録した記録媒体を用意し、これを
用いて図1の各部を制御すれば、上述と同様の動作を行
うことができることは明白である。この記録媒体には、
図1中に示されていない半導体メモリ、磁気ディスク装
置の他、種々の記録媒体を用いることができる。
【0056】また、同記録媒体に記録されているプログ
ラムによってコンピュータを制御すれば、上述と同様に
文字認識動作を行うことができることは明白である。こ
の記録媒体には、半導体メモリ、磁気ディスク装置の
他、種々の記録媒体を用いることができる。
ラムによってコンピュータを制御すれば、上述と同様に
文字認識動作を行うことができることは明白である。こ
の記録媒体には、半導体メモリ、磁気ディスク装置の
他、種々の記録媒体を用いることができる。
【0057】
【発明の効果】以上説明したように本発明は、文字認識
処理の中で処理時間が多くかかる累積類似度計算をする
前段階で、認識すべき単語の文字パターン情報の文字数
を比較することで処理時間を短縮し、更に、1文字が細
分化された文字パターンデータにおいて、認識すべき単
語の文字パターン情報の各文字接続数を参照すること
で、1文字となる組み合わせ数を導き出す処理時間を短
縮することができるという効果がある。また、多数の単
語を納めた単語辞書より、予め定められた単語数の上位
候補を並び換えてその結果を出力することができるとい
う効果がある。
処理の中で処理時間が多くかかる累積類似度計算をする
前段階で、認識すべき単語の文字パターン情報の文字数
を比較することで処理時間を短縮し、更に、1文字が細
分化された文字パターンデータにおいて、認識すべき単
語の文字パターン情報の各文字接続数を参照すること
で、1文字となる組み合わせ数を導き出す処理時間を短
縮することができるという効果がある。また、多数の単
語を納めた単語辞書より、予め定められた単語数の上位
候補を並び換えてその結果を出力することができるとい
う効果がある。
【図1】本発明の文字認識装置の実施の一形態を示す構
成図である。
成図である。
【図2】図1の装置によって実現される文字認識方法を
示すフローチャートである。
示すフローチャートである。
【図3】従来の文字認識装置の一例を示す構成図であ
る。
る。
10 アドレス制御部 11 文字パターン記憶部 12 文字パターン記憶単位 13 単語辞書記憶部 14 単語記憶単位 15 文字数比較部 16 累積類似度計算部 17 計算結果比較部 18 単語候補記憶部 19 結果順位付け部
Claims (12)
- 【請求項1】 1単語データの各1文字分が細分化され
た切出し文字パターンデータを1単語分として認識する
文字認識装置において、単語が記憶されている単語辞書
と、切出された文字パターンデータの切出し文字数、各
文字類似度、各文字接続数、有効単語文字数を記憶する
文字パターン記憶手段と、前記単語辞書と前記文字パタ
ーン記憶手段の情報を順次読出すアドレス制御手段と、
前記文字パターン記憶手段に記憶されている有効単語文
字数と単語辞書より順次読出された単語文字数との比較
結果が文字数範囲内でない場合は、前記単語辞書に記憶
されている次単語を読出すように前記アドレス制御手段
を制御する文字数比較手段と、前記文字パターン記憶手
段に記憶されている各文字パターンデータの各文字接続
数及び文字パターンの各文字に対する類似度である各文
字類似度並びに前記文字数比較手段の比較結果に基づい
て、切出された文字パターンデータがどれだけ単語辞書
の各単語と類似しているか累積類似度計算する累積類似
度計算手段と、累積類似度を記憶する単語候補記憶手段
と、前記累積類似度計算手段で計算された累積類似度と
前記単語候補記憶手段に記憶されている累積類似度とを
比較し単語候補とする場合には前記単語候補記憶手段に
記憶させる計算結果比較手段と、前記単語候補記憶手段
に記憶された累積類似度を順に並べ換える順位付け手段
とを有することを特徴とする文字認識装置。 - 【請求項2】 前記累積類似度計算手段は、前記文字パ
ターン記憶手段に記憶されている1文字が細分化された
各文字パターンデータの文字接続数に従い隣り合った各
文字データを1文字として接続し、前記文字パターン記
憶手段に記憶されている各文字類似度からどれだけ単語
辞書の各単語と類似しているか計算処理することを特徴
とする請求項1記載の文字認識装置。 - 【請求項3】 前記文字数比較手段は、前記文字パター
ン記憶手段に記憶されている有効単語文字数と単語辞書
より順次読出された単語文字数を比較し、結果が文字数
範囲内でない場合は、上記累積類似度計算手段の計算処
理をせずに前記単語辞書に記憶されている次単語を読出
すように前記アドレス制御手段にを制御することを特徴
とする請求項1記載の文字認識装置。 - 【請求項4】 前記順位付け手段は、前記単語候補記憶
手段の結果である累積類似度について予め決められた数
の最有力候補のみを順に並べ変えることを特徴とする請
求項1記載の文字認識装置。 - 【請求項5】 単語が記憶されている単語辞書と、切出
された文字パターンデータの切出し文字数、各文字類似
度、各文字接続数、有効単語文字数を記憶する文字パタ
ーン記憶部とを含み、1単語データの各1文字分が細分
化された切出し文字パターンデータを1単語分として認
識する文字認識装置における文字認識方法であって、前
記文字パターン記憶部に記憶されている有効単語文字数
と単語辞書より順次読出された単語文字数との比較結果
が文字数範囲内でない場合は、前記単語辞書に記憶され
ている次単語を読出す文字数比較ステップと、前記文字
パターン記憶部に記憶されている各文字パターンデータ
の各文字接続数及び文字パターンの各文字に対する類似
度である各文字類似度並びに前記文字数比較ステップの
比較結果に基づいて、切出された文字パターンデータが
どれだけ単語辞書の各単語と類似しているか累積類似度
計算する累積類似度計算ステップと、この計算された累
積類似度と単語候補記憶部に記憶されている累積類似度
とを比較し単語候補とする場合には前記単語候補記憶部
に記憶させる計算結果比較ステップと、前記単語候補記
憶部に記憶された累積類似度を順に並べ換える順位付け
ステップとを含むことを特徴とする文字認識方法。 - 【請求項6】 前記累積類似度計算ステップにおいて
は、前記文字パターン記憶部に記憶されている1文字が
細分化された各文字パターンデータの文字接続数に従い
隣り合った各文字データを1文字として接続し、前記文
字パターン記憶部に記憶されている各文字類似度からど
れだけ単語辞書の各単語と類似しているか計算処理する
ことを特徴とする請求項5記載の文字認識方法。 - 【請求項7】 前記文字数比較ステップにおいては、前
記文字パターン記憶部に記憶されている有効単語文字数
と単語辞書より順次読出された単語文字数を比較した結
果が文字数範囲内でない場合は、上記累積類似度計算ス
テップの計算処理をせずに前記単語辞書に記憶されてい
る次単語を読出すように制御することを特徴とする請求
項5又は6記載の文字認識方法。 - 【請求項8】 前記順位付けステップにおいては、前記
単語候補記憶ステップにおいて記憶された累積類似度に
ついて予め決められた数の最有力候補のみを順に並べ変
えることを特徴とする請求項5〜7のいずれかに記載の
文字認識方法。 - 【請求項9】 単語が記憶されている単語辞書と、切出
された文字パターンデータの切出し文字数、各文字類似
度、各文字接続数、有効単語文字数を記憶する文字パタ
ーン記憶部とを含み、1単語データの各1文字分が細分
化された切出し文字パターンデータを1単語分として認
識する文字認識装置を制御するための文字認識プログラ
ムを記録した記録媒体であって、該文字認識プログラム
は、前記文字パターン記憶部に記憶されている有効単語
文字数と単語辞書より順次読出された単語文字数との比
較結果が文字数範囲内でない場合は、前記単語辞書に記
憶されている次単語を読出す文字数比較ステップと、前
記文字パターン記憶部に記憶されている各文字パターン
データの各文字接続数及び文字パターンの各文字に対す
る類似度である各文字類似度並びに前記文字数比較ステ
ップの比較結果に基づいて、切出された文字パターンデ
ータがどれだけ単語辞書の各単語と類似しているか累積
類似度計算する累積類似度計算ステップと、この計算さ
れた累積類似度と単語候補記憶部に記憶されている累積
類似度とを比較して単語候補とする場合には前記単語候
補記憶部に記憶させる計算結果比較ステップと、前記単
語候補記憶部に記憶された累積類似度を順に並べ換える
順位付けステップとを含むことを特徴とする記録媒体。 - 【請求項10】 前記累積類似度計算ステップにおいて
は、前記文字パターン記憶部に記憶されている1文字が
細分化された各文字パターンデータの文字接続数に従い
隣り合った各文字データを1文字として接続し、前記文
字パターン記憶部に記憶されている各文字類似度からど
れだけ単語辞書の各単語と類似しているか計算処理する
ことを特徴とする請求項9記載の記録媒体。 - 【請求項11】 前記文字数比較ステップにおいては、
前記文字パターン記憶部に記憶されている有効単語文字
数と単語辞書より順次読出された単語文字数を比較した
結果が文字数範囲内でない場合は、上記累積類似度計算
ステップの計算処理をせずに前記単語辞書に記憶されて
いる次単語を読出すように制御することを特徴とする請
求項9又は10記載の記録媒体。 - 【請求項12】 前記順位付けステップにおいては、前
記単語候補記憶ステップにおいて記憶された累積類似度
について予め決められた数の最有力候補のみを順に並べ
変えることを特徴とする請求項9〜11のいずれかに記
載の記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11102584A JP2000293635A (ja) | 1999-04-09 | 1999-04-09 | 文字認識装置及び方法並びに文字認識プログラム記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11102584A JP2000293635A (ja) | 1999-04-09 | 1999-04-09 | 文字認識装置及び方法並びに文字認識プログラム記録媒体 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000293635A true JP2000293635A (ja) | 2000-10-20 |
Family
ID=14331291
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11102584A Withdrawn JP2000293635A (ja) | 1999-04-09 | 1999-04-09 | 文字認識装置及び方法並びに文字認識プログラム記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000293635A (ja) |
-
1999
- 1999-04-09 JP JP11102584A patent/JP2000293635A/ja not_active Withdrawn
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2000215678A (ja) | 連想記憶装置及び連想メモリ検索方法 | |
| KR20000069633A (ko) | 파일 처리 방법, 데이터 처리 장치 및 기억 매체 | |
| JP2000293635A (ja) | 文字認識装置及び方法並びに文字認識プログラム記録媒体 | |
| CN115221132A (zh) | 闪存字库的配置方法、装置及存储介质 | |
| JP2018060443A (ja) | 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置 | |
| JPS61262924A (ja) | 電子フアイル装置 | |
| JPS63153632A (ja) | 文字列検索方式 | |
| JPH07121665A (ja) | 文字認識辞書の構成方法及び検索方法 | |
| JPS63138479A (ja) | 文字認識装置 | |
| JPH04148384A (ja) | 辞書照合方式 | |
| JPH07101382B2 (ja) | マ−ジ処理装置 | |
| JP2835065B2 (ja) | 文字列検索方法 | |
| JPS63257030A (ja) | 文字列検索回路 | |
| JPS59100939A (ja) | 日本語入力装置 | |
| JP2586172B2 (ja) | 学習機能付テーブル検索装置 | |
| JP3353769B2 (ja) | 文字認識装置、文字認識方法、文字認識プログラム記録媒体 | |
| JP3387582B2 (ja) | 文字処理装置 | |
| JPH10134150A (ja) | 文字認識結果の後処理方法 | |
| JPH06230952A (ja) | プログラム編集装置 | |
| JP2006004368A (ja) | ストリング急速対比サーチの電子装置及び方法 | |
| JPH0232468A (ja) | 文字列データ検索方式 | |
| JPS61274956A (ja) | フオントパタ−ン発生装置 | |
| JPH0540854A (ja) | 文字認識結果の後処理方法 | |
| JPH0756782A (ja) | データレコード格納制御装置および方法 | |
| JPS63142423A (ja) | 文字列テ−ブル検索方式 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050406 |
|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060704 |