JPH02293990A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH02293990A JPH02293990A JP1114122A JP11412289A JPH02293990A JP H02293990 A JPH02293990 A JP H02293990A JP 1114122 A JP1114122 A JP 1114122A JP 11412289 A JP11412289 A JP 11412289A JP H02293990 A JPH02293990 A JP H02293990A
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- character
- candidate
- circuit
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、部分パターンマッチングの手法を用いる漢字
文字等の文字認識装置に関するものである。
文字等の文字認識装置に関するものである。
文字認識装置において、漢字を対象とする場合、膨大な
字種と類似文字の多さが問題となる。特に、文字全体の
形状を用いるパターンマッチング手法では、この問題に
対処することができないため、構造解析的な特徴要素の
導入か、単語辞書等を用いる知識処理が必要となる。ま
たは、類似文字間で共通に用いられている「モンガマエ
」や「ヘン」等の部首を取り除き、差異が明確な部分に
着目してこれらを区別する部分パターンマッチングの手
法が用いられる。
字種と類似文字の多さが問題となる。特に、文字全体の
形状を用いるパターンマッチング手法では、この問題に
対処することができないため、構造解析的な特徴要素の
導入か、単語辞書等を用いる知識処理が必要となる。ま
たは、類似文字間で共通に用いられている「モンガマエ
」や「ヘン」等の部首を取り除き、差異が明確な部分に
着目してこれらを区別する部分パターンマッチングの手
法が用いられる。
従来の部分パターンマッチング手法では、文字を構成す
る各部首を分離抽出し、あらかじめ用意された部首毎の
辞書パターンとの間で照合が行なねれる。同様な手法で
、漢和辞典から漢字を引くような手順で漢字を分類する
ことも行なわれている。
る各部首を分離抽出し、あらかじめ用意された部首毎の
辞書パターンとの間で照合が行なねれる。同様な手法で
、漢和辞典から漢字を引くような手順で漢字を分類する
ことも行なわれている。
この他に、類似文字間の差異を強調するため2つの差分
パターンを求め辞書パターンに対して重みとして作用さ
せ、識別能力を向上させる手法も考案されている。
パターンを求め辞書パターンに対して重みとして作用さ
せ、識別能力を向上させる手法も考案されている。
1文字の中から該文字を構成している部首だけを切り出
すことは文字の切り出しに比べ一般に難しく、「ヘン」
、「ツクリ」などの部首と「モンガマエ」や「シンニョ
ウ」等の部首では、それぞれを切り出すために個別の手
法を用いる必要がある。このため部首の切り出しの前に
おおまかな文字全体の認識処理を行い、部首切り出しの
対象とする文字の字種を限定する必要がある。このよう
して切り出した部首に対して再度特徴抽出からの認識処
理を行うことになるので、かかる従来の認識装置では認
識処理の制御が難しくなるという問題があった。
すことは文字の切り出しに比べ一般に難しく、「ヘン」
、「ツクリ」などの部首と「モンガマエ」や「シンニョ
ウ」等の部首では、それぞれを切り出すために個別の手
法を用いる必要がある。このため部首の切り出しの前に
おおまかな文字全体の認識処理を行い、部首切り出しの
対象とする文字の字種を限定する必要がある。このよう
して切り出した部首に対して再度特徴抽出からの認識処
理を行うことになるので、かかる従来の認識装置では認
識処理の制御が難しくなるという問題があった。
また漢字認識装置の場合、字種の多さから非常に多くの
辞書パターンとの照合を行う必要があるため、極めて高
速な演算が必要とされ、1文字に対する認識処理を互い
に独立ないくつかのプロセスに分け、パイプライン処理
や並列処理などを用いて演算の高速化を行う場合が多く
、前述のような処理の分岐やフィードバックなどへの対
処は技術的に難しい。
辞書パターンとの照合を行う必要があるため、極めて高
速な演算が必要とされ、1文字に対する認識処理を互い
に独立ないくつかのプロセスに分け、パイプライン処理
や並列処理などを用いて演算の高速化を行う場合が多く
、前述のような処理の分岐やフィードバックなどへの対
処は技術的に難しい。
また、文字毎の辞書パターンとは別の取扱が必要な部首
毎の辞書パターンを持つことになるので、このことは処
理の高速化や装置の小型化の妨げになるという問題もあ
った。
毎の辞書パターンを持つことになるので、このことは処
理の高速化や装置の小型化の妨げになるという問題もあ
った。
本発明の目的は、上述した従来技術における問題点を解
決し、認識処理の制御が技術的に容易であると共に、処
理の高速化、装置の小型化にも資する如き文字認識装置
を提供することにある。
決し、認識処理の制御が技術的に容易であると共に、処
理の高速化、装置の小型化にも資する如き文字認識装置
を提供することにある。
〔課題を解決するための手段]
認識対象文字についてパターンマッチングを行うための
特徴平面をいくつかの領域に分割し、各領域毎の類似度
を求めておき、文字全体の類似度を用いた認識結果にお
いて1位と2位の候補の類似度が近接している場合、先
に求めた領域毎の類似度に適当な重みをつけて足し合わ
せて全体の類似度を計算し、何種類か重みを付ける領域
を変えて同じことを繰り返して得られた類似度のうち、
1位と2位の類似度の差が最大となったものを選択し、
それによって新たな認識結果を得る。
特徴平面をいくつかの領域に分割し、各領域毎の類似度
を求めておき、文字全体の類似度を用いた認識結果にお
いて1位と2位の候補の類似度が近接している場合、先
に求めた領域毎の類似度に適当な重みをつけて足し合わ
せて全体の類似度を計算し、何種類か重みを付ける領域
を変えて同じことを繰り返して得られた類似度のうち、
1位と2位の類似度の差が最大となったものを選択し、
それによって新たな認識結果を得る。
文字の中から該文字を構成する部首の切り出し処理や、
部首毎の辞書パターンの用意などを要せずに、類似文字
間で差異が大きな部分を強調して類似度を求め、字種の
識別を行うことができる。
部首毎の辞書パターンの用意などを要せずに、類似文字
間で差異が大きな部分を強調して類似度を求め、字種の
識別を行うことができる。
また、1位と2位の候補の差が最大となるという判別条
件を用いることにより、類似文字を区別するために、認
識対象文字の特徴平面上で強調すべき部分(重み付けを
する部分)を半自動的に判断するようにすることができ
る。
件を用いることにより、類似文字を区別するために、認
識対象文字の特徴平面上で強調すべき部分(重み付けを
する部分)を半自動的に判断するようにすることができ
る。
これらの処理は、一つの認識対象文字に対して、該文字
を構成する高々数個の局所領域の重み付けを変えて類{
以度を求めるという演算であり、このために用いる回路
も小さなもので済み、処理を高速に行うこともできる。
を構成する高々数個の局所領域の重み付けを変えて類{
以度を求めるという演算であり、このために用いる回路
も小さなもので済み、処理を高速に行うこともできる。
第1図は本発明の一実施例の回路構成を示すブロック図
である。同図を参照する。
である。同図を参照する。
入力装置(例えば画像スキャナ)1から読み込まれた文
書画像は、特徴抽出回路2で1文字毎に切り出され、さ
らにパターンマッチングを行うための特徴パターンが抽
出される。そして、比較的、大まかな特敗パターンがル
ート2Aを介して分類回路3へ送られ、詳しい特徴パタ
ーンがルート2Bを介して乗算回路6へ送られる。分類
回路3では分類辞書4と大まかな特徴パターンを使って
認識対象文字の大まかな認識を行い、それにより適当な
個数に絞り込まれた候補文字5に対して、認識部Rでの
詳細な認識処理が行われる。
書画像は、特徴抽出回路2で1文字毎に切り出され、さ
らにパターンマッチングを行うための特徴パターンが抽
出される。そして、比較的、大まかな特敗パターンがル
ート2Aを介して分類回路3へ送られ、詳しい特徴パタ
ーンがルート2Bを介して乗算回路6へ送られる。分類
回路3では分類辞書4と大まかな特徴パターンを使って
認識対象文字の大まかな認識を行い、それにより適当な
個数に絞り込まれた候補文字5に対して、認識部Rでの
詳細な認識処理が行われる。
認識部Rでは、先ず認識用辞書パターン7とル−l−2
Bから入力される詳しい入力パターンの各要素とを、候
補文字5の各々毎に、乗算器6で掛け合わせる。乗算器
6の出力は認識対象の文字バターン全体の類似度を求め
る演算回路10と、認識対象文字パターンを複数の局所
領域に分け、各局所領域毎の類似度を求める演算回路8
に与えられる。パターン全体の類似度は局所領域毎の類
似度の合計として求められるため、演算回路10は必ず
しも必要ではない。演算回路8.10で求められた類似
度は記憶装置9、11に順次格納される。
Bから入力される詳しい入力パターンの各要素とを、候
補文字5の各々毎に、乗算器6で掛け合わせる。乗算器
6の出力は認識対象の文字バターン全体の類似度を求め
る演算回路10と、認識対象文字パターンを複数の局所
領域に分け、各局所領域毎の類似度を求める演算回路8
に与えられる。パターン全体の類似度は局所領域毎の類
似度の合計として求められるため、演算回路10は必ず
しも必要ではない。演算回路8.10で求められた類似
度は記憶装置9、11に順次格納される。
ここでは第2図に示すように、特徴平面(認識対象文字
パターン)をPi−P9の九つの領域に分割して局所領
域とする例を説明する。判定回路l2では、まず演算回
路IOで求めたパターン全体の類似度を記憶装置11か
ら読み出し、その上位から下位への並べ替えによる字種
の判定を行い、1位と2位の類似度の差があるしきい値
以下のとき、演算回路8で求めた各局所領域毎の類似度
を用いて文字種の判定をやり直す。すなわち、この際、
第2図におけるPI−P9の各局所領域のうち、特定の
領域の類似度にだけ重み係数aを乗じ、他の領域の類似
度には重み係数を掛けないで足し合わせパターン全体の
類似度を求める。
パターン)をPi−P9の九つの領域に分割して局所領
域とする例を説明する。判定回路l2では、まず演算回
路IOで求めたパターン全体の類似度を記憶装置11か
ら読み出し、その上位から下位への並べ替えによる字種
の判定を行い、1位と2位の類似度の差があるしきい値
以下のとき、演算回路8で求めた各局所領域毎の類似度
を用いて文字種の判定をやり直す。すなわち、この際、
第2図におけるPI−P9の各局所領域のうち、特定の
領域の類似度にだけ重み係数aを乗じ、他の領域の類似
度には重み係数を掛けないで足し合わせパターン全体の
類似度を求める。
例えば、局所領域P5とP8の類似度にだけ重み係数a
を掛け、残りの局所領域の類似度には重み係数を掛けな
いで足し合わせてパターン全体の類似度を一つ求める。
を掛け、残りの局所領域の類似度には重み係数を掛けな
いで足し合わせてパターン全体の類似度を一つ求める。
同様に次は、局所領域P2,P3,P5及びP6の類似
度にだけ重み係数aを掛け、残りの局所領域の類似度に
は重み係数を掛けないで足し合わせてパターン全体の類
似度を一つ求める。
度にだけ重み係数aを掛け、残りの局所領域の類似度に
は重み係数を掛けないで足し合わせてパターン全体の類
似度を一つ求める。
更に今度は局所領域P2,P3,P5,P6P8及びP
9の類似度にだけ重み係数aを掛け、残りの局所領域の
類似度には重み係数を掛けないで足し合わせてパターン
全体の類似度を一つ求める。そして更に次は、局所領域
PI,P2,P4,P5,P7及びP8の類似度にだけ
重み係数aを掛け、残りの局所領域の類似度には重み係
数を掛けないで足し合わせてパターン全体の類似度を一
つ求める。
9の類似度にだけ重み係数aを掛け、残りの局所領域の
類似度には重み係数を掛けないで足し合わせてパターン
全体の類似度を一つ求める。そして更に次は、局所領域
PI,P2,P4,P5,P7及びP8の類似度にだけ
重み係数aを掛け、残りの局所領域の類似度には重み係
数を掛けないで足し合わせてパターン全体の類似度を一
つ求める。
このようにして例えば4種類の類似度を求めてみて、そ
れら4種類の類似度を使って文字種の判定をやり直すの
である。
れら4種類の類似度を使って文字種の判定をやり直すの
である。
以下、具体的に説明する。重み付けは、例えば、類似文
字に共通な『モンガマエ」、「シンニョウJ1[ヘンJ
5 「ツタi月などがある場合、これらの除去を目的と
して第3図(イ),(口),(ハ)及び(二)のそれぞ
れ斜線領域に対して行う。
字に共通な『モンガマエ」、「シンニョウJ1[ヘンJ
5 「ツタi月などがある場合、これらの除去を目的と
して第3図(イ),(口),(ハ)及び(二)のそれぞ
れ斜線領域に対して行う。
ここで
(k=1〜4, j=1〜9)
P、 :局所領域の類似度.
Mh(j) :重み付けパターン
bk :Mm(j)に対する補正係数、Rm :
Mk(Dを用いた場合の類似度、である。
Mk(Dを用いた場合の類似度、である。
この他にも、多種多様な重み付けが考えられるし、aの
値を各領域で個別に設定することも有効であろう。これ
らの重み付けを順次行って類似度を求め字種の判定を行
う。このようにして求められた4種類の認識結果(第3
図の(イ).(口),(ハ)及び(二)について得られ
た4種類の類似度R.)のうち、1位と2位の類似度の
差が最大となった結果を新たな認識結果とする。ただし
、重みを掛ける領域(面積)の違いから、類似度を求め
る際、各重み付けパターン毎に設定される補正係数bを
掛ける必要がある。判定回路12における判定結果はホ
ストマシン13へ送られる。
値を各領域で個別に設定することも有効であろう。これ
らの重み付けを順次行って類似度を求め字種の判定を行
う。このようにして求められた4種類の認識結果(第3
図の(イ).(口),(ハ)及び(二)について得られ
た4種類の類似度R.)のうち、1位と2位の類似度の
差が最大となった結果を新たな認識結果とする。ただし
、重みを掛ける領域(面積)の違いから、類似度を求め
る際、各重み付けパターン毎に設定される補正係数bを
掛ける必要がある。判定回路12における判定結果はホ
ストマシン13へ送られる。
なお、具体例を挙げる。例えば「モンガマエ」を共通に
持つ二つの文字として「間」と「間」を想定する。この
二つの文字は「日」と「耳」の部分で相違するだけであ
る。「間」と「聞」の文字をそれぞれ第2図に見られる
ように9個の局所領域に分けたとしたら、第3図(イ)
の斜線領域に示すように重み付けを行うと、「日」と「
耳」の部分の特徴が強調され、両者間の類似度が大きく
相違してくることが理解されるであろう。
持つ二つの文字として「間」と「間」を想定する。この
二つの文字は「日」と「耳」の部分で相違するだけであ
る。「間」と「聞」の文字をそれぞれ第2図に見られる
ように9個の局所領域に分けたとしたら、第3図(イ)
の斜線領域に示すように重み付けを行うと、「日」と「
耳」の部分の特徴が強調され、両者間の類似度が大きく
相違してくることが理解されるであろう。
本発明によれば、局所領域の類似度に重み付けを行うこ
とにより、処理の高速化や装置の小型化の妨げとなる部
首の切り出し処理や、部首毎の辞古パターンを用いずに
、類似文字間で差異が太きな部分を強調して類似度を求
め字種の判別を行うことができる。また、複数の判別結
果から、1位と2位の差が最大となる結果を選ぶことに
より、類似文字を区別するために特徴平面上で強調すべ
き部分を半自動的に判断することができる。
とにより、処理の高速化や装置の小型化の妨げとなる部
首の切り出し処理や、部首毎の辞古パターンを用いずに
、類似文字間で差異が太きな部分を強調して類似度を求
め字種の判別を行うことができる。また、複数の判別結
果から、1位と2位の差が最大となる結果を選ぶことに
より、類似文字を区別するために特徴平面上で強調すべ
き部分を半自動的に判断することができる。
これらの処理は、一つの候補文字に対して高々数個の局
所領域の重み付けを変えて繰り返し類似度を求める演算
であり、このために用いる回路も小さなもので済み、処
理を高速に行うこともてき・・・頬似度演算回路、9,
11・・・記憶装置、12・・・判定回路、13・・・
ホストマシン
所領域の重み付けを変えて繰り返し類似度を求める演算
であり、このために用いる回路も小さなもので済み、処
理を高速に行うこともてき・・・頬似度演算回路、9,
11・・・記憶装置、12・・・判定回路、13・・・
ホストマシン
Claims (1)
- 1)認識対象としての文字について、辞書パターンとの
パターンマッチングを行うための特徴平面を複数の領域
に分割し、各領域毎の類似度を求める回路と、求めた複
数の各領域毎の類似度を記憶する記憶回路と、認識対象
としての文字について、文字全体としての類似度を求め
る回路と、文字全体の類似度を用いた認識結果において
上位の複数候補間の類似度が接近している場合、前記記
憶回路に記憶されている複数の領域の各領域毎の類似度
を読み出し、特定領域の類似度を選択してそれにのみ重
みを付け、他の領域の類似度には重みを付けないで足し
合わせることによって全体の類似度を計算すると共に、
重み付けの対象とする特定領域を色々に選択して同じこ
とを繰り返し、得られた複数の類似度を用いて新たな認
識結果を得る判定回路と、から成ることを特徴とする文
字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1114122A JPH02293990A (ja) | 1989-05-09 | 1989-05-09 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1114122A JPH02293990A (ja) | 1989-05-09 | 1989-05-09 | 文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02293990A true JPH02293990A (ja) | 1990-12-05 |
Family
ID=14629687
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1114122A Pending JPH02293990A (ja) | 1989-05-09 | 1989-05-09 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02293990A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04266741A (ja) * | 1991-02-21 | 1992-09-22 | Nec Corp | Vpc検出方式 |
| CN112329769A (zh) * | 2020-10-27 | 2021-02-05 | 广汽本田汽车有限公司 | 一种车辆铭牌识别方法、装置、计算机设备及存储介质 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5380922A (en) * | 1976-12-25 | 1978-07-17 | Toshiba Corp | Pattern recognition device |
| JPS6486286A (en) * | 1987-09-29 | 1989-03-30 | Oki Electric Ind Co Ltd | Device for recognizing character and pattern |
-
1989
- 1989-05-09 JP JP1114122A patent/JPH02293990A/ja active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5380922A (en) * | 1976-12-25 | 1978-07-17 | Toshiba Corp | Pattern recognition device |
| JPS6486286A (en) * | 1987-09-29 | 1989-03-30 | Oki Electric Ind Co Ltd | Device for recognizing character and pattern |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04266741A (ja) * | 1991-02-21 | 1992-09-22 | Nec Corp | Vpc検出方式 |
| CN112329769A (zh) * | 2020-10-27 | 2021-02-05 | 广汽本田汽车有限公司 | 一种车辆铭牌识别方法、装置、计算机设备及存储介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9147252B2 (en) | Method for partitioning a pattern into optimized sub-patterns | |
| EP0085545B1 (en) | Pattern recognition apparatus and method for making same | |
| JP5235691B2 (ja) | 情報処理装置及び情報処理方法 | |
| KR19990010210A (ko) | 대용량 패턴 정합 장치 및 방법 | |
| CN116912796A (zh) | 一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置 | |
| JP4039708B2 (ja) | パターン認識方法およびパターン認識装置 | |
| KR19980070101A (ko) | 데이터간 결합 룰 도출 방법 및 장치와,직교 볼록 영역 분리 추출 방법 및 장치 | |
| Ozdemir et al. | GA-based optimization of SURF algorithm and realization based on Vivado-HLS | |
| US5671293A (en) | Pattern recognizing method and apparatus | |
| JPH02293990A (ja) | 文字認識装置 | |
| JPH10143613A (ja) | パタン認識方法 | |
| Wang et al. | CNN and transformer hybrid network for hyperspectral image classification | |
| JP2766205B2 (ja) | 文字認識装置 | |
| WO2007088973A1 (ja) | データ分類方法、データ分類装置、コンピュータプログラム、及び記録媒体 | |
| Byun et al. | An efficient form classification method using partial matching | |
| JP2006023983A (ja) | 文字画像分離装置、文字画像分離方法、文字画像分離プログラム、およびこのプログラムを格納した記録媒体 | |
| JP3754118B2 (ja) | パターン認識装置及びパターン認識方法 | |
| Bidlo | Evolution of Approximate Functions for Image Thresholding | |
| JP2728117B2 (ja) | 文字認識装置 | |
| JP2574517B2 (ja) | パターン認識装置 | |
| JPH0381889A (ja) | 文字認識方式 | |
| JP4556121B2 (ja) | 情報処理装置および方法、並びにプログラム | |
| JPS63238688A (ja) | 文字認識方法 | |
| JPS6252912B2 (ja) | ||
| JPH0143353B2 (ja) |