JPH0368091A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH0368091A JPH0368091A JP1204984A JP20498489A JPH0368091A JP H0368091 A JPH0368091 A JP H0368091A JP 1204984 A JP1204984 A JP 1204984A JP 20498489 A JP20498489 A JP 20498489A JP H0368091 A JPH0368091 A JP H0368091A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern data
- character recognition
- written
- comparison
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000284 extract Substances 0.000 claims description 3
- 230000003287 optical effect Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 2
- 241000227425 Pieris rapae crucivora Species 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
〔産業上の利用分野]
本発明は1紙面上に書かれた文字を画像とじて人力する
ことにより1文書画像から文字領域を抽出し、コード番
号に変換する文字認識装置に関する。
ことにより1文書画像から文字領域を抽出し、コード番
号に変換する文字認識装置に関する。
近年、文字認識装置の急激なる進歩により、様々な文書
画像から文字領域を自動的に抽出し、さらに一つ一つの
文字を切り出し、認識し、自動的に文書ファイルが作成
できる様になってきており、文字の認識方法には様々な
方法が考え出されている。 例えば、文字認識の最も基礎的な方法としてパターンマ
ツチング法がある。該方法は、文字認識用の辞書として
、対象文字余ての文字パターンを辞書中に所有しており
、認識時においては、抽出文字パターンと、前記辞書中
の文字パターンとを重ね合わせることにより、その一致
度を調べit一致した文字を認識文字としている。該方
法は、非常に単純な方法ではあるが2認識対象文字と辞
書中の文字とのフォントが一致した場合には、がなり高
い率で正確に認識する。また、 Aii記方法は通常2
抽出した文字そのまま比較を行うが1文字の大きさによ
る艶響を吸収するために正規化して使用される場合があ
る。さらに、フォントの違いによるずれを解消するため
に、文字パターンにある程度の自由度を持たせることも
行われている。 [発明が解決しよったする課題1 しかしながら、上記方法においては、非常に単純な方法
でありながらも、かなり正確に認識するという利点はあ
るちのの、抽出文字パターンと辞書中の文字パターンと
を比較する際の画素の数が非常に多いため認識に要する
時間がかかるという。 文字認識装置においては重大な課題を有している。 そこで本発明は以上の様な課題を解決するちので、その
目的とするところは、パターンマツチングによる文字認
識方法において、少しで6速く文字を認識する文字認識
装置を提供することにある。 【課題を解決するための手段] 本発明の文字認識装置は1紙面等の反射光を光電変換し
て文書画像を入力する光字的画像入力手段と、前記入力
画像から文字行及び単語の位置を検知して一単語一単語
抽出する手段と、前記抽出文字から一文字一文字を抽出
し、あらかじめ所有している文字パターンデータとの比
較を行い、数置の最も高い文字コードに変換する文字認
識手段とを具備する文字認識装置において1文字パター
ンデータ辞書中に全テストビット数のデータを記録して
おくことを特徴とする。 〔実 施 例1 以下1本発明について実施例に基づいて詳細に説明する
。 本発明の文字認識装置のブロック図を第1図に示す0文
字認識装置はプログラムにしたがって処理を実行するc
puiot、文字画像を記憶装置に入力する画像入力装
置1025文字認識結果を表示する文字表示手段103
5文字パターンデータ辞書の納まっているROM104
、及び文字画像を記憶する記憶装置であるRAM l
05より構成されている。 以下1本発明の文字認識装置の文字認識の方法を第6図
に示すフローチャートに基づいて第2図、第3図、第4
図及び第5図を用いて詳細に説明する8本発明の文字認
識装置はまず初めに画像入力装@ l O2において光
学的な方法により紙面等に書かれた文字をイメージデー
タとして記憶装置であるRAM105に入力する0次に
入力した文字画像から単語領域の抽出を行う、単語領域
の抽出は、まず入力文字画像の行方向の周辺分布を計数
する。該周辺分布(図示せず)は文字行の存在する位置
で値が大きくなり、文字行と文字行との間は周辺分布の
値が小さい、従って、該周辺分布の値により文字行の位
置を容易に推定することが可能である0文字行の位置を
推定すると次に推定文字行の行方向と垂直な方向の周辺
分布を計数する。該周辺分布(図示せず)の値の大きい
ところは文字の存在している領域であり、小さいところ
は文字の存在していない領域である。従って、文字の存
在していない領域を調べることにより、単語間隔と文字
間隔の大きさが推定でき、単語領域が抽出できる。 単語領域が抽出されると次は、抽出した単語の認識を行
う、単語の認識は、−文字一文字を抽出した後にROM
104に納まっている文字パターンデータ辞書との比較
により行う、従来パターンマツチングによる文字の認識
は、第2図及び第3図に示す様な文字そのもののバクー
ンデータを所有し、該データと抽出文字との一致度を調
べることにより候補文字を絞っている。また、辞書の形
式は、第2図に示す様に、抽出文字を正規化して比較し
た場合、文字の多少の位置ずれ及びフォントの違いを吸
収する様、どの文字でも必ず文字部となる部分203、
どの文字でも必ず空白部となる部分201及び、文字に
よっては文字部になったり、空白部になったりするため
比較の対象としない部分202の3つの領域から形成さ
れている辞書や、ただ単に、対象フォントのみを認識す
る様に対象フォントのパターンそのままを表現した第3
図(a)及び第3図(b)の様な形式であり1文字ごと
に比較する画素の数が異なってぃる、従って前記文字パ
ターンデーク辞書を用いて文字の認識を行う場合、文字
パターンデーク辞書と抽出文字データの一画素一画素を
比較しながら、トータルの一致画素数を計数し、それと
同時にトータルの比較画素数を計数して最終的に文字の
一致度を計数し1文字を絞らなければならない、そのた
めに認識に要する時間がかなり長くかかってしまう、そ
こで、本発明においては、第4図及び第5図に示す様な
文字パターンデータ辞書を所有する。第4図は、第2図
における文字バクーンデータ辞書が書かれている部分4
01及び、前記文字パターンデーク辞書中のトータルの
比較画素数が書かれた部分402.さらに次の文字の文
字パターンデータ辞書403及び該文字のトータルの比
較画素数404という様に1文字パターンデータ及びト
ータルの比較画素数が組になって書かれている。また第
5図ら同様に第3図に示した文字パターンデータ辞書5
01,503.505及びトータルの比較画素数502
.504.506により構成されている。従って1文字
パターンデータとの比較時においては1文字パターンデ
ータと抽出文字との一致した画素の数のみを数え、すべ
ての画素の比較が終った時点でトータルの比較画素数を
読み込んで計数すれば一致度は求まる。その結果、各画
素の比較ごとに行っていたカウントの命令が省略できる
。パターンマツチングにおいては、抽出文字パターンと
辞書のすべての画素について比較を行い、各文字は非常
に多くの画素(通常1000画素以上)を所有している
ので、命令が減ることにより、かなりの時間の削減がで
きる。さらに、単語の認識を行う場合には、数個の文字
に対して多くの文字について比較を行うので速度の差が
人間が感じるまでに大きくなる。従って、本発明の認識
方法を用いることによりパターンマツチング法における
文字認識の時間を大きく短縮することが可能となる。 以上の様にして認識した単語を認識結果表示装置103
において出力して認識の動作を終了する。 【発明の効果] 以上述べた様に本発明は、パターンマツチングによる文
字認識方法において、文字パターンデータ辞書中にトー
タルの比較画素数を所有しているので、一画素一画素の
比較時におけるトータルの比較画素数の計数の必要が無
くなる。その結果、認識に要する時間を大幅に削減でき
、文字認識装置の性能を大幅に向上するという大きな効
果を有する。
画像から文字領域を自動的に抽出し、さらに一つ一つの
文字を切り出し、認識し、自動的に文書ファイルが作成
できる様になってきており、文字の認識方法には様々な
方法が考え出されている。 例えば、文字認識の最も基礎的な方法としてパターンマ
ツチング法がある。該方法は、文字認識用の辞書として
、対象文字余ての文字パターンを辞書中に所有しており
、認識時においては、抽出文字パターンと、前記辞書中
の文字パターンとを重ね合わせることにより、その一致
度を調べit一致した文字を認識文字としている。該方
法は、非常に単純な方法ではあるが2認識対象文字と辞
書中の文字とのフォントが一致した場合には、がなり高
い率で正確に認識する。また、 Aii記方法は通常2
抽出した文字そのまま比較を行うが1文字の大きさによ
る艶響を吸収するために正規化して使用される場合があ
る。さらに、フォントの違いによるずれを解消するため
に、文字パターンにある程度の自由度を持たせることも
行われている。 [発明が解決しよったする課題1 しかしながら、上記方法においては、非常に単純な方法
でありながらも、かなり正確に認識するという利点はあ
るちのの、抽出文字パターンと辞書中の文字パターンと
を比較する際の画素の数が非常に多いため認識に要する
時間がかかるという。 文字認識装置においては重大な課題を有している。 そこで本発明は以上の様な課題を解決するちので、その
目的とするところは、パターンマツチングによる文字認
識方法において、少しで6速く文字を認識する文字認識
装置を提供することにある。 【課題を解決するための手段] 本発明の文字認識装置は1紙面等の反射光を光電変換し
て文書画像を入力する光字的画像入力手段と、前記入力
画像から文字行及び単語の位置を検知して一単語一単語
抽出する手段と、前記抽出文字から一文字一文字を抽出
し、あらかじめ所有している文字パターンデータとの比
較を行い、数置の最も高い文字コードに変換する文字認
識手段とを具備する文字認識装置において1文字パター
ンデータ辞書中に全テストビット数のデータを記録して
おくことを特徴とする。 〔実 施 例1 以下1本発明について実施例に基づいて詳細に説明する
。 本発明の文字認識装置のブロック図を第1図に示す0文
字認識装置はプログラムにしたがって処理を実行するc
puiot、文字画像を記憶装置に入力する画像入力装
置1025文字認識結果を表示する文字表示手段103
5文字パターンデータ辞書の納まっているROM104
、及び文字画像を記憶する記憶装置であるRAM l
05より構成されている。 以下1本発明の文字認識装置の文字認識の方法を第6図
に示すフローチャートに基づいて第2図、第3図、第4
図及び第5図を用いて詳細に説明する8本発明の文字認
識装置はまず初めに画像入力装@ l O2において光
学的な方法により紙面等に書かれた文字をイメージデー
タとして記憶装置であるRAM105に入力する0次に
入力した文字画像から単語領域の抽出を行う、単語領域
の抽出は、まず入力文字画像の行方向の周辺分布を計数
する。該周辺分布(図示せず)は文字行の存在する位置
で値が大きくなり、文字行と文字行との間は周辺分布の
値が小さい、従って、該周辺分布の値により文字行の位
置を容易に推定することが可能である0文字行の位置を
推定すると次に推定文字行の行方向と垂直な方向の周辺
分布を計数する。該周辺分布(図示せず)の値の大きい
ところは文字の存在している領域であり、小さいところ
は文字の存在していない領域である。従って、文字の存
在していない領域を調べることにより、単語間隔と文字
間隔の大きさが推定でき、単語領域が抽出できる。 単語領域が抽出されると次は、抽出した単語の認識を行
う、単語の認識は、−文字一文字を抽出した後にROM
104に納まっている文字パターンデータ辞書との比較
により行う、従来パターンマツチングによる文字の認識
は、第2図及び第3図に示す様な文字そのもののバクー
ンデータを所有し、該データと抽出文字との一致度を調
べることにより候補文字を絞っている。また、辞書の形
式は、第2図に示す様に、抽出文字を正規化して比較し
た場合、文字の多少の位置ずれ及びフォントの違いを吸
収する様、どの文字でも必ず文字部となる部分203、
どの文字でも必ず空白部となる部分201及び、文字に
よっては文字部になったり、空白部になったりするため
比較の対象としない部分202の3つの領域から形成さ
れている辞書や、ただ単に、対象フォントのみを認識す
る様に対象フォントのパターンそのままを表現した第3
図(a)及び第3図(b)の様な形式であり1文字ごと
に比較する画素の数が異なってぃる、従って前記文字パ
ターンデーク辞書を用いて文字の認識を行う場合、文字
パターンデーク辞書と抽出文字データの一画素一画素を
比較しながら、トータルの一致画素数を計数し、それと
同時にトータルの比較画素数を計数して最終的に文字の
一致度を計数し1文字を絞らなければならない、そのた
めに認識に要する時間がかなり長くかかってしまう、そ
こで、本発明においては、第4図及び第5図に示す様な
文字パターンデータ辞書を所有する。第4図は、第2図
における文字バクーンデータ辞書が書かれている部分4
01及び、前記文字パターンデーク辞書中のトータルの
比較画素数が書かれた部分402.さらに次の文字の文
字パターンデータ辞書403及び該文字のトータルの比
較画素数404という様に1文字パターンデータ及びト
ータルの比較画素数が組になって書かれている。また第
5図ら同様に第3図に示した文字パターンデータ辞書5
01,503.505及びトータルの比較画素数502
.504.506により構成されている。従って1文字
パターンデータとの比較時においては1文字パターンデ
ータと抽出文字との一致した画素の数のみを数え、すべ
ての画素の比較が終った時点でトータルの比較画素数を
読み込んで計数すれば一致度は求まる。その結果、各画
素の比較ごとに行っていたカウントの命令が省略できる
。パターンマツチングにおいては、抽出文字パターンと
辞書のすべての画素について比較を行い、各文字は非常
に多くの画素(通常1000画素以上)を所有している
ので、命令が減ることにより、かなりの時間の削減がで
きる。さらに、単語の認識を行う場合には、数個の文字
に対して多くの文字について比較を行うので速度の差が
人間が感じるまでに大きくなる。従って、本発明の認識
方法を用いることによりパターンマツチング法における
文字認識の時間を大きく短縮することが可能となる。 以上の様にして認識した単語を認識結果表示装置103
において出力して認識の動作を終了する。 【発明の効果] 以上述べた様に本発明は、パターンマツチングによる文
字認識方法において、文字パターンデータ辞書中にトー
タルの比較画素数を所有しているので、一画素一画素の
比較時におけるトータルの比較画素数の計数の必要が無
くなる。その結果、認識に要する時間を大幅に削減でき
、文字認識装置の性能を大幅に向上するという大きな効
果を有する。
第1図に本発明の文字認識装置のブロック図を示す。
第2図、第3図、第4図及び第5図に本発明の概要を示
した図を示す。 第6図に本発明の文字認識装置のフローチャートを示す
。 101 ・ ・ ・ CPU 102・・・画像入力装置 103・・・認識結果表示装置 ・ ・ ・ ROM ・ ・ ・ RAM 403、 40 402、 404. 40 503、50 504、 50 501゜ 502、 04 05 01 02 03 01 02 401 。 ・共通白部 ・非比較対象部 ・共通文字部 ・文字部 ・白空部 ・トータル比較画素数 トータル比較画素数 文字パターンデータ 文字パターンデータ 以上
した図を示す。 第6図に本発明の文字認識装置のフローチャートを示す
。 101 ・ ・ ・ CPU 102・・・画像入力装置 103・・・認識結果表示装置 ・ ・ ・ ROM ・ ・ ・ RAM 403、 40 402、 404. 40 503、50 504、 50 501゜ 502、 04 05 01 02 03 01 02 401 。 ・共通白部 ・非比較対象部 ・共通文字部 ・文字部 ・白空部 ・トータル比較画素数 トータル比較画素数 文字パターンデータ 文字パターンデータ 以上
Claims (1)
- 紙面等の反射光を光電変換して文書画像を入力する光字
的画像入力手段と、前記入力画像から文字行及び単語の
位置を検知して一単語一単語抽出する手段と、前記抽出
文字から一文字一文字を抽出し、あらかじめ所有してい
る文字パターンデータとの比較を行い、一致度の最も高
い文字コードに変換する文字認識手段とを具備する文字
認識装置において、文字パターンデータ辞書中に全テス
トビット数のデータを記録しておくことを特徴とする文
字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1204984A JPH0368091A (ja) | 1989-08-08 | 1989-08-08 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1204984A JPH0368091A (ja) | 1989-08-08 | 1989-08-08 | 文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0368091A true JPH0368091A (ja) | 1991-03-25 |
Family
ID=16499547
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1204984A Pending JPH0368091A (ja) | 1989-08-08 | 1989-08-08 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0368091A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2012133513A1 (ja) | 2011-03-30 | 2012-10-04 | 住友金属工業株式会社 | 高速鉄道用焼結摩擦材 |
-
1989
- 1989-08-08 JP JP1204984A patent/JPH0368091A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2012133513A1 (ja) | 2011-03-30 | 2012-10-04 | 住友金属工業株式会社 | 高速鉄道用焼結摩擦材 |
| KR20130143715A (ko) | 2011-03-30 | 2013-12-31 | 신닛테츠스미킨 카부시키카이샤 | 고속 철도용 소결 마찰재 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI435276B (zh) | 用以辨識手寫符號之方法及設備 | |
| JP3445394B2 (ja) | 少なくとも二つのイメージセクションの比較方法 | |
| JPH05242292A (ja) | 分離方法 | |
| US20090245627A1 (en) | Character recognition device | |
| RU2707320C1 (ru) | Способ распознавания символа на банкноте и сопроцессор для вычислительной системы устройства для обработки банкнот | |
| JPH0368091A (ja) | 文字認識装置 | |
| CN119091447A (zh) | 一种基于计算机视觉的目标识别方法与系统 | |
| JP2821285B2 (ja) | 画像処理方法及び装置 | |
| JPS6316795B2 (ja) | ||
| JPS59197971A (ja) | 文字切出し装置 | |
| JP2925270B2 (ja) | 文字読取装置 | |
| JPH0371380A (ja) | 文字認識装置 | |
| JP2746904B2 (ja) | 文書読取り装置 | |
| JP2977244B2 (ja) | 文字認識方法及び文字認識装置 | |
| JPH01201789A (ja) | 文字読取装置 | |
| CN120356226A (zh) | 基于多模态算法的书本cip检测识别优化方法及系统 | |
| JPH0586585B2 (ja) | ||
| JPH0589289A (ja) | 文字認識方法 | |
| JPH05282487A (ja) | 文字認識装置 | |
| JPH0820669B2 (ja) | 画像情報記録・読取方法 | |
| JPH0351981A (ja) | 文字認識装置 | |
| JPS5914078A (ja) | 帳票読取装置 | |
| JPH04156694A (ja) | 文字認識方式 | |
| JPH0350690A (ja) | 文字認識装置 | |
| JPS62280983A (ja) | 図形認識結果のチエツク方式 |