JPH0795332B2 - 文字列読取装置 - Google Patents
文字列読取装置Info
- Publication number
- JPH0795332B2 JPH0795332B2 JP63001025A JP102588A JPH0795332B2 JP H0795332 B2 JPH0795332 B2 JP H0795332B2 JP 63001025 A JP63001025 A JP 63001025A JP 102588 A JP102588 A JP 102588A JP H0795332 B2 JPH0795332 B2 JP H0795332B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- recognition
- string
- rotation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は帳票上に記載される文字列を光学的に読取り認
識する文字列読取装置に関する。
識する文字列読取装置に関する。
(従来の技術) 帳票上に記載された文字列を読取り入力する装置として
光学的文字読取装置(OCR)がある。この種の装置は、
一般的には予め定められた書式の文字記入枠に記載され
た文字列を文字画像として光学的に読取り、各文字画像
を認識してその情報(認識結果)を入力するものとなっ
ている。
光学的文字読取装置(OCR)がある。この種の装置は、
一般的には予め定められた書式の文字記入枠に記載され
た文字列を文字画像として光学的に読取り、各文字画像
を認識してその情報(認識結果)を入力するものとなっ
ている。
これに対して最近では、書式の定まっていない帳票上に
自由に(フリーフォーマットで)記載された文字列をも
文字読取装置にて読取り入力したいと云う要求が強い。
しかし書式が定まっていない場合、文字列の並びの向き
や文字の向きが不明である為、文字列の読取り認識が著
しく困難となる。即ち、日本語の場合、文字列の形態と
して縦書きと横書きとがある。この為、光学的に読取ら
れた文字列画像を処理する場合には、その文字列を構成
する各文字の向きを判断し、その上で文字の並びの向き
を判断した上で各文字を認識処理する必要がある。従っ
てその処理手続きが繁雑であることのみならず、誤認識
や認識リジェクトが生じ易いと云う問題があった。
自由に(フリーフォーマットで)記載された文字列をも
文字読取装置にて読取り入力したいと云う要求が強い。
しかし書式が定まっていない場合、文字列の並びの向き
や文字の向きが不明である為、文字列の読取り認識が著
しく困難となる。即ち、日本語の場合、文字列の形態と
して縦書きと横書きとがある。この為、光学的に読取ら
れた文字列画像を処理する場合には、その文字列を構成
する各文字の向きを判断し、その上で文字の並びの向き
を判断した上で各文字を認識処理する必要がある。従っ
てその処理手続きが繁雑であることのみならず、誤認識
や認識リジェクトが生じ易いと云う問題があった。
(発明が解決しようとする問題点) このように従来にあっては自由形式で文字列が記載され
た帳票からその文字列を読取り入力するには、各文字の
向きを調べた上でその文字を認識し、その認識結果の列
を総合判定して上記文字列の情報を入力しているので、
その処理手続きが繁雑である等の問題があった。
た帳票からその文字列を読取り入力するには、各文字の
向きを調べた上でその文字を認識し、その認識結果の列
を総合判定して上記文字列の情報を入力しているので、
その処理手続きが繁雑である等の問題があった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、自由形式で記載された文字列を
簡易に効率良く読取り入力することのできる文字列読取
装置を提供することにある。
の目的とするところは、自由形式で記載された文字列を
簡易に効率良く読取り入力することのできる文字列読取
装置を提供することにある。
[発明の構成] (問題点を解決するための手段) 本発明は、帳票上に記載された文字列を読取る光電変換
手段と、この光電変換手段により読取られた文字列画像
から文字画像を1文字ずつ順に抽出する文字検出切出手
段と、この文字検出切出手段にて抽出された文字画像を
前記光電変換手段での文字読取り方向に対して90°単位
で回転処理し、前記各文字画像に対するそれぞれの回転
角度毎の文字認識結果を求める文字回転認識手段と、こ
の文字回転認識手段で求められた認識結果の文字を、同
じ回転角度の認識文字を抽出することにより各角度毎の
文字列候補として出力する手段と、読取り対象となる文
字列を予め記憶する文字列辞書と、前記出力手段から出
力された文字列候補を前記文字列辞書に記憶されている
読取り対象文字列と比較することにより文字列の識別結
果を求める文字列識別手段とから構成されている。
手段と、この光電変換手段により読取られた文字列画像
から文字画像を1文字ずつ順に抽出する文字検出切出手
段と、この文字検出切出手段にて抽出された文字画像を
前記光電変換手段での文字読取り方向に対して90°単位
で回転処理し、前記各文字画像に対するそれぞれの回転
角度毎の文字認識結果を求める文字回転認識手段と、こ
の文字回転認識手段で求められた認識結果の文字を、同
じ回転角度の認識文字を抽出することにより各角度毎の
文字列候補として出力する手段と、読取り対象となる文
字列を予め記憶する文字列辞書と、前記出力手段から出
力された文字列候補を前記文字列辞書に記憶されている
読取り対象文字列と比較することにより文字列の識別結
果を求める文字列識別手段とから構成されている。
(作用) 本発明は、帳票上に記載された文字列を読取り、この読
取った文字列画像から文字画像を1文字ずつ順に抽出す
るとともに、抽出された文字画像を前記光電変換手段で
の文字読取り方向に対して90°単位で回転処理し、それ
ぞれの回転角度毎の文字認識結果を求める。そして、求
められた認識結果の文字を、同じ回転角度の認識文字を
抽出することにより各角度毎の文字列候補を得、この文
字列候補を予め記憶された文字列辞書と比較することに
より文字列としての識別結果を求めるようにしたもので
ある。
取った文字列画像から文字画像を1文字ずつ順に抽出す
るとともに、抽出された文字画像を前記光電変換手段で
の文字読取り方向に対して90°単位で回転処理し、それ
ぞれの回転角度毎の文字認識結果を求める。そして、求
められた認識結果の文字を、同じ回転角度の認識文字を
抽出することにより各角度毎の文字列候補を得、この文
字列候補を予め記憶された文字列辞書と比較することに
より文字列としての識別結果を求めるようにしたもので
ある。
(実施例) 以下、図面を参照して本発明の一実施例につき説明す
る。
る。
第1図は本発明の一実施例に係る文字列読取装置の概略
構成図で、1は帳票上に記載されている文字列の情報を
帳票画像(文字列画像)として光学的に撮像入力する光
電変換部である。文字検出部2は入力された帳票画像か
ら、例えば第2図に示すようにその文字の並び方向の射
影、および並び方向と直交する向きの射影を求めて文字
列画像部分、およびその文字列を構成する各文字の文字
画像を、例えばその文字の並びの方向に沿って順に検出
切出しするものである。そして文字検出切出し部2は、
前記帳票画像から順次抽出した個々の文字画像をパター
ンメモリ3に順に格納し、その読取り入力に供してい
る。
構成図で、1は帳票上に記載されている文字列の情報を
帳票画像(文字列画像)として光学的に撮像入力する光
電変換部である。文字検出部2は入力された帳票画像か
ら、例えば第2図に示すようにその文字の並び方向の射
影、および並び方向と直交する向きの射影を求めて文字
列画像部分、およびその文字列を構成する各文字の文字
画像を、例えばその文字の並びの方向に沿って順に検出
切出しするものである。そして文字検出切出し部2は、
前記帳票画像から順次抽出した個々の文字画像をパター
ンメモリ3に順に格納し、その読取り入力に供してい
る。
文字回転識別部4は基本的にはパターンメモリ3に格納
された文字画像を、文字辞書5を参照して認識処理する
ものである。この際、文字回転識別部4は上記文字画像
を、前記光電変換部1での読取り方向に対して所定角度
ずつ回転し、例えば90°単位で回転処理し、その向きが
上下左右の4つの向きを取り得る可能性があることを想
定し、各向きについてそれぞれ文字辞書5を参照してそ
の認識結果を求めるものとなっている。
された文字画像を、文字辞書5を参照して認識処理する
ものである。この際、文字回転識別部4は上記文字画像
を、前記光電変換部1での読取り方向に対して所定角度
ずつ回転し、例えば90°単位で回転処理し、その向きが
上下左右の4つの向きを取り得る可能性があることを想
定し、各向きについてそれぞれ文字辞書5を参照してそ
の認識結果を求めるものとなっている。
具体的には第2図に例示するように『 』なる氏名を示す文字列が与えられた場合、その先頭の
文字『 』についてその向きが上下左右の4つの向きを取り得る
ことを想定し、その文字画像を90°ずつ回転処理した第
3図に示すような4つの文字画像を求め、これらの各文
字画像についてそれぞれ認識処理している。この認識
(識別)処理により、例えば0°回転(回転なし)の文
字画像『 』から「田」「母」等の文字認識結果を得、また90°回
転した文字画像『由』から「由」「申」等の文字認識結
果を得ている。同様にして180°回転した文字画像『 』から「田」「母」等の文字認識結果を得、270°回転
した文字画像『甲』から「甲」「用」等の文字認識結果
を得ている。
文字『 』についてその向きが上下左右の4つの向きを取り得る
ことを想定し、その文字画像を90°ずつ回転処理した第
3図に示すような4つの文字画像を求め、これらの各文
字画像についてそれぞれ認識処理している。この認識
(識別)処理により、例えば0°回転(回転なし)の文
字画像『 』から「田」「母」等の文字認識結果を得、また90°回
転した文字画像『由』から「由」「申」等の文字認識結
果を得ている。同様にして180°回転した文字画像『 』から「田」「母」等の文字認識結果を得、270°回転
した文字画像『甲』から「甲」「用」等の文字認識結果
を得ている。
文字列識別部6は、上述した如く想定した各向きについ
てそれぞれ求められた文字認識結果の列と、文字列辞書
7に登録されている認識対象文字列(例えば氏名や単語
等)とをそれぞれ比較照合し、該当する文字列が辞書7
中に存在するか否かを判定するものである。
てそれぞれ求められた文字認識結果の列と、文字列辞書
7に登録されている認識対象文字列(例えば氏名や単語
等)とをそれぞれ比較照合し、該当する文字列が辞書7
中に存在するか否かを判定するものである。
具体的には第4図に示すように0°回転を与えて識別さ
れた文字認識結果の列「田町然向」「母脈興何」…,90
°回転を与えて識別された文字認識結果の列「由良浩
司」「田町減団」…,180°回転を与えて識別された文字
認識結果の列「田畑単凶」,…等についてそれぞれ文字
列辞書7に登録された第5図に示すような文字列と照合
し、一致する文字列を探し出している。この場合には、
90°回転を与えて識別された文字認識結果の列「由良浩
司」について文字列辞書7から該当文字列が見出される
ことから、前記入力文字列が「由良浩司」であると識別
される。
れた文字認識結果の列「田町然向」「母脈興何」…,90
°回転を与えて識別された文字認識結果の列「由良浩
司」「田町減団」…,180°回転を与えて識別された文字
認識結果の列「田畑単凶」,…等についてそれぞれ文字
列辞書7に登録された第5図に示すような文字列と照合
し、一致する文字列を探し出している。この場合には、
90°回転を与えて識別された文字認識結果の列「由良浩
司」について文字列辞書7から該当文字列が見出される
ことから、前記入力文字列が「由良浩司」であると識別
される。
尚、この各向きについての文字認識結果の列と文字列辞
書7に登録されている文字列との比較照合は、日本語の
場合には縦書きの場合には上から下へ、また横書きの場
合には左から右へと文字が記載されるとの前提の下で、
180°回転,および270°回転した文字認識結果の列につ
いては、その文字を逆順に抽出して文字列辞書7との照
合が行なわれる。つまり180°回転して求められる向き
の文字認識結果列については、「田畑単凶」なる文字列
ではなく「凶単畑田」なる文字列として辞書照合が行な
われる。
書7に登録されている文字列との比較照合は、日本語の
場合には縦書きの場合には上から下へ、また横書きの場
合には左から右へと文字が記載されるとの前提の下で、
180°回転,および270°回転した文字認識結果の列につ
いては、その文字を逆順に抽出して文字列辞書7との照
合が行なわれる。つまり180°回転して求められる向き
の文字認識結果列については、「田畑単凶」なる文字列
ではなく「凶単畑田」なる文字列として辞書照合が行な
われる。
このように本装置によれば、自由形式で記載された文字
列を読取り入力する際、その文字列を構成する各文字が
取り得る向きを上下左右の4つ向きとして想定し、その
向きについて求められた文字認識結果の列を直接的に文
字列辞書7と照合して文字列の識別を行なうものとなっ
ている。これ故、従来のように一々文字の向きを判断
し、更に文字列の向きを判断した上で文字列の識別処理
を行なう必要がなく、その処理手続きを大幅に簡略化す
ることができる。しかも文字列を1つの処理単位として
識別処理するので、例えば個々の文字の向きが不確かな
場合であっても、その文字列を正確に認識し、読取り入
力することができる。従って誤認識や認識リジェクトの
発生を効果的に抑え、文字列の読取り入力の効率化を図
ることが可能となる等の実用上多大なる効果が奏せられ
る。
列を読取り入力する際、その文字列を構成する各文字が
取り得る向きを上下左右の4つ向きとして想定し、その
向きについて求められた文字認識結果の列を直接的に文
字列辞書7と照合して文字列の識別を行なうものとなっ
ている。これ故、従来のように一々文字の向きを判断
し、更に文字列の向きを判断した上で文字列の識別処理
を行なう必要がなく、その処理手続きを大幅に簡略化す
ることができる。しかも文字列を1つの処理単位として
識別処理するので、例えば個々の文字の向きが不確かな
場合であっても、その文字列を正確に認識し、読取り入
力することができる。従って誤認識や認識リジェクトの
発生を効果的に抑え、文字列の読取り入力の効率化を図
ることが可能となる等の実用上多大なる効果が奏せられ
る。
尚、本発明は上述した実施例に限定されるものではな
い。例えば文字列画像から個々の文字画像を抽出する
際、その文字列を構成する文字数が分るので、その情報
を利用して文字列辞書7の照合範囲を限定するように制
御することも可能である。また個々の文字画像の認識処
理の方式等も特に限定されない。その他、本発明はその
要旨を逸脱しない範囲で種々変形して実施することがで
きる。
い。例えば文字列画像から個々の文字画像を抽出する
際、その文字列を構成する文字数が分るので、その情報
を利用して文字列辞書7の照合範囲を限定するように制
御することも可能である。また個々の文字画像の認識処
理の方式等も特に限定されない。その他、本発明はその
要旨を逸脱しない範囲で種々変形して実施することがで
きる。
[発明の効果] 以上説明したように本発明よれば、帳票上に自由形式で
記載された縦書き、横書きの文字列であっても、また帳
票が上下反転していても非常に効率的にかつ正確に読取
ることができる。従って、従来のように文字の向きを判
断し、さらに文字列の向きを判断して文字列の識別を行
うものに比して処理を大幅に簡略することができ、その
結果、認識時間も短縮することができる等の実用上多大
なる効果を奏することができる。
記載された縦書き、横書きの文字列であっても、また帳
票が上下反転していても非常に効率的にかつ正確に読取
ることができる。従って、従来のように文字の向きを判
断し、さらに文字列の向きを判断して文字列の識別を行
うものに比して処理を大幅に簡略することができ、その
結果、認識時間も短縮することができる等の実用上多大
なる効果を奏することができる。
図は本発明の一実施例を示すもので、第1図は実施例装
置の要部概略構成図、第2図は入力文字列画像と文字画
像の抽出処理の例を説明する為の図、第3図は文字画像
に対する回転処理の概念を示す図、第4図は文字の向き
毎に求められる文字認識結果の列の例を示す図、第5図
は文字列辞書に登録される認識対象文字列の例を示す図
である。 1…光電変換部(光電変換手段)、2…文字検出切出部
(文字検出切出手段)、3…パターンメモリ、4…文字
回転識別部(文字回転認識手段)、5…文字辞書、6…
文字列識別部(文字列識別手段)、7…文字列辞書。
置の要部概略構成図、第2図は入力文字列画像と文字画
像の抽出処理の例を説明する為の図、第3図は文字画像
に対する回転処理の概念を示す図、第4図は文字の向き
毎に求められる文字認識結果の列の例を示す図、第5図
は文字列辞書に登録される認識対象文字列の例を示す図
である。 1…光電変換部(光電変換手段)、2…文字検出切出部
(文字検出切出手段)、3…パターンメモリ、4…文字
回転識別部(文字回転認識手段)、5…文字辞書、6…
文字列識別部(文字列識別手段)、7…文字列辞書。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭57−136285(JP,A) 特開 昭58−39377(JP,A) 特開 昭53−29623(JP,A)
Claims (1)
- 【請求項1】帳票上に記載された文字列を読取る光電変
換手段と、 この光電変換手段により読取られた文字列画像から文字
画像を1文字ずつ順に抽出する文字検出切出手段と、 この文字検出切出手段にて抽出された文字画像を前記光
電変換手段での文字読取り方向に対して90°単位で回転
処理し、前記各文字画像に対するそれぞれの回転角度毎
の文字認識結果を求める文字回転認識手段と、 この文字回転認識手段で求められた認識結果の文字を、
同じ回転角度の認識文字を抽出することにより各角度毎
の文字列候補として出力する手段と、 読取り対象となる文字列を予め記憶する文字列辞書と、 前記出力手段から出力されたそれぞれの文字列候補を、
前記文字列辞書に記憶されている読取り対象文字列と比
較することにより文字列の識別結果を求める文字列識別
手段とを具備することを特徴とする文字列読取装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63001025A JPH0795332B2 (ja) | 1988-01-06 | 1988-01-06 | 文字列読取装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63001025A JPH0795332B2 (ja) | 1988-01-06 | 1988-01-06 | 文字列読取装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH01177179A JPH01177179A (ja) | 1989-07-13 |
| JPH0795332B2 true JPH0795332B2 (ja) | 1995-10-11 |
Family
ID=11490024
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63001025A Expired - Lifetime JPH0795332B2 (ja) | 1988-01-06 | 1988-01-06 | 文字列読取装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0795332B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4553241B2 (ja) * | 2004-07-20 | 2010-09-29 | 株式会社リコー | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5329623A (en) * | 1976-09-01 | 1978-03-20 | Oki Electric Ind Co Ltd | Optical character reader |
| JPS57136285A (en) * | 1981-02-17 | 1982-08-23 | Fujitsu Ltd | Character recognizing system |
| JPS5839377A (ja) * | 1981-09-02 | 1983-03-08 | Toshiba Corp | 文字認識装置 |
-
1988
- 1988-01-06 JP JP63001025A patent/JPH0795332B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH01177179A (ja) | 1989-07-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3445394B2 (ja) | 少なくとも二つのイメージセクションの比較方法 | |
| JP3343864B2 (ja) | 語体の分離方法 | |
| JP3602596B2 (ja) | ドキュメントファイリング装置および方法 | |
| WO2025003209A1 (en) | Image analysis | |
| JPH0795332B2 (ja) | 文字列読取装置 | |
| JP3090070B2 (ja) | 帳票識別方法及び装置 | |
| CN115437504B (zh) | 页码定位方法、基于其的辅助阅读方法及应用 | |
| JP4221960B2 (ja) | 帳票識別装置及びその識別方法 | |
| JP2004280530A (ja) | 帳票処理システム及び帳票処理方法 | |
| JPS62166479A (ja) | 名刺画像処理方法 | |
| JPH01201789A (ja) | 文字読取装置 | |
| JPH1166230A (ja) | 文書認識装置、文書認識方法及び媒体 | |
| JP2977244B2 (ja) | 文字認識方法及び文字認識装置 | |
| JPH10124610A (ja) | 光学式文字読取装置 | |
| JP3151866B2 (ja) | 英文字認識方法 | |
| CN114565750A (zh) | 一种纸质试题的处理方法和系统 | |
| JP2006330873A (ja) | 指紋照合装置、方法およびプログラム | |
| JP2600703B2 (ja) | 部分細線照合装置 | |
| JP2570311B2 (ja) | 文字列認識装置 | |
| JPH01191986A (ja) | 読取装置 | |
| JP2963474B2 (ja) | 類似文字識別方法 | |
| JP2002042138A (ja) | 画像照合装置、画像照合方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JPH0264882A (ja) | 住所読取装置 | |
| JP2004013188A (ja) | 帳票読取り装置および帳票読取り方法ならびプログラム | |
| JPH0696277A (ja) | 英文字認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081011 Year of fee payment: 13 |
|
| EXPY | Cancellation because of completion of term | ||
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081011 Year of fee payment: 13 |