JPH04167193A - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JPH04167193A JPH04167193A JP2295733A JP29573390A JPH04167193A JP H04167193 A JPH04167193 A JP H04167193A JP 2295733 A JP2295733 A JP 2295733A JP 29573390 A JP29573390 A JP 29573390A JP H04167193 A JPH04167193 A JP H04167193A
- Authority
- JP
- Japan
- Prior art keywords
- character
- punctuation mark
- document
- punctuation
- orientation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は、紙等に印刷された文字を画像として読み取り
、各文字を認識する文字認識方法に関するものである。
、各文字を認識する文字認識方法に関するものである。
[従来の技術]
従来、文字パターンから文字を認識する際には、画像読
み取り装置に認識対象文書となる原稿を載せて、原稿の
画像をビットイメージで読み取り、その中から各文字を
切り出す。そして、各文字の文字パターンの特徴量と予
め保持しである文字の特徴量とを比較しながら、一致が
得られたらその文字を認識結果として出力していた。
み取り装置に認識対象文書となる原稿を載せて、原稿の
画像をビットイメージで読み取り、その中から各文字を
切り出す。そして、各文字の文字パターンの特徴量と予
め保持しである文字の特徴量とを比較しながら、一致が
得られたらその文字を認識結果として出力していた。
[発明が解決しようとする課題]
しかしながら従来の場合、原稿の置き方として文字の方
向即ち、上下、左右を指定された通りに置かないと文字
の認識が行われなかったり、或は、原稿の載置の方向を
ユーザが翻訳装置に指示しておく必要があった。或は、
4つの方向全てに辞書との照合を行う為処理速度が遅か
った。
向即ち、上下、左右を指定された通りに置かないと文字
の認識が行われなかったり、或は、原稿の載置の方向を
ユーザが翻訳装置に指示しておく必要があった。或は、
4つの方向全てに辞書との照合を行う為処理速度が遅か
った。
[課題を解決するための手段]
この課題を解決するために本発明は句読点の位置に着目
して文字の方向を識別するようにした。
して文字の方向を識別するようにした。
即ち、認識対象文書が、縦書きが横書きかを求め認識対
象文書を構成する文字の外接矩形の大きさ、位置に基づ
いて句読点に対応する位置に文字が存在するとした場合
の該文字の外接矩形となる句読点領域を求め、その領域
内での句読点の位置に応じて文字の方向を特定し、文字
の認識を行うようにした。
象文書を構成する文字の外接矩形の大きさ、位置に基づ
いて句読点に対応する位置に文字が存在するとした場合
の該文字の外接矩形となる句読点領域を求め、その領域
内での句読点の位置に応じて文字の方向を特定し、文字
の認識を行うようにした。
[作用]
句読点は横書きの場合は領域の左下に、縦書きの場合に
は右上にあるものなので、文書が縦書きか横書きかとい
う情報とで、文字の方向を特定することができる。
は右上にあるものなので、文書が縦書きか横書きかとい
う情報とで、文字の方向を特定することができる。
[実施例コ
以下、本発明の一実施例における文字認識方法について
図面を参照しながら説明する。
図面を参照しながら説明する。
第1図は、本実施例の文字認識方法を用いた文字認識装
置の構成図である。1は文字の記入されている文書を光
学的に走査し、電気信号に変換する光電変換部、2は光
電変換部1がら送られてくる光電変換信号を、ある基準
により、白黒に対応して2値化する2値化部、3は2値
化部2がら送られてくる2値化パターンから領域に分割
する領域分割部、4は分割された領域から文字領域を抽
出する文字領域抽出部、5は文字領域抽出部4により抽
出された文字領域の水平垂直射影を作成し、その間隔か
ら縦書き・横書きを判定する縦書き・横書き判定部、6
は文字領域抽出部4より抽出された文字領域のオリエン
テーションを判定するオリエンテーション判定部である
。7は縦書き・横書き判定部5、オリエンテーション判
定部6で判定した結果に従って、文字認識を行う文字認
識部である。
置の構成図である。1は文字の記入されている文書を光
学的に走査し、電気信号に変換する光電変換部、2は光
電変換部1がら送られてくる光電変換信号を、ある基準
により、白黒に対応して2値化する2値化部、3は2値
化部2がら送られてくる2値化パターンから領域に分割
する領域分割部、4は分割された領域から文字領域を抽
出する文字領域抽出部、5は文字領域抽出部4により抽
出された文字領域の水平垂直射影を作成し、その間隔か
ら縦書き・横書きを判定する縦書き・横書き判定部、6
は文字領域抽出部4より抽出された文字領域のオリエン
テーションを判定するオリエンテーション判定部である
。7は縦書き・横書き判定部5、オリエンテーション判
定部6で判定した結果に従って、文字認識を行う文字認
識部である。
第2図は、第1図の文字認識装置のブロック図である。
8はRAMで、画像データ等を格納する。9はROMで
、文字パターン辞書、プログラム等を格納する。10は
R3232Cで、認識指令及び、文字出力を行う。11
は演算処理装置で、プログラムの動作をコントロールす
る。12はスキャナで画像をイメージ・メモリの中にと
りこむ。
、文字パターン辞書、プログラム等を格納する。10は
R3232Cで、認識指令及び、文字出力を行う。11
は演算処理装置で、プログラムの動作をコントロールす
る。12はスキャナで画像をイメージ・メモリの中にと
りこむ。
処理全体の流れを、第3図のフローチャートを使って、
説明する。
説明する。
初めに、2値データを縦横両方向に走査して、白黒それ
ぞれの画素の連続した部分を領域区分線として、領域に
分割する(ステップl、第9図、第10図)。分割した
領域を更に黒画素8連結の小領域に分割し、その間隔、
大きさの分布が、ばらつきの少ない領域を、文字領域と
して抽出する(ステップ2、第11図)。抽出された文
字領域の水平・垂直斜影を取り、その谷間の大きさより
、縦書き・横書きを判定する(ステップ3、第4図)。
ぞれの画素の連続した部分を領域区分線として、領域に
分割する(ステップl、第9図、第10図)。分割した
領域を更に黒画素8連結の小領域に分割し、その間隔、
大きさの分布が、ばらつきの少ない領域を、文字領域と
して抽出する(ステップ2、第11図)。抽出された文
字領域の水平・垂直斜影を取り、その谷間の大きさより
、縦書き・横書きを判定する(ステップ3、第4図)。
黒画素8連結小領域の位置、大きさから、句読点候補を
抽出し、認識を行う(ステップ4、第5図)。認識した
結果、その類似度等の評価値により、句読点であると判
定されれば、その句読点の位置に対応して文字が存在す
るとした場合のその文字の外接矩形である句読点領域を
求め、その句読点領域内での句読点の位置により、オリ
エンテーションを判定しくステップ8)、すべての句読
点がリジェクトされれば、数個の通常文字パタンを、そ
のまま、90度、180度、270度回転した4つのパ
ターンで認識を行う(ステップ6)。その4種類に対し
て、類似度等の認識確度の和が最大の方向より、オリエ
ンテーションを判定する(ステップ7)。最後に、対象
とした文字領域が、判定した縦書き・横書き、オリエン
テーションであるとして、すべての文字を認識する(ス
テップ9)。
抽出し、認識を行う(ステップ4、第5図)。認識した
結果、その類似度等の評価値により、句読点であると判
定されれば、その句読点の位置に対応して文字が存在す
るとした場合のその文字の外接矩形である句読点領域を
求め、その句読点領域内での句読点の位置により、オリ
エンテーションを判定しくステップ8)、すべての句読
点がリジェクトされれば、数個の通常文字パタンを、そ
のまま、90度、180度、270度回転した4つのパ
ターンで認識を行う(ステップ6)。その4種類に対し
て、類似度等の認識確度の和が最大の方向より、オリエ
ンテーションを判定する(ステップ7)。最後に、対象
とした文字領域が、判定した縦書き・横書き、オリエン
テーションであるとして、すべての文字を認識する(ス
テップ9)。
具体例により、オリエンテーション判定について、説明
を補足する。句読点が、第8図(a)の様に左下にある
場合、横書きならば、第6図(a)ポートレート、正置
、縦書きならば(d)ポートレート、逆置き(180度
回転)であると判定できる。また、第7図(b)の様に
文字が90度回転ならば、各々第6図(f)ランドスケ
ープ、逆置き、第6図(h)ランドスケープ、正置であ
ると判定できる。
を補足する。句読点が、第8図(a)の様に左下にある
場合、横書きならば、第6図(a)ポートレート、正置
、縦書きならば(d)ポートレート、逆置き(180度
回転)であると判定できる。また、第7図(b)の様に
文字が90度回転ならば、各々第6図(f)ランドスケ
ープ、逆置き、第6図(h)ランドスケープ、正置であ
ると判定できる。
[発明の効果]
以上のように、本発明は、縦書き、横書きの情報と句読
点の位置とから原稿のオリエンテーションを判定するこ
とにより、全自動で、文字認識を行うことが可能となり
、省力化、操作ミスがなくなる等の効果がある。
点の位置とから原稿のオリエンテーションを判定するこ
とにより、全自動で、文字認識を行うことが可能となり
、省力化、操作ミスがなくなる等の効果がある。
第1図は本発明の一実施例における文字認識方法を用い
た文字認識装置の構成図、第2図は本発明の一実施例に
おける文字認識装置のブロック図、第3図は本実施例に
おけるフローチャート、第4図は水平・垂直斜影の例を
示す図、第5図は8隣接小領域の外接矩形の例、第6図
は縦書き・横書き、オリエンテーションの例を示す図、
第7図は、スキャナから入ってくる文字パターンの例を
示す図、第8図は、同じく句読点の例を示す図、第9図
は入力文書の例を示す図、第10図は第9図の入力文書
の領域分割を行った例を示す図、第11図は、黒画素8
連結小連結に分割し、文字領域を抽出した例を示す図で
ある。 第2図 第4図 第5図 第7図 (a) (b) (c) (d) 第8図 (a) (b) (c) (d) (○) (b) (e) (f)図 (c) (d) (CI) (it)第9図 第11図 第10図 屹字領域
た文字認識装置の構成図、第2図は本発明の一実施例に
おける文字認識装置のブロック図、第3図は本実施例に
おけるフローチャート、第4図は水平・垂直斜影の例を
示す図、第5図は8隣接小領域の外接矩形の例、第6図
は縦書き・横書き、オリエンテーションの例を示す図、
第7図は、スキャナから入ってくる文字パターンの例を
示す図、第8図は、同じく句読点の例を示す図、第9図
は入力文書の例を示す図、第10図は第9図の入力文書
の領域分割を行った例を示す図、第11図は、黒画素8
連結小連結に分割し、文字領域を抽出した例を示す図で
ある。 第2図 第4図 第5図 第7図 (a) (b) (c) (d) 第8図 (a) (b) (c) (d) (○) (b) (e) (f)図 (c) (d) (CI) (it)第9図 第11図 第10図 屹字領域
Claims (1)
- 【特許請求の範囲】 1)認識対象文書の画像を読み取り、 読み取った画像中の各文字の外接矩形を求め、求められ
た外接矩形の大きさと並び方に基づいて読み取った画像
中の句読点に対応する位置に文字が存在するとした場合
の該文字の外接矩形である句読点領域を求め、 前記句読点領域内での句読点の位置と縦書きか横書きか
の情報とに応じて認識対象文書の向きを識別し、 識別された向きに応じて読み取られた画像中の各文字の
認識を行う ことを特徴とする文字認識方法。 2)前記句読点領域は複数の句読点に対して求め、その
各々から得られた文書の方向のうち、最も多い方向に応
じて文字の認識を行うことを特徴とする特許請求の範囲
第1項に記載の文字認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2295733A JP3064391B2 (ja) | 1990-10-31 | 1990-10-31 | 文字認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2295733A JP3064391B2 (ja) | 1990-10-31 | 1990-10-31 | 文字認識方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH04167193A true JPH04167193A (ja) | 1992-06-15 |
| JP3064391B2 JP3064391B2 (ja) | 2000-07-12 |
Family
ID=17824470
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2295733A Expired - Fee Related JP3064391B2 (ja) | 1990-10-31 | 1990-10-31 | 文字認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3064391B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1166213A (ja) * | 1997-08-26 | 1999-03-09 | Aputasu:Kk | 電子カルテ装置及びそれを利用した指示伝達方法並びに医療データを記録したコンピュータ読み取り可能な記録媒体 |
| JP2000076380A (ja) * | 1998-08-31 | 2000-03-14 | Casio Comput Co Ltd | 手書き文字入力装置及び記憶媒体 |
| CN116563879A (zh) * | 2023-05-12 | 2023-08-08 | 东南大学 | 电气图纸中多行文字和/或多角度文字识别方法及系统 |
-
1990
- 1990-10-31 JP JP2295733A patent/JP3064391B2/ja not_active Expired - Fee Related
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1166213A (ja) * | 1997-08-26 | 1999-03-09 | Aputasu:Kk | 電子カルテ装置及びそれを利用した指示伝達方法並びに医療データを記録したコンピュータ読み取り可能な記録媒体 |
| JP2000076380A (ja) * | 1998-08-31 | 2000-03-14 | Casio Comput Co Ltd | 手書き文字入力装置及び記憶媒体 |
| CN116563879A (zh) * | 2023-05-12 | 2023-08-08 | 东南大学 | 电气图纸中多行文字和/或多角度文字识别方法及系统 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3064391B2 (ja) | 2000-07-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2986383B2 (ja) | ライン走査画像のためのスキューを補正する方法及びその装置 | |
| JPH01253077A (ja) | 文字列検出方法 | |
| JP3006466B2 (ja) | 文字入力装置 | |
| JPH04167193A (ja) | 文字認識方法 | |
| JP3268552B2 (ja) | 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 | |
| US7103220B2 (en) | Image processing apparatus, method and program, and storage medium | |
| JPS63304387A (ja) | 文書読取装置 | |
| JP7532124B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
| JPH08171609A (ja) | 文字列高速抽出装置 | |
| JP3239965B2 (ja) | 文字認識装置 | |
| JP2800205B2 (ja) | 画像処理装置 | |
| JP2571826B2 (ja) | 文字列パターン切り出し装置 | |
| JPH07109612B2 (ja) | 画像処理方法 | |
| JPH11250179A (ja) | 文字認識装置および文字認識方法 | |
| JP3199033B2 (ja) | 光学式文字読取方法、及び光学式文字読取装置 | |
| JP2721415B2 (ja) | 文字画像抽出方法 | |
| JPH04252665A (ja) | 画像処理装置 | |
| JP2954218B2 (ja) | 画像処理方法及び装置 | |
| JPH04262660A (ja) | 画像認識出力装置 | |
| JPH083830B2 (ja) | 文字列パタ−ン切り出し方式 | |
| JPH01245376A (ja) | 文字読取装置の文字切出し装置 | |
| JPS6327751B2 (ja) | ||
| JPS61165184A (ja) | 基準点自動検出処理方法 | |
| JPH01144181A (ja) | 光学的文字読取装置 | |
| JPH0578068B2 (ja) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090512 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100512 Year of fee payment: 10 |
|
| LAPS | Cancellation because of no payment of annual fees |