JPH04338889A - 文字認識方法及びその装置 - Google Patents
文字認識方法及びその装置Info
- Publication number
- JPH04338889A JPH04338889A JP3111538A JP11153891A JPH04338889A JP H04338889 A JPH04338889 A JP H04338889A JP 3111538 A JP3111538 A JP 3111538A JP 11153891 A JP11153891 A JP 11153891A JP H04338889 A JPH04338889 A JP H04338889A
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- template
- templates
- priority
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は、文字認識システム、特
に、図面をコンピュータシステムに自動入力するときの
、図面中の文字およびシンボルの認識システムに関する
。
に、図面をコンピュータシステムに自動入力するときの
、図面中の文字およびシンボルの認識システムに関する
。
【0002】
【従来の技術】近年、設計や製造の部門においてコンピ
ュータを利用するCAD/CAMシステムが広く普及し
てきた。これに伴い、紙面に書かれた図面、機械図面等
を、コンピュータが処理可能なCADデータに変換する
手段としての図面の入力の自動化の必要性が益々高まっ
てきた。図面の入力においては、文字及びシンボルの認
識が重要である。従来、図面の入力は、下記のように行
われている。 (1)図面をスキャナ等で読み取り、二値化し、ラスタ
ー・データを作成する。 (2)ラスター・データから大きさを基準にして、文字
及びシンボル領域(以下文字領域と記す)を抽出する。 そして、文字領域に外接し、走査方向を水平方向とする
矩形を想定し、その外接矩形の左上隅および右下隅の各
座標からなる文字領域データを作成する。図8は、文字
領域の一例を示す。図8において21および22は、図
形領域を示す外接矩形、23、24、25、26は文字
領域を示す外接矩形を示す。各矩形領域は、左上隅およ
び右下隅(点で示す)の各座標(X、Y)によって表わ
される。
ュータを利用するCAD/CAMシステムが広く普及し
てきた。これに伴い、紙面に書かれた図面、機械図面等
を、コンピュータが処理可能なCADデータに変換する
手段としての図面の入力の自動化の必要性が益々高まっ
てきた。図面の入力においては、文字及びシンボルの認
識が重要である。従来、図面の入力は、下記のように行
われている。 (1)図面をスキャナ等で読み取り、二値化し、ラスタ
ー・データを作成する。 (2)ラスター・データから大きさを基準にして、文字
及びシンボル領域(以下文字領域と記す)を抽出する。 そして、文字領域に外接し、走査方向を水平方向とする
矩形を想定し、その外接矩形の左上隅および右下隅の各
座標からなる文字領域データを作成する。図8は、文字
領域の一例を示す。図8において21および22は、図
形領域を示す外接矩形、23、24、25、26は文字
領域を示す外接矩形を示す。各矩形領域は、左上隅およ
び右下隅(点で示す)の各座標(X、Y)によって表わ
される。
【0003】(3)全文字領域データについて、ある任
意の傾きを持つ直線上において、予め定められた文字間
隔以内で近接する文字領域を統合した文字列を定義する
文字列データを作成する。文字列データは、文字列に含
まれる全文字領域に外接する矩形の幅Wおよび高さHと
、その矩形の左上隅の座標(X、Y)と、先頭文字領域
の中心と末尾文字領域の中心を結んだ線と走査方向のな
す角度θとからなる。ただし、一文字から構成される文
字列の角度θは、予め定められた値とする。図9は文字
列の例を示す。図9において、27は文字領域24、2
5および26に外接する矩形である。矩形27の左上隅
の点27aの座標(X2、Y2)、幅W2、高さH2お
よび角度θ2が、この文字列の文字列データを表わす。 23は、一文字で構成された文字列であり、文字列デー
タは、文字領域23の左上隅の点23aの座標(X1、
Y1)、幅W1、高さH1、角度θ1で表わされる。こ
の場合θ1=0である。
意の傾きを持つ直線上において、予め定められた文字間
隔以内で近接する文字領域を統合した文字列を定義する
文字列データを作成する。文字列データは、文字列に含
まれる全文字領域に外接する矩形の幅Wおよび高さHと
、その矩形の左上隅の座標(X、Y)と、先頭文字領域
の中心と末尾文字領域の中心を結んだ線と走査方向のな
す角度θとからなる。ただし、一文字から構成される文
字列の角度θは、予め定められた値とする。図9は文字
列の例を示す。図9において、27は文字領域24、2
5および26に外接する矩形である。矩形27の左上隅
の点27aの座標(X2、Y2)、幅W2、高さH2お
よび角度θ2が、この文字列の文字列データを表わす。 23は、一文字で構成された文字列であり、文字列デー
タは、文字領域23の左上隅の点23aの座標(X1、
Y1)、幅W1、高さH1、角度θ1で表わされる。こ
の場合θ1=0である。
【0004】(4)文字列の全文字に対して下記の(5
)〜(6)の処理を行う。 (5)各文字について、文字領域データを参照し、ラス
ター・データから文字領域を切り出し、文字列の角度(
図9のθ2)回転させ、正立状態に直す。この画像のサ
イズをテンプレートのサイズと合わせる処理(正規化)
を施し、その文字の文字画像とする。 (6)つぎのようにして、文字画像を認識する。文字画
像と辞書のテンプレートを照合し、距離が一番小さいテ
ンプレートのコードを認識結果とする。但し、距離が大
きい場合は、誤認識した可能性が大であることから、認
識できたか、できなかったかを判断するしきい値として
、最大許容不一致度を定め、この値より距離の大きいも
のは、認識出来なかった(リジェクト)とする。
)〜(6)の処理を行う。 (5)各文字について、文字領域データを参照し、ラス
ター・データから文字領域を切り出し、文字列の角度(
図9のθ2)回転させ、正立状態に直す。この画像のサ
イズをテンプレートのサイズと合わせる処理(正規化)
を施し、その文字の文字画像とする。 (6)つぎのようにして、文字画像を認識する。文字画
像と辞書のテンプレートを照合し、距離が一番小さいテ
ンプレートのコードを認識結果とする。但し、距離が大
きい場合は、誤認識した可能性が大であることから、認
識できたか、できなかったかを判断するしきい値として
、最大許容不一致度を定め、この値より距離の大きいも
のは、認識出来なかった(リジェクト)とする。
【0005】
【発明が解決しようとする課題】地図、配線図、イラス
ト図などを新規に作成する場合、手書き文字より、印刷
した文字の方が高い認識率を得られることから、図面を
作成する場合に、予め必要な文字やシンボルを印刷した
紙片を図面に貼付するという方法が取られることがある
。このように人手で印刷文字を切り貼りする場合には、
文字が傾かないように貼ることは仲々困難である。 一方、前述のように、従来の図面の自動入力における図
面の認識では、複数の文字から構成される文字列は、文
字の繋がりから文字の傾きを求めている。しかし、一文
字で構成される文字列や、単独で存在することの多いシ
ンボルの場合には、角度を特定することが出来ないので
、あらかじめ一文字文字列の角度をきめておく。
ト図などを新規に作成する場合、手書き文字より、印刷
した文字の方が高い認識率を得られることから、図面を
作成する場合に、予め必要な文字やシンボルを印刷した
紙片を図面に貼付するという方法が取られることがある
。このように人手で印刷文字を切り貼りする場合には、
文字が傾かないように貼ることは仲々困難である。 一方、前述のように、従来の図面の自動入力における図
面の認識では、複数の文字から構成される文字列は、文
字の繋がりから文字の傾きを求めている。しかし、一文
字で構成される文字列や、単独で存在することの多いシ
ンボルの場合には、角度を特定することが出来ないので
、あらかじめ一文字文字列の角度をきめておく。
【0006】しかし、上記のように、人手による切り貼
り作業の場合、定められた文字を定められた角度で正確
に貼ることが困難であり、多少傾いてしまうのが自然で
ある。そこで、上記自動入力手順(5)において、文字
領域を切り出し、正立状態に回転させ、文字画像を得て
も、多少傾きのある文字画像となってしまい、認識でき
ないことがある。本発明は、上記従来技術における問題
点に鑑みなされたもので、多少傾いた文字やシンボルで
あっても、正確にかつ短時間で認識することができる文
字認識方法および装置を提供することを目的とする。
り作業の場合、定められた文字を定められた角度で正確
に貼ることが困難であり、多少傾いてしまうのが自然で
ある。そこで、上記自動入力手順(5)において、文字
領域を切り出し、正立状態に回転させ、文字画像を得て
も、多少傾きのある文字画像となってしまい、認識でき
ないことがある。本発明は、上記従来技術における問題
点に鑑みなされたもので、多少傾いた文字やシンボルで
あっても、正確にかつ短時間で認識することができる文
字認識方法および装置を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明による文字認識方
法は、文字あるいはシンボルの画像を、その文字あるい
はシンボルのいろいろな姿勢をそれぞれ表わす複数のテ
ンプレートと順次照合し、画像に最も適合するテンプレ
ートにより文字あるいは、シンボルを認識するように構
成される。上記の照合は、複数のテンプレートに対し、
文字あるいはシンボルの正立状態からの傾き角度が大き
くなる程低い優先順位を与え、この優先順位に従って行
う。
法は、文字あるいはシンボルの画像を、その文字あるい
はシンボルのいろいろな姿勢をそれぞれ表わす複数のテ
ンプレートと順次照合し、画像に最も適合するテンプレ
ートにより文字あるいは、シンボルを認識するように構
成される。上記の照合は、複数のテンプレートに対し、
文字あるいはシンボルの正立状態からの傾き角度が大き
くなる程低い優先順位を与え、この優先順位に従って行
う。
【0008】本発明による文字認識装置は、紙面に描か
れた文字あるいはシンボルを読み込み、文字画像を形成
する手段と、文字あるいはシンボルの紙面上の正立状態
および正立状態から僅かづつ傾いた状態をそれぞれ表わ
す複数のテンプレートを有する辞書と、文字画像を、辞
書の複数のテンプレートと順次照合することにより、文
字あるいはシンボルの認識を行う文字認識部とを具備す
るように構成される。文字認識部は、文字あるいはシン
ボルの正立状態を表わすテンプレートに最高優先順位を
与え、以下、傾き角度が大きくなる程低い優先順位を与
え、この優先順位に従って、文字画像と複数のテンプレ
ートとを順次照合する手段と、文字画像と最も近く、か
つ、許容範囲内にあるテンプレートを抽出し、このテン
プレートの文字あるいはシンボルを、紙面上の文字ある
いはシンボルであると認定し、許容範囲内にあるテンプ
レートが存在しないときはリジェクトとする手段を具備
するように構成される。
れた文字あるいはシンボルを読み込み、文字画像を形成
する手段と、文字あるいはシンボルの紙面上の正立状態
および正立状態から僅かづつ傾いた状態をそれぞれ表わ
す複数のテンプレートを有する辞書と、文字画像を、辞
書の複数のテンプレートと順次照合することにより、文
字あるいはシンボルの認識を行う文字認識部とを具備す
るように構成される。文字認識部は、文字あるいはシン
ボルの正立状態を表わすテンプレートに最高優先順位を
与え、以下、傾き角度が大きくなる程低い優先順位を与
え、この優先順位に従って、文字画像と複数のテンプレ
ートとを順次照合する手段と、文字画像と最も近く、か
つ、許容範囲内にあるテンプレートを抽出し、このテン
プレートの文字あるいはシンボルを、紙面上の文字ある
いはシンボルであると認定し、許容範囲内にあるテンプ
レートが存在しないときはリジェクトとする手段を具備
するように構成される。
【0009】
【作用】上記構成により、辞書をマルチテンプレート化
し、正立文字のテンプレートと、いろいろな傾きを持つ
文字のテンプレートを辞書に登録する。上記の複数のテ
ンプレートに対して、紙面上の文字との適合の可能性の
大きさの順に優先順位をつける。図面等の紙面上に描か
れた文字を読み込み、文字画像を求め、この文字画像を
、上記の複数のテンプレートと優先順位の順に順次照合
し、最も適合したテンプレートの文字を上記紙面上の文
字と認定する。これによって、多少傾いた文字も認識可
能になると共に誤認識を防止することができる。また、
認識時間を短縮することができる。
し、正立文字のテンプレートと、いろいろな傾きを持つ
文字のテンプレートを辞書に登録する。上記の複数のテ
ンプレートに対して、紙面上の文字との適合の可能性の
大きさの順に優先順位をつける。図面等の紙面上に描か
れた文字を読み込み、文字画像を求め、この文字画像を
、上記の複数のテンプレートと優先順位の順に順次照合
し、最も適合したテンプレートの文字を上記紙面上の文
字と認定する。これによって、多少傾いた文字も認識可
能になると共に誤認識を防止することができる。また、
認識時間を短縮することができる。
【0010】
【実施例】以下、本発明の実施例について、図面を参照
して詳細に説明する。図1は本発明による文字・図形認
識装置の一実施例の構成図である。図1において、スキ
ャナ1は、図面等の紙面を走査し、文字、シンボル、図
形等を二値ラスター・データに変換する。このときスキ
ャナ1の制御をスキャナ制御部2が司る。スキャナ制御
部2は、読み込まれたラスター・データをフレーム・メ
モリ9に格納する。文字・図形分離部3は、ラスター・
データから連結黒画素成分の大きさを計測し、予め定め
られた文字の大きさに適合するものを文字候補とする。 文字候補以外を図形候補とする。文字候補に対しては、
前述のごとき文字領域データを作成し、文字・図形メモ
リ8に格納する。ベクトル生成部4は、図形候補に対し
てラスター・ベクトル変換(折れ線近似)を行い、生成
されたベクトル・データを文字・図形メモリ8に格納す
る。
して詳細に説明する。図1は本発明による文字・図形認
識装置の一実施例の構成図である。図1において、スキ
ャナ1は、図面等の紙面を走査し、文字、シンボル、図
形等を二値ラスター・データに変換する。このときスキ
ャナ1の制御をスキャナ制御部2が司る。スキャナ制御
部2は、読み込まれたラスター・データをフレーム・メ
モリ9に格納する。文字・図形分離部3は、ラスター・
データから連結黒画素成分の大きさを計測し、予め定め
られた文字の大きさに適合するものを文字候補とする。 文字候補以外を図形候補とする。文字候補に対しては、
前述のごとき文字領域データを作成し、文字・図形メモ
リ8に格納する。ベクトル生成部4は、図形候補に対し
てラスター・ベクトル変換(折れ線近似)を行い、生成
されたベクトル・データを文字・図形メモリ8に格納す
る。
【0011】文字列抽出部5は、文字・図形メモリ8に
格納された文字領域データを参照し、文字列データを作
成し、文字・図形メモリ8に格納する。文字領域切り出
し部6は、文字・図形メモリ8に格納されている文字領
域データと文字列データを参照し、フレーム・メモリ9
に格納されているラスター・データから文字領域イメー
ジを切り出し、これを回転した後、正規化し、文字画像
とする。文字認識部7は、文字画像と後に詳述する辞書
11とを参照することによって文字の認識を行い、文字
認識結果をコード・メモリ10に格納する。通信制御部
12は、文字・図形メモリ8に格納されたベクトル・デ
ータおよびコードメモリ10に格納された文字データを
CADシステムへ出力する。
格納された文字領域データを参照し、文字列データを作
成し、文字・図形メモリ8に格納する。文字領域切り出
し部6は、文字・図形メモリ8に格納されている文字領
域データと文字列データを参照し、フレーム・メモリ9
に格納されているラスター・データから文字領域イメー
ジを切り出し、これを回転した後、正規化し、文字画像
とする。文字認識部7は、文字画像と後に詳述する辞書
11とを参照することによって文字の認識を行い、文字
認識結果をコード・メモリ10に格納する。通信制御部
12は、文字・図形メモリ8に格納されたベクトル・デ
ータおよびコードメモリ10に格納された文字データを
CADシステムへ出力する。
【0012】辞書11は、つぎのように構成する。
(1)辞書11をマルチテンプレートにする。すなわち
、全文字あるいはシンボル(以下、文字とシンボルを総
称して、文字と記す。)の正立状態の画像、ある傾きの
ある画像を収集してそれぞれテンプレート群とし、これ
等テンプレート群の集合として辞書11を構成する。 左右両方向に傾く可能性がある文字については、左方向
と右方向に傾いた文字の別々のテンプレートを設ける。 (2)各テンプレート群に優先順位をつける。正立画像
で作成したテンプレート群に一番高い優先度を付加し、
次に傾く可能性の高い角度のテンプレート群に次に高い
優先度を付加する。この様に、全テンプレート群に優先
度を付加する。図1において、辞書11は、それぞれm
個の文字のテンプレートからなるn個テンプレート群T
G1、TG2…TGnを有する。優先度1のテンプレー
ト群TG1のm個の文字のテンプレートは、全て正立文
字のテンプレートである。優先度2のテンプレート群T
G2は、正立文字より少し傾いたm個の文字のテンプレ
ートを有する。以下、テンプレート群の優先度が下がる
に従ってm個の文字の傾きが大きくなる。
、全文字あるいはシンボル(以下、文字とシンボルを総
称して、文字と記す。)の正立状態の画像、ある傾きの
ある画像を収集してそれぞれテンプレート群とし、これ
等テンプレート群の集合として辞書11を構成する。 左右両方向に傾く可能性がある文字については、左方向
と右方向に傾いた文字の別々のテンプレートを設ける。 (2)各テンプレート群に優先順位をつける。正立画像
で作成したテンプレート群に一番高い優先度を付加し、
次に傾く可能性の高い角度のテンプレート群に次に高い
優先度を付加する。この様に、全テンプレート群に優先
度を付加する。図1において、辞書11は、それぞれm
個の文字のテンプレートからなるn個テンプレート群T
G1、TG2…TGnを有する。優先度1のテンプレー
ト群TG1のm個の文字のテンプレートは、全て正立文
字のテンプレートである。優先度2のテンプレート群T
G2は、正立文字より少し傾いたm個の文字のテンプレ
ートを有する。以下、テンプレート群の優先度が下がる
に従ってm個の文字の傾きが大きくなる。
【0013】以下、図1の文字図形認識装置の文字認識
動作を、図2のフローチャートを参照して説明する。 (1)図面をスキャナ1で読み込み、ラスターデータを
フレームメモリ9に格納する(S1)。 (2)ラスターデータから、文字領域データを作成し文
字・図形メモリ8に格納する(S2)。 (3)文字列抽出部5によって、文字列データを作成し
、文字・図形メモリ8に格納する(S3)。 (4)文字列の全文字に対して下記の処理を行う。 (5)文字領域切り出し部6は、文字・図形メモリ8に
格納されている文字領域データを参照し、フレームメモ
リ9内に格納されているラスターデータから文字領域を
切り出し(S4)、文字列の角度θだけ回転させて正立
状態に直し(S5)、この画像に正規化を施して(S6
)、文字画像(S7)とする。なお、上記(1)〜(5
)は、前述の従来技術におけるステップ(1)〜(5)
と同じである。
動作を、図2のフローチャートを参照して説明する。 (1)図面をスキャナ1で読み込み、ラスターデータを
フレームメモリ9に格納する(S1)。 (2)ラスターデータから、文字領域データを作成し文
字・図形メモリ8に格納する(S2)。 (3)文字列抽出部5によって、文字列データを作成し
、文字・図形メモリ8に格納する(S3)。 (4)文字列の全文字に対して下記の処理を行う。 (5)文字領域切り出し部6は、文字・図形メモリ8に
格納されている文字領域データを参照し、フレームメモ
リ9内に格納されているラスターデータから文字領域を
切り出し(S4)、文字列の角度θだけ回転させて正立
状態に直し(S5)、この画像に正規化を施して(S6
)、文字画像(S7)とする。なお、上記(1)〜(5
)は、前述の従来技術におけるステップ(1)〜(5)
と同じである。
【0014】つぎに、下記ステップ(6)〜(9)によ
って、文字認識部7は、文字画像の認識を行う。 (6)優先度を一番高い値にする(S8)。 (7)文字画像と該優先度を持つ全テンプレートとを照
合する(S9)。全てのテンプレートとの距離が、最大
許容不一致度より大きい場合(S10、S11)は、該
優先度では認識できなかったとする。そうでない場合は
、認識できたとし、距離が最小のテンプレートのコード
Tminを認識結果とし(S12)、終了する。 (8)文字画像が認識できるまで、優先度を一ランク落
とし、(7)の処理を行う(S14、S15)。 (9)全優先度との照合で認識結果が得られない場合は
リジェクトとする(S14、S16)。
って、文字認識部7は、文字画像の認識を行う。 (6)優先度を一番高い値にする(S8)。 (7)文字画像と該優先度を持つ全テンプレートとを照
合する(S9)。全てのテンプレートとの距離が、最大
許容不一致度より大きい場合(S10、S11)は、該
優先度では認識できなかったとする。そうでない場合は
、認識できたとし、距離が最小のテンプレートのコード
Tminを認識結果とし(S12)、終了する。 (8)文字画像が認識できるまで、優先度を一ランク落
とし、(7)の処理を行う(S14、S15)。 (9)全優先度との照合で認識結果が得られない場合は
リジェクトとする(S14、S16)。
【0015】以下、具体例について説明する。いま、図
3に示す図面14の認識処理を行うものとする。図面1
4には、シンボル15、16および17と、いくつかの
直線が描かれている。シンボル15、16、17を認識
対象とする。シンボル15は、正確に水平に描かれた4
角形、シンボル16は多少右に傾いた円、シンボル17
は、多少左に傾いた三角形である。ここで、一文字文字
列の角度は、0度とする。一方、辞書11は、図4、5
および6に示す3つのテンプレート群TG1、TG2、
TG3で構成する。テンプレート群TG1、TG2、T
G3はそれぞれ優先度1、2、3を与えられ、優先度1
、2、3の順で優先度が高いものとする。優先度1のテ
ンプレート群TG1は、正立したシンボルのテンプレー
トA1、B1、C1、D1…X1からなる。
3に示す図面14の認識処理を行うものとする。図面1
4には、シンボル15、16および17と、いくつかの
直線が描かれている。シンボル15、16、17を認識
対象とする。シンボル15は、正確に水平に描かれた4
角形、シンボル16は多少右に傾いた円、シンボル17
は、多少左に傾いた三角形である。ここで、一文字文字
列の角度は、0度とする。一方、辞書11は、図4、5
および6に示す3つのテンプレート群TG1、TG2、
TG3で構成する。テンプレート群TG1、TG2、T
G3はそれぞれ優先度1、2、3を与えられ、優先度1
、2、3の順で優先度が高いものとする。優先度1のテ
ンプレート群TG1は、正立したシンボルのテンプレー
トA1、B1、C1、D1…X1からなる。
【0016】優先度2のテンプレート群TG2は、少し
左方向に傾いたシンボルを含むテンプレートA21、B
21、C21、D21…X21からなるテンプレート群
TG21と、TG21と同程度に右方向に傾いたシンボ
ルを含むテンプレートA22、B22、C22、D22
…X22からなるテンプレート群TG22とを有する。 優先度3のテンプレート群TG3は、左方向に更に傾い
たシンボルを含むテンプレートA31、B31、C31
、D31…X31からなるテンプレート群TG31と、
TG31と同程度に右方向に傾いたシンボルを含むテン
プレートA32、B32、C32、D32…X32から
なるテンプレート群TG32とを有する。
左方向に傾いたシンボルを含むテンプレートA21、B
21、C21、D21…X21からなるテンプレート群
TG21と、TG21と同程度に右方向に傾いたシンボ
ルを含むテンプレートA22、B22、C22、D22
…X22からなるテンプレート群TG22とを有する。 優先度3のテンプレート群TG3は、左方向に更に傾い
たシンボルを含むテンプレートA31、B31、C31
、D31…X31からなるテンプレート群TG31と、
TG31と同程度に右方向に傾いたシンボルを含むテン
プレートA32、B32、C32、D32…X32から
なるテンプレート群TG32とを有する。
【0017】各シンボル15、16および17を認識す
る動作はつぎのように行われる。 (1)シンボル15の認識 シンボル15の文字領域を切り出し、正規化し、文字画
像を作成する。文字画像は図7の18のようになる、文
字画像18を優先度1のテンプレート群TG1と照合す
る。優先度1のテンプレート群TG1では、テンプレー
トA1との距離が最小になり、最大許容不一致度を越え
ない値なので、認識結果を4角形とし、認識を終了する
。 (2)シンボル16の認識 シンボル16の文字領域を切り出し、正規化し、文字画
像を作成する。文字画像は図7の19のようになる。文
字画像19を優先度1のテンプレート群TG1と照合す
る。優先度1のテンプレート群TG1では、テンプレー
トD1との距離が最小になるが、最小距離が最大許容不
一致度を越えた値なので、認識できなかったことになる
。従来の技術では、ここで終了するので、シンボル16
は認識できない。次に、文字画像19を優先度2のテン
プレート群TG2と照合する。優先度2のテンプレート
群TG2では、テンプレートD22との距離が最小にな
り、かつ、最大許容不一致度を越えない値なので、認識
結果を円とし、認識を終了する。
る動作はつぎのように行われる。 (1)シンボル15の認識 シンボル15の文字領域を切り出し、正規化し、文字画
像を作成する。文字画像は図7の18のようになる、文
字画像18を優先度1のテンプレート群TG1と照合す
る。優先度1のテンプレート群TG1では、テンプレー
トA1との距離が最小になり、最大許容不一致度を越え
ない値なので、認識結果を4角形とし、認識を終了する
。 (2)シンボル16の認識 シンボル16の文字領域を切り出し、正規化し、文字画
像を作成する。文字画像は図7の19のようになる。文
字画像19を優先度1のテンプレート群TG1と照合す
る。優先度1のテンプレート群TG1では、テンプレー
トD1との距離が最小になるが、最小距離が最大許容不
一致度を越えた値なので、認識できなかったことになる
。従来の技術では、ここで終了するので、シンボル16
は認識できない。次に、文字画像19を優先度2のテン
プレート群TG2と照合する。優先度2のテンプレート
群TG2では、テンプレートD22との距離が最小にな
り、かつ、最大許容不一致度を越えない値なので、認識
結果を円とし、認識を終了する。
【0018】(3)シンボル17の認識シンボル17の
文字領域を切り出し、正規化し、文字画像を作成する。 文字画像は図7の20のようになる。文字画像20を優
先度1のテンプレート群TG1と照合する。優先度1の
テンプレート群TG1では、テンプレートB1との距離
が最小になるが、最大許容不一致度を越えた値なので、
優先度1では認識できなかったことになる。従来の技術
では、ここで終了するので、シンボル17は認識できな
い。次に、文字画像20を優先度2のテンプレート群T
G2と照合する。優先度2のテンプレート群TG2では
、テンプレートB21との距離が最小になるが、最大許
容不一致度を越えた値なので、優先度2では認識できな
かったことになる。次に文字画像20を優先度3のテン
プレート群TG3と照合する。優先度3のテンプレート
群TG3では、テンプレートB31との距離が最小にな
り、かつ、最大許容不一致度を越えない値なので、認識
結果を三角形とし、認識を終了する。
文字領域を切り出し、正規化し、文字画像を作成する。 文字画像は図7の20のようになる。文字画像20を優
先度1のテンプレート群TG1と照合する。優先度1の
テンプレート群TG1では、テンプレートB1との距離
が最小になるが、最大許容不一致度を越えた値なので、
優先度1では認識できなかったことになる。従来の技術
では、ここで終了するので、シンボル17は認識できな
い。次に、文字画像20を優先度2のテンプレート群T
G2と照合する。優先度2のテンプレート群TG2では
、テンプレートB21との距離が最小になるが、最大許
容不一致度を越えた値なので、優先度2では認識できな
かったことになる。次に文字画像20を優先度3のテン
プレート群TG3と照合する。優先度3のテンプレート
群TG3では、テンプレートB31との距離が最小にな
り、かつ、最大許容不一致度を越えない値なので、認識
結果を三角形とし、認識を終了する。
【0019】
【発明の効果】本発明による文字認識方法によれば、辞
書をマルチテンプレートとし、各テンプレートに優先順
位を付与し、文字画像を複数のテンプレートと、優先順
位に従って、照合することにより文字を認識するように
したので、図面等に人手で貼布される場合のように傾い
た文字でも正確に、しかも短時間で認識することができ
る。従って、文字・図形認識装置の認識能力の向上に寄
与するところ大である。
書をマルチテンプレートとし、各テンプレートに優先順
位を付与し、文字画像を複数のテンプレートと、優先順
位に従って、照合することにより文字を認識するように
したので、図面等に人手で貼布される場合のように傾い
た文字でも正確に、しかも短時間で認識することができ
る。従って、文字・図形認識装置の認識能力の向上に寄
与するところ大である。
【図面の簡単な説明】
【図1】本発明の構成を示す図である。
【図2】図1のシステムの動作を示すフローチャートで
ある。
ある。
【図3】本発明の実施例における認識対象図面である。
【図4】優先度1のテンプレート群を示す図である。
【図5】優先度2のテンプレート群を示す図である。
【図6】優先度3のテンプレート群を示す図である。
【図7】図3の図面から切り出された文字画像を示す図
である。
である。
【図8】文字領域を説明するための図である。
【図9】文字列データを説明するための図である。
1 スキャナ
2 スキャナ制御部
3 文字・図形分離部
4 ベクトル生成部
5 文字列抽出部
6 文字領域切り出し部
7 文字認識部
8 文字・図形メモリ
9 フレームメモリ
10 コードメモリ
11 辞書
12 通信制御部
14 図面
15、16、17 シンボル
18、19、20 文字画像
21、22 図形領域
23、24、25、26 文字領域27
文字列 TG1〜TGn、TG21、TG22、TG31、TG
32 テンプレート群 A1〜X1、A21〜X21、A22〜X22、A31
〜X31、A32〜X32 テンプレートθ1、
θ2、W1、W2、H1、H2 文字列データS
1〜S15 ステップ
文字列 TG1〜TGn、TG21、TG22、TG31、TG
32 テンプレート群 A1〜X1、A21〜X21、A22〜X22、A31
〜X31、A32〜X32 テンプレートθ1、
θ2、W1、W2、H1、H2 文字列データS
1〜S15 ステップ
Claims (2)
- 【請求項1】 それぞれ別々の傾き角度を持つ文字あ
るいはシンボルを表わす複数のテンプレートを用意し、
前記複数のテンプレートに対して前記傾き角度が大きく
なる程低い優先順位を与え、文字あるいはシンボルの画
像を、前記複数のテンプレートと前記優先順位に従って
順次照合し、前記画像に最も適合するテンプレートによ
り前記文字あるいはシンボルを認識することを特徴とす
る文字認識方法。 - 【請求項2】 紙面に描かれた文字あるいはシンボル
を読み込み、文字画像を形成する手段と、前記文字ある
いはシンボルの紙面上の正立状態および正立状態から僅
かづつ傾いた状態をそれぞれ表わす複数のテンプレート
を有する辞書と、前記文字あるいはシンボルの正立状態
を表わすテンプレートに最高優先順位を与え、以下、傾
き角度が大きくなる程低い優先順位を与え、この優先順
位に従って、前記文字画像と前記複数のテンプレートと
を順次照合し、前記文字画像と最も近く、かつ、許容範
囲内にあるテンプレートを抽出し、このテンプレートの
文字あるいはシンボルを、前記紙面上の文字あるいはシ
ンボルであると認定し、許容範囲内にあるテンプレート
が存在しないときはリジェクトとする文字認識部とを具
備することを特徴とする文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3111538A JPH04338889A (ja) | 1991-05-16 | 1991-05-16 | 文字認識方法及びその装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3111538A JPH04338889A (ja) | 1991-05-16 | 1991-05-16 | 文字認識方法及びその装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04338889A true JPH04338889A (ja) | 1992-11-26 |
Family
ID=14563902
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3111538A Withdrawn JPH04338889A (ja) | 1991-05-16 | 1991-05-16 | 文字認識方法及びその装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04338889A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005346667A (ja) * | 2004-06-07 | 2005-12-15 | Sumitomo Electric Ind Ltd | ナンバープレート認識処理における文字切り出し方法、文字認識方法、並びにプログラム及び装置 |
| JP2010032287A (ja) * | 2008-07-28 | 2010-02-12 | Bridgestone Corp | 外観検査装置、及び被検査物の外観検査方法 |
| JP2017037415A (ja) * | 2015-08-07 | 2017-02-16 | キヤノン株式会社 | 情報処理装置およびその制御方法 |
-
1991
- 1991-05-16 JP JP3111538A patent/JPH04338889A/ja not_active Withdrawn
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005346667A (ja) * | 2004-06-07 | 2005-12-15 | Sumitomo Electric Ind Ltd | ナンバープレート認識処理における文字切り出し方法、文字認識方法、並びにプログラム及び装置 |
| JP2010032287A (ja) * | 2008-07-28 | 2010-02-12 | Bridgestone Corp | 外観検査装置、及び被検査物の外観検査方法 |
| JP2017037415A (ja) * | 2015-08-07 | 2017-02-16 | キヤノン株式会社 | 情報処理装置およびその制御方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111507251B (zh) | 试题图像中作答区域的定位方法、装置、电子设备及计算机存储介质 | |
| EP0764308B1 (en) | System and method for automatic page registration and automatic zone detection during forms processing | |
| JP4607633B2 (ja) | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 | |
| US5212739A (en) | Noise tolerant optical character recognition system | |
| JP3345224B2 (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
| US7123768B2 (en) | Apparatus and method for detecting a pattern | |
| MX2008011002A (es) | Metodo de ajuste de distorsion y aparato basado en el modelo. | |
| CN112418210B (zh) | 一种杆塔巡检信息智能分类方法 | |
| AU2006252019B2 (en) | Method and Apparatus for Dynamic Connector Analysis | |
| US8494278B2 (en) | Handwritten character recognition based on frequency variations in characters | |
| US6694065B2 (en) | Image collating apparatus and image collating method | |
| RU2626656C2 (ru) | Способ и система определения ориентации изображения текста | |
| JPH04338889A (ja) | 文字認識方法及びその装置 | |
| JP2000187705A (ja) | 文書読取装置および方法および記憶媒体 | |
| JP3466894B2 (ja) | 楽譜認識方法及びその装置並びに楽譜認識プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JP2775807B2 (ja) | 文字認識方法 | |
| CN115331229A (zh) | 一种光学字符识别方法、计算机可读存储介质及电子设备 | |
| JPS6027079A (ja) | 文字列の傾斜角検出装置 | |
| JPS61175880A (ja) | 破線抽出装置 | |
| JPH0117191B2 (ja) | ||
| JPH10261047A (ja) | 文字認識装置 | |
| JP4648084B2 (ja) | 記号認識方法及び装置 | |
| JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
| JPH06131446A (ja) | 指紋照合装置及び指紋照合方法 | |
| JP2004013188A (ja) | 帳票読取り装置および帳票読取り方法ならびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19980806 |