JPH03214286A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH03214286A JPH03214286A JP2009623A JP962390A JPH03214286A JP H03214286 A JPH03214286 A JP H03214286A JP 2009623 A JP2009623 A JP 2009623A JP 962390 A JP962390 A JP 962390A JP H03214286 A JPH03214286 A JP H03214286A
- Authority
- JP
- Japan
- Prior art keywords
- character
- section
- separated
- recognition
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
:1童菓上の利用分野二
本発明は、例えば印刷文書の文字を認識して文字コード
に変換する場合に使用して好適な文字認識装置に関する
。
に変換する場合に使用して好適な文字認識装置に関する
。
本発明は、例えば印刷文書の文字を認識して文字コード
に変換する場合に使用して好適な文字認識装置に関し、
原文書のイメージに対応する原文字信号から1個の文字
又は分離文字の各構成部を形成する切出し文字信号を順
次切出す文字切出し部と、文字コードに対応するイメー
ジデータを記憶した認識辞書部と、1個又は複数個のそ
の切出し文字信号に対応する文字コードをその認識辞書
部を用いて識別する文字識別部と、その文字切出し部よ
り供給されるその切出し文字信号のイメージデータをそ
の認識辞書部へ登録する辞書作成部とを有し、その文字
識別部にて分離文字の識別を誤った場合、この識別を誤
った分離文字の全体を形成する切出し文字信号をその文
字切出し部よりその辞書作成部へ供給することにより、
その識別を誤った分離文字のイメージデータをその認識
辞書部尺登録することにより、分離文字の識別率を容易
に高めることができるようにしたものである。
に変換する場合に使用して好適な文字認識装置に関し、
原文書のイメージに対応する原文字信号から1個の文字
又は分離文字の各構成部を形成する切出し文字信号を順
次切出す文字切出し部と、文字コードに対応するイメー
ジデータを記憶した認識辞書部と、1個又は複数個のそ
の切出し文字信号に対応する文字コードをその認識辞書
部を用いて識別する文字識別部と、その文字切出し部よ
り供給されるその切出し文字信号のイメージデータをそ
の認識辞書部へ登録する辞書作成部とを有し、その文字
識別部にて分離文字の識別を誤った場合、この識別を誤
った分離文字の全体を形成する切出し文字信号をその文
字切出し部よりその辞書作成部へ供給することにより、
その識別を誤った分離文字のイメージデータをその認識
辞書部尺登録することにより、分離文字の識別率を容易
に高めることができるようにしたものである。
例えば活版印刷において作業者が活字を拾う工程を自動
化するためには、タイプ印刷等で作成された原稿の各文
字を認識して文字コードに変換する文字認識装置が必要
である。
化するためには、タイプ印刷等で作成された原稿の各文
字を認識して文字コードに変換する文字認識装置が必要
である。
第゜6図は特開昭62 −74181 号公報で開示さ
れている従来の文字認識装置を示し、この第6図におい
て、(1)は原稿読取部であり、この原稿読取部(1)
から原稿の1ページ分の濃淡に対応する原文字信号S1
が文字列切出し部(2〕に供給される。この原文字信号
51は原稿を所定の密度でドット分解し、黒いドットを
ハイレベル“1” 白いドットを口−レベル“O”で表
わしたものであるが、各ドットの濃度を複数ビ7}の2
進数で表わす場合もある。
れている従来の文字認識装置を示し、この第6図におい
て、(1)は原稿読取部であり、この原稿読取部(1)
から原稿の1ページ分の濃淡に対応する原文字信号S1
が文字列切出し部(2〕に供給される。この原文字信号
51は原稿を所定の密度でドット分解し、黒いドットを
ハイレベル“1” 白いドットを口−レベル“O”で表
わしたものであるが、各ドットの濃度を複数ビ7}の2
進数で表わす場合もある。
文字列切出し部(2)は第1段前処理部(3)、第2段
前処理部(4)及び第3段前処理部(5)より構成され
、原文字信号S1には第1段前処理部(3)において雑
音の除去及び原稿の回転補正がなされ、第2段前処理部
(4)において文字領域AR(第7図参照)がその他の
領域(写真、図面等の領域)から区分されてその文字領
域ARに含まれるイメージデータだけが抽出され、第3
段前処理部(5)においてその抽出された文字領域A
Rに含まれる文字列API,AR2, ・・・に対応
する文字列信号S4が抽出される。
前処理部(4)及び第3段前処理部(5)より構成され
、原文字信号S1には第1段前処理部(3)において雑
音の除去及び原稿の回転補正がなされ、第2段前処理部
(4)において文字領域AR(第7図参照)がその他の
領域(写真、図面等の領域)から区分されてその文字領
域ARに含まれるイメージデータだけが抽出され、第3
段前処理部(5)においてその抽出された文字領域A
Rに含まれる文字列API,AR2, ・・・に対応
する文字列信号S4が抽出される。
この文字列信号S4の抽出を行なうには、第7図で示す
如く、文字領域A Rの各ドットの位置を水平方向にと
ったX軸と垂直方向にとったY軸とよりなる(X,Y)
座標で表わし、各ドットの“1″又は“0”の値をY軸
上に投影して和をとること1=よりY投影信号Syを生
成する。そして、二のY投影信号Syを所定の閾値レベ
ルで2値化すると、この2億化した信号の内の/%イレ
ベル“1”の区間が夫々文字列.A Rl, A R2
,・・・・に対応する如くなり、文字列信号S4は後続
の文字切出し部(6)に供給される。
如く、文字領域A Rの各ドットの位置を水平方向にと
ったX軸と垂直方向にとったY軸とよりなる(X,Y)
座標で表わし、各ドットの“1″又は“0”の値をY軸
上に投影して和をとること1=よりY投影信号Syを生
成する。そして、二のY投影信号Syを所定の閾値レベ
ルで2値化すると、この2億化した信号の内の/%イレ
ベル“1”の区間が夫々文字列.A Rl, A R2
,・・・・に対応する如くなり、文字列信号S4は後続
の文字切出し部(6)に供給される。
文字切出し邪(6)においては、例えば第8図Aに示す
1番目の文字列ARi の文字列信号S4をX軸上に投
影してX投影信号Sxを生成し、このX投影信号SXを
最小レベル(値が1)の閾値THIで2値化することに
より粗切出し信号DTI(第8図C)を得て、このX投
影信号Sxを中程度のレベルの閾値TH2(第8図D)
で2値化することにより細切出し信号DT2(第8図E
》を得る。同様に粗切出し信号DTI がハイレベル“
1″の区間だけで個々にY投影信号Syを生成すること
により、Y方向の切出し信号を生成することができる。
1番目の文字列ARi の文字列信号S4をX軸上に投
影してX投影信号Sxを生成し、このX投影信号SXを
最小レベル(値が1)の閾値THIで2値化することに
より粗切出し信号DTI(第8図C)を得て、このX投
影信号Sxを中程度のレベルの閾値TH2(第8図D)
で2値化することにより細切出し信号DT2(第8図E
》を得る。同様に粗切出し信号DTI がハイレベル“
1″の区間だけで個々にY投影信号Syを生成すること
により、Y方向の切出し信号を生成することができる。
そして、最終的に第8図Aに示す如く、例えば文字「て
」についてはこの文字に外接する外接枠(9)(M[で
ハイレベル“1″となると共に、分離文字である「い」
については分離されている各部に外接する外接枠(11
), (12) の内部でハイレベル“1”となる切
出し信号が得られ、人力される文字列信号S4からその
切出し信号がハイレベル“1”となる部分だけを順次切
出した信号が基本矩形切出し文字信号S7となる。
」についてはこの文字に外接する外接枠(9)(M[で
ハイレベル“1″となると共に、分離文字である「い」
については分離されている各部に外接する外接枠(11
), (12) の内部でハイレベル“1”となる切
出し信号が得られ、人力される文字列信号S4からその
切出し信号がハイレベル“1”となる部分だけを順次切
出した信号が基本矩形切出し文字信号S7となる。
尚、第8図Eの細切出し信号DT2 は各文字のより微
細な構造を調べる場合に使用される。また、第8図Aの
分離文字である「い」については外接枠(11), (
12) が2個あるため、後に文字識別の段階で統合
を行なう必要がある。
細な構造を調べる場合に使用される。また、第8図Aの
分離文字である「い」については外接枠(11), (
12) が2個あるため、後に文字識別の段階で統合
を行なう必要がある。
(7)は文字識別部を示し、この文字識別部(7)は基
本矩形切出し文字信号S7を各外接枠毎に取込んで文字
認識を行なう。具体的には、先ず位置による分類を行な
い、第8図八の文字例ARi に対して上半分の範囲
に存在する文字(r’ J, r”」,「゜」など)及
び下半分に存在する文字(「。」r. 」, r,
Jなど)を第1特徴文字としてパターンマッチングを
行って、対応する文字コード(JISコードなど)を付
与する。これで識別ができない場合には、外接枠の幅を
W1高さをhとして、縦横比h / w及び相対的大き
さによる分類を行なう。即ち、w1横比h/wが0<h
/w<0、5の範囲に入るか、l,5<h/wの範囲に
入るかによって分類を行なう。更に、平均的な大きさの
外接粋の幅をwR ,高さをh,として、縦相対比h/
ha及び撹相対比w/wII の値が夫々0くh/L<
0.5及び0 < w / w tr < 0. 5
(D範囲に入ルカ否かによって分類を行ない。上述の範
囲に入る文字を第2特徴文字としてパターンマッチング
を行なう。
本矩形切出し文字信号S7を各外接枠毎に取込んで文字
認識を行なう。具体的には、先ず位置による分類を行な
い、第8図八の文字例ARi に対して上半分の範囲
に存在する文字(r’ J, r”」,「゜」など)及
び下半分に存在する文字(「。」r. 」, r,
Jなど)を第1特徴文字としてパターンマッチングを
行って、対応する文字コード(JISコードなど)を付
与する。これで識別ができない場合には、外接枠の幅を
W1高さをhとして、縦横比h / w及び相対的大き
さによる分類を行なう。即ち、w1横比h/wが0<h
/w<0、5の範囲に入るか、l,5<h/wの範囲に
入るかによって分類を行なう。更に、平均的な大きさの
外接粋の幅をwR ,高さをh,として、縦相対比h/
ha及び撹相対比w/wII の値が夫々0くh/L<
0.5及び0 < w / w tr < 0. 5
(D範囲に入ルカ否かによって分類を行ない。上述の範
囲に入る文字を第2特徴文字としてパターンマッチング
を行なう。
また、第1及び第2特徴文字に分類されない文字に対し
ては個別に記憶されているドットパターンとのパターン
マッチングを行ない、所定の合致度が得られた場合には
その文字コードを付与する。
ては個別に記憶されているドットパターンとのパターン
マッチングを行ない、所定の合致度が得られた場合には
その文字コードを付与する。
それでもlJIWaできない文字が残った場合には、そ
の外接枠を更に複数の微少外接粋に分離する再切出し及
び後に続く外接枠と合体させる統合の動作が実効される
。尚、最終的に認識できない文字が残った場合には、そ
の文字には認識できない文字であることを示すリジェク
トコードが付与される。
の外接枠を更に複数の微少外接粋に分離する再切出し及
び後に続く外接枠と合体させる統合の動作が実効される
。尚、最終的に認識できない文字が残った場合には、そ
の文字には認識できない文字であることを示すリジェク
トコードが付与される。
その文字識別部(7)で生成された原稿の1ページ分の
文字コードは文字の位置や大きさを示す情報と共に所定
の記憶装置に記憶される。更に、認識結果が正しいかど
うかをオペレータが判定できる様に、その文字コードに
対応する文字のビデオ信号が陰極線管等の表示部(8)
に供給され、この表示部(8)の表示画面には原稿に対
応した形式で認識結果としての一群の文字が表示される
。この場合、認識できなかった文字の部分には高輝度の
矩形のブランクが表示される。従って、修正対象文字や
認識できない文字が存在する場合には、オペレータはワ
ードプロセッサと同じ要領でその部分に所望の文字を打
込むことができる。
文字コードは文字の位置や大きさを示す情報と共に所定
の記憶装置に記憶される。更に、認識結果が正しいかど
うかをオペレータが判定できる様に、その文字コードに
対応する文字のビデオ信号が陰極線管等の表示部(8)
に供給され、この表示部(8)の表示画面には原稿に対
応した形式で認識結果としての一群の文字が表示される
。この場合、認識できなかった文字の部分には高輝度の
矩形のブランクが表示される。従って、修正対象文字や
認識できない文字が存在する場合には、オペレータはワ
ードプロセッサと同じ要領でその部分に所望の文字を打
込むことができる。
上述のように、原稿の濃淡に対応する原文字信号S1を
生成し、この信号S1を1個の文字に外接する外接枠で
切出して切出し文字信号S7を生成し、この切出し文字
信号S7に対応する文字を特定するという文字認識のア
ルゴリズム自体は基本的には確立しているということが
できる。
生成し、この信号S1を1個の文字に外接する外接枠で
切出して切出し文字信号S7を生成し、この切出し文字
信号S7に対応する文字を特定するという文字認識のア
ルゴリズム自体は基本的には確立しているということが
できる。
ク発明が解決しようとする課M〕
しかしながら、その文字認識のアルゴリズムを用いた文
字認識装置を実際にオフィスに設定してオペレータが使
用した結果、操作性において種々の不都合があることが
判明した。
字認識装置を実際にオフィスに設定してオペレータが使
用した結果、操作性において種々の不都合があることが
判明した。
その不都合の1つは、分離文字の識別率を高めるのが困
難であることである。即ち、文字認識装置においては原
稿の中の或る特定の文字のみを読み誤ることがあるが、
その特定の文字が通常の一体化された文字であれば、文
字切出し部(6)から出力される基本矩形切出し文字信
号S7をそのまま用いて学習機能によって文字識別B(
7)の中に特徴量やドットパターン等のイメージデータ
を登録するごとにより次回からは正確に認識を行なうこ
とができる。
難であることである。即ち、文字認識装置においては原
稿の中の或る特定の文字のみを読み誤ることがあるが、
その特定の文字が通常の一体化された文字であれば、文
字切出し部(6)から出力される基本矩形切出し文字信
号S7をそのまま用いて学習機能によって文字識別B(
7)の中に特徴量やドットパターン等のイメージデータ
を登録するごとにより次回からは正確に認識を行なうこ
とができる。
しかしながら、例えば変則字体等の分離文字については
文字切出しB(6)から出力される基本矩形切出し文字
信号S7はその分離文字を構成する各部分の切出し文字
信号であるため、その分離文字のイメージデータを学習
機能によってその文字識別部(7〕の中に登録しようと
しても、登録されるのはその分離文字を構成する各部分
毎のイメージデータであり、分離文字全体を1個の文字
とみなしたイメージデータを登録することはできなかっ
た。
文字切出しB(6)から出力される基本矩形切出し文字
信号S7はその分離文字を構成する各部分の切出し文字
信号であるため、その分離文字のイメージデータを学習
機能によってその文字識別部(7〕の中に登録しようと
しても、登録されるのはその分離文字を構成する各部分
毎のイメージデータであり、分離文字全体を1個の文字
とみなしたイメージデータを登録することはできなかっ
た。
従って、変則字体等の分離文字は文字識別B(7)にお
いて切出し文字信号の統合を行っても、この統合された
文字信号のイメージデータの特徴量とその文字識別部(
7)に予め記録されているイメージデータの特徴量とは
合致せず常に誤認識されることになり、分離文字の識別
率を高めることは困難であった。
いて切出し文字信号の統合を行っても、この統合された
文字信号のイメージデータの特徴量とその文字識別部(
7)に予め記録されているイメージデータの特徴量とは
合致せず常に誤認識されることになり、分離文字の識別
率を高めることは困難であった。
本発明は斯かる点に鑑み、文字認識装置において大がか
りな辞書作成用の装置などを用いることなく分離文字の
識別率を高めるようにすることを目的とする。
りな辞書作成用の装置などを用いることなく分離文字の
識別率を高めるようにすることを目的とする。
本発明による文字認識装置は、原文書(14)のイメー
ジに対応する原文字信号51から1個の文字又は分離文
字の各構成部を形成する切出し文字信号S7を順次切出
す文字切出し部(24. 25)と、文字コードに対応
するイメージデータを記1意した認識辞書部(30)と
、1個又は複数個のその切出し文字信号S7に対応する
文字コードをその認識辞書部(30)を用いて識別する
文字認識部(28)と、その文字切出し部(24. 2
5)より供給されるその切出し文字信号S7のイメージ
データをその認識辞書部(30)へ登録する辞書作成部
(29)とを有し、その文字識別部(28)にて分離文
字の識別を誤った場合、この識別を誤った分離文字の全
体を形成する切出し文字信号S7をその文字切出し部(
24. 25)よりその辞書作成部(29)へ供給する
ことにより、その識別を誤った分離文字のイメージデー
タをその認識辞書部(30)へ登録するようにしたもの
である。
ジに対応する原文字信号51から1個の文字又は分離文
字の各構成部を形成する切出し文字信号S7を順次切出
す文字切出し部(24. 25)と、文字コードに対応
するイメージデータを記1意した認識辞書部(30)と
、1個又は複数個のその切出し文字信号S7に対応する
文字コードをその認識辞書部(30)を用いて識別する
文字認識部(28)と、その文字切出し部(24. 2
5)より供給されるその切出し文字信号S7のイメージ
データをその認識辞書部(30)へ登録する辞書作成部
(29)とを有し、その文字識別部(28)にて分離文
字の識別を誤った場合、この識別を誤った分離文字の全
体を形成する切出し文字信号S7をその文字切出し部(
24. 25)よりその辞書作成部(29)へ供給する
ことにより、その識別を誤った分離文字のイメージデー
タをその認識辞書部(30)へ登録するようにしたもの
である。
斯かる本発明によれば、その識別を誤った分離文字の全
体を形成する切出し文字信号S7が辞書作成部(29)
へ供給されるため、その認識辞書部(30)へはその識
別を誤った分離文字の全体のイメージが登録される。従
って、次にその識別を誤った分離文字が識別対象となっ
たときには、その文字識別部(28)はその分離文字の
各構成部を形成する切出し文字信号S7を統合して認識
辞書fl’E(30)を参照することにより、その分離
文字を正確に識別することができる。
体を形成する切出し文字信号S7が辞書作成部(29)
へ供給されるため、その認識辞書部(30)へはその識
別を誤った分離文字の全体のイメージが登録される。従
って、次にその識別を誤った分離文字が識別対象となっ
たときには、その文字識別部(28)はその分離文字の
各構成部を形成する切出し文字信号S7を統合して認識
辞書fl’E(30)を参照することにより、その分離
文字を正確に識別することができる。
従って、分離文字の識別率を高めることができる。
以下、本発明による文字認識装置の一実施例につき第1
図〜第5図を参照して説明しよう。
図〜第5図を参照して説明しよう。
第1図は本例の文字認識装置のシステム構成を示し、こ
の第1図において、(13)はドキュメントフィダーと
イメージリーグとよりなるスキャナー(14)はこのス
キャナーにセットされた原稿であり、スキアナー(13
)は原稿(14)の1ページ全体を例えば400 x4
00dpi (ドット/インチ)の読取り密度でド7}
分解し、各ドットの濃淡に対応した原文字信号S1を生
成する。
の第1図において、(13)はドキュメントフィダーと
イメージリーグとよりなるスキャナー(14)はこのス
キャナーにセットされた原稿であり、スキアナー(13
)は原稿(14)の1ページ全体を例えば400 x4
00dpi (ドット/インチ)の読取り密度でド7}
分解し、各ドットの濃淡に対応した原文字信号S1を生
成する。
(15)はイメージデータ入出力ボード、(16)はホ
ストコンビューク、(21)はプリンターを示し、イメ
ージデータ入出力ボード(15)は原文字信号S1の所
定部分をホストコンピュータ(16)に供給すると共に
、ホストコンピュータ(16)から出力される印字用の
信号をプリンター(16)に供給する。(17)はホス
トコンピュータ(16)を摸作するためのキーボード、
(18)はホストコンピュータ(16)に各種座標を入
力するための座標入力ユニット、(19)はキャラクタ
識別ボードを示し、ホストコンピュータ(16)が原文
字信号S1から1個の文字の外接枠の内部テハイレベル
“1″となる切出し信号を用いて切出した基本矩形切出
し文字信号S7を順次そのキャラクタ識別ボード(19
)に供給すると、キャラクタ識別ボード(19)はその
切出し文字信号S7に対応する文字の文字コードC(そ
の文字の認識ができない場合にはりジエクトコード)を
ホストコンピュータ(16)に供給する。
ストコンビューク、(21)はプリンターを示し、イメ
ージデータ入出力ボード(15)は原文字信号S1の所
定部分をホストコンピュータ(16)に供給すると共に
、ホストコンピュータ(16)から出力される印字用の
信号をプリンター(16)に供給する。(17)はホス
トコンピュータ(16)を摸作するためのキーボード、
(18)はホストコンピュータ(16)に各種座標を入
力するための座標入力ユニット、(19)はキャラクタ
識別ボードを示し、ホストコンピュータ(16)が原文
字信号S1から1個の文字の外接枠の内部テハイレベル
“1″となる切出し信号を用いて切出した基本矩形切出
し文字信号S7を順次そのキャラクタ識別ボード(19
)に供給すると、キャラクタ識別ボード(19)はその
切出し文字信号S7に対応する文字の文字コードC(そ
の文字の認識ができない場合にはりジエクトコード)を
ホストコンピュータ(16)に供給する。
(20)は陰極線管よりなる表示装置を示し、この表示
装置(20)の表示画面の所定領域にはr!K稿(14
)の1ページ分の文字を認識した結果を原稿(14)に
対応した形式で表示する如くなす。また、この表示装置
(20)の表示画面には必要に応じて原稿(14)の1
ページ分又は所定部分のドットパターンそのものをも表
示できる如くなす。
装置(20)の表示画面の所定領域にはr!K稿(14
)の1ページ分の文字を認識した結果を原稿(14)に
対応した形式で表示する如くなす。また、この表示装置
(20)の表示画面には必要に応じて原稿(14)の1
ページ分又は所定部分のドットパターンそのものをも表
示できる如くなす。
第2図は第1図例のプリンター(21)に関する処理部
分を除くより詳細な構成を示し、この第2図のイメージ
データ入出力ボード(15)において、(22)は原稿
(14)の1ページ分以上のドットパターンを記憶でき
るメモリを有するイメージデータ人力部、(23)は同
じく原稿(14)の1ページ分以上のドットパターンを
記憶できるバックアップメモリであり、スキャナー(1
3)より出力された原稿(14)の1ページ分の原文字
信号S1をイメージデータ人力部(22)に記憶する。
分を除くより詳細な構成を示し、この第2図のイメージ
データ入出力ボード(15)において、(22)は原稿
(14)の1ページ分以上のドットパターンを記憶でき
るメモリを有するイメージデータ人力部、(23)は同
じく原稿(14)の1ページ分以上のドットパターンを
記憶できるバックアップメモリであり、スキャナー(1
3)より出力された原稿(14)の1ページ分の原文字
信号S1をイメージデータ人力部(22)に記憶する。
また、このイメージデータ人力部(22)に記憶されて
いる原文字信号S1の所望の部分を随時バックアップメ
モ’J (23)に移送すると共に、その所望の部分は
文字がない白紙状体に対応する(例えばゼロレベル“0
″の)原文字信号で置換する如くなし、この所望の部分
が置換えられた原文字信号S1を原文字信号S2と称し
、この原文字信号S2の所定部分を原文字信号S3と称
する。
いる原文字信号S1の所望の部分を随時バックアップメ
モ’J (23)に移送すると共に、その所望の部分は
文字がない白紙状体に対応する(例えばゼロレベル“0
″の)原文字信号で置換する如くなし、この所望の部分
が置換えられた原文字信号S1を原文字信号S2と称し
、この原文字信号S2の所定部分を原文字信号S3と称
する。
ホストコンピュータ(16)において、(24)は中央
処理ユニット(以下rC P U.と称す) 、(25
)はメインメモリ、(26)は表示装置(20)用のビ
デオ信号用RAM (以下’ V R A M Jと称
す) 、(27)は文字コードを入力してこの文字コー
ドに対応する所定の字体のドットパターン即ちフォント
を出力するヰアラクタR O Mよりなるフォントテー
ブルを示し、オペレータがキーボード(17)及び座標
人力ユニ7}(18)を介してC P U(24)に各
種コマンド、データ及び座標データを供給すると、CP
U(24)’はこれに対応して本例の文字認識装置の全
体の動作を制御する。
処理ユニット(以下rC P U.と称す) 、(25
)はメインメモリ、(26)は表示装置(20)用のビ
デオ信号用RAM (以下’ V R A M Jと称
す) 、(27)は文字コードを入力してこの文字コー
ドに対応する所定の字体のドットパターン即ちフォント
を出力するヰアラクタR O Mよりなるフォントテー
ブルを示し、オペレータがキーボード(17)及び座標
人力ユニ7}(18)を介してC P U(24)に各
種コマンド、データ及び座標データを供給すると、CP
U(24)’はこれに対応して本例の文字認識装置の全
体の動作を制御する。
また、原文字信号S2及びS3を夫々随時メインメモ’
J(25)及びV R A M (26)に供給する。
J(25)及びV R A M (26)に供給する。
この場合、c P U(24)及びメインメモリ(25
)が第6図例の文字列切出し部(2)及び文字切出し部
(6)に対応し、メ・インメモ’) (25)かろ続出
された1文字の外接枠O内部に対応する基本矩形切出し
文字信号S7を順次キアラクタ識別ボード(19)に供
給し、キャラクタ識別ボード(19)より送信されて来
る文字コードCをメインメモリ(25)を介してフォン
トテ一ブル(27)のアドレスバスに供給し、このフォ
ントテーブル(27)のデータパスに現われるフォント
データをV R A M(26)の所定領域に書込む如
くなす。また、本例のホストコンビニータ(16)、キ
ーボード(17)、座標人カユニッ} (18)及び表
示装置(20)よりなるシステムはワードプロセッサと
しての機能をも具えている。
)が第6図例の文字列切出し部(2)及び文字切出し部
(6)に対応し、メ・インメモ’) (25)かろ続出
された1文字の外接枠O内部に対応する基本矩形切出し
文字信号S7を順次キアラクタ識別ボード(19)に供
給し、キャラクタ識別ボード(19)より送信されて来
る文字コードCをメインメモリ(25)を介してフォン
トテ一ブル(27)のアドレスバスに供給し、このフォ
ントテーブル(27)のデータパスに現われるフォント
データをV R A M(26)の所定領域に書込む如
くなす。また、本例のホストコンビニータ(16)、キ
ーボード(17)、座標人カユニッ} (18)及び表
示装置(20)よりなるシステムはワードプロセッサと
しての機能をも具えている。
キャラクタ識別ボード(19)において、ク28)は文
字の認識部、(30)は各種字体のフォントデータを文
字コード(本例ではJISコード)に対応させて記憶し
ている認識辞書部を示し、認識部(28)及び認識辞書
部(30)が基本的に第6図の文字識別部(7)に対応
する。本例の認識辞書部ク30)は大分類文字用の大分
類辞書部と細分類文字用の細分類辞書部とに分かれ、大
分類辞書部には前述した如く位置によって分類された第
1特徴文字並びに外接枠の相対的大きさく縦横比h/w
)、縦相対比h/h,及び横相対比W/WRの値によっ
て分類された第2特徴文字の例えば縦24ドット×横2
4ドットに正規化されたフォントデータが夫々格納され
ている。尚、一般に文字の大まかな特徴は文字の外接枠
の各辺の近傍のドットパターンによっても表わされるた
め、各文字の外接枠の四辺の近傍のドットパターンを四
辺データ(又は周辺データ)として数値化して、この四
辺データが所定の範囲に収まった文字(大分類文字)の
フォントデータを大分類辞書部に格納する如くなしても
よい。
字の認識部、(30)は各種字体のフォントデータを文
字コード(本例ではJISコード)に対応させて記憶し
ている認識辞書部を示し、認識部(28)及び認識辞書
部(30)が基本的に第6図の文字識別部(7)に対応
する。本例の認識辞書部ク30)は大分類文字用の大分
類辞書部と細分類文字用の細分類辞書部とに分かれ、大
分類辞書部には前述した如く位置によって分類された第
1特徴文字並びに外接枠の相対的大きさく縦横比h/w
)、縦相対比h/h,及び横相対比W/WRの値によっ
て分類された第2特徴文字の例えば縦24ドット×横2
4ドットに正規化されたフォントデータが夫々格納され
ている。尚、一般に文字の大まかな特徴は文字の外接枠
の各辺の近傍のドットパターンによっても表わされるた
め、各文字の外接枠の四辺の近傍のドットパターンを四
辺データ(又は周辺データ)として数値化して、この四
辺データが所定の範囲に収まった文字(大分類文字)の
フォントデータを大分類辞書部に格納する如くなしても
よい。
一方、細分類辞書部には大分類辞書部に含まれない他の
全ての文字(細分類文字)の正規化されたブオントデー
夕が文字コードに対応して格納されている。
全ての文字(細分類文字)の正規化されたブオントデー
夕が文字コードに対応して格納されている。
(29)は辞書作成部を示し、この辞書作成部(29)
はオペレータによって辞書作成モードが設定された場合
には、供給されて来る1文字分の基本矩形切出し文字信
号によって表わされるフォントデータが大分類文字に対
応するか細分類文字に対応するかを判別し、大分類文字
に対応するときはそのフォントデータを正規化して認識
辞書部(30)の大分類辞書部の所定の文字コードの領
域に書込み、細分類文字に対応するときにはそのフォン
トデー夕を正規化して認識辞書部(30)の細分類辞書
部の所定の文字コードの領域に書込む如くなす。これに
よって、ユーザ側で簡便に種々の字体に対応できる認識
辞書部(30)を作成することができる。
はオペレータによって辞書作成モードが設定された場合
には、供給されて来る1文字分の基本矩形切出し文字信
号によって表わされるフォントデータが大分類文字に対
応するか細分類文字に対応するかを判別し、大分類文字
に対応するときはそのフォントデータを正規化して認識
辞書部(30)の大分類辞書部の所定の文字コードの領
域に書込み、細分類文字に対応するときにはそのフォン
トデー夕を正規化して認識辞書部(30)の細分類辞書
部の所定の文字コードの領域に書込む如くなす。これに
よって、ユーザ側で簡便に種々の字体に対応できる認識
辞書部(30)を作成することができる。
キャラクタ識別ボード(19)の認識部(28)はオペ
レータによって文字認識モードが設定された場合、供給
されて来る基本矩形切出し文字信号S7が大分類文字に
対応するときには認識辞書部(30)の大分類文字部の
フォントデータを順次第1の先入れ先出し(FIFO)
レジスタに書込み、細分類文字に対応するときには細分
類文字部のフォントデータを順次第2のFIFOレジス
タに書込む。また、この動作と平行して認識部(28)
はその基本矩形切出し文字信号S7に対応するドットパ
ターンを正規化して順次第3のFIFOレジスタに書込
む。そして、認識部(28)は第3のFIFOレジスタ
中のfi2識対象となる文字のドットパターンと第1の
FIFC5レジスタ中の一連のフォントデータ及び第2
のFIFOレジスタ中の一連のフォントデータとを順次
比較することにより、その認識対象となる文字のドット
パターンに最も近いフォントデータに対応する文字コー
ドを優先順位の高い順に10個生成し、この文字コード
をホストコンピュータ(16)のメインメモリの所定領
域に書込む如くなす。
レータによって文字認識モードが設定された場合、供給
されて来る基本矩形切出し文字信号S7が大分類文字に
対応するときには認識辞書部(30)の大分類文字部の
フォントデータを順次第1の先入れ先出し(FIFO)
レジスタに書込み、細分類文字に対応するときには細分
類文字部のフォントデータを順次第2のFIFOレジス
タに書込む。また、この動作と平行して認識部(28)
はその基本矩形切出し文字信号S7に対応するドットパ
ターンを正規化して順次第3のFIFOレジスタに書込
む。そして、認識部(28)は第3のFIFOレジスタ
中のfi2識対象となる文字のドットパターンと第1の
FIFC5レジスタ中の一連のフォントデータ及び第2
のFIFOレジスタ中の一連のフォントデータとを順次
比較することにより、その認識対象となる文字のドット
パターンに最も近いフォントデータに対応する文字コー
ドを優先順位の高い順に10個生成し、この文字コード
をホストコンピュータ(16)のメインメモリの所定領
域に書込む如くなす。
その優先順位を決定するには、例えば24X24ドット
の個々のドットについて認識対象となる文字のドントパ
ターンと認識辞書部(30)より読出したフォントデー
タとを比較して、両者の値が異なっているドットの総和
を評価値となし、この評価値が小さい順に優先順位を高
く設定する。またこの最も優先順位の高い文字コードの
評価値が所定値以下の場合には、文字認識が行なわれた
ものとみなしてその最も優先順位の高い文字コードを認
識対象となる文字の文字コードCとしてメインメモ!J
(25)の原稿(14)に対応して定められた領域に
書込む。同時に認識部(28)はその文字コードCと共
にその文字の大きさを示すデータ及−びその文字の平均
的な外接枠の中での位置を示すデータをメインメモ!J
(25)に書込む如くなす。一方、最も優先順位の高
い文字コードの評価値が所定値を超える場合には、認識
部(28)は文字認識ができなかったものとみなしてて
リジエクトコードをそのメインメモIJ(25)の原稿
(14)に対応して定めろれた領域に書込む如くなす。
の個々のドットについて認識対象となる文字のドントパ
ターンと認識辞書部(30)より読出したフォントデー
タとを比較して、両者の値が異なっているドットの総和
を評価値となし、この評価値が小さい順に優先順位を高
く設定する。またこの最も優先順位の高い文字コードの
評価値が所定値以下の場合には、文字認識が行なわれた
ものとみなしてその最も優先順位の高い文字コードを認
識対象となる文字の文字コードCとしてメインメモ!J
(25)の原稿(14)に対応して定められた領域に
書込む。同時に認識部(28)はその文字コードCと共
にその文字の大きさを示すデータ及−びその文字の平均
的な外接枠の中での位置を示すデータをメインメモ!J
(25)に書込む如くなす。一方、最も優先順位の高
い文字コードの評価値が所定値を超える場合には、認識
部(28)は文字認識ができなかったものとみなしてて
リジエクトコードをそのメインメモIJ(25)の原稿
(14)に対応して定めろれた領域に書込む如くなす。
上述の文字認識の動作はバイブライン方式で高速に実行
される。
される。
第3図は本例の表示装置(20)の表示画面(2OA)
を示し、この表示画面(20^)には、原稿(14)の
1ページ分の文字を認識した認識結果を表示する認識結
果表示領域(31)を設ける。本例では原稿(14)は
縦書きであるが、認識結果は横書きで表示している。(
32)は修正対象となる文字を指示するためのカーソル
を示し、このカーソル(32)はキーボート責17〉又
は座標人カユニッ} (18)によって認識結果の任意
の文字の上に移動することができる。
を示し、この表示画面(20^)には、原稿(14)の
1ページ分の文字を認識した認識結果を表示する認識結
果表示領域(31)を設ける。本例では原稿(14)は
縦書きであるが、認識結果は横書きで表示している。(
32)は修正対象となる文字を指示するためのカーソル
を示し、このカーソル(32)はキーボート責17〉又
は座標人カユニッ} (18)によって認識結果の任意
の文字の上に移動することができる。
第3図例カーソル(32)をリジェクトコードを付され
た文字を示すブランクの上に移動すると、表示画面(2
OA> の認識結果表示領域ク31)に近接する領域
(34)及び(35)に夫々7対象文字一の語及びフラ
ンクが表示される。(36)は機能釦領域を示し、この
領域(36)には「候補」、「コード」及び「かな漢字
」の文字が表示されており、これらの機能釦は座標人カ
ユニッ} (18)によって選択することができる。例
えば「候補」が選択されると、表示画面(2OA)
の一部に修正対象となる文字に最も近いと認識された1
0個の文字のパターンが優先順位の高い順に表示され、
「コード」が選択されるとその修正対象文字を文字コー
ドで直接指定できるようになり、「かな漢字」が選択さ
れるとその修正対゛象文字をかな/漢字変換で人力でき
るようになる。
た文字を示すブランクの上に移動すると、表示画面(2
OA> の認識結果表示領域ク31)に近接する領域
(34)及び(35)に夫々7対象文字一の語及びフラ
ンクが表示される。(36)は機能釦領域を示し、この
領域(36)には「候補」、「コード」及び「かな漢字
」の文字が表示されており、これらの機能釦は座標人カ
ユニッ} (18)によって選択することができる。例
えば「候補」が選択されると、表示画面(2OA)
の一部に修正対象となる文字に最も近いと認識された1
0個の文字のパターンが優先順位の高い順に表示され、
「コード」が選択されるとその修正対象文字を文字コー
ドで直接指定できるようになり、「かな漢字」が選択さ
れるとその修正対゛象文字をかな/漢字変換で人力でき
るようになる。
また、(37)は再認識釦、(38)は文字統合釦を示
し、これらの釦(37), (38) を座標入力ユ
ニット(18)で選択することにより、夫々修正対象文
字の再認識及び分離文字の統合を実行できるようになる
。上述の機能釦領域(36)の各釦及び釦(37),
(38)の選択は具体的には、十字のカーソル(43)
を座標人カユニ7N18)にて所望の釦の上に移動した
後に座標人カスインチを損作することによって実行され
る。
し、これらの釦(37), (38) を座標入力ユ
ニット(18)で選択することにより、夫々修正対象文
字の再認識及び分離文字の統合を実行できるようになる
。上述の機能釦領域(36)の各釦及び釦(37),
(38)の選択は具体的には、十字のカーソル(43)
を座標人カユニ7N18)にて所望の釦の上に移動した
後に座標人カスインチを損作することによって実行され
る。
本例ではその認識結果表示領域(3l)の近傍に面積が
W x Wの周辺イメージ表示領域(33)を設け、こ
の周辺イメージ表示領域(33)には修正対象となる文
字に対応する原稿(14)上の文字「え」を中心として
幅170ドット×高さ170 ドットの領域のドット
パターンをそのまま表示する。具体的には第2図におい
て、C P U(24)はイメージデータ入力部(22
)に記憶されている1ページ分の原文字信号S2(本例
では原文字信号S1そのもの)の内で修正対象となる文
字を中心として170 X170ドットの領域の原文字
信号S3を読出して、この原文字信号S3を拡大(補間
)又は縮小(間引き)してV R A M (26>の
所定領域に書込む如くなす。従って、第3図の表示画面
(2OA) 中の周辺イメージ表示領域(33)には
修正対象となるリジエクト文字に対応する原稿(14)
上の文字 え.及びこの文字の周辺の例えば8個の文字
のイメージがドノトパターンとしてそのまま表示される
。
W x Wの周辺イメージ表示領域(33)を設け、こ
の周辺イメージ表示領域(33)には修正対象となる文
字に対応する原稿(14)上の文字「え」を中心として
幅170ドット×高さ170 ドットの領域のドット
パターンをそのまま表示する。具体的には第2図におい
て、C P U(24)はイメージデータ入力部(22
)に記憶されている1ページ分の原文字信号S2(本例
では原文字信号S1そのもの)の内で修正対象となる文
字を中心として170 X170ドットの領域の原文字
信号S3を読出して、この原文字信号S3を拡大(補間
)又は縮小(間引き)してV R A M (26>の
所定領域に書込む如くなす。従って、第3図の表示画面
(2OA) 中の周辺イメージ表示領域(33)には
修正対象となるリジエクト文字に対応する原稿(14)
上の文字 え.及びこの文字の周辺の例えば8個の文字
のイメージがドノトパターンとしてそのまま表示される
。
このように修正対象の文字及びその周辺の文字のイメー
ジが表示されると、オペレータは原稿(14)を参、照
することなく修正対象となる文字を前後の文字等に合わ
せて修正することができるので、修正の効率が改善され
る利益がある。
ジが表示されると、オペレータは原稿(14)を参、照
することなく修正対象となる文字を前後の文字等に合わ
せて修正することができるので、修正の効率が改善され
る利益がある。
更に、第3図において、(39)は切出し文字パターン
表示領域を示し、この表示領域(39)には修正対象と
なっている文字の基本矩形切出し文字信号S7に対応す
る24X24ドットに正規化されたドットパターンを表
示する。また、本例において文字統合釦(38)が選択
されると、表示画面(2OA) の左端の部分に統合
文字領域(40)が確保され、この統合文字領域(40
)の下端に登録釦(41)及び削除釦(42)が表示さ
れる。この統合文字領域(40)に表示される文字は第
2図のメインメモIJ(25)の一部に設けちれた文字
統合バノファに記憶されているイメージデータに対応す
るものである。
表示領域を示し、この表示領域(39)には修正対象と
なっている文字の基本矩形切出し文字信号S7に対応す
る24X24ドットに正規化されたドットパターンを表
示する。また、本例において文字統合釦(38)が選択
されると、表示画面(2OA) の左端の部分に統合
文字領域(40)が確保され、この統合文字領域(40
)の下端に登録釦(41)及び削除釦(42)が表示さ
れる。この統合文字領域(40)に表示される文字は第
2図のメインメモIJ(25)の一部に設けちれた文字
統合バノファに記憶されているイメージデータに対応す
るものである。
本例の文字認識装置の修正エディター機能によって認識
結渠の修正を行?よう際に分離文字の統合登録を行なう
場合の動作につき説明するに、本例の原稿(14)は縦
書きであるため対象とする分離文字としては縦書きの場
合に分離文字として判定される文字「え」を想定すると
共に、この原稿(14)で使用されている文字「え」の
字体は第2図の認識辞書部(30)に登録されていない
変則字体であるとする。
結渠の修正を行?よう際に分離文字の統合登録を行なう
場合の動作につき説明するに、本例の原稿(14)は縦
書きであるため対象とする分離文字としては縦書きの場
合に分離文字として判定される文字「え」を想定すると
共に、この原稿(14)で使用されている文字「え」の
字体は第2図の認識辞書部(30)に登録されていない
変則字体であるとする。
この場合、その文字「え」を全体として或る文字である
と認識することができないので、その文字「え」を2つ
の構成部分に分離して、上の構成部分を口・」、下の構
成部分を認識できない文字(リジエクトコードを付す文
字)であると認識すると考えろれ、表示画面(2OA)
中の認識結果表示領域(31)においては第3図に
示す如く本来「え」が表示されるべき位置(44A>,
(44B) に夫々「・」及びブランクが表示され
る。続いてオペレータがカーソル(32)を位置(44
B) に在るブランクの上に移動させて座標人力スイ
ッチを操作することにより、そのブランクに対応する文
字が修正対象文字に指定されて、周辺イメージ表示領域
(33)及び切出し文字パターン表示領域(39)には
夫々そのブランクに対応する原稿(14)上の文字の周
辺のイメージ及びその文字そのもののイメージが表示さ
れる。
と認識することができないので、その文字「え」を2つ
の構成部分に分離して、上の構成部分を口・」、下の構
成部分を認識できない文字(リジエクトコードを付す文
字)であると認識すると考えろれ、表示画面(2OA)
中の認識結果表示領域(31)においては第3図に
示す如く本来「え」が表示されるべき位置(44A>,
(44B) に夫々「・」及びブランクが表示され
る。続いてオペレータがカーソル(32)を位置(44
B) に在るブランクの上に移動させて座標人力スイ
ッチを操作することにより、そのブランクに対応する文
字が修正対象文字に指定されて、周辺イメージ表示領域
(33)及び切出し文字パターン表示領域(39)には
夫々そのブランクに対応する原稿(14)上の文字の周
辺のイメージ及びその文字そのもののイメージが表示さ
れる。
これらのイメージによってオペレータは原稿(14)の
分離文字「え」が誤って第1ブロー)ク(45A) 及
び第2ブロック(4513) に分離されたまま認識
されてしまったことを知ることができる。
分離文字「え」が誤って第1ブロー)ク(45A) 及
び第2ブロック(4513) に分離されたまま認識
されてしまったことを知ることができる。
そこで、オペレータがその変則字体の分離文字「え」の
イメージデータを統合して認識辞書部(30)へ登録す
るため、先ず認識結果表示領域(31)の位置(44A
) の「・」を修正対象に指定して文字統合釦(38
)を選択すると、表示画面(2OA) 中の統合文字
領域(40)にその「・」の元のパターン(46A)が
表示される。次にオペレータが位置(44B) のブ
ランクを修正対象に指定して文字統合釦(38)を選択
すると、統合文字領域(40)のパターン(46A)
の下jこそのブランクの元のパターン(46B>
が合成されて表示される。そして、オペレータがカーソ
ル(43)を移動してその統合文字領域(40)の中の
登録釦(41)を選択して対応するJISコード等を入
力することにより、その分離文字1え,の全体を形成す
る切出し文字信号S7がメインメモ!J (25)から
辞書作成部(29)へ供給され、その分離文字一え」の
全体のイメージヂータ(正規化データ、大分類用のデー
タ、細分類用のデータ等)が認識辞書部(30)に登録
される。尚、その統合文字領域(40)の中の削除釦(
42〉を選択することにより、その統合文字領域(40
)に表示されている分離文字の各構成部分を次第に削除
することができる。
イメージデータを統合して認識辞書部(30)へ登録す
るため、先ず認識結果表示領域(31)の位置(44A
) の「・」を修正対象に指定して文字統合釦(38
)を選択すると、表示画面(2OA) 中の統合文字
領域(40)にその「・」の元のパターン(46A)が
表示される。次にオペレータが位置(44B) のブ
ランクを修正対象に指定して文字統合釦(38)を選択
すると、統合文字領域(40)のパターン(46A)
の下jこそのブランクの元のパターン(46B>
が合成されて表示される。そして、オペレータがカーソ
ル(43)を移動してその統合文字領域(40)の中の
登録釦(41)を選択して対応するJISコード等を入
力することにより、その分離文字1え,の全体を形成す
る切出し文字信号S7がメインメモ!J (25)から
辞書作成部(29)へ供給され、その分離文字一え」の
全体のイメージヂータ(正規化データ、大分類用のデー
タ、細分類用のデータ等)が認識辞書部(30)に登録
される。尚、その統合文字領域(40)の中の削除釦(
42〉を選択することにより、その統合文字領域(40
)に表示されている分離文字の各構成部分を次第に削除
することができる。
次に、本例の文字認識装置の修正エディターによる分離
文字「え」の文字統合の動作につき第4図のステップ(
101)〜(106) を参照して詳細に説明するに、
原稿(14)の座標系、分離文字「え」のメインメモ’
IJ (25)への入力段階のイメージのメモリマップ
及びその分離文字「え」を統合するためメインメモ’I
J (25>の文字統合バッファ領域に記憶された統合
ブロック(48)を夫々第5図A,B及びCの如く表わ
す。また、その分離文字「え」を分離して認識したとき
の2つの構成部分の外接枠を夫々第5図已に示す如く第
1ブD−/ク(47A) 及び第2ブロック(47B
) と称し、座標系(X,Y)上のブロック(47A
), (47B) 及び(48)の始点Q,, Q2
,Rの座標を夫々(x+,y+), (X2, y2)
及び(X3,ys)で表わし、ブロック(47A),
(47B) 及び(48)の(X方向の長さ、Y方向の
長さ)のデータを夫々(Wl, h l), (W2.
h2)及び(W3,h3)で表わす。
文字「え」の文字統合の動作につき第4図のステップ(
101)〜(106) を参照して詳細に説明するに、
原稿(14)の座標系、分離文字「え」のメインメモ’
IJ (25)への入力段階のイメージのメモリマップ
及びその分離文字「え」を統合するためメインメモ’I
J (25>の文字統合バッファ領域に記憶された統合
ブロック(48)を夫々第5図A,B及びCの如く表わ
す。また、その分離文字「え」を分離して認識したとき
の2つの構成部分の外接枠を夫々第5図已に示す如く第
1ブD−/ク(47A) 及び第2ブロック(47B
) と称し、座標系(X,Y)上のブロック(47A
), (47B) 及び(48)の始点Q,, Q2
,Rの座標を夫々(x+,y+), (X2, y2)
及び(X3,ys)で表わし、ブロック(47A),
(47B) 及び(48)の(X方向の長さ、Y方向の
長さ)のデータを夫々(Wl, h l), (W2.
h2)及び(W3,h3)で表わす。
ステップ(101)
オペレータが第1ブロック(47^)を選択してメイン
メモIJ(25)の文字統合バッファ領域に登録するよ
うにC P U(24)に指示する。
メモIJ(25)の文字統合バッファ領域に登録するよ
うにC P U(24)に指示する。
一ステップ(102)
C P ’IJ (24)はその第1ブロック(47A
) をそのまま統合ブロック(48)とみなす。即ち
、(X3. Y3. W3. h3) =(X+, 3
’l+ w,, h+) ++−(x)が成立し、この
統合ブロック(48)のドットパターンイメージを表示
画面(2OA) の統合文字領域ク40)に表示する
。
) をそのまま統合ブロック(48)とみなす。即ち
、(X3. Y3. W3. h3) =(X+, 3
’l+ w,, h+) ++−(x)が成立し、この
統合ブロック(48)のドットパターンイメージを表示
画面(2OA) の統合文字領域ク40)に表示する
。
−ステップ(103)
オペレータが第2ブロック(47B) を選択してメ
インメモ!J (25)の文字統合バンファ領域に追加
登録するようにC P U(24)に指示する。
インメモ!J (25)の文字統合バンファ領域に追加
登録するようにC P U(24)に指示する。
ステップ(104)
C P U(24)は矩形の第1ブロック(47A)
と矩形の第2ブロック(47B) とよりこれら2
つのブロック(47A). (47B) に外接する
矩形の統合ブロソク(48)を合成する。即ち、先ず統
合ブロック(48)の始点Rの座標(X3,Y3)を次
式によって求める。
と矩形の第2ブロック(47B) とよりこれら2
つのブロック(47A). (47B) に外接する
矩形の統合ブロソク(48)を合成する。即ち、先ず統
合ブロック(48)の始点Rの座標(X3,Y3)を次
式によって求める。
X 3 =min( x l. X 2)
= = (2A)y:+=m+n(y+, y2
) ・・・12B)尚、本例の座
標(X,Y)の最小単位は1×1ドットであるとする。
= = (2A)y:+=m+n(y+, y2
) ・・・12B)尚、本例の座
標(X,Y)の最小単位は1×1ドットであるとする。
次に、ブロック(47A), (47B)の内で原点(
0.0>からX方向及びY方向へ最も遠い部分の座標を
夫々xsE及びy3Eとすると、これらの座標(x3E
,ysE) は次のように表わすことができる。
0.0>からX方向及びY方向へ最も遠い部分の座標を
夫々xsE及びy3Eとすると、これらの座標(x3E
,ysE) は次のように表わすことができる。
x3E=max(x,+w+ −1, X2+W2−1
)−=(3A>37+E=maX(3/++ h+
1, V2千h ,−1)−・− (3El)従って、
式(2A), (2B)の始点Rの座標( X:l+
ys)を用いることにより、統合ブロック(48)のX
方向の長さW3 及びY方向の長さh,は次式で表すこ
とができる。
)−=(3A>37+E=maX(3/++ h+
1, V2千h ,−1)−・− (3El)従って、
式(2A), (2B)の始点Rの座標( X:l+
ys)を用いることにより、統合ブロック(48)のX
方向の長さW3 及びY方向の長さh,は次式で表すこ
とができる。
W,= X3E X:l+1. =
=<4A)h:r=V3E Y3二1
・・・・(4日)ーステップ(105) − C P U(24>はステップ(104) で求めた
統合ブロック(48〉に対応してメインメモリ(25)
に記憶されている切出し文字信号S7をその文字のJI
Sコードと共に辞書作成部(29)に供給することによ
り、その分離文字「え」の認識辞書部(30)への登録
を行なった後に終了のステップ(106)へ移行する。
=<4A)h:r=V3E Y3二1
・・・・(4日)ーステップ(105) − C P U(24>はステップ(104) で求めた
統合ブロック(48〉に対応してメインメモリ(25)
に記憶されている切出し文字信号S7をその文字のJI
Sコードと共に辞書作成部(29)に供給することによ
り、その分離文字「え」の認識辞書部(30)への登録
を行なった後に終了のステップ(106)へ移行する。
尚、分離文字が3個以上の構成部分を有する場合には(
例えば文字「三」など)、更に第3ブロッグ等を統合す
るステップが必要となる。
例えば文字「三」など)、更に第3ブロッグ等を統合す
るステップが必要となる。
上述のように本例によれば、メインメモ!J (25)
の文字統合バソファ領域で所望の文字の各構成部分に外
接するブロックを統合して統合ブロック(48)を構成
し、この統合ブロソク(48)に対応する文字信号全体
を切出し文字信号S7とみなして辞書作成部(29)へ
供給することにより、認識辞書部(30)へイメージデ
ータを学習作用によって登録することができるため、ど
のような複雉な分離文字であってもそのイメージデータ
を認識辞書jl’l3(30)に追加登録することがで
きる。従って、次の認識からはその分離文字を正確に認
識することができるようになるため、分離文字の識別率
を高めることができる利益がある。
の文字統合バソファ領域で所望の文字の各構成部分に外
接するブロックを統合して統合ブロック(48)を構成
し、この統合ブロソク(48)に対応する文字信号全体
を切出し文字信号S7とみなして辞書作成部(29)へ
供給することにより、認識辞書部(30)へイメージデ
ータを学習作用によって登録することができるため、ど
のような複雉な分離文字であってもそのイメージデータ
を認識辞書jl’l3(30)に追加登録することがで
きる。従って、次の認識からはその分離文字を正確に認
識することができるようになるため、分離文字の識別率
を高めることができる利益がある。
また、本例では認識結果を修正するための修正エディタ
ーが上述の文字統合を行なっているため、大がかりな辞
書作成用の装置を使用する必要がない。
ーが上述の文字統合を行なっているため、大がかりな辞
書作成用の装置を使用する必要がない。
尚、本発明は上述実施例に限定されず、本発明の要旨を
逸脱しない範囲で種々の構成を採り得ることは勿論であ
る。
逸脱しない範囲で種々の構成を採り得ることは勿論であ
る。
本発明によれば、分離文牢の識別エを容易に高めること
ができる利益がある。
ができる利益がある。
第1図は本発明の一実施例の文字認R装置の/ステム構
成を示す一部斜視図を含む正面図、第2図は第1図例の
要部のより詳細一一構成を示す一部斜視図を含む構li
3:図、第3図は一実施例の表示画面(2OA) の
構成例を示す正面図、第4図は一実施例の分離文字の登
録動作を示すフローチャート図、第5図は一実施例の各
座標系の相互の関係の説明に供する線図、第6図は従来
の文字認識装置の全体構成を示すブロック図、第7図及
び第8図は夫々従来の文字列及び原矩形の切出し動作の
説明に供する線図である。 (13)はスキャナー、(14)は原稿、(15)はイ
メージデータ入出力ボート、(16)はホストコンピュ
ータ、(19)はキ丁ラクタ識別ボート、(20)は表
示装置、(24)は中央処理ユニット、(25)はメイ
ンメモリ、(28)は認識郎、(29)は認識辞書部、
(38)は文字統合釦、(48)は統合ブロックである
。 代 理 人 松 隈 秀 盛 第4図 第5図
成を示す一部斜視図を含む正面図、第2図は第1図例の
要部のより詳細一一構成を示す一部斜視図を含む構li
3:図、第3図は一実施例の表示画面(2OA) の
構成例を示す正面図、第4図は一実施例の分離文字の登
録動作を示すフローチャート図、第5図は一実施例の各
座標系の相互の関係の説明に供する線図、第6図は従来
の文字認識装置の全体構成を示すブロック図、第7図及
び第8図は夫々従来の文字列及び原矩形の切出し動作の
説明に供する線図である。 (13)はスキャナー、(14)は原稿、(15)はイ
メージデータ入出力ボート、(16)はホストコンピュ
ータ、(19)はキ丁ラクタ識別ボート、(20)は表
示装置、(24)は中央処理ユニット、(25)はメイ
ンメモリ、(28)は認識郎、(29)は認識辞書部、
(38)は文字統合釦、(48)は統合ブロックである
。 代 理 人 松 隈 秀 盛 第4図 第5図
Claims (1)
- 原文書のイメージに対応する原文字信号から1個の文
字又は分離文字の各構成部を形成する切出し文字信号を
順次切出す文字切出し部と、文字コードに対応するイメ
ージデータを記憶した認識辞書部と、1個又は複数個の
上記切出し文字信号に対応する文字コードを上記認識辞
書部を用いて識別する文字識別部と、上記文字切出し部
より供給される上記切出し文字信号のイメージデータを
上記認識辞書部へ登録する辞書作成部とを有し、上記文
字識別部にて分離文字の識別を誤った場合、該識別を誤
った分離文字の全体を形成する切出し文字信号を上記文
字切出し部より上記辞書作成部へ供給することにより、
上記識別を誤った分離文字のイメージデータを上記認識
辞書部へ登録するようにしたことを特徴とする文字認識
装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009623A JP2893781B2 (ja) | 1990-01-19 | 1990-01-19 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009623A JP2893781B2 (ja) | 1990-01-19 | 1990-01-19 | 文字認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03214286A true JPH03214286A (ja) | 1991-09-19 |
| JP2893781B2 JP2893781B2 (ja) | 1999-05-24 |
Family
ID=11725393
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009623A Expired - Fee Related JP2893781B2 (ja) | 1990-01-19 | 1990-01-19 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2893781B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013121648A1 (ja) * | 2012-02-17 | 2013-08-22 | オムロン株式会社 | 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム |
-
1990
- 1990-01-19 JP JP2009623A patent/JP2893781B2/ja not_active Expired - Fee Related
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013121648A1 (ja) * | 2012-02-17 | 2013-08-22 | オムロン株式会社 | 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム |
| JP2013171310A (ja) * | 2012-02-17 | 2013-09-02 | Omron Corp | 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム |
| CN104094288A (zh) * | 2012-02-17 | 2014-10-08 | 欧姆龙株式会社 | 字符识别方法、使用该方法的字符识别装置及程序 |
| US9224065B2 (en) | 2012-02-17 | 2015-12-29 | Omron Corporation | Character-recognition method and character-recognition device and program using said method |
| CN104094288B (zh) * | 2012-02-17 | 2017-07-28 | 欧姆龙株式会社 | 字符识别方法、使用该方法的字符识别装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2893781B2 (ja) | 1999-05-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8571359B2 (en) | Image processing device, method and storage medium for storing and displaying an electronic document | |
| JP4443576B2 (ja) | パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法 | |
| JP2002007963A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
| WO1990001198A1 (fr) | Dispositif de reconnaissance de caracteres | |
| US6947596B2 (en) | Character recognition method, program and recording medium | |
| JPH03214378A (ja) | 文字認識装置 | |
| US6504540B1 (en) | Method and apparatus for altering one or more attributes of one or more blocks of image data in a document | |
| JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
| JP2003256770A (ja) | 数式認識装置および数式認識方法 | |
| JP2893781B2 (ja) | 文字認識装置 | |
| JPH03214281A (ja) | 文字認識装置 | |
| JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
| JPH03214377A (ja) | 文字認識装置 | |
| JPH03214379A (ja) | 文字認識装置 | |
| JPH117493A (ja) | 文字認識処理装置 | |
| JPH03214350A (ja) | 部首検索方法 | |
| JP2923004B2 (ja) | 画像生成装置 | |
| JP2995818B2 (ja) | 文字切り出し方法 | |
| JPH01292586A (ja) | 文字認識支援装置 | |
| JP2687902B2 (ja) | 文書画像認識装置 | |
| JP2976990B2 (ja) | 文字認識装置 | |
| JPH08297718A (ja) | 文字切り出し装置及び文字認識装置 | |
| JP2001155139A (ja) | カメラ付きペン型入力装置用記憶媒体 | |
| JPH06195519A (ja) | 文字認識装置および文字認識方法 | |
| JPH103515A (ja) | 画像処理方法及び装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |