JPH0785215A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH0785215A JPH0785215A JP5252268A JP25226893A JPH0785215A JP H0785215 A JPH0785215 A JP H0785215A JP 5252268 A JP5252268 A JP 5252268A JP 25226893 A JP25226893 A JP 25226893A JP H0785215 A JPH0785215 A JP H0785215A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- data
- field
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 claims abstract description 19
- 238000006243 chemical reaction Methods 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 31
- 238000005520 cutting process Methods 0.000 claims description 18
- 238000012937 correction Methods 0.000 claims description 15
- 238000013500 data storage Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 9
- 239000011295 pitch Substances 0.000 description 8
- 238000009826 distribution Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 原稿読取りの際に文字と一緒に文字の位置や
サイズ及び罫線を切り出し、文字編集装置等で利用でき
るデータに変換することにより、読取り原稿そのままの
書式イメージを再現し得る文字認識装置の提供。 【構成】 文字認識装置は原稿をイメージスキャナ1で
読取りイメージデータとしてイメージメモリ2に記憶す
る。CPU3は操作者による領域指定がなされた後に認
識処理としてレイアウト解析、文字認識、及びデータ変
換を行う。レイアウト解析は指定領域が文字フィールド
か表フィールドかの判別を行う。表フィールドの場合に
は表罫線(座標)の切り出しを行う。文字フィールドの
場合は文字列を抽出し、文字フィールドを1行毎に切り
出し傾き補正をする(表フィールド中に文字列がある場
合も同様)。文字認識は、格納装置から認識辞書データ
をワークメモリ5にロードし、指定領域の文字認識を行
う。データ変換処理はレイアウト解析結果と文字認識の
結果を突き合わせ、文書編集装置で編集可能なデータに
変換し認識データファイルに認識データとして格納す
る。
サイズ及び罫線を切り出し、文字編集装置等で利用でき
るデータに変換することにより、読取り原稿そのままの
書式イメージを再現し得る文字認識装置の提供。 【構成】 文字認識装置は原稿をイメージスキャナ1で
読取りイメージデータとしてイメージメモリ2に記憶す
る。CPU3は操作者による領域指定がなされた後に認
識処理としてレイアウト解析、文字認識、及びデータ変
換を行う。レイアウト解析は指定領域が文字フィールド
か表フィールドかの判別を行う。表フィールドの場合に
は表罫線(座標)の切り出しを行う。文字フィールドの
場合は文字列を抽出し、文字フィールドを1行毎に切り
出し傾き補正をする(表フィールド中に文字列がある場
合も同様)。文字認識は、格納装置から認識辞書データ
をワークメモリ5にロードし、指定領域の文字認識を行
う。データ変換処理はレイアウト解析結果と文字認識の
結果を突き合わせ、文書編集装置で編集可能なデータに
変換し認識データファイルに認識データとして格納す
る。
Description
【0001】
【産業上の利用分野】本発明は文字認識装置に関する。
【0002】
【従来の技術】従来の文字認識装置は、活字文書や手書
き文書の指定された範囲の文字部分を切り出して1文字
のドットイメージで読取り、その読み取ったデータを解
析してから文字認識用の辞書から適切な文字を探し出
し、その文字を自動的に文字コード(テキストデータ)
に変換していた。
き文書の指定された範囲の文字部分を切り出して1文字
のドットイメージで読取り、その読み取ったデータを解
析してから文字認識用の辞書から適切な文字を探し出
し、その文字を自動的に文字コード(テキストデータ)
に変換していた。
【0003】
【発明が解決しようとする課題】上述したような従来技
術においてはコード変換されたデータを文字編集装置
(或いは、コード変換された文字コード(データ)を当
該文字認識装置の編集機能(以下、文字編集装置等と記
す)で修正・追加等の編集操作をするため文字編集装置
等)で呼び出した場合に、文字データのみが表示され読
取り原稿のイメージ(文字の位置やサイズ、或いは罫線
や表)を再現することができないため再度修正や編集を
し直さなければならないという問題点があった。
術においてはコード変換されたデータを文字編集装置
(或いは、コード変換された文字コード(データ)を当
該文字認識装置の編集機能(以下、文字編集装置等と記
す)で修正・追加等の編集操作をするため文字編集装置
等)で呼び出した場合に、文字データのみが表示され読
取り原稿のイメージ(文字の位置やサイズ、或いは罫線
や表)を再現することができないため再度修正や編集を
し直さなければならないという問題点があった。
【0004】即ち、従来の文字認識装置では、文書の文
字コードのみの変換を行っており書式レイアウトの再現
(文字のサイズ、文字の位置、罫線)ができなかった。
そこで、従来は書式レイアウトの再現には文字コード変
換後のデータ(認識データ)をワープロなどで編集し
て、文字の大きさや行ピッチ及び罫線等の書式等を再現
することを必要としていた。
字コードのみの変換を行っており書式レイアウトの再現
(文字のサイズ、文字の位置、罫線)ができなかった。
そこで、従来は書式レイアウトの再現には文字コード変
換後のデータ(認識データ)をワープロなどで編集し
て、文字の大きさや行ピッチ及び罫線等の書式等を再現
することを必要としていた。
【0005】本発明は上記問題点に鑑みてなされたもの
であり、原稿読取りの際に文字と一緒に文字の位置やサ
イズ及び罫線、或いは表を切り出し、データとして読み
込み文字編集装置等で利用できるデータ(文書編集装置
編集データ)に変換して文字編集装置等で呼び出した場
合、読取り原稿そのままの書式イメージを再現すること
により再度の修正や編集(文字の位置合わせやサイズ変
更・罫線(表)の入力)を必要とない文字認識装置を提
供することを目的とする。
であり、原稿読取りの際に文字と一緒に文字の位置やサ
イズ及び罫線、或いは表を切り出し、データとして読み
込み文字編集装置等で利用できるデータ(文書編集装置
編集データ)に変換して文字編集装置等で呼び出した場
合、読取り原稿そのままの書式イメージを再現すること
により再度の修正や編集(文字の位置合わせやサイズ変
更・罫線(表)の入力)を必要とない文字認識装置を提
供することを目的とする。
【0006】
【課題を解決するための手段】上記の目的を達成するた
めに第1の発明の文字認識装置は、記入或いは印字され
た文字および/または罫線からなる表を含む文書を読み
取ってイメージデータとして出力するイメージリーダー
と、イメージデータを記憶するイメージメモリと、認識
処理手段による認識処理を実行する処理装置と、文字認
識に用いる認識辞書データを格納する認識辞書データ格
納装置と、前記認識処理により得た認識データを格納す
る格納装置と、操作情報を入力する入力装置と、を有す
る文字認識装置において、認識処理手段が、イメージデ
ータの領域を入力装置により指定する領域指定手段と、
領域指定手段により指定された指定領域ごとに当該指定
領域のレイアウトを解析してレイアウト解析結果を得る
レイアウト解析手段と、領域指定手段により指定された
指定領域の中の文字フィールドの文字列を認識辞書デー
タに基づいて文字認識して文字認識結果を得る文字認識
手段と、文字認識結果とレイアウト解析結果を合成して
書式情報を付加し、書式文書として認識データを作成す
るデータ変換手段と、を有することを特徴とする。
めに第1の発明の文字認識装置は、記入或いは印字され
た文字および/または罫線からなる表を含む文書を読み
取ってイメージデータとして出力するイメージリーダー
と、イメージデータを記憶するイメージメモリと、認識
処理手段による認識処理を実行する処理装置と、文字認
識に用いる認識辞書データを格納する認識辞書データ格
納装置と、前記認識処理により得た認識データを格納す
る格納装置と、操作情報を入力する入力装置と、を有す
る文字認識装置において、認識処理手段が、イメージデ
ータの領域を入力装置により指定する領域指定手段と、
領域指定手段により指定された指定領域ごとに当該指定
領域のレイアウトを解析してレイアウト解析結果を得る
レイアウト解析手段と、領域指定手段により指定された
指定領域の中の文字フィールドの文字列を認識辞書デー
タに基づいて文字認識して文字認識結果を得る文字認識
手段と、文字認識結果とレイアウト解析結果を合成して
書式情報を付加し、書式文書として認識データを作成す
るデータ変換手段と、を有することを特徴とする。
【0007】第2の発明は上記第1の発明の文字認識装
置において、レイアウト解析手段が、指定領域のフィー
ルド種別を判別するフィールド種別判別手段と、上記フ
ィールド種別が罫線または表フィールドのとき、罫線を
切り出す罫線切り出し手段と、上記フィールド種別が文
字列を含む表フィールドのとき、該表フィールドから文
字列を切り出す第1の文字列切り出し手段と、上記フィ
ールド種別が文字フィールドのとき、該文字フィールド
から文字列を切り出す第2の文字列切り出し手段と、を
有することを特徴とする。
置において、レイアウト解析手段が、指定領域のフィー
ルド種別を判別するフィールド種別判別手段と、上記フ
ィールド種別が罫線または表フィールドのとき、罫線を
切り出す罫線切り出し手段と、上記フィールド種別が文
字列を含む表フィールドのとき、該表フィールドから文
字列を切り出す第1の文字列切り出し手段と、上記フィ
ールド種別が文字フィールドのとき、該文字フィールド
から文字列を切り出す第2の文字列切り出し手段と、を
有することを特徴とする。
【0008】第3の発明は上記第1の発明の文字認識装
置において、レイアウト解析手段が、文字または文書全
体の傾きを検出する傾き検出手段と、指定領域のフィー
ルド種別を判別するフィールド種別判別手段と、上記フ
ィールド種別が表フィールドのとき、罫線を切り出す罫
線切り出し手段と、上記フィールド種別が文字列を含む
表フィールドのとき、該表フィールドから文字列を切り
出し、該文字列から1行分毎の文字列を切り出す第1の
文字列切り出し手段と、上記フィールド種別が文字フィ
ールドのとき、該文字フィールドから文字列を切り出
し、該文字フィールドから1行分毎の文字列を切り出す
第2の文字列切り出し手段と、文字列1行毎に傾きを補
正する傾き補正手段と、を有することを特徴とする。
置において、レイアウト解析手段が、文字または文書全
体の傾きを検出する傾き検出手段と、指定領域のフィー
ルド種別を判別するフィールド種別判別手段と、上記フ
ィールド種別が表フィールドのとき、罫線を切り出す罫
線切り出し手段と、上記フィールド種別が文字列を含む
表フィールドのとき、該表フィールドから文字列を切り
出し、該文字列から1行分毎の文字列を切り出す第1の
文字列切り出し手段と、上記フィールド種別が文字フィ
ールドのとき、該文字フィールドから文字列を切り出
し、該文字フィールドから1行分毎の文字列を切り出す
第2の文字列切り出し手段と、文字列1行毎に傾きを補
正する傾き補正手段と、を有することを特徴とする。
【0009】第4の発明は上記第1の発明の文字認識装
置において、書式文書として編集可能な認識データが、 a.罫線データ長と、少なくとも、罫線種別コード、開
始座標、及び終了座標とからなる個別罫線情報の組の繰
返しからなる罫線情報と、 b.文字データ長、文字ピッチ、行間隔を示すコード
と、少なくとも、制御コード及び文字コードの組の繰返
しからなる文字情報と、 を含むことを特徴とする。
置において、書式文書として編集可能な認識データが、 a.罫線データ長と、少なくとも、罫線種別コード、開
始座標、及び終了座標とからなる個別罫線情報の組の繰
返しからなる罫線情報と、 b.文字データ長、文字ピッチ、行間隔を示すコード
と、少なくとも、制御コード及び文字コードの組の繰返
しからなる文字情報と、 を含むことを特徴とする。
【0010】第5の発明は上記第1ないし第4の発明の
文字認識装置において、更に、認識データを格納装置に
格納する認識データ格納手段を有することを特徴とす
る。
文字認識装置において、更に、認識データを格納装置に
格納する認識データ格納手段を有することを特徴とす
る。
【0011】第6の発明は上記第1ないし第4の発明の
文字認識装置において、更に、認識データを格納装置に
格納する認識データ格納手段と、イメージデータを格納
装置に格納するイメージデータ格納手段を有することを
特徴とする。
文字認識装置において、更に、認識データを格納装置に
格納する認識データ格納手段と、イメージデータを格納
装置に格納するイメージデータ格納手段を有することを
特徴とする。
【0012】
【作用】上記構成により第1の発明の文字認識装置は、
認識処理手段が、領域指定手段により入力装置でイメー
ジデータの領域を指定し、レイアウト解析手段により領
域指定手段で指定された指定領域ごとに当該指定領域の
レイアウトを解析してレイアウト解析結果を得て、文字
認識手段により領域指定手段により指定された指定領域
の中の文字フィールドの文字列を認識辞書データに基づ
いて文字認識して文字認識結果を得て、データ変換手段
により文字認識結果とレイアウト解析結果を合成して書
式情報を付加し、書式文書として認識データを作成す
る。
認識処理手段が、領域指定手段により入力装置でイメー
ジデータの領域を指定し、レイアウト解析手段により領
域指定手段で指定された指定領域ごとに当該指定領域の
レイアウトを解析してレイアウト解析結果を得て、文字
認識手段により領域指定手段により指定された指定領域
の中の文字フィールドの文字列を認識辞書データに基づ
いて文字認識して文字認識結果を得て、データ変換手段
により文字認識結果とレイアウト解析結果を合成して書
式情報を付加し、書式文書として認識データを作成す
る。
【0013】第2の発明は上記第1の発明の文字認識装
置において、レイアウト解析手段が、フィールド種別判
別手段により指定領域のフィールド種別を判別し、フィ
ールド種別に基づいてデータ列の切り出しを行う。この
場合フィールド種別が表フィールドのときは罫線切り出
し手段により罫線を切り出し、文字列を含む表フィール
ドのときは第1の文字列切り出し手段によりその表フィ
ールドから文字列を切り出し、フィールド種別が文字フ
ィールドのときは第2の文字列切り出し手段によりその
文字フィールドから文字列を切り出す。
置において、レイアウト解析手段が、フィールド種別判
別手段により指定領域のフィールド種別を判別し、フィ
ールド種別に基づいてデータ列の切り出しを行う。この
場合フィールド種別が表フィールドのときは罫線切り出
し手段により罫線を切り出し、文字列を含む表フィール
ドのときは第1の文字列切り出し手段によりその表フィ
ールドから文字列を切り出し、フィールド種別が文字フ
ィールドのときは第2の文字列切り出し手段によりその
文字フィールドから文字列を切り出す。
【0014】第3の発明は上記第1の発明の文字認識装
置において、レイアウト解析手段が、傾き検出手段によ
り文字または文書全体の傾きを検出し、フィールド種別
判別手段により指定領域のフィールド種別を判別する。
そして、フィールド種別が表フィールドのときは罫線を
切り出し手段により罫線を切り出し、文字列を含む表フ
ィールドのときは第1の文字列切り出し手段によりその
表フィールドから文字列を切り出した後、その文字列か
ら1行分毎の文字列を切り出し、文字フィールドのとき
は第2の文字列切り出し手段によりその文字フィールド
から文字列を切り出した後、その文字フィールドから1
行分毎の文字列を切り出す。更に、傾き補正手段により
文字列1行毎に文字の傾きを補正する。
置において、レイアウト解析手段が、傾き検出手段によ
り文字または文書全体の傾きを検出し、フィールド種別
判別手段により指定領域のフィールド種別を判別する。
そして、フィールド種別が表フィールドのときは罫線を
切り出し手段により罫線を切り出し、文字列を含む表フ
ィールドのときは第1の文字列切り出し手段によりその
表フィールドから文字列を切り出した後、その文字列か
ら1行分毎の文字列を切り出し、文字フィールドのとき
は第2の文字列切り出し手段によりその文字フィールド
から文字列を切り出した後、その文字フィールドから1
行分毎の文字列を切り出す。更に、傾き補正手段により
文字列1行毎に文字の傾きを補正する。
【0015】第4の発明は上記第1の発明の文字認識装
置において、データ変換手段レイアウト解析結果と認識
結果に基づいて、 a.罫線データ長と、少なくとも、罫線種別コード、開
始座標、及び終了座標とからなる個別罫線情報の組の繰
返しからなる罫線情報と、 b.文字データ長、文字ピッチ、行間隔を示すコード
と、少なくとも、制御コード及び文字コードの組の繰返
しからなる文字情報と、 を含む、書式文書として編集可能な認識データを作成す
る。
置において、データ変換手段レイアウト解析結果と認識
結果に基づいて、 a.罫線データ長と、少なくとも、罫線種別コード、開
始座標、及び終了座標とからなる個別罫線情報の組の繰
返しからなる罫線情報と、 b.文字データ長、文字ピッチ、行間隔を示すコード
と、少なくとも、制御コード及び文字コードの組の繰返
しからなる文字情報と、 を含む、書式文書として編集可能な認識データを作成す
る。
【0016】第5の発明は上記第1ないし第4の発明の
文字認識装置において、更に、認識データ格納手段によ
り認識データを格納装置に格納する。
文字認識装置において、更に、認識データ格納手段によ
り認識データを格納装置に格納する。
【0017】第6の発明は上記第1ないし第4の発明の
文字認識装置において、更に、認識データ格納手段によ
り認識データを、イメージデータ格納手段によりイメー
ジデータを格納装置に格納する。
文字認識装置において、更に、認識データ格納手段によ
り認識データを、イメージデータ格納手段によりイメー
ジデータを格納装置に格納する。
【0018】
【実施例】図1は、本発明の文字認識装置の一実施例の
構成図であり、図2は本発明の文字認識装置の他の実施
例の構成図である。図2の装置は文字(及び書式)原稿
を連続的に読み取って認識データを保管装置に保管し、
読取り処理終了後に一括して文字編集装置等(図示せ
ず)で修正するパッチ処理を行う機能を有する。
構成図であり、図2は本発明の文字認識装置の他の実施
例の構成図である。図2の装置は文字(及び書式)原稿
を連続的に読み取って認識データを保管装置に保管し、
読取り処理終了後に一括して文字編集装置等(図示せ
ず)で修正するパッチ処理を行う機能を有する。
【0019】図1及び図2で、1は活字原稿或いは手書
き原稿の文字を読み取るイメージスキャナ(画像読取り
装置)、2はイメージスキャナで読み取ったイメージデ
ータを一時的に保存(記憶)するイメージメモリ、3は
文字認識装置の動作の制御及び後述する認識処理手段に
よる認識処理の実行等を行うCPU(中央演算装置)、
4は認識処理により認識された認識データ及びイメージ
メモリ2からのイメージデータを格納する記憶(格納)
装置、5はCPU3による認識処理等において必要とす
る各処理手段(プログラム)、データ、辞書データ、あ
るいは設定値ないしパラメータ等を一時的に記憶するワ
ークメモリ(内部メモリ)、6はイメージリーダ1で読
み取った文字を認識するための認識辞書データからなる
認識辞書ファイルを格納した格納装置、7は文字認識装
置の操作に必要な操作コマンド、メニュー或いはアイコ
ン等の操作情報を表示する表示装置、8は文字認識装置
の操作に必要な操作情報を入力するキーボード、或いは
マウス等のポインティングデバイスを有する入力装置で
ある。
き原稿の文字を読み取るイメージスキャナ(画像読取り
装置)、2はイメージスキャナで読み取ったイメージデ
ータを一時的に保存(記憶)するイメージメモリ、3は
文字認識装置の動作の制御及び後述する認識処理手段に
よる認識処理の実行等を行うCPU(中央演算装置)、
4は認識処理により認識された認識データ及びイメージ
メモリ2からのイメージデータを格納する記憶(格納)
装置、5はCPU3による認識処理等において必要とす
る各処理手段(プログラム)、データ、辞書データ、あ
るいは設定値ないしパラメータ等を一時的に記憶するワ
ークメモリ(内部メモリ)、6はイメージリーダ1で読
み取った文字を認識するための認識辞書データからなる
認識辞書ファイルを格納した格納装置、7は文字認識装
置の操作に必要な操作コマンド、メニュー或いはアイコ
ン等の操作情報を表示する表示装置、8は文字認識装置
の操作に必要な操作情報を入力するキーボード、或いは
マウス等のポインティングデバイスを有する入力装置で
ある。
【0020】また、図2で、9は出力装置(プリンタ或
いは認識データを格納する磁気ディスク)である。な
お、格納装置4と6は物理的に同じ装置でもよい。ま
た、実施例ではレイアウト解析手段、文字認識手段、デ
ータ変換手段等の認識処理手段はプログラム手段として
格納装置4に格納されており、文字認識装置の起動時に
読み出されワークメモリ5に装置が駆動の間保持され、
CPU3により適時実行される。
いは認識データを格納する磁気ディスク)である。な
お、格納装置4と6は物理的に同じ装置でもよい。ま
た、実施例ではレイアウト解析手段、文字認識手段、デ
ータ変換手段等の認識処理手段はプログラム手段として
格納装置4に格納されており、文字認識装置の起動時に
読み出されワークメモリ5に装置が駆動の間保持され、
CPU3により適時実行される。
【0021】図3は文字読取り装置の動作ブロック図で
あり、図11は読取り原稿の例である。以下、図3及び
図11に従って本発明の文字読取り装置の動作について
説明する。なお、図11では説明上、文章(文字群)1
11と表112を原稿の上下に示してあるが、表112
の中に文字が書かれている場合も本発明を適用できる。
あり、図11は読取り原稿の例である。以下、図3及び
図11に従って本発明の文字読取り装置の動作について
説明する。なお、図11では説明上、文章(文字群)1
11と表112を原稿の上下に示してあるが、表112
の中に文字が書かれている場合も本発明を適用できる。
【0022】設定ブロック30では認識条件の設定を行
う。認識条件としては、例えば原稿の種類(例えば、ワ
ープロ印字、書籍(印刷文字)等の別)、文字方向の判
別条件(自動判別、手動等)、書式再現の可否、罫線再
現の可否、表内文字再現の可否等があり、これらの条件
は設定時に表示装置7に示され、操作者によりマウスで
指定され入力される。入力された各設定条件はCPU3
でチェックされた後にワークメモリ5の所定のアドレス
に記憶される。読取りブロック31ではイメージスキャ
ナ1にセットされた原稿110(図11参照)を読取り
バッファ(54Kバイト)単位で読取りながらイメージ
メモリ2にイメージデータを描画し、同時にイメージデ
ータを原稿全体ごと表示装置7に表示する。
う。認識条件としては、例えば原稿の種類(例えば、ワ
ープロ印字、書籍(印刷文字)等の別)、文字方向の判
別条件(自動判別、手動等)、書式再現の可否、罫線再
現の可否、表内文字再現の可否等があり、これらの条件
は設定時に表示装置7に示され、操作者によりマウスで
指定され入力される。入力された各設定条件はCPU3
でチェックされた後にワークメモリ5の所定のアドレス
に記憶される。読取りブロック31ではイメージスキャ
ナ1にセットされた原稿110(図11参照)を読取り
バッファ(54Kバイト)単位で読取りながらイメージ
メモリ2にイメージデータを描画し、同時にイメージデ
ータを原稿全体ごと表示装置7に表示する。
【0023】次に、領域指定ブロック32では領域指定
手段により画面上に表示された矩形の始点、終点の位置
を入力装置8のマウスで指定し入力する。図12は図1
1の原稿110のイメージ表示であり領域指定を行った
例である。図12では指定領域として2つの領域F1
(FIX1,FIY1)、F2(F2X1、F2Y1)
が示されている。
手段により画面上に表示された矩形の始点、終点の位置
を入力装置8のマウスで指定し入力する。図12は図1
1の原稿110のイメージ表示であり領域指定を行った
例である。図12では指定領域として2つの領域F1
(FIX1,FIY1)、F2(F2X1、F2Y1)
が示されている。
【0024】この場合、領域は領域指定を行った順に認
識される。なお、領域指定をしない場合は原稿全体が一
領域として指定されたことになる。認識ブロック33で
は図4のフローチャートに基づいてレイアウト解析、文
字認識、データ変換等の処理が実行される。なお、図5
は図4のレイアウト解析(ステップS3)の詳細フロー
チャート、図6は図4の文字認識(ステップS13)の
詳細フローチャート、図7は図4のデータ変換(ステッ
プS15)の詳細フローチャートである。
識される。なお、領域指定をしない場合は原稿全体が一
領域として指定されたことになる。認識ブロック33で
は図4のフローチャートに基づいてレイアウト解析、文
字認識、データ変換等の処理が実行される。なお、図5
は図4のレイアウト解析(ステップS3)の詳細フロー
チャート、図6は図4の文字認識(ステップS13)の
詳細フローチャート、図7は図4のデータ変換(ステッ
プS15)の詳細フローチャートである。
【0025】図4でステップS1,S2は上述した領域
指定ブロックによる領域確保の動作であり、説明を省略
する。ステップS3ではCPU3は図5に示すレイアウ
ト解析手段を実行して設定ブロック30で設定されワー
クメモリ5に記憶されている各設定条件と領域設定ブロ
ック32で指定された領域の座標を基にレイアウト(la
y-out)解析を行う。レイアウト解析は図5のフローチ
ャートに示すように最初にステップS30の前処理で未
知データのうち黒点の集まっている領域を探し出し矩形
で囲む(内部的処理)。
指定ブロックによる領域確保の動作であり、説明を省略
する。ステップS3ではCPU3は図5に示すレイアウ
ト解析手段を実行して設定ブロック30で設定されワー
クメモリ5に記憶されている各設定条件と領域設定ブロ
ック32で指定された領域の座標を基にレイアウト(la
y-out)解析を行う。レイアウト解析は図5のフローチ
ャートに示すように最初にステップS30の前処理で未
知データのうち黒点の集まっている領域を探し出し矩形
で囲む(内部的処理)。
【0026】次に、ステップS31で文字の傾きをチェ
ックする。±5°以上の場合は読取りやり直しとする。
文字の傾きは図8に示すように原稿の位置が正常であっ
て原稿内の文字そのものが傾いている場合と、図9に示
すように原稿の傾きに困るもの及び両者が組合わさった
ものがある。
ックする。±5°以上の場合は読取りやり直しとする。
文字の傾きは図8に示すように原稿の位置が正常であっ
て原稿内の文字そのものが傾いている場合と、図9に示
すように原稿の傾きに困るもの及び両者が組合わさった
ものがある。
【0027】原稿が傾いている場合には図9(a)のよ
うに左上座標(x1,y1)、左下座標(x2,y2)
だけでは傾きの判定が難しいので、図9(b)に示すよ
うに左下座標(x1,y4)、右上座標(x2,y3)
を用いて傾きを判定し全体として右下がりか左下がりか
を判定する。傾きチェックがOKの場合、図5のステッ
プS32で読取り原稿の指定領域が文字フィールドか表
フィールドかの判別を行う。表フィールドが判別された
場合にはステップS33〜S35の処理を行った後にス
テップS36に移り、表フィールドでない場合にはステ
ップS36の処理に移る。表フィールドか否かの判定は
線分が所定の大きさより大きい(長い)場合に罫線の抽
出を行いその数が所定数を越える時に表と判定する。ま
た、罫線の抽出はラングレス(黒点の連絡長)による。
うに左上座標(x1,y1)、左下座標(x2,y2)
だけでは傾きの判定が難しいので、図9(b)に示すよ
うに左下座標(x1,y4)、右上座標(x2,y3)
を用いて傾きを判定し全体として右下がりか左下がりか
を判定する。傾きチェックがOKの場合、図5のステッ
プS32で読取り原稿の指定領域が文字フィールドか表
フィールドかの判別を行う。表フィールドが判別された
場合にはステップS33〜S35の処理を行った後にス
テップS36に移り、表フィールドでない場合にはステ
ップS36の処理に移る。表フィールドか否かの判定は
線分が所定の大きさより大きい(長い)場合に罫線の抽
出を行いその数が所定数を越える時に表と判定する。ま
た、罫線の抽出はラングレス(黒点の連絡長)による。
【0028】ステップS33では表の中に文字列があれ
ば、ステップS34で周辺分布により文字列を抽出し、
文字フィールドを1行毎に切り出し傾き補正をする。文
字列がない場合にはステップS35に移行する。
ば、ステップS34で周辺分布により文字列を抽出し、
文字フィールドを1行毎に切り出し傾き補正をする。文
字列がない場合にはステップS35に移行する。
【0029】図8は文字が傾いている場合の補正(なな
め補正)の場合であり、(a)は右下がりの場合を示
す。右下がりの場合には座標を正の方向(図中の矢印の
方向)に原点0を中心として回転移動(座標変換)して
x,y座標を補正する。また、右下がりの場合には座標
を負の方向(図中の矢印の方向)に原点0を中心として
回転移動してx,y座標を補正する。原稿が傾いている
場合にも全体として右下がりか左下がりかを判定した後
に、例えば座標(x1,y1)を原点として回転移動し
てx,y座標を変換する。
め補正)の場合であり、(a)は右下がりの場合を示
す。右下がりの場合には座標を正の方向(図中の矢印の
方向)に原点0を中心として回転移動(座標変換)して
x,y座標を補正する。また、右下がりの場合には座標
を負の方向(図中の矢印の方向)に原点0を中心として
回転移動してx,y座標を補正する。原稿が傾いている
場合にも全体として右下がりか左下がりかを判定した後
に、例えば座標(x1,y1)を原点として回転移動し
てx,y座標を変換する。
【0030】ステップS35では表罫線(座標)の切り
出しのみを行い、ステップS36で罫線かどうか周辺分
布の平坦正及び外接矩形の縦横比で判定する。判定の結
果が罫線の場合はステップS37で罫線の切り出しを行
いステップS38に移行する。判定の結果罫線以外の場
合は直ちにステップS38に移行する。
出しのみを行い、ステップS36で罫線かどうか周辺分
布の平坦正及び外接矩形の縦横比で判定する。判定の結
果が罫線の場合はステップS37で罫線の切り出しを行
いステップS38に移行する。判定の結果罫線以外の場
合は直ちにステップS38に移行する。
【0031】ステップS38では矩形の大きさにより文
字か否かを判定する。文字の場合はステップS39で周
辺分布により文字列を抽出し、文字フィールドを1行毎
に切り出し傾き補正をしてステップS40に移行する。
文字がない場合は図または写真の場合であり、レイアウ
ト解析を終了しステップS4に移行する(図4)。
字か否かを判定する。文字の場合はステップS39で周
辺分布により文字列を抽出し、文字フィールドを1行毎
に切り出し傾き補正をしてステップS40に移行する。
文字がない場合は図または写真の場合であり、レイアウ
ト解析を終了しステップS4に移行する(図4)。
【0032】ステップS40ではレイアウト解析が済ん
でいない指定領域の有無をチェックし、レイアウト解析
が済んでいない指定領域がある場合は次の指定領域の処
理を行うためにステップS32〜S39を繰り返す。指
定領域のレイアウト解析が全く済んでいる場合はレイア
ウト解析を終了しステップS4に移行する(図4)。レ
イアウト解析結果は図18に示すようなフォーマットで
ワークメモリ5の所定の領域に保存される。なお、レイ
アウト解析結果の結果の行フィールドの座標はななめ補
正をしていない行座標(元のイメージに忠実な行座標)
である。
でいない指定領域の有無をチェックし、レイアウト解析
が済んでいない指定領域がある場合は次の指定領域の処
理を行うためにステップS32〜S39を繰り返す。指
定領域のレイアウト解析が全く済んでいる場合はレイア
ウト解析を終了しステップS4に移行する(図4)。レ
イアウト解析結果は図18に示すようなフォーマットで
ワークメモリ5の所定の領域に保存される。なお、レイ
アウト解析結果の結果の行フィールドの座標はななめ補
正をしていない行座標(元のイメージに忠実な行座標)
である。
【0033】ここで、ステップS32〜S39について
具体例として、図11の原稿110の場合を例にとる
と、ステップS32で領域F1が表フィールドかを判定
する。領域F1は表ではないのでステップS36で罫線
かどうかを判定する。また、領域F1は罫線ではないの
でステップS38で文字列か否かの判定を行う。領域F
1には文字列しか存在しないのでステップS39で文字
フィールド1行毎の切り出し及び行毎の傾き補正を行
う。なお、図16,17に図11の原稿110を例とす
るレイアウト解析結果等を示す。ここで、図17はレイ
アウト解析情報(原稿110のイメージデータ)であ
り、図16はレイアウト解析結果(原稿110の行座
標、罫線座標)である。
具体例として、図11の原稿110の場合を例にとる
と、ステップS32で領域F1が表フィールドかを判定
する。領域F1は表ではないのでステップS36で罫線
かどうかを判定する。また、領域F1は罫線ではないの
でステップS38で文字列か否かの判定を行う。領域F
1には文字列しか存在しないのでステップS39で文字
フィールド1行毎の切り出し及び行毎の傾き補正を行
う。なお、図16,17に図11の原稿110を例とす
るレイアウト解析結果等を示す。ここで、図17はレイ
アウト解析情報(原稿110のイメージデータ)であ
り、図16はレイアウト解析結果(原稿110の行座
標、罫線座標)である。
【0034】S40の指定領域存在判定の結果領域F2
がまだ未処理領域のためステップS32に戻り領域F2
が表フィールドかを判定する。領域F2は表であるため
ステップS33で表内に文字列があるか否かを判定す
る。この例の場合領域F2には文字がないと判定され、
ステップS35で罫線座標の切り出しを行う。領域F2
の罫線座標は次のようになる。
がまだ未処理領域のためステップS32に戻り領域F2
が表フィールドかを判定する。領域F2は表であるため
ステップS33で表内に文字列があるか否かを判定す
る。この例の場合領域F2には文字がないと判定され、
ステップS35で罫線座標の切り出しを行う。領域F2
の罫線座標は次のようになる。
【0035】 罫線1 K1(K1X,K1Y),K2(K2X,K2
Y) 罫線2 K3(K3X,K3Y),K4(K2X,K4
Y) 罫線3 K1(K1X,K1Y),K3(K3X,K3
Y) 罫線4 K2(K1X,K1Y),K4(K4X,K4
Y) 図4のステップS4でCPU3はレイアウト解析エラー
の有無を判定し、レイアウト解析エラーがある場合には
指定領域(インターフェイス領域)を解放して処理を終
了する(操作者はエラー表示によりブロック32の領域
設定からやり直す)。レイアウト解析エラーがない場合
にはステップS5でCPU3は表示装置7の画面上に、
例えば、文字列を矩形で囲みレイアウト解析結果を表示
する(図13)。
Y) 罫線2 K3(K3X,K3Y),K4(K2X,K4
Y) 罫線3 K1(K1X,K1Y),K3(K3X,K3
Y) 罫線4 K2(K1X,K1Y),K4(K4X,K4
Y) 図4のステップS4でCPU3はレイアウト解析エラー
の有無を判定し、レイアウト解析エラーがある場合には
指定領域(インターフェイス領域)を解放して処理を終
了する(操作者はエラー表示によりブロック32の領域
設定からやり直す)。レイアウト解析エラーがない場合
にはステップS5でCPU3は表示装置7の画面上に、
例えば、文字列を矩形で囲みレイアウト解析結果を表示
する(図13)。
【0036】次に、ステップS6〜S14で文字の認識
処理を実行する。ステップS6ではCPU3は文字認識
処理実行の可否を問うメッセージを表示装置7に表示
し、操作者による支持入力を促す。操作者はマウスによ
り入力指示を行う。実行不可の場合は指定領域(インタ
ーフェイス領域)を解放して処理を終了する。実行可の
場合はステップS7でCPU3は格納装置6に格納され
ている認識辞書ファイルから認識辞書データをワークメ
モリ5にロードし(ブロック34)、ステップ8でロー
ドエラーの有無をチェックした後にステップS9で表示
装置7のレイアウト解析画面を認識画面に切換えステッ
プS10に移行する。例えば、図12の領域F1の行K
1の部分を反転表示する。
処理を実行する。ステップS6ではCPU3は文字認識
処理実行の可否を問うメッセージを表示装置7に表示
し、操作者による支持入力を促す。操作者はマウスによ
り入力指示を行う。実行不可の場合は指定領域(インタ
ーフェイス領域)を解放して処理を終了する。実行可の
場合はステップS7でCPU3は格納装置6に格納され
ている認識辞書ファイルから認識辞書データをワークメ
モリ5にロードし(ブロック34)、ステップ8でロー
ドエラーの有無をチェックした後にステップS9で表示
装置7のレイアウト解析画面を認識画面に切換えステッ
プS10に移行する。例えば、図12の領域F1の行K
1の部分を反転表示する。
【0037】ステップS10ではCPU3は未認識の領
域があるか否かを判定する。未認識の領域がある場合は
ステップ11に移行し、未認識の領域がない場合はステ
ップS17に移行してワークエリア中の認識辞書データ
を解放しステップS18で指定領域を解放して次のブロ
ックに移る。
域があるか否かを判定する。未認識の領域がある場合は
ステップ11に移行し、未認識の領域がない場合はステ
ップS17に移行してワークエリア中の認識辞書データ
を解放しステップS18で指定領域を解放して次のブロ
ックに移る。
【0038】ステップS11ではCPU3は認識処理を
続行するか否かの判定を行い続行しない場合にはステッ
プS17に移行してワークエリア中の認識辞書データを
解放しステップS18で指定領域を解放して次のブロッ
クに移る。ステップS12ではCPU3は認識対象のイ
メージ行を表示装置7に表示する。ステップS13では
CPUはレイアウト結果を基に図6のフローチャートに
基づく文字認識手段を実行して文字認識を行う。具体例
として図13の領域F1の行K1の部分の文字認識につ
いて図6を基に説明する。
続行するか否かの判定を行い続行しない場合にはステッ
プS17に移行してワークエリア中の認識辞書データを
解放しステップS18で指定領域を解放して次のブロッ
クに移る。ステップS12ではCPU3は認識対象のイ
メージ行を表示装置7に表示する。ステップS13では
CPUはレイアウト結果を基に図6のフローチャートに
基づく文字認識手段を実行して文字認識を行う。具体例
として図13の領域F1の行K1の部分の文字認識につ
いて図6を基に説明する。
【0039】ステップS131でCPUは行L1から文
字を切り出し文字数(この例では1ステップS131で
CPUは行L1から文字を切り出し文字数(この例では
10個;図13では4個目以降は具体的文字の表示を説
明上省略(スペース)表示してある)、文字座標C1
(C1X1,C1Y1),C2(C2X1,C2Y
1),C2(C2X1,C2Y1),……C10(C1
0X1,C10Y1)、及び文字の形(全角;10字
分)をワークメモリ5に記憶する。
字を切り出し文字数(この例では1ステップS131で
CPUは行L1から文字を切り出し文字数(この例では
10個;図13では4個目以降は具体的文字の表示を説
明上省略(スペース)表示してある)、文字座標C1
(C1X1,C1Y1),C2(C2X1,C2Y
1),C2(C2X1,C2Y1),……C10(C1
0X1,C10Y1)、及び文字の形(全角;10字
分)をワークメモリ5に記憶する。
【0040】次に、ステップS132で文字座標C1か
ら順に1文字ずつC10まで前処理(大きさの正規化、
位置の正規化、ノイズ除去、ドット欠落の修正)を、ス
テップS133で1文字の認識(前処理したイメージデ
ータから特徴量を抽出し、認識辞書と比較)を行い文字
コードと認識精度を得る。
ら順に1文字ずつC10まで前処理(大きさの正規化、
位置の正規化、ノイズ除去、ドット欠落の修正)を、ス
テップS133で1文字の認識(前処理したイメージデ
ータから特徴量を抽出し、認識辞書と比較)を行い文字
コードと認識精度を得る。
【0041】ステップS134では認識結果が所定の閾
値外の場合に認識結果をリジェクトしステップS131
で次の行(L2)の認識処理に移行する。リジェクトさ
れた文字座標は例えば、“黒塗りの四角文字”としてコ
ード化される。
値外の場合に認識結果をリジェクトしステップS131
で次の行(L2)の認識処理に移行する。リジェクトさ
れた文字座標は例えば、“黒塗りの四角文字”としてコ
ード化される。
【0042】ステップS132では原稿行(L1)に未
認識文字がある場合はステップS132に戻り次の文字
の認識処理(前処理、文字認識)を繰り返す。文字フィ
ールド1行(具体例では行L1)について図6の文字認
識が終わると図4のステップS14でCPU3は認識エ
ラーの有無を判定し認識エラーがない場合はステップS
15に移り図7のフローチャートに示すようなデータ変
換手段を実行してデータ変換処理を行う。なお、図17
は認識結果の例(原稿110を例とする文字コード、文
字座標)である。認識結果は図17に示すようなフォー
マットでワークメモリ5に保存されている。
認識文字がある場合はステップS132に戻り次の文字
の認識処理(前処理、文字認識)を繰り返す。文字フィ
ールド1行(具体例では行L1)について図6の文字認
識が終わると図4のステップS14でCPU3は認識エ
ラーの有無を判定し認識エラーがない場合はステップS
15に移り図7のフローチャートに示すようなデータ変
換手段を実行してデータ変換処理を行う。なお、図17
は認識結果の例(原稿110を例とする文字コード、文
字座標)である。認識結果は図17に示すようなフォー
マットでワークメモリ5に保存されている。
【0043】データ変換処理は図7のステップS151
でステップS3のレイアウト解析結果とステップS13
の文字認識の結果を突き合わせ、ステップS152,S
153で文書編集装置(図示せず)で編集可能なデータ
(文書編集装置編集データ、図18参照)に変換する。
変換された文書編集装置編集データは認識データファイ
ルに認識データとして格納すると共に表示装置7にその
認識データを表示する。
でステップS3のレイアウト解析結果とステップS13
の文字認識の結果を突き合わせ、ステップS152,S
153で文書編集装置(図示せず)で編集可能なデータ
(文書編集装置編集データ、図18参照)に変換する。
変換された文書編集装置編集データは認識データファイ
ルに認識データとして格納すると共に表示装置7にその
認識データを表示する。
【0044】具体的には、罫線座標については罫線情報
を作成し、行座標については行フィールドの算出、改行
コードの付加を行い、文字座標については文字制御コー
ド(文字ポイント)、文字ピッチの算出及びピッチコー
ドの付加、スペースコードの付加等を行う。なお、文字
ポイントの算出は文字座標から大きさを算出することで
行う。
を作成し、行座標については行フィールドの算出、改行
コードの付加を行い、文字座標については文字制御コー
ド(文字ポイント)、文字ピッチの算出及びピッチコー
ドの付加、スペースコードの付加等を行う。なお、文字
ポイントの算出は文字座標から大きさを算出することで
行う。
【0045】認識データは図18に示すように基本的に
は文書データのテキスト情報(下記参照)とグラフィッ
ク罫線情報(下記参照)からなる簡単な構造を有してい
る。 (1)テキスト情報 文字データ長 文字ピッチ 行フィールド 制御コード、文字コード…(組として繰り返す) (2)罫線情報 罫線データ長 罫線種、頁、罫線コード、開始座標(X,Y)、終了座
標(X,Y)…(組として繰り返す)
は文書データのテキスト情報(下記参照)とグラフィッ
ク罫線情報(下記参照)からなる簡単な構造を有してい
る。 (1)テキスト情報 文字データ長 文字ピッチ 行フィールド 制御コード、文字コード…(組として繰り返す) (2)罫線情報 罫線データ長 罫線種、頁、罫線コード、開始座標(X,Y)、終了座
標(X,Y)…(組として繰り返す)
【0046】ステップS15で認識文字を表示させる場
合は、行は認識行座標のy座標を使用し桁は認識文字座
標のX座標を使用する。認識文字座標は図10(a)の
下段のように、文字のレイアウト結果の密接矩形の座標
をななめ補正して文字認識したものであり、上記認識文
字座標(図10(a)参照)をそのまま認識結果の表示
座標として用いるとY座標が文字毎に異なることとな
り、行がバラバラになる可能性があるのでCPU3は行
毎に全ての認識文字座標がそのの収まる矩形を算出し、
それを認識行座標とする。
合は、行は認識行座標のy座標を使用し桁は認識文字座
標のX座標を使用する。認識文字座標は図10(a)の
下段のように、文字のレイアウト結果の密接矩形の座標
をななめ補正して文字認識したものであり、上記認識文
字座標(図10(a)参照)をそのまま認識結果の表示
座標として用いるとY座標が文字毎に異なることとな
り、行がバラバラになる可能性があるのでCPU3は行
毎に全ての認識文字座標がそのの収まる矩形を算出し、
それを認識行座標とする。
【0047】CPU3は1行分のデータ変換、認識デー
タの格納、及び表示が終わるとステップS16で次の行
を処理するためステップS11〜S15を繰り返す。な
お、具体例で文字領域F1のデータ変換が終了すると表
(罫線)領域F2の処理に移るがこの場合は表内に文字
列がないので文字認識(S13,S14)をすることな
くレイアウト結果のみに基づきステップS15で罫線情
報を作成し、認識データファイルに認識データ(文書編
集装置編集データ:図18参照)として格納する。読み
取った原稿の全ての指定領域の処理が終了するとステッ
プS17で認識辞書を解放し、ステップS18で指定領
域の解放を行って次のブロックの処理に移行する。
タの格納、及び表示が終わるとステップS16で次の行
を処理するためステップS11〜S15を繰り返す。な
お、具体例で文字領域F1のデータ変換が終了すると表
(罫線)領域F2の処理に移るがこの場合は表内に文字
列がないので文字認識(S13,S14)をすることな
くレイアウト結果のみに基づきステップS15で罫線情
報を作成し、認識データファイルに認識データ(文書編
集装置編集データ:図18参照)として格納する。読み
取った原稿の全ての指定領域の処理が終了するとステッ
プS17で認識辞書を解放し、ステップS18で指定領
域の解放を行って次のブロックの処理に移行する。
【0048】なお、図3でブロック33の認識処理の終
了後、認識データ(文書編集装置編集データ)を表示装
置7に逐次表示し(図14の表示例参照)、図1の文字
認識装置では引き続いて修正処理(リジェクト文字の変
更或いは削除、文字の追加等)、を行うが、図2の文字
認識装置では次の原稿の読取りのためにブロック31に
戻りブロック31〜33の処理を繰り返す(修正は全て
の原稿の読取り及び認識データの格納終了後、一括して
別途行う)ことができる。また、図2の一括処理(バッ
チ処理)の場合はブロック31で読み取ったイメージデ
ータを格納装置に格納する。
了後、認識データ(文書編集装置編集データ)を表示装
置7に逐次表示し(図14の表示例参照)、図1の文字
認識装置では引き続いて修正処理(リジェクト文字の変
更或いは削除、文字の追加等)、を行うが、図2の文字
認識装置では次の原稿の読取りのためにブロック31に
戻りブロック31〜33の処理を繰り返す(修正は全て
の原稿の読取り及び認識データの格納終了後、一括して
別途行う)ことができる。また、図2の一括処理(バッ
チ処理)の場合はブロック31で読み取ったイメージデ
ータを格納装置に格納する。
【0049】以上説明したように第1の発明の文字認識
装置によれば、ワードプロセッサ等の文書編集装置で編
集可能な認識データ(文書編集装置編集データ)に変換
された認識データを得ることができるので、読み取った
書式のままのレイアウト再現(罫線、文字の大きさ、文
字のピッチ等の再現)が可能となる。また、第2の発明
の文字認識装置によれば、認識データの修正をワードプ
ロセッサ等の文書編集装置で別途修正できる。
装置によれば、ワードプロセッサ等の文書編集装置で編
集可能な認識データ(文書編集装置編集データ)に変換
された認識データを得ることができるので、読み取った
書式のままのレイアウト再現(罫線、文字の大きさ、文
字のピッチ等の再現)が可能となる。また、第2の発明
の文字認識装置によれば、認識データの修正をワードプ
ロセッサ等の文書編集装置で別途修正できる。
【0050】
【発明の効果】以上説明したように第1の発明の文字認
識装置によれば、ワードプロセッサ等の文書編集装置で
編集可能なデータ(文書編集装置編集データ)に変換さ
れた認識データを得ることができるので、読み取った書
式のままのレイアウト再現(罫線、文字の大きさ、文字
のピッチ等の再現)が可能となる。したがって、従来の
ように罫線を付加したり、文字の大きさを再編集するた
めの編集作業が不要となる。また、第2の発明の文字認
識装置によれば、認識データの修正をワードプロセッサ
等の文書編集装置で別途修正できるので、大量の文書
(例えば、図書)等のデータベース化などの場合に修正
作業を複数人に分散でき、作業期間の短縮に寄与し得
る。
識装置によれば、ワードプロセッサ等の文書編集装置で
編集可能なデータ(文書編集装置編集データ)に変換さ
れた認識データを得ることができるので、読み取った書
式のままのレイアウト再現(罫線、文字の大きさ、文字
のピッチ等の再現)が可能となる。したがって、従来の
ように罫線を付加したり、文字の大きさを再編集するた
めの編集作業が不要となる。また、第2の発明の文字認
識装置によれば、認識データの修正をワードプロセッサ
等の文書編集装置で別途修正できるので、大量の文書
(例えば、図書)等のデータベース化などの場合に修正
作業を複数人に分散でき、作業期間の短縮に寄与し得
る。
【図1】本発明の文字認識装置の一実施例の構成図であ
る。
る。
【図2】本発明の文字認識装置の他の実施例の構成図で
ある。
ある。
【図3】文字読取り装置の動作ブロック図である。
【図4】本発明の文字認識装置の認識動作を示すフロー
チャートである。
チャートである。
【図5】図4のレイアウト解析の詳細フローチャートで
ある。
ある。
【図6】図4の文字認識の詳細フローチャートである。
【図7】図4のデータ変換の詳細フローチャートであ
る。
る。
【図8】文字の傾き補正の説明図である。
【図9】原稿の傾き補正の説明図である。
【図10】認識文字座標及び認識行座標の説明図であ
る。
る。
【図11】読み取る原稿の例である。
【図12】領域指定の例である。
【図13】レイアウト解析結果の表示例である。
【図14】文書編集装置編集データの表示例である。
【図15】レイアウト解析情報の例である。
【図16】レイアウト解析結果の例である。
【図17】認識結果の例である。
【図18】データ変換された文書編集装置編集データの
例である。
例である。
1 イメージスキャナ 2 イメージメモリ 3 CPU 4 格納装置 5 ワークメモリ 6 認識辞書ファイル 7 表示装置 8 入力装置
Claims (6)
- 【請求項1】 記入或いは印字された文字および/また
は罫線からなる表を含む文書を読み取ってイメージデー
タとして出力するイメージリーダーと、イメージデータ
を記憶するイメージメモリと、認識処理手段による認識
処理を実行する処理装置と、文字認識に用いる認識辞書
データを格納する認識辞書データ格納装置と、前記認識
処理により得た認識データを格納する格納装置と、操作
情報を入力する入力装置と、を有する文字認識装置にお
いて、 前記認識処理手段が、 前記イメージデータの領域を前記入力装置により指定す
る領域指定手段と、 前記領域指定手段により指定された指定領域ごとに当該
指定領域のレイアウトを解析してレイアウト解析結果を
得るレイアウト解析手段と、 前記領域指定手段により指定された指定領域の中の文字
フィールドの文字列を前記認識辞書データに基づいて文
字認識して文字認識結果を得る文字認識手段と、 前記文字認識結果と前記レイアウト解析結果を合成して
書式情報を付加し、書式文書として認識データを作成す
るデータ変換手段と、 を有することを特徴とする文字認識装置。 - 【請求項2】 請求項1記載の文字認識装置において、
レイアウト解析手段が、 指定領域のフィールド種別を判別するフィールド種別判
別手段と、 上記フィールド種別が罫線または表フィールドのとき、
罫線を切り出す罫線切り出し手段と、 上記フィールド種別が文字列を含む表フィールドのと
き、該表フィールドから文字列を切り出す第1の文字列
切り出し手段と、 上記フィールド種別が文字フィールドのとき、該文字フ
ィールドから文字列を切り出す第2の文字列切り出し手
段と、 を有することを特徴とする文字認識装置。 - 【請求項3】 請求項1記載の文字認識装置において、
レイアウト解析手段が、 文字または文書全体の傾きを検出する傾き検出手段と、 指定領域のフィールド種別を判別するフィールド種別判
別手段と、 上記フィールド種別が表フィールドのとき、罫線を切り
出す罫線切り出し手段と、 上記フィールド種別が文字列を含む表フィールドのと
き、該表フィールドから文字列を切り出し、該文字列か
ら1行分毎の文字列を切り出す第1の文字列切り出し手
段と、 上記フィールド種別が文字フィールドのとき、該文字フ
ィールドから文字列を切り出し、該文字フィールドから
1行分毎の文字列を切り出す第2の文字列切り出し手段
と、 文字列1行毎に傾きを補正する傾き補正手段と、 を有することを特徴とする文字認識装置。 - 【請求項4】 請求項1記載の文字認識装置において、
書式文書として編集可能な認識データが、 a.罫線データ長と、少なくとも、罫線種別コード、開
始座標、及び終了座標とからなる個別罫線情報の組の繰
返しからなる罫線情報と、 b.文字データ長、文字ピッチ、行間隔を示すコード
と、少なくとも、制御コード及び文字コードの組の繰返
しからなる文字情報と、 を含むことを特徴とする文字認識装置。 - 【請求項5】 請求項1ないし4のいずれか1項記載の
文字認識装置において、更に、認識データを格納装置に
格納する認識データ格納手段を有することを特徴とする
文字認識装置。 - 【請求項6】 請求項1ないし4のいずれか1項記載の
文字認識装置において、更に、認識データを格納装置に
格納する認識データ格納手段と、イメージデータを格納
装置に格納するイメージデータ格納手段を有することを
特徴とする文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5252268A JPH0785215A (ja) | 1993-09-14 | 1993-09-14 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5252268A JPH0785215A (ja) | 1993-09-14 | 1993-09-14 | 文字認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0785215A true JPH0785215A (ja) | 1995-03-31 |
Family
ID=17234882
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5252268A Pending JPH0785215A (ja) | 1993-09-14 | 1993-09-14 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0785215A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008080621A (ja) * | 2006-09-27 | 2008-04-10 | Oki Data Corp | 印刷システム及び複合端末装置 |
| US7865353B2 (en) | 2005-03-22 | 2011-01-04 | Fuji Xerox Co., Ltd. | Translation device, image processing device, translation method, and recording medium |
| US9679217B2 (en) | 2014-08-26 | 2017-06-13 | Kabushiki Kaisha Toshiba | Information processing apparatus, information processing system, information processing method and storage medium |
| US9819860B2 (en) | 2015-03-09 | 2017-11-14 | Kabushiki Kaisha Toshiba | Data processor, data processing method and storage medium |
| US10121086B2 (en) | 2015-07-14 | 2018-11-06 | Kabushiki Kaisha Toshiba | Information processing apparatus and information processing method |
| CN110889311A (zh) * | 2018-09-07 | 2020-03-17 | 上海怀若智能科技有限公司 | 金融电子传真文档识别系统及方法 |
-
1993
- 1993-09-14 JP JP5252268A patent/JPH0785215A/ja active Pending
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7865353B2 (en) | 2005-03-22 | 2011-01-04 | Fuji Xerox Co., Ltd. | Translation device, image processing device, translation method, and recording medium |
| JP2008080621A (ja) * | 2006-09-27 | 2008-04-10 | Oki Data Corp | 印刷システム及び複合端末装置 |
| US9679217B2 (en) | 2014-08-26 | 2017-06-13 | Kabushiki Kaisha Toshiba | Information processing apparatus, information processing system, information processing method and storage medium |
| US9819860B2 (en) | 2015-03-09 | 2017-11-14 | Kabushiki Kaisha Toshiba | Data processor, data processing method and storage medium |
| US10121086B2 (en) | 2015-07-14 | 2018-11-06 | Kabushiki Kaisha Toshiba | Information processing apparatus and information processing method |
| CN110889311A (zh) * | 2018-09-07 | 2020-03-17 | 上海怀若智能科技有限公司 | 金融电子传真文档识别系统及方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6466694B2 (en) | Document image processing device and method thereof | |
| US6466954B1 (en) | Method of analyzing a layout structure of an image using character recognition, and displaying or modifying the layout | |
| US6208744B1 (en) | Document image processor and method for setting a document format conforming to a document image | |
| JPS63155386A (ja) | 帳票デ−タ読取装置 | |
| JPH0785215A (ja) | 文字認識装置 | |
| JPS60164863A (ja) | ワードプロセッサの手書き入力データ処理方法 | |
| JP7844982B2 (ja) | 情報処理装置及び情報処理プログラム | |
| JPH09282309A (ja) | 文書編集校正処理装置 | |
| JPH0991371A (ja) | 文字表示装置 | |
| JPH06251187A (ja) | 文字認識誤り修正方法及び装置 | |
| JPH08194703A (ja) | 文書イメージ処理装置 | |
| JPH08202856A (ja) | 画像処理方法 | |
| JP2011186945A (ja) | 画像処理装置、画像処理方法及びプログラム | |
| JP2698345B2 (ja) | 文書処理方法 | |
| JP2986505B2 (ja) | 文書作成支援における自動採番処理方式 | |
| JP2578748B2 (ja) | 手書情報処理方法 | |
| JP2003099709A (ja) | 誤読文字修正方法及び光学的文字認識装置 | |
| WO2024018553A1 (ja) | 被翻訳データ作成装置、被翻訳データ作成方法、及び被翻訳データ作成プログラム | |
| JP3347322B2 (ja) | 文書処理装置及び前記装置における文書処理方法 | |
| JPS61198376A (ja) | 光学的文字読取装置 | |
| JPH0459668B2 (ja) | ||
| JPH096899A (ja) | 画像処理装置及び方法 | |
| JPH09190494A (ja) | 画像処理方法及びその装置 | |
| JPH1055405A (ja) | 住所録読み取り装置及び住所録読み取り方法 | |
| JPH0561856A (ja) | 文書作成装置 |