JPH0785215A

JPH0785215A - 文字認識装置

Info

Publication number: JPH0785215A
Application number: JP5252268A
Authority: JP
Inventors: Kazumasa Nakazawa; 一政中澤; Hideo Wakabayashi; 英夫若林
Original assignee: Japan Digital Laboratory Co Ltd
Current assignee: Japan Digital Laboratory Co Ltd
Priority date: 1993-09-14
Filing date: 1993-09-14
Publication date: 1995-03-31

Abstract

(57)【要約】【目的】原稿読取りの際に文字と一緒に文字の位置や
サイズ及び罫線を切り出し、文字編集装置等で利用でき
るデータに変換することにより、読取り原稿そのままの
書式イメージを再現し得る文字認識装置の提供。【構成】文字認識装置は原稿をイメージスキャナ１で
読取りイメージデータとしてイメージメモリ２に記憶す
る。ＣＰＵ３は操作者による領域指定がなされた後に認
識処理としてレイアウト解析、文字認識、及びデータ変
換を行う。レイアウト解析は指定領域が文字フィールド
か表フィールドかの判別を行う。表フィールドの場合に
は表罫線（座標）の切り出しを行う。文字フィールドの
場合は文字列を抽出し、文字フィールドを１行毎に切り
出し傾き補正をする（表フィールド中に文字列がある場
合も同様）。文字認識は、格納装置から認識辞書データ
をワークメモリ５にロードし、指定領域の文字認識を行
う。データ変換処理はレイアウト解析結果と文字認識の
結果を突き合わせ、文書編集装置で編集可能なデータに
変換し認識データファイルに認識データとして格納す
る。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は文字認識装置に関する。

【０００２】

【従来の技術】従来の文字認識装置は、活字文書や手書
き文書の指定された範囲の文字部分を切り出して１文字
のドットイメージで読取り、その読み取ったデータを解
析してから文字認識用の辞書から適切な文字を探し出
し、その文字を自動的に文字コード（テキストデータ）
に変換していた。

【０００３】

【発明が解決しようとする課題】上述したような従来技
術においてはコード変換されたデータを文字編集装置
（或いは、コード変換された文字コード（データ）を当
該文字認識装置の編集機能（以下、文字編集装置等と記
す）で修正・追加等の編集操作をするため文字編集装置
等）で呼び出した場合に、文字データのみが表示され読
取り原稿のイメージ（文字の位置やサイズ、或いは罫線
や表）を再現することができないため再度修正や編集を
し直さなければならないという問題点があった。

【０００４】即ち、従来の文字認識装置では、文書の文
字コードのみの変換を行っており書式レイアウトの再現
（文字のサイズ、文字の位置、罫線）ができなかった。
そこで、従来は書式レイアウトの再現には文字コード変
換後のデータ（認識データ）をワープロなどで編集し
て、文字の大きさや行ピッチ及び罫線等の書式等を再現
することを必要としていた。

【０００５】本発明は上記問題点に鑑みてなされたもの
であり、原稿読取りの際に文字と一緒に文字の位置やサ
イズ及び罫線、或いは表を切り出し、データとして読み
込み文字編集装置等で利用できるデータ（文書編集装置
編集データ）に変換して文字編集装置等で呼び出した場
合、読取り原稿そのままの書式イメージを再現すること
により再度の修正や編集（文字の位置合わせやサイズ変
更・罫線（表）の入力）を必要とない文字認識装置を提
供することを目的とする。

【０００６】

【課題を解決するための手段】上記の目的を達成するた
めに第１の発明の文字認識装置は、記入或いは印字され
た文字および／または罫線からなる表を含む文書を読み
取ってイメージデータとして出力するイメージリーダー
と、イメージデータを記憶するイメージメモリと、認識
処理手段による認識処理を実行する処理装置と、文字認
識に用いる認識辞書データを格納する認識辞書データ格
納装置と、前記認識処理により得た認識データを格納す
る格納装置と、操作情報を入力する入力装置と、を有す
る文字認識装置において、認識処理手段が、イメージデ
ータの領域を入力装置により指定する領域指定手段と、
領域指定手段により指定された指定領域ごとに当該指定
領域のレイアウトを解析してレイアウト解析結果を得る
レイアウト解析手段と、領域指定手段により指定された
指定領域の中の文字フィールドの文字列を認識辞書デー
タに基づいて文字認識して文字認識結果を得る文字認識
手段と、文字認識結果とレイアウト解析結果を合成して
書式情報を付加し、書式文書として認識データを作成す
るデータ変換手段と、を有することを特徴とする。

【０００７】第２の発明は上記第１の発明の文字認識装
置において、レイアウト解析手段が、指定領域のフィー
ルド種別を判別するフィールド種別判別手段と、上記フ
ィールド種別が罫線または表フィールドのとき、罫線を
切り出す罫線切り出し手段と、上記フィールド種別が文
字列を含む表フィールドのとき、該表フィールドから文
字列を切り出す第１の文字列切り出し手段と、上記フィ
ールド種別が文字フィールドのとき、該文字フィールド
から文字列を切り出す第２の文字列切り出し手段と、を
有することを特徴とする。

【０００８】第３の発明は上記第１の発明の文字認識装
置において、レイアウト解析手段が、文字または文書全
体の傾きを検出する傾き検出手段と、指定領域のフィー
ルド種別を判別するフィールド種別判別手段と、上記フ
ィールド種別が表フィールドのとき、罫線を切り出す罫
線切り出し手段と、上記フィールド種別が文字列を含む
表フィールドのとき、該表フィールドから文字列を切り
出し、該文字列から１行分毎の文字列を切り出す第１の
文字列切り出し手段と、上記フィールド種別が文字フィ
ールドのとき、該文字フィールドから文字列を切り出
し、該文字フィールドから１行分毎の文字列を切り出す
第２の文字列切り出し手段と、文字列１行毎に傾きを補
正する傾き補正手段と、を有することを特徴とする。

【０００９】第４の発明は上記第１の発明の文字認識装
置において、書式文書として編集可能な認識データが、ａ．罫線データ長と、少なくとも、罫線種別コード、開
始座標、及び終了座標とからなる個別罫線情報の組の繰
返しからなる罫線情報と、ｂ．文字データ長、文字ピッチ、行間隔を示すコード
と、少なくとも、制御コード及び文字コードの組の繰返
しからなる文字情報と、を含むことを特徴とする。

【００１０】第５の発明は上記第１ないし第４の発明の
文字認識装置において、更に、認識データを格納装置に
格納する認識データ格納手段を有することを特徴とす
る。

【００１１】第６の発明は上記第１ないし第４の発明の
文字認識装置において、更に、認識データを格納装置に
格納する認識データ格納手段と、イメージデータを格納
装置に格納するイメージデータ格納手段を有することを
特徴とする。

【００１２】

【作用】上記構成により第１の発明の文字認識装置は、
認識処理手段が、領域指定手段により入力装置でイメー
ジデータの領域を指定し、レイアウト解析手段により領
域指定手段で指定された指定領域ごとに当該指定領域の
レイアウトを解析してレイアウト解析結果を得て、文字
認識手段により領域指定手段により指定された指定領域
の中の文字フィールドの文字列を認識辞書データに基づ
いて文字認識して文字認識結果を得て、データ変換手段
により文字認識結果とレイアウト解析結果を合成して書
式情報を付加し、書式文書として認識データを作成す
る。

【００１３】第２の発明は上記第１の発明の文字認識装
置において、レイアウト解析手段が、フィールド種別判
別手段により指定領域のフィールド種別を判別し、フィ
ールド種別に基づいてデータ列の切り出しを行う。この
場合フィールド種別が表フィールドのときは罫線切り出
し手段により罫線を切り出し、文字列を含む表フィール
ドのときは第１の文字列切り出し手段によりその表フィ
ールドから文字列を切り出し、フィールド種別が文字フ
ィールドのときは第２の文字列切り出し手段によりその
文字フィールドから文字列を切り出す。

【００１４】第３の発明は上記第１の発明の文字認識装
置において、レイアウト解析手段が、傾き検出手段によ
り文字または文書全体の傾きを検出し、フィールド種別
判別手段により指定領域のフィールド種別を判別する。
そして、フィールド種別が表フィールドのときは罫線を
切り出し手段により罫線を切り出し、文字列を含む表フ
ィールドのときは第１の文字列切り出し手段によりその
表フィールドから文字列を切り出した後、その文字列か
ら１行分毎の文字列を切り出し、文字フィールドのとき
は第２の文字列切り出し手段によりその文字フィールド
から文字列を切り出した後、その文字フィールドから１
行分毎の文字列を切り出す。更に、傾き補正手段により
文字列１行毎に文字の傾きを補正する。

【００１５】第４の発明は上記第１の発明の文字認識装
置において、データ変換手段レイアウト解析結果と認識
結果に基づいて、ａ．罫線データ長と、少なくとも、罫線種別コード、開
始座標、及び終了座標とからなる個別罫線情報の組の繰
返しからなる罫線情報と、ｂ．文字データ長、文字ピッチ、行間隔を示すコード
と、少なくとも、制御コード及び文字コードの組の繰返
しからなる文字情報と、を含む、書式文書として編集可能な認識データを作成す
る。

【００１６】第５の発明は上記第１ないし第４の発明の
文字認識装置において、更に、認識データ格納手段によ
り認識データを格納装置に格納する。

【００１７】第６の発明は上記第１ないし第４の発明の
文字認識装置において、更に、認識データ格納手段によ
り認識データを、イメージデータ格納手段によりイメー
ジデータを格納装置に格納する。

【００１８】

【実施例】図１は、本発明の文字認識装置の一実施例の
構成図であり、図２は本発明の文字認識装置の他の実施
例の構成図である。図２の装置は文字（及び書式）原稿
を連続的に読み取って認識データを保管装置に保管し、
読取り処理終了後に一括して文字編集装置等（図示せ
ず）で修正するパッチ処理を行う機能を有する。

【００１９】図１及び図２で、１は活字原稿或いは手書
き原稿の文字を読み取るイメージスキャナ（画像読取り
装置）、２はイメージスキャナで読み取ったイメージデ
ータを一時的に保存（記憶）するイメージメモリ、３は
文字認識装置の動作の制御及び後述する認識処理手段に
よる認識処理の実行等を行うＣＰＵ（中央演算装置）、
４は認識処理により認識された認識データ及びイメージ
メモリ２からのイメージデータを格納する記憶（格納）
装置、５はＣＰＵ３による認識処理等において必要とす
る各処理手段（プログラム）、データ、辞書データ、あ
るいは設定値ないしパラメータ等を一時的に記憶するワ
ークメモリ（内部メモリ）、６はイメージリーダ１で読
み取った文字を認識するための認識辞書データからなる
認識辞書ファイルを格納した格納装置、７は文字認識装
置の操作に必要な操作コマンド、メニュー或いはアイコ
ン等の操作情報を表示する表示装置、８は文字認識装置
の操作に必要な操作情報を入力するキーボード、或いは
マウス等のポインティングデバイスを有する入力装置で
ある。

【００２０】また、図２で、９は出力装置（プリンタ或
いは認識データを格納する磁気ディスク）である。な
お、格納装置４と６は物理的に同じ装置でもよい。ま
た、実施例ではレイアウト解析手段、文字認識手段、デ
ータ変換手段等の認識処理手段はプログラム手段として
格納装置４に格納されており、文字認識装置の起動時に
読み出されワークメモリ５に装置が駆動の間保持され、
ＣＰＵ３により適時実行される。

【００２１】図３は文字読取り装置の動作ブロック図で
あり、図１１は読取り原稿の例である。以下、図３及び
図１１に従って本発明の文字読取り装置の動作について
説明する。なお、図１１では説明上、文章（文字群）１
１１と表１１２を原稿の上下に示してあるが、表１１２
の中に文字が書かれている場合も本発明を適用できる。

【００２２】設定ブロック３０では認識条件の設定を行
う。認識条件としては、例えば原稿の種類（例えば、ワ
ープロ印字、書籍（印刷文字）等の別）、文字方向の判
別条件（自動判別、手動等）、書式再現の可否、罫線再
現の可否、表内文字再現の可否等があり、これらの条件
は設定時に表示装置７に示され、操作者によりマウスで
指定され入力される。入力された各設定条件はＣＰＵ３
でチェックされた後にワークメモリ５の所定のアドレス
に記憶される。読取りブロック３１ではイメージスキャ
ナ１にセットされた原稿１１０（図１１参照）を読取り
バッファ（５４Ｋバイト）単位で読取りながらイメージ
メモリ２にイメージデータを描画し、同時にイメージデ
ータを原稿全体ごと表示装置７に表示する。

【００２３】次に、領域指定ブロック３２では領域指定
手段により画面上に表示された矩形の始点、終点の位置
を入力装置８のマウスで指定し入力する。図１２は図１
１の原稿１１０のイメージ表示であり領域指定を行った
例である。図１２では指定領域として２つの領域Ｆ１
（ＦＩＸ１，ＦＩＹ１）、Ｆ２（Ｆ２Ｘ１、Ｆ２Ｙ１）
が示されている。

【００２４】この場合、領域は領域指定を行った順に認
識される。なお、領域指定をしない場合は原稿全体が一
領域として指定されたことになる。認識ブロック３３で
は図４のフローチャートに基づいてレイアウト解析、文
字認識、データ変換等の処理が実行される。なお、図５
は図４のレイアウト解析（ステップＳ３）の詳細フロー
チャート、図６は図４の文字認識（ステップＳ１３）の
詳細フローチャート、図７は図４のデータ変換（ステッ
プＳ１５）の詳細フローチャートである。

【００２５】図４でステップＳ１，Ｓ２は上述した領域
指定ブロックによる領域確保の動作であり、説明を省略
する。ステップＳ３ではＣＰＵ３は図５に示すレイアウ
ト解析手段を実行して設定ブロック３０で設定されワー
クメモリ５に記憶されている各設定条件と領域設定ブロ
ック３２で指定された領域の座標を基にレイアウト（la
y-out）解析を行う。レイアウト解析は図５のフローチ
ャートに示すように最初にステップＳ３０の前処理で未
知データのうち黒点の集まっている領域を探し出し矩形
で囲む（内部的処理）。

【００２６】次に、ステップＳ３１で文字の傾きをチェ
ックする。±５°以上の場合は読取りやり直しとする。
文字の傾きは図８に示すように原稿の位置が正常であっ
て原稿内の文字そのものが傾いている場合と、図９に示
すように原稿の傾きに困るもの及び両者が組合わさった
ものがある。

【００２７】原稿が傾いている場合には図９（ａ）のよ
うに左上座標（ｘ１，ｙ１）、左下座標（ｘ２，ｙ２）
だけでは傾きの判定が難しいので、図９（ｂ）に示すよ
うに左下座標（ｘ１，ｙ４）、右上座標（ｘ２，ｙ３）
を用いて傾きを判定し全体として右下がりか左下がりか
を判定する。傾きチェックがＯＫの場合、図５のステッ
プＳ３２で読取り原稿の指定領域が文字フィールドか表
フィールドかの判別を行う。表フィールドが判別された
場合にはステップＳ３３〜Ｓ３５の処理を行った後にス
テップＳ３６に移り、表フィールドでない場合にはステ
ップＳ３６の処理に移る。表フィールドか否かの判定は
線分が所定の大きさより大きい（長い）場合に罫線の抽
出を行いその数が所定数を越える時に表と判定する。ま
た、罫線の抽出はラングレス（黒点の連絡長）による。

【００２８】ステップＳ３３では表の中に文字列があれ
ば、ステップＳ３４で周辺分布により文字列を抽出し、
文字フィールドを１行毎に切り出し傾き補正をする。文
字列がない場合にはステップＳ３５に移行する。

【００２９】図８は文字が傾いている場合の補正（なな
め補正）の場合であり、（ａ）は右下がりの場合を示
す。右下がりの場合には座標を正の方向（図中の矢印の
方向）に原点０を中心として回転移動（座標変換）して
ｘ，ｙ座標を補正する。また、右下がりの場合には座標
を負の方向（図中の矢印の方向）に原点０を中心として
回転移動してｘ，ｙ座標を補正する。原稿が傾いている
場合にも全体として右下がりか左下がりかを判定した後
に、例えば座標（ｘ１，ｙ１）を原点として回転移動し
てｘ，ｙ座標を変換する。

【００３０】ステップＳ３５では表罫線（座標）の切り
出しのみを行い、ステップＳ３６で罫線かどうか周辺分
布の平坦正及び外接矩形の縦横比で判定する。判定の結
果が罫線の場合はステップＳ３７で罫線の切り出しを行
いステップＳ３８に移行する。判定の結果罫線以外の場
合は直ちにステップＳ３８に移行する。

【００３１】ステップＳ３８では矩形の大きさにより文
字か否かを判定する。文字の場合はステップＳ３９で周
辺分布により文字列を抽出し、文字フィールドを１行毎
に切り出し傾き補正をしてステップＳ４０に移行する。
文字がない場合は図または写真の場合であり、レイアウ
ト解析を終了しステップＳ４に移行する（図４）。

【００３２】ステップＳ４０ではレイアウト解析が済ん
でいない指定領域の有無をチェックし、レイアウト解析
が済んでいない指定領域がある場合は次の指定領域の処
理を行うためにステップＳ３２〜Ｓ３９を繰り返す。指
定領域のレイアウト解析が全く済んでいる場合はレイア
ウト解析を終了しステップＳ４に移行する（図４）。レ
イアウト解析結果は図１８に示すようなフォーマットで
ワークメモリ５の所定の領域に保存される。なお、レイ
アウト解析結果の結果の行フィールドの座標はななめ補
正をしていない行座標（元のイメージに忠実な行座標）
である。

【００３３】ここで、ステップＳ３２〜Ｓ３９について
具体例として、図１１の原稿１１０の場合を例にとる
と、ステップＳ３２で領域Ｆ１が表フィールドかを判定
する。領域Ｆ１は表ではないのでステップＳ３６で罫線
かどうかを判定する。また、領域Ｆ１は罫線ではないの
でステップＳ３８で文字列か否かの判定を行う。領域Ｆ
１には文字列しか存在しないのでステップＳ３９で文字
フィールド１行毎の切り出し及び行毎の傾き補正を行
う。なお、図１６，１７に図１１の原稿１１０を例とす
るレイアウト解析結果等を示す。ここで、図１７はレイ
アウト解析情報（原稿１１０のイメージデータ）であ
り、図１６はレイアウト解析結果（原稿１１０の行座
標、罫線座標）である。

【００３４】Ｓ４０の指定領域存在判定の結果領域Ｆ２
がまだ未処理領域のためステップＳ３２に戻り領域Ｆ２
が表フィールドかを判定する。領域Ｆ２は表であるため
ステップＳ３３で表内に文字列があるか否かを判定す
る。この例の場合領域Ｆ２には文字がないと判定され、
ステップＳ３５で罫線座標の切り出しを行う。領域Ｆ２
の罫線座標は次のようになる。

【００３５】罫線１Ｋ１（Ｋ１Ｘ，Ｋ１Ｙ），Ｋ２（Ｋ２Ｘ，Ｋ２
Ｙ）罫線２Ｋ３（Ｋ３Ｘ，Ｋ３Ｙ），Ｋ４（Ｋ２Ｘ，Ｋ４
Ｙ）罫線３Ｋ１（Ｋ１Ｘ，Ｋ１Ｙ），Ｋ３（Ｋ３Ｘ，Ｋ３
Ｙ）罫線４Ｋ２（Ｋ１Ｘ，Ｋ１Ｙ），Ｋ４（Ｋ４Ｘ，Ｋ４
Ｙ）図４のステップＳ４でＣＰＵ３はレイアウト解析エラー
の有無を判定し、レイアウト解析エラーがある場合には
指定領域（インターフェイス領域）を解放して処理を終
了する（操作者はエラー表示によりブロック３２の領域
設定からやり直す）。レイアウト解析エラーがない場合
にはステップＳ５でＣＰＵ３は表示装置７の画面上に、
例えば、文字列を矩形で囲みレイアウト解析結果を表示
する（図１３）。

【００３６】次に、ステップＳ６〜Ｓ１４で文字の認識
処理を実行する。ステップＳ６ではＣＰＵ３は文字認識
処理実行の可否を問うメッセージを表示装置７に表示
し、操作者による支持入力を促す。操作者はマウスによ
り入力指示を行う。実行不可の場合は指定領域（インタ
ーフェイス領域）を解放して処理を終了する。実行可の
場合はステップＳ７でＣＰＵ３は格納装置６に格納され
ている認識辞書ファイルから認識辞書データをワークメ
モリ５にロードし（ブロック３４）、ステップ８でロー
ドエラーの有無をチェックした後にステップＳ９で表示
装置７のレイアウト解析画面を認識画面に切換えステッ
プＳ１０に移行する。例えば、図１２の領域Ｆ１の行Ｋ
１の部分を反転表示する。

【００３７】ステップＳ１０ではＣＰＵ３は未認識の領
域があるか否かを判定する。未認識の領域がある場合は
ステップ１１に移行し、未認識の領域がない場合はステ
ップＳ１７に移行してワークエリア中の認識辞書データ
を解放しステップＳ１８で指定領域を解放して次のブロ
ックに移る。

【００３８】ステップＳ１１ではＣＰＵ３は認識処理を
続行するか否かの判定を行い続行しない場合にはステッ
プＳ１７に移行してワークエリア中の認識辞書データを
解放しステップＳ１８で指定領域を解放して次のブロッ
クに移る。ステップＳ１２ではＣＰＵ３は認識対象のイ
メージ行を表示装置７に表示する。ステップＳ１３では
ＣＰＵはレイアウト結果を基に図６のフローチャートに
基づく文字認識手段を実行して文字認識を行う。具体例
として図１３の領域Ｆ１の行Ｋ１の部分の文字認識につ
いて図６を基に説明する。

【００３９】ステップＳ１３１でＣＰＵは行Ｌ１から文
字を切り出し文字数（この例では１ステップＳ１３１で
ＣＰＵは行Ｌ１から文字を切り出し文字数（この例では
１０個；図１３では４個目以降は具体的文字の表示を説
明上省略（スペース）表示してある）、文字座標Ｃ１
（Ｃ１Ｘ１，Ｃ１Ｙ１），Ｃ２（Ｃ２Ｘ１，Ｃ２Ｙ
１），Ｃ２（Ｃ２Ｘ１，Ｃ２Ｙ１），……Ｃ１０（Ｃ１
０Ｘ１，Ｃ１０Ｙ１）、及び文字の形（全角；１０字
分）をワークメモリ５に記憶する。

【００４０】次に、ステップＳ１３２で文字座標Ｃ１か
ら順に１文字ずつＣ１０まで前処理（大きさの正規化、
位置の正規化、ノイズ除去、ドット欠落の修正）を、ス
テップＳ１３３で１文字の認識（前処理したイメージデ
ータから特徴量を抽出し、認識辞書と比較）を行い文字
コードと認識精度を得る。

【００４１】ステップＳ１３４では認識結果が所定の閾
値外の場合に認識結果をリジェクトしステップＳ１３１
で次の行（Ｌ２）の認識処理に移行する。リジェクトさ
れた文字座標は例えば、“黒塗りの四角文字”としてコ
ード化される。

【００４２】ステップＳ１３２では原稿行（Ｌ１）に未
認識文字がある場合はステップＳ１３２に戻り次の文字
の認識処理（前処理、文字認識）を繰り返す。文字フィ
ールド１行（具体例では行Ｌ１）について図６の文字認
識が終わると図４のステップＳ１４でＣＰＵ３は認識エ
ラーの有無を判定し認識エラーがない場合はステップＳ
１５に移り図７のフローチャートに示すようなデータ変
換手段を実行してデータ変換処理を行う。なお、図１７
は認識結果の例（原稿１１０を例とする文字コード、文
字座標）である。認識結果は図１７に示すようなフォー
マットでワークメモリ５に保存されている。

【００４３】データ変換処理は図７のステップＳ１５１
でステップＳ３のレイアウト解析結果とステップＳ１３
の文字認識の結果を突き合わせ、ステップＳ１５２，Ｓ
１５３で文書編集装置（図示せず）で編集可能なデータ
（文書編集装置編集データ、図１８参照）に変換する。
変換された文書編集装置編集データは認識データファイ
ルに認識データとして格納すると共に表示装置７にその
認識データを表示する。

【００４４】具体的には、罫線座標については罫線情報
を作成し、行座標については行フィールドの算出、改行
コードの付加を行い、文字座標については文字制御コー
ド（文字ポイント）、文字ピッチの算出及びピッチコー
ドの付加、スペースコードの付加等を行う。なお、文字
ポイントの算出は文字座標から大きさを算出することで
行う。

【００４５】認識データは図１８に示すように基本的に
は文書データのテキスト情報（下記参照）とグラフィッ
ク罫線情報（下記参照）からなる簡単な構造を有してい
る。（１）テキスト情報文字データ長文字ピッチ行フィールド制御コード、文字コード…（組として繰り返す）（２）罫線情報罫線データ長罫線種、頁、罫線コード、開始座標（Ｘ，Ｙ）、終了座
標（Ｘ，Ｙ）…（組として繰り返す）

【００４６】ステップＳ１５で認識文字を表示させる場
合は、行は認識行座標のｙ座標を使用し桁は認識文字座
標のＸ座標を使用する。認識文字座標は図１０（ａ）の
下段のように、文字のレイアウト結果の密接矩形の座標
をななめ補正して文字認識したものであり、上記認識文
字座標（図１０（ａ）参照）をそのまま認識結果の表示
座標として用いるとＹ座標が文字毎に異なることとな
り、行がバラバラになる可能性があるのでＣＰＵ３は行
毎に全ての認識文字座標がそのの収まる矩形を算出し、
それを認識行座標とする。

【００４７】ＣＰＵ３は１行分のデータ変換、認識デー
タの格納、及び表示が終わるとステップＳ１６で次の行
を処理するためステップＳ１１〜Ｓ１５を繰り返す。な
お、具体例で文字領域Ｆ１のデータ変換が終了すると表
（罫線）領域Ｆ２の処理に移るがこの場合は表内に文字
列がないので文字認識（Ｓ１３，Ｓ１４）をすることな
くレイアウト結果のみに基づきステップＳ１５で罫線情
報を作成し、認識データファイルに認識データ（文書編
集装置編集データ：図１８参照）として格納する。読み
取った原稿の全ての指定領域の処理が終了するとステッ
プＳ１７で認識辞書を解放し、ステップＳ１８で指定領
域の解放を行って次のブロックの処理に移行する。

【００４８】なお、図３でブロック３３の認識処理の終
了後、認識データ（文書編集装置編集データ）を表示装
置７に逐次表示し（図１４の表示例参照）、図１の文字
認識装置では引き続いて修正処理（リジェクト文字の変
更或いは削除、文字の追加等）、を行うが、図２の文字
認識装置では次の原稿の読取りのためにブロック３１に
戻りブロック３１〜３３の処理を繰り返す（修正は全て
の原稿の読取り及び認識データの格納終了後、一括して
別途行う）ことができる。また、図２の一括処理（バッ
チ処理）の場合はブロック３１で読み取ったイメージデ
ータを格納装置に格納する。

【００４９】以上説明したように第１の発明の文字認識
装置によれば、ワードプロセッサ等の文書編集装置で編
集可能な認識データ（文書編集装置編集データ）に変換
された認識データを得ることができるので、読み取った
書式のままのレイアウト再現（罫線、文字の大きさ、文
字のピッチ等の再現）が可能となる。また、第２の発明
の文字認識装置によれば、認識データの修正をワードプ
ロセッサ等の文書編集装置で別途修正できる。

【００５０】

【発明の効果】以上説明したように第１の発明の文字認
識装置によれば、ワードプロセッサ等の文書編集装置で
編集可能なデータ（文書編集装置編集データ）に変換さ
れた認識データを得ることができるので、読み取った書
式のままのレイアウト再現（罫線、文字の大きさ、文字
のピッチ等の再現）が可能となる。したがって、従来の
ように罫線を付加したり、文字の大きさを再編集するた
めの編集作業が不要となる。また、第２の発明の文字認
識装置によれば、認識データの修正をワードプロセッサ
等の文書編集装置で別途修正できるので、大量の文書
（例えば、図書）等のデータベース化などの場合に修正
作業を複数人に分散でき、作業期間の短縮に寄与し得
る。

【図面の簡単な説明】

【図１】本発明の文字認識装置の一実施例の構成図であ
る。

【図２】本発明の文字認識装置の他の実施例の構成図で
ある。

【図３】文字読取り装置の動作ブロック図である。

【図４】本発明の文字認識装置の認識動作を示すフロー
チャートである。

【図５】図４のレイアウト解析の詳細フローチャートで
ある。

【図６】図４の文字認識の詳細フローチャートである。

【図７】図４のデータ変換の詳細フローチャートであ
る。

【図８】文字の傾き補正の説明図である。

【図９】原稿の傾き補正の説明図である。

【図１０】認識文字座標及び認識行座標の説明図であ
る。

【図１１】読み取る原稿の例である。

【図１２】領域指定の例である。

【図１３】レイアウト解析結果の表示例である。

【図１４】文書編集装置編集データの表示例である。

【図１５】レイアウト解析情報の例である。

【図１６】レイアウト解析結果の例である。

【図１７】認識結果の例である。

【図１８】データ変換された文書編集装置編集データの
例である。

【符号の説明】

１イメージスキャナ２イメージメモリ３ＣＰＵ４格納装置５ワークメモリ６認識辞書ファイル７表示装置８入力装置

Claims

【特許請求の範囲】

【請求項１】記入或いは印字された文字および／また
は罫線からなる表を含む文書を読み取ってイメージデー
タとして出力するイメージリーダーと、イメージデータ
を記憶するイメージメモリと、認識処理手段による認識
処理を実行する処理装置と、文字認識に用いる認識辞書
データを格納する認識辞書データ格納装置と、前記認識
処理により得た認識データを格納する格納装置と、操作
情報を入力する入力装置と、を有する文字認識装置にお
いて、前記認識処理手段が、前記イメージデータの領域を前記入力装置により指定す
る領域指定手段と、前記領域指定手段により指定された指定領域ごとに当該
指定領域のレイアウトを解析してレイアウト解析結果を
得るレイアウト解析手段と、前記領域指定手段により指定された指定領域の中の文字
フィールドの文字列を前記認識辞書データに基づいて文
字認識して文字認識結果を得る文字認識手段と、前記文字認識結果と前記レイアウト解析結果を合成して
書式情報を付加し、書式文書として認識データを作成す
るデータ変換手段と、を有することを特徴とする文字認識装置。
【請求項２】請求項１記載の文字認識装置において、
レイアウト解析手段が、指定領域のフィールド種別を判別するフィールド種別判
別手段と、上記フィールド種別が罫線または表フィールドのとき、
罫線を切り出す罫線切り出し手段と、上記フィールド種別が文字列を含む表フィールドのと
き、該表フィールドから文字列を切り出す第１の文字列
切り出し手段と、上記フィールド種別が文字フィールドのとき、該文字フ
ィールドから文字列を切り出す第２の文字列切り出し手
段と、を有することを特徴とする文字認識装置。
【請求項３】請求項１記載の文字認識装置において、
レイアウト解析手段が、文字または文書全体の傾きを検出する傾き検出手段と、指定領域のフィールド種別を判別するフィールド種別判
別手段と、上記フィールド種別が表フィールドのとき、罫線を切り
出す罫線切り出し手段と、上記フィールド種別が文字列を含む表フィールドのと
き、該表フィールドから文字列を切り出し、該文字列か
ら１行分毎の文字列を切り出す第１の文字列切り出し手
段と、上記フィールド種別が文字フィールドのとき、該文字フ
ィールドから文字列を切り出し、該文字フィールドから
１行分毎の文字列を切り出す第２の文字列切り出し手段
と、文字列１行毎に傾きを補正する傾き補正手段と、を有することを特徴とする文字認識装置。
【請求項４】請求項１記載の文字認識装置において、
書式文書として編集可能な認識データが、ａ．罫線データ長と、少なくとも、罫線種別コード、開
始座標、及び終了座標とからなる個別罫線情報の組の繰
返しからなる罫線情報と、ｂ．文字データ長、文字ピッチ、行間隔を示すコード
と、少なくとも、制御コード及び文字コードの組の繰返
しからなる文字情報と、を含むことを特徴とする文字認識装置。
【請求項５】請求項１ないし４のいずれか１項記載の
文字認識装置において、更に、認識データを格納装置に
格納する認識データ格納手段を有することを特徴とする
文字認識装置。
【請求項６】請求項１ないし４のいずれか１項記載の
文字認識装置において、更に、認識データを格納装置に
格納する認識データ格納手段と、イメージデータを格納
装置に格納するイメージデータ格納手段を有することを
特徴とする文字認識装置。