JPH06337960A - 表認識装置 - Google Patents

表認識装置

Info

Publication number
JPH06337960A
JPH06337960A JP5126559A JP12655993A JPH06337960A JP H06337960 A JPH06337960 A JP H06337960A JP 5126559 A JP5126559 A JP 5126559A JP 12655993 A JP12655993 A JP 12655993A JP H06337960 A JPH06337960 A JP H06337960A
Authority
JP
Japan
Prior art keywords
black
extracted
white inversion
cell
white
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5126559A
Other languages
English (en)
Inventor
Yujiro Kamimura
裕二郎 上村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5126559A priority Critical patent/JPH06337960A/ja
Publication of JPH06337960A publication Critical patent/JPH06337960A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】スキャナーから入力した表画像を基に、表構造
を認識することを目的とする。 【構成】画像入力部21から入力した表画像の縦、横2
方向のランのうち、一定長さ以上のものを連結すること
により、実線の罫線を抽出する。次に、抽出された罫線
の内、幅がしきい値以上のもので囲まれた部分を白黒反
転セル候補として白黒反転セル候補抽出部24で抽出す
る。抽出した白黒反転セル候補の内部の黒画素の密度が
50%よりも大きければ、その部分を白黒反転セル決定
部25で白黒反転セルと決定する。決定したセル内の画
素を画素反転部26で反転することにより、通常のセル
と同様の文字認識を行う。 【効果】白黒反転したセルを持った表を認識する場合、
白黒反転セルを先に抽出し、その内部の画素を反転する
ため、表の構造および内部の文字をよ正確に認識するこ
とができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、印刷された表を読み取
り、表構造および、セル内の文字を認識する表認識装置
に関する。
【0002】
【従来の技術】近年、表認識装置がコンピュータなどの
入力装置として利用されるようになってきた。文書の清
書システムとして表認識装置の利用を考慮すると、罫線
位置、線種、線幅およびセル内の文字を認識する必要が
ある。
【0003】以下に従来の表認識装置について説明す
る。図5は従来の表認識装置の機能ブロック図であり、
11はスキャナなどの入力装置などで文書画像を入力す
る画像入力部であり、入力された画像データは画像領域
12に格納される。画像データは実線ラン抽出部13で
走査して一定長さ以上の黒画素の並び(以下ランとい
う)が抽出され、またラン画像データは破線ラン抽出部
14で走査して特定パターンのランの並びが抽出され
る。前記実線ラン抽出部13および破線ラン抽出部14
で抽出されたランの連結性は表構造抽出部15で調べて
罫線を抽出し、抽出された罫線位置の相互関係を見るこ
とにより、セルを抽出する。前記セル内の文字は文字切
り出し部16で切り出され、サンプル文字は文字パター
ン辞書17で記憶される。そして各セル内の文字を文字
認識部18でサンプル文字と比較し、前もって決めた値
よりも近い類似度ならば、その文字として出力し、認識
した表の情報は表出力部19で出力されるようになって
いる。
【0004】
【発明が解決しようとする課題】しかしながら上記従来
の構成では、表の中に白黒反転のセルを持つ文書の場
合、上記実線ラン抽出部13において、白黒反転セル内
に無数の実線ランを抽出してしまい、表の構造が正確に
認識できないという問題点があった。
【0005】本発明は前記従来の問題に留意し、表の構
造が正確に認識できる表認識装置を提供することを目的
とする。
【0006】
【課題を解決するための手段】本発明は上記問題点を解
決するため、しきい値よりも幅が大きいランに囲まれた
部分を抽出する白黒反転セル候補抽出部と、白黒反転セ
ルかどうかを決定する白黒反転セル決定部と、白黒反転
セル内の白画素と黒画素を反転する画素反転部を備える
表認識装置の構成とする。
【0007】
【作用】本発明は上記した構成において、白黒反転セル
を抽出し、抽出したセル内の画素を反転することによ
り、中の文字も通常のセルと同様に認識することができ
る。したがって、白黒反転セルを持った表の構造および
中の文字認識が可能となる。
【0008】
【実施例】以下本発明の実施例を説明する。図1は本発
明の一実施例における表認識装置の機能ブロック図を示
すものである。図1において構成要素として21はスキ
ャナなどの入力装置などで文書画像を入力する画像入力
部、22は入力された画像データを格納する画像領域、
23は画像データを走査して一定長さ以上のランを抽出
する実線ラン抽出部、24は実線ラン抽出部23で抽出
されたランの内、幅がしきい値よりも大きいものに囲ま
れた部分を抽出する白黒反転セル候補抽出部、25は抽
出されたセル候補の内部の黒画素比を算出し、50%よ
り大きい場合はその部分を白黒反転セルと決定する白黒
反転セル決定部、26は白黒反転セル決定部25で抽出
された白黒反転セル内の内部の画素を反転する画素反転
部、27は画像データを走査して特定パターンのランの
並びを抽出する破線ラン抽出部、28は実線ラン抽出部
23で抽出された実線ランと白黒反転セル決定部25で
抽出された白黒反転セルと破線ラン抽出部27で抽出さ
れた破線ランの相互関係を見ることにより、表構造を抽
出する表構造を抽出する表構造抽出部、29は白黒反転
セル決定部25で反転されたセル内および表構造抽出部
28で抽出された通常のセル内の文字を切り出す文字切
り出し部、30はサンプル文字を記憶する文字パターン
辞書、31は各セル内の文字をサンプル文字と比較し、
前もって決めた値よりも近い類似度ならば、その文字と
して出力する文字認識部、32は認識した表の情報を出
力する表出力部である。
【0009】図2は本実施例の表認識装置の構成を示す
ブロック図である。図2において40は表画像を読み取
るスキャナで、読み取った表画像を読み取るスキャナ
で、読み取った表画像をイメージデータとして出力す
る。41はRAMで、スキャナ40からのイメージデー
タを記憶する画像メモリ領域42、イメージデータの
縦、横2方向の黒画素の並びを格納するラン領域43、
ランの並びから抽出した実線および破線を格納する罫線
領域44、表認識の結果得られる表の構造、セル内の文
字を格納する表データ領域45を有する。46はROM
で、文字認識に使用する辞書を記憶した特徴辞書領域4
7およびプログラム記憶領域48を有する。49はプロ
グラム記憶領域48に記憶された制御プログラムに従っ
て処理を行う処理回路である。50は認識指令を行うキ
ーボードであり、51は表データ領域45に記憶された
表を表示する表示部である。
【0010】以上の各構成要素よりなる本実施例の表認
識装置について以下その動作を図3のフローチャートを
用いて説明する。ステップs1では、スキャナから画像
を入力し、メモリに格納する。ステップs2では、入力
した画像の傾きを補正する。ステップs3では、画像の
縦、横2方向の黒画素の並びを抽出する。ステップs4
では、抽出したランの内、一定長さ以上のものを検索す
る。ステップs5では、s4で検索したランを連結し
て、罫線を抽出する。ステップs6では、白黒反転セル
を抽出する(このステップの詳細は後述する)。ステッ
プs7では、抽出した白黒反転セルの内部の画素を反転
する。ステップs8では、ステップs3で抽出したラン
の内、特定パターンで一定長さより長いものを検索す
る。ステップs9では、検索したランを連結して、破線
を抽出する。ステップs10では、ステップs5で抽出
した罫線の中で白黒反転セルに含まれないものと、ステ
ップs6で抽出した白黒反転セルと、ステップs9で抽
出した破線に囲まれた部分を通常のセルとして抽出す
る。ステップs11では、文字認識が終了していないセ
ルがあるか調べ、あればステップs12のセル内文字認
識を行う。ステップs13では、認識された表を出力す
る。
【0011】次に図4のフローチャートを用いてステッ
プs6の詳細について説明する。ステップs61では、
ステップ4で抽出した罫線の内、しきい値よりも幅が太
いものを検索する。ステップs62では、検索した罫線
で囲まれた部分がないか調べ、有ればステップs63、
なければ白黒反転セル抽出部を終了する。ステップs6
3では、ステップs62で見つかった部分の内部の黒画
素の比率を算出する。ステップs64では、黒画素の比
率が50%よりも大きいかどうか調べ、大きければ、ス
テップs65で白黒反転部として出力する。
【0012】以上のように本実施例によれば、白黒反転
セル候補抽出部24と、白黒反転セル決定部25、およ
び画素反転部26を設けることにより、正確に表の構造
および内部の文字を認識することができる。
【0013】
【発明の効果】前記実施例の説明より明らかなように、
本発明は罫線の内、幅がしきい値以上のもので囲まれた
部分を白黒反転セル候補として抽出する白黒反転セル候
補抽出部と、抽出した白黒反転セル候補の内部の黒画素
の密度により、その部分を白黒反転セルと決定する白黒
反転セル決定部と、決定したセル内の画素を反転する画
素反転部を設けることにより、表の構造および内部の文
字を正確に認識することができる。
【図面の簡単な説明】
【図1】本発明の一実施例における表認識装置の機能ブ
ロック図
【図2】本実施例の表認識装置の構成を示すブロック図
【図3】本実施例における制御手順を示すフローチャー
【図4】本実施例における制御手順を示すフローチャー
【図5】従来の表認識装置の機能ブロック図
【符号の説明】
21 画像入力部 22 画像領域 23 実線ラン抽出部 24 白黒反転セル候補抽出部 25 白黒反転セル決定部 26 画素反転部 27 破線ラン抽出部 28 表構造抽出部 29 文字切り出し部 30 文字パターン辞書 31 文字認識部 32 表出力部 40 スキャナ 41 RAM 42 画像メモリ領域 43 ラン領域 44 罫線領域 45 表データ領域 46 ROM 47 特徴辞書領域 48 プログラム記憶領域 49 処理回路 50 キーボード 51 表示部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 与えられた入力図形を走査して得られた
    原図形情報に基づいて、表の構造を認識する表認識装置
    において、縦・横2方向の黒画素のランのうち、一定長
    さ以上のものを抽出する手段と、抽出されたランを連結
    することにより、実線の罫線を抽出する手段と、抽出さ
    れた罫線の内、幅がしきい値以上のもので囲まれた部分
    を白黒反転セル候補として抽出する手段と、抽出した白
    黒反転セル候補の内部の黒画素の密度により、その部分
    を白黒反転セルと決定する手段と、決定したセル内の画
    素を反転する手段を有し、表の構造および中の文字を正
    確に認識することを特徴とする表認識装置。
JP5126559A 1993-05-28 1993-05-28 表認識装置 Pending JPH06337960A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5126559A JPH06337960A (ja) 1993-05-28 1993-05-28 表認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5126559A JPH06337960A (ja) 1993-05-28 1993-05-28 表認識装置

Publications (1)

Publication Number Publication Date
JPH06337960A true JPH06337960A (ja) 1994-12-06

Family

ID=14938168

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5126559A Pending JPH06337960A (ja) 1993-05-28 1993-05-28 表認識装置

Country Status (1)

Country Link
JP (1) JPH06337960A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008198157A (ja) * 2007-02-16 2008-08-28 Fujitsu Ltd 表認識プログラム、表認識方法および表認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008198157A (ja) * 2007-02-16 2008-08-28 Fujitsu Ltd 表認識プログラム、表認識方法および表認識装置

Similar Documents

Publication Publication Date Title
JP2001060247A (ja) 画像処理装置および画像処理方法
JP3215163B2 (ja) 罫線識別方法及び領域識別方法
JPH08180068A (ja) 電子ファイリング装置
JPH06337960A (ja) 表認識装置
JP3993025B2 (ja) 文書画像変換方法、文書画像変換プログラム及び文書画像変換装置
US6356657B1 (en) Image processing method and apparatus for discriminating an input image area or an attribute of image information in the discriminated area
JP3060248B2 (ja) 表認識装置
JP3052438B2 (ja) 表認識装置
JP2796561B2 (ja) 表形式文書認識方式
JP3502130B2 (ja) 表認識装置および表認識方法
JP3304512B2 (ja) 表認識装置
JPH06150056A (ja) 表認識装置
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JPH08185475A (ja) 画像認識装置
JPH0830725A (ja) 画像処理装置及び方法
JP2007295210A (ja) 画像処理装置、画像処理方法、画像処理プログラム、およびこれを記録した記録媒体
JP2743378B2 (ja) 文字認識方法
JPH04276888A (ja) 文字読取装置
JPH06139277A (ja) 電子辞書装置
JPH06195505A (ja) 表認識装置
JPH0728934A (ja) 文書画像処理装置
JP2931041B2 (ja) 表内文字認識方法
JP2991761B2 (ja) 行切出し方法
JPH04360294A (ja) 表認識装置および表認識方法
JP2001266070A (ja) 文字認識装置、文字認識方法および記憶媒体