JPH08185475A - 画像認識装置 - Google Patents
画像認識装置Info
- Publication number
- JPH08185475A JPH08185475A JP6327648A JP32764894A JPH08185475A JP H08185475 A JPH08185475 A JP H08185475A JP 6327648 A JP6327648 A JP 6327648A JP 32764894 A JP32764894 A JP 32764894A JP H08185475 A JPH08185475 A JP H08185475A
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- ruled line
- character
- image recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
(57)【要約】
【目的】 罫線がなく文字列が不整な画像についても正
しく認識できる画像認識装置を提供することを目的とす
る。 【構成】 スキャナから入力した画像で、罫線を描画す
る位置を指定して、その指定された位置に罫線を描画
し、また削除する範囲を指定し、指定された範囲を削除
する。その後、従来の画像認識を行う。
しく認識できる画像認識装置を提供することを目的とす
る。 【構成】 スキャナから入力した画像で、罫線を描画す
る位置を指定して、その指定された位置に罫線を描画
し、また削除する範囲を指定し、指定された範囲を削除
する。その後、従来の画像認識を行う。
Description
【0001】
【産業上の利用分野】本発明は、文書画像を読み取り、
表の構造、図形、文字等を認識する画像認識装置に関す
るものである。
表の構造、図形、文字等を認識する画像認識装置に関す
るものである。
【0002】
【従来の技術】近年、画像認識装置がコンピュータ等の
ための入力装置として利用されるようになってきた。そ
こで、文書の清書システムとして画像認識装置の利用を
考慮すると、罫線位置、線種、線幅及びセル内の文字を
認識する必要がある。
ための入力装置として利用されるようになってきた。そ
こで、文書の清書システムとして画像認識装置の利用を
考慮すると、罫線位置、線種、線幅及びセル内の文字を
認識する必要がある。
【0003】以下に従来の画像認識装置について説明す
る。図8は従来の画像認識装置の機能ブロック図であ
り、9はスキャナ等の画像入力器から文書を読み取り、
2値の画像に変換する画像入力部、10は画像入力部9
で入力された画像データを格納する画像メモリ部、11
は画像データを走査して一定長さ以上の黒画素の並び
(以下ランという)を抽出する実線ラン抽出部、12は
実線ラン抽出部11で抽出されたランの連結性を調べて
罫線を抽出し、抽出された罫線位置の相互関係を見るこ
とにより、セルを抽出するセル抽出部、13はサンプル
文字を記憶する文字パターン辞書部、14は各セル内の
文字をサンプル文字と比較し、前もって決めた値よりも
近い類似度ならば、その文字として出力する文字認識
部、15は認識した表の情報を出力する表出力部であ
る。
る。図8は従来の画像認識装置の機能ブロック図であ
り、9はスキャナ等の画像入力器から文書を読み取り、
2値の画像に変換する画像入力部、10は画像入力部9
で入力された画像データを格納する画像メモリ部、11
は画像データを走査して一定長さ以上の黒画素の並び
(以下ランという)を抽出する実線ラン抽出部、12は
実線ラン抽出部11で抽出されたランの連結性を調べて
罫線を抽出し、抽出された罫線位置の相互関係を見るこ
とにより、セルを抽出するセル抽出部、13はサンプル
文字を記憶する文字パターン辞書部、14は各セル内の
文字をサンプル文字と比較し、前もって決めた値よりも
近い類似度ならば、その文字として出力する文字認識
部、15は認識した表の情報を出力する表出力部であ
る。
【0004】画像入力部9から入力された画像データ
は、セル抽出部12によって表構造が解析され、罫線及
び表内のセルが抽出される。抽出されたセル内のデータ
は、文字として文字認識部14において認識処理され
る。
は、セル抽出部12によって表構造が解析され、罫線及
び表内のセルが抽出される。抽出されたセル内のデータ
は、文字として文字認識部14において認識処理され
る。
【0005】
【発明が解決しようとする課題】しかしながら上記従来
の構成では、図1(a)のような文字列が整列されてい
て、かつ罫線がない画像を認識する場合や、図1(b)
のような表が点線で描画されている画像を認識する場合
や、文字サイズが異なる画像を認識する場合に、文字間
の間隔が正確に認識できなかったり、また文字サイズが
異なるため文字認識が正確にできないという問題点があ
った。また、表画像でない文書を表として認識すること
ができなかった。
の構成では、図1(a)のような文字列が整列されてい
て、かつ罫線がない画像を認識する場合や、図1(b)
のような表が点線で描画されている画像を認識する場合
や、文字サイズが異なる画像を認識する場合に、文字間
の間隔が正確に認識できなかったり、また文字サイズが
異なるため文字認識が正確にできないという問題点があ
った。また、表画像でない文書を表として認識すること
ができなかった。
【0006】そこで本発明は、罫線がなく文字列が不整
な画像についても正しく認識できる画像認識装置を提供
することを目的とする。
な画像についても正しく認識できる画像認識装置を提供
することを目的とする。
【0007】
【課題を解決するための手段】本発明の画像認識装置
は、罫線を描画する位置を指定する手段と、画像に指定
され対置で罫線を描画する手段と、削除する範囲を指定
する手段と、指定された範囲で画像を削除する手段を備
える。
は、罫線を描画する位置を指定する手段と、画像に指定
され対置で罫線を描画する手段と、削除する範囲を指定
する手段と、指定された範囲で画像を削除する手段を備
える。
【0008】
【作用】上記構成により、例えば図1(a)を認識する
場合、罫線を描画し図2のように画像編集をする。また
図1(b)を認識する場合、破線を削除して罫線を描画
し図2のように画像編集をする。また図3を認識する場
合、罫線を描画し図4のように画像編集をする。その
後、表認識、セル内文字認識が行われるため正確な表構
造認識およびセル内文字認識が可能となる。
場合、罫線を描画し図2のように画像編集をする。また
図1(b)を認識する場合、破線を削除して罫線を描画
し図2のように画像編集をする。また図3を認識する場
合、罫線を描画し図4のように画像編集をする。その
後、表認識、セル内文字認識が行われるため正確な表構
造認識およびセル内文字認識が可能となる。
【0009】
【実施例】次に図面を参照しながら、本発明の実施例を
説明する。
説明する。
【0010】図5は本発明の一実施例における画像認識
装置の機能ブロック図である。図5において、31はス
キャナ等の画像入力器から文書を読み取り、2値の画像
に変換する画像入力部、34は画像入力部31で入力さ
れた画像データを格納する画像メモリ部、32は画像デ
ータの削除範囲を指定する削除範囲指定部、33は画像
データの指定された部分を削除する削除部、37は画像
データに罫線を描画する開始点を求める描画開始点抽出
部、36は画像データに罫線を描画する終了点を求める
描画終了点抽出部、35は画像データに指定された点の
罫線を描画する罫線描画部である。
装置の機能ブロック図である。図5において、31はス
キャナ等の画像入力器から文書を読み取り、2値の画像
に変換する画像入力部、34は画像入力部31で入力さ
れた画像データを格納する画像メモリ部、32は画像デ
ータの削除範囲を指定する削除範囲指定部、33は画像
データの指定された部分を削除する削除部、37は画像
データに罫線を描画する開始点を求める描画開始点抽出
部、36は画像データに罫線を描画する終了点を求める
描画終了点抽出部、35は画像データに指定された点の
罫線を描画する罫線描画部である。
【0011】また、38は画像データを走査して一定長
さ以上の黒画素の並び(以下ランという)を抽出する実
線ラン抽出部、39は実線ラン抽出部38で抽出された
ランの連結性を調べて罫線を抽出し、抽出された罫線位
置の相互関係を見ることにより、セルを抽出するセル抽
出部、40はサンプル文字を記憶する文字パターン辞書
部、41は各セル内の文字をサンプル文字と比較し、前
もって決めた値よりも近い類似度ならば、その文字とし
て出力する文字認識部、42は認識した表の情報を出力
する表出力部である。
さ以上の黒画素の並び(以下ランという)を抽出する実
線ラン抽出部、39は実線ラン抽出部38で抽出された
ランの連結性を調べて罫線を抽出し、抽出された罫線位
置の相互関係を見ることにより、セルを抽出するセル抽
出部、40はサンプル文字を記憶する文字パターン辞書
部、41は各セル内の文字をサンプル文字と比較し、前
もって決めた値よりも近い類似度ならば、その文字とし
て出力する文字認識部、42は認識した表の情報を出力
する表出力部である。
【0012】図6は本実施例の画像認識装置の構成を示
すブロック図である。図6において、44は画像を読み
取るスキャナで、読み取った画像をイメージデータとし
て出力する。45はRAMでスキャナ44からのイメー
ジデータを記憶する画像メモリ領域46、画像メモリ領
域46の縦、横2方向の連続する黒画素と白画素の長さ
(ラン)を格納するラン領域47、表認識の結果得られ
る表の構造、セルの文字を格納する表データ領域48を
有する。49はROMで文字認識に使用する辞書を記憶
した特徴辞書領域50及びプログラム記憶領域51を有
する。52はプログラム記憶領域51に記憶された制御
プログラムに従って処理を行う処理回路である。53は
認識指令を行うキーボードであり、54は表データ領域
48に記憶された表を表示する表示部である。
すブロック図である。図6において、44は画像を読み
取るスキャナで、読み取った画像をイメージデータとし
て出力する。45はRAMでスキャナ44からのイメー
ジデータを記憶する画像メモリ領域46、画像メモリ領
域46の縦、横2方向の連続する黒画素と白画素の長さ
(ラン)を格納するラン領域47、表認識の結果得られ
る表の構造、セルの文字を格納する表データ領域48を
有する。49はROMで文字認識に使用する辞書を記憶
した特徴辞書領域50及びプログラム記憶領域51を有
する。52はプログラム記憶領域51に記憶された制御
プログラムに従って処理を行う処理回路である。53は
認識指令を行うキーボードであり、54は表データ領域
48に記憶された表を表示する表示部である。
【0013】以上のように構成された本実施例の画像認
識装置について以下その動作を図7のフローチャートを
用いて説明する。ステップs1では、画像入力部31に
よってスキャナ44から画像を入力し、画像メモリ領域
46に格納する。ステップs2では、入力された画像デ
ータに対して画像を編集するかどうか調べる。ステップ
s2でNoの場合は、ステップs10で縦横方向ラン抽
出をする。ステップs2でYesの場合は、ステップs
3で罫線描画するかどうか調べる。ステップs3でNo
の場合は、ステップs7で画像データを削除するかどう
か調べる。ステップs3でYesの場合は、ステップs
4の描画開始点抽出でマウスなどの入力装置を使って入
力された画像データにおける罫線描画の開始点A(x
1,y1)を求める。ステップs5の描画終了点抽出で
マウスなどの入力装置を使って入力された画像データに
おける罫線描画の終了点B(x2,y2)を求める。ス
テップs6の罫線描画で、ステップs4で求めた点A
(x1,y1)からステップs5で求めた点B(x2,
y2)まで入力された画像データに対して、罫線を描画
し再度画像メモリ領域46に格納する。ステップs7で
画像データを削除するかどうか調べ、Noの場合は、再
度画像編集をするかどうか調べる。ステップs7でYe
sの場合は、ステップs8の削除範囲抽出で、マウスな
どの入力装置を使って入力された画像データに対して削
除範囲を求める。ステップs9の削除で、入力された画
像データに対してステップs8で求められた削除範囲を
削除し再度画像メモリ領域46に格納する。ステップs
2で再度画像編集をするかどうか調べる。
識装置について以下その動作を図7のフローチャートを
用いて説明する。ステップs1では、画像入力部31に
よってスキャナ44から画像を入力し、画像メモリ領域
46に格納する。ステップs2では、入力された画像デ
ータに対して画像を編集するかどうか調べる。ステップ
s2でNoの場合は、ステップs10で縦横方向ラン抽
出をする。ステップs2でYesの場合は、ステップs
3で罫線描画するかどうか調べる。ステップs3でNo
の場合は、ステップs7で画像データを削除するかどう
か調べる。ステップs3でYesの場合は、ステップs
4の描画開始点抽出でマウスなどの入力装置を使って入
力された画像データにおける罫線描画の開始点A(x
1,y1)を求める。ステップs5の描画終了点抽出で
マウスなどの入力装置を使って入力された画像データに
おける罫線描画の終了点B(x2,y2)を求める。ス
テップs6の罫線描画で、ステップs4で求めた点A
(x1,y1)からステップs5で求めた点B(x2,
y2)まで入力された画像データに対して、罫線を描画
し再度画像メモリ領域46に格納する。ステップs7で
画像データを削除するかどうか調べ、Noの場合は、再
度画像編集をするかどうか調べる。ステップs7でYe
sの場合は、ステップs8の削除範囲抽出で、マウスな
どの入力装置を使って入力された画像データに対して削
除範囲を求める。ステップs9の削除で、入力された画
像データに対してステップs8で求められた削除範囲を
削除し再度画像メモリ領域46に格納する。ステップs
2で再度画像編集をするかどうか調べる。
【0014】ステップs10では、実線ラン抽出部38
が画像メモリ領域46に格納された画像から縦、横2方
向の連続する黒画素と白画素の長さ(ラン)を抽出しラ
ン領域47に格納する。ステップs11では、実線ラン
抽出部38によってラン領域47に格納されたランの
内、長さがしきい値以上の黒ランを選ぶ。ステップs1
2では、セル抽出部39がステップs11で選ばれたラ
ンの内、接触しているグループ毎に始点終点を求め、表
データ領域48に格納する。ステップs13では、セル
抽出部39がステップs12で抽出された罫線で囲まれ
た部分の四隅の座標をセルとして抽出し、表データ領域
48に格納する。ステップs14では、文字認識部41
がセル内の文字認識が全て終了したかどうか調べ、Ye
sの場合は、ステップs16で表出力部42が表を出力
して終了し、Noの場合は、文字認識部41及び文字パ
ターン辞書部40によってステップs15でセル内文字
認識を行う。
が画像メモリ領域46に格納された画像から縦、横2方
向の連続する黒画素と白画素の長さ(ラン)を抽出しラ
ン領域47に格納する。ステップs11では、実線ラン
抽出部38によってラン領域47に格納されたランの
内、長さがしきい値以上の黒ランを選ぶ。ステップs1
2では、セル抽出部39がステップs11で選ばれたラ
ンの内、接触しているグループ毎に始点終点を求め、表
データ領域48に格納する。ステップs13では、セル
抽出部39がステップs12で抽出された罫線で囲まれ
た部分の四隅の座標をセルとして抽出し、表データ領域
48に格納する。ステップs14では、文字認識部41
がセル内の文字認識が全て終了したかどうか調べ、Ye
sの場合は、ステップs16で表出力部42が表を出力
して終了し、Noの場合は、文字認識部41及び文字パ
ターン辞書部40によってステップs15でセル内文字
認識を行う。
【0015】以上のように本実施例によれば、表でない
画像を表画像として認識することが可能となるため、罫
線がなく一定の型で書かれている文字列や破線の表の文
字サイズが異なる文字に対する認識が正確に行えるよう
になる。また、文書の清書で罫線のない画像を表画像と
して編集することが可能となる。
画像を表画像として認識することが可能となるため、罫
線がなく一定の型で書かれている文字列や破線の表の文
字サイズが異なる文字に対する認識が正確に行えるよう
になる。また、文書の清書で罫線のない画像を表画像と
して編集することが可能となる。
【0016】
【発明の効果】本発明は、罫線を描画する位置を指定す
る手段と、画像に指定され対置で罫線を描画する手段
と、削除する範囲を指定する手段と、指定された範囲で
画像を削除する手段を備えるので、罫線がない画像に罫
線を描画し表画像とした後、表認識、セル内文字認識が
行われるため、正確な文字認識が可能となり、文書の清
書で表としての編集が可能となる。
る手段と、画像に指定され対置で罫線を描画する手段
と、削除する範囲を指定する手段と、指定された範囲で
画像を削除する手段を備えるので、罫線がない画像に罫
線を描画し表画像とした後、表認識、セル内文字認識が
行われるため、正確な文字認識が可能となり、文書の清
書で表としての編集が可能となる。
【図1】(a)本発明の実施例において罫線描画、削除
を行う前のサンプルの例示図 (b)本発明の実施例において罫線描画、削除を行う前
のサンプルの例示図
を行う前のサンプルの例示図 (b)本発明の実施例において罫線描画、削除を行う前
のサンプルの例示図
【図2】本発明の実施例において罫線描画、削除後のサ
ンプルの例示図
ンプルの例示図
【図3】本発明の実施例において罫線描画、削除を行う
前のサンプルの例示図
前のサンプルの例示図
【図4】本発明の実施例において罫線描画、削除を行う
前のサンプルの例示図
前のサンプルの例示図
【図5】本発明の一実施例における画像認識装置の機能
ブロック図
ブロック図
【図6】本実施例の画像認識装置の構成を示すブロック
図
図
【図7】本発明の実施例における画像認識装置のフロー
チャート
チャート
【図8】従来の画像認識装置の機能ブロック図
31 画像入力部 32 削除範囲指定部 33 削除部 34 画像メモリ部 35 罫線描画部 36 描画終了点抽出部 37 描画開始点抽出部 38 実線ラン抽出部 39 セル抽出部 40 文字パターン辞書部 41 文字認識部 42 表出力部
Claims (1)
- 【請求項1】与えられた入力図形を走査して得られた原
図形情報に基づいて画像を認識し、文字コード等のコー
ドに変換する画像認識装置において、罫線を描画する位
置を指定する手段と、画像に指定された位置で罫線を描
画する手段と、削除する範囲を指定する手段と、指定さ
れた範囲で画像を削除する手段を備えることを特徴とす
る画像認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6327648A JPH08185475A (ja) | 1994-12-28 | 1994-12-28 | 画像認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6327648A JPH08185475A (ja) | 1994-12-28 | 1994-12-28 | 画像認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08185475A true JPH08185475A (ja) | 1996-07-16 |
Family
ID=18201410
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6327648A Pending JPH08185475A (ja) | 1994-12-28 | 1994-12-28 | 画像認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08185475A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109284495A (zh) * | 2018-11-03 | 2019-01-29 | 上海犀语科技有限公司 | 一种对文本进行无表格线切表的方法及装置 |
-
1994
- 1994-12-28 JP JP6327648A patent/JPH08185475A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109284495A (zh) * | 2018-11-03 | 2019-01-29 | 上海犀语科技有限公司 | 一种对文本进行无表格线切表的方法及装置 |
| CN109284495B (zh) * | 2018-11-03 | 2023-02-07 | 上海犀语科技有限公司 | 一种对文本进行无表格线切表的方法及装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2940936B2 (ja) | 表領域識別方法 | |
| US8428356B2 (en) | Image processing device and image processing method for generating electronic document with a table line determination portion | |
| JP2713622B2 (ja) | 表形式文書読取装置 | |
| US6947596B2 (en) | Character recognition method, program and recording medium | |
| JPH0721310A (ja) | 文書認識装置 | |
| JPH08180068A (ja) | 電子ファイリング装置 | |
| JPH08185475A (ja) | 画像認識装置 | |
| JP2796561B2 (ja) | 表形式文書認識方式 | |
| JP3060248B2 (ja) | 表認識装置 | |
| JP3502130B2 (ja) | 表認識装置および表認識方法 | |
| JP3052438B2 (ja) | 表認識装置 | |
| JPH06150056A (ja) | 表認識装置 | |
| JP4040231B2 (ja) | 文字抽出方法及び装置並びに記憶媒体 | |
| JP3140079B2 (ja) | 罫線認識方法及び表処理方法 | |
| JP2877380B2 (ja) | 光学的文字読取装置 | |
| JPH05159062A (ja) | 文書認識装置 | |
| JPH0696274A (ja) | 文字等の認識方法 | |
| JPH0714000A (ja) | 表認識装置 | |
| JPH06337960A (ja) | 表認識装置 | |
| JPH11242716A (ja) | 画像処理方法および記録媒体 | |
| JPH0728934A (ja) | 文書画像処理装置 | |
| JPH04348475A (ja) | 画像情報検索方法及びその装置 | |
| JPH11250179A (ja) | 文字認識装置および文字認識方法 | |
| JP2972443B2 (ja) | 文字認識装置 | |
| JPH0573721A (ja) | 表認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040831 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041026 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041214 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050222 |