JPH04309186A - 棒グラフ認識装置 - Google Patents
棒グラフ認識装置Info
- Publication number
- JPH04309186A JPH04309186A JP3073401A JP7340191A JPH04309186A JP H04309186 A JPH04309186 A JP H04309186A JP 3073401 A JP3073401 A JP 3073401A JP 7340191 A JP7340191 A JP 7340191A JP H04309186 A JPH04309186 A JP H04309186A
- Authority
- JP
- Japan
- Prior art keywords
- graph
- bar graph
- character
- image
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は、デスクトップパブリッ
シングにおける表計算アプリケーションの入力手段とし
て、また、ファクシミリなどの画像伝送装置や、電子フ
ァイリングシステムなどにおける画像圧縮装置として利
用することができる棒グラフ認識装置に関するものであ
る。
シングにおける表計算アプリケーションの入力手段とし
て、また、ファクシミリなどの画像伝送装置や、電子フ
ァイリングシステムなどにおける画像圧縮装置として利
用することができる棒グラフ認識装置に関するものであ
る。
【0002】
【従来の技術】最近の技術の進歩により、DTP、ファ
クシミリ、電子ファイリングシステムなど画像情報の重
要性がさらに増加してくるようになってきた。画像デー
タの種類としては写真、イラスト、図面、グラフなど種
々のものが多く存在するが、それらを上記装置に入力す
る際には、画像情報の圧縮を行うことが多い。画像情報
圧縮の方法としては、次の2種類の方法によって圧縮が
おこなわれていた。 (1) ドットデータをMH符号、MR符号、MMR符
号などに変換することによって画像圧縮する。 (2) 図面を直線、円弧などのプリミティブで表現す
ることによって圧縮を行う。
クシミリ、電子ファイリングシステムなど画像情報の重
要性がさらに増加してくるようになってきた。画像デー
タの種類としては写真、イラスト、図面、グラフなど種
々のものが多く存在するが、それらを上記装置に入力す
る際には、画像情報の圧縮を行うことが多い。画像情報
圧縮の方法としては、次の2種類の方法によって圧縮が
おこなわれていた。 (1) ドットデータをMH符号、MR符号、MMR符
号などに変換することによって画像圧縮する。 (2) 図面を直線、円弧などのプリミティブで表現す
ることによって圧縮を行う。
【0003】これまでグラフ画像に関しては (1)の
ドットデータとしての圧縮の方法が取られていた。
ドットデータとしての圧縮の方法が取られていた。
【0004】
【発明が解決しようとする課題】上記従来例では、グラ
フを単なる画像データとして圧縮を行っていたので、高
い圧縮効果を得ることが困難であり、グラフのもってい
る内容については全く認識していないので、読み取った
グラフデータを表計算ソフトやWP(ワードプロセッサ
)で見るなど、データの再加工が行えなかった。
フを単なる画像データとして圧縮を行っていたので、高
い圧縮効果を得ることが困難であり、グラフのもってい
る内容については全く認識していないので、読み取った
グラフデータを表計算ソフトやWP(ワードプロセッサ
)で見るなど、データの再加工が行えなかった。
【0005】本発明は上記問題を解決するもので、原稿
から読み取ったグラフ画像から項目とそれに対応する値
を数値データ化してグラフ画像の圧縮率を向上できる棒
グラフ認識装置を提供することを目的とするものである
。
から読み取ったグラフ画像から項目とそれに対応する値
を数値データ化してグラフ画像の圧縮率を向上できる棒
グラフ認識装置を提供することを目的とするものである
。
【0006】
【課題を解決するための手段】上記課題を解決するため
に本発明の棒グラフ認識装置は、画像データの中から文
字部と図形部とを分離する文字図形分離部を設け、それ
ぞれ分離された文字および図形を認識する文字認識部お
よび図形認識部を設け、さらに、認識された文字、図形
から棒グラフを構成する図形、項目を抽出して棒グラフ
を認識する棒グラフ認識部と認識された棒グラフを保存
する棒グラフ書式格納部を設けたものである。
に本発明の棒グラフ認識装置は、画像データの中から文
字部と図形部とを分離する文字図形分離部を設け、それ
ぞれ分離された文字および図形を認識する文字認識部お
よび図形認識部を設け、さらに、認識された文字、図形
から棒グラフを構成する図形、項目を抽出して棒グラフ
を認識する棒グラフ認識部と認識された棒グラフを保存
する棒グラフ書式格納部を設けたものである。
【0007】
【作用】上記構成により、グラフ画像から図形と項目を
分離、認識し、文字データからその項目とそれに対応す
る数値を得ることによってグラフの認識を行い、グラフ
データとして、グラフの種類、項目およびそれに対応す
る値のみを記憶するだけでよく、これにより高い圧縮率
が得られる。また、認識結果を利用して表への変換など
グラフデータの2次利用が可能となる。
分離、認識し、文字データからその項目とそれに対応す
る数値を得ることによってグラフの認識を行い、グラフ
データとして、グラフの種類、項目およびそれに対応す
る値のみを記憶するだけでよく、これにより高い圧縮率
が得られる。また、認識結果を利用して表への変換など
グラフデータの2次利用が可能となる。
【0008】
【実施例】以下本発明の一実施例を図面に基づいて説明
する。図1は本発明の一実施例の棒グラフ認識装置の構
成図である。図1において、1はグラフ画像を電気信号
に変換する光電変換部、2は変換された結果を格納する
画像記憶部、3は画像データの中から文字部と図形部と
を分離する文字図形分離部、4は分離された文字を認識
する文字認識部、5はグラフを構成する図形を認識する
図形認識部、6は認識された文字、図形からグラフの項
目を抽出するグラフ認識部、7はその認識された結果を
保存するグラフ書式記憶部である。
する。図1は本発明の一実施例の棒グラフ認識装置の構
成図である。図1において、1はグラフ画像を電気信号
に変換する光電変換部、2は変換された結果を格納する
画像記憶部、3は画像データの中から文字部と図形部と
を分離する文字図形分離部、4は分離された文字を認識
する文字認識部、5はグラフを構成する図形を認識する
図形認識部、6は認識された文字、図形からグラフの項
目を抽出するグラフ認識部、7はその認識された結果を
保存するグラフ書式記憶部である。
【0009】次に、上記構成による動作を説明する。ま
ず入力されたグラフ画像は光電変換部1のスキャナなど
の光電変換装置により電気信号に変換され、画像記憶部
2に蓄えられる。蓄えられた画像データは文字図形分離
部3によって文字部(グラフの項目と数値が表示されて
いる)と図形部(グラフの外形が書かれている)とに分
離される。文字と図形の分離には図形候補および文字候
補を囲む外接矩形により、判別を行う。すなわち、外接
矩形の面積がある一定のしきい値より大きければ図形と
見なし、小さければ文字であるとする。図2(a)(b
)は文字と図形の例を示す。
ず入力されたグラフ画像は光電変換部1のスキャナなど
の光電変換装置により電気信号に変換され、画像記憶部
2に蓄えられる。蓄えられた画像データは文字図形分離
部3によって文字部(グラフの項目と数値が表示されて
いる)と図形部(グラフの外形が書かれている)とに分
離される。文字と図形の分離には図形候補および文字候
補を囲む外接矩形により、判別を行う。すなわち、外接
矩形の面積がある一定のしきい値より大きければ図形と
見なし、小さければ文字であるとする。図2(a)(b
)は文字と図形の例を示す。
【0010】このようにして分離された文字は文字認識
装置4によって文字に変換され、図形は5の図形認識装
置5によって棒グラフを構成する矩形、直線などに変換
される。文字認識の方法については、これまで多くの研
究があり、どの方法も本実施例に利用可能であり、図形
認識技術においても矩形や直線の認識についてその手法
は確立している。
装置4によって文字に変換され、図形は5の図形認識装
置5によって棒グラフを構成する矩形、直線などに変換
される。文字認識の方法については、これまで多くの研
究があり、どの方法も本実施例に利用可能であり、図形
認識技術においても矩形や直線の認識についてその手法
は確立している。
【0011】グラフを構成する文字、図形の認識を行っ
た後、グラフ認識部6により、文字図形の認識の結果か
らグラフの特徴を利用して図形および項目とそれに対応
する値を抽出する。図3に示すように、棒グラフは縦軸
11、横軸12、棒部13、項目部14、数値部15と
から構成されている。棒グラフでは項目部14が棒部1
3の下部に存在する。数値部15は棒部13の周辺にか
かれている。
た後、グラフ認識部6により、文字図形の認識の結果か
らグラフの特徴を利用して図形および項目とそれに対応
する値を抽出する。図3に示すように、棒グラフは縦軸
11、横軸12、棒部13、項目部14、数値部15と
から構成されている。棒グラフでは項目部14が棒部1
3の下部に存在する。数値部15は棒部13の周辺にか
かれている。
【0012】次に棒グラフを認識する課程を図4のフロ
ーチャートを用いて説明する。 (1) ステップS1 棒グラフの棒部13を認識する。いま、図5のような矩
形が認識されたとする。これらの矩形の中から棒グラフ
の棒部13の候補を認識する。認識の方法は、矩形の中
から任意の矩形R1を選択し、他の矩形R2〜R5に対
して次の条件を満たすかどうかを調べることで行う。
ーチャートを用いて説明する。 (1) ステップS1 棒グラフの棒部13を認識する。いま、図5のような矩
形が認識されたとする。これらの矩形の中から棒グラフ
の棒部13の候補を認識する。認識の方法は、矩形の中
から任意の矩形R1を選択し、他の矩形R2〜R5に対
して次の条件を満たすかどうかを調べることで行う。
【0013】1)図5のようにX軸と平行で矩形R1の
下辺と一致するような線を引いたとき、他の矩形R2〜
R5までの距離をLi(i=2,3,4,5)とすると
|Li|≦LL(LLはしきい値) を満たす。
下辺と一致するような線を引いたとき、他の矩形R2〜
R5までの距離をLi(i=2,3,4,5)とすると
|Li|≦LL(LLはしきい値) を満たす。
【0014】いま、図5でL2=1,L3=−1,L4
=5、LL=1とすると、 |L4|≧LL となり、R4は候補からはずれる。
=5、LL=1とすると、 |L4|≧LL となり、R4は候補からはずれる。
【0015】2)矩形の短辺の長さをAiとすると|A
i−A1|≦AA(i=2,3,5、AAはしきい値)
を満たす。
i−A1|≦AA(i=2,3,5、AAはしきい値)
を満たす。
【0016】いま、図5でA1=4、A2=4、A3=
4、A5=6、AA=1とすると |A5−A1|≧AA となり、R5は候補からはずれる。
4、A5=6、AA=1とすると |A5−A1|≧AA となり、R5は候補からはずれる。
【0017】3)矩形RiとRi+1との中心間距離を
Hiとすると |Hi+1−Hi|≦HH(HHはしきい値)を満たす
。図5ではこの条件を満たしている。
Hiとすると |Hi+1−Hi|≦HH(HHはしきい値)を満たす
。図5ではこの条件を満たしている。
【0018】以上の条件によって、R1,R2,R3が
棒グラフの棒部候補として認識される。 (2) ステップS2 棒グラフの縦軸11、横軸12を探す。縦軸は最も左に
ある棒部13のさらに左側にあり、棒部13の垂直辺と
平行な直線である。横軸12は棒部13の底辺上にある
。 (3) ステップS3 項目部14を認識する。項目部14の文字列は棒部13
の下部に存在する。 (4) ステップS4 数値部15を認識する。数値部15の文字列は、項目部
14以外の文字列で先頭文字が数字であり、棒部13の
周辺または内部に存在する。
棒グラフの棒部候補として認識される。 (2) ステップS2 棒グラフの縦軸11、横軸12を探す。縦軸は最も左に
ある棒部13のさらに左側にあり、棒部13の垂直辺と
平行な直線である。横軸12は棒部13の底辺上にある
。 (3) ステップS3 項目部14を認識する。項目部14の文字列は棒部13
の下部に存在する。 (4) ステップS4 数値部15を認識する。数値部15の文字列は、項目部
14以外の文字列で先頭文字が数字であり、棒部13の
周辺または内部に存在する。
【0019】以上の方法により、棒グラフを認識した後
、棒グラフ書式格納部7で項目とそれに対応する値とを
保存する。図6は図3の認識結果を保存データに変換し
たものである。21は棒グラフをあらわし、22は棒グ
ラフの縦、横の大きさ、23は項目数、24は項目とそ
れに対応する値である。
、棒グラフ書式格納部7で項目とそれに対応する値とを
保存する。図6は図3の認識結果を保存データに変換し
たものである。21は棒グラフをあらわし、22は棒グ
ラフの縦、横の大きさ、23は項目数、24は項目とそ
れに対応する値である。
【0020】
【発明の効果】以上のように、本発明によれば、グラフ
のイメージを記憶するのではなく、グラフを構成してい
る各項目とそれに対応する値を記憶することによって大
幅な情報圧縮が可能になる。また、認識されたグラフデ
ータを表計算データに変更することによって、高速で操
作性のよい入力装置として使用することができる。
のイメージを記憶するのではなく、グラフを構成してい
る各項目とそれに対応する値を記憶することによって大
幅な情報圧縮が可能になる。また、認識されたグラフデ
ータを表計算データに変更することによって、高速で操
作性のよい入力装置として使用することができる。
【図1】本発明の一実施例の棒グラフ認識装置の構成図
である。
である。
【図2】図形と文字の例を示す図である。
【図3】棒グラフを構成する各要素の説明図である。
【図4】図1の棒グラフ認識装置のグラフ認識部の動作
を説明するフローチャートである。
を説明するフローチャートである。
【図5】棒部認識の方法を説明するための図である。
【図6】図1の棒グラフ認識装置のグラフ書式格納部に
おいて変換される書式の例を示す図である。
おいて変換される書式の例を示す図である。
1 光電変換部
2 画像記憶部
3 文字図形分離部
4 文字認識部
5 図形認識部
6 棒グラフ認識部
7 グラフ書式格納部
13 棒部
14 項目部
15 数値部
Claims (1)
- 【請求項1】 グラフ画像を電気信号に変換する光電
変換部と、変換された画像データを格納する画像記憶部
と、画像データの中から文字部と図形部とを分離する文
字図形分離部と、それぞれ分離された文字を認識する文
字認識部と、図形を認識する図形認識部と、認識された
文字、図形から棒グラフを構成する図形、項目を抽出し
て棒グラフを認識する棒グラフ認識部と、その認識され
た棒グラフを保存する棒グラフ書式格納部からなり、画
像データとしての棒グラフから、外形部および項目とそ
れに対応する値を抽出し、数値データに変換することに
より、データの圧縮および再利用を可能にしたことを特
徴とする棒グラフ認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3073401A JPH04309186A (ja) | 1991-04-08 | 1991-04-08 | 棒グラフ認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3073401A JPH04309186A (ja) | 1991-04-08 | 1991-04-08 | 棒グラフ認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04309186A true JPH04309186A (ja) | 1992-10-30 |
Family
ID=13517140
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3073401A Pending JPH04309186A (ja) | 1991-04-08 | 1991-04-08 | 棒グラフ認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04309186A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0654753A3 (en) * | 1993-11-24 | 1995-12-06 | Xerox Corp | Method for analyzing an image carrying a graphic representation. |
| EP0654750A3 (en) * | 1993-11-24 | 1995-12-06 | Xerox Corp | Data analysis method defining an image. |
| EP1018694A3 (en) * | 1999-01-08 | 2002-01-09 | Hewlett-Packard Company, A Delaware Corporation | System and method for automatic graph parsing |
| GB2469436A (en) * | 2009-02-09 | 2010-10-20 | Inzpire Ltd | Method and apparatus for generating and storing graph representation data |
| JP2011059784A (ja) * | 2009-09-07 | 2011-03-24 | O Creation:Kk | 概念モデル可視化システムとプログラムと記録媒体 |
| WO2015162748A1 (ja) * | 2014-04-24 | 2015-10-29 | 株式会社日立製作所 | データ変換装置およびデータ変換方法 |
-
1991
- 1991-04-08 JP JP3073401A patent/JPH04309186A/ja active Pending
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0654753A3 (en) * | 1993-11-24 | 1995-12-06 | Xerox Corp | Method for analyzing an image carrying a graphic representation. |
| EP0654750A3 (en) * | 1993-11-24 | 1995-12-06 | Xerox Corp | Data analysis method defining an image. |
| US5544267A (en) * | 1993-11-24 | 1996-08-06 | Xerox Corporation | Using a category to analyze an image showing a graphical representation |
| EP1018694A3 (en) * | 1999-01-08 | 2002-01-09 | Hewlett-Packard Company, A Delaware Corporation | System and method for automatic graph parsing |
| GB2469436A (en) * | 2009-02-09 | 2010-10-20 | Inzpire Ltd | Method and apparatus for generating and storing graph representation data |
| JP2011059784A (ja) * | 2009-09-07 | 2011-03-24 | O Creation:Kk | 概念モデル可視化システムとプログラムと記録媒体 |
| WO2015162748A1 (ja) * | 2014-04-24 | 2015-10-29 | 株式会社日立製作所 | データ変換装置およびデータ変換方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5963966A (en) | Automated capture of technical documents for electronic review and distribution | |
| US8614838B2 (en) | Image processing apparatus and image processing method | |
| US5881168A (en) | Image processing apparatus method and system for converting character codes of character images extracted from an original image and positions of the images for transmission | |
| EP2224359B1 (en) | Image processing apparatus, image processing method, and computer program | |
| US5956422A (en) | Processor based method for extracting tablets from printed documents | |
| EP0411231A2 (en) | Method for digitizing information written into forms by means of very large symbol matching | |
| Chester et al. | Getting computers to see information graphics so users do not have to | |
| JPS6118381B2 (ja) | ||
| EP0098958A2 (en) | Method of encoding and transmitting documents for text processing systems | |
| JPH08330974A (ja) | データ圧縮方法およびその圧縮コードの復元回路 | |
| WO1998016917A2 (en) | A file structure for scanned documents | |
| US20030128881A1 (en) | Image data encoding apparatus | |
| JP2534276B2 (ja) | オリジナル・イメ−ジのペル信号の処理方法 | |
| JPH04309186A (ja) | 棒グラフ認識装置 | |
| JPH04172574A (ja) | グラフ認識装置 | |
| US5361309A (en) | Character recognition apparatus and method with low-resolution storage for character extraction | |
| JPH08180068A (ja) | 電子ファイリング装置 | |
| Nagy | Towards a structured-document-image utility | |
| US20030123087A1 (en) | Image compression method, decompression method thereof and program therefor | |
| JPH04324577A (ja) | 折れ線グラフ認識装置 | |
| JPH05108740A (ja) | 帯グラフ認識装置 | |
| JPH0573685A (ja) | レーダーチヤート認識装置 | |
| JPH05266247A (ja) | 画像データ処理システム | |
| Sauvola et al. | A document management interface utilizing page decomposition and content-based compression | |
| JP2508975B2 (ja) | 電子黒板 |