JP7659155B2 - 画像解析システム - Google Patents
画像解析システム Download PDFInfo
- Publication number
- JP7659155B2 JP7659155B2 JP2020130845A JP2020130845A JP7659155B2 JP 7659155 B2 JP7659155 B2 JP 7659155B2 JP 2020130845 A JP2020130845 A JP 2020130845A JP 2020130845 A JP2020130845 A JP 2020130845A JP 7659155 B2 JP7659155 B2 JP 7659155B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- image
- frames
- image analysis
- tables
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
このような画像解析に関する技術の一例が、特許文献1に開示されている。特許文献1に開示に技術では、読み取り対象となる原稿のフォーマット(すなわち、体裁)に対応して、何れの位置に何れの情報が記載されているのかを予め設定しておく。そして、この設定に基づくことにより、画像における、フォーマットに適合した位置から文字列を検出する等の画像解析を行うことができる。
このように、様々なフォーマットが混在する場合や、画像に歪み等が発生する場合であっても、精度高く画像解析を行うことが望まれる。
表を被写体として含む画像から、前記表に対応する領域を検出する表検出手段と、
前記表に対応する領域から前記表を構成する複数の枠を検出すると共に、該検出した複数の枠それぞれに前記画像における位置情報を付与する枠検出手段と、
前記複数の枠それぞれについての文字認識結果と、前記複数の枠それぞれに付与された位置情報とに基づいて、取得対象情報を取得する情報取得手段と、
を備えることを特徴とする。
図1は、本実施形態に係る画像解析システムSの全体構成を示すブロック図である。図1に示すように、画像解析システムSは、端末1と、画像解析装置2とを含む。また、図1には、本実施形態において画像解析処理を行う対象とする原稿3も図示する。ここで、原稿3は、何らかの表を含む原稿であるとする。
まず前提として、健康診断は、病気の早期発見及び早期治療のために非常に有益である。また、定期的に健康診断を受診することにより、ユーザは、自身の健康状態の変化等を把握することができる。
また、健康診断表は、各検査実施機関の間で電子データの共有もされていない。また、受診者であるユーザは、各検査実施機関から、紙媒体に印刷された健康診断表を受け取るのみであり、そもそも電子データを受け取っていない。このような状況であることから、ユーザは、自身の健康状態の変化等を把握することが困難である。また、各検査実施機関や病院等においても、ユーザの健康状態の変化等を把握することが困難である。
このように、健康診断表は、本実施形態における画像解析処理の対象として好適である。そのため、以下では原稿3が健康診断表である場合を想定して説明する。
端末1の構成について、図2を参照して説明をする。図2は、端末1の構成の一例を示すブロック図である。端末1は、上述したように、例えば、スマートフォンやタブレット型の端末、あるいはデジタルカメラ等により実現される。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
入力部17は、各種ボタン及びタッチパネル、又はマウス及びキーボード等の外部入力装置で構成され、ユーザの指示操作に応じて各種情報を入力する。
出力部18は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
また、記憶部16の一領域には、画像記憶部161と、解析結果記憶部162と、が設定される。
以下で特に言及しない場合も含め、これら機能ブロック間では、処理を実現するために必要なデータを、適切なタイミングで適宜送受信する。
また、撮影制御部111は、この取得した対象画像を、画像解析装置2に対して送信する。
次に、画像解析装置2の構成について、図3を参照して説明をする。図3は、画像解析装置2の構成の一例を示すブロック図である。画像解析装置2は、上述したように、例えば、パーソナルコンピュータやサーバ装置等により実現される。
また、記憶部26の一領域には、画像記憶部261と、解析結果記憶部263と、が設定される。
以下で特に言及しない場合も含め、これら機能ブロック間では、処理を実現するために必要なデータを、適切なタイミングで適宜送受信する。
これにより、枠検出部213は、対象画像内に含まれる複数の枠それぞれを単位とした画像であって、それぞれに位置情報が付与された画像(以下、「枠画像」と称する。)を生成する。枠画像は、例えば、健康診断表であれば特定の文字列(例えば、検査項目、検査値、基準値、前回検査値、患者の名前等の属性情報等)が記載されている1つの単位であり、位置情報を有する構造化データとして取り扱うことができる。
なお、文字認識部214は、既存の光学文字認識技術を用いるのみならず、例えば、予め対象画像に含まれ得る文字列(ここでは、健康診断表で用いられる単語等の文字列)を用いて機械学習を行うようにしてもよい。そして、この機械学習により生成された学習モデルを用いて文字認識処理を行うようにしてもよい。
図4は、端末1により行われる撮影処理の流れを説明するフローチャートである。撮影処理は、ユーザからの、端末1への電源投入等に伴い実行される。
以上説明した撮影処理により、画像解析装置2は、対象画像を取得することができる。
図5は、画像解析装置2により行われる画像解析処理の流れを説明するフローチャートである。画像解析処理は、端末1から対象画像が送信されたことや、ユーザからの、画像解析画像解析装置2への画像解析処理開始の指示操作を受け付けたことに伴い実行される。
具体的に、表検出部212は、まず前処理を行う。例えば、表検出部212は、対象画像をグレースケールに変換すると共に、そのサイズを1280×960に調整(すなわち、リサイズ)する。次に、表検出部212は、対象画像中の背景領域と枠線及び文字領域を分離し、0又は1で表現するための、二値化を行う。例えば、表検出部212は、retinexフィルタリングを用いて二値化を行う。二値化では、例えば、画像における、白が0で表現され、黒が1で表現される。また、表検出部212は、文字領域を削除するためのフィルタリングを行う。前提として、表の枠線は対象画像中の広範囲に広がっており、枠線内には文字が含まれる。そのため、画素は疎連結していると考えられる。このことから枠線におけるx方向及びy方向の分散はどちらも大きいと考えられる。
具体的に、枠検出部213は、まず枠線分離を行う。この場合に、上述したように、枠検出部213は、表を構成する複数の枠の枠線である第1の方向の枠線と第2の方向の枠線を分離して検出する。この点について、図6を参照して説明する。図6は、第1の方向の枠線と第2の方向の枠線を分離して検出することを示す模式図である。図6(a)に、画像内における分離前の枠線を示す。このように表を構成する複数の枠の枠線は、第1の方向(ここでは、縦方向)と、第2の方向(ここでは、横方向)の枠線を含む。枠検出部213は、これらの枠線を、図6(b-1)に示すように第1の方向(ここでは、縦方向)と、図6(b-2)に示すように第2の方向(ここでは、横方向)の枠線とに分離して検出する。
また、曲線近似は画素数の多い画素集合から行い、多項式を利用して次数を1から4まで徐々に上げていき、次式(1)に示す閾値判定を行い、閾値以下となった場合のみ近似曲線を作成する。
従って、ユーザは、より適切に健康診断の結果を把握することが可能となる。
以上、本発明の実施形態について説明したが、この実施形態は例示に過ぎず、本発明の技術的範囲を限定するものではない。本発明は、本発明の要旨を逸脱しない範囲で、その他の様々な実施形態を取ることが可能である共に、省略及び置換等種々の変形を行うことができる。この場合に、これら実施形態及びその変形は、本明細書等に記載された発明の範囲及び要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
一例として、以上説明した本発明の実施形態を、以下のようにして変形してもよい。
ステップS31において、枠検出部213は、自身が生成した複数の枠画像から、今回処理対象とする枠画像を取得する。
以上のように、本実施形態に係る画像解析システムSは、表検出部212と、枠検出部213と、情報取得部215と、を備える。
表検出部212は、表を被写体として含む画像から、表に対応する領域を検出する。
枠検出部213は、表に対応する領域から表を構成する複数の枠を検出すると共に、該検出した複数の枠それぞれに画像における位置情報を付与する。
情報取得部215は、複数の枠それぞれについての文字認識結果と、複数の枠それぞれに付与された位置情報とに基づいて、取得対象情報を取得する。
情報取得部215は、第1の情報の取得元となった枠に対応する位置情報に基づいて、取得対象情報の一部である第2の情報を取得する。
これにより、取得対象情報に対応した辞書データを用いて、より精度高く画像解析を行うことができる。
これにより、例えば、縦方向又は横方向に関連する情報が配置されている表において、より精度高く画像解析を行うことができる。
このように、第1の方向の枠線と第2の方向の枠線を分離して検出することによって、これらを分離することなく検出を行う場合よりも、枠線及び枠を正確に検出することができる。
文字認識結果は、切り出された複数の枠それぞれを単位とした画像解析処理により生成される。
これにより、文字列が含まれる枠を単位として画像解析処理を行うことができるので、より精度高く文字認識を行うことができる。
取得対象情報は、少なくとも健康診断結果を含む。
これにより、様々なフォーマットで記載される健康診断結果を、精度高く取得することができる。
上述した実施形態による一連の処理を実行させる機能は、ハードウェアにより実現することもできるし、ソフトウェアにより実現することもできるし、これらの組み合わせにより実現することもできる。換言すると、上述した一連の処理を実行する機能が、画像解析システムSの何れかにおいて実現されていれば足り、この機能をどのような態様で実現するのかについては、特に限定されない。
Claims (5)
- 複数の表を被写体として含む一つの対象画像から、前記複数の表それぞれに対応する複数の表領域を検出する表検出手段と、
前記複数の表領域それぞれについて前記表を構成する複数の枠を検出すると共に、該検出した複数の枠それぞれについて前記対象画像における位置情報を付与する枠検出手段と、
前記複数の枠それぞれについての文字認識結果と、前記複数の枠それぞれに付与された位置情報とに基づいて、取得対象情報を取得することで、前記複数の表それぞれについての取得対象情報を取得する情報取得手段と、
を備え、
前記表検出手段が複数の表領域を検出する前記対象画像は、被写体である前記複数の表について歪みが生じている画像であり、
前記枠検出手段は、枠線の交点を検出し、該交点の座標を用いて枠ごとに射影変換を行うことにより、前記歪みを修正する、
ことを特徴とする画像解析システム。 - 複数の表を被写体として含む一つの対象画像から、前記複数の表それぞれに対応する複数の表領域を検出する表検出手段と、
前記複数の表領域それぞれについて前記表を構成する複数の枠を検出すると共に、該検出した複数の枠それぞれについて前記対象画像における位置情報を付与する枠検出手段と、
前記複数の枠それぞれについての文字認識結果と、前記複数の枠それぞれに付与された位置情報とに基づいて、取得対象情報を取得することで、前記複数の表それぞれについての取得対象情報を取得する情報取得手段と、
を備え、
前記対象画像には、枠内に半角数字のみが含まれる枠と、枠内に全角文字が含まれる枠とが存在し、
前記枠検出手段は、前記対象画像に含まれる枠から文字を検出し、一つの文字の幅を該一つの文字の高さで除算した値である縦横比の値が、閾値以上の文字が含まれる枠を前記全角文字が含まれる枠とみなして、該枠内の文字を文字の合成を行う処理の候補とする、
ことを特徴とする画像解析システム。 - 複数の表を被写体として含む一つの対象画像から、前記複数の表それぞれに対応する複数の表領域を検出する表検出手段と、
前記複数の表領域それぞれについて前記表を構成する複数の枠を検出すると共に、該検出した複数の枠それぞれについて前記対象画像における位置情報を付与する枠検出手段と、
前記複数の枠それぞれについての文字認識結果と、前記複数の枠それぞれに付与された位置情報とに基づいて、取得対象情報を取得することで、前記複数の表それぞれについての取得対象情報を取得する情報取得手段と、
を備え、
前記枠検出手段は、
前記表領域から第1の方向の幅が所定値未満の画素を削除した画像を生成して、前記第1の方向の枠線を検出し、
前記表領域から前記第1の方向と交差する第2の方向の幅が所定値未満の画素を削除した画像を生成して、前記第2の方向の枠線を検出し、
前記検出した第1の方向の枠線及び前記第2の方向の枠線の交点に基づいて前記複数の枠を検出する、
ことを特徴とする画像解析システム。 - 前記表検出手段は、一つの画像に一つの表が含まれるように前記対象画像を分割し、
前記枠検出手段は、一つの画像に一つの枠が含まれるように前記表検出手段が分割した対象画像をさらに分割し、
前記情報取得手段は、前記枠検出手段がさらに分割した枠単位の対象画像それぞれについて、前記取得対象情報を取得する、
ことを特徴とする請求項1乃至3の何れか1項に記載の画像解析システム。 - 前記対象画像は、健康診断結果が記載された異なる体裁の複数の表を撮影することにより生成された前記複数の表について歪みが生じている画像であり、
前記取得対象情報は、少なくとも健康診断結果を含む、
ことを特徴とする請求項1乃至4の何れか1項に記載の画像解析システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020130845A JP7659155B2 (ja) | 2020-07-31 | 2020-07-31 | 画像解析システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020130845A JP7659155B2 (ja) | 2020-07-31 | 2020-07-31 | 画像解析システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022027060A JP2022027060A (ja) | 2022-02-10 |
| JP7659155B2 true JP7659155B2 (ja) | 2025-04-09 |
Family
ID=80264448
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020130845A Active JP7659155B2 (ja) | 2020-07-31 | 2020-07-31 | 画像解析システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7659155B2 (ja) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000029983A (ja) | 1998-07-10 | 2000-01-28 | Oki Electric Ind Co Ltd | 文書読取装置 |
| JP2002185763A (ja) | 2000-12-11 | 2002-06-28 | Minolta Co Ltd | デジタル複写機 |
| JP2007213255A (ja) | 2006-02-08 | 2007-08-23 | Fujitsu Ltd | 表認識装置、及びコンピュータプログラム |
| JP2016206823A (ja) | 2015-04-20 | 2016-12-08 | アドバンスト・アプリケーション株式会社 | 帳票データ抽出システム |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08329187A (ja) * | 1995-06-06 | 1996-12-13 | Oki Electric Ind Co Ltd | 文書読取装置 |
| JPH09288714A (ja) * | 1996-04-19 | 1997-11-04 | Hitachi Ltd | 表認識方法および装置 |
| JPH10134120A (ja) * | 1996-10-28 | 1998-05-22 | Oki Electric Ind Co Ltd | 表処理方法および表処理装置 |
| JPH11282957A (ja) * | 1998-03-26 | 1999-10-15 | Oki Electric Ind Co Ltd | 認識対象領域の決定方法 |
-
2020
- 2020-07-31 JP JP2020130845A patent/JP7659155B2/ja active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000029983A (ja) | 1998-07-10 | 2000-01-28 | Oki Electric Ind Co Ltd | 文書読取装置 |
| JP2002185763A (ja) | 2000-12-11 | 2002-06-28 | Minolta Co Ltd | デジタル複写機 |
| JP2007213255A (ja) | 2006-02-08 | 2007-08-23 | Fujitsu Ltd | 表認識装置、及びコンピュータプログラム |
| JP2016206823A (ja) | 2015-04-20 | 2016-12-08 | アドバンスト・アプリケーション株式会社 | 帳票データ抽出システム |
Non-Patent Citations (2)
| Title |
|---|
| 田中宏 外3名,交点追跡と全体最適化に基づく罫線抽出誤りに頑強な表項目セル抽出,電子情報通信学会論文誌,日本,社団法人電子情報通信学会,2011年07月01日,第J94-D巻 第7号,pp.1113~1124 |
| 石谷康人,モデルマッチングによる表形式文書の理解,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,1994年09月22日,第94巻 第242号,pp.57~64 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022027060A (ja) | 2022-02-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN101615251B (zh) | 字符识别设备中用于识别字符的方法和设备 | |
| EP3940589B1 (en) | Layout analysis method, electronic device and computer program product | |
| JP2018128996A (ja) | 情報処理装置、制御方法、およびプログラム | |
| CN114821620B (zh) | 基于行文本框纵向合并的文本内容提取识别方法 | |
| CN112560849A (zh) | 基于神经网络算法的文理分割方法及系统 | |
| JP2020046819A (ja) | 情報処理装置及びプログラム | |
| CN111612045B (zh) | 一种获取目标检测数据集的通用方法 | |
| JP4232679B2 (ja) | 画像形成装置およびプログラム | |
| CN109508712A (zh) | 一种基于图像的汉语文字识别方法 | |
| CN108875570B (zh) | 信息处理装置、存储介质和信息处理方法 | |
| US20060285748A1 (en) | Document processing device | |
| JP2013093777A (ja) | 文書ファイル出力装置、文書ファイル出力方法、及びコンピュータプログラム | |
| KR102328034B1 (ko) | 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법 | |
| CN115063818B (zh) | 一种机关公文字体类别判别方法及系统 | |
| CN108062548B (zh) | 一种盲文方自适应定位方法及系统 | |
| JP7659155B2 (ja) | 画像解析システム | |
| CN107958261B (zh) | 一种盲文点检测方法及系统 | |
| KR102300475B1 (ko) | 표가 삽입된 이미지를 전자 문서로 변환할 수 있는 전자 장치 및 그 동작 방법 | |
| JP4474231B2 (ja) | 文書リンク情報取得システム | |
| JP3898645B2 (ja) | 帳票書式編集装置および帳票書式編集プログラム | |
| JP7570843B2 (ja) | 画像処理装置、画像形成システム、画像処理方法、およびプログラム | |
| CN114882209B (zh) | 文本处理方法、装置和系统 | |
| JP7516170B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
| JP5298830B2 (ja) | 画像処理プログラム、画像処理装置及び画像処理システム | |
| JP2008054147A (ja) | 画像処理装置および画像処理プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20200828 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201009 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220914 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20220914 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20220915 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20221027 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20221029 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230113 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230718 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20230907 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230907 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240423 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240520 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240624 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240821 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241112 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250114 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250213 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250310 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7659155 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |



