JP2019204146A - データ変換装置、画像処理装置及びプログラム - Google Patents

データ変換装置、画像処理装置及びプログラム Download PDF

Info

Publication number
JP2019204146A
JP2019204146A JP2018096815A JP2018096815A JP2019204146A JP 2019204146 A JP2019204146 A JP 2019204146A JP 2018096815 A JP2018096815 A JP 2018096815A JP 2018096815 A JP2018096815 A JP 2018096815A JP 2019204146 A JP2019204146 A JP 2019204146A
Authority
JP
Japan
Prior art keywords
characters
calculation
character
calculation formula
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018096815A
Other languages
English (en)
Other versions
JP7110723B2 (ja
Inventor
貴久 松永
Takahisa Matsunaga
貴久 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2018096815A priority Critical patent/JP7110723B2/ja
Publication of JP2019204146A publication Critical patent/JP2019204146A/ja
Application granted granted Critical
Publication of JP7110723B2 publication Critical patent/JP7110723B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】演算対象の複数の文字と、これらの文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データから、文字や計算式を抽出して表計算形式等のデータに変換する場合に、誤変換を自動的に修正できるデータ変換装置等を提供する。【解決手段】演算対象の複数の文字と、複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データから、演算対象の複数の文字と計算式と演算結果を示す文字が抽出され、編集可能なデータへ変換される。抽出された演算対象の複数の文字を抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とが比較されることにより、それぞれ抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かが判定され、少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正される。【選択図】図4

Description

この発明は、演算対象の複数の文字と、これらの複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データから、前記文字や計算式を抽出可能な、例えば画像処理装置等のデータ変換装置、このデータ変換装置を備えた画像処理装置及びプログラムに関する。
近年、画像データに対して、例えばOCR(光学文字認識:optical character reader)やICR(インテリジェント文字認識:intelligent character recognition)、あるいはこれらとオブジェクト分離技術を組み合わせた画像解析処理を行うことにより、印刷文字のみならず手書き文字についてもテキストデータ等への高精度な変換を行うことが可能となってきた。それに伴い、変換後のデータをより編集しやすい形式にすることで、利便性の向上が図られてきている。
このような試みの一つに、印刷あるいは手書きされた表を、表計算形式のデータへと変換することが行われている。
具体例を挙げると、図11に示すように、表の縦方向を列、横方向を行とすると、A列2〜5行目の各マス目(セル)に「1Q」「2Q」「3Q」「4Q」の文字列がそれぞれ記載され、A列6行目のセルに「合計」という文字列が記載され、B〜D列1行目の各セルに個人の氏名がそれぞれ記載され、E列1行目のセルに「合計」という文字列が記載された表についての画像データがあるものとする。また、B〜D列2〜5行目の各セルには、個人毎の数値が記載されている。
このような画像データを表計算形式のデータに変換する。具体的には、B〜D列6行目の各セルに各個人毎の1Q〜4Qの合計値が自動計算されて記入されるように計算式を埋め込み、E列2〜5行目の各セルに1Q〜4Q毎の合計値が自動計算されて記入されるように計算式を埋め込み、E列6行目のセルに全部の合計値が自動計算されて記入されるように計算式を埋め込む。従って、例えば破線枠で示すB列6行目のセルB6のデータとしては、「18」という数字ではなく、埋め込まれる計算式である"=sum(B2:B5)"に変換される必要がある。
しかしながら現状では、画像解析処理(特にオフライン手書き文字認識処理)の精度はまだまだ不十分であり、以下のような誤変換が発生する場合がある。
例えば、図4の左側の図に示すような手書きの表を読み取って、同図右側の図に示す表計算形式のデータに変換したときに、オリジナルの手書き表における4Qの数値「8」を「3」と誤変換したとすると、計算式により計算した合計値は13となる。つまり、オリジナルの表では合計値が18であるのに対し、表計算形式のデータに変換したときには、演算対象の数値を誤変換すると計算式による計算結果も誤変換されてしまうことになる。
なお、特許文献1には、項目と数値が記述された表データから集計に使用された計算式を導出してその計算式が埋め込まれた表データを出力する表データ変換方法が提案されており、格子状にマス目(セル)が配列された表データの中の項目名として「合計」「平均」等の特定のキーワードが使用されている場合に、そのキーワードが使用されているセル(キーワード該当セル)と同じ“行”(横方向)または“列”(縦方向)に含まれる数値が登録されているセルを、「合計」のキーワードに対応する集計結果が格納されるセル(集計結果格納セル)に特定し、該集計結果格納セルの数値を、他のセルを参照する計算式に置き換える、もしくは、計算式による計算結果と元々そのセルに登録されていた数値が一致しない場合に、ユーザに計算結果が不一致となる旨を通知して警告することが記載されている。
特開2017−187931号公報
しかし、特許文献1に記載された方法では、計算式による計算結果と元々そのセルに登録されていた数値が一致しない場合に、ユーザに計算結果が不一致となる旨を通知して警告が行われるものの、誤変換の修正はユーザーの手作業により行われるものであり、誤変換を自動的に修正することはできなかった。
この発明は、このような技術的背景に鑑みてなされたものであって、演算対象の複数の文字と、これらの複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データから、文字や計算式を抽出して表計算形式等のデータに変換する場合に、誤変換を自動的に修正することができるデータ変換装置、画像処理装置及びプログラムを低供することを目的とする。
上記目的は、以下の手段によって達成される。
(1)演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付手段と、前記受付手段により受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出手段と、前記入力データを、前記抽出手段により抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換手段と、前記抽出手段より抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定手段と、前記判定手段により少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正手段と、を備えたことを特徴とするデータ変換装置。
(2)前記入力データは計算式を示す文字列を有する表計算形式の画像データであり、前記抽出手段は、前記入力データにおける前記文字列に基づいて前記計算式を抽出するとともに、前記演算対象の複数の文字と演算結果を示す文字を抽出し、前記変換手段は、抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた表計算型データに変換する前項1に記載のデータ変換装置。
(3)前記入力データは演算記号を有する画像データであり、前記抽出手段は、前記演算記号に基づいて前記計算式を抽出し、演算記号で示される被演算領域及び演算結果領域に基づいて、前記演算対象の複数の文字と演算結果を示す文字を抽出する前項1に記載のデータ変換装置。
(4)前記抽出手段による前記文字の抽出は文字認識処理により行われ、前記抽出手段は、文字認識率の最も高い文字を抽出し、前記判定手段により、抽出された少なくとも何れかの文字が誤変換されていると判定された場合、前記修正手段は、その文字を次に文字認識率の高い文字に修正し、前記判定手段は、前記文字の修正後に前記計算式による再計算を行うことにより、その文字について再度誤変換されているか否かを判定する前項1〜3の何れかに記載のデータ変換装置。
(5)計算式が端数処理を含む場合、前記修正手段は、切り捨てか切り上げかの確認を行った後に端数処理を決定することにより、計算式を修正する前項1〜4の何れかに記載のデータ変換装置。
(6)演算対象の複数の文字の一部についての前記抽出手段よる抽出が不可能な場合、前記修正手段は、前記抽出手段より抽出された演算対象の他の文字、計算式、演算結果を示す文字から逆算して、前記一部の文字を適正な文字に修正する前項1〜4の何れかに記載のデータ変換装置。
(7)再計算の結果は別シートに記録される前項4〜6のいずれかに記載のデータ変換装置。
(8)修正後の文字を識別できる態様で再計算の結果が別シートに記録される前項7に記載のデータ変換装置。
(9)前項1〜8の何れかに記載のデータ変換装置を備えた画像処理装置。
(10)演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付ステップと、前記受付ステップにより受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出ステップと、前記入力データを、前記抽出ステップにより抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換ステップと、前記抽出ステップより抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定ステップと、前記判定ステップにより少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正ステップと、をデータ変換装置のコンピュータに実行させるためのプログラム。
前項(1)に記載の発明によれば、演算対象の複数の文字と、複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データが、入力データとして受け付けられ、この受け付けた入力データから、演算対象の複数の文字と計算式と演算結果を示す文字が抽出され、編集可能なデータへ変換される。一方、抽出された演算対象の複数の文字を抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とが比較されることにより、それぞれ抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かが判定され、少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正される。
従って、元の画像データに含まれる文字や計算式から、これらの文字や計算式を抽出して編集可能なデータに変換するときに誤変換が発生しても、誤変換された文字や計算式が自動的に修正されるから、ユーザーが誤変換された文字や計算式を手作業で修正する手間を省くことができる。
前項(2)に記載の発明によれば、計算式を示す文字列を有する表計算形式の画像データにおける前記文字列に基づいて計算式が抽出されるとともに、演算対象の複数の文字と演算結果を示す文字が抽出され、これらの抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた表計算型データに変換される。
前項(3)に記載の発明によれば、演算記号を有する画像データの演算記号に基づいて計算式が抽出され、演算記号で示される被演算領域及び演算結果領域に基づいて、演算対象の複数の文字と演算結果を示す文字が抽出される。
前項(4)に記載の発明によれば、文字の抽出は文字認識処理により行われるとともに、文字認識率の最も高い文字が抽出されるが、抽出された少なくとも何れかの文字が適切でないと判定された場合、その文字は次に文字認識率の高い文字に修正される。そして、修正後に計算式による再計算が行われ、その文字について再度誤変換されているか否かが判定されるから、誤変換の発生をより確実に解消できる。
前項(5)に記載の発明によれば、計算式が端数処理を含む場合、切り捨てかまたは切り上げかの確認を行った後に端数処理が決定され計算式が修正されるから、適正な端数処理を有する計算式に修正できる。
前項(6)に記載の発明によれば、演算対象の複数の文字の一部について抽出が不可能な場合、抽出された演算対象の他の文字、計算式、演算結果を示す文字から逆算して、抽出不可能な一部の文字が適正な文字に修正されるから、確実に誤変換を防止することができる。
前項(7)に記載の発明によれば、再計算の結果は別シートに記録されるから、再計算の前後の結果を容易に確認することができる。
前項(8)に記載の発明によれば、修正後の文字を識別できる態様で再計算の結果が別シートに記録されるから、修正後の文字を容易に認識することができる。
前項(9)に記載の発明によれば、元の画像データに含まれる文字や計算式から、これらの文字や計算式を抽出して編集可能なデータに変換するときに誤変換が発生しても、誤変換された文字や計算式を自動的に修正することができる画像処理装置となる。
前項(10)に記載の発明によれば、元の画像データに含まれる文字や計算式から、これらの文字や計算式を抽出して編集可能なデータに変換するときに誤変換が発生しても、誤変換された文字や計算式を自動的に修正する処理を、データ処理装置のコンピュータに実行させることができる。
データ処理装置を構成する一例としてのパーソナルコンピュータ等の情報処理装置のブロック図である。 データ処理装置を構成する他の例としての画像形成装置のブロック図である。 情報処理装置のCPU及び画像形成装置のCPUによって実現される、画像データから文字や計算式を抽出して編集可能なデータへ変換する機能の構成を示すブロック図である。 この発明の一実施形態による誤変換の修正方法を説明するための図である。 上記の修正方法に用いられる各数値の変換精度を示す表である。 誤変換修正後の状態を示す図である。 この発明の他の実施形態による誤変換の修正方法を説明するための図である。 この発明のさらに他の実施形態による誤変換の修正方法を説明するための図である。 この発明のさらに他の実施形態による誤変換の修正方法を説明するための図である。 第1の実施形態におけるデータ処理装置の誤変換の修正動作を示すフローチャートである。 従来の課題を説明するための図である。
以下、この発明の実施形態を図面に基づいて説明する。
この発明の一実施形態に係るデータ処理装置は、図1に示すようなパーソナルコンピュータ(PCと記す)等の情報処理装置1によって構成されていても良いし、図2に示すような印刷装置等の画像形成装置2によって構成されていても良い。
図1は、データ処理装置を構成する情報処理装置1のブロック図である。
情報処理装置1は、制御部11と、記憶装置12と、入力インターフェース(入力I/F)13と、出力インターフェース(出力I/F)14等を備えている。
制御部11はCPU111とRAM112を備えている。
CPU111は、記憶装置12等に格納されている動作プログラムに従って動作することにより、情報処理装置1の全体を統括的に制御するものである。特にこの実施形態では、演算対象の複数の文字と、これらの複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを入力データとして受け付けるとともに、受け付けた入力データを画像解析処理して文字や計算式を抽出することにより、入力データを、抽出された文字や計算式を用いた編集可能なデータへ変換する等の処理を実行するが、詳細な説明は後述する。
RAM112は、CPU111が動作プログラムに従って動作する際の作業領域となるメモリである。
記憶装置12は例えばハードディスク装置(HDD)等からなり、CPU111の動作プログラム、各種のアプリケーション、その他のデータを記憶する。
入力インターフェース13は外部装置3から送信される各種のデータを受信する受信手段として機能し、出力インターフェース14はデータ処理装置1から外部装置3へ各種のデータを送信する送信手段として機能する。
図2は、データ処理装置を構成する画像形成装置2のブロック図である。
画像形成装置2は、制御部21と、記憶装置22と、操作パネル23と、画像入力部24と、画像印刷部25と、入力インターフェース(入力I/F)26と、出力インターフェース(出力I/F)27等を備えている。
制御部21はCPU211とRAM212とROM213を備えている。
CPU211は、ROM213や記憶装置22等に格納されている動作プログラムに従って動作することにより、画像形成装置2の全体を統括的に制御し、印刷機能等を実行させるものである。さらにこの実施形態では、CPU211は、演算対象の複数の文字と、これら複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを入力データとして受け付けるとともに、受け付けた入力データを画像解析して文字や計算式を抽出することにより、入力データを、抽出された文字や計算式を用いた編集可能なデータへ変換する等の処理を実行するが、詳細な説明は後述する。
RAM212は、CPU211が動作プログラムに従って動作する際の作業領域となるメモリであり、ROM213は、CPU211の動作プログラム等を格納するメモリである。
記憶装置22は例えばハードディスク装置(HDD)等からなり、各種のアプリケーションやその他のデータを記憶する。
操作パネル23はユーザーによる画像形成装置2の操作やユーザーへのメッセージの通知等に使用されるものであり、タッチパネルを備えた表示部やスタートキー、ストップキー等を備えている。
画像入力部24はスキャナ装置を備え、原稿の画像を読み取って画像データに変換するものであり、画像印刷部25は、画像入力部24で得られた画像データや、外部装置3から送信されるプリントデータを用紙に印刷するものである。
入力インターフェース26は外部装置3から送信されるプリントデータやその他のデータを受信する受信手段として機能し、出力インターフェース27はデータ処理装置1から外部装置3へ各種のデータを送信する送信手段として機能する。
なお外部装置3は情報処理装置1や画像形成装置3以外の他の情報処理装置や他の画像形成装置等である。
図3は、情報処理装置1のCPU111及び画像形成装置2のCPU211によって実現される、画像データから文字や計算式を抽出して編集可能なデータへ変換する機能の構成を示すブロック図である。
CPU111及びCPU211は、機能的に、画像処理部41と、項目部/数値部分離部42と、演算候補セル特定部43と、演算対象グループ抽出部44と、変換結果加工部45を備えている。
画像処理部41は、入力データとして受け付けた表形式等の画像データD1を画像処理し、罫線、文字等のオブジェクトを分離すると共に、OCR処理等により文字を抽出し、表データD2とする。項目部/数値部分離部42は、抽出された文字等を基に例えば「合計」「平均」「田中」「1Q」「2Q」といった表の項目部分と、「4」「2」といった数値部分を分離する。
なお、入力データとしての画像データは、外部装置3から情報処理装置1や画像形成装置2に入力されても良いし、画像形成装置2の画像入力部24で画像を読み取ることにより取得されても良い。
演算候補セル特定部43は、項目部分に記載された「合計」「平均」等の文字列から、計算式を抽出特定すると共に、文字列が指し示す被演算領域つまり数値が演算されるセル(マス目)と、演算結果領域つまり演算結果が記載されるセルを特定する。演算対象グループ抽出部44は、各行(横方向)及び各列(縦方向)の複数のセルのうち演算対象グループを構成するセルを抽出する。
変換結果加工部45は、抽出した項目や数値を各セルに記述し、演算結果を示すセルに抽出した計算式を埋め込んで、編集可能な表計算形式のデータに変換するとともに、演算対象グループのセルに記述した数値を計算式に従って演算する。そして、演算結果と、元の画像データから抽出された演算結果を示す文字(数値)とを比較することで、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定し、少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正して、容易に再編集可能な表データD3とする。以下に具体例を説明する。
[第1の実施形態]
この例では数字の「8」と「3」が誤変換される場合を示す。
図4左側の図は元の手書きによる表計算形式の画像であり、田中さんについて1Q、2Q、3Q、4Qに対応する各数値が4、2、4、8となっており、4Qの下のセルの文字列が「合計」となっている。従って、被演算領域のセルの各数値を合計した「18」が、演算結果領域のセルに記載されている。
図4左側の図に示す画像を画像データとして入力し、文字認識処理を含む画像解析処理により文字、計算式を抽出し、表計算形式のデータに変換した状態を同図の右側の図に示す。A列2〜5行の各セルA2〜A5に、抽出されたそれぞれ1Q、2Q、3Q、4Qの文字が記載され、A列6行のセルA6に、抽出された「合計」の文字が記載され、B列1行のセルB1に抽出された「田中」の文字が記載され、B列2〜5行の各セルB2〜B5に、抽出された4、2、4、3の各文字が記載されている。文字列「合計」と各数値等との記載から、被演算領域はB列2〜5行のセルB2〜B5であり、抽出された計算式が埋め込まれる演算結果を示す領域(演算結果領域)はB列6行のセルB6となる。
また、計算式としては、被演算領域であるセルB2〜B5の数値を加算する"=sum(B2:B5)"となる。
また、図4の左右の図の比較から理解されるように、元の画像データにおける4Qの数値「8」がセルB5において「3」と誤変換されている。その結果、計算式による合計値は4+2+4+3=13となり、画像解析処理により抽出された元の画像データの合計値18とは相違する。
そこで、図3に示した変換結果加工部45は、誤変換があると判定し、文字認識処理を実行するアプリケーションが有する文字認識率である各数値の変換精度を再確認し、次に可能性の高い数値を用いて再計算を行う。
各数値の変換精度の一例を図5の表に示す。同図に示すように、4、2、4、3、18の各数値が第1候補として高い変換精度を示しており、これらの数値がまず抽出されるが、上述したように誤変換がある場合は、第2候補の中から最も可能性の高いもの、換言すれば最も文字認識率の高い数値を選択する。図5の例ではハッチングを付した89%の「8」が該当し、最初に抽出されセルB5に記載された数値「3」を「8」に修正し、演算結果領域のセルB6に埋め込まれた計算式により再計算する。
再計算の結果、図6に示すように、計算式"=sum(B2:B5)"により数式変換した値は18となり、元の画像の文字列から変換された数値18と一致する。このため、セルB5の数値を修正値「8」に確定する。
このように、元の画像データに含まれる文字や計算式から、これらの文字や計算式を抽出して編集可能なデータに変換するときに誤変換が発生しても、誤変換された文字や計算式が自動的に修正されるから、ユーザーが誤変換された文字や計算式を手作業で修正する必要はなくなり、修正の手間を省くことができる。
[第2の実施形態]
この実施形態は、計算式が「合計」ではなく「平均」を求める式であるために、除算による端数処理が計算式に含まれる場合を示している。
図7の左側の図は元の手書きによる表計算形式の画像であり、田中さんについて1Q、2Q、3Q、4Qに対応する数値が4、2、4、8となっており、4Qの下のセルの文字列が「平均」となっている。また、被演算領域のセルの各数値を平均して端数を切り捨てた「4」が、演算結果領域のセルに記載されている。
図7の左側の図に示す画像を画像データとして入力し、文字認識処理を含む画像解析処理して文字、計算式を抽出し、表計算形式のデータに変換した状態を同図右側の図に示す。A列2〜5行の各セルA2〜A5に、抽出されたそれぞれ1Q、2Q、3Q、4Qの文字が記載され、A列6行のセルA6に、抽出された「平均」の文字が記載され、B列1行のセルB1に抽出された「田中」の文字が記載され、B列2〜5行の各セルB2〜B5に、抽出された4、2、4、8の各文字が記載されている。文字列「平均」と各数値等との記載から、被演算領域はB列2〜5行のセルB2〜B5であり、抽出された計算式が埋め込まれる演算結果領域はB列6行のセルB6となる。
また、計算式としては、被演算領域であるセルB2〜B5の数値の平均値を求める"=AVERAGE(Bsum(B2:B5)"であり、この計算式に従って演算した結果は4.5であるが、切り捨てかまたは切り上げかを確認するために四捨五入すると、図7の右側の図に示すように5となる。
一方、画像解析処理により抽出され変換された元の画像データの平均値は4であり、両者が相違する。
そこで、図3に示した変換結果加工部45は、計算式の端数処理に誤変換があると判定し、計算式における端数処理は四捨五入や切り上げではなく切り捨てと判断し、計算式に反映する。
このように、計算式が端数処理を含む場合、切り捨てかまたは切り上げかの確認を行った後に端数処理が決定され計算式が修正されるから、適正な端数処理を有する計算式に修正できる。
[第3の実施形態]
この実施形態は、変換対象の数値のうち、一部が変換不能な記載状態であっても、他の数値及び表の記載内容から逆算して、変換する場合を示している。
図8の左側の図は元の手書きによる表計算形式の画像であり、田中さんについて1Q、3Q、4Qに対応する各数値が4、4、8となっており、4Qの下のセルの文字列が「合計」となっているが、2Qに対応する数値は不明である。
また、被演算領域のセルの各数値を合計した「18」が、演算結果領域のセルに記載されている。
図8の左側の図に示す画像を画像データとして入力し、文字認識処理を含む画像解析処理して文字、計算式を抽出し、表計算形式のデータに変換した状態を同図右側の図に示す。A列2〜5行の各セルA2〜A5に、抽出されたそれぞれ1Q、2Q、3Q、4Qの文字が記載され、A列6行のセルA6に、抽出された「合計」の文字が記載され、B列1行のセルB1に抽出された「田中」の文字が記載され、B列2、4、5行の各セルB2、B4、B5に、抽出された4、4、8の各文字が記載される。ただし、B列3行のセルB3については、読み取れず変換不能となる。文字列「合計」と各数値等との記載から、被演算領域はセルB2〜B5であり、抽出された計算式が埋め込まれる演算結果領域はB列6行のセルB6となる。
また、計算式としては、被演算領域であるセルB2〜B5の数値を加算する"=sum(B2:B5)"となるが、B列3行のセルB3の数値が不明であるから計算式による演算を行うことができない。
そこで、図3に示した変換結果加工部45は、誤変換があると判定し、元の画像データから抽出された演算対象の各数値文字4、4、8と演算結果を示す数値18を用いて逆算する。つまり、演算結果を示す数値18から他の数値を減算し(18−4−4−8=2)、数値2を求める。
そして、変換結果加工部45はB列3行のセルB3の数値として2を当てはめ、計算式により再計算する。再計算の結果、図8に示すように、計算式"=sum(B2:B5)"により数式変換した値は18となり、元の画像の数値18と一致する。
このように、演算対象の複数の文字の一部について抽出が不可能な場合、抽出された演算対象の他の文字、計算式、演算結果を示す文字から逆算して、抽出不可能な一部の文字が適正な文字に修正されるから、確実に誤変換を防止することができる。
[第4の実施形態]
この実施形態は、元のデータが表形式ではなく、計算式がそのまま記載されている場合を示すものである。
図9は元の手書きによる画像であり、「2+4+8=14」が記載されている。この画像を画像データとして入力し、文字認識処理を含む画像解析処理して文字、計算式を抽出する。具体的には、左辺に「+」「=」の演算記号に基づいて、左辺を被演算領域と判定し、右辺を演算結果領域と判定する。そして、「+」の演算記号から左辺の数値を加算する計算式を抽出する。
ここで、左辺の「8」を「3」と誤変換したとすると、抽出した左辺の数値を抽出した計算式により加算すると、合計値は9となり、抽出された演算結果の数値14と相違する。
そこで、図3に示した変換結果加工部45は、誤変換があると判定し、第1の実施形態と同様に、文字認識処理を実行するアプリケーションが有する文字認識率である各数値の変換精度(図5参照)を再確認し、次に可能性の高い数値を用いて再計算を行う。
具体的には、第2候補の中から最も可能性の高いもの、換言すれば最も文字認識率の高い数値を選択する。図5の例では「8」が該当し、最初に抽出された「3」に対応する数値「3」を「8」に修正し、抽出された計算式により再計算する。
再計算の結果、計算式により数式変換した値は14となり、元の画像の文字列から変換された数値14と一致する。このため、修正値「8」を確定する。
このように、この実施形態によれば、画像データの演算記号に基づいて計算式を抽出でき、演算記号で示される被演算領域及び演算結果領域に基づいて、演算対象の複数の文字と演算結果を示す文字を抽出できる。
図10は、図4〜図6で説明した第1の実施形態におけるデータ処理装置1、2の誤変換の修正動作を示すフローチャートである。この動作は、データ処理装置1、2のCPU111、211が記憶装置12、22等に保存された動作プログラムに従って動作することにより実行される。
ステップS01で画像データの入力を受け付けたのち、ステップS02で画像解析処理を実行し、ステップS03で「合計」「平均」「+」「=」等の文字(キーワード)を抽出したかどうかを判断する。抽出しなければ(ステップS03でNO)、変換できないので処理を終了する。抽出した場合(ステップS03でYES)、ステップS04に進む。
ステップS04では、キーワードの対象となる被演算領域と演算結果を示す演算結果領域を抽出したのち、ステップS05で、演算結果領域を表計算式に変換する。つまり計算式を抽出し、演算結果領域に埋め込む。
次いでステップS06で変数nを0にセットし、Tに被演算個数+1をセットする。例えば被演算個数が4個の場合、T=5にセットする。
次に、ステップS07で、計算式による演算結果と、元の画像データの演算結果領域に記載されていた文字列の変換結果を比較する。同一であれば(ステップS07で「=」)、全て適正に変換されたので、処理を終了する。同一でなければ(ステップS07で「≠」)、ステップS08でn=Tかどうかを判断する。
n=Tでなければ(ステップS08でNO)、ステップS09で、図5に示す変換精度の一覧の中から、第2候補中のn番目に変換精度の高いものを取得して一時差し替えたのち、ステップS10で、差し替えた数値を用いて計算式により再計算を行い、ステップS11に進む。再計算の結果は、ユーザーが容易に確認できるように、変換結果を示すシートとは別のシートに記録されるのが良い。また、修正後の数字を識別できる態様で再計算の結果が記録されるのが望ましい。
ステップS11ではnをn+1にセットしたのち、ステップS07に戻る。
ステップS07では、再度、計算式による演算結果と文字列の変換結果を比較する。このような処理をステップS08でn=Tと判断されるまで行う。ステップS08でn=Tと判断されると(ステップS08でYES)、適正な変換ができないので、ステップS12で、警告画面を表示することによりユーザーに通知する。
1 情報処理装置(データ処理装置)
2 画像形成装置(データ処理装置)
3 外部装置
11、21 制御部
111、211 CPU
41 画像処理部
42 項目部/数値部分離部
43 演算候補セル特定部
44 演算対象グループ抽出部
45 変換結果加工部

Claims (10)

  1. 演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付手段と、
    前記受付手段により受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出手段と、
    前記入力データを、前記抽出手段により抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換手段と、
    前記抽出手段より抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定手段と、
    前記判定手段により少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正手段と、
    を備えたことを特徴とするデータ変換装置。
  2. 前記入力データは計算式を示す文字列を有する表計算形式の画像データであり、
    前記抽出手段は、前記入力データにおける前記文字列に基づいて前記計算式を抽出するとともに、前記演算対象の複数の文字と演算結果を示す文字を抽出し、
    前記変換手段は、抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた表計算型データに変換する請求項1に記載のデータ変換装置。
  3. 前記入力データは演算記号を有する画像データであり、
    前記抽出手段は、前記演算記号に基づいて前記計算式を抽出し、演算記号で示される被演算領域及び演算結果領域に基づいて、前記演算対象の複数の文字と演算結果を示す文字を抽出する請求項1に記載のデータ変換装置。
  4. 前記抽出手段による前記文字の抽出は文字認識処理により行われ、前記抽出手段は、文字認識率の最も高い文字を抽出し、
    前記判定手段により、抽出された少なくとも何れかの文字が誤変換されていると判定された場合、前記修正手段は、その文字を次に文字認識率の高い文字に修正し、
    前記判定手段は、前記文字の修正後に前記計算式による再計算を行うことにより、その文字について再度誤変換されているか否かを判定する請求項1〜3の何れかに記載のデータ変換装置。
  5. 計算式が端数処理を含む場合、前記修正手段は、切り捨てか切り上げかの確認を行った後に端数処理を決定することにより、計算式を修正する請求項1〜4の何れかに記載のデータ変換装置。
  6. 演算対象の複数の文字の一部についての前記抽出手段よる抽出が不可能な場合、前記修正手段は、前記抽出手段より抽出された演算対象の他の文字、計算式、演算結果を示す文字から逆算して、前記一部の文字を適正な文字に修正する請求項1〜4の何れかに記載のデータ変換装置。
  7. 再計算の結果は別シートに記録される請求項4〜6のいずれかに記載のデータ変換装置。
  8. 修正後の文字を識別できる態様で再計算の結果が別シートに記録される請求項7に記載のデータ変換装置。
  9. 請求項1〜8の何れかに記載のデータ変換装置を備えた画像処理装置。
  10. 演算対象の複数の文字と、前記複数の文字を所定の計算式で演算したときの演算結果を示す文字とを含む画像データを、入力データとして受け付ける受付ステップと、
    前記受付ステップにより受け付けた入力データから、前記演算対象の複数の文字と前記計算式と演算結果を示す文字を抽出する抽出ステップと、
    前記入力データを、前記抽出ステップにより抽出された演算対象の複数の文字と計算式と演算結果を示す文字を用いた編集可能なデータへ変換する変換ステップと、
    前記抽出ステップより抽出された演算対象の複数の文字を、抽出された計算式で演算したときの演算結果と、抽出された演算結果を示す文字とを比較することにより、抽出された演算対象の各文字、計算式、演算結果を示す文字の少なくとも何れかが誤変換されているか否かを判定する判定ステップと、
    前記判定ステップにより少なくとも何れかが誤変換されていると判定された場合、適正な文字若しくは計算式に修正する修正ステップと、
    をデータ変換装置のコンピュータに実行させるためのプログラム。
JP2018096815A 2018-05-21 2018-05-21 データ変換装置、画像処理装置及びプログラム Active JP7110723B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018096815A JP7110723B2 (ja) 2018-05-21 2018-05-21 データ変換装置、画像処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018096815A JP7110723B2 (ja) 2018-05-21 2018-05-21 データ変換装置、画像処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2019204146A true JP2019204146A (ja) 2019-11-28
JP7110723B2 JP7110723B2 (ja) 2022-08-02

Family

ID=68726916

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018096815A Active JP7110723B2 (ja) 2018-05-21 2018-05-21 データ変換装置、画像処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP7110723B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767884A (zh) * 2020-07-07 2020-10-13 北京猿力未来科技有限公司 图像处理方法及装置
KR102667631B1 (ko) * 2023-11-28 2024-05-22 한화시스템(주) 다출처데이터 계보관계 분석 시스템 및 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10177334A (ja) * 1996-12-18 1998-06-30 Brother Ind Ltd 演算学習機
JP2000172784A (ja) * 1998-12-03 2000-06-23 Ricoh Co Ltd 文字認識方法
JP2001325562A (ja) * 2000-05-17 2001-11-22 Minolta Co Ltd 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2016200900A (ja) * 2015-04-08 2016-12-01 シャープ株式会社 画像読取装置、画像読取方法及びコンピュータプログラム
JP2017187931A (ja) * 2016-04-06 2017-10-12 コニカミノルタ株式会社 表データ変換方法、プログラム、画像読取装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10177334A (ja) * 1996-12-18 1998-06-30 Brother Ind Ltd 演算学習機
JP2000172784A (ja) * 1998-12-03 2000-06-23 Ricoh Co Ltd 文字認識方法
JP2001325562A (ja) * 2000-05-17 2001-11-22 Minolta Co Ltd 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2016200900A (ja) * 2015-04-08 2016-12-01 シャープ株式会社 画像読取装置、画像読取方法及びコンピュータプログラム
JP2017187931A (ja) * 2016-04-06 2017-10-12 コニカミノルタ株式会社 表データ変換方法、プログラム、画像読取装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767884A (zh) * 2020-07-07 2020-10-13 北京猿力未来科技有限公司 图像处理方法及装置
KR102667631B1 (ko) * 2023-11-28 2024-05-22 한화시스템(주) 다출처데이터 계보관계 분석 시스템 및 방법

Also Published As

Publication number Publication date
JP7110723B2 (ja) 2022-08-02

Similar Documents

Publication Publication Date Title
US9697193B2 (en) Associating captured image data with a spreadsheet
JP4742404B2 (ja) 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
US10885325B2 (en) Information processing apparatus, control method, and storage medium
US9286526B1 (en) Cohort-based learning from user edits
US10142499B2 (en) Document distribution system, document distribution apparatus, information processing method, and storage medium
JP5771108B2 (ja) 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム
US11941903B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium
EP4191433A1 (en) Method, device, and system for analyzing unstructured document
US12148234B2 (en) Information processing with iteratively improved estimates of data attributes based on user modifications, and apparatus, method, and storage medium thereof
US11113558B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program for character string extraction
JP2019204146A (ja) データ変換装置、画像処理装置及びプログラム
JP5942361B2 (ja) 画像処理装置及び画像処理プログラム
EP4036871A1 (en) Image processing apparatus, image processing method, program and storage medium
JP6680052B2 (ja) 表データ変換方法、プログラム、画像読取装置
US11972208B2 (en) Information processing device and information processing method
US11170211B2 (en) Information processing apparatus for extracting portions filled with characters from completed document without user intervention and non-transitory computer readable medium
JP2017102587A (ja) 情報処理装置、画像読み取り装置、画像形成装置、および、プログラム
US12591743B2 (en) Information processing apparatus, information processing method, and storage medium for extracting a named entity from a document
JP7021496B2 (ja) 情報処理装置及びプログラム
JP2020087112A (ja) 帳票処理装置および帳票処理方法
JP2023081040A (ja) 文書電子化システム、情報処理装置、文書分割方法、学習方法およびプログラム
US11574490B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP7848537B2 (ja) 情報処理装置およびプログラム
JP7644282B1 (ja) 情報処理システム、情報処理方法、およびプログラム
JP5644247B2 (ja) 文字認識装置、文字認識方法及び文字認識プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220704

R150 Certificate of patent or registration of utility model

Ref document number: 7110723

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150