JP2020021273A

JP2020021273A - 画像読取装置

Info

Publication number: JP2020021273A
Application number: JP2018144368A
Authority: JP
Inventors: 松前　慶作; Keisaku Matsumae; 慶作松前
Original assignee: Kyocera Document Solutions Inc
Current assignee: Kyocera Document Solutions Inc
Priority date: 2018-07-31
Filing date: 2018-07-31
Publication date: 2020-02-06
Also published as: US10943108B2; US20200042786A1

Abstract

【課題】文字認識の誤りを適正に補正できるようにする。【解決手段】原稿載置面に載置された複数の原稿を、１回の読取ジョブで一括して読み取り可能な原稿読取部６と、原稿読取部６による読み取りで得られた画像データから、原稿毎に独立した個別画像を切り抜く加工処理を行う個別画像切抜部１０３と、個別画像の画像データに対して文字認識の処理を行い、個別画像上に存在する文字列を検出する文字列検出部１０４と、文字列について、内容が同じ又は類似するもの同士を同一情報として個別画像間で比較して、一致しない部分を検出する不一致検出部１０５と、当該一致しない部分について、多数派の文字の占める割合が予め定められた割合に達していると判断部１０６が判断した場合、少数派の文字を多数派の文字に置き換えることによって文字の補正を行う補正部１０７と、を備える。【選択図】図１

Description

本発明は、画像読取装置に関し、特に、複数の原稿を読み取って得た画像から解析した文字列を補正する技術に関する。

画像読取装置には、原稿載置面（例えば、コンタクトガラス）に載置された複数の原稿を一括して読み取って、それぞれを原稿毎に独立した個別画像として自動的に切り抜く機能（いわゆる、マルチクロップ機能）を有しているものがある。

このような機能を用いて、画像読取装置に、原稿載置面に載置された複数の名刺を読み取らせ、名刺を管理するという技術がある。また、画像読取装置に、名刺の一方面をまず読み取らせ、ユーザーにより裏返された後、名刺の他方面を読み取らせ、名刺の表面と裏面とを合わせて管理するという技術がある（例えば、下記の特許文献１，２を参照）。

特開２００６−３３９７７０号公報特開２０１３−２５０７２５号公報

名刺などの原稿を画像読取装置に読み取らせて、名刺情報の管理を行う場合に、ＯＣＲ（Optical Character Recognition）処理を行って文字を認識して、文字情報として名刺情報をデータベースに登録するということが一般的に行われている。

その際、ＯＣＲ処理による文字の認識が全て正しく行われれば問題はないが、文字のサイズが小さかったり、解像度が低かったり、文字認識の困難なフォントが使用されていたり、画像に汚れがあったりすると、文字の認識に誤りが生じ、ユーザーによる手動での補正が必要になる場合がある。

上記の特許文献１には、ＯＣＲ処理を行った結果から、原稿の表面と裏面とを紐づける技術について記載されているが、文字認識に誤りが生じた場合にこれを解決する技術を示していない。

本発明は、上記の事情に鑑みなされたものであり、文字認識の誤りを適正に補正できるようにすることを目的とする。

本発明の一局面に係る画像読取装置は、原稿載置面に載置された複数の原稿を、１回の読取ジョブで一括して読み取り可能な原稿読取部と、前記原稿読取部による読み取りで得られた画像データから、原稿毎に独立した個別画像を切り抜く加工処理を行う個別画像切抜部と、前記個別画像切抜部により切り抜かれた個別画像の画像データに対して文字認識の処理を行い、個別画像上に存在する文字列を検出する文字列検出部と、前記文字列検出部が検出した文字列について、内容が同じ又は類似するもの同士を同一情報として個別画像間で比較して、一致しない部分を検出する不一致検出部と、前記一致しない部分について、前記同一情報の中で多数派の文字の占める割合が予め定められた割合に達しているか否かを判断する判断部と、前記判断部により、多数派の文字の占める割合が前記予め定められた割合に達していると判断された場合、前記同一情報の中で少数派の文字を多数派の文字に置き換えることによって文字の補正を行う補正部と、を備える。

本発明によれば、個別画像から検出された文字列について、内容が同じ又は類似するものを同一情報として個別画像間で比較することで、一致しない部分が検出され、一致しない部分について、多数派の文字の占める割合が予め定められた割合に達している場合、少数派の文字を多数派の文字に置き換えることによって文字の補正が行われる。

例えば、４つの個別画像のうちの３つに文字列「佐藤太郎」を検出し、残りの１つに文字列「佐藤大郎」を検出したとき（つまり、３文字目が前者は「太」であるのに対し、後者は「大」であるとき）、上記予め定められた割合が過半数であるとすると、一致しない３文字目について、多数派の文字の占める割合が７５％で過半数に達するので、少数派の文字「大」が多数派の文字「太」に置き換えられる。これにより、少数派の文字が、文字認識の誤りと判定され、多数派の文字に自動的に置き換えられるので、文字認識の誤りを適正に補正することができる。

本発明の第１実施形態に係る画像読取装置を備えてなる、画像形成装置の主要内部構成を概略的に示した機能ブロック図である。第１実施形態に係る画像読取装置を備えてなる、画像形成装置の外観を示した斜視図である。コンタクトガラスに原稿が載置された状態の一例を示し、下方から見た図である。個別画像切抜部により切り抜かれた個別画像の一例を示した図である。文字列検出部により検出された文字列の一例を示した図である。表示部に表示される操作画面の一例を示した図である。第１実施形態に係る画像読取装置の一実施形態としての画像形成装置の制御ユニットで行われる処理の一例を示したフローチャートである。第１実施形態に係る画像読取装置の一実施形態としての画像形成装置の制御ユニットで行われる処理の一例を示したフローチャートである。文字列リストの一例を示した図である。第２実施形態に係る画像読取装置の一実施形態としての画像形成装置の制御ユニットで行われる処理の一例を示したフローチャートである。コンタクトガラスに原稿が載置された状態の一例を示し、下方から見た図である。コンタクトガラスに原稿が載置された状態の一例を示し、下方から見た図である。個別画像切抜部により切り抜かれた個別画像の一例を示した図である。

以下、本発明の一実施形態に係る画像読取装置について図面を参照して説明する。図１は、本発明の第１実施形態に係る画像読取装置を備えてなる、画像形成装置の主要内部構成を概略的に示した機能ブロック図であり、図２は、第１実施形態に係る画像読取装置を備えてなる、画像形成装置の外観を示した斜視図である。

画像形成装置１は、例えば、コピー機能、プリンター機能、スキャナー機能、及びファクシミリ機能のような複数の機能を兼ね備えた複合機である。画像形成装置１は、制御ユニット１０、原稿給送部６、原稿読取部５、画像形成部１２、定着部１３、給紙部１４、及び操作部４７を備える。

画像形成装置１で原稿読取動作が行われる場合について説明する。原稿給送部６により搬送されてきた原稿、又はコンタクトガラス１６１に載置されている原稿の画像を、原稿読取部５が光学的に読み取り、そして画像データを生成する。原稿読取部５により生成された画像データは、図略の画像メモリー等に保存される。また、原稿読取部５は、コンタクトガラス１６１に載置された複数の原稿を一括して読み取り可能に構成されている。なお、コンタクトガラス１６１は、特許請求の範囲における原稿載置面の一例である。

また、原稿給送部６は、原稿読取部５の上面にヒンジ等によって開閉可能に構成され、原稿給送部６は、原稿マット６１を備え、コンタクトガラス１６１上に載置された原稿を読み取る場合に原稿押さえカバーとして機能する。

画像形成装置１で画像形成動作が行われる場合について説明する。原稿読取動作により生成された画像データや、ネットワーク接続された外部装置としてのコンピューターから受信した画像データ等に基づいて、画像形成部１２が、給紙部１４から給紙される記録媒体としての記録紙にトナー像を形成する。

定着部１３は、熱圧着によりトナー像を記録紙に定着させるものであり、定着処理が施された記録紙は排出トレイ１５１に排出される。給紙部１４は、給紙カセットを備える。

操作部４７は、画像形成装置１が実行可能な各種動作及び処理について、操作者から、画像形成動作実行指示等の指示を受け付ける。操作部４７は、操作者への操作案内等を表示する表示部４７３を備えている。表示部４７３はタッチパネルになっており、操作者は画面表示されるボタンやキーに触れて画像形成装置１を操作することができる。

制御ユニット１０は、プロセッサー、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、及び専用のハードウェア回路を含んで構成される。プロセッサーは、例えばＣＰＵ（Central Processing Unit）、ＡＳＩＣ（Application Specific Integrated Circuit）、又はＭＰＵ（Micro Processing Unit）等である。制御ユニット１０は、制御部１００と、操作受付部１０１と、個別画像切抜部１０３と、文字列検出部１０４と、不一致検出部１０５と、判断部１０６と、補正部１０７とを備えている。

上記プロセッサーが、ＨＤＤ（Hard Disk Drive）９２に記憶されている制御プログラムに従った動作を行うことにより、制御ユニット１０は、制御部１００、操作受付部１０１、個別画像切抜部１０３、文字列検出部１０４、不一致検出部１０５、判断部１０６、及び補正部１０７として機能する。但し、制御部１００等は、制御ユニット１０による制御プログラムに従った動作によらず、それぞれハードウェア回路により構成することも可能である。以下、特に触れない限り、各実施形態について同様である。

制御部１００は、画像形成装置１の全体的な動作制御を司る。制御部１００は、原稿給送部６、原稿読取部５、画像形成部１２、定着部１３、給紙部１４、及び操作部４７と接続され、これら各部の駆動制御等を行う。

操作受付部１０１は、操作部４７を介したユーザーからの操作入力を受け付ける。また、操作受付部１０１は、補正受付部１０２を備えている。なお、補正受付部１０２の詳細については、後で説明する。

個別画像切抜部１０３は、原稿読取部５による読み取りで得られた画像データから、原稿毎に独立した個別画像を切り抜く加工処理を行う。個別画像切抜部１０３は、例えば、原稿読取部５による読み取りで得られた画像データに対してエッジ検出処理を実行し、エッジ画像を検出する。そして、個別画像切抜部１０３は、原稿読取部５による読み取りで得られた画像データであって、上記エッジ画像を検出した画像データから、１つのかたまりとしてエッジ画像により四辺が囲まれた矩形画像を上記個別画像として切り抜く処理を行う。

図３は、コンタクトガラス１６１に複数の原稿が載置された状態の一例を示し、下方から見た図である。図３に示したように、複数の原稿Ｍ１〜Ｍ３（例えば、名刺）がコンタクトガラス１６１に載置され、これらを原稿読取部５により読み取った場合、当該読取で得られた画像データに基づいて、原稿Ｍ１〜Ｍ３に対応する矩形画像が個別画像Ｇ１〜Ｇ３（図４を参照）として個別画像切抜部１０３により切り抜かれる。

図４は、個別画像切抜部１０３により切り抜かれた個別画像の一例を示した図である。個別画像Ｇ１〜Ｇ３には、例えば、役職（含まない場合あり）、名前、会社名、会社ロゴ、顔写真、電話番号、住所、メールアドレス、及びホームページアドレスが含まれている。

文字列検出部１０４は、個別画像切抜部１０３により切り抜かれた個別画像の画像データに対して、ＯＣＲ技術等を用いて文字認識の処理を行い、個別画像上に存在する文字列を検出する。

例えば、文字列検出部１０４は、個別画像Ｇ１（図４）から「課長」、「佐藤太郎」、「ＡＢＣ株式会社」、「06-1234-5678」、「大阪市中心地１−２−３」、「sato＠abc.com」、及び「http://www.abc.com」の文字列を検出する。

また、文字列検出部１０４は、個別画像Ｇ２（図４）から「鈴木二郎」、「ＡＢＣ株式会社」、「06-1234-5678」、「大阪市中心地１−２−３」、「suzuki＠abc.com」、及び「http://www.abc.com」の文字列を検出し、個別画像Ｇ３（図４）から「係長」、「高橋花子」、「ＡＢＣ株式会社」、「06-1234-5678」、「大阪市中心地１−２−３」、「takahashi＠abc.com」、及び「http://www.abc.com」の文字列を検出する。

しかしながら、文字列検出部１０４が、個別画像Ｇ１〜Ｇ３上に存在する文字列を間違いなく全てを正確に検出できるとは限らない。図５は、文字列検出部１０４により検出された文字列の一例を示した図である。なお、正しく認識されなかった部分については、破線で囲んで強調している。

図５から、文字列検出部１０４が、個別画像Ｇ１上に存在する住所の「３」を「８」と、個別画像Ｇ２上に存在する住所の「３」を「９」と、同ホームページアドレスの「／／」を「１１」と、個別画像Ｇ３上に存在する電話番号の「５」を「Ｓ」と、それぞれ誤って認識し、同ホームページアドレスの最後の「ｍ」を認識できていないことが分かる。

不一致検出部１０５は、文字列検出部１０４が検出した文字列について、内容が同じ又は類似するもの同士を同一情報として個別画像間で比較して、一致しない部分を検出する。例えば、不一致検出部１０５は、文字列を構成する文字の一致率が予め定められた値（例えば、７０％）以上のものを同一情報として扱う。

例えば、個別画像Ｇ１〜Ｇ３から検出された文字列「ＡＢＣ株式会社」を構成する文字の一致率は１００％であるので、不一致検出部１０５は、これらを同一情報として扱う。また、個別画像Ｇ１，Ｇ２から検出された文字列「06-1234-5678」を構成する文字と個別画像Ｇ３から検出された文字列「06-1234-S678」を構成する文字の一致率は９０％であるので、不一致検出部１０５は、これらも同一情報として扱う。

同様に、不一致検出部１０５は、個別画像Ｇ１から検出された文字列「大阪市中央地１−２−８」、個別画像Ｇ２から検出された文字列「大阪市中央地１−２−９」、及び個別画像Ｇ３から検出された文字列「大阪市中央地１−２−３」を同一情報として、個別画像Ｇ１〜Ｇ３から検出された文字列「@abc.com」を同一情報として、そして、個別画像Ｇ１から検出された文字列「http://www.abc.com」、個別画像Ｇ２から検出された文字列「http:11www.abc.com」、及び個別画像Ｇ３から検出された文字列「http://www.abc.co」を同一情報として扱う。

そして、不一致検出部１０５は、例えば、個別画像Ｇ１，Ｇ２から検出された文字列「06-1234-5678」、及び個別画像Ｇ３から検出された文字列「06-1234-S678」を比較し、一致しない部分として、９文字目（個別画像Ｇ１，Ｇ２では「５」であるが、個別画像Ｇ３では「Ｓ」である）を検出する。

また、不一致検出部１０５は、例えば、個別画像Ｇ１から検出された文字列「大阪市中央地１−２−８」、個別画像Ｇ２から検出された文字列「大阪市中央地１−２−９」、及び個別画像Ｇ３から検出された文字列「大阪市中央地１−２−３」を比較し、一致しない部分として、１１文字目（個別画像Ｇ１では「８」、個別画像Ｇ２では「９」、個別画像Ｇ３では「３」）を検出する。

なお、第１実施形態では、不一致検出部１０５が、文字列検出部１０４が検出した文字列について、内容が同じ又は類似するもの同士を同一情報として扱う場合について説明しているが、別の実施形態として、文字列検出部１０４が、個別画像上に存在する文字列を検出すると共に、当該文字列の個別画像上の位置を検出するようにし、不一致検出部１０５が、上記文字列について、個別画像上の位置を検出し、当該位置が同じ又は近似し、なおかつ内容が同じ又は類似するもの同士を同一情報として扱うようにしてもよい。これにより、配置場所の大きく離れているものについては、比較対象から外すことができる。

例えば、位置が近似するか否かを判定する方法としては、各文字列を囲む最小の矩形領域同士を比較して、一定量以上の重なりがあるか否かを判断し、それぞれの個別画像内における当該矩形領域の位置に一定量以上の重なりがある場合に、位置が近似していると不一致検出部１０５が判定する方法が挙げられる。

また、文字列を囲む最小の矩形領域を特定する方法としては、個別画像の左上隅を通る当該個別画像の横辺をＸ軸とし、縦辺をＹ軸とし、当該個別画像から検出された文字列を構成する文字の全ての位置を座標として示した場合の最小及び最大のＸ座標と、最小及び最大のＹ座標とを抽出し、これら４つの点を頂点とする四辺から上記矩形領域を特定するといった方法が挙げられる。

判断部１０６は、不一致検出部１０５が検出した一致しない部分について、上記同一情報の中で多数派となる文字の占める割合が予め定められた割合ＴＨ１（ここでは、ＴＨ１＝過半数を例にして説明する）に達しているか否かを判断する。判断部１０６は、例えば、上記したように、電話番号の９文字目が個別画像Ｇ１，Ｇ２で「５」と認識され、個別画像Ｇ３で「Ｓ」と認識されている場合、多数派の文字「５」の占める割合（６７％）は過半数に達していると判断する。

補正部１０７は、判断部１０６により、多数派の文字の占める割合が予め定められた割合ＴＨ１に達していると判断された場合、上記同一情報の中で少数派となる文字を多数派の文字に置き換えることによって文字の補正を行う。例えば、個別画像Ｇ３で「Ｓ」と認識されていた文字を、多数派の文字「５」に置き換える。

また、判断部１０６は、例えば、上記したように、住所の１１文字目が個別画像Ｇ１で「８」と認識され、個別画像Ｇ２で「９」と認識され、個別画像Ｇ３で「３」と認識されている場合、多数派の文字（「８」、「９」、「３」は同じ割合で存在するため、ここではその全てを多数派とする）の占める割合（３３％）は過半数に達していないと判断する。

操作受付部１０１を構成する補正受付部１０２は、判断部１０６により、多数派の文字の占める割合が予め定められた割合ＴＨ１に達していないと判断された場合、少数派の文字に対するユーザーの補正を受け付ける。例えば、補正受付部１０２は、図６に示すような操作画面Ｐ１を表示部４７３に表示することで、ユーザーによる補正を受け付ける。

操作画面Ｐ１には、正しい文字の入力を促すメッセージを表示する第１表示領域Ｅ１と、文字列検出部１０４が検出した文字列を表示する第２表示領域Ｅ２と、操作部４７を介してユーザーにより入力された文字列を表示する第３表示領域Ｅ３と、入力した文字列への置き換えのユーザーの意思を確定させるための「確定」と記された設定ボタンＢ１とが表示されている。補正受付部１０２は、第２表示領域Ｅ２に、少数派の文字（多数派の割合が同一である、又は少数派を区別できない場合は、いずれの文字でもよい）を表示させる。

操作部４７を介して文字列が入力され、設定ボタンＢ１が押下されると、補正受付部１０２は、上記補正を受け付ける。そして、補正受付部１０２が、上記補正を受け付けると、補正部１０７が、少数派の文字を、補正受付部１０２が受け付けた内容で補正する。

次に、第１実施形態に係る画像読取装置の一実施形態としての画像形成装置１の制御ユニット１０で行われる処理の一例について、図７及び図８に示したフローチャートに基づいて説明する。なお、この処理は、操作受付部１０１が、操作部４７を介してユーザーから指示された、コンタクトガラス１６１に載置された原稿の読み取り指示を受け付けた場合に行われる処理である。

操作受付部１０１が、原稿の読み取り指示を受け付けると、制御部１００は、原稿読取部５の動作を制御することによって、原稿読取部５にコンタクトガラス１６１を読み取らせ（Ｓ１）、図略の画像メモリーに記憶させる。その後、個別画像切抜部１０３が、原稿読取部５による読み取りで得られた画像データから、独立した各個別画像を切り抜く加工処理を行う（Ｓ２）。

その後、文字列検出部１０４が、個別画像切抜部１０３により切り抜かれた個別画像の画像データに対して、ＯＣＲ技術等を用いて文字認識の処理を行い、個別画像上に存在する文字列を検出する（Ｓ３）。

続いて、不一致検出部１０５が、文字列検出部１０４が検出した各個別画像中の文字列について、同一情報となる文字列を１つのグループとして、文字列リストＬＴ１（図９を参照）を作成する（Ｓ４）。

図９は、文字列リストの一例を示した図である。文字列リストＬＴ１は、個別画像Ｇ１〜Ｇ３から検出された文字列について、同一情報となる文字列を１つのグループとしたものである。例えば、グループ２には、個別画像Ｇ１から検出された文字列「06-1234-5678」、個別画像Ｇ２から検出された文字列「06-1234-5678」、及び個別画像Ｇ３から検出された文字列「06-1234-S678」が属している。

不一致検出部１０５は、文字列リストＬＴ１（図９）を参照して、グループ毎に各グループに属する文字列同士を比較することによって、一致しない部分を検出する（Ｓ５）。不一致検出部１０５は、グループ１に属する文字列同士を比較しても、一致しない部分を検出しないが、グループ２に属する文字列同士を比較した場合、一致しない部分として、９文字目を検出する。

判断部１０６は、不一致検出部１０５が一致しない部分を検出したか否かを判断し（Ｓ６）、判断部１０６が、不一致検出部１０５が一致しない部分を検出したと判断した場合（Ｓ６でＹＥＳ）、文字認識に誤りがあったと推定されるので、処理はＳ７に移り、補正部１０７が、文字を補正する補正処理（図８を参照）を行う。一方、判断部１０６が、不一致検出部１０５が一致しない部分を検出していないと判断した場合（Ｓ６でＮＯ）、文字認識の誤りがなかったと推定されるので、処理を終了する。

図８のＳ１１では、判断部１０６が、不一致検出部１０５が検出した一致しない部分について、上記一致しない部分が検出された各グループ別に、多数派の文字の占める割合が予め定められた割合ＴＨ１（例えば、過半数）に達しているか否かを判断する（Ｓ１１）。

判断部１０６が、多数派の占める割合が予め定められた割合ＴＨ１に達していると判断した場合（Ｓ１１でＹＥＳ）、補正部１０７が、少数派の文字を多数派の文字に置き換えることによって文字の補正を行い（Ｓ１２）、その後、処理はＳ１３に移る。例えば、グループ２（図９）での一致しない部分（９文字目）について、多数派の文字「５」の占める割合が過半数に達していると判断部１０６が判断した場合、補正部１０７は、グループ２に属する個別画像Ｇ３から検出された少数派の文字「Ｓ」を多数派の文字「５」に置き換えることによって補正を行う。

一方、判断部１０６が、多数派の文字の占める割合が予め定められた割合ＴＨ１に達していないと判断した場合（Ｓ１１でＮＯ）、Ｓ１２を飛ばして、処理はＳ１３に移る。例えば、グループ３（図９）での一致しない部分（１１文字目）について、多数派の文字（「８」、「９」、「３」は同じ割合で存在するため、ここではその全てを多数派とする）の占める割合が過半数に達していないと判断部１０６が判断した場合、ここでは補正を行わず、処理はＳ１３に移る。

補正部１０７は、不一致検出部１０５が検出した一致しない部分の全てに対して、判断部１０６による判断が終了したか否かを判断する（Ｓ１３）。判断部１０６による判断は終了したと判断した場合（Ｓ１３でＹＥＳ）、補正部１０７は、不一致検出部１０５が検出した一致しない部分の全てに対して、補正を行ったか否かを判断する（Ｓ１４）。つまり、補正は完了したか否かを判断する。

具体的には、Ｓ１１で「ＮＯ」と一度も判断されず、不一致検出部１０５が検出した一致しない部分の全てに対して、少数派の文字を多数派の文字で置き換える処理が実行された場合、補正部１０７は、補正は完了したと判断する。

一方、Ｓ１３において、判断部１０６による判断は終了していないと判断した場合（Ｓ１３でＮＯ）、処理はＳ１１に戻る。

Ｓ１４において、補正部１０７が補正は完了していないと判断した場合（Ｓ１４でＮＯ）、補正受付部１０２は、図６に示したような操作画面Ｐ１を表示部４７３に表示し、当該操作画面Ｐ１に対するユーザーによる操作に応じてタッチパネル又は操作部４７を介して、ユーザーによる補正を受け付け（Ｓ１５）、補正部１０７が、少数派の文字を、補正受付部１０２が受け付けた内容で補正する（Ｓ１６）。この後、処理は終了する。

一方、補正部１０７が、補正は完了していると判断した場合（Ｓ１４でＹＥＳ）、Ｓ１５，Ｓ１６の処理は必要ないので、この処理は終了する。

上記第１実施形態によれば、個別画像から検出された文字列について、内容が同じ又は類似するものを同一情報として個別画像間で比較することで、一致しない部分が検出され、一致しない部分について、多数派の文字の占める割合が予め定められた割合ＴＨ１（例えば、過半数）に達している場合、少数派の文字を多数派の文字に置き換えることによって文字の補正が行われる。

例えば、３つの個別画像のうちの２つに文字列「06-1234-5678」が存在し、残りの１つに文字列「06-1234-S678」が存在するとき（つまり、９文字目が前者は「５」であるのに対し、後者は「Ｓ」であるとき）、一致しない９文字目について、多数派の文字の占める割合が６７％で過半数に達するので、少数派の文字「Ｓ」が多数派の文字「５」に置き換えられる。これにより、少数派の文字が、文字認識の誤りと判定され、多数派の文字に自動的に置き換えられるので、文字認識の誤りを自動的に補正することができる。

また、多数派の文字の占める割合が過半数に達せず、補正が自動的に行われなかった場合には、ユーザーが手動で補正する機会が与えられるので、間違って認識されたものを適切に補正することが可能となる。

また、上記第１実施形態では、１回の読取ジョブで原稿読取部５による読み取りで得られた画像データを用いて、文字認識の誤りを補正する場合について説明しているが、第２実施形態として、１回ではなく、複数回の読取ジョブで原稿読取部５による読み取りで得られた全ての画像データを用いて、文字認識の誤りを補正する実施形態を説明する。

次に、第２実施形態に係る画像読取装置の一実施形態としての画像形成装置１の制御ユニット１０で行われる処理の一例について、図１０に示したフローチャートに基づいて説明する。なお、この処理は、操作受付部１０１が、操作部４７を介してユーザーから指示された、コンタクトガラス１６１に載置された原稿の両面読み取り指示を受け付けた場合に行われる処理である。

操作受付部１０１が、原稿の両面読み取り指示を受け付けると、制御部１００は、原稿読取部５の動作を制御することによって、原稿読取部５にコンタクトガラス１６１を読み取らせ図略の画像メモリーに記憶させる（Ｓ２１）。ここでは、原稿読取部５により原稿の一方面が読み取られて画像データが取得されたものとする。

その後、個別画像切抜部１０３が、原稿読取部５による読み取りで得られた画像データから、原稿毎に独立した個別画像を切り抜く加工処理を行う（Ｓ２２）。

図１１は、コンタクトガラス１６１に複数の原稿が載置された状態の一例を示し、下方から見た図である。図１１に示したように、複数の原稿Ｍ１，Ｍ２がコンタクトガラス１６１に載置されている場合、原稿Ｍ１，Ｍ２の一方面に対応する矩形画像が個別画像Ｇ１，Ｇ２（図４）として個別画像切抜部１０３により切り抜かれる。

続いて、制御部１００が、操作受付部１０１により、操作部４７を介してユーザーから指示された、コンタクトガラス１６１に載置された原稿に対する再度の読み取り指示が受け付けられたか否かを判断する（Ｓ２３）。なお、ユーザーは、当該再度の読み取り指示を操作部４７に入力する前に、コンタクトガラス１６１に載置された各原稿を裏返しておくものとする。

制御部１００が、操作受付部１０１により、当該指示が受け付けられたと判断した場合（Ｓ２３でＹＥＳ）、原稿読取部５に、コンタクトガラス１６１に載置されている原稿を読み取らせて、原稿読取部５による読み取りで得られた画像データを上記画像メモリーに記憶させる（Ｓ２４）。当該指示は、原稿Ｍ１，Ｍ２をユーザーが裏返した後に行われることになるので、原稿読取部５に、裏返された原稿Ｍ１，Ｍ２、すなわち、原稿Ｍ１，Ｍ２の他方面を読み取らせることになる。

その後、個別画像切抜部１０３が、原稿読取部５による読み取りで得られた画像データから、原稿毎に独立した個別画像を切り抜く加工処理を行う（Ｓ２５）。

図１２は、コンタクトガラス１６１に複数の原稿が載置された状態の一例を示し、下方から見た図である。図１１に示したように、裏返された複数の原稿Ｍ１，Ｍ２がコンタクトガラス１６１に載置されている場合、原稿Ｍ１，Ｍ２の他方面に対応する矩形画像が個別画像Ｇ１１，Ｇ１２（図１３を参照）として個別画像切抜部１０３により切り抜かれる。

その後、文字列検出部１０４が、Ｓ２２及びＳ２５で個別画像切抜部１０３により切り抜かれた個別画像の画像データに対して、ＯＣＲ技術等を用いて文字認識の処理を行い、個別画像上に存在する文字列を検出する（Ｓ２６）。Ｓ４以降の処理については、第１実施形態での処理と同様であるので説明を省略する。

本発明による補正はサンプルとなる個別画像が少なくとも３つ必要であるため、コンタクトガラス１６１に載置できる原稿が２つしかない場合、上記第１実施形態では、上記多数派が予め定められた割合ＴＨ１としての半数に満たず、補正部１０７が、少数派の文字を多数派の文字に置き換えることによって補正することを実現できないが、上記第２実施形態では、原稿の一方面だけでなく、原稿の他方面を用いることができるので、コンタクトガラス１６１に載置できる原稿が２つしかなくても、サンプルとなる個別画像を４つに、すなわち、３つ以上にすることができ、少数派の文字を多数派の文字に置き換える補正が可能になる。特に、最近では、表面は母国語（日本語）で記載され、裏面は外国語（英語）で記載され、名刺の両面に同一情報が記載されているものが少なくないため、例えば電話番号やメールアドレス等については、複数回の読取ジョブで原稿読取部５による両面読み取りで得られた画像データを用いて、文字認識の誤りを補正することができる。

また、本発明は上記実施の形態の構成に限られず種々の変形が可能である。また、上記実施形態では、本発明に係る画像読取装置の一実施形態として複合機を用いて説明しているが、これは一例に過ぎず、例えば、スキャナー機能等を有した他の画像読取装置でもよい。

また、図１乃至図１３を用いて上記実施形態により示した構成及び処理は、本発明の一実施形態に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。

１画像形成装置
５原稿読取部
１００制御部
１０１操作受付部
１０２補正受付部
１０３個別画像切抜部
１０４文字列検出部
１０５不一致検出部
１０６判断部
１０７補正部
１６１コンタクトガラス

Claims

原稿載置面に載置された複数の原稿を、１回の読取ジョブで一括して読み取り可能な原稿読取部と、
前記原稿読取部による読み取りで得られた画像データから、原稿毎に独立した個別画像を切り抜く加工処理を行う個別画像切抜部と、
前記個別画像切抜部により切り抜かれた個別画像の画像データに対して文字認識の処理を行い、個別画像上に存在する文字列を検出する文字列検出部と、
前記文字列検出部が検出した文字列について、内容が同じ又は類似するもの同士を同一情報として個別画像間で比較して、一致しない部分を検出する不一致検出部と、
前記一致しない部分について、前記同一情報の中で多数派の文字の占める割合が予め定められた割合に達しているか否かを判断する判断部と、
前記判断部により、多数派の文字の占める割合が前記予め定められた割合に達していると判断された場合、前記同一情報の中で少数派の文字を多数派の文字に置き換えることによって文字の補正を行う補正部と、を備える画像読取装置。
前記不一致検出部は、前記文字列検出部が検出した文字列について、個別画像上の位置が同じ又は近似し、なおかつ内容が同じ又は類似するもの同士を前記同一情報として個別画像間で比較して、前記一致しない部分を検出する請求項１に記載の画像読取装置。
前記不一致検出部は、１回又は複数回の読取ジョブで前記原稿読取部による読み取りで得られた画像データから前記個別画像切抜部により切り抜かれた個別画像上に存在する文字列について、個別画像間で比較して、前記一致しない部分を検出する請求項１又は請求項２に記載の画像読取装置。
前記不一致検出部は、前記文字列検出部が検出した文字列について、前記同一情報のものを１つのグループとして文字列リストを作成し、前記文字列リストを参照して、グループ毎に各グループに属する文字列同士を比較することによって、前記一致しない部分をグループ毎に検出する請求項１乃至請求項３のいずれかに記載の画像読取装置。
前記判断部により、多数派の文字の占める割合が前記予め定められた割合に達していないと判断された場合、多数派及び少数派の文字に対するユーザーの補正を受け付ける補正受付部を更に備え、
前記補正部は、多数派及び少数派の文字を、前記補正受付部が受け付けた内容で補正する請求項１乃至請求項４のいずれかに記載の画像読取装置。