JP2017016549A - 文字認識装置、文字認識方法、及びプログラム - Google Patents

文字認識装置、文字認識方法、及びプログラム Download PDF

Info

Publication number
JP2017016549A
JP2017016549A JP2015135059A JP2015135059A JP2017016549A JP 2017016549 A JP2017016549 A JP 2017016549A JP 2015135059 A JP2015135059 A JP 2015135059A JP 2015135059 A JP2015135059 A JP 2015135059A JP 2017016549 A JP2017016549 A JP 2017016549A
Authority
JP
Japan
Prior art keywords
item
character
recognition
recognizing
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015135059A
Other languages
English (en)
Other versions
JP6527410B2 (ja
Inventor
新庄 広
Hiroshi Shinjo
広 新庄
高橋 寿一
Juichi Takahashi
寿一 高橋
義行 小林
Yoshiyuki Kobayashi
義行 小林
健太郎 大西
Kentaro Onishi
健太郎 大西
亮一 加畑
Ryoichi Kahata
亮一 加畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Systems Ltd
Original Assignee
Hitachi Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Systems Ltd filed Critical Hitachi Systems Ltd
Priority to JP2015135059A priority Critical patent/JP6527410B2/ja
Publication of JP2017016549A publication Critical patent/JP2017016549A/ja
Application granted granted Critical
Publication of JP6527410B2 publication Critical patent/JP6527410B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】ユーザが機器の特定情報の確認作業、及びユーザの点検項目の手作業による入力を不要として、作業効率を向上させることを目的とする【解決手段】文字を認識する複数の項目を含む複数のグループと、グループに含まれる複数の項目の当該グループ内での認識順序と、各項目の文字の認識に用いる情報とが登録された認識辞書を記憶する記憶部と、プロセッサと、を備え、認識辞書に登録される項目は、複数の第1項目及び複数の第2項目を含み、第1項目はグループ内での認識順序が最初の項目であって、第1項目に少なくとも一つの第2項目が関連付けられ、プロセッサは、認識辞書に登録された複数のグループの第1項目の文字の認識に用いる情報に基づいて、入力された画像から第1項目の文字を認識し、認識された文字の第1項目に関連付けられた第2項目から次に文字を認識する第2項目を特定し、特定した第2項目の文字の認識に用いる情報を認識辞書に基づいて、入力された画像から当該第2項目の文字を認識することを特徴とする文字認識装置。【選択図】図5

Description

本発明は、入力された画像から文字を認識する文字認識装置に関する。
情報通信機器等の数、及び情報通信機器等が扱うデータ量は飛躍的に増加している。情報通信機器等を用いた情報サービスを運用するために、当該情報通信機器等を安定的に稼働させる必要がある。このため、情報通信機器等が設置される場所において、情報通信機器等の点検作業の重要性が増している。
従来の点検作業では、作業員が点検結果を紙の点検表に手書きで記入するものでる。このため、点検作業の運用効率、及び点検作業の正確性の面で以下の問題があった。
(1)紙の利用によるコスト高:点検表に記入された点検結果をデータ化するために別途パンチ入力作業が必要となり、コストが高くなる。
(2)型番の確認作業の煩雑さ:点検作業では、作業員が、点検対象の機器の型番を確認した後、当該機器に応じた点検項目を確認する。しかし、似たような型式の型番の機器が多く設置される場所では、型番及び点検項目の文字が小さく、設置場所が暗い可能性が高いので、点検対象の機器の型番を特定すること及び点検項目の数字又はコード等を確認することが煩雑である。このような状況で作業員による目視の型番の確認作業は、時間がかかるうえに誤りを伴う可能性が高い。
(3)点検作業の煩雑さ:点検作業においては、紙に点検すべき項目が記入されており、作業員が、一つの項目を点検した後、紙を見て、次の項目を確認し、当該項目の数字又はコード等を見つけて、当該数字又はコードを点検表に記入するが、この点検作業が煩雑である。
上記(1)〜(3)の問題に対して、特開2015−1851号公報(特許文献1)に記載された技術がある。特許文献1の公報には、「同じ種類の点検を実施する予定の設備または機器の識別情報、設備機器名称情報、点検内容情報、支援情報および関連設備機器情報を抽出する第1の抽出部と、点検を実施する予定の設備または機器に対応する階層情報および場所特定情報を抽出する第2の抽出部と、次に点検を実施する設備または機器の候補を特定する候補特定部と、点検を実施する予定の設備または機器に対応する識別情報、点検内容情報、支援情報および候補を、作業者の利用する端末の表示部に表示させるための点検シナリオ表示情報を生成する表示生成部と、を備える点検支援装置である。」と記載されている(要約参照)。
特開2015−1851号公報
特許文献1に記載の技術では、点検項目の数字又はコード等が作業員によって端末にデータとして手作業で入力されるので、上記(1)の問題は解決される。また、作業者の端末に点検シナリオが表示されるので、上記(3)の問題も解決される。
しかしながら、特許文献1に記載の技術では、作業員が型番等を確認しなければならず、また、作業員が手作業で点検項目の数字又はコード等を入力する必要がある。このため、上記(2)の問題は解決されない。また、作業員が点検項目の箇所を探す必要がある。
本発明は、機器の特定情報の文字を認識して、機器の特定情報に対応する点検項目の文字を認識することによって、ユーザが機器の特定情報の確認作業、及びユーザの点検項目の手作業による入力を不要として、作業効率を向上させる文字認識装置を提供することを目的とする。
本発明の代表的な一例を示せば、入力された画像に含まれる文字を認識する文字認識装置であって、文字を認識する複数の項目を含む複数のグループと、前記グループに含まれる複数の項目の当該グループ内での認識順序と、各項目の文字の認識に用いる情報とが登録された認識辞書を記憶する記憶部と、プロセッサと、を備え、前記認識辞書に登録される項目は、複数の第1項目及び複数の第2項目を含み、前記第1項目は前記グループ内での認識順序が最初の項目であって、前記第1項目に少なくとも一つの第2項目が関連付けられ、前記プロセッサは、前記認識辞書に登録された複数のグループの第1項目の文字の認識に用いる情報に基づいて、入力された画像から前記第1項目の文字を認識し、前記認識辞書に登録された前記認識順序を参照し、前記認識された文字の第1項目に関連付けられた第2項目から次に文字を認識する第2項目を特定し、前記特定した第2項目の文字の認識に用いる情報を前記認識辞書から読み出し、前記読み出された第2項目の文字の認識に用いる情報に基づいて、入力された画像から当該第2項目の文字を認識することを特徴とする。
本願において開示される発明のうち代表的なものによって得られる効果を簡潔に説明すれば、下記の通りである。すなわち、ユーザが機器の特定情報の確認作業、及びユーザの点検項目の手作業による入力を不要として、作業効率を向上させる文字認識装置を提供できる。
上記した以外の課題、構成、及び効果は、以下の実施形態の説明により明らかにされる。
実施例1の点検作業の一例の説明図である。 実施例1の文字認識装置のハードウェア構成図である。 実施例1の点検シナリオデータの説明図である。 実施例1の作業ログの説明図である。 実施例1の文字認識部によって実行される文字認識処理のフローチャートである。 実施例1の型番照合処理及び項目認識処理のフローチャートである。 実施例1の文字認識前処理及び文字列認識処理のフローチャートである。 実施例1の日付辞書の説明図である。 実施例1の場所選択受付画面の説明図である。 実施例1の型番一覧表示画面の説明図である。 実施例1の型番の認識結果表示画面の説明図である。 実施例1の点検項目一覧表示画面の説明図である。 実施例1のS/Nの認識結果表示画面の説明図である。 実施例2の文字認識処理のフローチャートである。 実施例2の項目一括認識処理のフローチャートである。 実施例1の項目一括確認処理のフローチャートである。 実施例2の型番の認識結果表示画面の説明図である。 実施例2の項目(S/N)の認識結果表示画面の説明図である。 実施例2の項目(MAC)の認識結果表示画面の説明図である。 実施例2の未認識項目表示画面の説明図である。 実施例3の文字認識処理のフローチャートである。 実施例3の点検項目の一覧を表示する認識結果表示画面の説明図である。 実施例3の型番の認識結果表示画面の説明図である。
実施例1について図1〜図9Eを用いて説明する。
本実施例では、例えば、データセンタ及び各種店舗等に設置された情報機器(例えば、サーバ等)の点検作業に用いられる文字認識装置について説明する。しかしながら、本実施例の文字認識装置は、点検作業に限定されることなく、画像及び動画等から文字を認識する作業に適用可能である。
まず、本実施例の概略について説明する。
本実施例の文字認識装置は、入力された画像から文字を認識する必要のある項目文字を自動的に認識し、認識した文字を点検作業結果として記憶する。これによって、ユーザの作業効率を向上させることができる。
図1は、実施例1の点検作業の一例の説明図である。
図1では、一例として、携帯端末100が文字認識部251(図2参照)を有する文字認識装置であるものとして説明する。
ユーザ(例えば、点検作業を実施する作業員)は、機器140に貼付されたラベル141を携帯端末100(例えばタブレット端末及びスマートフォン等)のカメラで撮影する。カメラで撮影された画像は、携帯端末100のディスプレイに認識結果表示画面110として表示される。認識結果表示画面110は、撮影画像表示エリア120及び文字認識結果表示エリア130を含む。撮影画像表示エリア120には、カメラで撮影された画像が表示され、当該画像に含まれる文字列のうち文字が認識された文字列が矩形121で囲まれて表示される。
文字認識結果表示エリア130は、認識文字列拡大画像表示部131、文字認識結果表示部132、OKボタン133、及びRetryボタン134を含む。
認識文字列拡大画像表示部131には、文字が認識された文字列の拡大された画像が表示される。文字認識結果表示部132には、認識された文字が表示される。認識文字列拡大画像表示部131及び文字認識結果表示部132は、ユーザがカメラで撮影された文字列と認識された文字との比較を可能にする。
ユーザは、認識された文字が正しいと判断した場合、OKボタン133を操作する。一方、ユーザは、認識された文字が正しくないと判断した場合、Retryボタン134を操作して、再度文字を認識させるか、手入力で正しい文字を入力する。
本実施例では、文字認識の精度を向上させるために、点検シナリオデータ261(図2参照)及び作業ログ262(図2参照)を用いて文字を認識する。
(1)点検シナリオデータ261に基づく文字認識
点検シナリオデータ261は、特許請求の範囲では認識辞書と記載され、点検シナリオデータ261には、文字を認識する複数の項目を含む複数のグループと、各グループ内での項目の認識順序と、各項目の文字の認識に用いる情報とが登録される。なお、点検シナリオデータ261に登録される項目は、複数の第1項目及び複数の第2項目を含み、第1項目は前記グループ内での認識順序が最初の項目であって、機器を特定するための機器特定情報(例えば型番)である。また、第1項目に少なくとも一つの第2項目が関連付けられる。第2項目は、機器特定情報以外の点検すべき項目である。
携帯端末100は、点検する項目ごとに利用する辞書を切り替えて各項目の文字を認識する。これによって、携帯端末100は、点検項目に適した辞書を用いて各項目の文字を認識するので、文字認識の精度を向上させることができる。
(2)作業ログ262に基づく文字認識
作業ログ262には、各項目の認識結果と、画像を補正するための各種パラメータとが登録される。各機器の各項目が点検された際の認識結果及び各種パラメータが作業ログ262に蓄積される。文字認識が一度成功した項目が再度文字認識される場合、文字認識が成功した作業ログ262を利用でき、当該項目の文字認識の精度を向上させることができる。
本実施例の点検シナリオデータ261及び作業ログ262を文字認識に利用することによって、文字認識の精度を向上させ、点検作業を効率化できる。なお、作業ログ262は文字認識に必ずしも利用されなくてもよい。
例えば、点検シナリオデータ261の各項目の文字認識に利用する情報としては、項目の文字種別、項目の文字数、及び項目の表記形式等がある。文字種別は、項目の文字に使用される文字の種別(例えば、数字、英字、カナ、漢字、又は記号等)である。文字数は、項目の文字の数であり、項目の文字が数字であれば桁数であってもよい。表記形式は、項目特有の文字の表記形式である。例えば、日付の表記形式は、「YY.MM.DD」又は「YY/MM/DD」等である。ここで、「YY」「MM」「DD」は、それぞれ年、月、日を表す数字を意味する。例えば、「MM」の場合、「1〜12」と「01〜09」の数字である。
本実施例は、文字を認識する項目に対応して認識辞書を切り替える。例えば、画像中の日付「15.01.18」が認識辞書を利用せずに文字認識されると、「l(エル)5.O1・旧」と誤認識される可能性がある。画像中の「1」はアルファベットの「エル」に誤認識され、画像中の「0」はアルファベットの「オー」に誤認識され、画像中の「.」は中点に誤認識され、画像中の「18」は、「1」と「8」とが一文字として認識されて「旧」と誤認識されている。
例えば、日付の項目の認識辞書として、文字種別が数字であること、及び表記形式「YY.MM.DD」が登録されていれば、このような誤認識を防止でき、当該日付の項目の文字を正確に認識することができる。
また、点検シナリオデータ261には項目の点検順序が登録されているので、点検作業の点検順に認識辞書を自動的に切り替えることができ、文字を認識する項目に適切な点検シナリオデータ261を利用して、文字を認識することができる。
以上によって、ユーザが機器140のラベル141を携帯端末100のカメラで撮影するだけで、点検作業で入力する必要のある項目の文字が携帯端末100に入力される。これによって、ユーザの点検効率を向上させることができる。
なお、必ずしも、携帯端末100が文字認識部251を有する文字認識装置である必要はない。例えば、携帯端末100は、自身が撮影した画像を、文字認識部251を有するサーバ(文字認識装置)に送信し、サーバが文字認識処理を実行して、文字認識結果を携帯端末100に送信する。そして、携帯端末100が文字認識結果等を携帯端末100のディスプレイに表示してもよい。
図2は、実施例1の文字認識装置200のハードウェア構成図である。
上記したように、文字認識装置200は、携帯端末100であってもよいし、携帯端末100がネットワークを介して接続可能なサーバであってもよい。
文字認識装置200は、操作部210、表示部220、画像入力部230、プロセッサ250、メモリ(主記憶装置)260、補助記憶装置270、及びインタフェース(IF)280を有する。
操作部210は、文字認識装置200のユーザによる操作の入力を受け付ける。操作部210は、例えば、タッチパネル、キーボード、マウス、又はボタン等である。表示部220は、文字認識装置200に入力された画像、及び文字認識結果等を表示するディスプレイ等である。画像入力部230は、CCD(Charge Coupled Device)等の撮像素子を用いて画像を撮像するデジタルカメラ又はスキャナ等である。
プロセッサ250は、メモリ260に格納されたプログラムを実行する。メモリ260は、不揮発性の記憶素子であるROM及び揮発性の記憶素子であるRAMを含む。ROMは、不変のプログラム(例えば、BIOS)などを格納する。RAMは、DRAM(Dynamic Random Access Memory)のような高速かつ揮発性の記憶素子であり、プロセッサ250が実行するプログラム及びプログラムの実行時に使用されるデータを一時的に格納する。
補助記憶装置270は、例えば、磁気記憶装置(HDD)、フラッシュメモリ(SSD)等の大容量かつ不揮発性の記憶装置であり、プロセッサ250が実行するプログラム及びプログラムの実行時に使用されるデータを格納する。すなわち、プログラムは、補助記憶装置270からメモリ260にロードされて、プロセッサ250によって実行される。
プロセッサ250は、入力された画像の文字を認識する文字認識部251を有する。文字認識部251は、機器特定情報認識部252及び点検項目認識部253を有する。機器特定情報認識部252は、入力された画像から機器特定情報(第1項目)の文字を認識する。点検項目認識部253は、入力された画像から、認識された第1項目に関連付けられた複数の第2項目の文字を認識する。すなわち、点検項目認識部253は、第1項目である機器特定情報によって特定される機器で点検すべき項目の文字を認識する。メモリ260には、文字認識部251に対応するプログラムが記憶され、プロセッサ250が当該プログラムを実行することによって、文字認識部251はプロセッサ250に実装される。
メモリ260には、点検シナリオデータ261及び作業ログ262が記憶される。点検シナリオデータ261には、機器の種類ごとに、文字を認識する項目の順序及び各項目の文字の認識に利用する認識辞書等が登録される。点検シナリオデータ261の詳細は図3で説明する。作業ログ262には、各項目の文字認識結果、及び画像を調整するための各種パラメータが登録される。作業ログ262の詳細は図4で説明する。
インタフェース280は、文字認識装置200をネットワーク又は他の機器に接続するインタフェースである。
なお、画像は画像入力部230によって撮影される代わりに、インタフェース280から取得されてもよい。具体的には、画像が可搬型記憶媒体に記憶されていて、文字認識装置200は、インタフェース280を介して可搬型記憶媒体に接続され、可搬型記憶媒体に記憶された文字を認識する画像を取得してもよい。また、文字認識装置200にネットワークを介して接続されるサーバ等に画像が記憶されていて、文字認識装置200は、インタフェースを介してサーバ等から画像を取得してもよい。
図3は、実施例1の点検シナリオデータ261の説明図である。
点検シナリオデータ261は、場所301、機器番号302、型番303、項目番号304、属性305、認識モード306、文字認識辞書307、単語辞書308、及び表記辞書309を含む。
場所301には、点検対象となる機器が設置された場所の識別子が登録される。例えば、場所301に登録された「A」はデータセンタAの識別子であり、「B」はデータセンタBの識別子である。機器番号302には、点検対象となる機器を識別するための番号が登録される。型番303には、点検対象となる機器の型番が登録される。項目番号304には、点検対象となる機器に対応して点検する項目を識別するための番号が登録される。属性305には、点検する項目の属性が登録される。
認識モード306には、点検する項目の文字の認識モードが登録される。例えば、認識モードには、照合モード、読取モード、選択モード、及び直接入力モード等ある。照合モードは、認識された文字が単語辞書308に登録された値と一致する場合、認識された文字を文字認識結果とし、認識された文字が単語辞書308に登録された値と一致しない場合、認識された文字を破棄するモードである。読取モードは、認識された文字を読み取るモードである。選択モードは、表示部220に表示された複数の選択肢から少なくとも一つの選択肢の入力を受け付けるモードである。直接入力モードは、文字や数字をユーザが直接入力するモードである。照合モード及び読取モードは、文字認識装置200が実際に画像から文字を認識するモードであり、選択モード及び直接入力モードは、文字認識装置200における文字の認識が不要なモードである。
文字認識辞書307には、項目の文字の種別が登録される。例えば、文字認識辞書307に「英、数」が登録されている項目は、当該項目はアルファベット及び数字によって構成されることを意味する。当該項目の文字を認識する場合には、アルファベット用の文字認識辞書及び数字用の文字認識辞書のみが利用される。
単語辞書308には、認識された文字が一致しなければならない単語(値)が登録される。表記辞書309には、項目の文字の表記形式が登録される。例えば、表記辞書309に「NNN−NNNN−JPNN」が登録されている場合、認識された項目の文字が、左から順に、3桁の数字、「−」、4桁の数字、「−」、「JP」、及び2桁の数字という表記形式でなければならないことを意味する。
文字認識辞書307、単語辞書308及び表記辞書309は、文字の認識に利用される情報である。
以上によって、点検シナリオデータ261には、点検対象となる機器ごとに、点検する項目と、当該項目の点検順序と、当該項目の認識に用いる情報とが登録される。図3に示すデータセンタAのレコードでは、型番「967−7363−JP03」の機器で点検する項目のグループと、型番「AZ513−88E」の機器で点検する項目のグループとがある。型番「967−7363−JP03」の機器では、「型番」が最初に認識され、次に「S/N(シリアルナンバー)」が認識され、次に「MACアドレス」が認識される。また、型番「AZ513−88E」の機器では、「型番」が最初に認識され、次に、「処理数」が認識される。
点検シナリオデータ261には機器ごとに点検する項目が登録されているため、最初に型番を認識して、点検作業を実施する機器を特定する必要がある。このため、点検シナリオデータ261のいずれのグループでも型番が最初に点検する項目として登録される。
図4は、実施例1の作業ログ262の説明図である。
作業ログ262は、作業日401、場所402、機器番号403、型番404、項目番号405、属性406、認識モード407、結果値408、パラメータA409、及びパラメータB410を含む。
作業日401には、点検作業が実施された年月日が登録される。場所402〜認識モード407は、点検シナリオデータ261の場所301〜認識モード306と同じであるので、説明を省略する。結果値408には、項目の文字認識結果が登録される。パラメータA409及びパラメータB410には、画像を補正するためのパラメータが登録される。画像を補正するためのパラメータについては、図7で詳細に説明する。また、パラメータA409及びパラメータB410には、文字認識にかかった時間、文字認識の全実行回数、及び文字認識の成功回数等が登録されてもよい。例えば、文字認識にかかった時間が所定値以上の項目、及び文字認識の全実行回数に対する成功回数の割合が所定値以下である項目は、文字認識せずにユーザの手入力を促すように点検シナリオデータ261を変更してもよい。また、パラメータA409及びパラメータB410には、文字認識に用いた画像が登録されてもよい。この文字認識に用いた画像の利用は、文字認識結果が成功しているか否かの調査を可能にする。
図5は、実施例1の文字認識部251によって実行される文字認識処理のフローチャートである。
文字認識処理は、(1)〜(3)の三つのステップを含む。
(1)点検場所選択受付ステップ(501)
文字認識部251が、点検対象の機器が設置されている場所の選択を受け付ける。
(2)機器特定ステップ(520)
場所の選択を受け付けた後、文字認識部251の機器特定情報認識部252が、点検対象の機器を特定する文字を認識して、点検対象の機器を特定する。
(3)点検項目認識ステップ(530)
点検対象の機器が特定された後、文字認識部251の点検項目認識部253が、点検シナリオデータ261に基づいて、機器特定ステップで特定した機器の点検項目の文字を認識する。
以下、(1)〜(3)のステップの詳細を説明する。
(1)点検場所選択受付ステップ(501)
ステップ501の処理では、文字認識部251は、図9Aに示す場所選択受付画面900を表示部220に表示し、ユーザから点検場所の選択の入力を受け付ける。場所選択受付画面900には、点検シナリオデータ261の場所301に登録された場所の識別子によって識別される場所の名称が表示される。文字認識部251は、場所の選択の入力を受け付けた場合、点検シナリオデータ261を参照し、入力を受け付けた場所に設置される機器の型番のリスト等を表示部220に表示してもよい。具体的には、文字認識部251は、点検シナリオデータ261に登録されたレコードのうち、場所301に入力を受け付けた場所の識別子が登録されたレコードの型番303に登録された型番を取得し、取得した型番を表示部220に表示する。
(2)機器特定ステップ(520)
次に、文字認識部251は、機器特定ステップ(520)を実行するために、機器特定情報認識部252を呼び出す。機器特定情報認識部252は、点検シナリオデータ261に登録されたレコードのうち、ステップ501の処理で入力を受け付けた場所の識別子が場所301に登録されたレコードを読み込む(502)。
次に、機器特定情報認識部252は、作業ログ262に登録されたレコードのうち、ステップ501の処理で入力を受け付けた場所の識別子が場所402に登録されたレコードを読み込む(503)。
次に、機器特定情報認識部252は、ステップ502の処理で読み込まれた点検シナリオデータ261及びステップ503の処理で読み込まれた作業ログ262を用いて、型番照合処理を実行する(504)。型番照合処理では、機器特定情報認識部252は、入力された画像から点検対象の機器の型番を機器特定情報として認識する。型番照合処理の詳細は、図6及び図7で説明する。
(3)点検項目認識ステップ(530)
次に、文字認識部251は、点検項目認識ステップ(530)を実行するために、点検項目認識部253を呼び出す。点検項目認識部253は、点検シナリオデータ261に登録されたレコードのうち、場所301にステップ501の処理で入力を受け付けた場所の識別子が登録され、型番303にステップ504の処理で認識された型番が登録され、かつ次に認識する項目のレコードを読み込む(505)。次に項目する認識するレコードとは、例えば、ステップ504の処理で型番が認識された直後に点検項目認識ステップが実行される場合、項目番号304に型番の次に認識される項目番号が登録されたレコードである。図3に示す点検シナリオデータ261の型番303に「967−7363−JP03」が登録されたレコードにおいては、項目番号304に「2」が登録されたレコードが読み出される。
次に、点検項目認識部253は、作業ログ262に登録されたレコードのうち、場所402にステップ501の処理で入力を受け付けた場所の識別子が登録され、型番404にステップ504の処理で認識された型番が登録され、かつ次に認識する項目のレコードを読み込む(506)。
次に、点検項目認識部253は、ステップ505の処理で読み込まれた点検シナリオデータ261及びステップ506の処理で読み込まれた作業ログ262を用いて、項目認識処理を実行する(507)。項目認識処理では、点検項目認識部253は、入力された画像から型番以外の項目の文字を認識する。項目認識処理の詳細は、図6及び図7で説明する。
次に、文字認識部251は、ステップ504の処理で認識された型番に対応する型番以外の全ての項目に対して項目認識処理が実行されたか否かを判定する(508)。
ステップ508の処理において、ステップ504の処理で認識された型番に対応する型番以外の全ての項目に対して項目認識処理が実行されていないと判定された場合(508:NO)、点検項目認識部253は、点検シナリオデータ261を参照して、次に項目を認識する項目を決定する(509)。そして、点検項目認識部253は、ステップ505の処理に戻り、次に認識する項目のレコードを読み出し、項目認識処理を実行する。
例えば、図3に示す点検シナリオデータ261の型番303に「967−7363−JP03」が登録されたレコードにおいては、項目番号304に「2」が登録されたレコードの項目を認識した場合、次に認識する項目は、項目番号304に「3」が登録されたレコードとなる。
一方、ステップ508の処理において、ステップ504の処理で認識された型番に対応する型番以外の全ての項目に対して項目認識処理が実行されたと判定された場合(508:YES)、文字認識部251は、ステップ501の処理で入力を受け付けた場所に設置された全ての機器に対してステップ520及び530の処理が実行されたか否かを判定する(510)。
ステップ510の処理において、ステップ501の処理で入力を受け付けた場所に設置された全ての機器に対してステップ520及び530の処理が実行されていないと判定された場合(510:NO)、文字認識部251は、次の機器を決定し(511)、ステップ502の処理に戻る。
一方、ステップ510の処理において、ステップ501の処理で入力を受け付けた場所に設置された全ての機器に対してステップ520及び530の処理が実行されたと判定された場合(510:YES)、文字認識処理を終了する。
図6は、実施例1の型番照合処理及び項目認識処理のフローチャートである。
型番照合処理は機器特定情報認識部252によって実行され、項目認識処理は点検項目認識部253によって実行されるが、図6では、型番照合処理及び項目認識処理を纏めて説明するので、各処理の主語を文字認識部251として説明する。
まず、文字認識部251は、点検シナリオデータ261を参照し、点検する項目が文字認識を必要とするか否かを判定する(601)。文字認識を必要としない項目には、例えば、点検済みであることを示すチェックマークを入力するだけでよい項目、複数の選択肢から少なくとも一つの選択肢を選択する項目、及び、文字又は数字等を直接入力する項目等がある。点検シナリオデータ261の文字認識を必要としない項目のレコードの認識モード306には、その旨を示す情報(例えば選択モード等)が登録される。
ステップ601の処理で、点検する項目が文字認識を必要としないと判定された場合(601:NO)、文字認識部251は、ユーザによるデータの入力を受け付け(602)、ステップ605の処理に進む。
一方、ステップ601の処理で、点検する項目が文字認識を必要とすると判定された場合(601:YES)、文字認識部251は、文字認識前処理を実行する(603)。文字認識前処理では、文字認識部251は、入力された画像を調整し、入力された画像から文字列を抽出する。文字認識前処理の詳細は図7で説明する。
次に、文字認識部251は、文字列認識処理を実行する(604)。文字列認識処理では、文字認識部251は、ステップ603の処理で抽出された文字列から、点検する項目の文字列を認識する。文字列認識処理の詳細は図7で説明する。
次に、文字認識部251は、ステップ604の処理の認識結果をユーザに提示する(605)。ユーザは、ステップ605の処理で提示された内容に基づいて、ステップ604の処理の認識結果が正しいか否かを判断する。ユーザは、ステップ604の処理の認識結果が誤っていると判断した場合、ステップ603及び604の処理を文字認識部251に再度実行させるか、修正内容を文字認識装置200に入力する。
次に、文字認識部251は、ステップ604の処理の認識結果及びステップ603の処理で用いたパラメータを作業ログ262に登録し(606)、型番照合処理又は項目認識処理を終了する。
図7は、実施例1の文字認識前処理及び文字列認識処理のフローチャートである。
文字認識前処理及び文字列認識処理では、文字認識部251は、作業ログ262を参照しながら、点検する項目の文字を認識する。なお、作業ログ262には、文字認識が成功した場合の各種パラメータ及び認識結果が登録される。ただし、文字認識が失敗した場合等、作業ログ262には、ユーザ等によってパラメータ又は認識結果が直接入力されてもよい。
まず、文字認識部251には、画像入力部230から画像が入力される(701)。文字認識部251は、作業ログ262のパラメータに含まれる焦点判定パラメータを参照し、ステップ701の処理で入力された画像の焦点が合っているか否かを判定する。例えば、焦点判定パラメータは、文字認識が成功した画像の濃度値の分布であり、文字認識部251は、当該濃度値の分布と入力された画像の濃度値の分布とを比較して、入力された画像の焦点が合っているか否かを判定する。文字認識部251は、入力された画像の焦点が合っていないと判定した場合、新たな画像の入力を促す画面をユーザに提示してもよい。
次に、文字認識部251は、作業ログ262のパラメータに含まれる白黒反転の有無、及び色相・輝度補正パラメータを参照し、ステップ701の処理で入力された画像を補正する(702)。点検作業においては、画像はカメラによって撮像される可能性が高い。例えば、撮像素子と紙とが密着した状態で光を当てて撮像するスキャナ等が撮像した画像では、画質が安定するが、カメラによって撮像された画像の画質は外部環境の影響を受けやすく不安定である。画像の補正の例としては、暗所で撮像された画像のコントラストの補正、及び白黒反転文字を含む画像の白黒反転等がある。作業ログ262の点検する項目のパラメータが白黒反転有りである場合、文字認識部251は、ステップ701の処理で入力された画像の白黒(ネガポジ)を反転させる。また、文字認識部251は、作業ログ262の点検する項目のパラメータに含まれる色相・輝度補正パラメータに基づいて、ステップ701の処理で入力された画像のコントラストを補正する。
次に、文字認識部251は、作業ログ262のパラメータに含まれる二値化方式及び二値化パラメータを参照し、ステップ701の処理で入力された画像を二値化する(703)。一般に、カラー画像又はグレー画像は白黒の二値画像に変換され、変換後の二値画像の文字が認識される。適切な二値画像への変換には、ステップ701の処理で入力された画像の状況に応じて適切な二値化方式及び二値化パラメータが利用されなければならない。例えば、文字の色と背景の色との差が小さい画像、コントラストが低い画像、及び薄い文字と濃い背景とを含む画像それぞれに適切な二値化方式及び二値化パラメータが利用されなければならない。文字認識部251は、文字認識が成功した項目の二値化方式及び二値化パラメータを記憶しておき、当該項目の文字を再度認識する場合には、当該二値化方式及び二値化パラメータを利用してカラー画像又はグレー画像を二値画像に変換する。
次に、文字認識部251は、作業ログ262のパラメータに含まれる撮影方向及び傾きを参照して、ステップ701の処理で入力された画像の射影歪、樽型歪み、又は傾き等を補正する(704)。機器の設置場所によっては読取対象のラベルを正面からカメラで撮影できず、ラベルを斜め方向から撮影せざるを得ない場合、また文字が傾いた状態で撮影せざるを得ない場合がある。ステップ704の処理では、このように撮影された画像の歪み又は傾きが補正される。作業ログ262には、カメラと読取対象との位置関係(例えば、撮影方向等)及び撮影時の文字列の傾きが登録されている。文字認識部251は、作業ログ262を利用して、画像の歪み及び傾きを補正するので、正確かつ高速に画像の歪み及び傾きを補正できる。
次に、文字認識部251は、作業ログ262のパラメータに含まれる項目間のレイアウト、文字列間距離、及び文字間距離を参照して、ステップ701の処理で画像から点検する項目の文字列を抽出する(705)。文字列抽出方法として連結成分融合法が知られている。連結成分融合法は、二値画像で黒画素が連続した領域を連結成分として抽出し、連結成分の配置関係から文字列を抽出する方法である。具体的には、互いに近接する連結成分の縦方向又は横方向の整列性を考慮して文字列が抽出される。
ステップ701の処理で入力された画像は点検する項目以外の文字列を含む可能性がある。このため、文字認識部251は、ステップ701の処理で入力された画像から点検する項目の文字列を選択する。この文字列の選択方法には三つの方法がある。
一つ目の方法は、点検する項目の文字列のみを選択する方法である。本実施例では、ユーザは、点検する項目ごとにカメラで画像を撮影する。この場合、ユーザは、点検する項目の文字列が画像の中央付近に位置するように画像を撮影する。文字認識部251は、ステップ701の処理で入力された画像の中央付近の領域から連結成分融合法を用いて文字列を抽出する。これによって、文字認識部251は、点検する項目の文字列のみを抽出できる。
二つ目の方法は、ステップ701の処理で入力された画像の全ての文字列を抽出し、ステップ604の処理である文字列認識処理で点検する項目の文字列を選択する方法である。具体的には、文字列認識処理では、抽出された全ての文字列のうち点検する項目の単語辞書308及び表記辞書309と一致する文字列が点検する項目として選択される。
三つ目の方法は、ステップ701の処理で入力された画像を表示部220に表示し、点検する項目の文字列の範囲の指定をユーザから受け付ける方法である。ユーザの指定方法としては、例えば、文字列の中心のみが指定される方法、文字列の両端が指定される方法、及び文字列の四隅が指定される方法等がある。
ステップ705の処理では、文字認識部251は、作業ログ262に含まれる文字列間距離及び文字列距離等を参照して、画像から文字列を抽出する。一つ目の方法では、点検する項目の文字列と点検する項目以外の文字列との距離が文字列間距離と比較して所定値より小さい場合、二つの文字列を一つの文字列として誤抽出する可能性がある。また、点検する項目の文字間距離が作業ログ262の文字間距離より所定値より大きい場合、点検する項目の文字列の一部のみしか抽出できない可能性がある。
次に、文字認識部251は、文字認識辞書711を参照し、ステップ705の処理で抽出された文字列の個々の文字を認識する(706)。文字認識方法として改良型投影距離(Modified quadratic discriminant functions:MQDF)がある。この方法では、大量の文字が登録された文字認識辞書711が生成される場合、距離尺度を算出するための識別関数がベイズの定理から文字カテゴリごとに算出される。そして、入力された文字を認識する場合、識別関数が出力する距離尺度に基づいて入力された文字を文字カテゴリに分類することによって、入力された文字を認識する。なお、距離尺度に基づいて、文字認識の確からしさを示す文字認識スコアを算出してもよい。
ステップ706の処理では、文字認識部251は、点検シナリオデータの点検する項目のレコードの文字認識辞書307に登録された文字の種別を取得し、取得した文字の種別に対応する文字認識辞書711を参照して、文字を認識する。これによって、文字認識の精度を向上させることができる。
次に、文字認識部251は、ステップ706の処理での文字認識結果に対して単語照合処理及び表記照合処理を実行して、項目の最終的な文字認識結果を算出する(707)。単語照合処理は、ステップ706の処理での文字認識結果と点検シナリオデータ261の点検する項目のレコードの単語辞書308に登録された単語とが一致するか否かを照合する処理である。また、表記照合処理は、ステップ706の処理での文字認識結果の表記形式と点検シナリオデータ261の点検する項目のレコードの表記辞書309に登録された表記形式とが一致するか否かを照合する処理である。
単語照合処理の具体例について説明する。例えば、点検する項目の単語辞書308に「top」及び「base」の二つの単語が登録され、ステップ706の処理での文字認識結果が「bass」である場合、文字認識部251は、文字認識結果と単語辞書308に登録された単語とが一致しないと判定する。
文字認識部251は、文字認識結果「bass」と単語辞書308に登録された「base」とは一文字違いであるので、文字認識結果「bass」を「base」に修正し、「base」を最終的な文字認識として算出してもよい。単語照合処理では、ステップ706の処理での文字認識結果と単語辞書308に登録された単語との類似度(単語照合スコア)を算出し、算出した類似度が所定の値より両者が類似することを示せば、単語辞書308に登録された単語を最終的な文字認識結果として算出してもよい。
表記照合処理の具体例について説明する。点検する項目の文字が一定のルールで表記される場合、表記照合処理は、ステップ706の処理での文字認識結果が当該ルールと一致するか否かを照合する。例えば、点検する項目が日付である場合、当該項目の表記辞書309には、「YY.MM.DD」又は「YY/MM/DD」等の表記形式が登録されており、表記照合処理は、ステップ706の処理での文字認識結果の表記形式が、「YY.MM.DD」又は「YY/MM/DD」等の表記形式と一致するか否かを照合する。なお、表記照合処理では、ステップ706の処理での文字認識結果が作業ログ262又は表記辞書309に登録された数値又は英字の範囲内であるか否かを判定してもよい。
また、表記照合処理は、ステップ706の処理での文字認識結果の表記形式と表記辞書309に登録された表記形式との類似度(表記照合スコア)を算出してもよい。
点検シナリオデータ261の認識モード306に登録されるモードのうち文字認識が必要となるモードには「読取モード」及び「照合モード」がある。「読取モード」は、画像中の文字を認識するモードである。例えば、文字又は数値が可変である項目の認識モードは「読取モード」である。「照合モード」は、単語辞書308に登録された単語と文字認識結果とが一致するか否かを照合するモードである。文字又は数値が決まっている項目の認識モードは「照合モード」である。例えば、「型番」、「S/N」、「MACアドレス」は文字又は数値が決まっているので、これらの項目の認識モードは「照合モード」であり、「処理数」は数値が可変であるので、認識モードは「読取モード」である。
「照合モード」の項目では、単語照合処理及び表記照合処理が実行されるが、「読取モード」の項目は単語辞書308が登録されていないので、「読取モード」の項目では表記照合処理のみが実行される。なお、本実施例では、型番の項目の認識モードが「照合モード」であり、単語照合処理及び表記照合処理が実行されるがこれに限定されない。例えば、型番の項目の認識モードが「読取モード」であり、表記照合処理のみが実行されてもよい。ただし、認識精度を向上させるために、型番の項目の文字は、少なくとも表記辞書309を用いて認識されるものとする。型番以外の項目は、各項目に対応する文字の特定に応じて適切な認識モードが設定される。
点検する項目が日付である場合の表記辞書309には、日付の表記形式の他に図8に示す日付辞書800も登録されていてもよい。図8は、実施例1の日付辞書800の説明図である。
日付辞書800には、年、月、及び日の表記の定義、並びにこれらの組み合わせである年月日の表記の定義が登録される。日付辞書800は、文脈自由文法の記法であるBNF(Backus−Naur form)によって記述される。
次に、本実施例で表示部220に表示される画面について図9A〜図9Eを用いて説明する。まず、文字認識部251は、図9Aに示す場所選択受付画面900を表示し、場所の選択の入力を受け付ける。次に、文字認識部251は、場所選択受付画面900で入力を受け付けた場所で点検する機器の型番の一覧を表示する型番一覧表示画面910(図9B参照)を表示する。
文字認識部251に画像が入力された場合、文字認識部251は、入力された画像から最初の点検項目である型番の文字を認識し、型番の文字認識結果を含む認識結果表示画面110(図9C参照)を表示する。次に、文字認識部251は、点検シナリオデータ261を参照し、入力された場所の識別子、及び認識された型番に対応する機器の点検項目を取得し、取得した点検項目の一覧を含む点検項目一覧表示画面920(図9D)を表示する。
次に、文字認識部251に新たな画像が入力された場合、文字認識部251は、入力された画像から次の点検項目であるS/Nの文字を認識し、S/Nの文字認識結果を含む認識結果表示画面(図9E参照)を表示する。
なお、文字認識部251は、一つの項目の文字を認識するたびに、認識結果表示画面110を表示する。
図9Aは、実施例1の場所選択受付画面900の説明図である。
場所選択受付画面900は、点検シナリオデータ261の場所301に登録された識別子によって識別される場所の名称が選択肢901及び902として表示される。ユーザは、ポインタ903を操作して、点検作業を実施する場所を示す選択肢を選択する。
図9Bは、実施例1の型番一覧表示画面910の説明図である。
文字認識部251は、場所の選択の入力を受け付けると、点検シナリオデータ261を参照し、場所301に入力を受け付けた場所の識別子が登録されたレコードの型番303に登録された型番を取得し、取得した型番の一覧を型番一覧表示画面910として表示する。
図9Cは、実施例1の型番の認識結果表示画面110の説明図である。
文字認識部251は、画像が入力されると、最初に型番の文字を認識する。認識結果表示画面110には、型番の文字認識結果が表示される。
認識結果表示画面110は、撮影画像表示エリア120及び文字認識結果表示エリア130を含む。撮影画像表示エリア120は、図1で説明した構成と同じであるので、説明を省略する。また、文字認識結果表示エリア130は、認識文字列拡大画像表示部131、文字認識結果表示部132、表記形式表示部931、OKボタン133、及びRetryボタン134を含む。認識文字列拡大画像表示部131、文字認識結果表示部132、OKボタン133、及びRetryボタン134は、図1で説明した構成と同じであるので、説明を省略する。
表記形式表示部931には、図7に示す表記照合処理で用いた表記辞書309に登録された表記形式が表示される。これによって、ユーザは、項目の文字認識結果と表記形式とが一致しているかを確認することができる。なお、表記形式表示部931には、数字又は英字等の範囲が表示されてもよいし、図7に示す単語照合処理で用いた単語辞書308に登録された単語が表示されてもよい。
図9Cに示す認識結果表示画面110では、文字認識結果表示部132には、ユーザによって操作可能なカーソル932が表示される。また、認識文字列拡大画像表示部131には、カーソル932が位置する文字に対応する文字の画像に位置するカーソル933が表示される。
文字認識結果表示部132に表示された文字認識結果が画像の点検する項目の文字と異なる場合、ユーザは、修正する文字までカーソル932を移動させ、正しい文字を入力することができる。カーソル932が位置する文字の画像にカーソル933が位置するので、ユーザは、修正しようとする認識結果の文字に対応する画像を即座に把握することができる。
図9Dは、実施例1の点検項目一覧表示画面920の説明図である。
文字認識部521は、型番の文字を認識すると、点検シナリオデータ261を参照し、場所301に場所選択受付画面900で入力を受け付けた場所の識別子が登録され、かつ型番303に認識された文字が登録されたレコードの属性305に登録された属性を取得し、取得した属性を含む点検項目一覧表示画面920を表示する。
点検項目一覧表示画面920には、点検する機器で点検する項目が表示される。なお、型番の文字が認識済みであるので、図9Dに示す点検項目一覧表示画面920の型番には認識結果が表示される。
図9Eは、実施例1のS/Nの認識結果表示画面110の説明図である。
次に、文字認識部251は、型番の文字認識が終了すると、新たな画像が入力され、S/Nの文字を認識し、S/Nの認識結果表示画面110を表示する。S/Nの認識結果表示画面110の構成は、図9Cに示す型番の認識結果表示画面の構成と同じである。
認識文字列拡大画像表示部131には、S/Nの文字列の画像が拡大表示され、文字認識結果表示部132には、S/Nの文字の認識結果が表示され、表記形式表示部931には、S/Nの単語照合処理で用いた表記辞書309に登録された表記形式が表示される。
なお、S/Nの認識結果表示画面110でOKボタン133が操作されると、文字認識部251は、図9Dに示す点検項目一覧表示画面920を表示する。この場合の点検項目一覧表示画面920のS/Nには、S/Nの認識結果が表示される。
そして、新たな画像が文字認識部251に入力され、次の項目(MACアドレス)の文字が認識され、MACアドレスの認識結果表示画面110が表示され、OKボタン133が操作されると、点検項目一覧表示画面920が表示される。この処理が最後の項目の文字が認識されるまで繰り返される。
以上によって、本実施例では、入力された画像に含まれる文字を認識する文字認識装置であって、文字を認識する複数の項目を含む複数のグループと、グループ内での複数の項目の認識順序と、各項目の文字の認識に用いる情報とが登録された認識辞書(点検シナリオデータ261)を記憶する記憶部と、プロセッサと、を備え、認識辞書に登録される項目は、複数の第1項目(例えば型番等の機器特定情報)及び複数の第2項目(機器特定情報以外の点検する項目)を含み、第1項目はグループ内での認識順序が最初の項目であって、第1項目に少なくとも一つの第2項目が関連付けられ、プロセッサは、認識辞書に登録された複数のグループの第1項目の文字の認識に用いる情報に基づいて、入力された画像から第1項目の文字を認識し、認識辞書に登録された認識順序を参照し、認識された文字の第1項目に関連付けられた第2項目から次に文字を認識する第2項目を特定し、特定した第2項目の文字の認識に用いる情報を認識辞書から読み出し、読み出された第2項目の文字の認識に用いる情報に基づいて、入力された画像から当該第2項目の文字を認識する。
これによって、項目に対応した文字の認識に用いる情報を用いて項目の文字を認識できるので、文字の認識精度を向上させることができ、ユーザの各項目の手作業による入力を不要として、作業効率を向上させることができる。
また、本実施例では、第1項目の文字の認識に用いる情報は、前記第1項目の表記形式を含み、前記プロセッサは、前記第1項目の認識された文字の表記形式が当該第1項目の表記形式と一致する場合、当該第1項目の認識された文字を当該第1項目の認識結果とする。これによって、第1項目の認識精度を向上させることができる。なお、第1項目の認識結果によって次の第2項目が決まるので、第1項目が誤認識されると、第2項目の文字の認識に用いる情報が誤って読み出されるので、第1項目の認識精度を向上させる必要がある。
また、本実施例では、プロセッサは、前記認識された第1項目及び第2項目の文字を、作業ログ262として前記記憶部に記憶する。これによって、次の文字認識に前回の文字認識結果を利用することができ、各項目の認識精度を向上させることができる。
また、本実施例では、前記プロセッサは、入力された画像をパラメータに基づいて補正し、前記補正後の画像から認識対象となる項目の文字を認識し、前記文字の認識が成功した場合、前記画像の補正に用いたパラメータを前記作業ログとして前記記憶部に記憶する。これによって、認識が成功した項目のパラメータに基づいて画像を補正することができるので、補正後の画像が文字認識に適切である可能性が高くなり、認識精度を向上させることができる。
また、本実施例では、前記第1項目の文字を認識するための画像が入力され、前記プロセッサは、前記入力された画像から前記第1項目の文字を認識し、前記認識された第1項目の次に認識する第2項目の文字を認識するための画像が入力され、前記プロセッサは、当該入力された画像から当該第2項目の文字を認識し、前記認識された第1項目に関連付けられた最後の第2項目の文字を認識するための画像が入力され、当該入力された画像から当該第2項目の文字を認識するまで繰り返す。例えば、認識する項目が中央付近に存在する画像が入力されれば、当該項目の文字の認識精度を向上させることができる。
また、本実施例では、プロセッサは、前記認識された第1項目の文字を表示部に表示し、前記認識された第2項目の文字を前記認識辞書に登録された認識順序通りに前記表示部に表示する。これによって、ユーザは、認識順序通りに項目の認識結果を確認できる。
また、本実施例では、プロセッサは、前記認識された第1項目の文字を前記表示部に表示する場合、又は前記認識された第2項目の文字を前記表示する場合、前記認識辞書に登録された前記認識に用いた情報も前記表示部に表示する。これによって、ユーザは、項目の認識結果とともに、認識に用いた情報も確認できる。
実施例2について、図10〜図14を用いて説明する。
実施例1では、一つの項目の文字を認識するための一つの画像がカメラで撮影され、文字認識部251に入力され、一つの項目ごとに文字認識処理が実行されたが、本実施例では、型番の文字を認識するための画像が入力されて型番の文字が認識された後、型番以外の項目の文字を認識するための一つの画像が入力され、当該画像から型番以外の全ての点検項目の文字が一括して認識される。
図10は、実施例2の文字認識処理のフローチャートである。図10では、実施例1の図5に示す文字認識処理と同じ処理は同じ符号を付与し、説明を省略する。
本実施例の文字認識処理は、点検項目認識ステップ(530)が実施例1の文字認識処理と異なる。
本実施例の点検項目認識ステップでは、点検項目認識部253は、項目一括認識処理を実行し(1001)、項目一括確認処理を実行する(1002)。
ステップ1001の処理の項目一括認識処理は、点検する項目の文字を認識するために入力された画像内の全ての点検項目の文字を認識する。項目一括確認処理の詳細は図11で説明する。
ステップ1002の処理の項目一括確認処理は、ステップ1001の処理における全ての点検項目の認識結果を一括して確認する。項目一括確認処理の詳細は図12で説明する。
文字認識部251は、ステップ504の処理で認識された型番に対応する全ての点検項目の文字が認識されたか否かを判定する(1003)。
ステップ1003の処理で、型番に対応する全ての点検項目の文字が認識されたと判定された場合、ステップ510の処理に進み、ステップ501の処理で入力を受け付けた場所に設置された全ての機器に対してステップ520及び530の処理が実行されたか否かを判定する。
一方、ステップ1003の処理で、型番に対応する全ての点検項目の文字が認識されていないと判定された場合、入力された画像に未認識の項目の文字列が含まれていなかったことか、入力された画像に未認識の項目の文字列が含まれるものの認識に失敗したことが考えられる。このため、文字認識部251は、未認識の項目を特定し(1004)、ステップ1001の処理に戻り、新たな画像の入力を受け付け、項目認識ステップを再度実行する。
図11は、実施例2の項目一括認識処理のフローチャートである。
実施例1の図3に示す処理では、点検項目ごとに新たな画像が入力され、入力された画像に対して文字認識前処理及び文字列認識処理が実行される。図11に示す項目一括認識処理では、型番以外の項目の文字認識のために入力された一つの画像に対して文字認識前処理及び文字列認識処理が実行され、当該一つの画像から型番以外の項目の文字を認識する。図11では、図6に示す処理と同じ処理は同じ符号を付与し、説明を省略する。
ステップ601の処理で、全ての項目が文字認識を必要としないと判定された場合(601:NO)、点検項目認識部253は、ユーザによるデータの入力を受け付け、項目一括認識処理を終了する。
一方、ステップ601の処理で、いずれかの項目が文字認識を必要とすると判定された場合(601:YES)、点検項目認識部253は、点検シナリオデータ261に登録されたレコードのうち、場所301にステップ501の処理で入力を受け付けた場所の識別子が登録され、型番303にステップ504の処理で認識された型番が登録された全てのレコードを読み込む(1101)。
次に、点検項目認識部253は、作業ログ262に登録されたレコードのうち、場所402にステップ501の処理で入力を受け付けた場所の識別子が登録され、型番404にステップ504の処理で認識された型番が登録された全てのレコードを読み込む(1102)。
次に、点検項目認識部253は、文字認識前処理を実行する(603)。本実施例の文字認識前処理では、入力された画像を作業ログ262に登録されたパラメータに基づいて補正し、補正後の画像から全ての文字列を抽出する。
本実施例の文字認識前処理の詳細について図7のステップ701〜705の処理を用いて説明する。実施例1のステップ702〜704の処理は、ある一つの項目の文字を認識するための一つの画像に対して作業ログ262の当該項目のレコードに含まれるパラメータに基づいて各種処理を実行する。本実施例のステップ702〜704の処理は、型番以外の項目の全ての項目の文字を認識するための一つの画像に対して作業ログ262の点検作業を実施する機器の各項目のパラメータに基づいて各種処理を実行する。この結果、各項目のパラメータに基づいて各種処理が実行された画像が、点検作業を実施する機器の項目の数だけ生成される。
なお、本実施例のステップ702〜704の処理は、作業ログ262の点検作業を実施する機器の各項目の各パラメータの平均値を算出し、型番以外の項目の全ての項目の文字を認識するための一つの画像に対して各パラメータの平均値に基づいて各種処理を実行してもよい。また、一つの項目のパラメータを選択し、型番以外の項目の全ての項目の文字を認識するための一つの画像に対して一つの項目のパラメータに基づいて各種処理を実行してもよい。
本実施例のステップ705の処理は、ステップ702〜704の処理が実行された画像の全ての文字列を抽出し、図11に示すステップ1103の処理に進む。
ステップ1103の処理では、点検項目認識部253は、点検シナリオデータ261の場所301にステップ501の処理で入力を受け付けた場所の識別子が登録され、かつ型番303にステップ504の処理で認識された型番が登録されたレコードから、次に認識する項目のレコードを読み込む(1103)。
次に、点検項目認識部253は、作業ログ262から場所402にステップ501の処理で入力を受け付けた場所の識別子が登録され、かつ型番404にステップ504の処理で認識された型番が登録されたレコードから、次に認識する項目のレコードを読み込む(1104)。
次に、点検項目認識部253は、ステップ603の処理で抽出された文字列から最初の文字列を選択する(1105)。ここで、最初の文字列とは、ステップ603の処理で文字列が画像の上から順に文字列が抽出される場合、一番上に位置する文字列である。なお、ステップ603の処理で文字列を抽出する方向は上から下に限定されず、例えば画像の左から右に抽出されてもよい。
なお、ステップ603の文字認識前処理で全ての項目に対応する画像が生成されている場合、ステップ1103の処理で読み込まれた点検シナリオデータ261のレコードの項目に対応する画像から最初に抽出された文字列を選択する。
次に、点検項目認識部253は、文字列認識処理を実行する(604)。
本実施例の文字列認識処理について図7のステップ706及び707の処理を用いて説明する。
ステップ706の処理は、文字認識辞書711を参照し、ステップ1105の処理で選択された文字列の文字を認識する。
ステップ707の処理は、ステップ706の処理での文字認識結果に対して単語照合処理及び表記照合処理を実行する。単語照合処理では、点検項目認識部253は、ステップ706の処理での文字認識結果とステップ1103の処理で読み込まれた点検シナリオデータ261の項目の単語辞書308に登録された単語とが一致するか否かを照合する。また、表記照合処理では、点検項目認識部253は、ステップ706の処理での文字認識結果の表記形式とステップ1103の処理で読み込まれた点検シナリオデータ261の項目の表記辞書309に登録された表記形式とが一致するか否かを照合する。
本実施例のステップ707の処理では、単語照合スコア及び表記照合スコアが算出されるものとする。
次に、点検項目認識部253は、ステップ604の処理での文字認識が成功したか否かを判定する(1106)。具体的には、点検項目認識部253は、単語照合スコア及び表記照合スコアの少なくとも一方が閾値以上であれば、ステップ604の処理での文字認識が成功したと判定する。
ステップ1106の処理において、ステップ604の処理での文字認識が失敗したと判定された場合(1106:NO)、点検項目認識部253は、ステップ603の処理で抽出された全ての文字列に対してステップ604の処理が実行されたか否かを判定する(1107)。
ステップ1107の処理において、ステップ603の処理で抽出された全ての文字列に対してステップ604の処理が実行されていないと判定された場合(1107:NO)、点検項目認識部253は、ステップ603の処理で抽出された文字列から次の文字列を選択し(1108)、ステップ604の処理に戻る。
一方、ステップ1107の処理において、ステップ603の処理で抽出された全ての文字列に対してステップ604の処理が実行されたと判定された場合(1107:YES)、ステップ1103の処理で読み込まれた点検シナリオデータ261の項目の文字が入力さ入力された画像に含まれていなかったか、当該項目の文字認識に失敗したので、点検項目認識部253は、当該項目を未認識の項目として記憶し(1109)、次の項目を選択し(1112)、ステップ1103の処理に戻る。そして、ステップ1103の処理では、点検シナリオデータ261から選択した次の項目のレコードを読み込む。
ステップ1106の処理において、ステップ604の処理での文字認識が成功したと判定された場合(1106:YES)、点検項目認識部253は、ステップ604の処理での文字認識結果を記憶し(1110)、点検作業を実施する機器の全ての項目に対してステップ604の処理が実行されたか否かを判定する(1111)。
ステップ1111の処理で、点検作業を実施する機器の全ての項目に対してステップ604の処理が実行されたと判定された場合(1111:YES)、項目一括認識処理を終了する。
一方、ステップ1111の処理で、点検作業を実施する機器の全ての項目に対してステップ604の処理が実行されていないと判定された場合(1111:NO)、ステップ1112の処理に進み、点検項目認識部253は、次の項目を選択し、ステップ1103の処理に戻る。
図12は、実施例2の項目一括確認処理のフローチャートである。
まず、点検項目認識部253は、項目一括認識処理で認識された最初の項目を選択する(1201)。
次に、点検項目認識部253は、ステップ1201の処理で選択した項目の文字認識結果を含む認識結果表示画面110を表示し、当該項目の文字認識結果をユーザに提示する(1202)。ステップ1202の処理では、ユーザは、認識結果表示画面110を見て、ステップ1201の処理で選択した項目の文字認識結果が正しいか否かを判断する。ユーザは、文字認識結果が誤っていると判断した場合、文字一括認識処理を点検項目認識部253に再度実行させるか、修正内容を文字認識装置200に入力する。
次に、点検項目認識部253は、ステップ1201の処理で選択した文字認識結果又はユーザによって修正された文字認識結果、及びステップ603の処理で用いたパラメータを、作業ログ262に登録する(1203)。
次に、点検項目認識部253は、項目一括認識処理で認識された全ての項目にステップ1202及び1203の処理が実行されたか否かを判定する(1204)。
ステップ1204の処理で、項目一括認識処理で認識された全ての項目にステップ1202及び1203の処理が実行されていないと判定された場合(1204:NO)、点検項目認識部253は、点検一括認識処理で認識された次の項目を選択し(1205)、ステップ1202の処理に戻る。
一方、ステップ1204の処理で、項目一括認識処理で認識された全ての項目にステップ1202及び1203の処理が実行されたと判定された場合(1204:YES)、点検項目認識部253は、ステップ1109の処理で未認識の項目が記憶されたか否かを判定する(1206)。
ステップ1206の処理において、ステップ1109の処理で未認識の項目が記憶されたと判定された場合(1206:YES)、点検項目認識部253は、ステップ1109の処理で記憶された未認識の項目の一覧を含む未認識項目表示画面1400を表示し(1207)、項目一括確認処理を終了する。未認識項目表示画面1400の詳細は図14で説明する。
一方、ステップ1206の処理において、ステップ1109の処理で未認識の項目が記憶されていないと判定された場合(1206:NO)、点検項目認識部253は、項目一括確認処理を終了する。
次に、図13A〜図14を用いて、本実施例で表示される画面について説明する。
まず、点検項目認識部253は、図12に示す項目一括確認処理のステップ1201の処理の実行前に型番の認識結果表示画面110を表示する。図13Aは、実施例2の型番の認識結果表示画面110の説明図である。
図13Aに示す型番の認識結果表示画面110は、図1で説明した認識結果表示画面110と同じく、撮影画像表示エリア120及び文字認識結果表示エリア130を含む。
撮影画像表示エリア120には、項目一括認識処理の文字認識前処理のステップ701の処理で入力された画像が表示される。また、撮影画像表示エリア120に表示された画像では、点検項目の文字が認識された文字列の画像が矩形1301及び1302によって囲まれて表示される。
文字認識結果表示エリア130は、型番認識結果表示部1311及び点検項目表示部1312を含む。型番認識結果表示部1311には、型番照合504で認識された型番の文字が表示される。点検項目表示部1312には、認識された型番の機器で点検すべき項目が点検順序に従って表示される。
撮影画像表示エリア120に表示された画像で、項目一括確認処理を実行する場合、ユーザはOKボタン133を操作する。撮影画像表示エリア120に表示された画像に点検対象の文字列が含まれず、新たな画像を入力する場合、ユーザはRetryボタン134を操作する。
次に、図12に示す項目一括確認処理のステップ1201の処理では、最初に点検する項目(S/N)が選択され、ステップ1202の処理で、項目(S/N)の認識結果表示画面110が表示される。図13Bは、実施例2の項目(S/N)の認識結果表示画面110の説明図である。
項目(S/N)の認識結果表示画面110の撮影画像表示エリア120に表示された画像では、認識結果の項目であるS/Nの文字列の画像を囲む矩形1301が強調表示される。一方、認識結果の項目でないMACの文字列の画像を囲む矩形1302は強調表示されない。
文字認識結果表示エリア130は、図9Eと同じであるので説明を省略する。
ユーザは、項目(S/N)の認識結果表示画面110で認識結果が正しいと判断した場合、認識結果の修正が完了した場合、OKボタン133を操作する。ユーザによってOKボタン133が操作された場合、点検項目認識部253は、次の項目(MAC)の認識結果表示画面110(図13C参照)を表示する。一方、ユーザは、撮影画像表示エリア120に表示された画像に点検すべき項目の文字列が含まれないことに気づいた場合、Retryボタン134を操作する。この場合、点検項目認識部253は、新たな画像の入力を受け付け、再度項目一括認識処理を実行する。
図13Cは、実施例2の項目(MAC)の認識結果表示画面110の説明図である。
項目(MAC)の認識結果表示画面110の撮影画像表示エリア120に表示された画像では、認識結果の項目であるMACの文字列の画像を囲む矩形1302が強調表示される。一方、認識結果の項目でないS/Nの文字列の画像を囲む矩形1301は強調表示されない。
文字認識結果表示エリア130は、図9Eと同じであるので説明を省略する。
図14は、実施例2の未認識項目表示画面1400の説明図である。
未認識項目表示画面1400には、点検作業を実施する機器の点検すべき項目のうち、項目一括認識処理で認識されていない項目の一覧が表示される。
以上によって、本実施例では、第1項目の文字を認識するための画像が入力され、前記プロセッサは、前記入力された画像から前記第1項目の文字を認識し、前記認識された第1項目に関連付けられた第2項目の文字を認識するための画像が入力され、前記プロセッサは、当該入力された画像から前記認識された第1項目に関連付けられた第2項目の文字を認識する。これによって、第2項目を特定するために必要な項目である第1項目用の画像から第1項目の文字を認識するので、第1項目の認識精度を向上させつつ、第2項目は一つの画像から一括して認識するので、第2項目ごとに画像を入力する必要がなくなり、ユーザの作業効率を向上させることができる。
実施例3について、図15〜図16Bを用いて説明する。
実施例2では、型番の文字を認識するための画像が入力されて型番の文字が認識された後、一つの画像が入力され、当該画像から型番以外の全ての点検項目の文字が一括して認識されたが、本実施例では、入力された一つの画像から型番を含む全ての項目の文字が一括して認識される。
図15は、実施例3の文字認識処理のフローチャートである。図15では、実施例1の図5及び実施例2の図10に示す文字認識処理と同じ処理は同じ符号を付与し、説明を省略する。
本実施例の文字認識処理は、図10に示すステップ504の処理(型番照合処理)を実行せず、また、図10に示すステップ1001の処理(項目一括認識処理)の代わりに全項目一括認識処理を実行し(1501)、図10に示すステップ1002の処理(項目一括確認処理)の代わりに全項目一括確認処理を実行する(1502)。
ステップ1501の処理で実行される全項目一括認識処理では、文字認識部251は、入力された画像から文字列を抽出し、抽出した文字列から型番を含む全ての項目の文字を認識する。
全項目一括認識処理は、基本的には項目一括認識処理と同じ処理で実現可能である。しかし、全項目一括認識処理は、型番を含む全ての項目の文字を認識する点で図10に示す項目一括認識処理と相違する。
全項目一括認識処理では、入力された画像から最初に型番の文字を認識する必要がある。このため、型番の文字が認識される前のステップ1103の処理では、文字認識部251は、ステップ501の処理で入力を受け付けた場所に設置される全ての機器の型番のレコードを点検シナリオデータ261から読み込み、ステップ604の処理で型番の文字を認識する。もしくは、点検シナリオデータ261の機器番号302の順に、一つずつ型番のレコードを読み込み、ステップ604の処理で型番の文字を認識する。ステップ1104の処理でも、ステップ1103の処理と同じく入力を受け付けた場所に設置された機器の型番のレコードを作業ログ262から読み込む。なお、型番の文字が認識された後の全項目一括認識処理は、項目一括認識処理と同じである。
全項目一括確認処理は、基本的には、項目一括認識確認処理と同じ処理で実現可能である。全項目一括確認処理は、型番の文字認識結果を示す認識結果表示画面110も表示する点で、項目一括確認処理と異なる。
次に、図16A及び図16Bを用いて、本実施例で表示される画面について説明する。
まず、文字認識部251は、全項目一括確認処理で最初の項目(型番)の認識結果表示画面110(図16B参照)を表示する前に、点検項目の一覧を表示する認識結果表示画面110を表示する。図16Aは、実施例3の点検項目の一覧を表示する認識結果表示画面110の説明図である。
図16Aに示す認識結果表示画面110は、撮影画像表示エリア120及び文字認識結果表示エリア130を含む。
撮影画像表示エリア120には、全項目一括認識処理で入力された画像が表示される。また、撮影画像表示エリア120に表示された画像では、型番として認識された文字列の画像が矩形1601によって囲まれて表示され、型番以外の点検項目として認識された文字列の画像点検項目の文字が認識された文字列の画像が矩形1301及び1302によって囲まれて表示される。
型番の文字列を囲む矩形1601と点検項目の文字列を囲む矩形1301及び1302とは、型番の文字列であるか点検項目の文字列であるかをユーザが特定可能なように表示される。例えば、矩形1601は実線で表示され、矩形1301及び1302は点線で表示される。
文字認識結果表示エリア130は点検項目表示部1312を含み、点検項目表示部1312には点検すべき型番を含む項目が点検順序に表示される。
OKボタン133が操作されると、文字認識部251は、最初の項目である型番の認識結果表示画面110を表示する。図16Bは、実施例3の型番の認識結果表示画面110の説明図である。図16Bに示す型番の認識結果表示画面110は、型番の認識結果が表示される点以外は、図13Bに示す項目(S/N)の認識結果表示画面110と同じであり、同じ構成は同じ符号を付与し、説明を省略する。
撮影画像表示エリア120に表示される画像においては、文字認識結果表示エリア130に認識結果が表示されている型番の文字列の矩形1601が例えば実線で強調表示される。なお、S/Nの文字列を囲む矩形1301及びMACの文字列を囲む矩形1302は点線で表示されるが、次に認識結果が表示される矩形1301の点線の点と点との距離を、矩形1302の点線の点と点との距離を長くすることによって、次に認識結果が表示される項目の文字列を囲む矩形と、その他の項目の文字列を囲む矩形とを把握しやすいようにする。
OKボタン133が操作されると、文字認識部251は、次の項目である項目(MAC)の認識結果表示画面110を表示する。
本実施例では、プロセッサは、入力された一つの画像から、前記第1項目の文字を認識し、前記入力された画像から、前記認識された第1項目に関連付けられた全ての第2項目の文字を一括で認識する。これによって、一つの画像を入力するだけで、全ての項目の文字が一括で認識されるので、ユーザの作業効率を向上させることができる。
本実施例では、文字認識部251は、ある機器で点検作業が実施され、当該機器の項目の文字が認識された場合、文字が認識された項目の相対的な配置関係(レイアウト)を作業ログ262にとして記憶する。配置関係とは、例えば、型番の下方にS/Nが位置し、S/Nの下方にMACが位置する等の位置関係であってもよいし、項目の重心間の距離であってもよい。位置関係は上下方向に限定されず、左右方向の位置関係を含んでもよい。
そして、同じ機器で点検作業が実施される場合、文字認識部251は、作業ログ262の認識する項目のレコードのレイアウトを参照し、文字を認識する項目の文字列の抽出する領域を入力された画像から特定する。そして、文字認識部251は、特定した領域から文字列を抽出し、抽出した文字列の文字を認識する。このように、作業ログ262のレイアウトを参照して特定された文字列の抽出位置から文字列を抽出するので、入力された画像の全ての位置から文字列を抽出する必要がなくなり、文字認識装置200の処理負荷を軽減できる。本実施例は、複数の項目を一括で認識する処理を実行する実施例2及び2に適用可能である。
本実施例の文字認識処理について実施例2を用いて説明する。
まず、図10に示す項目一括確認処理のステップ1203の処理で、ステップ1202の認識結果表示画面110が表示された項目の文字認識結果及び画像を補正するためのパラメータを作業ログ262に登録する際に、当該項目の文字が認識された文字列の位置を示す座標も作業ログ262に登録する。例えば、作業ログ262に登録される座標は、入力された画像の文字列が抽出された領域の重心の座標である。そして、文字認識部251は、当該項目の項目番号より一つ前の項目の文字列の座標から当該項目の文字列の座標までの向き及び距離を計算し、計算した向き及び距離を当該項目の作業ログ262に登録する。このように、本実施例の項目一括確認処理では、確認する項目の作業ログ262に、当該項目の一つ前の項目の文字列の座標からの向き及び距離がレイアウトとして登録される。
次に、作業ログ262に登録されたレイアウトを用いた項目一括認識処理について図11を用いて説明する。実施例2は、ステップ603の処理の文字認識前処理で入力された画像から文字列を抽出したが、本実施例は、ステップ603の処理の文字認識前処理で文字列を抽出せずに、ステップ1105の処理で文字列を抽出し、抽出した文字列を選択する。
本実施例のステップ1105の処理で実行される文字列抽出処理について説明する。文字認識部251は、ステップ1104の処理で読み込まれた文字を認識する項目の作業ログ262からレイアウトを取得する。そして、ステップ1105の処理では、文字認識部251は、文字を認識する項目の一つ前の項目の文字列の位置から、取得したレイアウトに含まれる向き及び距離によって特定される領域の文字列を抽出し、抽出した文字列を選択して、ステップ604の文字列認識処理を実行する。
このように、本実施例では、入力された画像の全ての文字列を抽出せずに、項目ごとに限定された領域から文字列を抽出するので、文字認識装置200の処理負荷を軽減できる。また、文字を認識する項目の文字列が位置する可能性が高い領域から文字列が抽出され、抽出された文字列の文字が認識されるので、認識精度も向上させることができる。
なお、同じ機器に複数回点検作業が実施される場合、カメラの画角が点検作業ごとに異なる可能性があるが、文字認識前処理で、画角の違いを補正することによって文字列を正確に抽出できる。また、点検作業毎に項目のレイアウトを統計的に解析し、解析結果を作業ログ262に登録することによって、画角の違いを吸収できる。
また、作業ログ262のレイアウトは項目の文字列の周辺の文字列の座標等を含んでもよい。この場合、文字認識部251は、文字を認識する項目の文字列を抽出する場合、認識対象とならない周辺の文字列の座標付近の文字列を抽出しない。文字を認識する項目の周辺の文字列が抽出されないので、候補となる文字列を減らすことができ、認識精度を向上させることができる。
実施例1〜3では、文字認識部251に入力される画像は静止画であるものとして説明したが、文字認識部251に入力される画像は動画であってもよい。ユーザが点検作業をする機器のラベル等の動画を撮影し、当該動画がリアルタイムで文字認識部251に入力され、文字認識部251がリアルタイムで文字認識処理を実行してもよい。なお、文字認識部251は、ある機器の全ての項目の文字認識が終了した時点で、動画の撮影を終了させて、認識結果をユーザに確認させてもよい。
実施例1〜3では、文字認識部251は、一つの画像から文字を認識するが、複数の画像から文字を認識してもよい。例えば、文字認識部251に動画が入力され、入力された動画に含まれる複数のフレーム画像から文字を認識し、認識結果が同じフレーム画像が所定数以上あれば、当該認識結果を記憶する。これによって、認識精度を向上させることができる。
実施例1〜3で認識する文字は項目の名称の周辺に記載された点検対象となる文字列であるが、項目の名称の文字列及び当該項目の点検対象となる文字列の文字を認識してもよい。これは、同じ表記の文字列が一つの画像に存在する場合に有効である。例えば、文字認識部251に入力された画像に次回点検予定日の日付と前回点検日の日付とが含まれている場合等である。例えば、図1に示すラベル141からは、項目名の名称「S/N」と点検対象となる文字列「17120401161」との組み合わせ、及び項目の名称「MAC」と点検対象となる文字列「C08ADE14CB60」との組み合わせが抽出される。
また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。また、上記の各構成、機能、処理部、処理手段などは、それらの一部または全部を、例えば集積回路で設計するなどによりハードウェアで実現してもよい。
また、前記の各構成、機能などは、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。
各機能を実現するプログラム、テーブル、ファイルなどの情報は、メモリや、ハードディスク、SSD(Solid State Drive)などの記録装置、または、IC(Integrated Circuit)カード、SDカード、DVD(Digital Versatile Disc)などの記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。
200 文字認識装置
210 操作部
220 表示部
230 画像入力部
250 プロセッサ
251 文字認識部
252 機器特定情報認識部
253 点検項目認識部
260 メモリ
261 点検シナリオデータ
262 作業ログ
270 補助記憶装置

Claims (12)

  1. 入力された画像に含まれる文字を認識する文字認識装置であって、
    文字を認識する複数の項目を含む複数のグループと、前記グループに含まれる複数の項目の当該グループ内での認識順序と、各項目の文字の認識に用いる情報とが登録された認識辞書を記憶する記憶部と、
    プロセッサと、を備え、
    前記認識辞書に登録される項目は、複数の第1項目及び複数の第2項目を含み、
    前記第1項目は前記グループ内での認識順序が最初の項目であって、前記第1項目に少なくとも一つの第2項目が関連付けられ、
    前記プロセッサは、
    前記認識辞書に登録された複数のグループの第1項目の文字の認識に用いる情報に基づいて、入力された画像から前記第1項目の文字を認識し、
    前記認識辞書に登録された前記認識順序を参照し、前記認識された文字の第1項目に関連付けられた第2項目から次に文字を認識する第2項目を特定し、
    前記特定した第2項目の文字の認識に用いる情報を前記認識辞書から読み出し、
    前記読み出された第2項目の文字の認識に用いる情報に基づいて、入力された画像から当該第2項目の文字を認識することを特徴とする文字認識装置。
  2. 請求項1に記載の文字認識装置であって、
    前記第1項目の文字の認識に用いる情報は、前記第1項目の表記形式を含み、
    前記プロセッサは、前記第1項目の認識された文字の表記形式が当該第1項目の表記形式と一致する場合、当該第1項目の認識された文字を当該第1項目の認識結果とすることを特徴とする文字認識装置。
  3. 請求項1に記載の文字認識装置であって、
    前記プロセッサは、前記認識された第1項目及び第2項目の文字を、作業ログとして前記記憶部に記憶することを特徴とする文字認識装置。
  4. 請求項3に記載の文字認識装置であって、
    前記プロセッサは、
    入力された画像をパラメータに基づいて補正し、前記補正後の画像から認識対象となる項目の文字を認識し、
    前記文字の認識が成功した場合、前記画像の補正に用いたパラメータを前記作業ログとして前記記憶部に記憶することを特徴とする文字認識装置。
  5. 請求項3に記載の文字認識装置であって、
    前記プロセッサは、
    入力された画像から文字列を抽出し、
    前記抽出した文字列から認識対象となる項目の文字の認識に用いる情報に基づいて文字を認識し、
    前記文字の認識が成功した場合、前記文字を認識した項目と当該項目より認識順序が一つ前の項目との配置関係を前記作業ログに登録し、
    当該項目の文字を再度認識する場合、前記作業ログに登録された配置関係に基づいて、入力された画像から文字列を抽出する領域を特定し、
    前記特定した領域から文字列を抽出することを特徴とする文字認識装置。
  6. 請求項1に記載の文字認識装置であって、
    前記第1項目の文字を認識するための画像が入力され、前記プロセッサは、前記入力された画像から前記第1項目の文字を認識し、
    前記認識された第1項目の次に認識する第2項目の文字を認識するための画像が入力され、前記プロセッサは、当該入力された画像から当該第2項目の文字を認識し、
    前記認識された第1項目に関連付けられた最後の第2項目の文字を認識するための画像が入力され、当該入力された画像から当該第2項目の文字を認識するまで繰り返すことを特徴とする文字認識装置。
  7. 請求項1に記載の文字認識装置であって、
    前記第1項目の文字を認識するための画像が入力され、前記プロセッサは、前記入力された画像から前記第1項目の文字を認識し、
    前記認識された第1項目に関連付けられた第2項目の文字を認識するための画像が入力され、前記プロセッサは、当該入力された画像から前記認識された第1項目に関連付けられた全ての第2項目の文字を一括で認識することを特徴とする文字認識装置。
  8. 請求項1に記載の文字認識装置であって、
    前記プロセッサは、
    入力された一つの画像から、前記第1項目の文字を認識し、
    前記入力された画像から、前記認識された第1項目に関連付けられた全ての第2項目の文字を一括で認識することを特徴とする文字認識装置。
  9. 請求項1に記載の文字認識装置であって、
    前記プロセッサは、
    前記認識された第1項目の文字を表示部に表示し、
    前記認識された第2項目の文字を前記認識辞書に登録された認識順序通りに前記表示部に表示することを特徴とする文字認識装置。
  10. 請求項9に記載の文字認識装置であって、
    前記プロセッサは、前記認識された第1項目の文字を前記表示部に表示する場合、又は前記認識された第2項目の文字を前記表示部に前記表示する場合、前記認識辞書に登録された前記認識に用いた情報も前記表示部に表示することを特徴とする文字認識装置。
  11. 入力された画像に含まれる文字を認識する文字認識装置における文字認識方法であって、
    前記文字認識装置は、記憶部とプロセッサとを有し、
    前記記憶部には、文字を認識する複数の項目を含む複数のグループと、前記グループに含まれる複数の項目の当該グループ内での認識順序と、各項目の文字の認識に用いる情報とが登録された認識辞書が記憶され、
    前記認識辞書に登録される項目は、複数の第1項目及び複数の第2項目を含み、
    前記第1項目は前記グループ内での認識順序が最初の項目であって、前記第1項目に少なくとも一つの第2項目が関連付けられ、
    前記文字認識方法は、
    前記プロセッサが、前記認識辞書に登録された複数のグループの第1項目の文字の認識に用いる情報に基づいて、入力された画像から前記第1項目の文字を認識し、
    前記プロセッサが、前記認識辞書に登録された前記認識順序を参照し、前記認識された文字の第1項目に関連付けられた第2項目から次に文字を認識する第2項目を特定し、
    前記プロセッサが、前記特定した第2項目の文字の認識に用いる情報を前記認識辞書から読み出し、
    前記プロセッサが、前記読み出された第2項目の文字の認識に用いる情報に基づいて、入力された画像から当該第2項目の文字を認識することを特徴とする文字認識方法。
  12. 入力された画像に含まれる文字を認識する処理を装置が有するプロセッサに実行させるプログラムであって、
    前記装置は、記憶部と前記プロセッサとを有し、
    前記記憶部には、文字を認識する複数の項目を含む複数のグループと、前記グループに含まれる複数の項目の当該グループ内での認識順序と、各項目の文字の認識に用いる情報とが登録された認識辞書が記憶され、
    前記認識辞書に登録される項目は、複数の第1項目及び複数の第2項目を含み、
    前記第1項目は前記グループ内での認識順序が最初の項目であって、前記第1項目に少なくとも一つの第2項目が関連付けられ、
    前記処理では、
    前記プロセッサが、前記認識辞書に登録された複数のグループの第1項目の文字の認識に用いる情報に基づいて、入力された画像から前記第1項目の文字を認識し、
    前記プロセッサが、前記認識辞書に登録された前記認識順序を参照し、前記認識された文字の第1項目に関連付けられた第2項目から次に文字を認識する第2項目を特定し、
    前記プロセッサが、前記特定した第2項目の文字の認識に用いる情報を前記認識辞書から読み出し、
    前記プロセッサが、前記読み出された第2項目の文字の認識に用いる情報に基づいて、入力された画像から当該第2項目の文字を認識することを特徴とするプログラム。
JP2015135059A 2015-07-06 2015-07-06 文字認識装置、文字認識方法、及びプログラム Expired - Fee Related JP6527410B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015135059A JP6527410B2 (ja) 2015-07-06 2015-07-06 文字認識装置、文字認識方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015135059A JP6527410B2 (ja) 2015-07-06 2015-07-06 文字認識装置、文字認識方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017016549A true JP2017016549A (ja) 2017-01-19
JP6527410B2 JP6527410B2 (ja) 2019-06-05

Family

ID=57830875

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015135059A Expired - Fee Related JP6527410B2 (ja) 2015-07-06 2015-07-06 文字認識装置、文字認識方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6527410B2 (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018045480A (ja) * 2016-09-15 2018-03-22 株式会社アイエスピー ガイダンス付き文書情報取得方法、プログラム、及び携帯端末装置
JP2018129689A (ja) * 2017-02-08 2018-08-16 パナソニック株式会社 文字認識システム、文字認識方法、及び文字認識サーバ
JP2018136830A (ja) * 2017-02-23 2018-08-30 凸版印刷株式会社 移動端末装置、シリアルコード抽出用プログラム及びサーバ装置
CN109214381A (zh) * 2017-07-03 2019-01-15 发那科株式会社 数控程序转换装置
CN110378217A (zh) * 2019-06-13 2019-10-25 平安科技(深圳)有限公司 基于光学字符识别的申请验证方法、装置及电子设备
WO2020158955A1 (ja) * 2019-02-01 2020-08-06 エックスリープ株式会社 情報処理装置
CN111523359A (zh) * 2019-02-05 2020-08-11 富士施乐株式会社 信息处理装置、记录媒体及信息处理方法
JP2021012741A (ja) * 2020-10-22 2021-02-04 日本電気株式会社 画像処理装置、画像処理方法およびプログラム
WO2021033603A1 (ja) * 2019-08-21 2021-02-25 京セラドキュメントソリューションズ株式会社 画像読取装置
JP2022017914A (ja) * 2020-07-14 2022-01-26 九電ビジネスソリューションズ株式会社 運用保守システム、運用保守方法および運用保守プログラム
JP2022037301A (ja) * 2020-08-25 2022-03-09 日東工業株式会社 配電機器調査システム
WO2022254560A1 (ja) * 2021-05-31 2022-12-08 株式会社KPMG Ignition Tokyo 光学文字認識により生成されるテキストデータを用いたデータマッチング
US11605219B2 (en) 2018-04-02 2023-03-14 Nec Corporation Image-processing device, image-processing method, and storage medium on which program is stored
WO2024053411A1 (ja) * 2022-09-05 2024-03-14 ダイキン工業株式会社 情報端末、文字認識方法及び文字認識プログラム
JP2024039233A (ja) * 2022-09-09 2024-03-22 三菱マテリアル株式会社 推定装置、推定システム、推定方法、およびプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208650A (ja) * 1992-04-03 1994-07-26 Iiguretsuku Syst:Kk 情報認識方法及び情報認識装置
JP2001224557A (ja) * 1999-09-09 2001-08-21 Matsushita Electric Ind Co Ltd データ入力装置、データ入力システム、表示データ解析装置および媒体
JP2006277315A (ja) * 2005-03-29 2006-10-12 Nec Corp パターン認識装置、パターン認識方法およびそのパターン認識装置をもつ電子機器
JP2013161395A (ja) * 2012-02-08 2013-08-19 Asahi Glass Co Ltd データ管理システム、管理データ抽出方法および管理データ抽出プログラム
JP2015011674A (ja) * 2013-07-02 2015-01-19 三菱電機ビルテクノサービス株式会社 検針用携帯端末

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208650A (ja) * 1992-04-03 1994-07-26 Iiguretsuku Syst:Kk 情報認識方法及び情報認識装置
JP2001224557A (ja) * 1999-09-09 2001-08-21 Matsushita Electric Ind Co Ltd データ入力装置、データ入力システム、表示データ解析装置および媒体
JP2006277315A (ja) * 2005-03-29 2006-10-12 Nec Corp パターン認識装置、パターン認識方法およびそのパターン認識装置をもつ電子機器
JP2013161395A (ja) * 2012-02-08 2013-08-19 Asahi Glass Co Ltd データ管理システム、管理データ抽出方法および管理データ抽出プログラム
JP2015011674A (ja) * 2013-07-02 2015-01-19 三菱電機ビルテクノサービス株式会社 検針用携帯端末

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018045480A (ja) * 2016-09-15 2018-03-22 株式会社アイエスピー ガイダンス付き文書情報取得方法、プログラム、及び携帯端末装置
JP2018129689A (ja) * 2017-02-08 2018-08-16 パナソニック株式会社 文字認識システム、文字認識方法、及び文字認識サーバ
JP2018136830A (ja) * 2017-02-23 2018-08-30 凸版印刷株式会社 移動端末装置、シリアルコード抽出用プログラム及びサーバ装置
CN109214381A (zh) * 2017-07-03 2019-01-15 发那科株式会社 数控程序转换装置
JP2019016001A (ja) * 2017-07-03 2019-01-31 ファナック株式会社 Ncプログラム変換装置
US10410080B2 (en) 2017-07-03 2019-09-10 Fanuc Corporation NC-program conversion device
US11605219B2 (en) 2018-04-02 2023-03-14 Nec Corporation Image-processing device, image-processing method, and storage medium on which program is stored
WO2020158955A1 (ja) * 2019-02-01 2020-08-06 エックスリープ株式会社 情報処理装置
JPWO2020158955A1 (ja) * 2019-02-01 2021-12-02 エックスリープ株式会社 情報処理装置
CN111523359B (zh) * 2019-02-05 2025-07-25 富士胶片商业创新有限公司 信息处理装置、记录媒体及信息处理方法
CN111523359A (zh) * 2019-02-05 2020-08-11 富士施乐株式会社 信息处理装置、记录媒体及信息处理方法
CN110378217A (zh) * 2019-06-13 2019-10-25 平安科技(深圳)有限公司 基于光学字符识别的申请验证方法、装置及电子设备
WO2021033603A1 (ja) * 2019-08-21 2021-02-25 京セラドキュメントソリューションズ株式会社 画像読取装置
JP2022017914A (ja) * 2020-07-14 2022-01-26 九電ビジネスソリューションズ株式会社 運用保守システム、運用保守方法および運用保守プログラム
JP2022037301A (ja) * 2020-08-25 2022-03-09 日東工業株式会社 配電機器調査システム
JP7511982B2 (ja) 2020-08-25 2024-07-08 日東工業株式会社 配電機器調査システム
JP7111143B2 (ja) 2020-10-22 2022-08-02 日本電気株式会社 画像処理装置、画像処理方法およびプログラム
JP2021012741A (ja) * 2020-10-22 2021-02-04 日本電気株式会社 画像処理装置、画像処理方法およびプログラム
WO2022254560A1 (ja) * 2021-05-31 2022-12-08 株式会社KPMG Ignition Tokyo 光学文字認識により生成されるテキストデータを用いたデータマッチング
WO2024053411A1 (ja) * 2022-09-05 2024-03-14 ダイキン工業株式会社 情報端末、文字認識方法及び文字認識プログラム
JP2024036017A (ja) * 2022-09-05 2024-03-15 ダイキン工業株式会社 情報端末、文字認識方法及び文字認識プログラム
JP7568945B2 (ja) 2022-09-05 2024-10-17 ダイキン工業株式会社 情報端末、文字認識方法及び文字認識プログラム
US20250201000A1 (en) * 2022-09-05 2025-06-19 Daikin Industries, Ltd. Information terminal, character recognition method and character recognition program
JP2024039233A (ja) * 2022-09-09 2024-03-22 三菱マテリアル株式会社 推定装置、推定システム、推定方法、およびプログラム
JP7490028B2 (ja) 2022-09-09 2024-05-24 三菱マテリアル株式会社 推定装置、推定システム、推定方法、およびプログラム

Also Published As

Publication number Publication date
JP6527410B2 (ja) 2019-06-05

Similar Documents

Publication Publication Date Title
JP6527410B2 (ja) 文字認識装置、文字認識方法、及びプログラム
US11170248B2 (en) Video capture in data capture scenario
US9785627B2 (en) Automated form fill-in via form retrieval
KR101199747B1 (ko) 단어 인식 방법 및 단어 인식용 프로그램의 기록매체 및 정보 처리 장치
JP6528147B2 (ja) 会計データ入力支援システム、方法およびプログラム
KR102208683B1 (ko) 문자 인식 방법 및 그 장치
US10552674B2 (en) Computer, document identification method, and system
CN111353501A (zh) 一种基于深度学习的书本点读方法及系统
JP6569532B2 (ja) 管理システム、リスト作成装置、リスト作成方法、管理方法及び管理用プログラム
CN107545391A (zh) 一种基于图像识别的物流单据智能分析与自动存储方法
JP4661921B2 (ja) 文書処理装置およびプログラム
JP6458239B1 (ja) 画像認識システム
US20230215201A1 (en) Identify card number
JPH07185473A (ja) ビデオコーティング装置
JP6831951B2 (ja) 画像認識システム
US20210012138A1 (en) Image processing device, image processing method, and storage medium storing program
CN104067294A (zh) 字符读取装置和字符读取方法
CN113673528A (zh) 文本处理方法、装置、电子设备和可读存储介质
US20180174324A1 (en) Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor
CN112115921A (zh) 一种真伪鉴别方法、装置以及电子设备
JP6941331B2 (ja) 画像認識システム
US10438097B2 (en) Recognition device, recognition method, and computer program product
JP2018156308A (ja) 情報処理装置、情報処理システム及びプログラム
JP6432179B2 (ja) 文書ファイル生成装置及び文書ファイル生成方法
JP2019016128A (ja) 画像類否判断プログラム、画像類否判断装置および画像類否判断方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190510

R150 Certificate of patent or registration of utility model

Ref document number: 6527410

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees