JP7780090B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP7780090B2
JP7780090B2 JP2022141408A JP2022141408A JP7780090B2 JP 7780090 B2 JP7780090 B2 JP 7780090B2 JP 2022141408 A JP2022141408 A JP 2022141408A JP 2022141408 A JP2022141408 A JP 2022141408A JP 7780090 B2 JP7780090 B2 JP 7780090B2
Authority
JP
Japan
Prior art keywords
image data
character recognition
unit
character
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022141408A
Other languages
English (en)
Other versions
JP2024036873A (ja
Inventor
展秀 澤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Wave Inc
Original Assignee
Denso Wave Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Wave Inc filed Critical Denso Wave Inc
Priority to JP2022141408A priority Critical patent/JP7780090B2/ja
Publication of JP2024036873A publication Critical patent/JP2024036873A/ja
Application granted granted Critical
Publication of JP7780090B2 publication Critical patent/JP7780090B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本明細書では、画像データに対する文字認識を実行する文字認識装置に関する技術を開示する。
特許文献1には、撮影された画像データ内の文字を認識する文字認識手段と、静止状態を検知する静止検知手段と、を備える文字認識装置が開示されている。文字認識装置では、文字認識を開始する条件の一つとして、静止状態を検知したことが設定されている。
特開2010―217997号公報
例えば、連続的に画像データを出力するカメラが想定される。当該カメラを特許文献1の文字認識装置に採用すると、文字認識装置に複数個の画像データが記憶される。このため、文字認識装置に記憶されている複数個の画像データのうち、静止状態前に撮像された画像データに対する文字認識が実行されるおそれがある。この場合、ユーザが意図した文字とは異なる文字を認識してしまうおそれがある。本明細書では、カメラが連続的に画像データを出力する構成において、ユーザが意図した文字とは異なる文字を認識することを抑制するための技術を提供する。
本明細書が開示する文字認識装置は、操作部と、前記操作部がユーザから所定の第1の指示を受け付けることに応じて、動作を開始するカメラと、前記カメラの動作中に前記カメラから連続して出力される画像データを記憶するメモリと、前記文字認識装置の姿勢の揺れを示す姿勢値を計測する計測部と、出力部と、前記操作部が前記ユーザから前記第1の指示を受け付けた第1のタイミングから前記姿勢値が前記姿勢の揺れが静止したことを示す第2のタイミングまでの間に前記メモリに記憶された、複数個の前記画像データを削除する削除部と、前記第2のタイミング後に前記メモリに記憶された少なくとも1個の前記画像データに対する文字認識を実行する文字認識実行部と、前記文字認識の結果を示すデータを前記出力部に出力させる出力制御部と、を備えてもよい。
文字認識装置の姿勢に揺れが静止する前にメモリに記憶された画像データは、ユーザの意図に反する画像データである可能性がある。上記の構成によれば、第1のタイミングから第2のタイミングの間のユーザの意図に反する可能性のある複数個の画像データがメモリから削除される。文字認識装置の姿勢の揺れが静止する前にメモリに記憶された画像データに対する文字認識が実行されない。カメラが連続的に画像データを出力する構成において、ユーザが意図した文字とは異なる文字を認識することを抑制することができる。
上述した文字読取装置では、前記操作部は、前記第1の指示の後に所定の第2の指示を受け付けてもよい。その場合、前記文字認識実行部は、前記操作部が前記第2の指示を受け付けた後に前記メモリに記憶された前記少なくとも1個の画像データに対する前記文字認識を実行してもよい。
このような構成によると、ユーザは、第1の指示によりカメラを起動し、第2の指示により文字認識を実行させることができる。第2の指示が無い比較例よりも、ユーザの意図を文字認識の対象に反映させることができる。
上述した文字認識装置では、前記出力制御部は、前記第2の指示の後、前記姿勢値が前記姿勢の揺れが静止したことを示す場合に、前記データを前記出力部に出力させてもよい。その場合、前記姿勢値が前記姿勢の揺れが静止したことを示さない場合に、前記データを前記出力部に出力させなくてもよい。
ユーザから第2の指示を受け付けた後に文字認識装置の姿勢が揺れると、ユーザの意図に反した文字に対する文字認識が実行される可能性がある。姿勢値が姿勢の揺れが静止したことを示さない場合に、データを出力部に出力させないことにより、ユーザが意図した文字とは異なる文字に対するデータが出力部に出力されることを抑制することができる。
前記文字認識装置は、さらに、前記第2のタイミングから前記操作部が前記第2の指示を受け付けた第3のタイミングまでの間に前記メモリに記憶された第1の画像データと、前記第3のタイミング後に前記メモリに記憶された第2の画像データと、を比較する画像比較部を備えてもよい。その場合、前記文字認識実行部は、前記第1の画像データと前記第2の画像データとが類似する場合に、前記第1の画像データ及び前記第2の画像データのうちの少なくとも一方に対する前記文字認識を実行してもよく、前記第1の画像データと前記第2の画像データとが類似しない場合に、前記第2の画像データに対する前記文字認識を実行してもよい。
第1の画像データと第2の画像データとが類似しない場合、ユーザは、第1の画像データではなく、第2の画像データに対する文字認識の実行を意図していると推測される。このような構成によると、第1の画像データと第2の画像データとを比較することによって、第1の画像データと第2の画像データとのうち、ユーザが意図する画像データに対する文字認識を適切に実行することができる。
上述した文字認識装置では、前記文字認識は、画像データから文字画像データを抽出する第1の認識処理と、抽出済みの前記文字画像データに対して前記文字認識を実行する第2の認識処理と、を含んでもよい。その場合、文字認識装置は、さらに、前記第2のタイミングから前記操作部が前記第2の指示を受け付けた第3のタイミングまでの間に前記メモリに記憶された第1の画像データと、前記第3のタイミング後に前記メモリに記憶された第2の画像データと、を比較する画像比較部を備えてもよい。前記文字認識実行部は、前記第2のタイミングから前記第3のタイミングの間において、前記第1の画像データに対する前記第1の認識処理を実行し、前記第1の画像データと前記第2の画像データとが類似する場合に、前記第1の認識処理が実行されている前記第1の画像データに対して前記第2の認識処理を実行してもよく、前記第1の画像データと前記第2の画像データとが類似しない場合に、前記第2の画像データに対して前記第1の認識処理及び前記第2の認識処理の双方を実行してもよい。
第1の画像データと第2の画像データが類似する場合、ユーザは、第1の画像データに対する文字認識の実行を意図していると推測される。このような構成によると、双方の画像データが互いに類似する場合、既に第1の認識処理が実行された第1の画像データに対して第2の認識処理が実行されるため、第1の画像データに対する迅速な文字認識を実行することができる。一方で、双方の画像データが互いに類似しない場合、ユーザが文字認識の実行を意図すると推測される第2の画像データに対して、文字認識を適切に実行することができる。
上述した文字認識装置では、前記第1の指示は、前記操作部に含まれる所定のボタンを押し下げる動作であってもよく、前記第2の指示は、前記第1の指示によって押し下げられた前記ボタンから指を離す動作であってもよい。
このような構成によると、例えば、ボタンを2回押し下げる比較例と比べて、ユーザの動作を簡潔にすることができる。
上述した文字認識装置は、さらに、前記姿勢値が前記姿勢の揺れが静止したことを示す場合に、所定の報知動作を実行する動作実行部を備えてもよい。
このような構成によると、ユーザは、所定の報知動作によって、文字認識装置の姿勢の揺れが静止したことを認識することができる。
前記文字認識装置は、さらに、前記少なくとも1個の画像データを表示する表示部を備えてもよい。その場合、前記報知動作は、前記第2のタイミングの後に、前記少なくとも1個の画像データ内に含まれる文字を強調する強調線を前記表示部に表示する動作を含んでもよい。
このような構成によると、ユーザは、強調線を見て、文字認識の対象となる文字を認識することができる。
前記文字認識装置は、さらに、前記文字認識の対象の文字を指し示すための指示マーカを照射する照射部と、前記操作部が前記第1の指示を受け付けることをトリガとして、前記指示マーカの照射を前記照射部に実行させる照射制御部と、を備えてもよい。
このような構成によると、指示マーカが対象の文字を指し示すまでの間に、ユーザは、文字認識装置の姿勢を調整する。姿勢が調整されている間、文字認識装置の姿勢は揺れやすい。このため、指示マーカを照射する文字認識装置では、第1のタイミングから第2のタイミングまでにメモリに記憶される画像データはユーザの意図が反映されていないことが推測される。本明細書が開示する技術は、このような構成を有する文字認識装置に対して特に有益である。
上述した文字読取装置では、前記照射制御部は、前記姿勢値が前記姿勢の揺れが静止したことを示す場合に、前記指示マーカの表示態様を、第1の態様から前記第1の態様とは異なる第2の態様に変更してもよい。
このような構成によると、ユーザは、第2の態様に変更された指示マーカを見て、文字認識装置の姿勢の揺れが静止したことを認識することができる。
上述した文字認識装置は、さらに、前記文字認識が所定時間を超えて完了しない場合に、前記文字認識を停止する文字認識停止部と、前記文字認識が停止されたことを前記ユーザに報知する停止報知部と、を備えてもよい。
このような構成によると、ユーザに文字認識が停止されたことを報知することができる。
また、上述の文字認識装置の制御方法、文字認識装置のためのコンピュータプログラム、及び、当該コンピュータプログラムを保存する記憶媒体も、新規で有用である。
第1実施例の情報読取端末の斜視図を示す。 第1実施例の情報読取端末の構成図を示す。 第1実施例の画像認識処理のフロー図を示す。 第2実施例の画像認識処理のフロー図を示す。
(第1実施例)
(情報読取端末10の構成;図1、図2)
図1に示す情報読取端末10は、情報を読み取るための複数の機能を有する可搬型の端末装置である。複数の機能は、情報コードに記録された情報を読み取る機能、記憶媒体に記憶された情報を読み取る機能、及び、紙等の印刷媒体に表示された文字を認識する文字認識機能を含む。情報コードは、例えば、2次元コード、バーコード等である。記憶媒体は、ICチップ、RFID等である。文字認識機能は、例えば、OCR(Optical Character Recognitionの略)によって実現される。ユーザは、情報読取端末10を把持して、例えば、荷物100の上面に貼付されるラベルL1に記載される文字列S1を情報読取端末10に読み取らせる。本明細書の情報読取端末10が実行する「文字認識」は、画像データに対応する画像に文字を表す画像が含まれるか否かを判断する処理と、文字を表す画像を文字データとして認識する処理と、を含む。
情報読取端末10は、操作部12と、表示部14と、カメラ16と、通信インターフェース18と、照射部20と、加速度センサ22と、報知部24と、制御部30と、筐体60と、を備える。以下、本明細書では、インターフェースのことを「I/F」と記載する。
操作部12は、情報読取端末10の正面(即ち、Z軸方向正側の面、図1の紙面上側の面)に設けられる複数個のボタンと、情報読取端末10の側面(即ち、Y軸方向負側の面、図1の紙面左側の面)に設けられるトリガボタンB1と、を備える。ユーザは操作部12を操作することによって、様々な指示を情報読取端末10に入力することができる。特に、トリガボタンB1は、カメラ16の動作を開始させるためのボタンである。表示部14は、様々な情報を表示するディスプレイである。表示部14は、例えば、カメラ16が撮像した画像を表示する。また、表示部14は、文字認識の結果を示すデータ(例えば、文字データ)も表示する。なお、表示部14は、ユーザの操作を受け付け可能なタッチパネル(即ち操作部12)として機能してもよい。
カメラ16は、情報読取端末10の裏面(即ち、Z軸方向負側の面、図1の紙面下側の面)に設けられており、LEDライト等の発光源と、CCDイメージセンサと、を含む。通信I/F18は、例えば、外部の装置(例えば、図示省略のサーバ)との通信を実行するためのインターフェースである。
照射部20は、カメラ16に隣接して設けられる。照射部20は、読み取り対象(例えば、二次元コード、文字)を指し示す指示マーカM1を照射するレーザ光源である。図1に示されるように、指示マーカM1は、十字形状を有する。照射部20は、ユーザによってトリガボタンB1が押されることをトリガとして、指示マーカM1を照射する。これにより、ユーザは、カメラ16の撮像範囲を読み取りの対象に近づけることができる。なお、指示マーカM1の形状は、例えば、ドット形状、三角形等の多角形、円形、楕円形等の他の形状であってもよい。
加速度センサ22は、情報読取端末10に内蔵されている。加速度センサ22は、例えば、圧電型センサ、静電容量型センサやピエゾ抵抗型センサ等である。加速度センサ22は、情報読取端末10の各方向(すなわち、X軸方向、Y軸方向及びZ軸方向)における加速度を検出して出力する。加速度センサ22は、ユーザによってトリガボタンB1が押されることをトリガとして、情報読取端末10の加速度を継続して検出する。加速度センサ22の各方向の出力値は、情報読取端末10の姿勢に応じて変化する。加速度センサ22は、情報読取端末10の姿勢を示す出力値を出力する。なお、変形例では、加速度センサ22に代えて、ジャイロセンサが用いられてもよい。
報知部24は、ユーザへの報知を実行する装置である。報知部24は、様々な音(例えば、様々な報知音、メッセージ音声等)を出力可能なスピーカである。変形例では、報知部24は、スピーカに限られず、光を発することができるライト、情報読取端末10を振動させることができる振動装置等であってもよい。
制御部30は、上記の各部12~24と電気的に接続されている。制御部30は、各部12~24と通信して、各部12~24の動作を制御する。制御部30は、CPU32とメモリ34とを備える。CPU32は、メモリ34内に記憶されているプログラム36に従って、様々な処理を実行する。
メモリ34は、RAM、ROMや不揮発性メモリ等を含む。また、メモリ34は、プログラム36に加え、閾値Thを記憶している。閾値Thは、加速度センサ22の出力値の変化に基づいて、情報読取端末10の姿勢が揺れているか否かを判定するための閾値である。閾値Thは、加速度センサ22の出力値の単位時間における変化率の閾値である。ここで、単位時間は、例えば、1ミリ秒であり、非常に短い時間である。制御部30は、加速度センサ22の出力値が、閾値Thを超えて変化する場合に、情報読取端末10の姿勢が揺れていることを検知する。このように、加速度センサ22の出力値は、情報読取端末10の姿勢の揺れを示す姿勢値である。
さらに、メモリ34には、カメラ16の動作中に、カメラ16から連続して出力される画像データが記憶される。
(画像認識処理;図3)
図3を参照して、第1実施例の情報読取端末10の制御部30が実行する画像認識処理を説明する。本実施例の画像認識処理は、ユーザが、トリガボタンB1を押し下げることをトリガとして実行される。なお、ユーザによってトリガボタンB1が押し下げられると、カメラ16は、動作を開始し、連続して画像データをメモリ34に出力する。これにより、メモリ34に複数個の画像データが蓄積する。画像データがメモリ34に蓄積される処理は、図3の処理と並列で実行される。
S2では、制御部30は、指示マーカM1を照射部20に照射させる。S10では、制御部30は、メモリ34に記憶されている複数個の画像データの中から最新の画像データを取得する。
S12では、制御部30は、S10で取得した画像データに対応する画像に文字を表す画像が含まれるのか否かを判断する。例えば、制御部30は、画像データに文字らしき画像が存在する場合には、画像データに対応する画像に文字を表す画像が含まれると判断して、当該画像を切り取る。ここで、文字らしき画像とは、画像データに対応する画像のサイズ、単位面積当たりの明度等の情報に基づいて、文字が記載されていると推測される画像を示す。また、例えば、制御部30は、メモリ34内に文字の見本データを記憶していてもよい。その場合、制御部30は、メモリ34内の見本データに含まれる文字と所定の割合を超えて類似する画像が含まれる場合に、画像に文字を表す画像が含まれると判断してもよい。制御部30は、S10で取得した画像データに対応する画像に文字を表す画像が含まれると判断する場合(S12でYES)、S20に進む。制御部30は、S10で取得した画像データに対応する画像に文字を表す画像が含まれないと判断する場合(S12でNO)、S18に進む。
S20では、制御部30は、加速度センサ22の出力値の変化が、閾値Thよりも小さいか否かを判断する。制御部30は、出力値の変化が閾値Thよりも小さい場合(S20でYES)、情報読取端末10の姿勢の揺れが静止していると判断して、S22に進む。制御部30は、出力値の変化が閾値Thより大きい場合(S20でNO)、情報読取端末10の姿勢が揺れていると判断して、S18に進む。
S18では、制御部30は、メモリ34に記憶されている複数個の画像データを削除する。これにより、文字を含まない画像に対応する画像データ、及び、情報読取端末10の姿勢の揺れが静止する前に撮像された画像データがメモリ34から削除される。その後、制御部30は、S10に戻る。
S22では、制御部30は、照射部20によって指示マーカM2を照射する。指示マーカM2は、矩形形状を有する。制御部30は、情報読取端末10の姿勢の揺れが静止した場合に、指示マーカの形状を、十字型の指示マーカM1から、矩形型の指示マーカM2に変更する。十字型の指示マーカM1は、読み取り対象の範囲を指し示すのに対して、矩形型の指示マーカM2は、読み取り対象の文字を囲む。ユーザは、指示マーカM1から指示マーカM2に変化したことを見て、情報読取端末10の姿勢の揺れが静止したことを認識するとともに、読み取り対象の文字が確定したことを知ることができる。
S30では、制御部30は、S10で取得した最新の画像データに対する文字データ認識を実行する。具体的には、制御部30は、S12で最新の画像データに含まれると判断した文字を表す画像を、文字データとして認識する。
S32では、制御部30は、S30の文字データ認識が成功したか否かを判断する。制御部30は、S30の文字データ認識が成功する場合(S32でYES)、S34に進む。
S34では、制御部30は、文字データ認識の結果を表示部14に表示する。具体的には、制御部30は、文字データ認識によって認識した文字データを表示部14に表示させる。その後、制御部30は、図3の処理を終了する。なお、変形例では、制御部30は、文字データ認識の結果示すデータを通信I/F18を介して外部の装置(例えばサーバ)に送信してもよい。
また、制御部30は、S30の文字データ認識が成功することなく、S30の処理の開始から所定時間が経過する場合(S40でYES)、S42に進む。
S42では、制御部30は、S30で実行された文字データ認識を途中で停止する。これにより、例えばS10で取得された画像データに対応する画像が不鮮明である場合に、文字データ認識が不必要に継続されることが抑制される。
S44では、制御部30は、報知部24に、S30の文字データ認識が途中で停止されたことを示す警告音を報知部24に出力させて、図3の処理を終了する。これにより、情報読取端末10のユーザは、文字データ認識が停止されたことを認識することができる。なお、変形例では、制御部30は、文字データ認識が途中で停止されたことを示すメッセージを表示部14に表示させてもよい。
(本実施例の効果)
情報読取端末10は、指示マーカM1によって、文字データ認識の対象となる文字を指し示す。このため、ユーザは、指示マーカM1を文字に合わせるため、情報読取端末10の姿勢を調整する。姿勢が調整されている間、情報読取端末10の姿勢は揺れやすい。姿勢が調整されている間においてカメラ16によって撮像された画像データは、ユーザの意図が反映されていないとことが推測される。本実施例の情報読取端末10は、ユーザがトリガボタンB1を押下げたタイミングから、加速度センサ22の出力値の変化が閾値Thよりも小さくなるタイミング(S20でYES)までの間にメモリ34に記憶される複数個の画像データを削除する(S18)。加速度センサ22の出力値の変化が閾値Thよりも小さくなる前にメモリ34に記憶された複数個の画像データに対する文字データ認識が実行されない。カメラ16が連続的に画像データを出力する構成において、ユーザが意図した文字とは異なる文字を認識することを抑制することができる。
(対応関係)
情報読取端末10が「文字認識装置」の一例である。トリガボタンB1を押下げることが、「第1の指示」の一例である。加速度センサ22、表示部14が、それぞれ、「計測部」「出力部」の一例である。ユーザがトリガボタンB1を押下げるタイミング、加速度センサ22の出力値の変化が閾値Thよりも小さくなるタイミングが、それぞれ、「第1のタイミング」、「第2のタイミング」の一例である。指示マーカM1、指示マーカM2が、それぞれ、「第1の態様」、「第2の態様」の一例である。
S18が、「削除部」によって実行される処理の一例である。S30が、「文字認識実行部」によって実行される処理の一例である。S36が、「出力制御部」によって実行される処理の一例である。S42、S44が、それぞれ、「文字認識停止部」、「停止報知部」によって実行される処理の一例である。
(第2実施例)
(画像認識処理;図4)
図4を参照して、第2実施例の情報読取端末10の制御部30が実行する画像認識処理を説明する。第2実施例の情報読取端末10は、第1実施例の情報読取端末10と同様の構成を有する。第2実施例の情報読取端末10の制御部30は、トリガボタンB1が押下げられている間、カメラ16が動作を継続し、連続して画像データをメモリ34に出力する。カメラ16は、図4の処理が終了するまで、連続して画像データをメモリ34に出力する。
S102では、制御部30は、指示マーカM1を照射部20に照射させることに代えて、カメラ16が撮像した画像を表示部14に表示させる。S110~S120では、制御部30は、図3のS10~S20と同様の処理を実行する。
加速度センサ22の出力値の変化が閾値Thよりも小さい場合(S120でNO)、S122において、制御部30は、文字枠F1を表示部14に表示させる。文字枠F1は、読み取り対象の文字を囲む矩形形状を有する。即ち、文字枠F1は、読取り対象の文字を強調する強調線である。制御部30は、情報読取端末10の姿勢の揺れが静止した場合に、文字枠F1を表示部14に表示させる。これにより、ユーザは、文字枠F1を見て、情報読取端末10の姿勢の揺れが静止したことを認識するとともに、読み取り対象の文字が確定したことを知ることができる。なお、変形例では、文字枠F1は、円形、楕円形等の他の形状であってもよい。
S200では、制御部30は、ユーザがトリガボタンB1の押下げを停止することを監視する。制御部30は、ユーザがトリガボタンB1の押下げを継続する場合(S200でNO)、S110に戻る。制御部30は、ユーザがトリガボタンB1の押下げを停止する場合(S200でYES)、S210に進む。本実施例の情報読取端末10では、制御部30は、ユーザがトリガボタンB1の押下げを停止する場合に、S210以降の処理に進み、文字データ認識を実行する。これにより、本実施例の情報読取端末10は、ユーザがトリガボタンB1の押下げを停止に応じることなく文字データ認識を実行する比較例よりも、ユーザの意図を文字データ認識の対象に反映させることができる。また、本実施例では、ユーザは、トリガボタンB1の押し下げを停止する際、トリガボタンB1から指を離せばよい。このため、例えば、トリガボタンB1を2回押し下げる比較例と比べて、ユーザの動作を簡潔にすることができる。さらに、本実施例の情報読取端末10では、トリガボタンB1を2回押し下げる比較例と比べてトリガボタンB1を操作する回数が少ないので、情報読取端末10の姿勢が揺れることを抑制することができる。なお、変形例では、上記の比較例が採用されてもよい。
S210では、制御部30は、メモリ34に記憶されている複数個の画像データの中から最新の画像データを取得する。S210で取得する画像データは、S110で取得される画像データよりも後に撮像された画像データである。
S220では、制御部30は、S110で取得した画像データ(以下では、第1の画像データと記載する)と、S210で取得した画像データ(以下では、第2の画像データと記載する)と、が互いに類似するか否かを判断する。例えば、制御部30は、第1の画像データに対応する画像が、第2の画像データに対応する画像と所定の割合を超えて一致する場合(S220でYES)、双方の画像データが互いに類似すると判断し、S222に進む。制御部30は、第1の画像データに対応する画像が、第2の画像データに対応する画像と所定の割合を超えて一致しない場合(S220でNO)、双方の画像データが互いに類似しないと判断し、S224に進む。
S222では、制御部30は、第1の画像データに対する文字データ認識を実行する。
S224では、制御部30は、第2の画像データに対して、S112と同様の処理を実行する。制御部30は、第2の画像データに対応する画像に文字を表す画像が含まれると判断する場合(S224でYES)、S226に進む。S226では、制御部30は、第2の画像データに対する文字データ認識を実行する。制御部30は、第2の画像データに対応する画像に文字を表す画像が含まれないと判断する場合(S224でNO)、S118に進む。
本実施例の情報読取端末10では、S220で第1の画像データと第2の画像データとを比較し、双方の画像データが互いに類似する場合(S220でYES)、第1の画像データに対する文字データ認識を実行する(S222)。第1の画像データは、S112において、対応する画像に文字を表す画像が含まれるのか否かを既に判断済みである。このため、双方の画像データが互いに類似する場合に、第1の画像データに対して迅速に文字データ認識を実行することができる。一方で、双方の画像データが互いに類似しない場合(S220でNO)、ユーザは、第1の画像データではなく、第2の画像データに対する文字データ認識の実行を意図していると推測される。本実施例では、双方の画像データが互いに類似しない場合に、第2の画像データに対応する画像に文字を表す画像が含まれるのか否かの判断(S224)と、当該文字を表す画像に対する文字データ認識(S226)が実行される。このため、情報読取端末10は、第1の画像データと第2の画像データとのうち、ユーザが意図する画像データに対する文字データ認識を適切に実行することができる。
S230では、制御部30は、S120と同様の処理を実行する。制御部30は、出力値の変化が閾値Thよりも小さい場合(S230でYES)に、情報読取端末10の姿勢の揺れが静止していると判断して、S234に進む。制御部30は、出力値の変化が閾値Thより大きい場合(S230でNO)、情報読取端末10の姿勢が揺れていると判断して、S118に進む。ユーザがトリガボタンB1の押下げを停止した後(S200でYES)、情報読取端末10の姿勢が揺れると、ユーザの意図に反した文字に対する文字データ認識が実行される可能性がある。本実施例では、情報読取端末10の姿勢が揺れていると判断される場合(S230でNO)に、文字データ認識の結果が出力されず、S118でメモリ内の画像が削除される。これにより、情報読取端末10は、ユーザが意図した文字とは異なる文字に対するデータが出力部に出力されることを抑制することができる。
S234では、制御部30は、図3のS34と同様の処理を実行する。S234の処理が終了すると、制御部30は、図4の処理を終了する。
(対応関係)
トリガボタンB1の押し下げを停止すること、トリガボタンB1の押し下げが停止されるタイミングが、それぞれ、「第2の指示」、「第3のタイミング」の一例である。文字枠F1が、「強調線」の一例である。S112、S224の処理が、それぞれ、「第1の認識処理」の一例である。S222、S226の処理が、それぞれ、「第2の認識処理」の一例である。S122、S220が、それぞれ、「動作実行部」、「画像比較部」によって実行される処理の一例である。
以上、本明細書で開示する技術の具体例を説明したが、これらは例示にすぎず、特許請求の範囲を限定するものではない。特許請求の範囲に記載の技術には以上に例示した具体例を様々に変形、変更したものが含まれる。例えば、以下の変形例を採用してもよい。
(変形例1)上述した実施例では、制御部30は、加速度センサ22の出力の変化と閾値Thとを比較することによって、情報読取端末10の姿勢の揺れが静止していることを判断した。本変形例では、制御部30は、画像データに対応する画像の明度の単位時間当たりの変化率と閾値とを比較して、情報読取端末10の姿勢の揺れが静止していることを判断してもよい。本変形例では、明度を計測する制御部30が、「計測部」の一例であり、画像データに対応する画像の明度が、情報読取端末10の姿勢の揺れを示す「姿勢値」の一例である。
(変形例2)第2実施例の情報読取端末10の制御部30は、S230の処理を実行しなくてもよい。
(変形例3)第1実施例の情報読取端末10の制御部30は、S12の処理を実行しなくてもよい。
(変形例4)第2実施例の情報読取端末10の制御部30は、S122において、文字枠F1を表示部14に表示させることに代えて、例えば、読み取り対象の文字が確定したことを表す音を報知部24に報知させてもよい。本変形例では、当該音を出力することが、「所定の報知動作」の一例である。さらなる変形例では、「所定の報知動作」は、情報読取端末10を振動させることであってもよいし、表示部14に光を出力することであってもよい。
(変形例5)第2実施例の情報読取端末10の制御部30は、122において、文字枠F1を表示部14に表示させることに代えて、例えば、文字認識の対象となる文字の下方に位置する直線を表示部14に表示させてもよい。本変形例では、当該直線が、「強調線」の一例である。さらなる変形例では、「強調線」は、文字認識の対象となる文字の上方に位置する直線であってもよいし、文字認識の対象となる文字を円形で囲う曲線であってもよい。
(変形例6)第2実施例の情報読取端末10の制御部30は、S102において、指示マーカM1を照射部20に照射させるとともに、カメラ16の画像を表示部14に表示させてもよい。その場合、S122において、制御部30は、指示マーカをM1からM2に変更するとともに、文字枠F1を表示部14に表示させてもよい。
(変形例7)第1実施例の情報読取端末10の制御部30は、S22において、指示マーカの表示態様をM1からM2に変更しなくてもよい。本変形例では、「第2の態様」を省略可能である。
(変形例8)第1実施例の情報読取端末10の制御部30は、S40~S44の処理を実行しなくてもよい。一般的に言うと、「文字認識停止部」と「停止報知部」とは、省略可能である。
本明細書または図面に説明した技術要素は、単独であるいは各種の組合せによって技術的有用性を発揮するものであり、出願時請求項記載の組合せに限定されるものではない。また、本明細書または図面に例示した技術は複数目的を同時に達成するものであり、そのうちの一つの目的を達成すること自体で技術的有用性を持つものである。
10 :情報読取端末
12 :操作部
14 :表示部
16 :カメラ
18 :通信インターフェース
20 :照射部
22 :加速度センサ
24 :報知部
30 :制御部
32 :CPU
34 :メモリ
36 :プログラム
60 :筐体
100 :荷物
B1 :トリガボタン
F1 :文字枠
L1 :ラベル
M1、M2 :指示マーカ
S1 :文字列
Th :閾値

Claims (11)

  1. 文字認識装置であって、
    操作部と、
    前記操作部がユーザから所定の第1の指示を受け付けることに応じて、動作を開始するカメラと、
    前記カメラの動作中に前記カメラから連続して出力される画像データを記憶するメモリと、
    前記文字認識装置の姿勢の揺れを示す姿勢値を計測する計測部と、
    出力部と、
    前記操作部が前記ユーザから前記第1の指示を受け付けた第1のタイミングから前記姿勢値が前記姿勢の揺れが静止したことを示す第2のタイミングまでの間に前記メモリに記憶された、複数個の前記画像データを削除する削除部と、
    前記第2のタイミング後に前記メモリに記憶された少なくとも1個の前記画像データに対する文字認識を実行する文字認識実行部と、
    前記文字認識の結果を示すデータを前記出力部に出力させる出力制御部と、
    を備える、文字認識装置。
  2. 前記操作部は、前記第1の指示の後に所定の第2の指示を受け付け、
    前記文字認識実行部は、前記操作部が前記第2の指示を受け付けた後に前記メモリに記憶された前記少なくとも1個の画像データに対する前記文字認識を実行する、請求項1に記載の文字認識装置。
  3. 前記出力制御部は、
    前記第2の指示の後、前記姿勢値が前記姿勢の揺れが静止したことを示す場合に、前記データを前記出力部に出力させ、
    前記姿勢値が前記姿勢の揺れが静止したことを示さない場合に、前記データを前記出力部に出力させない、
    請求項2に記載の文字認識装置。
  4. 前記文字認識装置は、さらに、前記第2のタイミングから前記操作部が前記第2の指示を受け付けた第3のタイミングまでの間に前記メモリに記憶された第1の画像データと、前記第3のタイミング後に前記メモリに記憶された第2の画像データと、を比較する画像比較部を備え、
    前記文字認識実行部は、
    前記第1の画像データと前記第2の画像データとが類似する場合に、前記第1の画像データ及び前記第2の画像データのうちの少なくとも一方に対する前記文字認識を実行し、
    前記第1の画像データと前記第2の画像データとが類似しない場合に、前記第2の画像データに対する前記文字認識を実行する、
    請求項2に記載の文字認識装置。
  5. 前記文字認識は、
    画像データから文字画像データを抽出する第1の認識処理と、
    抽出済みの前記文字画像データに含まれる文字を文字データとして認識する第2の認識処理と、を含み、
    前記文字認識装置は、さらに、前記第2のタイミングから前記操作部が前記第2の指示を受け付けた第3のタイミングまでの間に前記メモリに記憶された第1の画像データと、前記第3のタイミング後に前記メモリに記憶された第2の画像データと、を比較する画像比較部を備え、
    前記文字認識実行部は、
    前記第2のタイミングから前記第3のタイミングの間において、前記第1の画像データに対する前記第1の認識処理を実行し、
    前記第1の画像データと前記第2の画像データとが類似する場合に、前記第1の認識処理によって前記第1の画像データから抽出された前記文字画像データに対して前記第2の認識処理を実行し、
    前記第1の画像データと前記第2の画像データとが類似しない場合に、前記第2の画像データに対して前記第1の認識処理及び前記第2の認識処理の双方を実行する、
    請求項2に記載の文字認識装置。
  6. 前記第1の指示は、前記操作部に含まれる所定のボタンを押し下げる動作であり、
    前記第2の指示は、前記第1の指示によって押し下げられた前記ボタンから指を離す動作である、
    請求項2に記載の文字認識装置。
  7. 前記文字認識装置は、さらに、前記姿勢値が前記姿勢の揺れが静止したことを示す場合に、所定の報知動作を実行する動作実行部を備える、請求項1から6のいずれか一項に記載の文字認識装置。
  8. 前記文字認識装置は、さらに、前記少なくとも1個の画像データを表示する表示部を備え、
    前記報知動作は、前記第2のタイミングの後に、前記少なくとも1個の画像データ内に含まれる文字を強調する強調線を前記表示部に表示する動作を含む、
    請求項7に記載の文字認識装置。
  9. 前記文字認識装置は、さらに、
    前記文字認識の対象の文字を指し示すための指示マーカを照射する照射部と、
    前記操作部が前記第1の指示を受け付けることをトリガとして、前記指示マーカの照射を前記照射部に実行させる照射制御部と、
    を備える、
    請求項1から6のいずれか一項に記載の文字認識装置。
  10. 前記照射制御部は、前記姿勢値が前記姿勢の揺れが静止したことを示す場合に、前記指示マーカの表示態様を、第1の態様から前記第1の態様とは異なる第2の態様に変更する、請求項9に記載の文字認識装置。
  11. 前記文字認識装置は、さらに、
    前記文字認識が所定時間を超えて完了しない場合に、前記文字認識を停止する文字認識停止部と、
    前記文字認識が停止されたことを前記ユーザに報知する停止報知部と、
    を備える、
    請求項1から6のいずれか一項に記載の文字認識装置。
JP2022141408A 2022-09-06 2022-09-06 文字認識装置 Active JP7780090B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022141408A JP7780090B2 (ja) 2022-09-06 2022-09-06 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022141408A JP7780090B2 (ja) 2022-09-06 2022-09-06 文字認識装置

Publications (2)

Publication Number Publication Date
JP2024036873A JP2024036873A (ja) 2024-03-18
JP7780090B2 true JP7780090B2 (ja) 2025-12-04

Family

ID=90273056

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022141408A Active JP7780090B2 (ja) 2022-09-06 2022-09-06 文字認識装置

Country Status (1)

Country Link
JP (1) JP7780090B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003134389A (ja) 2001-10-29 2003-05-09 Fuji Photo Film Co Ltd デジタルスチルカメラ
JP2004215067A (ja) 2003-01-07 2004-07-29 Canon Inc デジタル機器
JP2005260663A (ja) 2004-03-12 2005-09-22 Casio Comput Co Ltd デジタルカメラ、および、プログラム
JP2013008389A (ja) 2012-09-12 2013-01-10 Omron Corp 携帯端末装置用のプログラムおよび携帯端末装置
JP2021121129A (ja) 2020-07-31 2021-08-19 キヤノン株式会社 画像処理装置及びその制御方法、プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63305484A (ja) * 1987-06-05 1988-12-13 Sumitomo Electric Ind Ltd 光学文字読取装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003134389A (ja) 2001-10-29 2003-05-09 Fuji Photo Film Co Ltd デジタルスチルカメラ
JP2004215067A (ja) 2003-01-07 2004-07-29 Canon Inc デジタル機器
JP2005260663A (ja) 2004-03-12 2005-09-22 Casio Comput Co Ltd デジタルカメラ、および、プログラム
JP2013008389A (ja) 2012-09-12 2013-01-10 Omron Corp 携帯端末装置用のプログラムおよび携帯端末装置
JP2021121129A (ja) 2020-07-31 2021-08-19 キヤノン株式会社 画像処理装置及びその制御方法、プログラム

Also Published As

Publication number Publication date
JP2024036873A (ja) 2024-03-18

Similar Documents

Publication Publication Date Title
CN103916592B (zh) 用于在具有照相机的便携式终端中拍摄肖像的设备和方法
JP5304848B2 (ja) プロジェクタ
US8497840B2 (en) Computer peripheral for scanning
US9183689B2 (en) Compact assistive reading device
US10810412B2 (en) Method, system and apparatus for gesture-based configuration of paired scanner
US10372954B2 (en) Method for reading indicia off a display of a mobile device
CN105455389A (zh) 美甲设计显示控制装置、美甲打印装置及美甲设计显示控制方法
CN107992223A (zh) 触摸面板装置以及触摸面板控制程序
JP5966936B2 (ja) 手書き入力装置及び制御プログラム
JP7780090B2 (ja) 文字認識装置
JP5773003B2 (ja) 表示制御装置、表示制御方法及びプログラム
JP4589619B2 (ja) 紙文書情報操作システムおよび情報操作方法
US7397465B2 (en) Coordinate input control method
WO2021176771A1 (ja) 撮像方法、撮像装置、撮像対象の判別方法及びプログラム
JP5691736B2 (ja) 読取装置
JP6873672B2 (ja) 電子機器および電子機器の制御方法
JP2019017991A (ja) 描画装置、描画方法及びプログラムを記録した記録媒体
CN111316320B (zh) 用于快速确定对象尺寸的方法和装置
JP2019008728A (ja) 文書管理システムおよび文書管理装置
JP7495621B2 (ja) 情報読取装置
CN110968205A (zh) 屏幕点亮方法、移动终端及存储介质
JP6065711B2 (ja) 関連付けシステム及びプログラム
US10747975B2 (en) Methods for changing a configuration of a device for reading machine-readable code
JP2010097316A (ja) 光学的情報読取装置
US9928612B2 (en) Information processing apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20250116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20251021

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20251103

R150 Certificate of patent or registration of utility model

Ref document number: 7780090

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150