JP5495657B2 - 文字認識装置、文字認識プログラム - Google Patents
文字認識装置、文字認識プログラム Download PDFInfo
- Publication number
- JP5495657B2 JP5495657B2 JP2009181632A JP2009181632A JP5495657B2 JP 5495657 B2 JP5495657 B2 JP 5495657B2 JP 2009181632 A JP2009181632 A JP 2009181632A JP 2009181632 A JP2009181632 A JP 2009181632A JP 5495657 B2 JP5495657 B2 JP 5495657B2
- Authority
- JP
- Japan
- Prior art keywords
- code data
- character
- movement
- writing
- movement vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
<構成>
図1は、本実施の形態の入力システム10の構成図である。図1を参照して、入力システム10は文字入力装置12を含み、文字入力装置12は文字認識プログラムを記憶し、文字認識装置としても機能する。この文字入力装置12は、ペン型の筐体(ケース)14を備えるとともに、このケース14の一部から操作部が露出するように配置されたスイッチ16を備える。又、入力システム10はコンピュータ20を備え、文字入力装置12とコンピュータ20とがケーブル(USBケーブルやIEEE1394ケーブルなど)18を用いて接続される。
例えば、使用者がペンを持つように文字入力装置12を手指で把持し、文字(本実施の形態では、ひらがな)を書く。すると、文字入力装置12は使用者が書いた文字を認識し、認識した文字をコンピュータ20に入力する。以下、文字入力装置12における文字の認識方法について詳細に説明する。
文字入力装置12では、カメラ40からの画像データがインターフェイス38およびバス32を介してCPU30に与えられる。本実施の形態では、CPU30は、カメラ40からの画像データを所定時間(1フレーム:1/30秒)毎に検出し、フレーム間(1つ手前のフレームと現フレームとの間)の動きベクトルを計算する。動きベクトルを計算する方法は既に周知であるため、ここでは詳細な説明は省略する。
次に、本実施の形態における、筆記コードデータ524と辞書コードデータ520a,520b,520c,…との類似度の評価方法について図5を用いて説明する。類似度の評価には、時系列データに対して時間伸縮を含めたマッチングに適した方法として、例えばDPマッチングを利用することができる。
図6は、図1に示したRAM36のメモリマップを示す図解図である。ただし、RAM36に記憶されるプログラムや一部のデータはROM34からロードされる。図6に示すように、RAM36はプログラム記憶領域50とデータ記憶領域52を含む。プログラム記憶領域50は、文字認識プログラムと文字入力プログラム508を記憶する。文字認識プログラムは、メイン処理プログラム500、手指の動き検出プログラム502、コード化プログラム504および文字特定プログラム506によって構成される。
次に、筆記コードデータ524の検出精度の向上について説明する。動きベクトルの移動量(スカラ)が所定値未満であるときにコード「S」と符号化し、静止状態(動き量が少ない)と判定するが、この所定値(閾値)を適切に制御することが、検出精度を向上させるための第一の方法である。空中に文字を書く場合、状況や人によって文字の大きさや速度は大きく変動すると考えられる。大きな文字を書く場合や早く書く場合には、一旦筆を静止させたつもりでも動いていると判定する一方、小さい文字を書く場合やゆっくりと書いた場合には、筆を動かしているつもりでも静止状態であると誤検出することがある。そこで、大きな状況変化がない場合に使用者が書く速度や文字の大きさは、一般的に直前に書いた速度や文字の大きさや速度に近いと考える。そこで、直前の数文字分の文字を書く速度(フレーム間の移動量)の最大値と最小値および平均値を算出し、その値に基づいて静止状態であるか否かの閾値を変更することにより、上述の誤検出が削減できる。具体的には文字を書く速度が高い時には閾値を大きく、文字を書く速度が低い時には閾値を小さくするように適応的に制御を行う。
実施の形態1の文字認識装置12によれば、既に述べた通り以下の効果を奏する。すなわち、文字認識装置は、使用者の所定動作に応じ、文字を筆記する入力期間と次文字に移る移行期間とを検出する入力期間検出手段と、手指の移動を移動ベクトルとして検出する移動検出手段と、入力期間中、移動検出手段で検出した移動ベクトルを次画への移行部分を含めてコード化し、時系列にしたがって圧縮した筆記コードデータ524を取得する移動情報取得手段と、各文字を正しい書き順および筆運びで筆記した場合に発生する移動ベクトルを次画への移行部分を含めてコード化し、時系列にしたがって圧縮した辞書コードデータを記憶する辞書コードデータ記憶手段と、移動情報取得手段が取得した筆記コードデータと辞書コードデータとを比較して使用者が筆記した文字を特定する特定手段と、を備える。移動ベクトルをコード化することにより、演算量と処理時間を低減することが出来る。又、次画への移行部分を含めてコード化することによって、連続的に複数の画数からなる文字を筆記することができ、筆記する場所や大きさや速度の制限が無い文字認識装置となる。
<構成>
実施の形態1では、使用者が文字入力装置12のペン型の筐体14を手に持って空中に文字を書き、文字入力装置12がこれを認識したが、実施の形態2では、使用者はハンドフリーにて空中に文字を書き、文字入力装置がその文字を認識する。
たとえば、使用者が文字入力装置92の前に手を出し、手を握ることで文字入力を開始し、手を握ったまま空中に一筆書きで文字を書いて、一文字が書き終われば手を開く動作を行う。すると文字入力装置92は、カメラ40で撮像した使用者の手の形から一文字を書く入力期間の開始と終了のタイミングを検出し、さらに筆記中の使用者の手の位置から筆跡を検出する。即ち、実施の形態1では、文字単位の入力期間の開始と終了の検出をスイッチ16のON/OFFによって検出していたが、実施の形態2では、カメラ40で撮像した手指の形からこれを検出する。又、実施の形態1では、カメラ40で撮像した画像全体の動きベクトルから筆記の方向を検出していたが、実施の形態2では、カメラで撮影した画像から手の位置を検出し、この手の動きから筆記の方向を検出する。その他の処理については、実施の形態1と同様の処理によって文字が認識できるので、カメラ40の撮像画像から手の形と動きを検出する方法について次に説明する。
まず、前に出した手を検出する方法として、肌色情報を利用する手法がある。これは、一般的に手は肌色であるという前提に基づいて撮像画像から肌色に近い領域を抜き出し2値化するものである。原理上、使用者が手袋をしており手の色が肌色でない場合や、後ろに人の顔など肌色に近いものが存在する場合に誤検出してしまうという問題があるが、手が速く動く場合でも検出することが出来る。
実施の形態2の文字認識装置によれば、既に述べたとおり以下の効果を奏する。すなわち、文字認識装置は、使用者の手指を撮像する撮像手段(カメラ40)をさらに備え、入力期間検出手段は、撮像手段によって撮像した手指の形状を検出する形状検出手段を備え、形状検出手段の検出結果に基づいて入力期間と前記移行期間とを検出し、移動検出手段は、前記撮像手段によって撮像した手指の位置を検出する位置検出手段を備え、位置検出手段が検出する手指の位置変化から移動ベクトルを検出する。使用者は手にデバイスを持たずに空中に文字を筆記し、環境側に設置したカメラを利用して文字を認識するため、デバイスを持つ場合に比べてさらに自由度が高く便利な空中手書き入力が実現できる。
Claims (7)
- 使用者の手指を撮像する撮像手段と、
使用者の所定動作に応じ、文字を筆記する入力期間と次文字に移る移行期間とを検出する入力期間検出手段と、
手指の移動を移動ベクトルとして検出する移動検出手段と、
前記入力期間中、前記移動検出手段で検出した前記移動ベクトルを次画への移行部分を含めてコード化し、時系列にしたがって圧縮した筆記コードデータを取得する筆記コードデータ取得手段と、
各文字を筆記した場合に発生する前記移動ベクトルを次画への移行部分を含めてコード化し、時系列にしたがって圧縮した辞書コードデータを記憶する辞書コードデータ記憶手段と、
前記筆記コードデータと前記辞書コードデータとを比較して使用者が筆記した文字を特定する特定手段とを備え、
前記筆記コードデータ取得手段は、前記移動ベクトルの移動量が所定の閾値以下の時に静止状態と判定し、前記所定の閾値より大きい場合に移動方向に従って移動ベクトルをコード化し、前記所定の閾値は、移動量の履歴に基づいて変更されることを特徴とする、
文字認識装置。 - 前記入力期間検出手段は、前記撮像手段によって撮像した手指の形状を検出する形状検出手段を備えたことを特徴とする、
請求項1に記載の文字認識装置。 - 前記入力期間検出手段は、前記形状検出手段の検出結果に基づいて前記入力期間と前記移行期間とを検出し、
前記移動検出手段は、前記撮像手段によって撮像した手指の位置を検出する位置検出手段を備え、前記位置検出手段が検出する手指の位置変化から前記移動ベクトルを検出することを特徴とする、請求項2に記載の文字認識装置。 - 前記辞書コードデータ記憶手段は、各文字に対応する前記辞書コードデータを複数個備え、正しい書き順および筆運びで筆記した場合に加え、正しくない書き順および筆運びで筆記した場合に対応する辞書コードデータを少なくとも1つ備えることを特徴とする、
請求項1〜3のいずれかに記載の文字認識装置。 - 前記筆記コードデータ取得手段は、前記移動ベクトルが二つの方向を繰り返す時には繰り返し部分を削除してコード化することを特徴とする、請求項1〜4のいずれかに記載の文字認識装置。
- コンピュータを、
使用者の所定動作に応じ、文字を筆記する入力期間と次文字に移る移行期間とを検出する入力期間検出手段、
手指の移動を移動ベクトルとして検出する移動検出手段、
前記入力期間中、前記移動検出手段で検出した前記移動ベクトルを次画への移行部分を含めてコード化し、時系列にしたがって圧縮した筆記コードデータを取得する筆記コードデータ取得手段、
前記筆記コードデータと予め準備された辞書コードデータとを比較して使用者が筆記した文字を特定する特定手段として機能させ、
前記筆記コードデータ取得手段は、前記移動ベクトルの移動量が所定の閾値以下の時に静止状態と判定し、前記所定の閾値より大きい場合に移動方向に従って移動ベクトルをコード化し、前記所定の閾値を移動量の履歴に基づいて変更することを特徴とする、
文字認識プログラム。 - 前記入力期間検出手段は、撮像手段によって撮像した手指の形状を検出する形状検出手段を備えたことを特徴とする、
請求項6に記載の文字認識プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009181632A JP5495657B2 (ja) | 2009-08-04 | 2009-08-04 | 文字認識装置、文字認識プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009181632A JP5495657B2 (ja) | 2009-08-04 | 2009-08-04 | 文字認識装置、文字認識プログラム |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2011034437A JP2011034437A (ja) | 2011-02-17 |
| JP2011034437A5 JP2011034437A5 (ja) | 2012-09-06 |
| JP5495657B2 true JP5495657B2 (ja) | 2014-05-21 |
Family
ID=43763431
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009181632A Expired - Fee Related JP5495657B2 (ja) | 2009-08-04 | 2009-08-04 | 文字認識装置、文字認識プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5495657B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6406279B2 (ja) * | 2016-02-22 | 2018-10-17 | マツダ株式会社 | 自動車の制動装置 |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02157986A (ja) * | 1988-12-09 | 1990-06-18 | Nec Corp | 認識文字種指定方式 |
| JPH04195670A (ja) * | 1990-11-28 | 1992-07-15 | Toshiba Corp | 手書き文字認識かな漢字変換方式 |
| US5491758A (en) * | 1993-01-27 | 1996-02-13 | International Business Machines Corporation | Automatic handwriting recognition using both static and dynamic parameters |
| JPH08211979A (ja) * | 1995-02-02 | 1996-08-20 | Canon Inc | 手振り入力装置及び方法 |
| JP3574246B2 (ja) * | 1995-11-29 | 2004-10-06 | 株式会社リコー | パターン認識装置 |
| JPH11143868A (ja) * | 1997-11-07 | 1999-05-28 | Toshiba Corp | 文字認識装置、入力制御方法及び記録媒体 |
| JP2002259046A (ja) * | 2001-02-28 | 2002-09-13 | Tomoya Sonoda | 空中で手描きした文字・記号入力システム |
| JP4244614B2 (ja) * | 2002-10-31 | 2009-03-25 | 株式会社日立製作所 | 手書き入力装置、プログラムおよび手書き入力方法システム |
| JP2008108051A (ja) * | 2006-10-25 | 2008-05-08 | Funai Electric Co Ltd | 映像記録再生装置および文字の入力システム |
-
2009
- 2009-08-04 JP JP2009181632A patent/JP5495657B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2011034437A (ja) | 2011-02-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8902198B1 (en) | Feature tracking for device input | |
| US9423877B2 (en) | Navigation approaches for multi-dimensional input | |
| US10209881B2 (en) | Extending the free fingers typing technology and introducing the finger taps language technology | |
| EP2577426B1 (en) | Information processing apparatus and method and program | |
| US8754745B2 (en) | Method and electronic apparatus for creating biological feature data | |
| CN109829368B (zh) | 手掌特征的识别方法、装置、计算机设备及存储介质 | |
| US9746929B2 (en) | Gesture recognition using gesture elements | |
| CN111414837A (zh) | 手势识别方法、装置、计算机设备及存储介质 | |
| JP2020067999A (ja) | ジェスチャー認識に基づく仮想ユーザー・インターフェース対話の方法および関係した装置 | |
| EP2626813B1 (en) | Apparatus and method for guiding handwriting input for handwriting recognition | |
| WO2015104257A1 (en) | Human-to-computer natural three-dimensional hand gesture based navigation method | |
| CN104081328B (zh) | 智能触摸屏键激活检测 | |
| US20150185850A1 (en) | Input detection | |
| US12340083B2 (en) | Key function execution method and apparatus, device, and storage medium | |
| CN104914989A (zh) | 姿势辨识装置以及姿势辨识装置的控制方法 | |
| JP5495657B2 (ja) | 文字認識装置、文字認識プログラム | |
| CN104714736A (zh) | 一种退出全屏锁定状态的控制方法及终端 | |
| CN113095171A (zh) | 书写字符识别方法及装置、电子设备、存储介质 | |
| CN118116078A (zh) | 识别挥动动作的方法及相关装置 | |
| CN119445682A (zh) | 情绪识别方法、装置、电子设备及存储介质 | |
| Asaari et al. | Real-Time Hand Tracking and Trajectory Gesture Recognition | |
| CN112596603A (zh) | 核电站控制系统的手势操控方法、装置、设备及存储介质 | |
| JP2016095795A (ja) | 認識装置、方法、及びプログラム | |
| JP2007200186A (ja) | 文字認識装置および文字認識プログラム | |
| JP7657998B1 (ja) | 電子機器、プログラム、及び制御方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120723 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120723 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130813 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131009 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131126 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140110 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140204 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140304 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5495657 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |