JP4594765B2 - 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体 - Google Patents
文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体 Download PDFInfo
- Publication number
- JP4594765B2 JP4594765B2 JP2005064386A JP2005064386A JP4594765B2 JP 4594765 B2 JP4594765 B2 JP 4594765B2 JP 2005064386 A JP2005064386 A JP 2005064386A JP 2005064386 A JP2005064386 A JP 2005064386A JP 4594765 B2 JP4594765 B2 JP 4594765B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- character recognition
- character
- line width
- coincidence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
草地良規、伊藤直己、鈴木章、荒川賢一、「画像インデクシングを目的としたテキスト領域不要の景観中文字認識」、電子情報通信学会 信学技報 PRMU2004−89、(2004−10)、p.37−42
まず図1を用いて、文字認識装置を文字列翻訳システムに適用した例を説明する。文字列翻訳システムは、カメラ付きPDAなどの携帯端末11、文字認識装置12、文字列推定装置13、及び翻訳装置14から構成される。
ここで図2を用いて、文字認識装置12の構成を説明する。図2に示すように文字認識装置12は、第一段文字認識手段21、及びN個の異特徴文字認識手段22−1〜22−Nから構成される。
第一段文字認識手段21は、画像から文字候補を抽出する手段であり、例えば、「画像インデクシングを目的としたテキスト領域不要の景観中文字認識」、電子情報通信学会 信学技報 PRMU2004−89(2004−10)、p.37−42、に記載の方法により実現できる。
1:原パターンから、ソーベルオペレータを用いて微分の値及び方向を求める。
2:微分の方向をM方向に量子化する。
3:原パターンをN×Nのグリッドに分割する。
4:各グリッドの各M方向で、微分値の大きさを加算する。
5:N×N×Mの特徴ベクトルと考え、ノルムを正規化する。
1.特徴抽出:各解像度画像全面に対し位置を変化させつつ、領域を切り出して特徴を抽出する。すべての切り出し領域の特徴をあらかじめ算出しておく。
2.初期化:木構造のルートノードを出発点とする。
3.候補ノードの設定:すべての切り出し領域に、候補ノードとして第一階層のノードをセットする。各切り出し領域に対して、4〜6を繰り返す。
4.圧縮:下層の圧縮率を用いて切り出し領域の特徴を圧縮する。これをI’(r)と表す。
5.投影距離計算:以下の式に従い、候補ノードCの部分空間を用いて投影距離L(C)を求める。
6.スクリーニング:上記の距離値から、各候補ノードの順位を計算する。この距離及び順位の閾値から、候補ノードを更新する。
7.ピーク検出:すべての切り出し領域の各候補ノードについて、3次元(縦、横、解像度)の空間的な連結性を算出し、セグメントを求める。各セグメント内の距離値の最小ピークを有する候補ノードのみを残す。その他の候補ノードは削除する。
8.局所領域でのスクリーニング:同一解像度のピークの集合各々に対して以下の処理を行う。まず空間をブロック分割し、各ブロック内に含まれるピークを距離値によってソートして、上位から一定個数以内だけ採用する。その後、ブロック分割の位置を水平/垂直に半ブロックずらして同じ処理を行う。
9.同一候補文字のピーク統合:同一候補文字を持つ2つのピークを取り出して中心座標と解像度が互いに近ければ距離値の小さい方に統合する処理を、統合するピークの対が存在しなくなるまで繰り返す。
10.候補ノードの更新:候補ノードの下層に接続されたノードを新しい候補ノードとして登録する。
11.終了判定:最下層に辿り着いていれば残った候補ノードをインデクスとして出力して終了、その他であれば上記4に戻る。インデクスのフォーマットは(カテゴリ名、位置、大きさ、類似度)である。
(1)パターンの大きさがほぼそろっていること
(2)ピッチがほぼ一定であること
(3)ピッチの大きさが個別のパターンの大きさに対して相対的に一定の範囲内に収まっていること
(4)パターンの並ぶ順序が入力された文字列の順序と一致し、かつパターンの並ぶ方向と水平方向又は垂直方向との角度の差が一定の範囲内であることを用いる。
異特徴文字認識手段22−1〜22−Nは、文字候補(候補カテゴリ、位置、大きさ、類似度)から文字を認識する手段であり、画像から特徴を抽出した後、部分空間法等により文字識別を行う。なお、部分空間法は、以下の文献に詳細が記載されている。“E.Oja.Subspace Methods of Pattern Recognitions.Research Studies Press,1983.”。
ここで図6を用いて、第一段文字認識手段21と異特徴文字認識手段22とが特徴抽出手段61を共有する場合について説明する。図6に示すように、第一段文字認識手段21と異特徴文字認識手段22とが特徴抽出手段61をシュアしており、そのパラメータのみが異なるものとする。
エッジの方向/大きさを求める(S71)。
ここで、図10を用いて、第一段文字認識手段21が加重方向指数ヒストグラム特徴抽出手段101を有し、異特徴文字認識手段22が線幅特徴抽出手段102を有する場合について説明する。なお、第一段文字認識手段21が線幅特徴抽出手段102を有し、異特徴文字認識手段22が加重方向指数ヒストグラム特徴抽出手段101を有してもよい。
図11を用いて線幅特徴抽出手段102について説明する。図11は、線幅特徴抽出手段102の構成図である。図11に示すように線幅特徴抽出手段102は、文字パターン群又は画像(画像パターンと呼ぶ)を入力する画像入力手段111、任意の画素において複数の方向の線幅を検出する線幅検出手段112、及び各画素の各方向の線幅を特徴値とした特徴ベクトルとして出力する出力手段113から構成される。
ここで図15を用いて線幅検出手段112、132について説明する。図15に示すように、線幅検出手段112、132は、任意の方向および線幅に応じた複数のフィルタを算出するフィルタ生成手段151、着目画素を中心とした領域と複数のフィルタとの一致度を算出する一致度算出手段152、及び最大の一致度を示すフィルタの線幅の大きさと一致度とを乗算して線幅とする線幅計算手段153から構成される。
一致度計算手段152では、生成した各フィルタと着目画素を中心とした領域との一致度を計算する。ここで、図17に一致度計算手段152の構成について説明する。図17に示すように、一致度計算手段152は正規化相関手段171を有している。この正規化相関手段171は、フィルタ生成手段151が生成したフィルタ並びに文字パターン群若しくは画像を入力して、フィルタと文字パターン群又は画像との正規化相関値を算出し、この正規化相関値を一致度として出力する。この正規化相関値の算出においては、例えば、内積値や距離などを用いることができる。
なお、上記実施形態において、文字認識装置は、例えば、文字認識装置を構成するコンピュータ装置が有するCPUによって実現され、必要とする第一段文字認識処理、異特徴文字認識処理、特徴抽出処理、拡張加重方向指数ヒストグラム特徴抽出処理、線幅特徴抽出処理、正規化相関計算処理などをアプリケーションプログラムとして搭載することができる。
12…文字認識装置
13…文字列推定装置
14…翻訳装置
21…第一段文字認識手段
22…異特徴文字認識手段
61…特徴抽出手段
101…拡張加重方向指数ヒストグラム特徴抽出手段
102…線幅特徴抽出手段
111…画像入力手段
112…線幅検出手段
113…出力手段
131…画像入力手段
132…線幅検出手段
133…線幅ヒストグラム計算手段
134…出力手段
151…フィルタ生成手段
152…一致度計算手段
153…線幅計算手段
171…正規化相関手段
Claims (3)
- 画像中の文字を認識する文字認識装置であって、
入力した画像を走査しながら局所画像を切り出して特徴を抽出し、当該特徴と辞書に登録された文字の特徴との類似度に基づいて文字候補を決定する第一段文字認識手段と、
前記決定した文字候補について、既に特徴抽出に用いられた特徴とは異なる特徴を抽出し、当該特徴と辞書に登録された文字の特徴との類似度から前記文字候補の絞込みを行う一以上の異特徴文字認識手段と、を有し、
前記第一段文字認識手段と前記一以上の異特徴文字認識手段のうちのいずれか1つの手段が、
入力された画像について、複数の方向に線の線幅を検出する線幅検出手段と、
前記各方向の線の線幅を特徴値とした特徴ベクトルを出力する出力手段と、を有し、
前記線幅検出手段は、
線幅を検出する方向および線の線幅に応じた複数のフィルタを生成するフィルタ生成手段と、
前記画像と前記複数のフィルタとの一致度を算出する一致度算出手段と、
前記算出した一致度において最大の一致度を示すフィルタの線の線幅の値と前記一致度とを乗算して得た値を線の線幅とする線幅計算手段と、
を有することを特徴とする文字認識装置。 - 画像中の文字を認識する文字認識装置における文字認識方法であって、
第一段文字認識手段が、入力した画像を走査しながら局所画像を切り出して特徴を抽出し、当該特徴と辞書に登録された文字の特徴との類似度に基づいて文字候補を決定する第一段文字認識ステップと、
一以上の異特徴文字認識手段が、前記決定した文字候補について、既に特徴抽出に用いられた特徴とは異なる特徴を抽出し、当該特徴と辞書に登録された文字の特徴との類似度から前記文字候補の絞込みを行う異特徴文字認識ステップと、を有し、
前記第一段文字認識ステップと前記異特徴文字認識ステップのいずれかのステップにおいて、
線幅検出手段が、入力された画像について、複数の方向に線の幅を検出する線幅検出ステップと、
出力手段が、前記各方向の線の線幅を特徴値とした特徴ベクトルを出力する出力ステップと、を有し、
前記線幅検出ステップにおいて、
フィルタ生成手段が、線幅を検出する方向および線の線幅に応じた複数のフィルタを生成するフィルタ生成ステップと、
一致度算出手段が、前記画像と前記複数のフィルタとの一致度を算出する一致度算出ステップと、
線幅計算手段が、前記算出した一致度において最大の一致度を示すフィルタの線の線幅の値と前記一致度とを乗算して得た値を線の線幅とする線幅計算ステップと、
を有することを特徴とする文字認識方法。 - 上記請求項1または2いずれかに記載の文字認識装置又は文字認識方法を、コンピュータで実行可能に記載したプログラムを記録したことを特徴とする記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005064386A JP4594765B2 (ja) | 2005-03-08 | 2005-03-08 | 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005064386A JP4594765B2 (ja) | 2005-03-08 | 2005-03-08 | 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006251920A JP2006251920A (ja) | 2006-09-21 |
| JP4594765B2 true JP4594765B2 (ja) | 2010-12-08 |
Family
ID=37092383
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005064386A Expired - Fee Related JP4594765B2 (ja) | 2005-03-08 | 2005-03-08 | 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4594765B2 (ja) |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0664629B2 (ja) * | 1985-11-26 | 1994-08-22 | 沖電気工業株式会社 | 文字認識方式 |
| JP3161107B2 (ja) * | 1992-11-20 | 2001-04-25 | 富士ゼロックス株式会社 | 文字認識装置 |
| JP2766205B2 (ja) * | 1994-12-27 | 1998-06-18 | 長野日本電気ソフトウェア株式会社 | 文字認識装置 |
| JP2000155803A (ja) * | 1998-11-20 | 2000-06-06 | Nec Corp | 文字読取方法および光学式文字読取装置 |
-
2005
- 2005-03-08 JP JP2005064386A patent/JP4594765B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2006251920A (ja) | 2006-09-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8594431B2 (en) | Adaptive partial character recognition | |
| US9767604B2 (en) | Image analysis method by analyzing point cloud using hierarchical search tree | |
| JP5202148B2 (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
| CN105095905B (zh) | 目标识别方法和目标识别装置 | |
| KR101617681B1 (ko) | 히스토그램들을 갖는 다중 층 연결 요소들을 사용하는 텍스트 검출 | |
| US20070058856A1 (en) | Character recoginition in video data | |
| JP4300098B2 (ja) | オブジェクト識別方法とその装置、プログラム及び記録媒体 | |
| CN111626303B (zh) | 性别和年龄的识别方法、装置、存储介质及服务器 | |
| JP2006252162A (ja) | パターン認識装置及びその方法 | |
| JP6278108B2 (ja) | 画像処理装置、画像センサ、画像処理方法 | |
| JP6754120B2 (ja) | プログラム、情報記憶媒体及び文字分割装置 | |
| WO2015146113A1 (ja) | 識別辞書学習システム、識別辞書学習方法および記録媒体 | |
| JP2017084006A (ja) | 画像処理装置およびその方法 | |
| JP2019021100A (ja) | 画像探索装置、商品認識装置および画像探索プログラム | |
| KR101521136B1 (ko) | 얼굴 인식 방법 및 얼굴 인식 장치 | |
| KR20240043468A (ko) | 한국어 가상이미지 생성기술을 이용한 대용량 문서 데이터 구축 시스템 및 방법 | |
| JP4721829B2 (ja) | 画像検索方法及び装置 | |
| JP6393495B2 (ja) | 画像処理装置および物体認識方法 | |
| CN112818983A (zh) | 一种利用图片相识度判断字符倒置的方法 | |
| JP4594765B2 (ja) | 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体 | |
| JP6778625B2 (ja) | 画像検索システム、画像検索方法及び画像検索プログラム | |
| JPWO2013154062A1 (ja) | 画像識別システム、画像識別方法、およびプログラム | |
| JP2003123023A (ja) | 文字認識方法及び文字認識装置、文字認識プログラム並びにそのプログラムを記録した記録媒体 | |
| JP2006235817A (ja) | 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体 | |
| JP7782225B2 (ja) | 機械学習モデルを用いてクラス分類処理を実行するクラス分類装置、方法、及び、コンピュータープログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070221 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090528 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100226 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100323 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100520 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100521 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100914 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100917 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130924 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |