JPH0632088B2 - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JPH0632088B2 JPH0632088B2 JP59149563A JP14956384A JPH0632088B2 JP H0632088 B2 JPH0632088 B2 JP H0632088B2 JP 59149563 A JP59149563 A JP 59149563A JP 14956384 A JP14956384 A JP 14956384A JP H0632088 B2 JPH0632088 B2 JP H0632088B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- dictionary
- recognition
- font
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 〔発明の利用分野〕 本発明は光学文字読取装置の文字認識方法に係り、特に
多種類の字形、例えば多種類のプリンタで印字された活
字を読取るのに好適な異なる字体の文字を認識する方法
に関する。
多種類の字形、例えば多種類のプリンタで印字された活
字を読取るのに好適な異なる字体の文字を認識する方法
に関する。
異なる字体の文字を読取る方法として、例えば特公昭56
−44455号公報、特公昭59−3793号公報および特開昭58
−51390号公報に記載のように、各字体に対応した複数
の辞書を用意し、読取った文字パターンを全ての辞書を
用いて認識し、認識率の一番高い辞書による結果を読取
り出力とする方法がある。この方法は帳票のフォーマッ
トを変更せずに字形を増せる長所はあるが、字形が多く
なった場合、各辞書による認識結果の振分けに失敗した
り、読取り速度が遅くなったりする欠点がある。
−44455号公報、特公昭59−3793号公報および特開昭58
−51390号公報に記載のように、各字体に対応した複数
の辞書を用意し、読取った文字パターンを全ての辞書を
用いて認識し、認識率の一番高い辞書による結果を読取
り出力とする方法がある。この方法は帳票のフォーマッ
トを変更せずに字形を増せる長所はあるが、字形が多く
なった場合、各辞書による認識結果の振分けに失敗した
り、読取り速度が遅くなったりする欠点がある。
本発明の目的は、異なる字体の文字を高速かつ高精度に
認識する方法を提供することである。
認識する方法を提供することである。
本発明の特徴とするところは、字体毎の複数の辞書から
なる文字認識辞書を用いて異なる字体の文字を認識する
方法において、異なる字体毎にそれぞれ割り当てられた
特定の記号若しくは文字の組み合わせからなる字形識別
辞書を準備しておき、帳票の特定領域に当該帳票に使用
する字体に割り当てられた特定の記号若しくは文字を印
字若しくは印刷し、この特定領域の記号若しくは文字を
字形識別辞書を用いて認識し、その認識結果に対応する
字体の辞書を文字認識辞書から選択し、その選択した辞
書を用いて帳票の文字認識を行なうところにある。
なる文字認識辞書を用いて異なる字体の文字を認識する
方法において、異なる字体毎にそれぞれ割り当てられた
特定の記号若しくは文字の組み合わせからなる字形識別
辞書を準備しておき、帳票の特定領域に当該帳票に使用
する字体に割り当てられた特定の記号若しくは文字を印
字若しくは印刷し、この特定領域の記号若しくは文字を
字形識別辞書を用いて認識し、その認識結果に対応する
字体の辞書を文字認識辞書から選択し、その選択した辞
書を用いて帳票の文字認識を行なうところにある。
以下本発明の一実施例を第1図及至第4図を参照して詳
細に説明する。
細に説明する。
第1図は本発明が適用された光学文字読取装置の一部機
構部を含むブロック図、第2図は帳票のフォーマット例
を示す図、第3図は字形識別辞書例を示す図、第4図は
字体毎の複数の辞書からなる文字認識辞書例を示す図で
ある。
構部を含むブロック図、第2図は帳票のフォーマット例
を示す図、第3図は字形識別辞書例を示す図、第4図は
字体毎の複数の辞書からなる文字認識辞書例を示す図で
ある。
第1図を参照するに、帳票1は制御部7により紙送り制
御が行なわれる搬送路2上を搬送される。帳票1上の文
字は光源3に照射され、その反射光がCCDセンサ等か
らなる光電変換部4に入力される。光電変換部4は入力
された光信号を電気信号に変換し、2値化回路5に出力
する。2値化回路5は入力された電気信号を2値化し、
制御部7の制御を受けて2値信号をメモリ6に出力す
る。メモリ6は入力される2値信号を制御部7の制御を
受けながら順次格納していく。メモリ6には例えば帳票
1枚分の文字パターンが格納される。
御が行なわれる搬送路2上を搬送される。帳票1上の文
字は光源3に照射され、その反射光がCCDセンサ等か
らなる光電変換部4に入力される。光電変換部4は入力
された光信号を電気信号に変換し、2値化回路5に出力
する。2値化回路5は入力された電気信号を2値化し、
制御部7の制御を受けて2値信号をメモリ6に出力す
る。メモリ6は入力される2値信号を制御部7の制御を
受けながら順次格納していく。メモリ6には例えば帳票
1枚分の文字パターンが格納される。
第2図は帳票1のフォーマットを示しており、帳票には
本来読取るべきデータが印字若しくは印刷されるデータ
フィールド11と、使用された文字の字形を識別するため
の記号若しくは文字が印字若しくは印刷される字形識別
フィールド10が設けられており、字形識別フィールド10
は帳票1の右上端に配置されている。帳票1に印字若し
くは印刷する場合、使用するプリンタ等の印字装置毎に
割当てられた特定の記号若しくは文字を字形識別フィー
ルド10に印字若しくは印刷する。この特定の記号若しく
は文字は、後述するように字形識別辞書12に登録されて
いる文字パターンに一致している。
本来読取るべきデータが印字若しくは印刷されるデータ
フィールド11と、使用された文字の字形を識別するため
の記号若しくは文字が印字若しくは印刷される字形識別
フィールド10が設けられており、字形識別フィールド10
は帳票1の右上端に配置されている。帳票1に印字若し
くは印刷する場合、使用するプリンタ等の印字装置毎に
割当てられた特定の記号若しくは文字を字形識別フィー
ルド10に印字若しくは印刷する。この特定の記号若しく
は文字は、後述するように字形識別辞書12に登録されて
いる文字パターンに一致している。
次に第3図および第4図を参照して字形識別辞書と文字
認識辞書について詳細に説明する。
認識辞書について詳細に説明する。
第4図は文字認識辞書13で、文字の字体毎、例えば使用
するプリンタの字形毎の辞書が、13(1)〜13(n)のように
用意されている。第3図は字形識別辞書12で、文字認識
辞書13の各辞書13(1)〜13(n)から一字ずつ選択して組合
せたものである。すなわち、辞書13(1)からは文字種
「1」,辞書13(2)からは文字種「2」,……辞書13(n)からは
文字種「0」を選択している。選択にあたっては、各辞書
間で非類似の種類の文字とするのが望ましい。
するプリンタの字形毎の辞書が、13(1)〜13(n)のように
用意されている。第3図は字形識別辞書12で、文字認識
辞書13の各辞書13(1)〜13(n)から一字ずつ選択して組合
せたものである。すなわち、辞書13(1)からは文字種
「1」,辞書13(2)からは文字種「2」,……辞書13(n)からは
文字種「0」を選択している。選択にあたっては、各辞書
間で非類似の種類の文字とするのが望ましい。
前述で、帳票1上の字形識別フィールド10に印字若しく
は印刷される記号若しくは文字が、使用される印字装置
に割当てられた特定の記号若しくは文字であり、これら
は字形識別辞書12に登録されている文字パターンと一致
していることを説明したが、使用する印字装置の字体が
文字認識辞書13(1)に相当する字形であれば、この印字
装置には、字形識別辞書12に登録されている辞書13
(1)から選択された文字「1」が割当てられる。
は印刷される記号若しくは文字が、使用される印字装置
に割当てられた特定の記号若しくは文字であり、これら
は字形識別辞書12に登録されている文字パターンと一致
していることを説明したが、使用する印字装置の字体が
文字認識辞書13(1)に相当する字形であれば、この印字
装置には、字形識別辞書12に登録されている辞書13
(1)から選択された文字「1」が割当てられる。
さて再び第1図の説明に戻る。メモリ6には帳票1の文
字パターンが格納されている。文字切出し部8は制御部
7から切出しに必要な情報を貰い、メモリ6上の字形識
別フィールド10内の文字パターンを切出し、文字パター
ンのメモリ6上の位置情報を認識部9に送る。文字切出
し部8における字形識別フィールド10の探索は、制御部
7から帳票1上の字形識別フィールドの位置、例えば帳
票1の左端および上端からの寸法を貰うことにより可能
である。字形識別フィールド10内の文字パターンの切出
しは、例えば、文字パターンの輪郭追跡により文字成分
の存在を認識し、文字の印字ピッチに合せて1文字ずつ
振分ける方法等で行なわれる。認識部9は、文字切出し
部8からの位置情報に基づいて文字パターンをメモリ6
から読出し字形識別辞書12を用いて認識する。すなわち
文字パターンが字形識別辞書12のどの文字に一番近いか
を判定する。具体的手法として、例えば、文字パターン
と辞書の標準パターンの中心を合せて重ね合せ、一致し
た黒ビット数と標準パターンの黒ビット数の比を求め、
比率の高い文字パターンを答とする方法等が用いられ
る。字形識別の結果は制御部7に送られる。制御部7は
次にデータフィールド11内の文字を認識するために、文
字切出し部8に切出しに必要な情報を送る。文字切出し
部8は前述と同様の切出し手法に基づいてデータフィー
ルド11内の文字パターンを一文字ずつ切出す。また制御
部7は前述の字形識別結果を字形番号として認識部9に
送る。認識部9は、制御部7より受けた字形番号に対応
する辞書を複数の辞書13(1)〜13(n)から選択し、その辞
書を用いて前述同様の認識方法でデータフィールド11内
の文字を認識する。
字パターンが格納されている。文字切出し部8は制御部
7から切出しに必要な情報を貰い、メモリ6上の字形識
別フィールド10内の文字パターンを切出し、文字パター
ンのメモリ6上の位置情報を認識部9に送る。文字切出
し部8における字形識別フィールド10の探索は、制御部
7から帳票1上の字形識別フィールドの位置、例えば帳
票1の左端および上端からの寸法を貰うことにより可能
である。字形識別フィールド10内の文字パターンの切出
しは、例えば、文字パターンの輪郭追跡により文字成分
の存在を認識し、文字の印字ピッチに合せて1文字ずつ
振分ける方法等で行なわれる。認識部9は、文字切出し
部8からの位置情報に基づいて文字パターンをメモリ6
から読出し字形識別辞書12を用いて認識する。すなわち
文字パターンが字形識別辞書12のどの文字に一番近いか
を判定する。具体的手法として、例えば、文字パターン
と辞書の標準パターンの中心を合せて重ね合せ、一致し
た黒ビット数と標準パターンの黒ビット数の比を求め、
比率の高い文字パターンを答とする方法等が用いられ
る。字形識別の結果は制御部7に送られる。制御部7は
次にデータフィールド11内の文字を認識するために、文
字切出し部8に切出しに必要な情報を送る。文字切出し
部8は前述と同様の切出し手法に基づいてデータフィー
ルド11内の文字パターンを一文字ずつ切出す。また制御
部7は前述の字形識別結果を字形番号として認識部9に
送る。認識部9は、制御部7より受けた字形番号に対応
する辞書を複数の辞書13(1)〜13(n)から選択し、その辞
書を用いて前述同様の認識方法でデータフィールド11内
の文字を認識する。
以上の説明の如く本実施例によれば、文字認識の前に、
帳票上の字形識別フィールドに印字若しくは印刷された
文字パターンを認識して字形を決定し、この決定された
字形に対応する辞書を選択してデータフィールド内の文
字の認識を行うので、異なる字形の文字を高速に認識す
ることができる。しかも、使用された文字の字形に一致
する辞書を用いて認識を行なうため認識精度も高い。
帳票上の字形識別フィールドに印字若しくは印刷された
文字パターンを認識して字形を決定し、この決定された
字形に対応する辞書を選択してデータフィールド内の文
字の認識を行うので、異なる字形の文字を高速に認識す
ることができる。しかも、使用された文字の字形に一致
する辞書を用いて認識を行なうため認識精度も高い。
なお上記実施例では、制御部、文字切出し部、認識部が
夫々独立した構成となっているが、これらは一台のマイ
クロプロセッサを用い、時系列に全体の制御、文字の切
出し処理、認識処理を行なっても良い。また、制御部を
独立のマイクロプロセッサとし、文字切出し部と認識部
を一台のマイクロプロセッサとして文字切出し処理と認
識処理を時系列に行なっても良い。さらに認識部は夫々
字形識別部、文字認識部として独立のマイクロプロセッ
サで構成しても良い。また、字形識別辞書と文字認識辞
書は一個のメモリ上に持っても良いし、認識部に外付の
メモリでも良いし、認識部に内蔵されていても良い。
夫々独立した構成となっているが、これらは一台のマイ
クロプロセッサを用い、時系列に全体の制御、文字の切
出し処理、認識処理を行なっても良い。また、制御部を
独立のマイクロプロセッサとし、文字切出し部と認識部
を一台のマイクロプロセッサとして文字切出し処理と認
識処理を時系列に行なっても良い。さらに認識部は夫々
字形識別部、文字認識部として独立のマイクロプロセッ
サで構成しても良い。また、字形識別辞書と文字認識辞
書は一個のメモリ上に持っても良いし、認識部に外付の
メモリでも良いし、認識部に内蔵されていても良い。
一方帳票の字形識別フィールドに、プリンタ毎に割当て
られた記号あるいは文字を印字するための制御方法とし
て、プリンタあるいは光学文字読取装置が接続される上
位装置の制御プログラムで行うこともできるし、プリン
タ自体にそのような動作手順をプログラムとして持つこ
ともできる。
られた記号あるいは文字を印字するための制御方法とし
て、プリンタあるいは光学文字読取装置が接続される上
位装置の制御プログラムで行うこともできるし、プリン
タ自体にそのような動作手順をプログラムとして持つこ
ともできる。
字形識別フィールドに印字若しくは印刷する記号あるい
は文字は、字形識別をより確かにするために、同一種類
の文字を複数桁にしておくことも可能である。
は文字は、字形識別をより確かにするために、同一種類
の文字を複数桁にしておくことも可能である。
字形識別辞書は、相互に認識の際の類似度に距離の出る
種類の文字を組合せることが望ましく、字形によっては
複数種類とすることも可能であるし、数字以外の文字、
記号とすることも可能である。
種類の文字を組合せることが望ましく、字形によっては
複数種類とすることも可能であるし、数字以外の文字、
記号とすることも可能である。
字形識別フィールドは、データフィールドの一部、例え
ば右1桁とか左1桁に設定することも可能であるし、帳
票のフォーマット識別フィールドと併用することも可能
である。
ば右1桁とか左1桁に設定することも可能であるし、帳
票のフォーマット識別フィールドと併用することも可能
である。
本発明によれば、印字若しくは印刷された文字の字形を
識別し、識別された字形に対応する辞書を複数の辞書の
中から選択して文字認識を行なうので、字体の異なる文
字の認識を高速かつ高精度に行なうことができる。特
に、本発明では、異なる字体毎にそれぞれ割り当てられ
た特定の記号若しくは文字の組み合わせからなる字形識
別辞書を用いるので、この字形識別辞書には字体毎にそ
れぞれ割り当てられた特定の記号若しくは文字が当該字
体で登録されており、字形識別辞書に登録されている特
定の記号若しくは文字はそれぞれ字体が異なる。従っ
て、特定領域の文字認識に際して、当該特定領域に記録
されている特定の記号若しくは文字は、選択すべき字体
の辞書に対しては同じ字体の同じ文字パターンによって
マッチングされ、選択すべきでない辞書に対しては異な
る字体の異なる文字パターンによってマッチングされる
ので、選択すべき字体の辞書を高精度で選択することが
できる。また、帳票の特定領域には、当該帳票のデータ
印字に使用するのと同じ印字装置で印字できる、という
利点がある。
識別し、識別された字形に対応する辞書を複数の辞書の
中から選択して文字認識を行なうので、字体の異なる文
字の認識を高速かつ高精度に行なうことができる。特
に、本発明では、異なる字体毎にそれぞれ割り当てられ
た特定の記号若しくは文字の組み合わせからなる字形識
別辞書を用いるので、この字形識別辞書には字体毎にそ
れぞれ割り当てられた特定の記号若しくは文字が当該字
体で登録されており、字形識別辞書に登録されている特
定の記号若しくは文字はそれぞれ字体が異なる。従っ
て、特定領域の文字認識に際して、当該特定領域に記録
されている特定の記号若しくは文字は、選択すべき字体
の辞書に対しては同じ字体の同じ文字パターンによって
マッチングされ、選択すべきでない辞書に対しては異な
る字体の異なる文字パターンによってマッチングされる
ので、選択すべき字体の辞書を高精度で選択することが
できる。また、帳票の特定領域には、当該帳票のデータ
印字に使用するのと同じ印字装置で印字できる、という
利点がある。
第1図は本発明による認識方法が適用された光学文字読
取装置の一実施例を示す一部機構部を含むブロック図、
第2図は帳票例を示す図、第3図は第1図に示される字
形識別辞書例を示す図、第4図は第1図に示される文字
認識辞書例を示す図である。 符号の説明 1……帳票、2……搬送路 3……光源、4……光電変換部 5……2値化回路、6……メモリ 7……制御部、8……文字切出し部 9……認識部、10……字形識別フィールド 11……データフィールド、12……字形識別辞書 13……文字認識辞書
取装置の一実施例を示す一部機構部を含むブロック図、
第2図は帳票例を示す図、第3図は第1図に示される字
形識別辞書例を示す図、第4図は第1図に示される文字
認識辞書例を示す図である。 符号の説明 1……帳票、2……搬送路 3……光源、4……光電変換部 5……2値化回路、6……メモリ 7……制御部、8……文字切出し部 9……認識部、10……字形識別フィールド 11……データフィールド、12……字形識別辞書 13……文字認識辞書
───────────────────────────────────────────────────── フロントページの続き (72)発明者 道野 正雄 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (72)発明者 伊藤 敏 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (72)発明者 花野井 歳弘 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (72)発明者 ▲高▼本 賢一 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (56)参考文献 特開 昭58−78277(JP,A) 特開 昭58−78276(JP,A)
Claims (2)
- 【請求項1】字体毎の複数の辞書からなる文字認識辞書
を用いて異なる字体の文字を認識する方法において、異
なる字体毎にそれぞれ割り当てられた字体と同じ字体で
あって互いに異なる特定の記号若しくは文字の組み合わ
せからなる字形識別辞書を準備しておき、帳票の特定領
域に当該帳票に使用する字体に割り当てられた同じ字体
からなる前記特定の記号若しくは文字を印字若しくは印
刷し、この特定領域の記号若しくは文字を前記字形識別
辞書を用いて認識し、その認識結果に対応する字体の辞
書を前記文字認識辞書から選択し、その選択した辞書を
用いて前記帳票の文字認識を行なうことを特徴とする文
字認識方法。 - 【請求項2】前記特定の記号若しくは文字は、前記文字
認識辞書の各辞書から選択され、各辞書毎に異なる記号
若しくは文字からなることを特徴とする特許請求の範囲
第1項記載の文字認識方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59149563A JPH0632088B2 (ja) | 1984-07-20 | 1984-07-20 | 文字認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59149563A JPH0632088B2 (ja) | 1984-07-20 | 1984-07-20 | 文字認識方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6129976A JPS6129976A (ja) | 1986-02-12 |
| JPH0632088B2 true JPH0632088B2 (ja) | 1994-04-27 |
Family
ID=15477909
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59149563A Expired - Lifetime JPH0632088B2 (ja) | 1984-07-20 | 1984-07-20 | 文字認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0632088B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0434679A (ja) * | 1990-05-31 | 1992-02-05 | Nec Corp | 文字認識装置 |
| JPH0466666U (ja) * | 1990-10-12 | 1992-06-12 |
-
1984
- 1984-07-20 JP JP59149563A patent/JPH0632088B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6129976A (ja) | 1986-02-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US3676856A (en) | Automatic editing system and method | |
| US6279828B1 (en) | One dimensional bar coding for multibyte character | |
| JPH0632088B2 (ja) | 文字認識方法 | |
| JPS57168382A (en) | Optical character reader | |
| JPS6336389A (ja) | 文字読取装置 | |
| JPH0475556B2 (ja) | ||
| JPH0769938B2 (ja) | 文字読取装置 | |
| JP2578767B2 (ja) | 画像処理方法 | |
| JPS63263588A (ja) | 文字読取装置 | |
| JP2784004B2 (ja) | 文字認識装置 | |
| JP2674020B2 (ja) | 光学文字認識装置 | |
| JPS5785179A (en) | Optical character reading method | |
| JPS5914078A (ja) | 帳票読取装置 | |
| JPS593793B2 (ja) | 光学的文字読取装置 | |
| JPS6160184A (ja) | 光学的文字読取装置 | |
| JPS62281087A (ja) | パタ−ン認識方法 | |
| JPH0576674B2 (ja) | ||
| JPS60175188A (ja) | 区分装置 | |
| JPH01145791A (ja) | 光学文字読取装置 | |
| JPS60211587A (ja) | 活字認識制御装置 | |
| JPS6029883A (ja) | 光学的文字読取装置 | |
| JPH06103397A (ja) | 光学マークカード読み取り機 | |
| JPS58149574A (ja) | 標準パタ−ン登録装置 | |
| JPS62295192A (ja) | 光学文字画像読取装置 | |
| JPS62281091A (ja) | パタ−ン情報認識方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| EXPY | Cancellation because of completion of term |