JPH0632088B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH0632088B2
JPH0632088B2 JP59149563A JP14956384A JPH0632088B2 JP H0632088 B2 JPH0632088 B2 JP H0632088B2 JP 59149563 A JP59149563 A JP 59149563A JP 14956384 A JP14956384 A JP 14956384A JP H0632088 B2 JPH0632088 B2 JP H0632088B2
Authority
JP
Japan
Prior art keywords
character
dictionary
recognition
font
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59149563A
Other languages
English (en)
Other versions
JPS6129976A (ja
Inventor
純一 小林
健 福田
正雄 道野
敏 伊藤
歳弘 花野井
賢一 ▲高▼本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59149563A priority Critical patent/JPH0632088B2/ja
Publication of JPS6129976A publication Critical patent/JPS6129976A/ja
Publication of JPH0632088B2 publication Critical patent/JPH0632088B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は光学文字読取装置の文字認識方法に係り、特に
多種類の字形、例えば多種類のプリンタで印字された活
字を読取るのに好適な異なる字体の文字を認識する方法
に関する。
〔発明の背景〕
異なる字体の文字を読取る方法として、例えば特公昭56
−44455号公報、特公昭59−3793号公報および特開昭58
−51390号公報に記載のように、各字体に対応した複数
の辞書を用意し、読取った文字パターンを全ての辞書を
用いて認識し、認識率の一番高い辞書による結果を読取
り出力とする方法がある。この方法は帳票のフォーマッ
トを変更せずに字形を増せる長所はあるが、字形が多く
なった場合、各辞書による認識結果の振分けに失敗した
り、読取り速度が遅くなったりする欠点がある。
〔発明の目的〕
本発明の目的は、異なる字体の文字を高速かつ高精度に
認識する方法を提供することである。
〔発明の概要〕
本発明の特徴とするところは、字体毎の複数の辞書から
なる文字認識辞書を用いて異なる字体の文字を認識する
方法において、異なる字体毎にそれぞれ割り当てられた
特定の記号若しくは文字の組み合わせからなる字形識別
辞書を準備しておき、帳票の特定領域に当該帳票に使用
する字体に割り当てられた特定の記号若しくは文字を印
字若しくは印刷し、この特定領域の記号若しくは文字を
字形識別辞書を用いて認識し、その認識結果に対応する
字体の辞書を文字認識辞書から選択し、その選択した辞
書を用いて帳票の文字認識を行なうところにある。
〔発明の実施例〕
以下本発明の一実施例を第1図及至第4図を参照して詳
細に説明する。
第1図は本発明が適用された光学文字読取装置の一部機
構部を含むブロック図、第2図は帳票のフォーマット例
を示す図、第3図は字形識別辞書例を示す図、第4図は
字体毎の複数の辞書からなる文字認識辞書例を示す図で
ある。
第1図を参照するに、帳票1は制御部7により紙送り制
御が行なわれる搬送路2上を搬送される。帳票1上の文
字は光源3に照射され、その反射光がCCDセンサ等か
らなる光電変換部4に入力される。光電変換部4は入力
された光信号を電気信号に変換し、2値化回路5に出力
する。2値化回路5は入力された電気信号を2値化し、
制御部7の制御を受けて2値信号をメモリ6に出力す
る。メモリ6は入力される2値信号を制御部7の制御を
受けながら順次格納していく。メモリ6には例えば帳票
1枚分の文字パターンが格納される。
第2図は帳票1のフォーマットを示しており、帳票には
本来読取るべきデータが印字若しくは印刷されるデータ
フィールド11と、使用された文字の字形を識別するため
の記号若しくは文字が印字若しくは印刷される字形識別
フィールド10が設けられており、字形識別フィールド10
は帳票1の右上端に配置されている。帳票1に印字若し
くは印刷する場合、使用するプリンタ等の印字装置毎に
割当てられた特定の記号若しくは文字を字形識別フィー
ルド10に印字若しくは印刷する。この特定の記号若しく
は文字は、後述するように字形識別辞書12に登録されて
いる文字パターンに一致している。
次に第3図および第4図を参照して字形識別辞書と文字
認識辞書について詳細に説明する。
第4図は文字認識辞書13で、文字の字体毎、例えば使用
するプリンタの字形毎の辞書が、13(1)〜13(n)のように
用意されている。第3図は字形識別辞書12で、文字認識
辞書13の各辞書13(1)〜13(n)から一字ずつ選択して組合
せたものである。すなわち、辞書13(1)からは文字種
「1」,辞書13(2)からは文字種「2」,……辞書13(n)からは
文字種「0」を選択している。選択にあたっては、各辞書
間で非類似の種類の文字とするのが望ましい。
前述で、帳票1上の字形識別フィールド10に印字若しく
は印刷される記号若しくは文字が、使用される印字装置
に割当てられた特定の記号若しくは文字であり、これら
は字形識別辞書12に登録されている文字パターンと一致
していることを説明したが、使用する印字装置の字体が
文字認識辞書13(1)に相当する字形であれば、この印字
装置には、字形識別辞書12に登録されている辞書13
(1)から選択された文字「1」が割当てられる。
さて再び第1図の説明に戻る。メモリ6には帳票1の文
字パターンが格納されている。文字切出し部8は制御部
7から切出しに必要な情報を貰い、メモリ6上の字形識
別フィールド10内の文字パターンを切出し、文字パター
ンのメモリ6上の位置情報を認識部9に送る。文字切出
し部8における字形識別フィールド10の探索は、制御部
7から帳票1上の字形識別フィールドの位置、例えば帳
票1の左端および上端からの寸法を貰うことにより可能
である。字形識別フィールド10内の文字パターンの切出
しは、例えば、文字パターンの輪郭追跡により文字成分
の存在を認識し、文字の印字ピッチに合せて1文字ずつ
振分ける方法等で行なわれる。認識部9は、文字切出し
部8からの位置情報に基づいて文字パターンをメモリ6
から読出し字形識別辞書12を用いて認識する。すなわち
文字パターンが字形識別辞書12のどの文字に一番近いか
を判定する。具体的手法として、例えば、文字パターン
と辞書の標準パターンの中心を合せて重ね合せ、一致し
た黒ビット数と標準パターンの黒ビット数の比を求め、
比率の高い文字パターンを答とする方法等が用いられ
る。字形識別の結果は制御部7に送られる。制御部7は
次にデータフィールド11内の文字を認識するために、文
字切出し部8に切出しに必要な情報を送る。文字切出し
部8は前述と同様の切出し手法に基づいてデータフィー
ルド11内の文字パターンを一文字ずつ切出す。また制御
部7は前述の字形識別結果を字形番号として認識部9に
送る。認識部9は、制御部7より受けた字形番号に対応
する辞書を複数の辞書13(1)〜13(n)から選択し、その辞
書を用いて前述同様の認識方法でデータフィールド11内
の文字を認識する。
以上の説明の如く本実施例によれば、文字認識の前に、
帳票上の字形識別フィールドに印字若しくは印刷された
文字パターンを認識して字形を決定し、この決定された
字形に対応する辞書を選択してデータフィールド内の文
字の認識を行うので、異なる字形の文字を高速に認識す
ることができる。しかも、使用された文字の字形に一致
する辞書を用いて認識を行なうため認識精度も高い。
なお上記実施例では、制御部、文字切出し部、認識部が
夫々独立した構成となっているが、これらは一台のマイ
クロプロセッサを用い、時系列に全体の制御、文字の切
出し処理、認識処理を行なっても良い。また、制御部を
独立のマイクロプロセッサとし、文字切出し部と認識部
を一台のマイクロプロセッサとして文字切出し処理と認
識処理を時系列に行なっても良い。さらに認識部は夫々
字形識別部、文字認識部として独立のマイクロプロセッ
サで構成しても良い。また、字形識別辞書と文字認識辞
書は一個のメモリ上に持っても良いし、認識部に外付の
メモリでも良いし、認識部に内蔵されていても良い。
一方帳票の字形識別フィールドに、プリンタ毎に割当て
られた記号あるいは文字を印字するための制御方法とし
て、プリンタあるいは光学文字読取装置が接続される上
位装置の制御プログラムで行うこともできるし、プリン
タ自体にそのような動作手順をプログラムとして持つこ
ともできる。
字形識別フィールドに印字若しくは印刷する記号あるい
は文字は、字形識別をより確かにするために、同一種類
の文字を複数桁にしておくことも可能である。
字形識別辞書は、相互に認識の際の類似度に距離の出る
種類の文字を組合せることが望ましく、字形によっては
複数種類とすることも可能であるし、数字以外の文字、
記号とすることも可能である。
字形識別フィールドは、データフィールドの一部、例え
ば右1桁とか左1桁に設定することも可能であるし、帳
票のフォーマット識別フィールドと併用することも可能
である。
〔発明の効果〕
本発明によれば、印字若しくは印刷された文字の字形を
識別し、識別された字形に対応する辞書を複数の辞書の
中から選択して文字認識を行なうので、字体の異なる文
字の認識を高速かつ高精度に行なうことができる。特
に、本発明では、異なる字体毎にそれぞれ割り当てられ
た特定の記号若しくは文字の組み合わせからなる字形識
別辞書を用いるので、この字形識別辞書には字体毎にそ
れぞれ割り当てられた特定の記号若しくは文字が当該字
体で登録されており、字形識別辞書に登録されている特
定の記号若しくは文字はそれぞれ字体が異なる。従っ
て、特定領域の文字認識に際して、当該特定領域に記録
されている特定の記号若しくは文字は、選択すべき字体
の辞書に対しては同じ字体の同じ文字パターンによって
マッチングされ、選択すべきでない辞書に対しては異な
る字体の異なる文字パターンによってマッチングされる
ので、選択すべき字体の辞書を高精度で選択することが
できる。また、帳票の特定領域には、当該帳票のデータ
印字に使用するのと同じ印字装置で印字できる、という
利点がある。
【図面の簡単な説明】
第1図は本発明による認識方法が適用された光学文字読
取装置の一実施例を示す一部機構部を含むブロック図、
第2図は帳票例を示す図、第3図は第1図に示される字
形識別辞書例を示す図、第4図は第1図に示される文字
認識辞書例を示す図である。 符号の説明 1……帳票、2……搬送路 3……光源、4……光電変換部 5……2値化回路、6……メモリ 7……制御部、8……文字切出し部 9……認識部、10……字形識別フィールド 11……データフィールド、12……字形識別辞書 13……文字認識辞書
───────────────────────────────────────────────────── フロントページの続き (72)発明者 道野 正雄 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (72)発明者 伊藤 敏 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (72)発明者 花野井 歳弘 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (72)発明者 ▲高▼本 賢一 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (56)参考文献 特開 昭58−78277(JP,A) 特開 昭58−78276(JP,A)

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】字体毎の複数の辞書からなる文字認識辞書
    を用いて異なる字体の文字を認識する方法において、異
    なる字体毎にそれぞれ割り当てられた字体と同じ字体で
    あって互いに異なる特定の記号若しくは文字の組み合わ
    せからなる字形識別辞書を準備しておき、帳票の特定領
    域に当該帳票に使用する字体に割り当てられた同じ字体
    からなる前記特定の記号若しくは文字を印字若しくは印
    刷し、この特定領域の記号若しくは文字を前記字形識別
    辞書を用いて認識し、その認識結果に対応する字体の辞
    書を前記文字認識辞書から選択し、その選択した辞書を
    用いて前記帳票の文字認識を行なうことを特徴とする文
    字認識方法。
  2. 【請求項2】前記特定の記号若しくは文字は、前記文字
    認識辞書の各辞書から選択され、各辞書毎に異なる記号
    若しくは文字からなることを特徴とする特許請求の範囲
    第1項記載の文字認識方法。
JP59149563A 1984-07-20 1984-07-20 文字認識方法 Expired - Lifetime JPH0632088B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59149563A JPH0632088B2 (ja) 1984-07-20 1984-07-20 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59149563A JPH0632088B2 (ja) 1984-07-20 1984-07-20 文字認識方法

Publications (2)

Publication Number Publication Date
JPS6129976A JPS6129976A (ja) 1986-02-12
JPH0632088B2 true JPH0632088B2 (ja) 1994-04-27

Family

ID=15477909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59149563A Expired - Lifetime JPH0632088B2 (ja) 1984-07-20 1984-07-20 文字認識方法

Country Status (1)

Country Link
JP (1) JPH0632088B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0434679A (ja) * 1990-05-31 1992-02-05 Nec Corp 文字認識装置
JPH0466666U (ja) * 1990-10-12 1992-06-12

Also Published As

Publication number Publication date
JPS6129976A (ja) 1986-02-12

Similar Documents

Publication Publication Date Title
US3676856A (en) Automatic editing system and method
US6279828B1 (en) One dimensional bar coding for multibyte character
JPH0632088B2 (ja) 文字認識方法
JPS57168382A (en) Optical character reader
JPS6336389A (ja) 文字読取装置
JPH0475556B2 (ja)
JPH0769938B2 (ja) 文字読取装置
JP2578767B2 (ja) 画像処理方法
JPS63263588A (ja) 文字読取装置
JP2784004B2 (ja) 文字認識装置
JP2674020B2 (ja) 光学文字認識装置
JPS5785179A (en) Optical character reading method
JPS5914078A (ja) 帳票読取装置
JPS593793B2 (ja) 光学的文字読取装置
JPS6160184A (ja) 光学的文字読取装置
JPS62281087A (ja) パタ−ン認識方法
JPH0576674B2 (ja)
JPS60175188A (ja) 区分装置
JPH01145791A (ja) 光学文字読取装置
JPS60211587A (ja) 活字認識制御装置
JPS6029883A (ja) 光学的文字読取装置
JPH06103397A (ja) 光学マークカード読み取り機
JPS58149574A (ja) 標準パタ−ン登録装置
JPS62295192A (ja) 光学文字画像読取装置
JPS62281091A (ja) パタ−ン情報認識方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term