JPH0479036B2 - - Google Patents

Info

Publication number
JPH0479036B2
JPH0479036B2 JP58186755A JP18675583A JPH0479036B2 JP H0479036 B2 JPH0479036 B2 JP H0479036B2 JP 58186755 A JP58186755 A JP 58186755A JP 18675583 A JP18675583 A JP 18675583A JP H0479036 B2 JPH0479036 B2 JP H0479036B2
Authority
JP
Japan
Prior art keywords
character
pattern
ocr
font
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58186755A
Other languages
English (en)
Other versions
JPS6079486A (ja
Inventor
Saiji Kageyama
Hirohide Endo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP58186755A priority Critical patent/JPS6079486A/ja
Publication of JPS6079486A publication Critical patent/JPS6079486A/ja
Publication of JPH0479036B2 publication Critical patent/JPH0479036B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は文字認識方式に係り、特に文字認識過
程における標準パターンの作成、参照方法に関す
る。
〔発明の背景〕
文字認識機能(与えられた印刷又は手書きされ
た文字パターンに対し、その文字パターンの文字
カテゴリを決定する機能)および文字の表示印字
機能(与えられた文字コードに対応するフオント
を表示、印字する機能)の両方をもつ装置を作成
する場合、文字認識用標準パターンメモリ(以下
OCR用標準パターンメモリと呼ぶ。)と文字表
示、印字用パターンメモリ(キヤラクタジエネレ
ータ、以下文字の表示、印字用メモリとも呼ぶ。)
の両方を用意するのが普通である。しかし漢字の
ように文字カテゴリ数が多い場合(常用漢字で
1945カテゴリ;JIS第1水準で2965カテゴリ;JIS
第1,第2水準の両方で6349カテゴリ)両方のメ
モリを装置に実装するとコストが高くなるという
問題点があつた。
この問題点を解決する一つの方法として、従
来、OCR用標準パターンメモリのみを装置に実
装し、文字の表示、印字用のフオントをOCR用
標準パターンから作成する方式〔出願No.49−
26298〕が提案されている。しかしこの従来発明
にはOCR用標準パターンの表現〔特徴表現〕が
縮退している場合、文字の表示又は印字に用いる
フオントつまり文字形状がその標準パターンから
復元できないという欠点があつた。文字形状が復
元できない特徴表現の例としては周辺分布と呼
ばれる特徴表現、ストローク密度関数と呼ばれ
る特徴表現、ペリフエラル特徴と呼ばれる特徴
表現、その他がある。、、の特徴表現の
例をそれぞれ第1図のa、第1図のb、第1図の
cとdに示す。このうちcは第1次ペリフエラル
特徴と呼ばれ、dは第2次ペリフエラル特徴と呼
ばれる。〜の特徴は印刷漢字又は手書き漢字
を認識する際有効であることが示されており、従
来発明の大切な目的である漢字認識装置を実現す
る時、上記欠点は大きな障害であつた。
の特徴表現は「中田,中野他、Recognition
of Chinese Charactevs、Pros.of the
Confevence on machine perception of
patterns and pictures held at the NPL、
Teddington、〔1972年4月〕」に詳細に記載され
ている。
、の特徴表現は「萩田他、3つの概形特徴
を用いた手書き漢字の分類、信学論、Vol.63−
D、No.12、PP1096〜1101、〔1980年12月〕」に詳
細に記載されている。
〔発明の目的〕
本発明の目的は、上記従来発明の欠点を解消
し、文字認識過程における標準パターンの作成、
参照方式を提供することにある。
〔発明の概要〕
本発明では上記目的を達成するために、OCR
用標準パターンメモリではなく、文字の表示、印
字用パターンメモリ(キヤラクタジエネレータ)
のみを装置に実装し、キヤラクタジエネレータが
発生するフオントからOCR用標準パターンを作
成しながら参照することにより、文字認識を行え
るようにした。その結果従来発明の欠点を解決
し、文字形状が復元できない縮退した特徴表現も
OCR用標準パターンとして使用できるようにな
つた。
またOCR用標準パターンメモリの実装を不要
にしたことにより、従来と同様なメモリ容量にす
ることができた。さらに印刷文字パターンを認識
する場合、印刷文字パターンの発生源であるフオ
ントから本発明の方法で作成したOCR用標準パ
ターンは、従来の印字されたパターンをスキヤナ
で電気信号に変換してから作成したOCR用標準
パターンにより、文字品質が高いという特色があ
る。この特色を反映して文字認識精度(特に品質
の高い文字パターンに対する)を高くできるとい
う効果もある。
本発明の基本手順を第2図のPAD(Program
Analysis Diagram)に示す。本PADについての
4つの注意事項を次に示す。
手順(2)で得られた特徴fと手順(3−1)で
得られたOCR用標準パターンの特徴gil,……,
gij,……,giJ(i)は、手順(3−2)で整合がと
れるような対応する形式でなければならない。
例えばfとgij(1jJ(i))がベクトルで表
現させる場合、それらの次元数と各次元につい
ての変域を対応させる必要がある。
手順(3−1)における前処理(主に大き
さ、傾きなどの正規化)は不要であることが多
い。その代表例は、手順(2)において未知文字パ
ターンuをフオントパターンPiに合わせる正規
化を行うことができる場合である。
手順(2)の特殊ケースとして、uに何も施さず
fがuのものである場合がある。
手順(3−1)の特殊ケースとして、Piに何
も施さずgil=Pi,J(i)=1である場合もある。
〔発明の実施例〕
以下、本発明の実施例について説明する。
第3図は本発明の一実施例を示す図である。
図において、初めに入力文字パターン20aが
観測部21に入力される。観測部21は入力文字
パターン20aを電気信号21aに変換する。電
気信号21aは22の処理により、前処理と切り
出しの一方又は両者が施された後、単位文字パタ
ーン22aに変換される。前処理は特徴抽出部2
3の中でなされることもある。単位文字 パター
ン22aは特徴抽出部23により特徴23aに変
換される。こうして入力文字パターン20aが特
徴23aに変換される。
一方、キヤラクタジエネレータ24に順次フオ
ントパターン24aを発生させながら、そのフオ
ントパターン24aに前処理(主に正規化)と特
徴抽出を25により施し、OCR用標準パターン
25aを得る。
フオントパターン24aに前処理、特徴抽出を
施してOCR用標準パターン25aを得た例を第
1図aを用いて説明する。
31のフオントパターンをz(x,y)、x=
1,……,Nl,y=1,……,N2と表す。この
フオントパターンz(x,y)に対し、(x軸)周
辺分布32Pl(x)と(y軸)周辺分布33P2
(y)を次式により計算し、OCR用標準パターン
25aとした。
Pl(x)=N2y=1 z(x,y),x=1,……,Nl P2(y)=N1x=1 z(x,y),y=1,……,N2 またフオントパターン24aからOCR用標準
パターンを得るための前処理、特徴抽出の方法と
しては、文字認識の分野で知られている様々な方
法を適用することができる。
次に整合部26において、特徴23aと各標準
パターン25a(特徴表現)との間の類似性を評
価する。続いて判定部27において、上記類似性
の評価値に基づいて、答カテゴリ27aを出力す
るか、又は答カテゴリの出力を拒否(リジエクト
27b)するかを決定する。
20a,21a,……などの信号の制御は、制
御部28で行う。第3図においては、図のはん雑
化をさけるため制御信号線を省略した。21,2
2,……,28の各処理部と記憶部は、光電変換
装置、μ−プロセツサ、メモリなどにより実現す
ることができる。24のキヤラクタジエネレータ
には不揮発性メモリを用いる。
第4図は本発明の他の一実施例を示す図であ
る。
本実施例はワードプロセツサ(或いは文字印刷
装置)41と文字認識装置42を一体とした装置
で、キヤラクタジエネレータ43を共用した場合
である。
文字認識装置42は、キヤラクタジエネレータ
43のフオントパターンに前処理、特徴抽出など
を施して標準パターンを作成し、参照する。
ワードプロセツサ(或いは文字印刷装置)41
はキヤラクタジエネレータにフオントを発生さ
せ、それを文字の表示又は印字に利用する。
〔発明の効果〕
本発明によれば、OCR用標準パターンを低価
格のキヤラクタジエネレータから作成して、参照
できるので、OCR(特に漢字OCR)の価格を低く
することができる。またOCR用標準パターン作
成用の上記キヤラクタジエネレータを文字の表
示,印字にも併用することにより、コストパフオ
ーマンスをさらに改善することができる。
【図面の簡単な説明】
第1図は文字形状が復元できない特徴表現の例
を示す図、第2図は本発明を実行するための
PADを示す図、第3図は本発明の一実施例の構
成を示す図、第4図は本発明の他の実施例の構成
を示す図である。 21……観測部、22……前処理と切出しの一
方又は両者を行う部分、23……特徴抽出部、2
4……キヤラクタジエネレータ、25……前処
理、特徴抽出を行う部分、26……整合部、27
……判定部、28……制御部、20a……入力文
字パターン、21a……20aの信号を電気信号
に変換したもの、22a……単位文字パターン、
23a……特徴、24a……フオントパターン、
25a……フオントパターンから作成した標準パ
ターン(特徴表現)、26a……23a(f)と25
a(gijとの間の類似性の評価値、27a……答カ
テゴリ、27b……リジエクト、31……フオン
トパターン、32……(x軸)周辺分布、33…
…(y軸)周辺分布、41……文字認識装置、4
2……ワードプロセツサ或いは文字印刷装置。

Claims (1)

  1. 【特許請求の範囲】 1 未知文字パターンと複数個の標準文字パター
    ンと間の類似性を評価し、その類似性の評価値に
    基づいて答カテゴリの出力を決定する文字認識処
    理において、キヤラクタジエネレータに順次発生
    させた各フオントパターン或いは、上記各フオン
    トパターンに前処理、特徴抽出などの変換を施し
    たものを上記標準文字パターンとすることを特徴
    とする文字認識方式。 2 特許請求の範囲第1項の記載において、上記
    キヤラクタジエネレータに発生させたフオントパ
    ターンを文字の表示、印字にも用いることを特徴
    とする文字認識方式。
JP58186755A 1983-10-07 1983-10-07 文字認識方式 Granted JPS6079486A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58186755A JPS6079486A (ja) 1983-10-07 1983-10-07 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58186755A JPS6079486A (ja) 1983-10-07 1983-10-07 文字認識方式

Publications (2)

Publication Number Publication Date
JPS6079486A JPS6079486A (ja) 1985-05-07
JPH0479036B2 true JPH0479036B2 (ja) 1992-12-14

Family

ID=16194068

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58186755A Granted JPS6079486A (ja) 1983-10-07 1983-10-07 文字認識方式

Country Status (1)

Country Link
JP (1) JPS6079486A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245606B (zh) * 2019-06-13 2021-07-20 广东小天才科技有限公司 一种文本识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JPS6079486A (ja) 1985-05-07

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
DE69517564T2 (de) Verfahren und Gerät zur Erzeugung einer hybriden Datenstruktur zur Anzeige eines Rasterbildes
JP3163185B2 (ja) パターン認識装置およびパターン認識方法
JPH0798765A (ja) 方向検出方法および画像解析装置
JPH0773329A (ja) 画像処理方法および装置
CN101017533A (zh) 印刷体蒙古文字符识别方法
EP0810542A2 (en) Bitmap comparison apparatus and method
JPH0479036B2 (ja)
JPH0516632B2 (ja)
JP2788506B2 (ja) 文字認識装置
JP3141516B2 (ja) 地図作成方式
JPH024033B2 (ja)
JP2827288B2 (ja) 文字認識装置
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
US20240062567A1 (en) Learning Image Generation Apparatus, Learning Image Generation Method, And Non-Transitory Computer-Readable Recording Medium
JP2800205B2 (ja) 画像処理装置
JP3381326B2 (ja) アウトラインフォントデータの座標正規化方法,及びアウトラインフォントデータ生成装置
JP4011859B2 (ja) 単語画像正規化装置,単語画像正規化プログラム記録媒体および単語画像正規化プログラム
JP3127413B2 (ja) 文字認識装置
JPS6120180A (ja) 光学的文字認識装置
JPH0586585B2 (ja)
JPS62257583A (ja) 文字認識方式
JPS6262392B2 (ja)
JPH03282689A (ja) 文字認識装置
JPS5914078A (ja) 帳票読取装置