JPS6182284A - ストロ−ク抽出方式 - Google Patents

ストロ−ク抽出方式

Info

Publication number
JPS6182284A
JPS6182284A JP58247188A JP24718883A JPS6182284A JP S6182284 A JPS6182284 A JP S6182284A JP 58247188 A JP58247188 A JP 58247188A JP 24718883 A JP24718883 A JP 24718883A JP S6182284 A JPS6182284 A JP S6182284A
Authority
JP
Japan
Prior art keywords
stroke
strokes
extracted
stage
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58247188A
Other languages
English (en)
Inventor
Masahiro Nakamura
昌弘 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP58247188A priority Critical patent/JPS6182284A/ja
Publication of JPS6182284A publication Critical patent/JPS6182284A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は1文字認識装置において文字パターンのストロ
ークを抽出する方式に関する。
〔従来技術〕
従来の文字認識装置におけるストローク抽出方式は、文
字パターンを方向別にコード化し、さらに伸長処理を行
うことにより、方向別にストロークを抽出し、連結した
ストロークは背景情報を使って分難するという方式とな
っている。しかし、このような従来の方式では、極めて
類似した文字パターンであっても、抽出されるストロー
ク数が異なることがあり、特徴量が安定せず、これが原
囚で辞書容量が増大し、認識率及び認識速度の低下を招
くと云う問題があった。
そのような例を第1図によって説明する。この図は(a
)は、方向別コード化によって得られた方向コードLL
 1 、lのパターンである。従来方式では、このパタ
ーンから、(b)のように4つのストロ−−夕が抽出さ
れる。(b)において、111 IIから4″′は、そ
れぞれストローク識別番号である。(c)は方向別コー
ドによって得られた方向コードLL I IIのパター
であり、従来方式によると、このパターンから(d)に
示すように3つのストロークが抽出される。
このように、(C)のパターンは、中央部分の○で囲ん
だ2つの画素が白である点だけが(a)のパターンと相
違するのみであるが、(a)のパターンからは4つのス
トロークが抽出されるのに対し、(c)パターンからは
3つのストロークが抽出されるのみである。
〔目 的〕
本発明の目的は、上述のような問題点を解消したストロ
ーク抽出方式を提供することにある。
〔実施例〕
第2図は本発明に係わる文字認識装置の概略ブロック図
である。入力原稿は、光電変換部100によって2値の
画像データに変換される。前処理部101は、光電変換
された画像データから文字を切り出し、スムージング、
正規化等の処理を行う。特徴抽出部102は、前処理部
101によって切り出された文字パターンから特徴量を
抽出し、その特徴量を検索部103へ送る。検索部10
3は、抽出された特徴量を、辞書記憶部104に予め登
録されている既知文字の特徴量と比較し1文字認識を行
い、認識結果を出力部105へ送る。
出力部105は、認識結果を印刷または表示、あるいは
記憶する。
特徴抽出部102の構成を第3図によって説明する。こ
の図において、301は全体特徴抽出部であり、文字の
全体的な特徴、たとえばホールの中心と個数、文字の重
心等を抽出する。これ以外の部分はストローク抽出に関
係する部分であり、その構成は次の通りである。
前処理部101から入力される文字パターンは、方向別
コード化部302によって方向別にコード化される。こ
のコート化は、たとえば3×3マスクによって文字パタ
ーンの黒画素の連結方向を調べ、その連結方向に従って
黒画素に対応する方向コードを付けるという公知の方法
によって行われる。
伸長部303は、コード化されたパターンについて、各
方向コードをその方向に黒画素である限り伸長する。こ
の伸長後のパターンの一例を第4図(a)に示す。この
図において、LL i 11は方向コードである。
ストローク抽出部304は、伸長後のパターンから方向
別に連結状態をチェックしつつ、ストロークを抽出する
。この際、第4図Lt)に示すようなストロークが連結
したパターンについては、背景情報を使ってストローク
の分離を行う。この処理自体は従来と同様でよい。また
、ストロークの連結を検出すると、そのストローク方向
の連結アフラグFiをONする。
第4図(a)のパターンの場合、(b)に示すように4
つのストロークが抽出される。この図において、LL 
I IIからII 4 IIはストローク識別番号であ
る。
ストローク抽出部304は、ストロークの抽出を行った
後、各ストロークの中心座標、長さ、幅等のストローク
特徴を抽出する。
ストローク抽出部304によるストローク抽出が終了す
ると、細線化ストローク抽出部305は、連結フラグF
iの状態をチェックする。連結フラグFiがOFF状態
ならば、細線化ストローク抽出部305は、何もしない
で処理終了信号をストローク選択統合部306へ出力す
る。連結フラグFiがON状態ならば、細線化ストロー
ク抽出部305は、伸長部303によって伸長処理を行
われた後の各方向コードのパターンを細線化しくこの細
線化処理は、従来から知られている方法で行ってよい)
、細線化されたパターンからストロークを抽出し、各ス
トロークの中心座標を抽出する。
この処理が終わると、処理終了信号を出力する。
第4図(a)のパターンの場合、細線化ストローり抽出
部305によって、第4図(c)に示すような4本のス
トロークが抽出される。
ストローク選択統合部306は、細線化ストローク抽出
部305から処理終了信号を入力されると、連結フラグ
Fiの状態をチェックする。連結フラグFiがOFF状
態の場合は、ストローク抽出部304によって抽出され
たストロークをそのまま最終的なストロークとして選択
し、それらのストローク特徴を検索部103へ出力する
連結フラグFiがON状態の場合、ストローク選択統合
部306は、ストローク抽出部304により抽出された
ストローク本数Miと、細線化ストローク抽出部305
によって抽出されたストローク本数Niを比較する。
この比較が一致するときは、ストローク選択統合部30
6は、ストローク抽出部304により抽出されたストロ
ークをそのまま最終的なストロ−として選択し、それら
のストローク特徴を検索部103へ出力する。
上記比較が不一致のときは(M i )N i) 、ス
トローク抽出部304により抽出されたス1〜ロークと
、細線化ストローク抽出部305で抽出されたストロー
クとの中心座標の距離(相対距離)を算出する。そして
、ストローク抽出部304で抽出されたストローク(M
i本)より、」二記相対距離の小さいものから順にN4
本だけ選択する。
また、選択されずに残ったスI・ロータは、選択された
ストロークの中の中心座標の最も近いストローク特徴製
算出する。この統合ス1−ロークと、そのまま選択した
ストロークを最終的なストロークとして抽出し、それら
のストローク特徴を検索部103へ出力する。
なお、以上の細線化ストローク抽出部305およびスト
ローク選択部306の処理は、方向別に実行される。
第4図(’a )のパターンの場合は、ストローク特徴
抽出部304と細線化ストロータ抽出部305の何れに
よっても4本のストロークが抽出されるので、(b)に
示した各ストロークが最終的なストロークとして選択さ
れ、それらのストローク特徴が検索部103へ出力され
る。
ストローク本数が一致しない例を第5図に示す。
(a)は、コード化および伸長を行った後の方向コード
゛′1″のパターンであり、(b)はストローク抽出部
304によって抽出されたストロークのパターンである
。各ストロークの中心座標は表1の左側の欄に示す通り
である。(c)は細線化ストローク抽出部305によっ
て抽出されたストロークのパターンであり、各ストロー
クの中心座標は表1の右側の欄に示す通りである。
この場合、ストローク抽出部304によって抽出された
ストロークNα1.Nα4は、そのまま最終的なストロ
ークとして選択されるが、ストロークNα2 、 No
、 3は一本のストロークに統合され、統合後ストロー
クが最終的に抽出される。
表  1 なお、方向別コード化部2によるコード化、伸長部30
3による伸長、ストローク抽出部30/1におけるスト
ロークの抽出、分離等の処理、および細線化部ス1−ロ
ーク抽出部5による細線化とス1−ローク抽出処理等は
、前述のように、従来と同様な方法によって行ってよい
。本発明の特徴は、そのような個々の処理にあるのでは
なく、前述のような一連の処理系列にある。
〔効 果〕
以上詳細に説明したように、本発明のストローク抽出方
式によれば、文字パターンの微妙な違いによるストロー
ク本数の変動を防止し、安定なストローク抽出を行うこ
とができ、従って、文字認識装置の辞書容量を削減し、
また認識率および認識速度の向上を図ることができる。
また、細線化を行ってからのストローク抽出処理を、非
細線化ストローク抽出処理でストロークの連結が検出さ
れた場合のみ実行するから、細線化ストローク抽出処理
の追加によるストローク抽出処理時間の増加を最小限に
抑えることができる。
【図面の簡単な説明】
第1図は従来の問題点を説明するためのパターン図、第
2図は本発明に係わる文字認識装置の概略ブロック図、
第3図は特徴抽出部の詳細ブロック図、第4図および第
5図はストローク抽出の例を示すパターン図である。 100・・・光電変換部、  101・・・前処理部、
102・・・特徴抽出部、  103・・・検索部、1
04・・・辞書抽出部、  105・・・出力部、30
1・・・全体特徴抽出部、 302・・・方向別コード
化部、  303・・・伸長部、 304・・・ストロ
ーク抽出部、 305・・・細線化ストローク抽出部、
306・・・ストローク選択統合部、。 図面の浄■ト(内容に変更なし 第X図 (cL) 、、、、11111111・・・ 、、、1111・・・・・・・・ 、、、、11111111.、。 、、1111111111.。 =、、 1111111111.。 、、、、11111111・・・ ・・、・、11111.、、、、 cL) ・・・−・・444 ・・・・・ 、、、3333・・・・・・・・ 、、、3.222222222・。 −1,,22222222,、。 0.、.222>2.?22・・・ 、、−2222222222・。 (C’) 、、、1111111111.。 −,,1111111117−。 ・・・0111・・・・・・、。 ・・・・11111171・・・ ・、、1111111111.。 ・・・・・11111・・・・・ (匈 ・・・・・・3ろ3・・・・・・ 、、、、33333333.、。 、、、3333333333−。 10.3つ33″333″1133・・。、、、222
.、、、、、。 、、、、 222222222・・ 、、、、22222)22.、。 豐#感−22222フ′22・・・ −0・2222フ22722・・ 、、、1′X11111111.。 ・・・・11Tl1111・・・ ・・・・・1llll・・・・・ 手続補正書(方式) 1.事件の表示  特願昭58−247188号発明 2、Mの名称  ストローク佃出方式 3補正をする者 事件との関係  出願人 住 所 東京都太田区中馬込1丁目3番6号8  !’
F   (674)  株式会社 リ コ −4代理人 住  所  8I51東京都渋谷区代々木2丁目38番
X2号 線部ビル201号5、 補正命令 の日付 昭和59年3月 7日(発送日昭和59年3月4日)第
1図を別紙の通りに補正する。 9、添付書類の目録 補 正 図 面         1通手続補正書(方
式) 昭和60年10月28日 昭和58年特許願第247188号 2、発明の名称 ストローク抽出方式 3、補正をする者 事件との関係  出願人 住所  東京都大田区中馬込1丁目3番6号名称  (
674)  株式会社 リ コ −代表者      
 浜 1)  広 4、代理人 5、補正命令の日付 昭和60年8月7日(発送日 昭和60年8月27日)
7、補正の内容 明細書節11頁14〜15行目の「、第4図および第5
図はストローク抽出の例を示すパターン図」の記載を削
除する。 以上

Claims (1)

    【特許請求の範囲】
  1. (1)文字パターンの黒画素にその連結方向に従った方
    向コードを付け、さらに各方向コードの伸長を行った後
    、方向コード別にストロークを抽出するとともに、スト
    ロークの連結の有無を調べる第1段階と、該第1段階で
    ストロークの連結が検出された場合に、上記伸長後の各
    方向コードのパターンを細線化した後、各方向コードの
    ストロークを抽出する第2段階と、該第1段階でストロ
    ークの連結が検出されない場合は、該第1段階で抽出さ
    れたストロークを最終的なストロークとして抽出し、該
    第1段階でストロークの連結が検出された場合は、該第
    1と第2の段階で抽出されたストロークの本数が同一な
    らば該第1段階で抽出されたストロークをそのまま最終
    的なストロークとして抽出し、ストローク本数が不一致
    ならば該第1と第2の段階で抽出されたストロークの相
    対距離を算出し、該第1段階で抽出されたストロークの
    中から、相対距離の小さい順に該第2段階で抽出された
    ストローク本数と同じだけ選択し、選択されずに残った
    ストロークを選択されたストロークの相対距離の小さい
    ものに統合するストロークの選択統合を行って最終的な
    ストロークを抽出する第3の段階とから成るストローク
    抽出方式。
JP58247188A 1983-12-28 1983-12-28 ストロ−ク抽出方式 Pending JPS6182284A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58247188A JPS6182284A (ja) 1983-12-28 1983-12-28 ストロ−ク抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58247188A JPS6182284A (ja) 1983-12-28 1983-12-28 ストロ−ク抽出方式

Publications (1)

Publication Number Publication Date
JPS6182284A true JPS6182284A (ja) 1986-04-25

Family

ID=17159745

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58247188A Pending JPS6182284A (ja) 1983-12-28 1983-12-28 ストロ−ク抽出方式

Country Status (1)

Country Link
JP (1) JPS6182284A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9074913B2 (en) 2010-09-15 2015-07-07 Nippon Seiki Co., Ltd. Instrument driving device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9074913B2 (en) 2010-09-15 2015-07-07 Nippon Seiki Co., Ltd. Instrument driving device

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
JP5274305B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
KR101220709B1 (ko) 한글 및 한자가 혼용된 문서에 대한 전자 사전 검색 장치 및 방법
JPH09223240A (ja) 文書電子化装置
CN116704540A (zh) 将纸质文件内容进行标识并高保真的转换为ofd文件的技术
JPS6182284A (ja) ストロ−ク抽出方式
CN114328679A (zh) 图像处理方法、装置、计算机设备以及存储介质
TW202117589A (zh) 表單內容辨識系統及其方法
CN114898345B (zh) 一种阿拉伯语文本识别方法及系统
JP2508975B2 (ja) 電子黒板
JP3030126B2 (ja) 画像処理方法
CN116090422A (zh) 一种电力业扩表单的录入方法及装置
JP2000132639A (ja) 文字抽出認識方法及び装置及びこの方法を記録した記録媒体
KR100259804B1 (ko) 도표형태의문서인식방법
JPS59148983A (ja) 漢字認識辞書選択方式
KR102574293B1 (ko) 전자 문서에 삽입되는 2차원 코드와의 연동을 통해 상기 전자 문서에 대한 저자 정보의 저장 및 조회를 가능하게 하는 블록체인 기반의 저자 정보 관리 서버 및 그 동작 방법
JPH03127169A (ja) マルチメディア文書構造化方式
TW480416B (en) Ten-simple-code Chinese input method
JPS60150193A (ja) ストロ−ク抽出方式
JPS60140486A (ja) ストロ−ク抽出方式
JPS62253270A (ja) ミクストモ−ド信号処理方式
JPH04324577A (ja) 折れ線グラフ認識装置
JPS60584A (ja) 単語認識方式
JPH05174150A (ja) 円グラフ認識装置
JPS594358Y2 (ja) 文字修正における文字制御装置