JPS60142784A - 文字分離方式 - Google Patents

文字分離方式

Info

Publication number
JPS60142784A
JPS60142784A JP58246709A JP24670983A JPS60142784A JP S60142784 A JPS60142784 A JP S60142784A JP 58246709 A JP58246709 A JP 58246709A JP 24670983 A JP24670983 A JP 24670983A JP S60142784 A JPS60142784 A JP S60142784A
Authority
JP
Japan
Prior art keywords
character
line segment
character pattern
end point
singular line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58246709A
Other languages
English (en)
Inventor
Toshio Matsuura
松浦 俊夫
Katsuhiko Nishikawa
克彦 西川
Akira Inoue
彰 井上
Tomomitsu Murano
朋光 村野
Kiyoshi Iwata
清 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58246709A priority Critical patent/JPS60142784A/ja
Publication of JPS60142784A publication Critical patent/JPS60142784A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (発明の技術分野〕 本発明は手書きされたアルファ・ニューメリック文字に
おいて、文字と文字が接合されたものを分離するように
した文字分離方式に関する。
〔従来技術と問題点〕
従来の手書き文字認識技術は、−文字毎に決められた文
字枠内に書かれたものを認識するために、一定の文字枠
に書かれたものだけしか認識できなかった。しかも文字
枠内に書かれるため文字と文字との接合はなかった。
ところで論理回路図等では回路素子の名称や人力信号表
示等のために手書き文字でこれらの記号を表示している
。しかるに論理回路図をデータ処理装置に入力する場合
、この手書き文字部分が特別な文字枠内で書かれたもの
ではなく、文字間の連続部分が存在するためにこの手書
き文字を認識することができなかった。そのため従来で
は回路設計者が図面を作成する場合にこの手書き文字の
記号部分をパンチカードにデータとして入力し、カード
リーグでデータ処理装置に入力しなければならなかった
そのため回路設計者には図面の作成の外に手書き文字部
分をデータ入力しなければならないという負担がか\る
ので、この手書き文字部分を自動読取りできるような装
置の開発が要求されている。
〔発明の目的〕
本発明の目的は、このような手書き文字部分の認識に際
して必要な、文字枠という規定がなく書かれた文字列群
の中で文字と文字が接合したデータに対してこれを分離
して個々の文字を抽出することを可能とする文字分離方
式を提供することである。
〔発明の構成〕
この目的を達成するため、本発明の文字分離方式では、
接合された手書き文字を保持する手書き文字保持手段と
、この接合された手書き文字領域の文字量中心推定位置
より一定範囲内を走査して特異線分を抽出する特異線分
抽出手段と、この特異線分が文字バタンと接触する特異
線分終点を検出する特異線分終点検出手段と、この特異
線分終点により文字パタンを分離する文字分離処理部を
備え、接合された手書き文字バタンから1文字分の文字
パタンを分離するようにしたことを特徴とする。
〔発明の実施例〕
本発明を一実施例にもとづき詳述するに先立ち、その動
作原理を説明する。
(1)まず図面を走査して手書き文字グループを検出す
る。手書き文字グループは、パターンや線部分に比較し
て黒領域がある程度集合しているので容易に識別し、抽
出することがわかる。
(2)このようにして手書き文字グループを抽出後、第
1図(イ)に示す如(、これを水平方向に走査して、同
(ロ)に示す如く、その文字グループの高さく垂直方向
の長さ)Hと長さLをめる。
それから第1図(ロ)に示す如く、この領域を垂直方向
にスキャンして分離可能な文字を分離する。この結果、
第1図においてA、ESC,Dは個別に分離可能である
が、「4N」は接合しているので第2図(イ)に示す如
く、これが一つの単位として抽出される。
(3)ところで通常文字の大きさは、第1図(ハ)に示
す如く、その幅と高さの比は約2対3て′あるので、こ
の場合第2図(イ)の縦YWと横XWとの比率より2文
字が接合された場合に相当することが識別される。
(4)次に第2図(ロ)に示す如く、この文字領域の横
領域の中心線Cより閾値αの区域を定め、これを水平走
査して黒点と黒点とのはさまれた部分の中心位置を特異
線分としてめる。このときその一方または両方の側に黒
点領域が存在しないとき閾値αの枠部分と黒点間の中心
位置、または枠部分間の中心位置を前記特異線分とする
このようにして上の部分と、下の部分よりそれぞれ特異
線分をめるが、特異線分が複数本存在するときその中心
線Cに近いものを残す。
(5)この上の方からの特異線分と、下の方からの特異
線分が文字バタンと接したとき、第2図(ニ)に示す如
く、その中心線Cに近い接点により、この文字パタンを
分離する。
本発明の一実施例を第3図〜第5図にもとづき、第2図
を参照しつつ説明する。
図中、10は画像メモリ、11は矩形領域バ・ソファ・
メモリ、12は閾値保持レジスタ、13はアドレス制御
部、14は特異線分抽出部、15は特異線分終点検出部
、16は一文字分離処理部である。
画像メモリ10はビデオ入力信号が格納されるものであ
って原画像全体が保持されるものである。
矩形領域バッファ・メモリ11は、前記第2図(イ)に
示す如く、接続されたものとして判定されたデータが入
力されるバッファ・メモリである。
閾値保持レジスタ12は、第2図(ロ)に示す閾値αが
記入されるレジスタである。この閾値αはシュミレーシ
ョンにより決定されるが、例えばXWの幅の値の10〜
20%位に定められる。
アドレス制御部13は画像メモリ10から第2図(イ)
に示す領域を切り出して矩形領域バ・ソファ・メモリ1
1に格納したり、あるいは矩形領域バッファ・メモリ1
1に格納された文字バタンを読み出したり、中心線Cを
中心にそれぞれ左右αずつ領域を切り出す等の如きアド
レスを発生するものである。
特異線分抽出部14は前記閾値αで設定された領域内の
特異線分を抽出するものである。ここで特異線分は文字
パタンの中間点を示すものであるが、第4図に示す如く
、領域内においてβ1の部分は文字パタンか存在しない
ためその領域の中間点を示す■が特異線分となり、β2
の部分は文字パタンP2のみが存在するため、領域の左
端部分と文字パタンP2の左側部分の中間点を示す■と
、文字パタンP2の右側部分と領域の右端部分の中間点
を示す■′とが特異線分となる。そして13の部分では
文字パタンP1の右側と文字パタンP2の左側の中間点
を示す■と、領域の右端部分と文字パタンP1の左側の
中間点を示す■′および上記■゛とが特異線分となる。
そして特異線分が複数存在するとき、領域の中心線Cに
近いものを採用する。
特異線分終点検出部15は、特異線分と文字パタンの接
触する終点をめるものであり、例えば第5図に示す如く
、特異線分■と文字パタンPが接触する特異線分終点E
1及び特異線分■と文字パタンPとの接触する特異線分
終点E2をめるものである。なお、特異線分終点が上ま
たは下のそれぞれにおいて複数存在するとき、中心線C
に近いものと文字パタンとの特異線分終点を検出するこ
とになる。
一文字分離処理部16は接合されている文字パタンPを
分離処理するものであって上記特異線分終点E1および
β2のうちのいずれか中心線Cに近い方の特異線分終点
を通り中心線Cに平行な直線にもとづき文字パタンを分
離処理するものであって、第5図の例では特異線分終点
E1より垂下した直線りにもとづき文字パタンPを分離
するものである。
次に本発明の一実施例構成である第3図の動作について
説明する。
(a)画像メモリ10に入力されている画像データを、
図示省略した図形処理装置で処理し、第1図(ロ)に示
す如き文字バタン群を抽出し、これを上下方向に走査し
て分離できない幅が2文字分あるWの部分を検出する。
それからこの部分の文字パタンか接合しているのか否か
を検出するため、第2図(イ)に示すYW力方向走査に
より最初に文字パタンに接触する点Sを検出し、この点
Sより周知の方法でこの文字パタンの周辺を追跡してX
Wのほぼ全幅の範囲を通過して出発点である点Sに戻っ
たとき、このXWとYWの領域に接合された文字パタン
か存在するものと判断できる。
(b)このようにして第2図(イ)の領域に2文字のバ
タンか接合されているものと判断されたとき、この領域
を矩形領域バッファ・メモリー1に記入する。そして第
2図(ロ)に示す如く、この領域の中心線C−Cより閾
値保持レジスター2に記入されているαの範囲の領域を
定め、特異線分抽出部14により例えば第4図に示す如
き特異線分■、■、■・−をその上方と下においてめる
勿論この際、第4図の■′や■′の如き特異線。
分は特異線分■、■よりも中心線C−Cから遠くにある
ので、除外されることになる。
(C)次に特異線分終点検出部15により、前記第4図
のような処理結果により残された特異線分が、文字パタ
ンと接する点である、例えば第5図におけるEl、β2
を特異線分終点として検出する。
(d)そして−文字分離処理部16によりこの特異線分
終点El、β2のうち中心線C−Cに近い特異線分終点
E1において、線りにもとづき文字パタンPを分離する
このようにして分離された文字パタンを、それぞれ周知
の方法で辞書バタンと比較してこの分離した文字パタン
を認識することが可能となる。
なお上記説明ではアルファ・ニューメリック文字を例に
して説明したが勿論本発明はこれのみに限定されるもの
ではない。1つの文字が縦方向に分離していないもので
あれば分離することが可能であり、アルファ・ニューメ
リック文字は1つの文字に分離部分が存在しないので効
果的に分離することが、可能である。
0 しかも接合文字数は2文字のみに限定されるものではな
い。例えばその文字パタンの縦横の比より3文字の接合
と判定されたときは、その領域を3等分するような位置
に引いてその左右の閾値範囲を同等に処理すればよい。
〔発明の効果〕
本発明によれば接合した手書き文字パタンを比較的簡単
な手段により、正確に分離することができる。
【図面の簡単な説明】
第1図は文字パタンの説明図、第2図は接合文字パタン
の分離状態説明図、第3図は本発明の一実施例構成図、
第4図および第5図はその動作状態説明図である。 図中、10は画像メモリ、11は矩形領域バッファ・メ
モリ、12は闇値保持レジスタ、13はアドレス制御部
、14は特異線分抽出部、15は特異線分終点検出部、
16は一文字分離処理部である。 特許出願人 富士通株式会社 代理人弁理士 山 谷 晧 榮 1

Claims (1)

  1. 【特許請求の範囲】 1、接合された手書き文字を保持する手書き文字保持手
    段と、この接合された手書き文字領域の文字量中心推定
    位置より一定の範囲内を走査して特異線分を抽出する特
    異線分抽出手段と、この特異線分が文字バタンと接触す
    る特異線分終点を検出する特異線分終点検出手段と、こ
    の特異線分終点により文字バタンを分離する文字分離処
    理部を備え、接合された手書き文字バタンから1文字分
    の文字バタンを分離するようにしたことを特徴とする文
    字分離方式。 2、前記文字バタンかアルファ・ニューメリック文字で
    あることを特徴とする特許請求の範囲第1項記載の文字
    分離方式。
JP58246709A 1983-12-29 1983-12-29 文字分離方式 Pending JPS60142784A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58246709A JPS60142784A (ja) 1983-12-29 1983-12-29 文字分離方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58246709A JPS60142784A (ja) 1983-12-29 1983-12-29 文字分離方式

Publications (1)

Publication Number Publication Date
JPS60142784A true JPS60142784A (ja) 1985-07-27

Family

ID=17152469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58246709A Pending JPS60142784A (ja) 1983-12-29 1983-12-29 文字分離方式

Country Status (1)

Country Link
JP (1) JPS60142784A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6237786A (ja) * 1985-08-13 1987-02-18 Matsushita Electric Ind Co Ltd 文字切り出し装置
JPS6252687A (ja) * 1985-08-30 1987-03-07 Toshiba Corp 文字読取装置の文字検出切出し方式
JPS6361387A (ja) * 1986-09-02 1988-03-17 Hitachi Ltd 文字切り出し方法
JPS63142485A (ja) * 1986-12-05 1988-06-14 Mitsubishi Electric Corp 文字列パタ−ン切り出し方式
JPS6436385A (en) * 1987-07-31 1989-02-07 Matsushita Electric Industrial Co Ltd Character recognition device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56166587A (en) * 1980-05-28 1981-12-21 Toshiba Corp Character segmenting system
JPS5745676A (en) * 1980-08-29 1982-03-15 Fujitsu Ltd Cut-out system of character

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56166587A (en) * 1980-05-28 1981-12-21 Toshiba Corp Character segmenting system
JPS5745676A (en) * 1980-08-29 1982-03-15 Fujitsu Ltd Cut-out system of character

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6237786A (ja) * 1985-08-13 1987-02-18 Matsushita Electric Ind Co Ltd 文字切り出し装置
JPS6252687A (ja) * 1985-08-30 1987-03-07 Toshiba Corp 文字読取装置の文字検出切出し方式
JPS6361387A (ja) * 1986-09-02 1988-03-17 Hitachi Ltd 文字切り出し方法
JPS63142485A (ja) * 1986-12-05 1988-06-14 Mitsubishi Electric Corp 文字列パタ−ン切り出し方式
JPS6436385A (en) * 1987-07-31 1989-02-07 Matsushita Electric Industrial Co Ltd Character recognition device

Similar Documents

Publication Publication Date Title
US5751851A (en) Method of splitting handwritten input
Mullick et al. An efficient line segmentation approach for handwritten Bangla document image
JPS60142784A (ja) 文字分離方式
Lehal et al. A technique for segmentation of Gurmukhi text
JPH06180771A (ja) 英文字認識装置
JP2004046528A (ja) 文書方向推定方法および文書方向推定プログラム
JP2565150B2 (ja) 文字切り出し方法
JPH0713994A (ja) 文字認識装置
JP2728086B2 (ja) 文字切り出し方法
KR100286709B1 (ko) 영문자열에서의 개별문자 분리 방법
JPH07160810A (ja) 文字認識装置
JPS61190679A (ja) 文字デ−タ処理装置
KR930012142B1 (ko) 문서인식장치의 개별문자 절출방법
JPS63316288A (ja) 文字認識装置
JP2570415B2 (ja) 文字切り出し方法
JPH10162104A (ja) 文字認識装置
JPH03122786A (ja) 光学的文字読取装置
JPH07168911A (ja) 文書認識装置
JP2000181989A (ja) 文字認識装置及びその方法並びにその方法をプログラムとして記録したコンピュータ読み取り可能な記録媒体
JP3051628B2 (ja) 文字認識方法及び装置
JPS6160184A (ja) 光学的文字読取装置
JPS62293387A (ja) 文字切出し装置
KR980010860A (ko) 문자인식 시스템의 문자영역 구분방법
JPH0816720A (ja) 文字認識装置
JPS60159986A (ja) 光学的文字読取装置