JPH0715702B2 - 文字パターン切り出し装置 - Google Patents

文字パターン切り出し装置

Info

Publication number
JPH0715702B2
JPH0715702B2 JP60285021A JP28502185A JPH0715702B2 JP H0715702 B2 JPH0715702 B2 JP H0715702B2 JP 60285021 A JP60285021 A JP 60285021A JP 28502185 A JP28502185 A JP 28502185A JP H0715702 B2 JPH0715702 B2 JP H0715702B2
Authority
JP
Japan
Prior art keywords
area
separator
white
character
areas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60285021A
Other languages
English (en)
Other versions
JPS62144288A (ja
Inventor
文夫 依田
陽二 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP60285021A priority Critical patent/JPH0715702B2/ja
Publication of JPS62144288A publication Critical patent/JPS62144288A/ja
Publication of JPH0715702B2 publication Critical patent/JPH0715702B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、互に入りくんだ文字同士を分離して切り出す
文字パターン切り出し装置に関するものである。
〔従来の技術〕
第2図は、例えば特公昭57−51144号公報に示された従
来のこの種の装置の構成図である。図中1は用紙、2は
用紙1上に記入された文字列を光学的に走査して光電変
換する走査手段、3は光電変換された文字列のパターン
(以後、「文字列パターン」と呼ぶ)を記憶する文字列
パターン記憶手段、4は上記文字列パターンを上から順
に水平方向に走査して白画素が連続する領域(以後「白
領域」と呼ぶ)の左端と右端との座標を検出し記憶する
白領域検出手段、5は上記白領域検出手段4で検出した
白領域の情報に基づいて上下に隣接する白領域の連続性
を調べ、最上段から最下段に至るすべての走査間で互い
に連続する白領域の列を選択して記憶する連続性チェッ
ク手段、6は上記連続性チェック手段で選択した白領域
の列の情報に基づいて上記文字列パターン記憶手段に格
納した文字列のパターンから1文字ずつ文字パターンを
切り出して出力する文字分離手段である。
第3図(A)〜(C)は、第2図に示す従来装置の動作
列を説明するための図である。図中7は文字列パターン
「23」の例、8は白画素、9は黒画素、10は白領域の
例、11は選択された白領域の列の例、12と13は切り出す
領域の例である。
次に第3図(A)〜(C)を用いて第2図に示す従来の
この種装置の動作について説明する。
まず、用紙1上の文字列は走査手段2で光電変換され文
字列パターン記憶手段3に格納される。次に文字列パタ
ーン記憶手段3内の文字列パターン「23」7は白領域検
出手段4に渡される。
白領域検出手段4では、文字列パターン「23」7を左右
方向に走査して白画素が連続する白領域の左端と右端と
の座標を検出する。すなわち、上記文字列パターン「2
3」7に対して第1番目の走査では左端と右端との座標
がそれぞれx1とx3,x6とx8である白領域を検出する。同
様に、第3番目の走査における白領域,…,第10番目の
走査における白領域と順次検出していき上記文字列パタ
ーン「23」7から第3図B図の例に示すように各走査に
おける白領域10を求めて上記連続性チェッ手段5に送
る。
次に上記連続性チェック手段5では、上記白領域検出手
段4で検出した白領域の情報に基づいて最上段の走査か
ら最下段の走査に至るすべての走査間で互いに連続し合
う白領域を選択し、上記文字分離手段6に転送する。
すなわち、上記連続性チェック手段5は2つの白領域の
左端と右端との座標で示される区間に重なり合う領域が
あるか否かによつて白領域の連続性を判定するように構
成されている。そして、上記連続性チェック手段5では
まず第3図(B)に示した白領域10の情報に基づて第1
番目と第2番目との走査における白領域の連続性、第2
番目と第3番目との走査における白領域の連続性,…,
と順次チェックを行い隣接する走査間で連続する白領域
を検出していき、次に第1番目の走査における白領域か
ら第10番目の走査における白領域まで互いに連続し合う
第3図(C)の例に示す白領域の列11を選択する。
最後に、上記文字分離手段6では、上記連続性チェック
手段5で選択した第3図(C)の例に示す白領域11で分
離される領域12と領域13とに対応するパターンを上記文
字列パターン記憶手段3から読み出すことにより文字
「2」と文字「3」とを分離して切り出し外部装置へ出
力する。
〔発明が解決しようとする問題点〕
従来の文字切り出し装置は以上のように文字列パターン
から抽出した白領域の上下方向の連続性を調べ、最上段
から最下段に至るすべての走査間で互いに連続し合う白
領域で分離される領域を個々の文字領域として切り出す
ように構成されていたので、黒画素が8連結で連結して
いる領域(以後「黒連結成分」と呼ぶ)が複数個集つて
構成される文字(以後「分離文字」と呼ぶ)を含む文字
列から文字を切り出す場合は各連結成分毎に分離して切
り出されてしまうという問題点があつた。
例えば、第4図(A),(B)は分離文字「シ」を含む
文字列の従来装置の処理結果の例を示した図であり、図
中14は文字列パターン「ナシタ」の例、15は上記連続性
チェック手段5で上記文字列パターン「ナシタ」から選
択したすべての走査間で連続し合う白領域の列の例、16
〜20は文字列パターン「ナシタ」14から切り出す領域の
例である。
従来の装置では、第4図(A)に示す文字列パターン
「ナシタ」14から第4図(B)に示す上下に連続する白
領域15を検出し、この白領域15で分離される5つの領域
「ナ」16,「ヽ」17,「ヽ」18,「ノ」19,「タ」20をそれ
ぞれ文字領域として切り出す。
このように、従来の装置では分離文字のない数字などの
文字列からは個々の文字を正しく切り出すことが出来る
が分離文字を含む仮名,漢字などからなる一般の日本語
文字列から正しく文字を切り出せないという問題点があ
つた。
この発明は、上記のような問題点を解消するためになさ
れたもので、「シ」や「言」などの分離文字が入りくん
で重なり合う文字列からも個々の文字を正しく切り出す
ことが出来る装置を得ることを目的とする。
〔問題点を解決するための手段〕
このためこの発明にかかる文字切り出し装置は、第1番
目の走査線に沿つて得られた白領域は第1の走査のセパ
レータ領域とし、第2番目以降第n番目のセパレータ領
域は第n番目の白領域が第n−1番目のセパレータ領域
複数個と隣接する場合、第n番目の白領域と第n−1番
目のセパレータ領域が共通する領域として決定するセパ
レータ領域検出手段を設け、このセパレータ領域に基づ
いて文字パターンを切り出すことを特徴とするものであ
る。
〔作用〕
この発明にかかるセパレータ領域検出手段は、第1番目
の走査線に沿つて得られた白領域は第1の走査のセパレ
ータ領域とし、第2番目以降第n番目のセパレータ領域
は第n番目の白領域が第n−1番目のセパレータ領域複
数個と隣接する場合、第n番目の白領域と第n−1番目
のセパレータ領域が共通する領域として決定する。そし
て、このセパレータ領域に基づいて文字パターンを切り
出す。
〔実施例〕
以下図面を用いて詳細に説明する。
第1図は、この発明の実施例を示す図である。図中1〜
6は第2図に示した上記従来装置と同一のものである。
図中21は上記白領域検出手段4で検出した白領域の情報
に基づいてセパレータ領域を検出し記憶するセパレータ
領域検出手段である。
第5図は第4図(A)に示す文字列パターン「ナシタ」
14から白領域を検出した例を示す図であり、図中22は検
出した白領域の例である。
第6図は第4図(A)に示す文字列パターン「ナシタ」
14からセパレータ領域を検出した例を示す図であり、図
中23は検出したセパレータ領域の例である。
第7図は上記セパレータ領域検出手段でセパレータ領域
を検出するアルゴリズムを説明するための説明図であ
る。図中24〜26は第n−1番目の走査におけるセパレー
タ領域の例、27と28は第n番目の走査で得た白領域の
例、29〜31は第n番目の走査におけるセパレータ領域の
例である。
次に第4図(A)の例に示す文字列パターン「ナシタ」
14から文字を切り出す場合を例にとり、第5図〜第7図
を用いて第1図に示す実施例のセパレータ領域検出手段
までの動作を説明する。
まず用紙1上に記入された文字列は上記走査手段2で光
電変換され、この結果得た文字列パターン「ナシタ」14
は上記文字列パターン記憶手段3に渡される。
次に上記文字列パターン「ナシタ」14は上記白領域検出
手段4に渡される。また上記白領域検出手段4では上記
文字列パターン「ナシタ」を左右方向に走査して第5図
の例に示す白領域22を検出し、この白領域22の左端と右
端との座標を上記セパレータ検出手段21に転送する。
上記セパレータ領域検出手段21では、上記白領域検出手
段4で検出した白領域22の情報に基づいて各走査におけ
るセパレータ領域を順次決定していく。すなわち、まず
第1番目の走査で得た白領域の左端と右端との座標で示
される領域を第1番目の走査のセパレータ領域として記
憶する。次に、上述の如く求めた第1番目の走査のすべ
てのセパレータ領域と第2番目の走査で得た各白領域と
の連続性を調べ、第1番目の走査における複数個のセパ
レータ領域と連続している第2番目の走査の白領域が検
出された場合はこの白領域を上記複数個のセパレータ領
域に対応させて分割してこの各領域を第2番目の走査に
おけるセパレータ領域として決定し、第1番目の走査に
おける複数個のセパレータ領域と連続してない第2番目
の白領域が検出された場合この白領域を1つのセパレー
タ領域として決定する。以下同様に、第3番目の走査に
おけるセパレータ領域から第10番目の走査におけるセパ
レータ領域と順次決定し、第6図の例に示すセパレータ
領域23を検出する。
次にセパレータ領域の抽出方法を例を用いて更に詳しく
説明する。例えば、第7図は第n−1番目の走査におけ
るセパレータ領域と第n番目の走査で得た白領域との情
報から第n番目の走査でのセパレータ領域を検出する例
を示した図である。第7図において第n番目の走査で得
た白領域27は、第n−1番目の走査における1つのセパ
レータ領域24とのみ連続する。そこで白領域27を第n番
目の走査のセパレータ領域29として決定し、その左端と
右端との座標を記憶する。また、第n番目の走査での白
領域28は第n−1番目の走査のセパレータ領域25とセパ
レータ領域26との2つのセパレータ領域と連続してい
る。これはセパレータ領域25とセパレータ領域26との間
に存在する領域に分離文字の一部である黒連結成分が存
在する場合に発生する現象である。そこで、上記セパレ
ータ領域検出手段21は第n番目の走査の白領域28と第n
−1番目の走査の2つのセパレータ領域25と26との共通
する領域を求めて白領域28を分割し、これを第n番目の
セパレータ領域30とセパレータ領域31として決定する。
そして、それぞれのセパレータ領域の左端と右端との座
標を記憶する。
このように複数個と隣接する場合にのみ共通領域をセパ
レータ領域とすることにより、分離文字に対してのみそ
の分離部分を連結させる作用を有し、入りくんで重なり
合う文字間を連結してしまうような不具合が生じない。
例えば、第5図の第4番目の走査におけるx15,x16の白
領域はその前の走査の白領域と1つしか隣接していない
ので第6図に示すようにそのままセパレータ領域とな
り、「シ」と「タ」が連結してしまうことはなく、正し
く切り出せる。また、分離文字ではないが、第3図の文
字列を含むような場合でも、第9番目の走査におけるx7
〜x12の白領域はその前の走査の白領域と1つしか隣接
していないのでそのままセパレータ領域となり、「2」
と「3」が連結してしまうことはなく、正しく切り出せ
る。
以上の如く第1図に示す実施例のセパレータ領域検出手
段21で求めた各走査におけるセパレータ領域の情報は、
次に上記連続性チェック手段5に転送される。そして上
記連続性チェック手段5では、従来の装置と同様に上下
の走査間におけるセパレータ領域の連続性をチェックし
最上段から最下段に至るすべての走査間で互いに連続し
合うセパレータ領域を選択する。例えば、第8図は、第
6図の例に示したセパレータ領域23から上記連続性チェ
ック手段5で選択したセパレータ領域の列の例を示す図
であり、図中32と33は選択したセパレータ領域の列、34
〜36はセパレータ領域32と33とで分離される領域であ
る。
最後に、上記文字分離手段6は、上記連続性チェック手
段5で選択した第8図のセパレータ領域の列32と33とで
分離される領域34〜領域36に対応するパターン「ナ」,
「シ」,「タ」を上記文字列パターン記憶手段3から読
み出して外部装置に出力する。
なお、上記実施例では、カタカナの文字列から文字を切
り出す場合について説明したが、この発明はこれに限ら
ず英字、平仮名、漢字等が混在した文字列から文字を切
り出す場合に用いてもよい。
また、上記実施例では横書きの文字列から文字を切り出
す場合について説明したが、これに限定するものではな
く縦書きの文字列から文字を切り出す場合に用いてもよ
い。
〔発明の効果〕
以上説明したようにこの発明にかかる文字切り出し装置
は、第1番目の走査線に沿つて得られた白領域は第1の
走査のセパレータ領域とし、第2番目以降第n番目のセ
パレータ領域は第n番目の白領域が第n−1番目のセパ
レータ領域複数個と隣接する場合、第n番目の白領域と
第n−1番目のセパレータ領域が共通する領域として決
定するセパレータ領域検出手段を設け、このセパレータ
領域に基づいて文字パターンを切り出すので、「シ」な
どの分離文字を含む入りくんで重なり合う文字列から個
々の文字を正しく切り出すことのできる装置が得られる
効果がある。
【図面の簡単な説明】
第1図は、この発明の一実施例の構成を示すブロック
図、第2図は、従来装置の構成を示すブロック図、第3
図(A),(B),(C)と第4図(A),(B)は従
来装置の動作の例を説明するための図、第5図,第6
図,第8図はこの発明の装置の動作の例を説明するため
の図、第7図はセパレータ領域を検出するアルゴリズム
を説明する図である。 図中1は用紙、2は走査手段、3は文字列パターン記憶
手段、4は白領域検出手段、5は連続性チェック手段、
6は文字分離手段、21はセパレータ領域検出手段であ
る。 なお図中同一あるいは相当部分には同一符号を付して表
示してある。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】用紙などに記入されている文字列を光学的
    に走査し、走査線に沿って画素を白領域と黒領域に分け
    て1文字づつ文字パターンを切り出す文字パターン切り
    出し装置において、第1番目の走査線に沿って得られた
    白領域は第1の走査のセパレータ領域とし、第2番目以
    降第n番目(nは整数)の走査線に対しては、第n番目
    の走査線によって得られた各白領域について第n−1番
    目のセパレータ領域との連続性を調べ、第n番目の1つ
    の白領域が第n−1番目のセパレータ領域複数個と隣接
    する場合、第n番目の前記1つの白領域と前記隣接した
    第n−1番目のセパレータ領域が共通する領域をセパレ
    ータ領域として決定し、第n番目の1つの白領域が第n
    −1番目のセパレータ領域1つのみと隣接する場合、第
    n番目の前記1つの白領域をセパレータ領域として決定
    するセパレータ領域検出手段を設け、このセパレータ領
    域に基づいて文字パターンを切り出すことを特徴とする
    文字パターン切り出し装置。
JP60285021A 1985-12-18 1985-12-18 文字パターン切り出し装置 Expired - Lifetime JPH0715702B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60285021A JPH0715702B2 (ja) 1985-12-18 1985-12-18 文字パターン切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60285021A JPH0715702B2 (ja) 1985-12-18 1985-12-18 文字パターン切り出し装置

Publications (2)

Publication Number Publication Date
JPS62144288A JPS62144288A (ja) 1987-06-27
JPH0715702B2 true JPH0715702B2 (ja) 1995-02-22

Family

ID=17686126

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60285021A Expired - Lifetime JPH0715702B2 (ja) 1985-12-18 1985-12-18 文字パターン切り出し装置

Country Status (1)

Country Link
JP (1) JPH0715702B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6337489A (ja) * 1986-08-01 1988-02-18 Hitachi Ltd 文書文字切り出し画像処理方式

Also Published As

Publication number Publication date
JPS62144288A (ja) 1987-06-27

Similar Documents

Publication Publication Date Title
RU2437152C2 (ru) Устройство обработки изображений, способ и компьютерная программа обработки изображений
JPH0721320A (ja) 自動スクリプト決定装置
US5265171A (en) Optical character reading apparatus for performing spelling check
US4769849A (en) Method and apparatus for separating overlapping patterns
JPH0821057B2 (ja) 文書画像解析方式
JPH0715702B2 (ja) 文字パターン切り出し装置
JPH011087A (ja) 行及び文字分離装置
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
JP2559356B2 (ja) 文書画像処理方法
JPH0564396B2 (ja)
JPS63304387A (ja) 文書読取装置
JP4866184B2 (ja) 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JPH03142691A (ja) 表形式文書認識方式
JP2722549B2 (ja) 光学文字読取装置
JPH0514952B2 (ja)
JPS63137383A (ja) 文字読取装置
JPH0697470B2 (ja) 文字列抽出装置
JPS592189A (ja) 文字認識装置
JPH05166000A (ja) 文書画像の領域抽出方法
JP2687902B2 (ja) 文書画像認識装置
JPH06150056A (ja) 表認識装置
JPS60201480A (ja) 文字読み取り方式
Sugawara Document reading system for the visually disabled
JPS63143685A (ja) 文字認識装置における認識結果表示方法
JPS63204486A (ja) 文字入力装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term