JPH07319998A

JPH07319998A - 文字切り出し方法

Info

Publication number: JPH07319998A
Application number: JP7109774A
Authority: JP
Inventors: Mikio Aoki; 三喜男青木
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1988-04-28
Filing date: 1995-05-08
Publication date: 1995-12-08
Anticipated expiration: 2011-12-18
Also published as: JP2565150B2

Abstract

(57)【要約】【目的】隣どうしの文字が接触した文字画像等から、一
つ一つの文字を正確に切り出す方法を提供することを目
的とする。【構成】光学的画像入力手段により紙面等に書かれた
文字画像を読み取り、入力された画像データ中の文字を
認識する文字認識装置の文字切り出し方法において、行
方向の周辺分布より文字の標準文字高及び最低線幅を推
定し、行方向と垂直な方向の周辺分布より、標準文字間
隔、単語間隔及び標準文字幅を推定し、標準文字間隔及
び単語間隔と、行方向と垂直な方向の周辺分布とを比較
することにより単語の抽出を行ない、行方向と垂直な方
向の周辺分布より文字切り出し候補位置を推定する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、紙面上に書かれた文宇
を画像として入力することにより、文字画像から文字領
域を捜し出し、コード番号に変換する文字認識装置の文
字切り出し方法に関する。

【０００２】

【従来の技術】近年、文字認識装置の急激なる進歩によ
り、さまざまな文書画像から文字領域を自動的に抽出
し、さらに一つ一つの文字を切り出し、認識し、自動的
に文字ファイルが作成できるようになってきており、文
字の切り出し方法はさまざまな方法が考え出されてきて
いる。

【０００３】例えば一般に多く用いられている方法に抽
出文字行の縦方向の周辺分布を計数する方法がある。

【０００４】例えば、図４（ａ）に示す様な抽出文字行
の縦方向の周辺分布を計数すると図４（ｂ）に示すよう
な分布を得る。（図４（ｂ）は、文字画像の存在か否か
のみを示す）該分布の値により、文字の存在位置を知る
ことが可能となり、一文字一文字の文字の切り出しを行
っていた。また、抽出文字行が図４（ｃ）に示す様な周
辺分布の重なった文字においては、複数文字と判断した
場合に文字ピッチにより文字の切れ目を推定して、強制
的に文字の切り出しを行っていた。

【０００５】

【発明が解決しようとする課題】しかしながら、この様
な方法で文字の切り出しを行う場合、対象文字画像が、
図４（ａ）に示す様な定ピッチの文字画像においては正
確に文字の切り出しが可能であるが、図４（Ｃ）に示し
た様な文字画像、図５（ａ）に示した様な文字画像、図
ｌ１（ａ）に示した様な文字画像においては、正確な文
字の切り出しは不可能である。図４（Ｃ）の文字画像、
図５（ａ）の文字画像、図ｌ１（ａ）の文字画像、どれ
も文字ピッチ不定のプロポーシヨナル文字である。従っ
て、従来の方法の様に単に縦方向の周辺分布より文字位
置及び文字ピッチを推定することができない。

【０００６】図４（Ｃ）により従来の方法にて文字の切
り出しを行おうとした場合について述べる。図４（Ｃ）
は、図４（ａ）と同ーフォントの文字画像である。図４
（ａ）が文字ピッチー定なのに対し、図４（ｃ）は文字
ピッチ不定のプロポーシヨナル文字である。既文字画像
の縦方向の周辺分布図４（ｄ）に着目すると、殆どの部
分で図４（ａ）の周辺分布図４（ｂ）とほぼ同じである
が、ＹＯの周辺分布に相当する部分が異なる。図４
（ｄ）は、Ｙの周辺分布と０の周辺分布が重なってしま
っている。従って該周辺分布からは、Ｙと０を一つの文
字として判断してしまうか、あるいは実際と異った場所
で切り離してしまう。今、仮に二つの文字と判断して強
制的に二つの文字に分けようとした場合、文字ピッチに
着目すると、図１２に示す１２０１で文字画像を分離
し、周辺分布の形状に着目すると、１２０２で文字画像
を分離してしまう。１２０１、１２０２どちらの位置で
文字画像を分離しても、Ｙか０の文字の途中で切れ、別
の文字と一緒に抽出されてしまい、正確な文字の抽出は
不可能である。

【０００７】次に図５（ａ）に示した文字画像より、従
来の方法により文字の切り出しを行う場合について述べ
る。図５（ａ）はｍ１ｉｌｌｉｏｎという７つの文字に
より構成される単語である。該単語の縦方向の周辺分布
を計数すると図５（ｂ）に示す様に、ｍ，ｉ，ｌ，ｌ，
ｉの５つの文字の周辺分布５０１、５０２、５０３、５
０４、５０５は連なって一つの周辺分の固まりとなって
いる。従って、該周辺分布からは簡単に文字の切れ目を
推定することは不可能である。文字ピッチにより文字の
切り離しを行おうとすると、ｉ，ｌ等の文字は標準文字
幅の半分の大きさであるので、二つの文字で一つの文字
と判断して一緒に切り出される可能性が大きい。また、
周辺分布の形状で判断して切り離すと、ｉ，ｌ等の文字
はうまく切り離せるかもしれないが、文字ｍを分解する
可能性が大であり、文字の切り出しの信頼性が極めて小
さい。

【０００８】また、図１１（ａ）に示した文字画像の場
合も、図５の場合と同様に周辺分布の形状のみからは文
字の正確な切り出しは不可能である。

【０００９】そこで本発明は以上の様な課題を解決する
もので、その目的とするところは、隣どうしの文字が接
触した文字画像、周辺分布が重なった文字画像、文字ビ
ッチが一定でない文字画像から一つ一つの文字を正確に
切り出す方法を提供することにある。

【００１０】

【課題を解決するための手段】本発明の光学的画像入力
手段により紙面等に書かれた文字画像を読み取り、入力
された画像デー夕中の文字を認識１コード番号に起き換
える文字認識装置における文字切り出し方法は、行方向の周辺分布より文字の標準文字高及び線の太さ
を推定し、行方向と垂直な方向の周辺分布より、標準文字間隔、
単語間隔及び標準文字幅を推定し、単語の抽出を行い、前記周辺分布より文字切り出し候補位置を推定し、前記抽出単語中の文字の切り出しは文字の連結成分の
輪郭を抽出すると同時に、文字高及び文字幅を抽出し、文字幅が標準文字幅から許容できる大きさを越える場
合には、前記文字切り出し候補位置の範囲内にて再度輪
郭の抽出を行い、前記文字切り出し候補位置が存在しない場合いには行
方向と垂直な方向の周辺分布により文字切り出しの範囲
を決め再度輪郭の抽出を行い、該輪郭に囲まれた領域の内側のみを抽出することによ
り文字の切り出しを行うことを特徴とする。

【００１１】文字の標準文字高は、行方向の周辺分布の
形に着目し、周辺分布が急激に変化して大きくなってい
る部の幅を標準文字高とし、該標準文字高の大きさよ
り、文字線の最低線幅を推定することを特徴とする。

【００１２】行方向と垂直な方向の周辺分布で文字の存
在しない部分の大きさの統計をとることにより、標準文
字間隔及び単語間隔を推定することを特徴とする。

【００１３】行方向と垂直な方向の周辺分布で、周辺分
布の値が前記最低線幅より大きい部分の大きさの統計を
とることにより、標準文字幅を推定することを特徴とす
る。

【００１４】標準文字幅の惟定は、前記統計で、標準文
字高の７５％よりも大きい領域において、標準文字高に
最も近い固まりの最大値とすることを特徴とする。

【００１５】前記統計中の固まりの分類は、固まりと固
まりとの距離が、標準文字高に比例したある値以下であ
れば同一の固まりとみなすことを特徴とする。

【００１６】前記標準文字間隔及び単語間隔と、行方向
と垂直な方向の周辺分布とを比較することにより単語の
位置の抽出を行うことを特徴とする。

【００１７】行方向と垂直な方向の周辺分布で、周辺分
布の値が前記最低線幅より小さい部分の、各々の中心部
分を文字切り出し候補位置とすることを特徴とする。

【００１８】抽出文字幅より連結文字と判断した場合、
前記文字切り出し候補位置を優先に切り出すことを特徴
とする。

【００１９】周辺分布の値より文字切り出し位置を推定
する場合、１／２文字幅付近及びｌ文字幅付近で最も周
辺分布の値の小さいところを求めることを特微とする。

【００２０】文字の輪郭に囲まれた領域の抽出は、原画
像と同じ大きさの画像領域を設け、該画像領域に文字の
輪郭を描き、輪郭の内側を塗りつぶした後に原画像との
共通部分をとることにより、対象文字のみを抽出するこ
とを特徽とする。

【００２１】

【実施例】以下本発明について実施例に基づいて詳細に
説明する。

【００２２】本発明の文字切り出し手段が構成要素とな
る文字認識装置は、図１のプロック図に示す様に、ＣＰ
Ｕ１０１、画像入力装置１０２、認識文字表示装置１０
３、ＲＯＭ１０４、ＲＡＭ１０５により横成されてい
る。

【００２３】以下、画像入力装置ｌ０２によりＲＡＭｌ
０５に読み込まれた文字画像中よリーつ一つの文字を切
り出す本発明の文字切り出し方法を図２に示すフローチ
ャー卜に基づいて詳細に説明する。

【００２４】画像入力装置１０２によりＲＡＭ１０５に
読み込まれた文字画像を図３（ａ）とする。本発明にお
いては、まず最初に行方向の周辺分布を計数する。文字
画像図３（ａ）の行方向の周辺分布を計数すると図３
（ｂ）の３０１の様な形状の周辺分布を得る。欧米文字
は、図３（ａ）のｄに相当する文字高の大きな文字、ｅ
に相当する文字高の小さな文字、ｙに相当する文字高は
大きいが文字位置が低い文字の３種類め文字から構成さ
れている。従って、該３種類の文字から構成されている
文字画像の行方向の周辺分布を計数すると、通常図３
（ｂ）に示す３０１の様な形状の周辺分布となる。該周
辺分布３０１は、３１１，３１２，３ｌ３の三つの領域
が合わさってできており、文字画像によっては、３１２
の領域あるいは３１３の領域が存在しない場合がある。
しかしながら、３１１の領域は常に存在し、該領域の幅
３０４は、文字高の小さな文字の高さ（以下標準文字高
と呼ぶ）に相当する。従って、周辺分布の形状に着目す
ることにより標準文字高３０４を知ることが可能とな
る。また、印刷欧米活字は、標準文字高と文字線の太さ
との間に通常標準文字高：文字線の太さ≧１６：１の関係が成り立つ。従って、文字画像の垂直方向の周辺
分布に着目した場合、周辺分布の値が標準文字高の１／
１６よりも低い値の部分は文字のひげ部分であり、ある
いは、文字が接触している部分であると判断できる。こ
こで、判断の基準となる標準文字高の１／１６の値を最
低線幅として求めておく。

【００２５】次の段階として、文字行の垂直方向の周辺
分布により標準文字間隔、単語間隔及び標準文字幅を求
める。まず最初に、文字行と垂直な方向に投影した場
合、文字画像が存在するか否かのデータを求める。文字
画像を図４（ａ）とした場合、文字画像が存在するか否
かのデータすなわち文字画像と垂直の方向に投影したデ
ータは図４（ｂ）である。領域４０１は文字画像が存在
する部分、領域４０２は文字画像が存在しない部分、す
なわち文字間隔に相当する部分である。該文字が存在し
ない部分４０２の統計をとると図６（ａ）の様になる。
同様に、文字画像図４（ｃ）の投影したデータ図４
（ｄ）の文字画像が存在しない部分４０２の統計をとる
と図６（ｂ）の様になる。図６（ａ）、図６（ｂ）の実
線で示されたデータは、図４（ｂ）、図４（ｄ）のデー
タをそれぞれ示すが、一般に文字間隔のヒストグラムは
図６（ａ）、図６（ｂ）に示した点線で示される傾向に
なる。該２つのヒストグラムは、それぞれ２つの固まり
に分けることが可能である。該固まりは一つは文字間隔
の固まり、もう一つは単語間隔の固まりと判断すること
ができる。従って、文字間隔の統計により標準文字間隔
及び単語間隔を推定することが可能となる。一般に文字
間隔のヒストグラムは図６の様なヒストグラムになるが
時として図８の様なヒス卜グラムを得ることがある。該
ヒス卜グラムにはデータの固まりがいくつもある。この
様に固まりが多く存在する場合には、次の方法にて固ま
りを分類する。印刷欧米文字は通常規則正しく並んで印
刷されている。

【００２６】したがって、文字間隔はほぼ等しいはずで
あるが時として文字の形により文字間隔が異なる場合が
生じる。しかしながらその問隔は、標準文字高に比例し
たある値以上にちらばることは無い。したがって、本発
明では、標準文字高の１／１６を固まりと固まりの距離
のしきい値８０５とした。該しきい値８０５と、固まり
８１１、８１２、８１３、８１４、８１５の間隔８０
１、８０２、８０３、８０４とを比較することにより、
固まり８１１と８ｌ２は同一の固まり、固まり８１３と
８１４と８ｌ５は同一の固まりと判断でき、標準文字問
隔及び単語間隔の推定が可能となる。

【００２７】次に文字画像の標準文字幅を推定する。標
準文字幅を推定できれば、文字の切り出し時において連
結文字かの判断及び、切り出し候補位置を推定する手掛
りとなる。標準文字幅の推定は、標準文字間隔及び単語
間隔の推定と同様に文字領域の統計をとる。仮に文字画
像が図４（ａ）及び図４（Ｃ）の場合、文字幅の統計は
図７（ａ）及び図７（ｂ）の実線の様になり、一般的に
点線で示した傾向のデー夕を得る。図７（ａ）に示した
データは固まりが一つであるため該固まりの最大値を標
準文字幅とすることができる。図７（ｂ）に示したデー
タにおいては、固まり７０２と固まり７０３の２つの固
まりが存在する。通常印刷欧米文字は標準文字幅は標準
文字高に非常に近い値であるので、標準文字高７０１の
付近の固まり７０２の最大値を標準文字幅とすることが
可能となる。また文字間隔の推定時と同様に時としてヒ
ス卜グラムが多くの固まりからなる場合図９において
は、固まりと固まりの距離９０１、９０２、９０３とし
きい値９０４とを比較することにより固まり９ｌｌ、固
まり９１２及び固まり９１３は同一の固まりと判断する
ことが可能である。さらに、固まりと固まりの間のしき
い値でもって多くの固まりを分類しても、図１０の様な
３つの固まりになることがある。統計の結果が図１０の
様になるのは、文字画像中にｉやｌ等の文字が含まれて
いるからである。そこで、本発明では、ｉやｌ等の固ま
り１００１の最大値を標準文字幅と判断しない様に、標
準文字幅の７５％の位置１００４よりも大きい領域にお
いて固まりの最大値を捜す。こうすることにより標準文
字幅の約半分の大きさのｉやｌの固まりを除外し、正確
に標準文字幅を推定することを可能にした。以上の様に
して通常の文字画像の文字幅の推定は可能となるが、文
字画像の中には図５（ａ）に示した様な文字画像が存在
する。該文字画像は、ｍ，ｉ，ｌ，ｌ，ｉ，Ｏ，ｎの７
つの文字より横成されており、そのうちｍ，ｉ，ｌ，
ｌ，ｉの５の文字が接触している。従って、標準文字幅
の推定のために縦方向の周辺分布を計数しても、標準文
字幅の推定は不可能である。そこで本発明では、印刷欧
米文字において、文字線幅は標準文字高に比例したある
値以上の太さを持ち、図５（ａ）に見られる底辺部のひ
げの部分は該ある値よりも細い線であることに着目し、
縦方向の周辺分布図５（ｂ）を計数した後、標準文字高
に比例したある値５０８でもって周辺分布を切り捨てる
過程を設ける。該過程により、ある値５０８よりも周辺
分布の値が大きくなる部分のみを文字領域と判断して、
文字領域を表示すると図５（ｃ）に示す様になる。５１
１、５１２、５１３、５１４、５１５、５ｌ６、５ｌ７
はそれぞれｍ，ｉ，ｌ，ｌ，ｉ，ｏ，ｎの文字位置及び
文字幅を示す。５ｌ１〜５ｌ７の７つのデータは、実際
の文字幅よりも多少小さめではあるが、文字として必要
な情報の部分は必ず含んでおり、これらの領域を文字領
域と判断することが可能となる。従って、該データ図５
（ｃ）の文字領域の統計をとることにより、標準文字幅
の推定が可能となる。

【００２８】次に文字画像より単語の抽出を行う。単語
の抽出は前記標準文字間隔及び単語間隔と、文字行の垂
直方向の周辺分布とを比較する（文字画像が図４（ａ）
の場合周辺分布は図４（ｂ）ｒすることにより、その文
字の存在していない部分の大きさから単語間隔を見つけ
ることが可能となり、文字画像中からの単語の抽出が可
能となる。

【００２９】次に該抽出単語から一文字一文字の抽出を
連結成分を抽出することにより行うわけであるが、ここ
でまた一つ問題がある。今仮に抽出単語が図５（ａ）の
様な文字画像であるとする。この場合、連結成分の抽出
を行うとｍｉｌｌｉの５つの文字を抽出してしまう。該
抽出文字はその文字幅から連結文字と判断し、途中で強
制的に切り離さなければならない。該切り離し位置は、
通常、標準文字幅付近の周辺分布の値の小さいところで
行われる。ところが、図５（ａ）の場合、ｍやｉ，ｌと
いった文字が含まれている。この様な文字においては、
ｉやｌの文字は標準文字幅の半分の幅であるため、二文
字連なると一文字分の幅となり二文字一緒に切り出され
てしまい、またｍの場合、標準文字幅の付近において一
度周辺分布の値がかなり小さくなっているため文字の切
れ目と判断され途中で切り離されてしまう可能性が非常
に大きい。そこで本発明は、図５（ｂ）の周辺分布で標
準文字高に比例したある値５０８以上の領域図５（ｃ）
の文字位置５１１一５ｌ７の文字と文字の中間点５２１
〜５２６を求める。切り出し候補位置とする。該切り出
し候補位置５２１〜５２６は図５からも明らかな様に文
字と文字の境を表わしている。従って、文字の切り出し
時において、文字の大きさが標準文字幅から許容できる
大きさよりも大きい場合には該位置を用いることにより
文字の切り出しが可能となり、間違った位置での文字の
切り出しが極めて滅少する。

【００３０】次に一文字一文字の文字の抽出を行う。本
発明においては、文字の抽出は連結成分を抽出すること
によって行っている。欧米文字は、殆どの文字が一つの
連結成分であり、連結成分が一つでない文字において
も、主な連結成分のみでたいていの文字は判断できるた
め該方法は効果的である。連結成分の抽出は、最初に連
結成分の輪郭を抽出する。輪郭を抽出することにより、
文字の位置及び大きさの情報が得られる。輪郭の抽出が
行われると既に求められた標準文字幅と、該抽出文字幅
とを比較する。抽出文字幅が標準文字幅より許容できる
大きさである場合には、該抽出文字を一文字と判断１文
字を抽出する。抽出文字幅が標準文字幅より許容できな
い大きさの場合には、先ず、該抽出領域中に切り出し候
補位置が存在するか否かを調べる。もし、切り出し候補
位置が存在していれば、該位置において文字を切り出す
のが最も適切であるため該位置の範囲内において再度連
結成分の文字の輪郭の抽出を行う。また、文字画像が図
１１（ａ）の様な文字画像であった場合、（この文字画
像においては、標準文字高に対する一定の大きさｌｌ１
０よりも周辺分布の小さい領域の中問点は１１２１〜１
１２５の５箇所しか存在しない。しかしながら、文字は
９文字存在する。）文字画像ｌ１５２の輪郭抽出を行う
と、標準文字幅より許容できない文字幅と判断される。
そこで、切り出し候補位置の存在を確認する。しかし文
字画像１１５２の周辺分布１１４２は最低線幅１１１０
よりも小さくなる値を文字の途中にもっていないので切
り出し候補位置は存在しない。この場合、抽出文字の周
辺分布ｌ１４２の標準文字幅付近の値に着目する。それ
により、文字ｐとｒの接触部分１１３１を捜すことが可
能となリー文字一文字の文字の切り出しが可能となる。
同様に切り出しを繰り返して図１１においては、ｌ１２
１〜１ｌ２５の５箇所の切り出し候補位置の他に、１１
３１〜１１３３の３箇所の切り出し位置を抽出し、９つ
の文字を正確に切り出すことが可能となる。また本発明
は、文字の連結成分の輪郭を抽出した後、抽出文字幅が
一文字幅である場合には文字の抽出を行う方法であるの
で、例えば図ｌ２（ａ）の様な文字画像においても何の
問題も無く文字の抽出を行える。該文字画像はＹ，ｏ，
ｕという３つの無接触の文字である。しかしながら周辺
分布図１２（ｂ）においては、Ｙと０の周辺分布が重な
って１つの周辺分布１２０３を形成している。ここで従
来の様に該周辺分布ｌ２０３の形状から文字を強制的に
切り離そうとするとｌ２０２の位置で切り離すことにな
り、また、周辺分布の大きさにより切り離そうとすると
ｌ２０１の位置で切り離すことになってしまう。いずれ
の位置にせよ、文字を不適切な位置で切り離してしまう
結果になるが、本発明において全く問題は生じない。

【００３１】文字の連結成分の輪郭抽出が適当な大きさ
で行われた後は、文字の連結成分の抽出を行う。本発明
においては、字画像と同じ大きさの領域をもう一つ設け
てある，図１３（ａ）の文字画像１３０１よりＰという
文字を抽出するにあたって先ず図１３（ａ）のＰという
文字の輪郭を別の領域１３０２に描く。次に該輪郭によ
って囲まれた領域をぬりつぶし、図１３（ｂ）を得る。
この後、原画像図１３（ａ）と抽出文字領域の現像図１
３（ｂ）との共通部分を抽出することにより図１３
（Ｃ）に示した画像を得る。該画像図１３（Ｃ）を見て
わかる様に、位置的に重なっているＰとｅの画像から、
Ｐの画像のみをきれいに抽出することが可能となってい
る。

【００３２】以上述べた様に本発明によれば、行方向の
周辺分布により標準文字高及び最低線幅を求め、該値を
参考に標準字間隔及び単語間隔、標準文字長を求めるの
で、正確な標準文字間隔及び単語間隔、標準文字長が求
まる。その結果、正確な単語切り出しが可能となる。ま
た、文字切り出し時においては、標準文字幅と比較しな
がら、切り出し候補位置及び周辺分布を参考に文字の切
り出しを行うので、正確な位置での文字の切り出しが可
能となった。さらに、文字の切り出しは、文字の連結成
分の輪郭に囲まれた領域の画像を抽出するので、周辺分
布では重なって切り出し位置がわからない文字画像から
でも正確に一文字のみを抽出することが可能となった。

【００３３】以上のように本発明により、今まで困難と
されていた一文字一文字の文字の切り出しをより正確に
行うことを可能にしたので、該方法を構成要素に用いる
文字認識装置の信頼性を大幅に向上させることが可能と
なった。

【００３４】また本発明は、標準文字高及び文字の連結
成分の抽出を用いているので、特に印刷欧米文字等に適
したものである。

【００３５】

【発明の効果】以上述べた様に本発明は次にあげる多く
の効果を有し、文字認識装置の信頼性を多いに向上させ
るものである。

【００３６】行方向の周辺分布を計数し、該周辺分布の
形状より標準文字高及び最低線幅を推定することによ
り、行方向と垂直な方向の文字領域をより正確に求める
ことを可能とし、文字切り出し候補位置を求めることを
可能とした。また、標準文字間隔及び単語間隔、標準文
字長を正確に求めることを可能とした。

【００３７】行方向と垂直な方向の周辺分布で文字の存
在しない部分の統計をとることにより正確な標準文字間
隔及び単語間隔が求まりその結果正確な単語の抽出を可
能にした。

【００３８】行方向と垂直な方向の周辺分布で、標準文
字高に比例したある大きさ以下の領域の統計をとること
により正確な標準文字長が求まり、また該領域の中心を
切り出し候補位置とすることにより、正確な位置での文
字の切り離しを可能にした。

【００３９】標準文字幅の推定時においては、標準文字
高の７５％より大きい領域の固まりの最大値を求めるこ
とによって、文字幅が半分の文字の固まりを誤って選ぶ
可能性を無くし、また、固まりと固まりとの間隔が標準
文字高に比例したある値以下であれば同一の固まりとみ
なすので正確に固まりの分類ができ、その結果正確に標
準文字幅、標準文字間隔及び単語間隔が推定できる。

【００４０】文字の切り出しは、文字の輪郭の内側の領
域のみを抽出するので、縦方向の周辺分布においては切
り出し位置のわからない文字画像であっても正確に対象
の文字のみを抽出することが可能である。

【００４１】文字抽出時において、抽出文字幅が標準文
字幅の許容できる大きさを越えている場合、先ず切り出
し候捕位置を確認し、切り出し候補位置が存在しない場
合のみ周辺分布の値より切り出し位置を求めているの
で、周辺分布の値のみでは間違った位置で切り離してし
まう文字画像においても、より正確な文字の抽出が可能
となった。

【００４２】以上述べた様に本発明は、隣どおしの文字
が接触した文字画像、周辺分布が重なった文字画像、文
字ピッチが一定でない文字画像から一つ一つの文字を正
確に切り出すことを可能にした。その結果、該文字切り
出し方法を構成要素とする文字認識装置の信頼性を大き
く向上させるという効果を有している。

【図面の簡単な説明】

【図１】本発明の文字切り出し手段の用いられる文字認
識装置のブロック図。

【図２】本発明の文字切り出し手段のフローチャートを
示す。

【図３】（ａ）、（ｂ）は本発明の標準文字高の抽捧方
法を説明した図。

【図４】（ａ）〜（ｄ）は本発明の標準文字間隔及び単
語間隔、標準文字長、切り出し候補位置の推定の様子を
説明した図。

【図５】（ａ）〜（ｃ）は本発明の標準文字間隔及び単
語間隔、標準文字長、切り出し候補位置の推定の様子を
説明した図。

【図６】（ａ）、（ｂ）は本発明の標準文字間隔及び単
語間隔、標準文字長、切り出し候補位置の推定の様子を
説明した図。

【図７】（ａ）、（ｂ）は本発明の標準文字間隔及び単
語間隔、標準文字長、切り出し候補位置の推定の様子を
説明した図。

【図８】本発明の標準文字間隔及び単語間隔、標準文字
長、切り出し候補位置の推定の様子を説明した図。

【図９】本発明の標準文字間隔及び単語間隔、標準文字
長、切り出し候補位置の推定の様子を説明した図。

【図１０】本発明の標準文字間隔及び単語間隔、標準文
字長、切り出し候補位置の推定の様子を説明した図。

【図１１】（ａ）、（ｂ）本発明の文字抽出の様子を説
明した図。

【図１２】（ａ）、（ｂ）本発明の文字抽出の様子を説
明した図。

【図１３】（ａ）〜（Ｃ）本発明の文字抽出の様子を説
明した図。

【符号の説明】

１０１・・・・・・ＣＰＵ１０２・・・・・・画像人力装置１０３・・・・・・認識文字表示装置１０４・・・・・・ＲＯＭｌ０５・・・・・・ＲＡＭ３０１・・・・・・行方向周辺分布３０４・・・・・・標準文字高４０１・・・・・・文字領域４０２・・・・・・文字間隔５０ｌ〜５０７・・文字周辺分布５ｌ１〜５１７・・文字領域５２１〜５２６・・文字切り出し候補位置５０８・・・・・・最低文字線幅７０ｌ・・・・・・標準文字高８０ｌ〜８０４・・固まりの間隔８０５・・・・・・固まりの間隔のしきい値９０ｌ〜９０３・・固まりの問隔９０４・・・・・・固まりの問隔のしきい値１００４・・・・・標準文字高の７５％１ｌ１０・・・・・最低文字線幅１１３１〜１ｌ３３・・・文字切り出し位置１２０ｌ〜１２０２・・・文字切り出し位置

【手続補正書】

【提出日】平成７年６月５日

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】０００７

【補正方法】変更

【補正内容】

【０００７】次に図５（ａ）に示した文字画像より、従
来の方法により文字の切り出しを行う場合について述べ
る。図５（ａ）はｍｉｌｌｉｏｎという７つの文字によ
り構成される単語である。該単語の縦方向の周辺分布を
計数すると図５（ｂ）に示す様に、ｍ，ｉ，ｌ，ｌ，ｉ
の５つの文字の周辺分布５０１、５０２、５０３、５０
４、５０５は連なって一つの周辺分の固まりとなってい
る。従って、該周辺分布からは簡単に文字の切れ目を推
定することは不可能である。文字ピッチにより文字の切
り離しを行おうとすると、ｉ，ｌ等の文字は標準文字幅
の半分の大きさであるので、二つの文字で一つの文字と
判断して一緒に切り出される可能性が大きい。また、周
辺分布の形状で判断して切り離すと、ｉ，ｌ等の文字は
うまく切り離せるかもしれないが、文字ｍを分解する可
能性が大であり、文字の切り出しの信頼性が極めて小さ
い。

Claims

【特許請求の範囲】

【請求項１】光学的画像入力手段により紙面等に書かれ
た文字画像を読み取り、入力された画像データ中の文字
を認識する文字認識装置の文字切り出し方法において、行方向の周辺分布より文字の標準文字高及び最低線幅を
推定し、前記行方向と垂直な方向の周辺分布より、標準文字間
隔、単語間隔及び標準文字幅を推定し、前記標準文字間隔及び単語間隔と、前記行方向と垂直な
方向の周辺分布とを比較することにより単語の抽出を行
ない、前記行方向と垂直な方向の周辺分布より文字切り出し候
補位置を推定することを特徴とする文字切り出し方法。
【請求項２】文字の標準文字高は、行方向の周辺分布の
形に着目し、前記周辺分布が急激に変化して大きくなっ
ている部分の幅を標準文字高とし、該標準文字高の大き
さより、文字線の最低線幅を推定することを特徴とする
請求項１記載の文字切り出し方法。
【請求項３】行方向と垂直な方向の周辺分布で、文字の
存在しない部分の大きさの統計をとることにより、標準
文字間隔及び単語間隔を推定することを特徴とする請求
項１記載の文字切り出し方法。
【請求項４】行方向と垂直な方向の周辺分布で、周辺分
布の値が前記最低線幅より大きい部分の大きさの統計を
とることにより、標準文字幅を推定することを特徴とす
る請求項１記載の文字切り出し方法。
【請求項５】行方向と垂直な方向の周辺分布の統計をと
り、周辺分布の値が前記標準文字高の約半分よりも大き
い領域において、標準文字幅を推定することを特徴とす
る請求項１記載の文字切り出し方法。
【請求項６】前記統計中の固まりの分類は、固まりと固
まりとの距離が、標準文字高に比例したある値以下であ
れば同一の固まりとみなすことを特徴とする請求項３、
４、または５記載の文字切り出し方法。
【請求項７】光学的画像入力手段により紙面等に書かれ
た文字画像を読み取り、入力された画像データ中の文字
を認識する文字認識装置の文字切り出し方法において、行方向の周辺分布より文字の最低線幅を推定し、前記行方向と垂直な方向の周辺分布より標準文字幅及び
文字切り出し候補位置を推定し、文字の切り出しは文字の連結成分の輪郭を抽出すると同
時に、文字幅を抽出し、前記文字幅と前記標準文字幅
とを比較して、前記文字幅が許容できる大きさである場
合は一文字と判断し、もし、許容できない大きさの場合は、まず前記文字切り
出し候補位置が存在するかどうかを確認し、文字切り出
し候補位置が存在する場合は、文字切り出し候補位置の
範囲内にて再度輪郭の抽出を行ない、もし、文字切り出し候補位置が存在しない場合は、行方
向と垂直な方向の周辺分布により文字切り出し範囲を決
め、再度輪郭の抽出を行ない、前記輪郭に囲まれた領域の内側のみを抽出することによ
り文字の切り出しを行なうことを特徴とする文字切り出
し方法。