JPH06195508A - 文字切り出し方法 - Google Patents

文字切り出し方法

Info

Publication number
JPH06195508A
JPH06195508A JP4343768A JP34376892A JPH06195508A JP H06195508 A JPH06195508 A JP H06195508A JP 4343768 A JP4343768 A JP 4343768A JP 34376892 A JP34376892 A JP 34376892A JP H06195508 A JPH06195508 A JP H06195508A
Authority
JP
Japan
Prior art keywords
character
knowledge
rectangle
validity
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4343768A
Other languages
English (en)
Other versions
JP3115139B2 (ja
Inventor
Masami Oguro
雅己 小黒
Osamu Nakamura
修 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP04343768A priority Critical patent/JP3115139B2/ja
Publication of JPH06195508A publication Critical patent/JPH06195508A/ja
Application granted granted Critical
Publication of JP3115139B2 publication Critical patent/JP3115139B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 処理量の増大を軽減した高精度な文字切り出
し方法を提供する。 【構成】 最初に、文字切り出し手段101で形状的知
識を用いた文字切り出しを行う。次に文字認識手段10
2で文字切り出し結果に対し文字認識を行い、文字妥当
性評価手段103で文字認識結果と単語的な連接関係を
用いて妥当性を評価し、評価結果により不当文字矩形領
域抽出手段104で不当な文字切り出し部分を抽出す
る。次に最適パタン探索手段105にて、不当な文字切
り出し部分についてのみ要素矩形に分離して網羅的な文
字切り出しを行う。このように、形状的な知識に加え、
文字認識結果や単語的な知識も含めて切り出しパタンの
判断を行うことで、文字切り出しの精度を高める。ま
た、形状的な知識のみで切り出しが可能な部分は、最初
に形状的な知識を適用して文字切り出しを行うことによ
り、以下の網羅的な文字切り出しを不要とし、処理量を
大幅に削減する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自由手書きで記入され
た文字列の文字切り出し方式に関し、特に、一単語の長
さが短い単語の認識の文字切り出し方式として好適に用
いることができる文字切り出し方法に関するものであ
る。
【0002】
【従来の技術】従来、文字切り出し方法として、文字の
黒連結成分から得た外接矩形を基にして、矩形の形状的
な情報により、文字切り出しを行う方法がある(参考文
献(A):北村他、“単語知識を利用した手書き文字列
処理方式”、NTT R&D,39,3,pp.429
−436など)。本方法は、黒連結部に外接する基本矩
形を抽出し、近接する2つの基本矩形を、統合知識を利
用して統合していき、1文字の範囲を決定する。このと
き、統合知識としては、統合矩形の縦横比や各矩形の配
置関係等の、物理的な情報を用いる。
【0003】他方、外接矩形を網羅的に組み合わせ、全
組み合わせの中から最適なパタンを選択する方法がある
(参考文献(B):村瀬他、“言語情報を利用した手書
き文字列からの文字切り出しと認識”、信学論(D)、
J69−D,9,pp.1292−1301など)。こ
れは、外接矩形を抽出した後、文字認識を行い、該文字
認識で得られた文字類似度が最大となる矩形の組み合わ
せを探索し、単語知識を用いて、最終的な切り出しパタ
ンを決定するものである。
【0004】
【発明が解決しようとする課題】しかしながら、従来行
っていた、矩形の形状的な情報による文字切り出し方法
では、矩形の物理的な配置関係しか考慮しないため、配
置関係の知識の精度が切り出し精度を左右する。例え
ば、文字間隔が広いことを想定して知識を作成した場合
に、一部文字間隔が狭い文字列があると、切り出し誤り
が生じる。従って、種々の文字列パタンの切り出しを行
う場合、配置関係だけでは不十分である。これを防ぐた
めに、文字認識を行って、単語と文字候補列の部分照合
を行い、単語候補を検索し、単語候補からのフィードバ
ックで再度切り出しを行う方法(参考文献(A))があ
るが、単語の文字列長が短いと、切り出し誤り、文字認
識誤り等で、部分照合でも単語候補内に正解が含まれな
くなり、フィードバックの効果が無い。
【0005】また、文字認識の結果や、単語の知識を用
い、外接矩形の網羅的な組み合わせの中から最適なパタ
ンを選択する方法では、前記配置関係を利用する方法に
比べ精度が高くなるが、外接矩形を全て組み合わせて評
価する必要があるため、入力文字列が長くなると、探索
範囲が膨大となり、演算量が増大するという問題があ
る。
【0006】本発明は、上記問題点を解決するためにな
されたものであり、その目的は、配置関係の知識だけで
なく、文字認識結果、単語知識を用いた高精度で、か
つ、演算量の増大を軽減した文字切り出し方法を提供す
ることにある。
【0007】
【課題を解決するための手段】上記の目的を達成するた
め、本発明の文字切り出し方法は、任意ピッチで入力さ
れる文字列を1文字単語に切り出す文字切り出し方法に
おいて、前記文字列の黒画素の連続部分を基に作成した
文字要素矩形から1文字に相当する文字矩形へ該要素矩
形を統合する形状的切り出し過程と、文字の特徴を登録
した文字辞書を備え、前記文字矩形内のイメージと該文
字辞書との照合を行い文字候補を得る文字認識過程と、
2文字間の連接関係を表すテーブルを備え、前記文字認
識過程で得られた文字候補の類似度及び該連接関係を用
いて文字妥当性を評価する過程と、前記文字妥当性の低
い文字矩形についてのみ、該文字矩形を要素矩形へ分離
し、前記文字妥当性の評価により、妥当な要素矩形の組
み合わせを探索する過程と、を有することを特徴として
いる。
【0008】
【作用】本発明の文字切り出し方法では、まず、文字切
り出し過程において、形状的知識を用いた文字切り出し
を行い、次に、文字認識過程において、上記文字切り出
し結果に対して文字辞書との照合による文字認識を行
い、次に、文字妥当性の評価過程においてその文字認識
結果と単語的な連接関係を用いた妥当性の評価により不
当な文字切り出し部分を抽出し、次に、要素矩形の組み
合わせ探索過程において、この不当な文字切り出し部分
についてのみ要素矩形に分離して網羅的な文字切り出し
を行い、妥当性の高い文字切り出しパタンを決定する。
このように、形状的な知識に加え、文字認識結果や単語
的な知識も含めて文字切り出しパタンの判断を行うこと
で、形状的な知識のみに比べて精度の高い切り出しを可
能にする。さらに、形状的な知識のみで切り出しが可能
な部分は、最初に形状的な知識を適用して切り出しを行
うことにより、以下の網羅的な切り出しを不要とし、全
文字列を対象とした網羅的な文字切り出しに比べて大幅
な処理量削減を可能にしている。
【0009】
【実施例】以下、本発明の実施例を、図面を参照して詳
細に説明する。
【0010】図1は本発明の一実施例の構成を示すブロ
ック図である。図中、101は形状的文字切り出し手
段、102は文字認識手段、103は文字妥当性評価手
段、104は不当文字矩形領域抽出手段、105は最適
パタン探索手段、106は文字辞書、107は文字連接
関係テーブルを示す。
【0011】本実施例の文字切り出し方法では、まず、
形状的文字切り出し手段101において、図略のスキャ
ナ等から入力された任意ピッチ文字列の黒画素の連続部
分を基に作成した文字要素矩形を、形状知識を利用して
1文字に相当する文字矩形へ該要素矩形を統合する。次
に、文字認識手段102において、上記文字矩形内のイ
メージと文字の特徴を登録した文字辞書106との照合
による文字認識を行って文字候補を得る。次に、文字妥
当性評価手段103において、2文字間の連接関係を表
わす文字連接関係テーブル107を参照し、上記文字候
補の類似度および該連接関係を用いて文字妥当性を評価
する。次に、不当文字矩形領域抽出手段104におい
て、上記文字妥当性評価の低い文字矩形の連続を文字要
素矩形に分割して不当文字矩形領域とする。次に、最適
パタン探索手段105において、上記不当文字矩形領域
について文字要素矩形の組み合わせを変えて前記の文字
妥当性を行い妥当な要素矩形の組み合わせを探索して、
文字切り出しパタンを決定する。
【0012】以上のように構成した実施例の具体的な動
作例と作用を述べる。
【0013】図2はその具体的な動作例を示す説明図で
ある。スキャナ等で読み取られ、2値データで入力され
た文字列201は、図1の形状的文字切り出し手段10
1において、形状的な知識を用いて文字矩形202へ切
り出される。これは、文字列201から黒画素の連結部
分に外接する矩形を求め、該矩形の配置関係の知識で文
字要素矩形を作成し、更に形状的な文字らしさの知識に
より、文字要素矩形を統合する手段により実現できる
(参考文献(A))。尚、ここでいう配置関係の知識と
は、例えば、横書きの文字列の場合、上下に重なってい
る矩形は同一文字の要素部分である、等の確実に同一文
字と判定できる知識であり、形状的な文字らしらの知識
とは、統合した矩形の縦横比が1(正方形)に近い、等
の記入パタンに左右される知識である。
【0014】形状的文字切り出し手段101で切り出さ
れたパタンは、各矩形毎に、文字認識手段102で、矩
形内イメージの形状的な特徴が抽出され、文字辞書10
6との照合により認識される。文字認識手段102で
は、認識結果である文字候補と、各文字候補毎の文字辞
書106との類似度(距離値等)が出力される。この例
を、図2の203,204に示す。ここでは、第1位の
文字候補とその類似度を表わしており、類似度は0〜1
00までの値を取り、値が大きいほど類似しているとい
う尺度である。
【0015】文字妥当性評価手段103は、任意の文字
矩形の文字候補と、該文字矩形の直前(または、直後)
の文字矩形の文字候補との組と、文字連接関係テーブル
107(図2の211)との照合により求めた文字の連
接関係(図2の205)、1位文字候補の類似度S、1
位文字候補と2位文字候補の類似度の差D、を用いて文
字の妥当性を評価する手段である。その処理フローを図
3に示す。301で、単語的な文字の連接関係をチェッ
クする。単語的な連接関係は、単語として存在する文字
列から作ることができる。単語的な連接関係がある場合
は、302の判定を行う。すなわち、SとDとの関係に
より文字妥当性を判定する。本例では、1位文字候補の
類似度Sがしきい値T1より大きく、かつ、類似度の差
Dがしきい値T2より大きければ、認識された文字が正
しい確率が高いと判断する。一方、単語的な連接関係が
無い場合は、303の判定を行う。ここでは、302と
同様な判定を行うが、Sのしきい値T3をT1よりも、
Dのしきい値T4をT2よりも大きくし、類似度だけで
判断できる範囲の文字矩形のみを妥当として判定する。
【0016】不当文字矩形領域抽出手段104は、上記
において妥当性が低いとされ不当文字と判定された矩形
が連続している場合、それらを文字要素矩形に分割し、
不当文字矩形領域とする処理を行う。
【0017】続く最適パタン探索手段105は、各不当
文字矩形領域毎に最適パタンの選択を行う。図4に、文
字妥当性を数量化し、文字妥当性が最大となる文字矩形
の統合パタンを最良優先探索方式で最適パタン探索手段
105を実施した場合の処理フローを示す。401にお
いて不当文字矩形領域の先頭の矩形(矩形番号m)を開
始位置とし、まずm単独,m〜m+1,m〜m+2,
…,の順に統合矩形を形成し、以下402から405ま
での処理を行う。
【0018】402では、統合矩形[m,j]([m,
j]はm〜j(≧m)までの統合(マージ)した文字矩
形を表す)の形状的な特徴(矩形の縦横比)により、文
字として許容できる範囲(縦横比がT5以内)の統合で
あるか判定する。ただし、前記形状的文字切り出し手段
101で用いた形状的な文字らしさの知識よりゆるめの
チェックである。403では、統合矩形の文字認識を前
記文字認識手段102と同様の方法で行い、文字候補,
各文字候補の類似度を求める。404では、連接性のチ
ェックを行い、以下の評価式(1)により統合矩形
[m,j]の妥当性Pm,jを求める。但し、1位文字
候補の類似度をSm,j、1位文字候補と2位文字候補
の類似度の差をDm,j、前文字矩形との連接性をC
m,j(={0,1})、αを経験値とする。
【0019】 Pm,j=α×Cm,j×Sm,j×√(Dm,j/Sm,j) (1) 後記する405は、i>mの場合に有効であるため、i
=mの場合はなにも行わない。
【0020】以上の処理で得られた、Pm,k(m<k
<j)の中から最大値Pmaxを求め(406)、Pm
axを持つ統合矩形[m,jmax]の直後の矩形(矩
形番号jmax+1)を開始位置とし、同様の処理を行
う。この場合、統合矩形は、[jmax+1,j](j
≧jmax+1)を用い、404では、Pjmax+
1,jの算出を行い、jmax+1>mであるため、4
05を行う。405は、不当文字矩形領域の先頭位置か
らjまでの評価値の総和を求め、文字数で除した正規化
文字妥当性Pm,jを求める。406では、既に算出さ
れた全てのPm,jの中から、Pmaxを求める。ここ
で、すでに算出されたPm,jの中には、先頭を開始位
置とした時の[m,jmax]以外の統合矩形の結果も
含めることにより、[m,jmax]が誤りで有る場合
に、他の候補での探索も可能となる。
【0021】このようにして、不当文字矩形猟奇の最終
矩形まで処理した時に、最大のPmaxを持つ統合矩形
の組み合わせを、最終的な切り出し結果とする。
【0022】
【発明の効果】以上説明したように、本発明の文字切り
出し方法によれば、形状的な知識に加え、文字認識結
果、単語的な知識も含めて、文字切り出しパタンの判断
を行っているため、形状的な知識のみに比べて精度の高
い切り出しが可能となる。さらに、最初に形状的な知識
を適用しているため、形状的な知識のみで切り出しが可
能な部分は、以下の網羅的な切り出しが不要となるの
で、処理量が大幅に削減できる。また、文字切り出し精
度が高くなるため、後段で単語との照合を行う場合、短
い単語でも単語候補内に含めることが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図
【図2】上記実施例における具体的な動作例を示す説明
【図3】上記実施例における文字妥当性評価の処理フロ
ー図
【図4】上記実施例における不当文字列に対する最適な
切り出しパタン探索に用いる手段の処理フロー図
【符号の説明】
101…形状的文字切り出し手段 102…文字認識手段 103…文字妥当性評価手段 104…不当文字矩形領域抽出手段 105…最適パタン探索手段 106…文字辞書 107,211…文字連接関係テーブル

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 任意ピッチで入力される文字列を1文字
    単語に切り出す文字切り出し方法において、 前記文字列の黒画素の連続部分を基に作成した文字要素
    矩形から1文字に相当する文字矩形へ該要素矩形を統合
    する形状的切り出し過程と、 文字の特徴を登録した文字辞書を備え、前記文字矩形内
    のイメージと該文字辞書との照合を行い文字候補を得る
    文字認識過程と、 2文字間の連接関係を表すテーブルを備え、前記文字認
    識過程で得られた文字候補の類似度及び該連接関係を用
    いて文字妥当性を評価する過程と、 前記文字妥当性の低い文字矩形についてのみ、該文字矩
    形を要素矩形へ分離し、前記文字妥当性の評価により、
    妥当な要素矩形の組み合わせを探索する過程と、を有す
    ることを特徴とする文字切り出し方法。
JP04343768A 1992-12-24 1992-12-24 文字切り出し方法 Expired - Fee Related JP3115139B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04343768A JP3115139B2 (ja) 1992-12-24 1992-12-24 文字切り出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04343768A JP3115139B2 (ja) 1992-12-24 1992-12-24 文字切り出し方法

Publications (2)

Publication Number Publication Date
JPH06195508A true JPH06195508A (ja) 1994-07-15
JP3115139B2 JP3115139B2 (ja) 2000-12-04

Family

ID=18364093

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04343768A Expired - Fee Related JP3115139B2 (ja) 1992-12-24 1992-12-24 文字切り出し方法

Country Status (1)

Country Link
JP (1) JP3115139B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007219867A (ja) * 2006-02-17 2007-08-30 Hitachi Ltd 文字列読取り方法
JP2013238999A (ja) * 2012-05-15 2013-11-28 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007219867A (ja) * 2006-02-17 2007-08-30 Hitachi Ltd 文字列読取り方法
JP2013238999A (ja) * 2012-05-15 2013-11-28 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Also Published As

Publication number Publication date
JP3115139B2 (ja) 2000-12-04

Similar Documents

Publication Publication Date Title
JP3639126B2 (ja) 住所認識装置及び住所認識方法
US20030208354A1 (en) Method for named-entity recognition and verification
JP3452774B2 (ja) 文字認識方法
CN101520783B (zh) 基于图像内容的关键词搜索方法和装置
JP3216800B2 (ja) 手書き文字認識方法
CN119810855A (zh) 一种文档识别方法、装置、计算设备和存储介质
Allam Segmentation versus segmentation-free for recognizing Arabic text
JPH06195508A (ja) 文字切り出し方法
Lu et al. Word searching in document images using word portion matching
JP2751865B2 (ja) 文字列認識装置
Hirayama et al. Development of template-free form recognition system
JPH11328315A (ja) 文字認識装置
JPH09274645A (ja) 文字認識方法および装置
JP3419251B2 (ja) 文字認識装置及び文字認識方法
JP3151866B2 (ja) 英文字認識方法
KR100292352B1 (ko) 형태소 분석을 이용한 인식기의 편집방법
JP2906758B2 (ja) 文字読取装置
JP2746345B2 (ja) 文字認識の後処理方法
JP3100786B2 (ja) 文字認識後処理方式
KR100473660B1 (ko) 단어인식방법
JP2671984B2 (ja) 情報認識装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JP2002312398A (ja) 文書検索装置
JPH0830734A (ja) 文字列認識装置
JPS60217487A (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees