JPH0365584B2 - - Google Patents
Info
- Publication number
- JPH0365584B2 JPH0365584B2 JP57229025A JP22902582A JPH0365584B2 JP H0365584 B2 JPH0365584 B2 JP H0365584B2 JP 57229025 A JP57229025 A JP 57229025A JP 22902582 A JP22902582 A JP 22902582A JP H0365584 B2 JPH0365584 B2 JP H0365584B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- width
- limit value
- blocks
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
Description
【発明の詳細な説明】
本発明は、文字分離装置、特に文字の接触を含
む印字された紙面上の文字列イメージが可変ピツ
チ文字列か等ピツチ文字列かを識別する装置に関
するものである。
む印字された紙面上の文字列イメージが可変ピツ
チ文字列か等ピツチ文字列かを識別する装置に関
するものである。
従来、印字あるいは手書き文字を光学的に読み
取る装置(以下、OCRと称す)において、英数
字及びカタカナを対象とするものはすでに実用化
されている。しかし、このようなOCRにおける
読取対象も種々な印字文字や品質を持つ郵便物や
文書のような、紙面や印字機械の制限が緩和され
たものとなると、タイプライター等の印字の際に
生じる印字ぶれや位置ずれ等により隣接文字間の
接触が生じる場合が増える。このような接触する
文字が含まれる紙面上の文字列イメージを分離す
るためには、まず最初に読取対象が等ピツチ文字
列を識別する必要が生じる。可変文字ピツチ列か
等ピツチ列かの識別方法として接触した文字も含
めたすべての文字幅の頻度分布等に基づいて、統
計的に調べる方法を用いると、接触する文字が増
えるにつれて、等ピツチ文字列か可変ピツチ文字
列かの識別が不正確となる。等ピツチ文字列か可
変ピツチ文字列かの識別が不正確となると、等ピ
ツチ文字列の接触する文字塊の検出等が困難とな
るか、または、文字接触の比較的少ない可変ピツ
チ文字列の不正確な分離を引き起こす結果とな
る。
取る装置(以下、OCRと称す)において、英数
字及びカタカナを対象とするものはすでに実用化
されている。しかし、このようなOCRにおける
読取対象も種々な印字文字や品質を持つ郵便物や
文書のような、紙面や印字機械の制限が緩和され
たものとなると、タイプライター等の印字の際に
生じる印字ぶれや位置ずれ等により隣接文字間の
接触が生じる場合が増える。このような接触する
文字が含まれる紙面上の文字列イメージを分離す
るためには、まず最初に読取対象が等ピツチ文字
列を識別する必要が生じる。可変文字ピツチ列か
等ピツチ列かの識別方法として接触した文字も含
めたすべての文字幅の頻度分布等に基づいて、統
計的に調べる方法を用いると、接触する文字が増
えるにつれて、等ピツチ文字列か可変ピツチ文字
列かの識別が不正確となる。等ピツチ文字列か可
変ピツチ文字列かの識別が不正確となると、等ピ
ツチ文字列の接触する文字塊の検出等が困難とな
るか、または、文字接触の比較的少ない可変ピツ
チ文字列の不正確な分離を引き起こす結果とな
る。
本発明の目的は、複数個の文字塊の平均高さよ
り一文字となり得る可能な文字塊の幅の存在範囲
を設定し、存在範囲内で、予め定めた許容幅で求
めた最頻度となる文字塊の幅の上限値を頻度情報
に基づいて更新し、一文字幅クラスを得ることに
よつて等ピツチ文字列の接触文字塊の幅やコンマ
等を除去し、容易に文字ピツチの識別が行なえる
ようにした文字ピツチ識別装置を提供することに
ある。
り一文字となり得る可能な文字塊の幅の存在範囲
を設定し、存在範囲内で、予め定めた許容幅で求
めた最頻度となる文字塊の幅の上限値を頻度情報
に基づいて更新し、一文字幅クラスを得ることに
よつて等ピツチ文字列の接触文字塊の幅やコンマ
等を除去し、容易に文字ピツチの識別が行なえる
ようにした文字ピツチ識別装置を提供することに
ある。
本発明の他の目的は、一文字幅クラスの文字塊
の幅の広がり具合に基づいて文字ピツチの識別を
行なうようにした文字ピツチ識別装置を提供する
ことにある。
の幅の広がり具合に基づいて文字ピツチの識別を
行なうようにした文字ピツチ識別装置を提供する
ことにある。
本発明の更に他の目的は、文字ピツチの値が予
め、知ることができない種々の印字文字から、安
定に文字ピツチの識別を行なうようにした文字ピ
ツチ識別装置を提供することにある。
め、知ることができない種々の印字文字から、安
定に文字ピツチの識別を行なうようにした文字ピ
ツチ識別装置を提供することにある。
本発明によれば、紙面上に記載された文字列イ
メージを走査し、個々の文字に分離する文字分離
装置において、2値化された文字列イメージから
複数個の文字塊の高さ及び幅を得る手段と、複数
個の文字塊の幅に関する頻度情報を得る頻度テー
ブルメモリと、複数個の文字塊の高さから文字塊
の平均高さを得る手段と、文字塊の平均高さを用
いて一文字となり得る可能な文字塊の幅の存在範
囲を設定し、頻度テーブルメモリ内の頻度情報か
ら予め定められた許容幅で最頻度となる文字塊の
幅の上限値及び下限値を存在範囲内で得る手段
と、上限値を頻度テーブルメモリ内の頻度情報に
基づいて更新し、一文字クラスの上限値及び下限
値を得る手段と、一文字幅クラスの上限値及び下
限値の広がり具合を調べ、可変文字ピツチ文字列
か等文字ピツチ文字列かを識別する手段とを有す
ることを特徴とする文字ピツチ識別装置が得られ
る。
メージを走査し、個々の文字に分離する文字分離
装置において、2値化された文字列イメージから
複数個の文字塊の高さ及び幅を得る手段と、複数
個の文字塊の幅に関する頻度情報を得る頻度テー
ブルメモリと、複数個の文字塊の高さから文字塊
の平均高さを得る手段と、文字塊の平均高さを用
いて一文字となり得る可能な文字塊の幅の存在範
囲を設定し、頻度テーブルメモリ内の頻度情報か
ら予め定められた許容幅で最頻度となる文字塊の
幅の上限値及び下限値を存在範囲内で得る手段
と、上限値を頻度テーブルメモリ内の頻度情報に
基づいて更新し、一文字クラスの上限値及び下限
値を得る手段と、一文字幅クラスの上限値及び下
限値の広がり具合を調べ、可変文字ピツチ文字列
か等文字ピツチ文字列かを識別する手段とを有す
ることを特徴とする文字ピツチ識別装置が得られ
る。
以下、本発明における具体的一実施例を参照し
て説明する。第1図は、文字間の接触を含む等ピ
ツチ文字列イメージの一部を示した一例である。
図において、斜線で示した白地で分離可能な文字
部イメージ即ち文字塊を矩形領域で示しており、
図中Vi,Hi(i=1,…,8)は、各文字塊の幅
及び高さを示している。ここで、文字塊幅V1,
V8を持つ文字塊は文字塊の接触によつて、2文
字を含んだ文字イメージとなつている。
て説明する。第1図は、文字間の接触を含む等ピ
ツチ文字列イメージの一部を示した一例である。
図において、斜線で示した白地で分離可能な文字
部イメージ即ち文字塊を矩形領域で示しており、
図中Vi,Hi(i=1,…,8)は、各文字塊の幅
及び高さを示している。ここで、文字塊幅V1,
V8を持つ文字塊は文字塊の接触によつて、2文
字を含んだ文字イメージとなつている。
第2図は、第1図で示したような紙面上の複数
個の文字塊幅の頻度分布の一例を示しており、こ
れを用いて本発明の原理を説明する。第2図にお
いて、図中、複数個の文字塊に関する頻度分布の
横軸は、文字塊幅Vの値を示しており、縦軸
NUMは任意の文字塊幅の値における文字塊の個
数、即ち、頻度値を示している。本発明では前述
した頻度分布を参照しながら第2図A1で示した
1文字と見なせる文字幅の区間A1即ち、その上
限値VUと下限値VLとの差を抽出し、この値を文
字塊の平均高さHnに基づいて設定された閾値と
比較することによつて等ピツチ/可変ピツチ文字
列の識別が自動的に行われる。そこで、1文字と
見なせる文字幅の区間A1の抽出について説明す
る。最初に、文字の幅と高さには密接な関係があ
るため、文字塊の平均高さHn及び定数C1,C2(但
し、C1<C2、例えばC1=0.5、C2=1.2)を用いて
1文字可能範囲Aを設定する。次に頻度分布を参
照して上記範囲A内で最頻値を持つ文字塊を最も
1文字らしい文字幅として抽出する。ここで、上
記最頻値を得る場合、通常、郵便物上の住所等の
ように観測できる文字塊数が少ない場合も考慮す
るために、許容幅ΔT(図中、ΔT=3)を設け、
許容幅ΔT内に含まれる文字塊数の頻度数が最大
となる文字塊幅の区間ASの上限値V′Uと下限値
V′Lを算出する。尚、ここで、1文字可能範囲A
内に対し許容幅ΔTで最頻値を算出するために、
V′U−V′L=ΔTが成立する。
個の文字塊幅の頻度分布の一例を示しており、こ
れを用いて本発明の原理を説明する。第2図にお
いて、図中、複数個の文字塊に関する頻度分布の
横軸は、文字塊幅Vの値を示しており、縦軸
NUMは任意の文字塊幅の値における文字塊の個
数、即ち、頻度値を示している。本発明では前述
した頻度分布を参照しながら第2図A1で示した
1文字と見なせる文字幅の区間A1即ち、その上
限値VUと下限値VLとの差を抽出し、この値を文
字塊の平均高さHnに基づいて設定された閾値と
比較することによつて等ピツチ/可変ピツチ文字
列の識別が自動的に行われる。そこで、1文字と
見なせる文字幅の区間A1の抽出について説明す
る。最初に、文字の幅と高さには密接な関係があ
るため、文字塊の平均高さHn及び定数C1,C2(但
し、C1<C2、例えばC1=0.5、C2=1.2)を用いて
1文字可能範囲Aを設定する。次に頻度分布を参
照して上記範囲A内で最頻値を持つ文字塊を最も
1文字らしい文字幅として抽出する。ここで、上
記最頻値を得る場合、通常、郵便物上の住所等の
ように観測できる文字塊数が少ない場合も考慮す
るために、許容幅ΔT(図中、ΔT=3)を設け、
許容幅ΔT内に含まれる文字塊数の頻度数が最大
となる文字塊幅の区間ASの上限値V′Uと下限値
V′Lを算出する。尚、ここで、1文字可能範囲A
内に対し許容幅ΔTで最頻値を算出するために、
V′U−V′L=ΔTが成立する。
次に、上述した最も1文字らしい文字幅の区間
ASを初期値として、その上限値V′Uを頻度分布を
参照しながらその値を増加する方向に更新するこ
とによつて、1文字と見なせる文字幅の区間A1
の下限値VUと下限値VLを抽出することができる。
尚、下限値VLについて、例えば、ピリオツド、
カンマ等のように文字幅が小さいものを除去し、
等ピツチ文字列と可変ピツチ文字列との識別の信
頼性を上げるために上記最も1文字らしい文字幅
の区間ASの下限値V′Lがその値が減少する方向に
更新を行わない。即ち、下限値VLは下限値V′Lに
等しくなる。また、上記下限値V′Uを更新し、1
文字と見なせる文字幅区間A1の上限値VUを求め
るための更新動作の終了は、第3図を用いて後記
に説明するように定数C3及び文字塊の平均高さ
Hn(但し、C3<C2であり、例えばC3=0.4)を用
いて行うことができる。ここで、上記文字幅の区
間A1の値によつて等ピツチ文字列か可変ピツチ
文字列かの識別ができることについて簡単に述べ
る。即ち、ピリオツド、カンマ等の文字幅が小さ
い物を除けば、等ピツチ文字列の場合、上述した
最も1文字らしい文字塊幅付近(即ち、図中AS
付近)に集中する印刷物が大半であり、一方、可
変ピツチ文字列では、ピリオツド、カンマ等の文
字幅が小さいものを除いても、最も1文字塊幅付
近に集中することなく、ばらつく性質を持つてい
る。そのため、第2図で示す如く、1文字幅と見
なせ得る区間A1を検出することによつて等ピツ
チ文字列と可変ピツチ文字列との識別が可能とな
る。
ASを初期値として、その上限値V′Uを頻度分布を
参照しながらその値を増加する方向に更新するこ
とによつて、1文字と見なせる文字幅の区間A1
の下限値VUと下限値VLを抽出することができる。
尚、下限値VLについて、例えば、ピリオツド、
カンマ等のように文字幅が小さいものを除去し、
等ピツチ文字列と可変ピツチ文字列との識別の信
頼性を上げるために上記最も1文字らしい文字幅
の区間ASの下限値V′Lがその値が減少する方向に
更新を行わない。即ち、下限値VLは下限値V′Lに
等しくなる。また、上記下限値V′Uを更新し、1
文字と見なせる文字幅区間A1の上限値VUを求め
るための更新動作の終了は、第3図を用いて後記
に説明するように定数C3及び文字塊の平均高さ
Hn(但し、C3<C2であり、例えばC3=0.4)を用
いて行うことができる。ここで、上記文字幅の区
間A1の値によつて等ピツチ文字列か可変ピツチ
文字列かの識別ができることについて簡単に述べ
る。即ち、ピリオツド、カンマ等の文字幅が小さ
い物を除けば、等ピツチ文字列の場合、上述した
最も1文字らしい文字塊幅付近(即ち、図中AS
付近)に集中する印刷物が大半であり、一方、可
変ピツチ文字列では、ピリオツド、カンマ等の文
字幅が小さいものを除いても、最も1文字塊幅付
近に集中することなく、ばらつく性質を持つてい
る。そのため、第2図で示す如く、1文字幅と見
なせ得る区間A1を検出することによつて等ピツ
チ文字列と可変ピツチ文字列との識別が可能とな
る。
第3図は、本発明における具体的一実施例を示
す論理ブロツク図である。尚、図において、信号
線の末尾にSを付けることにより、その信号を表
わすものとする。走査装置1は、紙面上の印字又
は手書きされた文字列を光学的に走査して電気信
号に変換し、2値に量子化した文字列イメージを
順次文字列イメージメモリ2へ書き込む。3は文
字塊抽出装置であり、文字列イメージメモリ2に
格納された文字列イメージから白ビツトで囲まれ
た文字イメージ(以下文字塊と呼ぶ)を順次検出
し、各文字塊の始端位置及び大きさを文字塊レジ
スタ4へ格納する。尚、文字塊の大きさは、文字
塊の幅及び高さを表わすものとする。また、この
ような文字塊抽出装置は、例えば同一出願人によ
る特願昭56−27512号明細書で示されている技術
を用いて求めることができる。文字塊レジスタ4
に格納された複数個の文字塊の幅は、順次制御装
置6へ転送される。制御装置6は順次転送される
文字塊の幅の値を、頻度テーブルメモリ5のアド
レスに変換し、対応する頻度テーブルメモリ5の
内容を読み出し、+1加算回路11によつて、イ
ンクリメントし、頻度テーブルメモリ5内の同一
の記憶場所に書き込む。このようにして、頻度テ
ーブルメモリ5内に文字列イメージメモリ2より
抽出された文字塊の幅Viの頻度値が、頻度テー
ブルメモリ5のアドレスVi番地に格納される。
す論理ブロツク図である。尚、図において、信号
線の末尾にSを付けることにより、その信号を表
わすものとする。走査装置1は、紙面上の印字又
は手書きされた文字列を光学的に走査して電気信
号に変換し、2値に量子化した文字列イメージを
順次文字列イメージメモリ2へ書き込む。3は文
字塊抽出装置であり、文字列イメージメモリ2に
格納された文字列イメージから白ビツトで囲まれ
た文字イメージ(以下文字塊と呼ぶ)を順次検出
し、各文字塊の始端位置及び大きさを文字塊レジ
スタ4へ格納する。尚、文字塊の大きさは、文字
塊の幅及び高さを表わすものとする。また、この
ような文字塊抽出装置は、例えば同一出願人によ
る特願昭56−27512号明細書で示されている技術
を用いて求めることができる。文字塊レジスタ4
に格納された複数個の文字塊の幅は、順次制御装
置6へ転送される。制御装置6は順次転送される
文字塊の幅の値を、頻度テーブルメモリ5のアド
レスに変換し、対応する頻度テーブルメモリ5の
内容を読み出し、+1加算回路11によつて、イ
ンクリメントし、頻度テーブルメモリ5内の同一
の記憶場所に書き込む。このようにして、頻度テ
ーブルメモリ5内に文字列イメージメモリ2より
抽出された文字塊の幅Viの頻度値が、頻度テー
ブルメモリ5のアドレスVi番地に格納される。
尚、頻度テーブルメモリ5は、最初、0にクリ
アされているとする。次に、文字塊レジスタ4に
格納された複数個の文字塊の高さは、順次平均高
さ検出部7へ転送される。平均高さ検出部7は、
複数個の文字塊の高さの平均値を算出する。尚、
平均高さ検出部7において、最頻値を有する高さ
を算出する回路を用いても良い。
アされているとする。次に、文字塊レジスタ4に
格納された複数個の文字塊の高さは、順次平均高
さ検出部7へ転送される。平均高さ検出部7は、
複数個の文字塊の高さの平均値を算出する。尚、
平均高さ検出部7において、最頻値を有する高さ
を算出する回路を用いても良い。
15は、定数レジスタであり、第2図で説明し
た定数C1,C2,C3(但し、C1<C2、C3<C2)を格
納する。定数C1,C2は、平均高さ検出部7にお
いて検出された文字塊の平均高さHmより、一文
字塊の幅の可能な範囲を決めるものであり、定数
C3は、図中点線で囲まれた一文字幅クラス検出
部8において、用いる閾値を生成するためのもの
である。乗算部10は、文字塊の平均高さHmと
定数C1,C2,C3との乗算を行なう。乗算部10
によつて得られた値のうち、C1・Hm及びC2・
Hm(但し、C1・Hm<C2・Hm)はそれぞれ、可
能な一文字の幅の下限及び上限値とし一文字範囲
設定レジスタ12へ格納され、C3・Hmは閾値レ
ジスタ17へ格納される。16は、定数レジスタ
であり、予め設定された許容幅を示す定数△Tが
設定されている。13は、最頻度幅検出部であ
る。一文字範囲設定レジスタ12に格納された可
能な一文字の幅の下限値C1・Hm及び上限値C2・
Hm内に含まれる文字塊の幅の頻度値を制御装置
6によつて、頻度テーブルメモリ5から順次、最
頻度幅検出部13へ入力させると、最頻度幅検出
部13は、定数レジスタ16の内容である定数△
T間隔で、頻度値を計数し、最頻度値を有する文
字塊の幅の区間を示す下限値、上限値VL,VU(但
し、C1・Hm≦VL≦C2・Hm−△T、C1:Hm+
△T≦VU≦C2・Hm、VU−VL=△Tを満たす。)
を検出する。最頻度値を有する文字塊の幅の下限
値VL及び上限値VUは、一文字初期クラスレジス
タ81へ格納される。
た定数C1,C2,C3(但し、C1<C2、C3<C2)を格
納する。定数C1,C2は、平均高さ検出部7にお
いて検出された文字塊の平均高さHmより、一文
字塊の幅の可能な範囲を決めるものであり、定数
C3は、図中点線で囲まれた一文字幅クラス検出
部8において、用いる閾値を生成するためのもの
である。乗算部10は、文字塊の平均高さHmと
定数C1,C2,C3との乗算を行なう。乗算部10
によつて得られた値のうち、C1・Hm及びC2・
Hm(但し、C1・Hm<C2・Hm)はそれぞれ、可
能な一文字の幅の下限及び上限値とし一文字範囲
設定レジスタ12へ格納され、C3・Hmは閾値レ
ジスタ17へ格納される。16は、定数レジスタ
であり、予め設定された許容幅を示す定数△Tが
設定されている。13は、最頻度幅検出部であ
る。一文字範囲設定レジスタ12に格納された可
能な一文字の幅の下限値C1・Hm及び上限値C2・
Hm内に含まれる文字塊の幅の頻度値を制御装置
6によつて、頻度テーブルメモリ5から順次、最
頻度幅検出部13へ入力させると、最頻度幅検出
部13は、定数レジスタ16の内容である定数△
T間隔で、頻度値を計数し、最頻度値を有する文
字塊の幅の区間を示す下限値、上限値VL,VU(但
し、C1・Hm≦VL≦C2・Hm−△T、C1:Hm+
△T≦VU≦C2・Hm、VU−VL=△Tを満たす。)
を検出する。最頻度値を有する文字塊の幅の下限
値VL及び上限値VUは、一文字初期クラスレジス
タ81へ格納される。
一文字幅クラス検出部8は前述した最頻度値を
有する文字塊の幅の上限値VUを、頻度テーブル
メモリ5の頻度情報に基づいて、更新し、一文字
の幅が有する区間即ち、第2図で示した一文字幅
と見なせ得る区間A1の上限値及び下限値を、求
める回路であり、構成要素として、一文字初期ク
ラスレジスタ81、カウンター82、頻度値レジ
スタ83、ゼロ検出部84、減算部85比較部8
6、OR回路87、より構成される。一文字初期
クラスレジスタ81に格納された文字塊の幅の上
限値は、カウンター82にセツトされた後、1カ
ウントアツプされ、カウンター82の内容である
文字塊の幅に対応する頻度値を制御装置6によつ
て、頻度テーブルメモリ5から読み出し、頻度値
レジスタ83に格納される。ゼロ検出部84にお
いて、頻度値レジスタ83の内容が0か否かを検
出し、0であれば、出力信号841Sを“1”に
することによつて、OR回路87が開き、カウン
タ82が1カウントアツプされる。
有する文字塊の幅の上限値VUを、頻度テーブル
メモリ5の頻度情報に基づいて、更新し、一文字
の幅が有する区間即ち、第2図で示した一文字幅
と見なせ得る区間A1の上限値及び下限値を、求
める回路であり、構成要素として、一文字初期ク
ラスレジスタ81、カウンター82、頻度値レジ
スタ83、ゼロ検出部84、減算部85比較部8
6、OR回路87、より構成される。一文字初期
クラスレジスタ81に格納された文字塊の幅の上
限値は、カウンター82にセツトされた後、1カ
ウントアツプされ、カウンター82の内容である
文字塊の幅に対応する頻度値を制御装置6によつ
て、頻度テーブルメモリ5から読み出し、頻度値
レジスタ83に格納される。ゼロ検出部84にお
いて、頻度値レジスタ83の内容が0か否かを検
出し、0であれば、出力信号841Sを“1”に
することによつて、OR回路87が開き、カウン
タ82が1カウントアツプされる。
一方、ゼロ検出部84において、頻度値レジス
タの内容が0でなければ、その出力信号841S
より“0”が出力され、制御装置6によつて一文
字初期クラスレジスタ81の内容である文字塊の
幅の上限値とカウンター82の内容とを減算部8
5へ転送する。減算回路85は、カウンター82
の内容から初期文字クラスレジスタ81の内容で
ある文字塊の幅の上限値を減じ、減じた値を比較
部86へ転送する。比較部86において、閾値レ
ジスタ17の内容と減算部85からの出力値とを
比較し閾値レジスタ17の内容が減算部85の出
力値よりも大きければ、その出力信号861Sよ
り“1”を出力する。出力信号861Sより
“1”が出力されると、制御装置6によつて、カ
ウンター82の内容を用いて、一文字初期クラス
レジスタ82に格納された文字塊の幅の上限値を
更新すると共に、OR回路87が開き、カウンタ
ー82が1カウントアツプされる。一方、閾値レ
ジスタ17の内容が減算部85の出力値よりも小
さいか等しければ、比較部86の出力信号861
Sより“0”が出力され制御装置6によつて、一
文字初期クラスレジスタ81の内容である文字塊
の幅の下限値及び前述したようにして更新された
上限値を一文字幅クラスレジスタ14へ転送され
る。ここで、以上述べた一文字幅クラス検出部8
の動作を要約する。即ち、1文字初期クラスレジ
スタ81に初期値としてセツトされた文字塊幅の
上限値を検査中の文字塊幅を示すカウンタ82の
内容によつて更新する動作は、カウンタ82の内
容と一文字初期クラスレジスタ81に記憶された
上記上限値との差が閾値レジスタ17の内容であ
る値C3Hmより大きくなつた時に終了し、一文字
初期クラスレジスタ81お記憶された上限値が一
文字幅レジスタ14へ転送されることになる。
タの内容が0でなければ、その出力信号841S
より“0”が出力され、制御装置6によつて一文
字初期クラスレジスタ81の内容である文字塊の
幅の上限値とカウンター82の内容とを減算部8
5へ転送する。減算回路85は、カウンター82
の内容から初期文字クラスレジスタ81の内容で
ある文字塊の幅の上限値を減じ、減じた値を比較
部86へ転送する。比較部86において、閾値レ
ジスタ17の内容と減算部85からの出力値とを
比較し閾値レジスタ17の内容が減算部85の出
力値よりも大きければ、その出力信号861Sよ
り“1”を出力する。出力信号861Sより
“1”が出力されると、制御装置6によつて、カ
ウンター82の内容を用いて、一文字初期クラス
レジスタ82に格納された文字塊の幅の上限値を
更新すると共に、OR回路87が開き、カウンタ
ー82が1カウントアツプされる。一方、閾値レ
ジスタ17の内容が減算部85の出力値よりも小
さいか等しければ、比較部86の出力信号861
Sより“0”が出力され制御装置6によつて、一
文字初期クラスレジスタ81の内容である文字塊
の幅の下限値及び前述したようにして更新された
上限値を一文字幅クラスレジスタ14へ転送され
る。ここで、以上述べた一文字幅クラス検出部8
の動作を要約する。即ち、1文字初期クラスレジ
スタ81に初期値としてセツトされた文字塊幅の
上限値を検査中の文字塊幅を示すカウンタ82の
内容によつて更新する動作は、カウンタ82の内
容と一文字初期クラスレジスタ81に記憶された
上記上限値との差が閾値レジスタ17の内容であ
る値C3Hmより大きくなつた時に終了し、一文字
初期クラスレジスタ81お記憶された上限値が一
文字幅レジスタ14へ転送されることになる。
また、文字塊幅の上限値を更新する条件につい
ては、カウンタ82の内容である検査中の文字塊
幅に対応する頻度分布の頻度値が0の時(ゼロ検
出部84で検知)には、無条件でカウンタ82の
内容をカウントアツプ(即ち、次の文字塊幅)
し、上記頻度値が0でなく且つまだ上述した文字
塊幅の上限値を更新する動作終了とならない時に
は、検査中の文字塊幅を示すカウンタ82の内容
を一文字初期クラスレジスタ81の上限値として
転送することによつて文字塊幅の上限値の更新が
行われることになる。
ては、カウンタ82の内容である検査中の文字塊
幅に対応する頻度分布の頻度値が0の時(ゼロ検
出部84で検知)には、無条件でカウンタ82の
内容をカウントアツプ(即ち、次の文字塊幅)
し、上記頻度値が0でなく且つまだ上述した文字
塊幅の上限値を更新する動作終了とならない時に
は、検査中の文字塊幅を示すカウンタ82の内容
を一文字初期クラスレジスタ81の上限値として
転送することによつて文字塊幅の上限値の更新が
行われることになる。
図中点線で囲まれた判定部9は、文字列イメー
ジメモリ2に記憶された文字列イメージが等ピツ
チ文字列か可変ピツチ文字列かを決定する。91
は減算部であり、一文字幅クラスレジスタ14の
内容である文字塊の幅の上限値から下限値を減
じ、その出力値を比較部93へ転送する。92は
閾値レジスタであり、予め設定された閾値が格納
される。尚、閾値レジスタ92の内容は、閾値レ
ジスタ17の内容のように、平均高さ検出部7で
得られた文字塊の平均高さに基づいて設定しても
良い。比較部93において、閾値レジスタ92の
内容と減算部91の出力値とを比較する。閾値レ
ジスタ92の内容が減算部91の出力値よりも大
きければ、その出力信号931Sより“1”を出
力することによつて等ピツチ文字列の検出が可能
となる。閾値レジスタ92の内容が減算部91の
出力値よりも小さいか等しければ、その出力信号
931Sより“0”を出力することによつて可変
ピツチ文字列の検出が可能となる。
ジメモリ2に記憶された文字列イメージが等ピツ
チ文字列か可変ピツチ文字列かを決定する。91
は減算部であり、一文字幅クラスレジスタ14の
内容である文字塊の幅の上限値から下限値を減
じ、その出力値を比較部93へ転送する。92は
閾値レジスタであり、予め設定された閾値が格納
される。尚、閾値レジスタ92の内容は、閾値レ
ジスタ17の内容のように、平均高さ検出部7で
得られた文字塊の平均高さに基づいて設定しても
良い。比較部93において、閾値レジスタ92の
内容と減算部91の出力値とを比較する。閾値レ
ジスタ92の内容が減算部91の出力値よりも大
きければ、その出力信号931Sより“1”を出
力することによつて等ピツチ文字列の検出が可能
となる。閾値レジスタ92の内容が減算部91の
出力値よりも小さいか等しければ、その出力信号
931Sより“0”を出力することによつて可変
ピツチ文字列の検出が可能となる。
以上述べたように、本発明を適用することによ
り、隣接文字間の接触が生じやすくなる場合でも
安定に可変ピツチ文字列か等ピツチ文字列かを識
別することが可能となる。
り、隣接文字間の接触が生じやすくなる場合でも
安定に可変ピツチ文字列か等ピツチ文字列かを識
別することが可能となる。
第1図は、等ピツチ文字列イメージの一部を一
例として示した図である。第2図は、本発明の原
理を示すために示した文字塊幅の頻度分布の一例
を示した図である。第3図は本発明における具体
的一実施を示す論理ブロツク図である。図におい
て、1は走査装置、2は文字列イメージメモリ、
3は文字塊抽出装置、4は文字塊レジスタ、5は
頻度テーブルメモリ、6は制御装置、7は平均高
さ検出部、10は乗算部、11は+1加算回路、
12は一文字範囲設定レジスタ、13は最頻度幅
検出部、14は一文字幅クラスレジスタ、15,
16は定数レジスタ、17は閾値レジスタ、8は
一文字幅クラス検出部、81は一文字初期クラス
レジスタ、82はカウンター、83は頻度値レジ
スタ、84はゼロ検出部、85は減算部、86は
比較部、87はOR回路、9は判定部、92は閾
値レジスタ、91は減算部、93は比較部であ
る。
例として示した図である。第2図は、本発明の原
理を示すために示した文字塊幅の頻度分布の一例
を示した図である。第3図は本発明における具体
的一実施を示す論理ブロツク図である。図におい
て、1は走査装置、2は文字列イメージメモリ、
3は文字塊抽出装置、4は文字塊レジスタ、5は
頻度テーブルメモリ、6は制御装置、7は平均高
さ検出部、10は乗算部、11は+1加算回路、
12は一文字範囲設定レジスタ、13は最頻度幅
検出部、14は一文字幅クラスレジスタ、15,
16は定数レジスタ、17は閾値レジスタ、8は
一文字幅クラス検出部、81は一文字初期クラス
レジスタ、82はカウンター、83は頻度値レジ
スタ、84はゼロ検出部、85は減算部、86は
比較部、87はOR回路、9は判定部、92は閾
値レジスタ、91は減算部、93は比較部であ
る。
Claims (1)
- 1 紙面上に記載された文字列イメージを走査
し、個々の文字に分離する文字分離装置におい
て、2値量子化した前記文字列イメージから白ビ
ツト列で囲まれた複数個の文字塊を抽出し、前記
文字塊の高さ及び幅を得る手段と、複数個の前記
文字塊の幅に関する頻度情報を得る頻度テーブル
メモリと、複数個の前記文字塊の高さから、文字
塊の平均高さを得る手段と、前記文字塊の平均高
さを用いて一文字となり得る可能な文字塊の幅の
存在範囲を設定し、前記頻度テーブルメモリ内の
頻度情報から予め定められた許容幅で最頻度とな
る文字塊の幅の上限値及び下限値を前記存在範囲
内で得る手段と、前記上限値を前記頻度テーブル
メモリ内の頻度情報に基づいて更新し、一文字幅
クラスの上限値及び下限値を得る手段と、前記一
文字幅クラスの上限値及び下限値の広がり具合を
調べ、可変文字ピツチ文字列か等文字ピツチ文字
列かを識別する手段とを有することを特徴とする
文字ピツチ識別装置。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57229025A JPS59121589A (ja) | 1982-12-28 | 1982-12-28 | 文字ピッチ識別装置 |
| DE8383113182T DE3380462D1 (en) | 1982-12-28 | 1983-12-28 | Character pitch detecting apparatus |
| EP83113182A EP0113119B1 (en) | 1982-12-28 | 1983-12-28 | Character pitch detecting apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57229025A JPS59121589A (ja) | 1982-12-28 | 1982-12-28 | 文字ピッチ識別装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS59121589A JPS59121589A (ja) | 1984-07-13 |
| JPH0365584B2 true JPH0365584B2 (ja) | 1991-10-14 |
Family
ID=16885565
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57229025A Granted JPS59121589A (ja) | 1982-12-28 | 1982-12-28 | 文字ピッチ識別装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS59121589A (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2565150B2 (ja) * | 1988-04-28 | 1996-12-18 | セイコーエプソン株式会社 | 文字切り出し方法 |
| JP2570415B2 (ja) * | 1988-04-28 | 1997-01-08 | セイコーエプソン株式会社 | 文字切り出し方法 |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5339094B2 (ja) * | 1973-06-30 | 1978-10-19 |
-
1982
- 1982-12-28 JP JP57229025A patent/JPS59121589A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS59121589A (ja) | 1984-07-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0120334B1 (en) | Letter pitch detection system | |
| US8306325B2 (en) | Text character identification system and method thereof | |
| US4635290A (en) | Sectioning apparatus and method for optical character reader systems | |
| JPS63158678A (ja) | 単語間スペ−ス検出方法 | |
| CN111814780A (zh) | 一种票据图像处理方法、装置、设备及存储介质 | |
| JPH0365584B2 (ja) | ||
| JPH0430070B2 (ja) | ||
| US8391606B2 (en) | Image processing device, image processing method, and computer readable medium | |
| JPH0410087A (ja) | 基本ライン抽出方法 | |
| EP4036871A1 (en) | Image processing apparatus, image processing method, program and storage medium | |
| JPS59125477A (ja) | 文字ピツチ識別装置 | |
| EP0113119B1 (en) | Character pitch detecting apparatus | |
| JPH0368431B2 (ja) | ||
| JP2001251490A (ja) | 印刷制御装置、複写機、印刷制御方法、複写制御方法、印刷制御プログラムを記録した媒体及び複写制御プログラムを記録した媒体 | |
| JPS60164879A (ja) | 文字分離装置 | |
| JPH0259502B2 (ja) | ||
| JPH0468669B2 (ja) | ||
| JPH0471232B2 (ja) | ||
| JP2778436B2 (ja) | 文字切り出し装置 | |
| JP3006294B2 (ja) | 光学的文字読取装置 | |
| JP2001291058A (ja) | 文字認識装置及び記録媒体 | |
| JPH0632074B2 (ja) | 正規化方法 | |
| JPH0459670B2 (ja) | ||
| JPH11272795A (ja) | 文字読取装置と文字読取方法および文字検査装置と文字検査方法 | |
| CN119992573A (zh) | 用于在报告中提取检定信息的方法及装置及存储介质 |