JPH10261047A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH10261047A
JPH10261047A JP9066146A JP6614697A JPH10261047A JP H10261047 A JPH10261047 A JP H10261047A JP 9066146 A JP9066146 A JP 9066146A JP 6614697 A JP6614697 A JP 6614697A JP H10261047 A JPH10261047 A JP H10261047A
Authority
JP
Japan
Prior art keywords
character
character string
recognition device
character recognition
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9066146A
Other languages
English (en)
Inventor
Yoshinobu Hotsuta
悦伸 堀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP9066146A priority Critical patent/JPH10261047A/ja
Publication of JPH10261047A publication Critical patent/JPH10261047A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】イメージデータとして入力された画像データ
(文書画像)から文字を認識する文字認識装置に関し,
特にフリーピッチ領域に書かれた文字について,個々の
文字を正確に切り出し,認識する装置を提供することを
目的とする。 【解決手段】文書画像に対して,フィルタリング部3は
複数種類のフィルタリングを施し,結果をフィルタリン
グ画像格納部4へ記憶する。文字列抽出部7は,フィル
タリング画像からその画像の濃度値に基づいて文字列を
抽出し,さらに文字列方向を算出する。文字切り出し部
8は,文字列方向とフィルタリング画像の濃度情報をも
とに,ある濃度値内の領域を1文字として切り出し,文
字認識部9は,切り出された文字を認識する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,入力したイメージ
データから文字の切り出しを正確に行い,高い認識率を
得られるようにした文字認識装置に関する。
【0002】近年,手書き用の入力周辺機器として手書
き文字認識装置(OCR)の需要が増加している。手書
き文字認識装置において,個々の文字の高い認識率を実
現するためには,文字認識処理の前段階である文字切り
出しの正確性が重要になる。これまで,帳票等において
指定した位置に文字が正しく書かれたものに対しては,
文字の切り出し位置が明らかであるため高い精度で認識
することができた。しかし,個々の文字枠のないフリー
ピッチ領域に書かれた文字に対しては,文字の切り出し
誤りのために,文字認識率が低下する問題が生じてい
た。
【0003】本発明は,文字認識装置において特にフリ
ーピッチ領域における文字切り出し(セグメンテーショ
ン)処理の技術に関するものである。なお,本技術は手
書き文字認識装置だけでなく,印刷文字認識,図面認識
における文字の切り出しなど,広い意味での認識システ
ムの文字切り出し技術として用いることができる。
【0004】
【従来の技術】イメージスキャナ等により入力された手
書き文字等の文書イメージデータ(以下,「文書画像」
という)から,文字を切り出し,認識するための従来の
技術としては,文字の統合/切り出しを行う際に,文字
列に対して投影をとり,その白画素・黒画素の間隔をも
とに統合を行う方式(特開平4−98477号)や,視
覚の誘導場を計算し,複数の文字がつくり出す視覚の誘
導場を用いて文字の切り出しを行う方式(特開平6−2
15182号)などがある。
【0005】図10は,従来の技術を説明する図であ
る。図10に示す技術では,文字列に対して画素の投影
値を求め,投影結果から文字要素の統合/切り出しを行
う。
【0006】フリーピッチ領域に書かれる文字列では,
文字同士が近接して書かれる場合がある。このような場
合,従来技術のような投影を用いる方式では,文字同士
が非接触であっても,文字の要素同士が上下に重なる
(オーバーラップ)と,投影値に谷間ができず,それら
の文字を分離できないという問題点がある。
【0007】例えば,図10(A)の「ビニール」の文
字列では,「ビ」の濁点が投影結果に反映されている
が,図10(B)の「ビニール」の文字列の場合には,
「ビ」の濁点と次の文字「ニ」が上下に重なってしまい
(オーバーラップ),「ビ」の濁点は,「ニ」とは非接
触であっても投影結果としては「ニ」に含まれてしま
い,結果的に「ビ」および「ニ」の文字は正確に切り出
すことができなくなってしまう。
【0008】また,図10(A)の場合でも,「ル」の
ような分離文字に対しては,どこまでを1文字として切
り出したらよいかわかりにくいという問題がある。一
方,視覚の誘導場を計算して文字の統合/切り出しを行
うような方式では,連結画素間の近接度合いしかみてい
ないため,オーバーラップのない文字同士の間でも,そ
れらが近接して存在していると,統合された文字として
抽出されることがあるという問題があった。また,誘導
場の計算には,処理に莫大な時間(数時間)がかかると
いう問題もあった。
【0009】
【発明が解決しようとする課題】本発明は上記問題点の
解決を図り,フリーピッチ領域に書かれたような手書き
文字の認識等において,認識対象の文字列が傾いている
ような場合でも正しい文字の切り出しを行うことがで
き,文字の認識率を向上させることができるようにする
ことを目的とする。
【0010】
【課題を解決するための手段】図1は,本発明の構成例
を示す図である。図1において,1はイメージ受信部,
2はイメージ格納部,3はフィルタリング部,4はフィ
ルタリング画像格納部,5はラベリング部,6はラベリ
ング画像格納部,7は文字列抽出部,8は文字切り出し
部,9は文字認識部を表す。
【0011】イメージ受信部1は,イメージスキャナ等
により取り込まれた文書のイメージデータ(文書画像)
を受信し,イメージ格納部2に記憶する手段である。ラ
ベリング部5は,文書画像に対してラベリング処理を行
い,各々の連結画素群を求め,その結果(ラベリング画
像)をラベリング画像格納部6に格納する手段である。
【0012】フィルタリング部3は,フィルタ構成パラ
メータを変えてフィルタリングを行い,複数種類のフィ
ルタリング画像を得て,これをフィルタリング画像格納
部4へ記憶する手段である。フィルタリング部3は,特
定の方向に重み付けしたフィルタを用いてフィルタリン
グを行い,また,ラベリング画像から得たラベル外接矩
形のサイズヒストグラムから,その頻度分布より定まる
値の定数倍をフィルタサイズとする。さらに,フィルタ
構成パラメータを変える際に,ラベリング画像から得た
ラベル外接矩形のサイズヒストグラムまたはラベル外接
矩形間のピッチヒストグラムから,その頻度分布より定
まる値の定数倍をフィルタ構成パラメータとする。
【0013】文字列抽出部7は,フィルタリング画像の
画素濃度情報をもとに文字列を抽出する手段である。文
字列抽出部7は,フィルタリング画像のある濃度値内に
含まれるものを文字列として抽出し,前記フィルタリン
グ画像中の濃度値の濃い閉曲線の集合から文字列の軸を
算出し,その軸からある閾値内に存在する連結画素を集
めて同一文字列に属するものとする。また,文字列抽出
部7は,ある画素濃度値の閉曲線内で最大長さを持つ線
分をみつけ,その線分の方向を文字列方向とし,あるい
は,ある濃度値の閉曲線のモーメントを算出し,そのモ
ーメントから求まる方向を文字列方向とする。
【0014】文字切り出し部8は,抽出された文字列中
から文字を切り出す手段である。文字切り出し部8は,
文字列方向および画素濃度情報と,ラベリング画像とを
もとに文字を切り出す。また,文字認識部9からの文字
認識結果をもとに,認識確信度が高くなるように文字を
切り出す。
【0015】文字認識部9は,文字切り出し部8により
切り出された文字を認識する手段である。文字認識部9
は,画素濃度値を連結画素間の統合確率と捉え,ある連
結画素が他の複数の連結画素と同程度の確率を持つ場合
には,それを各々と統合したときの認識確信度を求め,
確信度の高いほうに統合して文字認識を行う。認識確信
度は,照合対象の標準パターンと入力パターンのマッチ
ングの距離等から求められる。
【0016】本発明は,以下のように作用する。本発明
では,原画像に対して,パラメータ値を変えた複数種類
のフィルタリングを施し,フィルタリングされた画像か
らその画素の濃度値に基づいて文字列を抽出し,文字の
切り出しを行う。複数のフィルタリング結果の画素濃度
情報に基づいて文字列の抽出および文字の切り出しを行
うので,比較的高速に安定した良好な結果を得ることが
できる。
【0017】具体的には,ラベリング部5のラベリング
処理により求まるラベル外接矩形のヒストグラムを算出
して平均文字サイズを推定する。次に,フィルタリング
部3は,この平均文字サイズの定数倍をフィルタサイズ
とし,さらにフィルタサイズよりフィルタ構成パラメー
タを決定する。続いて,そのフィルタ構成パラメータを
変えたフィルタのそれぞれについて,フィルタリング画
像を生成し,フィルタリング画像格納部4へ記憶する。
【0018】文字列抽出部7は,フィルタリング画像中
から同一濃度値内の領域を文字列として抽出し,また
は,高い濃度値の閉曲線の集合から文字列の軸を算出し
てその軸からある閾値内にある連結画素を集めて同一文
字列に属するものとし,さらに文字列の方向を算出す
る。
【0019】文字切り出し部8は,文字列方向と画素濃
度情報をもとに,文字列を抽出したときよりも高い同一
濃度値内の領域を1文字として抽出する。あるいは濃度
値を連結画素間の統合確率と捉え,確率の高い連結画素
の組み合わせごとに文字認識部9により認識処理を施
し,最も高い認識確信度を示した連結画素の組み合わせ
を1文字として切り出す。
【0020】文字認識部9は,この文字切り出し部8で
切り出された文字を認識する。
【0021】
【発明の実施の形態】以下,本発明の実施の形態につい
て説明する。 (1)ラベリング処理 ラベリング部5は,入力された文書画像の連結した黒画
素の領域をみつけて,同一の符号を付すラベリング処理
を行う。ラベリング処理された画像はラベリング画像格
納部6へ可能される。
【0022】(2)フィルタリング処理 フィルタとしては,例えばガウシアンフィルタを用い
る。σを標準偏差とするとガウシアンフィルタは次のよ
うに定義される。
【0023】
【数1】
【0024】画像をフィルタリングする際には,フィル
タサイズ(例えば3×3,5×5など)とσの値をいく
つか変えて行う。ここで,一般にガウシアンフィルタの
構成は等方的であるが,特定の方向に重みを付けたフィ
ルタを用いることにより,分離した文字要素からなる文
字(分離文字)の統合を容易にすることができる。例え
ば,横書きで書かれた文字列の場合には,「三」や
「シ」のような縦方向に分離した文字を統合しやすくす
るために,縦方向に重み付けしたガウシアンフィルタを
構成することが考えられる。具体的には,(式1)の
「x2 」の部分を「2x2 」とすれば,横方向に比べて
縦方向を重み付けしたフィルタが得られる。
【0025】図2は,フィルタリング部の処理フローチ
ャートである。ステップS11では,ラベリング画像格
納部6に格納された各ラベルに外接する矩形の高さ,幅
に関して,ヒストグラムの値を取得する。
【0026】ステップS12では,取得したヒストグラ
ムをもとにフィルタサイズを決定する。文書画像の場合
には,文字サイズ近傍の値が最も頻度が高くなるので,
その最頻値,または頻度が高い領域近傍の平均値などか
ら文字サイズを概算し,その定数倍をフィルタサイズと
する。これにより,文字の大きさに応じたフィルタサイ
ズを自動的に設定することができる。
【0027】ステップS13では,決定したフィルタサ
イズをもとに複数種類のフィルタ構成パラメータを決定
する。フィルタ構成パラメータ(σ)は,ガウシアンフ
ィルタを用いる場合には,「6σ<フィルタサイズ」の
条件を満たすように算出する。
【0028】図3は,フィルタ構成パラメータの例を示
す図である。図3(A)は,フィルタサイズ=7,σ=
3の場合のパラメータ値,図3(B)は,フィルタサイ
ズ=3,σ=1の場合のパラメータ値を示している。こ
の例は等方的であるが,縦方向または横方向などの特定
方向に重み付けをしたパラメータ値を用いることも有効
である。
【0029】ステップS14では,フィルタリングを行
う。ステップS12およびS13の処理で求めたフィル
タ構成パラメータを用いてフィルタリングを行うことに
より,複数種類のフィルタリング画像を得て,フィルタ
リング画像格納部4に格納する。
【0030】(3)文字列抽出処理 フィルタリング画像に対し,ある一定濃度値をとる画素
をたどると,それはいわば濃度の等高線であり,閉曲線
を構成する。文字列の場合には,文字の並びの方向に長
い閉曲線となる。そこで,フィルタ構成パラメータ
(σ)の大きいフィルタを用いて処理した画像につい
て,ある低い濃度値の閉曲線から順にみていき,文字の
並びの垂直方向の高さが,文字サイズとほぼ同じ大きさ
になる閉曲線を見つける。そして,その閉曲線内に含ま
れる文字群を1つの文字列とすることで文字列を抽出す
る。
【0031】図4は,文字列抽出部の処理フローチャー
ト(1)を示す図である。ステップS21では,文字列
抽出部7は,フィルタリング画像の最小濃度値をセット
する。
【0032】ステップS22では,濃度値を少し高く設
定する。ステップS23では,その濃度値をとる画素を
たどり,同じ濃度値の閉曲線を抽出する。
【0033】ステップS24では,抽出した閉曲線の最
大長さ方向に垂直な方向の高さが文字サイズと等しいか
どうかを判定する。閉曲線の最大長さ方向に垂直な方向
の高さが文字サイズとほぼ等しい場合にはステップS2
5の処理へ進み,そうでない場合にはステップS22の
処理へ戻り,閉曲線の最大長さ方向に垂直な方向の高さ
が文字サイズと等しくなるまで処理を繰り返す。
【0034】別の文字列抽出方法としては,濃度値の高
い閉曲線に着目する方法もある。濃度値の高い閉曲線に
着目すると,大体1文字ごとに濃度値の高い閉曲線が得
られる。それらの閉曲線は近接して,ある方向,すなわ
ち文字列方向を示す。そこで,それらの閉曲線を通る直
線を文字列軸として,例えば最小2乗法を用いて文字列
軸の直線を算出し,その文字列軸近傍の文字を抽出し
て,それらを1つの文字列とみなす。
【0035】図5は,この第2の方法による文字列抽出
部の処理フローチャート(2)を示す図である。ステッ
プS31では,文字列抽出部7は,フィルタリング画像
から濃度値の高い閉曲線を抽出する。
【0036】ステップS32では,それぞれの閉曲線の
中心位置を算出する。ステップS33では,中心位置を
最もよく通る直線を,最小2乗法などにより算出する。
【0037】ステップS34では,直線との距離が閾値
以内の連結画素を抽出する。ステップS35では,それ
らを1つの文字列とみなす。 (4)文字列方向算出処理 文字列抽出部7は,さらに抽出した文字列の文字列方向
を算出する。
【0038】文字列方向を算出する方法としては,図6
に示すように,例えば閉曲線内で最も長くなる線分を見
つけて,その線分の方向を文字列方向とする方法があ
る。また,別の方法として,図7に示すように,閉曲線
のモーメントを用いる方法がある。モーメントを用いる
場合は,以下のようになる。(p+q)次の重心回りの
モーメントを次のように表す。
【0039】
【数2】
【0040】ここで,閉曲線の座標をf(x,y),そ
の重心座標を(xg ,yg )とする。このときx軸と閉
曲線のなす角θは,
【0041】
【数3】
【0042】として表されるので,θを文字列方向とす
る。 (5)文字切り出し処理および文字認識処理 文字列内の文字並びが粗な場合には,フィルタリング画
像について,ある濃度値内の連結画素すべてを1文字を
構成する画素とみなして,それらを1文字として切り出
し,文字認識を行う。このとき,縦方向に重み付けした
フィルタを用いたフィルタリング画像を対象とすれば,
隣接する文字間の閉曲線が接触する割合が減少し,文字
切り出し,文字認識が容易となる。
【0043】また,文字列内の文字並びが粗でない場
合,画素濃度値を連結画素間の統合確率と捉え,確率の
高い連結画素の組み合わせごとに認識処理を施す。ある
連結画素が他の複数の連結画素と同程度の確率を持つ場
合には,それを各々と統合したときの認識確信度を求
め,確信度の高いほうに統合する。
【0044】
【実施例】図8および図9は,本発明の実施例における
画像のフィルタリング結果を示す図である。
【0045】図8は,印刷文字の文書画像に対して,フ
ィルタ構成パラメータ(σ)を変えてフィルタリングを
行ったフィルタリング画像の例を示している。図8
(A)はσ=5の場合,図8(B)はσ=20の場合,
図8(C)はσ=60の場合のガウシアンフィルタによ
るフィルタリング画像を示す。この例では,図8(B)
のσ=20のフィルタリング画像を用いて文字列の方向
および文字列を抽出している。
【0046】図9は,手書き文字の文書画像に対して,
フィルタ構成パラメータ(σ)を変えてフィルタリング
を行った結果を示す。図9では,画素濃度値の濃淡が分
かりやすいように,画素濃度値の等高線に沿って縞模様
で表している。縞模様で表される領域の中央部に近いほ
うが画素濃度値が高い。
【0047】図9(A)は,入力手書き文字の例を示
し,図9(B)はσ=3の場合,図9(C)はσ=6の
場合,図9(D)はσ=9の場合,図9(E)はσ=1
5の場合,図9(F)はσ=21の場合のガウシアンフ
ィルタによるフィルタリング画像を示している。
【0048】図9(F)に示すσ=21のフィルタリン
グ画像の最小濃度値内で文字列が1つの閉曲線内に含ま
れている。また,図9(D)に示すσ=9のフィルタリ
ング画像において,最小濃度値内で1つの閉曲線が1文
字にほぼ対応している。したがって,σ=21のフィル
タリング画像の最小濃度値内で文字列の方向と文字列を
抽出し,σ=9のフィルタリング画像の最小濃度値で各
文字を切り出すことができる。
【0049】
【発明の効果】以上説明したように,本発明によれば以
下のような効果を奏する。 1.請求項1記載の発明では,複数種類のフィルタリン
グ画像の画素濃度情報をもとに文字列を抽出するので,
比較的簡単な処理により文書の傾きに依存せずに文字列
を抽出することが可能である。フィルタ構成パラメータ
の決定に際しては,その値が自動的に決定されるため,
人間が経験的に値を決定する必要がない。また,「ハ」
「ツ」「テ」などの分離文字も,文字列が密でなければ
自動的に1文字として切り出されてくる。
【0050】2.請求項2記載のものでは,フィルタ構
成パラメータを変えた画像を同時に得ておくことによ
り,文字列抽出から文字切り出しまでを同一手法で行う
ことができ,処理の簡素化が可能となる。
【0051】3.請求項3記載のものでは,特定の方向
に重み付けしたフィルタを用いることにより,隣接文字
同士の誤統合を防ぎ,文字の切り出しを正確に行うこと
が可能となる。
【0052】4.請求項4記載のものでは,ラベル外接
矩形のヒストグラムからフィルタサイズを自動的に算出
することにより,あらかじめサイズの閾値を決めておく
必要がなく,さらに様々な文字サイズの文字データに対
応することができる。
【0053】5.請求項5記載のものでは,フィルタ構
成パラメータを変える際に,前記のフィルタサイズから
自動的に算出することにより,あらかじめパラメータ値
を設定しておく必要がない。
【0054】6.請求項6記載のものでは,フィルタ構
成パラメータを変える際に,文字列内の文字ピッチから
自動的に算出することにより,あらかじめパラメータ値
を設定しておく必要がない。
【0055】7.請求項7記載のものでは,ある濃度値
の閉曲線内に含まれるものを文字列とすることにより,
文字列の抽出にあたって連結画素間の位置関係を細かく
計算する必要がない。
【0056】8.請求項8記載のものでは,小さい連結
画素はフィルタリングにより消失して,大きい連結画素
だけが濃度値の高い閉曲線を構成するようになることに
より,ノイズなどに影響されずに正しく文字列を抽出す
ることが可能である。
【0057】9.請求項9記載のものでは,閉曲線内の
線分を求める処理が簡単なことにより,文字列の方向を
素早くみつけることが可能である。 10.請求項10記載のものでは,閉曲線のモーメント
を用いることにより,文字列の方向を正確に算出するこ
とが可能となる。
【0058】11.白黒(2値)画像では,ある連結画
素が,文字の中心部から遠いのか近いのかを判定するの
が困難であるが,請求項11記載のものでは,フィルタ
リングに基づく画素濃度情報を用いることにより,ある
連結画素が,文字の中心部から遠いのか近いのかがわか
り,さらに濃度値を統合の確信度としてとらえることが
でき,連結画素間の統合関係の把握が容易となる。
【0059】12.請求項12記載のものでは,文字列
が粗な場合,分離文字の各要素,例えば「ソ」の左部分
と右部分などはある濃度値の閉曲線内に含まれる。これ
により,連結画素間の統合条件を定める必要がなく,文
字種,文字サイズに依存しない文字切り出し処理を自動
的に行うことが可能となる。
【0060】13.請求項13記載のものでは,濃度値
をそのまま連結画素間の統合確率とみなすことにより,
確率計算を容易に行うことができる。また,統合確率に
基づいて認識処理を併用した文字切り出しを行うことに
より,正しく文字切り出しを行うことが可能となる。
【図面の簡単な説明】
【図1】本発明の構成例を示す図である。
【図2】フィルタリング部の処理フローチャートであ
る。
【図3】フィルタ構成パラメータの例を示す図である。
【図4】文字列抽出部の処理フローチャート(1)であ
る。
【図5】文字列抽出部の処理フローチャート(2)であ
る。
【図6】文字列方向抽出方法の例を示す図である。
【図7】文字列方向抽出方法の例を示す図である。
【図8】印刷文字の文書画像に対する複数種類のパラメ
ータによるフィルタリング画像の例を示す図である。
【図9】手書き文字の文書画像に対する複数種類のパラ
メータによるフィルタリング画像の例を示す図である。
【図10】従来の技術を説明する図である。
【符号の説明】
1 イメージ受信部 2 イメージ格納部 3 フィルタリング部 4 フィルタリング画像格納部 5 ラベリング部 6 ラベリング画像格納部 7 文字列抽出部 8 文字切り出し部 9 文字認識部

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 イメージデータとして入力された画像デ
    ータから文字を認識する文字認識装置であって,入力画
    像に複数種類のフィルタリングを行うフィルタリング手
    段と,前記フィルタリング手段によりフィルタリングさ
    れた画像の画素濃度情報をもとに文字列を抽出する文字
    列抽出手段と,前記文字列抽出手段により抽出された文
    字列中から文字を切り出し,認識する文字切り出し・認
    識手段とを備えることを特徴とする文字認識装置。
  2. 【請求項2】 請求項1記載の文字認識装置において,
    前記フィルタリング手段は,フィルタの構成パラメータ
    を変えてフィルタリングを行うことにより複数種類のフ
    ィルタリング画像を得ることを特徴とする文字認識装
    置。
  3. 【請求項3】 請求項1記載の文字認識装置において,
    前記フィルタリング手段は,特定の方向に重み付けした
    フィルタを用いてフィルタリングを行うことを特徴とす
    る文字認識装置。
  4. 【請求項4】 請求項1記載の文字認識装置において,
    前記フィルタリング手段は,原画像に対してラベリング
    処理を施した結果から得た各ラベルに外接する矩形のサ
    イズヒストグラムをもとに,その頻度分布より定まる値
    の定数倍をフィルタサイズとすることを特徴とする文字
    認識装置。
  5. 【請求項5】 請求項2記載の文字認識装置において,
    前記フィルタリング手段は,フィルタ構成パラメータを
    変える際に,原画像に対してラベリング処理を施した結
    果から得た各ラベルに外接する矩形のサイズヒストグラ
    ムをもとに,その頻度分布より定まる値の定数倍をフィ
    ルタ構成パラメータとすることを特徴とする文字認識装
    置。
  6. 【請求項6】 請求項2記載の文字認識装置において,
    前記フィルタリング手段は,フィルタ構成パラメータを
    変える際に,原画像に対してラベリング処理を施した結
    果から得た各ラベルに外接する矩形のピッチヒストグラ
    ムをもとに,その頻度分布より定まる値の定数倍をフィ
    ルタ構成パラメータとすることを特徴とする文字認識装
    置。
  7. 【請求項7】 請求項1記載の文字認識装置において,
    前記文字列抽出手段は,前記フィルタリング画像の中か
    ら,ある濃度値内に含まれるものを文字列として抽出す
    ることを特徴とする文字認識装置。
  8. 【請求項8】 請求項1記載の文字認識装置において,
    前記文字列抽出手段は,前記フィルタリング画像中の濃
    度値の高い閉曲線の集合から文字列の軸を算出し,その
    軸からある閾値内に存在する連結画素を集めて同一文字
    列に属するものを定めることを特徴とする文字認識装
    置。
  9. 【請求項9】 請求項1記載の文字認識装置において,
    前記文字列抽出手段は,文字列の方向を算出する際に,
    ある画素濃度値の閉曲線内で最大長さを持つ線分を求
    め,その線分の方向を文字列の方向とすることを特徴と
    する文字認識装置。
  10. 【請求項10】 請求項1記載の文字認識装置におい
    て,前記文字列抽出手段は,文字列の方向を算出する際
    に,ある濃度値の閉曲線のモーメントを算出し,そのモ
    ーメントから求まる方向を文字列の方向とすることを特
    徴とする文字認識装置。
  11. 【請求項11】 請求項1記載の文字認識装置におい
    て,前記文字切り出し・認識手段は,前記文字列抽出手
    段により抽出された文字列の方向と,前記フィルタリン
    グ画像の画素濃度情報をもとに文字を切り出すことを特
    徴とする文字認識装置。
  12. 【請求項12】 請求項11記載の文字認識装置におい
    て,前記文字切り出し・認識手段は,前記フィルタリン
    グ画像におけるある画素濃度値内の画像を1文字として
    切り出すことを特徴とする文字認識装置。
  13. 【請求項13】 請求項1記載の文字認識装置におい
    て,前記文字切り出し・認識手段は,画素濃度値を連結
    画素間の統合確率と捉え,ある連結画素が他の複数の連
    結画素と同程度の確率を持つ場合には,それを各々と統
    合したときの認識確信度を求め,確信度の高いほうに統
    合することを特徴とする文字認識装置。
JP9066146A 1997-03-19 1997-03-19 文字認識装置 Withdrawn JPH10261047A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9066146A JPH10261047A (ja) 1997-03-19 1997-03-19 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9066146A JPH10261047A (ja) 1997-03-19 1997-03-19 文字認識装置

Publications (1)

Publication Number Publication Date
JPH10261047A true JPH10261047A (ja) 1998-09-29

Family

ID=13307444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9066146A Withdrawn JPH10261047A (ja) 1997-03-19 1997-03-19 文字認識装置

Country Status (1)

Country Link
JP (1) JPH10261047A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009098777A (ja) * 2007-10-15 2009-05-07 Fuji Xerox Co Ltd データ処理装置及びデータ処理プログラム
US8213748B2 (en) 2008-02-26 2012-07-03 Fuji Xerox Co., Ltd. Generating an electronic document with reference to allocated font corresponding to character identifier from an image
US8411955B2 (en) 2007-02-21 2013-04-02 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium
JP2013257866A (ja) * 2012-06-12 2013-12-26 Xerox Corp 自然風景の中のテキストの発見
JP2021061018A (ja) * 2017-12-06 2021-04-15 コグネックス・コーポレイション シンボル読み取りのためのローカルトーンマッピング

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8411955B2 (en) 2007-02-21 2013-04-02 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium
JP2009098777A (ja) * 2007-10-15 2009-05-07 Fuji Xerox Co Ltd データ処理装置及びデータ処理プログラム
US8213748B2 (en) 2008-02-26 2012-07-03 Fuji Xerox Co., Ltd. Generating an electronic document with reference to allocated font corresponding to character identifier from an image
JP2013257866A (ja) * 2012-06-12 2013-12-26 Xerox Corp 自然風景の中のテキストの発見
JP2021061018A (ja) * 2017-12-06 2021-04-15 コグネックス・コーポレイション シンボル読み取りのためのローカルトーンマッピング

Similar Documents

Publication Publication Date Title
Llorens et al. Car license plates extraction and recognition based on connected components analysis and HMM decoding
JP6080259B2 (ja) 文字切り出し装置及び文字切り出し方法
US20060008147A1 (en) Apparatus, medium, and method for extracting character(s) from an image
JPH096957A (ja) 濃度画像の2値化方法および画像2値化装置
WO2013076358A1 (en) Text detection using multi-layer connected components with histograms
CN112580447B (zh) 一种基于边缘二阶统计与融合的电力线检测方法
JPH0737103A (ja) 傾き角度検出装置
JPH06215293A (ja) 車番認識装置
Yoon et al. Blob extraction based character segmentation method for automatic license plate recognition system
JP2002228423A (ja) タイヤ検出方法および装置
Çavdaroğlu et al. A character segmentation method to increase character recognition accuracy for Turkish number plates
Rastegar et al. An intelligent control system using an efficient License Plate Location and Recognition Approach
JPH09311905A (ja) 行検出方法および文字認識装置
JPH10261047A (ja) 文字認識装置
JP2006155126A (ja) 車両番号認識装置
JPH08305795A (ja) 文字認識方法
JP2898562B2 (ja) ナンバープレート決定方法
Siddique et al. Development of an automatic vehicle license plate detection and recognition system for Bangladesh
JP4264332B2 (ja) 文字認識装置、ナンバープレート認識システム
JP2005250786A (ja) 画像認識方法
JP2868134B2 (ja) 画像処理方法及び装置
US20070104376A1 (en) Apparatus and method of recognizing characters contained in image
JP2872768B2 (ja) 文字切出し装置
JP2000357287A (ja) ナンバープレート認識方法および認識装置
Winger et al. Low-complexity character extraction in low-contrast scene images

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20040601