JPH10261047A

JPH10261047A - 文字認識装置

Info

Publication number: JPH10261047A
Application number: JP9066146A
Authority: JP
Inventors: Yoshinobu Hotsuta; 悦伸堀田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1997-03-19
Filing date: 1997-03-19
Publication date: 1998-09-29

Abstract

(57)【要約】【課題】イメージデータとして入力された画像データ
（文書画像）から文字を認識する文字認識装置に関し，
特にフリーピッチ領域に書かれた文字について，個々の
文字を正確に切り出し，認識する装置を提供することを
目的とする。【解決手段】文書画像に対して，フィルタリング部３は
複数種類のフィルタリングを施し，結果をフィルタリン
グ画像格納部４へ記憶する。文字列抽出部７は，フィル
タリング画像からその画像の濃度値に基づいて文字列を
抽出し，さらに文字列方向を算出する。文字切り出し部
８は，文字列方向とフィルタリング画像の濃度情報をも
とに，ある濃度値内の領域を１文字として切り出し，文
字認識部９は，切り出された文字を認識する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は，入力したイメージ
データから文字の切り出しを正確に行い，高い認識率を
得られるようにした文字認識装置に関する。

【０００２】近年，手書き用の入力周辺機器として手書
き文字認識装置（ＯＣＲ）の需要が増加している。手書
き文字認識装置において，個々の文字の高い認識率を実
現するためには，文字認識処理の前段階である文字切り
出しの正確性が重要になる。これまで，帳票等において
指定した位置に文字が正しく書かれたものに対しては，
文字の切り出し位置が明らかであるため高い精度で認識
することができた。しかし，個々の文字枠のないフリー
ピッチ領域に書かれた文字に対しては，文字の切り出し
誤りのために，文字認識率が低下する問題が生じてい
た。

【０００３】本発明は，文字認識装置において特にフリ
ーピッチ領域における文字切り出し（セグメンテーショ
ン）処理の技術に関するものである。なお，本技術は手
書き文字認識装置だけでなく，印刷文字認識，図面認識
における文字の切り出しなど，広い意味での認識システ
ムの文字切り出し技術として用いることができる。

【０００４】

【従来の技術】イメージスキャナ等により入力された手
書き文字等の文書イメージデータ（以下，「文書画像」
という）から，文字を切り出し，認識するための従来の
技術としては，文字の統合／切り出しを行う際に，文字
列に対して投影をとり，その白画素・黒画素の間隔をも
とに統合を行う方式（特開平４−９８４７７号）や，視
覚の誘導場を計算し，複数の文字がつくり出す視覚の誘
導場を用いて文字の切り出しを行う方式（特開平６−２
１５１８２号）などがある。

【０００５】図１０は，従来の技術を説明する図であ
る。図１０に示す技術では，文字列に対して画素の投影
値を求め，投影結果から文字要素の統合／切り出しを行
う。

【０００６】フリーピッチ領域に書かれる文字列では，
文字同士が近接して書かれる場合がある。このような場
合，従来技術のような投影を用いる方式では，文字同士
が非接触であっても，文字の要素同士が上下に重なる
（オーバーラップ）と，投影値に谷間ができず，それら
の文字を分離できないという問題点がある。

【０００７】例えば，図１０（Ａ）の「ビニール」の文
字列では，「ビ」の濁点が投影結果に反映されている
が，図１０（Ｂ）の「ビニール」の文字列の場合には，
「ビ」の濁点と次の文字「ニ」が上下に重なってしまい
（オーバーラップ），「ビ」の濁点は，「ニ」とは非接
触であっても投影結果としては「ニ」に含まれてしま
い，結果的に「ビ」および「ニ」の文字は正確に切り出
すことができなくなってしまう。

【０００８】また，図１０（Ａ）の場合でも，「ル」の
ような分離文字に対しては，どこまでを１文字として切
り出したらよいかわかりにくいという問題がある。一
方，視覚の誘導場を計算して文字の統合／切り出しを行
うような方式では，連結画素間の近接度合いしかみてい
ないため，オーバーラップのない文字同士の間でも，そ
れらが近接して存在していると，統合された文字として
抽出されることがあるという問題があった。また，誘導
場の計算には，処理に莫大な時間（数時間）がかかると
いう問題もあった。

【０００９】

【発明が解決しようとする課題】本発明は上記問題点の
解決を図り，フリーピッチ領域に書かれたような手書き
文字の認識等において，認識対象の文字列が傾いている
ような場合でも正しい文字の切り出しを行うことがで
き，文字の認識率を向上させることができるようにする
ことを目的とする。

【００１０】

【課題を解決するための手段】図１は，本発明の構成例
を示す図である。図１において，１はイメージ受信部，
２はイメージ格納部，３はフィルタリング部，４はフィ
ルタリング画像格納部，５はラベリング部，６はラベリ
ング画像格納部，７は文字列抽出部，８は文字切り出し
部，９は文字認識部を表す。

【００１１】イメージ受信部１は，イメージスキャナ等
により取り込まれた文書のイメージデータ（文書画像）
を受信し，イメージ格納部２に記憶する手段である。ラ
ベリング部５は，文書画像に対してラベリング処理を行
い，各々の連結画素群を求め，その結果（ラベリング画
像）をラベリング画像格納部６に格納する手段である。

【００１２】フィルタリング部３は，フィルタ構成パラ
メータを変えてフィルタリングを行い，複数種類のフィ
ルタリング画像を得て，これをフィルタリング画像格納
部４へ記憶する手段である。フィルタリング部３は，特
定の方向に重み付けしたフィルタを用いてフィルタリン
グを行い，また，ラベリング画像から得たラベル外接矩
形のサイズヒストグラムから，その頻度分布より定まる
値の定数倍をフィルタサイズとする。さらに，フィルタ
構成パラメータを変える際に，ラベリング画像から得た
ラベル外接矩形のサイズヒストグラムまたはラベル外接
矩形間のピッチヒストグラムから，その頻度分布より定
まる値の定数倍をフィルタ構成パラメータとする。

【００１３】文字列抽出部７は，フィルタリング画像の
画素濃度情報をもとに文字列を抽出する手段である。文
字列抽出部７は，フィルタリング画像のある濃度値内に
含まれるものを文字列として抽出し，前記フィルタリン
グ画像中の濃度値の濃い閉曲線の集合から文字列の軸を
算出し，その軸からある閾値内に存在する連結画素を集
めて同一文字列に属するものとする。また，文字列抽出
部７は，ある画素濃度値の閉曲線内で最大長さを持つ線
分をみつけ，その線分の方向を文字列方向とし，あるい
は，ある濃度値の閉曲線のモーメントを算出し，そのモ
ーメントから求まる方向を文字列方向とする。

【００１４】文字切り出し部８は，抽出された文字列中
から文字を切り出す手段である。文字切り出し部８は，
文字列方向および画素濃度情報と，ラベリング画像とを
もとに文字を切り出す。また，文字認識部９からの文字
認識結果をもとに，認識確信度が高くなるように文字を
切り出す。

【００１５】文字認識部９は，文字切り出し部８により
切り出された文字を認識する手段である。文字認識部９
は，画素濃度値を連結画素間の統合確率と捉え，ある連
結画素が他の複数の連結画素と同程度の確率を持つ場合
には，それを各々と統合したときの認識確信度を求め，
確信度の高いほうに統合して文字認識を行う。認識確信
度は，照合対象の標準パターンと入力パターンのマッチ
ングの距離等から求められる。

【００１６】本発明は，以下のように作用する。本発明
では，原画像に対して，パラメータ値を変えた複数種類
のフィルタリングを施し，フィルタリングされた画像か
らその画素の濃度値に基づいて文字列を抽出し，文字の
切り出しを行う。複数のフィルタリング結果の画素濃度
情報に基づいて文字列の抽出および文字の切り出しを行
うので，比較的高速に安定した良好な結果を得ることが
できる。

【００１７】具体的には，ラベリング部５のラベリング
処理により求まるラベル外接矩形のヒストグラムを算出
して平均文字サイズを推定する。次に，フィルタリング
部３は，この平均文字サイズの定数倍をフィルタサイズ
とし，さらにフィルタサイズよりフィルタ構成パラメー
タを決定する。続いて，そのフィルタ構成パラメータを
変えたフィルタのそれぞれについて，フィルタリング画
像を生成し，フィルタリング画像格納部４へ記憶する。

【００１８】文字列抽出部７は，フィルタリング画像中
から同一濃度値内の領域を文字列として抽出し，また
は，高い濃度値の閉曲線の集合から文字列の軸を算出し
てその軸からある閾値内にある連結画素を集めて同一文
字列に属するものとし，さらに文字列の方向を算出す
る。

【００１９】文字切り出し部８は，文字列方向と画素濃
度情報をもとに，文字列を抽出したときよりも高い同一
濃度値内の領域を１文字として抽出する。あるいは濃度
値を連結画素間の統合確率と捉え，確率の高い連結画素
の組み合わせごとに文字認識部９により認識処理を施
し，最も高い認識確信度を示した連結画素の組み合わせ
を１文字として切り出す。

【００２０】文字認識部９は，この文字切り出し部８で
切り出された文字を認識する。

【００２１】

【発明の実施の形態】以下，本発明の実施の形態につい
て説明する。（１）ラベリング処理ラベリング部５は，入力された文書画像の連結した黒画
素の領域をみつけて，同一の符号を付すラベリング処理
を行う。ラベリング処理された画像はラベリング画像格
納部６へ可能される。

【００２２】（２）フィルタリング処理フィルタとしては，例えばガウシアンフィルタを用い
る。σを標準偏差とするとガウシアンフィルタは次のよ
うに定義される。

【００２３】

【数１】

【００２４】画像をフィルタリングする際には，フィル
タサイズ（例えば３×３，５×５など）とσの値をいく
つか変えて行う。ここで，一般にガウシアンフィルタの
構成は等方的であるが，特定の方向に重みを付けたフィ
ルタを用いることにより，分離した文字要素からなる文
字（分離文字）の統合を容易にすることができる。例え
ば，横書きで書かれた文字列の場合には，「三」や
「シ」のような縦方向に分離した文字を統合しやすくす
るために，縦方向に重み付けしたガウシアンフィルタを
構成することが考えられる。具体的には，（式１）の
「ｘ²」の部分を「２ｘ²」とすれば，横方向に比べて
縦方向を重み付けしたフィルタが得られる。

【００２５】図２は，フィルタリング部の処理フローチ
ャートである。ステップＳ１１では，ラベリング画像格
納部６に格納された各ラベルに外接する矩形の高さ，幅
に関して，ヒストグラムの値を取得する。

【００２６】ステップＳ１２では，取得したヒストグラ
ムをもとにフィルタサイズを決定する。文書画像の場合
には，文字サイズ近傍の値が最も頻度が高くなるので，
その最頻値，または頻度が高い領域近傍の平均値などか
ら文字サイズを概算し，その定数倍をフィルタサイズと
する。これにより，文字の大きさに応じたフィルタサイ
ズを自動的に設定することができる。

【００２７】ステップＳ１３では，決定したフィルタサ
イズをもとに複数種類のフィルタ構成パラメータを決定
する。フィルタ構成パラメータ（σ）は，ガウシアンフ
ィルタを用いる場合には，「６σ＜フィルタサイズ」の
条件を満たすように算出する。

【００２８】図３は，フィルタ構成パラメータの例を示
す図である。図３（Ａ）は，フィルタサイズ＝７，σ＝
３の場合のパラメータ値，図３（Ｂ）は，フィルタサイ
ズ＝３，σ＝１の場合のパラメータ値を示している。こ
の例は等方的であるが，縦方向または横方向などの特定
方向に重み付けをしたパラメータ値を用いることも有効
である。

【００２９】ステップＳ１４では，フィルタリングを行
う。ステップＳ１２およびＳ１３の処理で求めたフィル
タ構成パラメータを用いてフィルタリングを行うことに
より，複数種類のフィルタリング画像を得て，フィルタ
リング画像格納部４に格納する。

【００３０】（３）文字列抽出処理フィルタリング画像に対し，ある一定濃度値をとる画素
をたどると，それはいわば濃度の等高線であり，閉曲線
を構成する。文字列の場合には，文字の並びの方向に長
い閉曲線となる。そこで，フィルタ構成パラメータ
（σ）の大きいフィルタを用いて処理した画像につい
て，ある低い濃度値の閉曲線から順にみていき，文字の
並びの垂直方向の高さが，文字サイズとほぼ同じ大きさ
になる閉曲線を見つける。そして，その閉曲線内に含ま
れる文字群を１つの文字列とすることで文字列を抽出す
る。

【００３１】図４は，文字列抽出部の処理フローチャー
ト（１）を示す図である。ステップＳ２１では，文字列
抽出部７は，フィルタリング画像の最小濃度値をセット
する。

【００３２】ステップＳ２２では，濃度値を少し高く設
定する。ステップＳ２３では，その濃度値をとる画素を
たどり，同じ濃度値の閉曲線を抽出する。

【００３３】ステップＳ２４では，抽出した閉曲線の最
大長さ方向に垂直な方向の高さが文字サイズと等しいか
どうかを判定する。閉曲線の最大長さ方向に垂直な方向
の高さが文字サイズとほぼ等しい場合にはステップＳ２
５の処理へ進み，そうでない場合にはステップＳ２２の
処理へ戻り，閉曲線の最大長さ方向に垂直な方向の高さ
が文字サイズと等しくなるまで処理を繰り返す。

【００３４】別の文字列抽出方法としては，濃度値の高
い閉曲線に着目する方法もある。濃度値の高い閉曲線に
着目すると，大体１文字ごとに濃度値の高い閉曲線が得
られる。それらの閉曲線は近接して，ある方向，すなわ
ち文字列方向を示す。そこで，それらの閉曲線を通る直
線を文字列軸として，例えば最小２乗法を用いて文字列
軸の直線を算出し，その文字列軸近傍の文字を抽出し
て，それらを１つの文字列とみなす。

【００３５】図５は，この第２の方法による文字列抽出
部の処理フローチャート（２）を示す図である。ステッ
プＳ３１では，文字列抽出部７は，フィルタリング画像
から濃度値の高い閉曲線を抽出する。

【００３６】ステップＳ３２では，それぞれの閉曲線の
中心位置を算出する。ステップＳ３３では，中心位置を
最もよく通る直線を，最小２乗法などにより算出する。

【００３７】ステップＳ３４では，直線との距離が閾値
以内の連結画素を抽出する。ステップＳ３５では，それ
らを１つの文字列とみなす。（４）文字列方向算出処理文字列抽出部７は，さらに抽出した文字列の文字列方向
を算出する。

【００３８】文字列方向を算出する方法としては，図６
に示すように，例えば閉曲線内で最も長くなる線分を見
つけて，その線分の方向を文字列方向とする方法があ
る。また，別の方法として，図７に示すように，閉曲線
のモーメントを用いる方法がある。モーメントを用いる
場合は，以下のようになる。（ｐ＋ｑ）次の重心回りの
モーメントを次のように表す。

【００３９】

【数２】

【００４０】ここで，閉曲線の座標をｆ（ｘ，ｙ），そ
の重心座標を（ｘ_g，ｙ_g）とする。このときｘ軸と閉
曲線のなす角θは，

【００４１】

【数３】

【００４２】として表されるので，θを文字列方向とす
る。（５）文字切り出し処理および文字認識処理文字列内の文字並びが粗な場合には，フィルタリング画
像について，ある濃度値内の連結画素すべてを１文字を
構成する画素とみなして，それらを１文字として切り出
し，文字認識を行う。このとき，縦方向に重み付けした
フィルタを用いたフィルタリング画像を対象とすれば，
隣接する文字間の閉曲線が接触する割合が減少し，文字
切り出し，文字認識が容易となる。

【００４３】また，文字列内の文字並びが粗でない場
合，画素濃度値を連結画素間の統合確率と捉え，確率の
高い連結画素の組み合わせごとに認識処理を施す。ある
連結画素が他の複数の連結画素と同程度の確率を持つ場
合には，それを各々と統合したときの認識確信度を求
め，確信度の高いほうに統合する。

【００４４】

【実施例】図８および図９は，本発明の実施例における
画像のフィルタリング結果を示す図である。

【００４５】図８は，印刷文字の文書画像に対して，フ
ィルタ構成パラメータ（σ）を変えてフィルタリングを
行ったフィルタリング画像の例を示している。図８
（Ａ）はσ＝５の場合，図８（Ｂ）はσ＝２０の場合，
図８（Ｃ）はσ＝６０の場合のガウシアンフィルタによ
るフィルタリング画像を示す。この例では，図８（Ｂ）
のσ＝２０のフィルタリング画像を用いて文字列の方向
および文字列を抽出している。

【００４６】図９は，手書き文字の文書画像に対して，
フィルタ構成パラメータ（σ）を変えてフィルタリング
を行った結果を示す。図９では，画素濃度値の濃淡が分
かりやすいように，画素濃度値の等高線に沿って縞模様
で表している。縞模様で表される領域の中央部に近いほ
うが画素濃度値が高い。

【００４７】図９（Ａ）は，入力手書き文字の例を示
し，図９（Ｂ）はσ＝３の場合，図９（Ｃ）はσ＝６の
場合，図９（Ｄ）はσ＝９の場合，図９（Ｅ）はσ＝１
５の場合，図９（Ｆ）はσ＝２１の場合のガウシアンフ
ィルタによるフィルタリング画像を示している。

【００４８】図９（Ｆ）に示すσ＝２１のフィルタリン
グ画像の最小濃度値内で文字列が１つの閉曲線内に含ま
れている。また，図９（Ｄ）に示すσ＝９のフィルタリ
ング画像において，最小濃度値内で１つの閉曲線が１文
字にほぼ対応している。したがって，σ＝２１のフィル
タリング画像の最小濃度値内で文字列の方向と文字列を
抽出し，σ＝９のフィルタリング画像の最小濃度値で各
文字を切り出すことができる。

【００４９】

【発明の効果】以上説明したように，本発明によれば以
下のような効果を奏する。１．請求項１記載の発明では，複数種類のフィルタリン
グ画像の画素濃度情報をもとに文字列を抽出するので，
比較的簡単な処理により文書の傾きに依存せずに文字列
を抽出することが可能である。フィルタ構成パラメータ
の決定に際しては，その値が自動的に決定されるため，
人間が経験的に値を決定する必要がない。また，「ハ」
「ツ」「テ」などの分離文字も，文字列が密でなければ
自動的に１文字として切り出されてくる。

【００５０】２．請求項２記載のものでは，フィルタ構
成パラメータを変えた画像を同時に得ておくことによ
り，文字列抽出から文字切り出しまでを同一手法で行う
ことができ，処理の簡素化が可能となる。

【００５１】３．請求項３記載のものでは，特定の方向
に重み付けしたフィルタを用いることにより，隣接文字
同士の誤統合を防ぎ，文字の切り出しを正確に行うこと
が可能となる。

【００５２】４．請求項４記載のものでは，ラベル外接
矩形のヒストグラムからフィルタサイズを自動的に算出
することにより，あらかじめサイズの閾値を決めておく
必要がなく，さらに様々な文字サイズの文字データに対
応することができる。

【００５３】５．請求項５記載のものでは，フィルタ構
成パラメータを変える際に，前記のフィルタサイズから
自動的に算出することにより，あらかじめパラメータ値
を設定しておく必要がない。

【００５４】６．請求項６記載のものでは，フィルタ構
成パラメータを変える際に，文字列内の文字ピッチから
自動的に算出することにより，あらかじめパラメータ値
を設定しておく必要がない。

【００５５】７．請求項７記載のものでは，ある濃度値
の閉曲線内に含まれるものを文字列とすることにより，
文字列の抽出にあたって連結画素間の位置関係を細かく
計算する必要がない。

【００５６】８．請求項８記載のものでは，小さい連結
画素はフィルタリングにより消失して，大きい連結画素
だけが濃度値の高い閉曲線を構成するようになることに
より，ノイズなどに影響されずに正しく文字列を抽出す
ることが可能である。

【００５７】９．請求項９記載のものでは，閉曲線内の
線分を求める処理が簡単なことにより，文字列の方向を
素早くみつけることが可能である。１０．請求項１０記載のものでは，閉曲線のモーメント
を用いることにより，文字列の方向を正確に算出するこ
とが可能となる。

【００５８】１１．白黒（２値）画像では，ある連結画
素が，文字の中心部から遠いのか近いのかを判定するの
が困難であるが，請求項１１記載のものでは，フィルタ
リングに基づく画素濃度情報を用いることにより，ある
連結画素が，文字の中心部から遠いのか近いのかがわか
り，さらに濃度値を統合の確信度としてとらえることが
でき，連結画素間の統合関係の把握が容易となる。

【００５９】１２．請求項１２記載のものでは，文字列
が粗な場合，分離文字の各要素，例えば「ソ」の左部分
と右部分などはある濃度値の閉曲線内に含まれる。これ
により，連結画素間の統合条件を定める必要がなく，文
字種，文字サイズに依存しない文字切り出し処理を自動
的に行うことが可能となる。

【００６０】１３．請求項１３記載のものでは，濃度値
をそのまま連結画素間の統合確率とみなすことにより，
確率計算を容易に行うことができる。また，統合確率に
基づいて認識処理を併用した文字切り出しを行うことに
より，正しく文字切り出しを行うことが可能となる。

【図面の簡単な説明】

【図１】本発明の構成例を示す図である。

【図２】フィルタリング部の処理フローチャートであ
る。

【図３】フィルタ構成パラメータの例を示す図である。

【図４】文字列抽出部の処理フローチャート（１）であ
る。

【図５】文字列抽出部の処理フローチャート（２）であ
る。

【図６】文字列方向抽出方法の例を示す図である。

【図７】文字列方向抽出方法の例を示す図である。

【図８】印刷文字の文書画像に対する複数種類のパラメ
ータによるフィルタリング画像の例を示す図である。

【図９】手書き文字の文書画像に対する複数種類のパラ
メータによるフィルタリング画像の例を示す図である。

【図１０】従来の技術を説明する図である。

【符号の説明】

１イメージ受信部２イメージ格納部３フィルタリング部４フィルタリング画像格納部５ラベリング部６ラベリング画像格納部７文字列抽出部８文字切り出し部９文字認識部

Claims

【特許請求の範囲】

【請求項１】イメージデータとして入力された画像デ
ータから文字を認識する文字認識装置であって，入力画
像に複数種類のフィルタリングを行うフィルタリング手
段と，前記フィルタリング手段によりフィルタリングさ
れた画像の画素濃度情報をもとに文字列を抽出する文字
列抽出手段と，前記文字列抽出手段により抽出された文
字列中から文字を切り出し，認識する文字切り出し・認
識手段とを備えることを特徴とする文字認識装置。
【請求項２】請求項１記載の文字認識装置において，
前記フィルタリング手段は，フィルタの構成パラメータ
を変えてフィルタリングを行うことにより複数種類のフ
ィルタリング画像を得ることを特徴とする文字認識装
置。
【請求項３】請求項１記載の文字認識装置において，
前記フィルタリング手段は，特定の方向に重み付けした
フィルタを用いてフィルタリングを行うことを特徴とす
る文字認識装置。
【請求項４】請求項１記載の文字認識装置において，
前記フィルタリング手段は，原画像に対してラベリング
処理を施した結果から得た各ラベルに外接する矩形のサ
イズヒストグラムをもとに，その頻度分布より定まる値
の定数倍をフィルタサイズとすることを特徴とする文字
認識装置。
【請求項５】請求項２記載の文字認識装置において，
前記フィルタリング手段は，フィルタ構成パラメータを
変える際に，原画像に対してラベリング処理を施した結
果から得た各ラベルに外接する矩形のサイズヒストグラ
ムをもとに，その頻度分布より定まる値の定数倍をフィ
ルタ構成パラメータとすることを特徴とする文字認識装
置。
【請求項６】請求項２記載の文字認識装置において，
前記フィルタリング手段は，フィルタ構成パラメータを
変える際に，原画像に対してラベリング処理を施した結
果から得た各ラベルに外接する矩形のピッチヒストグラ
ムをもとに，その頻度分布より定まる値の定数倍をフィ
ルタ構成パラメータとすることを特徴とする文字認識装
置。
【請求項７】請求項１記載の文字認識装置において，
前記文字列抽出手段は，前記フィルタリング画像の中か
ら，ある濃度値内に含まれるものを文字列として抽出す
ることを特徴とする文字認識装置。
【請求項８】請求項１記載の文字認識装置において，
前記文字列抽出手段は，前記フィルタリング画像中の濃
度値の高い閉曲線の集合から文字列の軸を算出し，その
軸からある閾値内に存在する連結画素を集めて同一文字
列に属するものを定めることを特徴とする文字認識装
置。
【請求項９】請求項１記載の文字認識装置において，
前記文字列抽出手段は，文字列の方向を算出する際に，
ある画素濃度値の閉曲線内で最大長さを持つ線分を求
め，その線分の方向を文字列の方向とすることを特徴と
する文字認識装置。
【請求項１０】請求項１記載の文字認識装置におい
て，前記文字列抽出手段は，文字列の方向を算出する際
に，ある濃度値の閉曲線のモーメントを算出し，そのモ
ーメントから求まる方向を文字列の方向とすることを特
徴とする文字認識装置。
【請求項１１】請求項１記載の文字認識装置におい
て，前記文字切り出し・認識手段は，前記文字列抽出手
段により抽出された文字列の方向と，前記フィルタリン
グ画像の画素濃度情報をもとに文字を切り出すことを特
徴とする文字認識装置。
【請求項１２】請求項１１記載の文字認識装置におい
て，前記文字切り出し・認識手段は，前記フィルタリン
グ画像におけるある画素濃度値内の画像を１文字として
切り出すことを特徴とする文字認識装置。
【請求項１３】請求項１記載の文字認識装置におい
て，前記文字切り出し・認識手段は，画素濃度値を連結
画素間の統合確率と捉え，ある連結画素が他の複数の連
結画素と同程度の確率を持つ場合には，それを各々と統
合したときの認識確信度を求め，確信度の高いほうに統
合することを特徴とする文字認識装置。