JPH08339424A - 画像処理装置及び方法 - Google Patents
画像処理装置及び方法Info
- Publication number
- JPH08339424A JPH08339424A JP7143366A JP14336695A JPH08339424A JP H08339424 A JPH08339424 A JP H08339424A JP 7143366 A JP7143366 A JP 7143366A JP 14336695 A JP14336695 A JP 14336695A JP H08339424 A JPH08339424 A JP H08339424A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- line
- characters
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 入力された原稿画像中の文字種を効率良く判
定することで、下位の処理、例えば文字認識処理におけ
る処理精度を上げることを可能にする。 【構成】 入力した原稿画像中の文字列パターンの行が
判別されると、その行におけるドットの連続性でもって
個々の文字幅を得る(ステップS106)。そして、文
字数と文字幅及び行高に基づいて1文字当たりの高さと
幅の比の平均値Rを算出する。そして、算出した値Rの
大小に基づいて、注目行が英語文字であるか、日本語文
字かを判定する(S107)。
定することで、下位の処理、例えば文字認識処理におけ
る処理精度を上げることを可能にする。 【構成】 入力した原稿画像中の文字列パターンの行が
判別されると、その行におけるドットの連続性でもって
個々の文字幅を得る(ステップS106)。そして、文
字数と文字幅及び行高に基づいて1文字当たりの高さと
幅の比の平均値Rを算出する。そして、算出した値Rの
大小に基づいて、注目行が英語文字であるか、日本語文
字かを判定する(S107)。
Description
【0001】
【産業上の利用分野】本発明は画像処理装置及び方法、
詳しくは入力された原稿画像中の文字種を判定し下位の
処理に渡す画像処理装置及び方法に関するものである。
詳しくは入力された原稿画像中の文字種を判定し下位の
処理に渡す画像処理装置及び方法に関するものである。
【0002】
【従来の技術】情報が溢れる現代社会において情報管
理、検索が容易になる情報の電子化が早急に望まれてい
る。情報の電子化には、スキャナなどの入力装置で読み
取った画像である文字を文字コードに変換するOCR
(光学的文字認識)が必須であり、その精度はどんどん
向上してきている。
理、検索が容易になる情報の電子化が早急に望まれてい
る。情報の電子化には、スキャナなどの入力装置で読み
取った画像である文字を文字コードに変換するOCR
(光学的文字認識)が必須であり、その精度はどんどん
向上してきている。
【0003】OCRは日本語(漢字、ひらがな、カタカ
ナ)と英語その他(アルファベット)の特性の違いのた
め、アルファベット(特に小文字)を日本語OCRで認
識するのは困難であることから、それぞれ別の認識アル
ゴリズムを用いたり、アルゴリズムは同じでも辞書の切
り替えを行ったりする。従って、アルファベットと日本
語を判別するための技術が必要になる。
ナ)と英語その他(アルファベット)の特性の違いのた
め、アルファベット(特に小文字)を日本語OCRで認
識するのは困難であることから、それぞれ別の認識アル
ゴリズムを用いたり、アルゴリズムは同じでも辞書の切
り替えを行ったりする。従って、アルファベットと日本
語を判別するための技術が必要になる。
【0004】従来、アルファベットと日本語を判別する
方法はなかったため、ユーザがオペレーションパネルや
キーボード或いはポインティングデバイス等を操作し
て、それらを区別するための指示を行っていた。
方法はなかったため、ユーザがオペレーションパネルや
キーボード或いはポインティングデバイス等を操作し
て、それらを区別するための指示を行っていた。
【0005】
【発明が解決しようとする課題】しかしながら、これで
はユーザの手間が多大であるし、さらに以下のような問
題点がある。
はユーザの手間が多大であるし、さらに以下のような問
題点がある。
【0006】複数枚のデータを読み込む際、ADF(オ
ートドキュメントフィーダ)がユーザに原稿指し替え作
業を削減するが、その複数ページ中に英語のドキュメン
ト、日本語のドキュメントが入り混じっている可能性が
ある。一枚読み込む毎にユーザの指示を待っていたので
は、ADFの利点が台無しになってしまう。また、全ペ
ージ読み込んだ後にユーザの指示を受ける形式にするに
は大量のメモリが必要になる。
ートドキュメントフィーダ)がユーザに原稿指し替え作
業を削減するが、その複数ページ中に英語のドキュメン
ト、日本語のドキュメントが入り混じっている可能性が
ある。一枚読み込む毎にユーザの指示を待っていたので
は、ADFの利点が台無しになってしまう。また、全ペ
ージ読み込んだ後にユーザの指示を受ける形式にするに
は大量のメモリが必要になる。
【0007】
【課題を解決するための手段】及び
【作用】本発明はかかる問題点に鑑みなされたものであ
り、入力された原稿画像中の文字種を効率良く判定する
ことで、下位の処理、例えば文字認識処理における処理
精度を上げることを可能にする画像処理装置及び方法を
提供しようとするものである。
り、入力された原稿画像中の文字種を効率良く判定する
ことで、下位の処理、例えば文字認識処理における処理
精度を上げることを可能にする画像処理装置及び方法を
提供しようとするものである。
【0008】この課題を解決するため、例えば本発明の
画像処理装置は以下の構成を備える。すなわち、原稿画
像を入力して、当該原稿中の文字の種別を判定し下位の
処理に渡す画像処理装置であって、入力された原稿画像
中の文字列パターンを含む行を判別する判別手段と、該
判別手段によって判別された行の高さ、仮文字数、及び
個々の仮文字の幅をドット分布に基づいて検出する検出
手段と、該検出手段で検出された行高、仮文字数及び仮
文字の幅に基づいて注目行の文字種を判定する判定手段
とを備える。
画像処理装置は以下の構成を備える。すなわち、原稿画
像を入力して、当該原稿中の文字の種別を判定し下位の
処理に渡す画像処理装置であって、入力された原稿画像
中の文字列パターンを含む行を判別する判別手段と、該
判別手段によって判別された行の高さ、仮文字数、及び
個々の仮文字の幅をドット分布に基づいて検出する検出
手段と、該検出手段で検出された行高、仮文字数及び仮
文字の幅に基づいて注目行の文字種を判定する判定手段
とを備える。
【0009】ここで本発明に好適な実施態様に従えば、
前記下位処理は文字認識処理であって、前記判定手段で
判定された結果に応じて認識処理するときに使用する認
識辞書を選択させることが望ましい。また、前記下位処
理は文字認識処理であって、前記判定手段で判定された
結果に応じて認識処理するときに使用する認識アルゴリ
ズムを選択させても良い。この結果、認識する処理或い
は辞書が予め決められるので、認識処理が簡潔になり、
処理速度及び文字認識率を上げることが可能になる。
前記下位処理は文字認識処理であって、前記判定手段で
判定された結果に応じて認識処理するときに使用する認
識辞書を選択させることが望ましい。また、前記下位処
理は文字認識処理であって、前記判定手段で判定された
結果に応じて認識処理するときに使用する認識アルゴリ
ズムを選択させても良い。この結果、認識する処理或い
は辞書が予め決められるので、認識処理が簡潔になり、
処理速度及び文字認識率を上げることが可能になる。
【0010】また、前記文字種は、アルファベット文字
と漢字圏文字のいずれかであることが望ましい。これに
より、アルファベット圏と漢字圏との文字の特徴を利用
して、精度良く判定できるようになる。
と漢字圏文字のいずれかであることが望ましい。これに
より、アルファベット圏と漢字圏との文字の特徴を利用
して、精度良く判定できるようになる。
【0011】また、前記判定手段は、1文字当たりの高
さと幅の比の平均値でもって注目行の文字種を判定する
ことが望ましい。これにより、高さは同程度であって
も、幅狭文字と幅広文字の判定が容易になる。
さと幅の比の平均値でもって注目行の文字種を判定する
ことが望ましい。これにより、高さは同程度であって
も、幅狭文字と幅広文字の判定が容易になる。
【0012】前記判定手段は、注目行中の仮文字の文字
幅の大きさに従って並べ替え、両端から所定個数の仮文
字を除く仮文字で得られるの高さと幅の平均値でもって
判定することが望ましい。これにより、仮文字として判
定された文字の切り出し位置に誤りがあっても、その誤
り部分を吸収できるようになるので、判定結果の精度を
上げることが可能になる。
幅の大きさに従って並べ替え、両端から所定個数の仮文
字を除く仮文字で得られるの高さと幅の平均値でもって
判定することが望ましい。これにより、仮文字として判
定された文字の切り出し位置に誤りがあっても、その誤
り部分を吸収できるようになるので、判定結果の精度を
上げることが可能になる。
【0013】また、このとき、所定個数は、仮文字数の
個数に依存して変動することが望ましい。これによっ
て、実際の1行の文字数が如何なる個数であっても、文
字切り出し位置に誤りを効率良く吸収できるようにな
る。
個数に依存して変動することが望ましい。これによっ
て、実際の1行の文字数が如何なる個数であっても、文
字切り出し位置に誤りを効率良く吸収できるようにな
る。
【0014】また、更に、前記入力された原稿画像中の
ノイズ除去するノイズ除去手段を備えるが望ましい。こ
の結果、ノイズによる影響をなくすことができるので、
行の判別をより精度良く行なえる。
ノイズ除去するノイズ除去手段を備えるが望ましい。こ
の結果、ノイズによる影響をなくすことができるので、
行の判別をより精度良く行なえる。
【0015】また、更に、前記入力された画像を所定角
度だけ回転させて、正立画像としての方向を決定する手
段を備えることが望ましい。これによって、原稿画像の
入力方向に応じて判定することが可能になる。
度だけ回転させて、正立画像としての方向を決定する手
段を備えることが望ましい。これによって、原稿画像の
入力方向に応じて判定することが可能になる。
【0016】
【実施例】以下、添付図面に従って本発明に係る実施例
を詳細に説明する。
を詳細に説明する。
【0017】実施例における文字認識装置のブロック構
成を図10に示す。図中、1は装置全体の制御を司るC
PU、2はブートプログラム等を記憶しているROM、
3はCPU1が実行処理するプログラムやオペレーティ
ングシステム(OS)を記憶するRAMである。4は例
えばハードディスク装置等の外部記憶装置であって、こ
こにOS、文字認識処理に係るプログラム(後述する図
1、3、9に示したフローチャートに対応するプログラ
ムを含む)、更には認識辞書(日本語文字用と英語文字
用)が格納されている。5はキーボードやポインティン
グデバイス等で構成される入力装置、6は原稿画像を読
み取るイメージスキャナである。7は読み取った画像を
一時的に記憶する画像メモリ、8は各種メッセージや認
識された情報を表示する表示装置である。
成を図10に示す。図中、1は装置全体の制御を司るC
PU、2はブートプログラム等を記憶しているROM、
3はCPU1が実行処理するプログラムやオペレーティ
ングシステム(OS)を記憶するRAMである。4は例
えばハードディスク装置等の外部記憶装置であって、こ
こにOS、文字認識処理に係るプログラム(後述する図
1、3、9に示したフローチャートに対応するプログラ
ムを含む)、更には認識辞書(日本語文字用と英語文字
用)が格納されている。5はキーボードやポインティン
グデバイス等で構成される入力装置、6は原稿画像を読
み取るイメージスキャナである。7は読み取った画像を
一時的に記憶する画像メモリ、8は各種メッセージや認
識された情報を表示する表示装置である。
【0018】以上の構成における実施例の処理を説明す
る前に、簡単にその文字種判別(日本語と英語の判別)
の原理を説明する。
る前に、簡単にその文字種判別(日本語と英語の判別)
の原理を説明する。
【0019】一般に、同じサイズの文字(日本語、英語
とも)では、全体として見た場合、日本語の個々の文字
(ドットパターン)の外接矩形の高さに対する横幅の比
は、英語のそれより大きい値を持つ。換言すれば、英語
文字は、その高さに対して横幅は小さい。従って、これ
を基にして、入力画像中の文字が日本語なのか、英語な
のかを判断できることになる。
とも)では、全体として見た場合、日本語の個々の文字
(ドットパターン)の外接矩形の高さに対する横幅の比
は、英語のそれより大きい値を持つ。換言すれば、英語
文字は、その高さに対して横幅は小さい。従って、これ
を基にして、入力画像中の文字が日本語なのか、英語な
のかを判断できることになる。
【0020】以下、実施例の処理を図1のフローチャー
トに従って説明する。尚、同プログラムに基づくプログ
ラムは外部記憶装置4に記憶されているものであるが、
RAM3にロードされ、実行される。
トに従って説明する。尚、同プログラムに基づくプログ
ラムは外部記憶装置4に記憶されているものであるが、
RAM3にロードされ、実行される。
【0021】さて、イメージスキャナ6により入力され
たビットマップ画像は、ステップS101でブロック分
けが行われる。
たビットマップ画像は、ステップS101でブロック分
けが行われる。
【0022】1画素1ビットの2値ビットマップ画像の
一例を図2(a)に示す。本実施例では単純2値化され
た2値画像が好ましい。そのビットマップ画像を図2
(b)の形にするのが、ステップS101の領域分離処
理である。
一例を図2(a)に示す。本実施例では単純2値化され
た2値画像が好ましい。そのビットマップ画像を図2
(b)の形にするのが、ステップS101の領域分離処
理である。
【0023】領域分離処理の一例のフローチャートを図
3に示す。ステップS301でビットマップ画像にm×
m画素サイズのウインドウを定義し、このウインドウ内
に所定数(実施例では“1”とした)の黒画素があった
ら、該当するウインドウを黒とし、解像度を大幅に減ら
し文字部分を連結させる。ステップS301の解像度変
換した様子を図4に示す。次にステップS302で輪郭
線追跡をすると、文字特有の細長いパターンとその他の
図形を区別することができる。最後のステップS303
では、同一グループ連結処理で、隣接するテキスト部を
結合させることによって図2(b)のように領域分離す
ることができる。
3に示す。ステップS301でビットマップ画像にm×
m画素サイズのウインドウを定義し、このウインドウ内
に所定数(実施例では“1”とした)の黒画素があった
ら、該当するウインドウを黒とし、解像度を大幅に減ら
し文字部分を連結させる。ステップS301の解像度変
換した様子を図4に示す。次にステップS302で輪郭
線追跡をすると、文字特有の細長いパターンとその他の
図形を区別することができる。最後のステップS303
では、同一グループ連結処理で、隣接するテキスト部を
結合させることによって図2(b)のように領域分離す
ることができる。
【0024】実施例においては、各ブロックを定義する
ために、ブロック定義用のデータ構造体を決めた。図5
(a)がその構造体であり、ブロックの種別を定義する
要素“type”(short 型)、ブロックの左上隅位置x座
標及びy座標を定義する要素“startx”,“starty”
(各々をshort 型)、ブロックの幅と高さを定義する
要素“width”,“height”(各々short型)、そして、
次のブロックのアドレスを記憶するための要素“next_a
ddress”で構成される。
ために、ブロック定義用のデータ構造体を決めた。図5
(a)がその構造体であり、ブロックの種別を定義する
要素“type”(short 型)、ブロックの左上隅位置x座
標及びy座標を定義する要素“startx”,“starty”
(各々をshort 型)、ブロックの幅と高さを定義する
要素“width”,“height”(各々short型)、そして、
次のブロックのアドレスを記憶するための要素“next_a
ddress”で構成される。
【0025】ここで、要素“type”は、0〜2のいずれ
かの数値が割り当てられ、“0”が該当するブロックは
“タイトル”であることを、“1”は“テキスト”、
“2”は“その他(図形や写真等)”であることを示
す。
かの数値が割り当てられ、“0”が該当するブロックは
“タイトル”であることを、“1”は“テキスト”、
“2”は“その他(図形や写真等)”であることを示
す。
【0026】尚、各ブロックの種別を判定する手法であ
るが、実施例では図4に示すように解像度を下げて処理
した場合(このとき文字パターンどうしは互いに連結さ
れてしまい一塊の黒画素領域になる)、その領域の輪郭
を追跡していって、細長い連なりかどうかを判定し、細
長い(縦横比が所定条件を満たしている)とき該当する
領域は文字列領域であると判定する。ここで、文字列に
は、タイトル(見出し)と本文のテキストの二種類に分
けられるが、前者(タイトル)は一般にその文字サイズ
が大きい。そこで、文字領域であると判定された細長い
黒画素領域の長手方向にほぼ直角な断面の長さが所定以
上のとき、タイトルとして判定するようにした。また、
一般にタイトルは、本文の上方にある場合が多いので、
その存在位置に従ってタイトルかテキストかを判断する
ようにしても良い。但し、ブロックの判定そのものは本
発明の主要な部分ではないので、これ以上の説明は省略
する。
るが、実施例では図4に示すように解像度を下げて処理
した場合(このとき文字パターンどうしは互いに連結さ
れてしまい一塊の黒画素領域になる)、その領域の輪郭
を追跡していって、細長い連なりかどうかを判定し、細
長い(縦横比が所定条件を満たしている)とき該当する
領域は文字列領域であると判定する。ここで、文字列に
は、タイトル(見出し)と本文のテキストの二種類に分
けられるが、前者(タイトル)は一般にその文字サイズ
が大きい。そこで、文字領域であると判定された細長い
黒画素領域の長手方向にほぼ直角な断面の長さが所定以
上のとき、タイトルとして判定するようにした。また、
一般にタイトルは、本文の上方にある場合が多いので、
その存在位置に従ってタイトルかテキストかを判断する
ようにしても良い。但し、ブロックの判定そのものは本
発明の主要な部分ではないので、これ以上の説明は省略
する。
【0027】図5(b)は、上記の構造体で表されるデ
ータの例を示している。各ブロックの要素next_address
には、次のブロックのアドレスが格納され、最後はNU
LLを代入しておくことでそれ以降のデータは存在しな
いことを明示させておく。
ータの例を示している。各ブロックの要素next_address
には、次のブロックのアドレスが格納され、最後はNU
LLを代入しておくことでそれ以降のデータは存在しな
いことを明示させておく。
【0028】図1の説明に戻る。ステップS101でブ
ロックデータが抽出されると、処理はステップS102
に進み、未処理のブロックがなくなるまで(構造体のne
xt_addressがNULLになるまで)ループする。もし、
未処理のブロックがなくなったら本処理を終了するが、
未処理のブロックがあるならばステップS103に移
る。
ロックデータが抽出されると、処理はステップS102
に進み、未処理のブロックがなくなるまで(構造体のne
xt_addressがNULLになるまで)ループする。もし、
未処理のブロックがなくなったら本処理を終了するが、
未処理のブロックがあるならばステップS103に移
る。
【0029】ステップS103では現在処理しようとす
るブロックが文字を含んでいれば(要素typeが0又
は1)、ステップS104に進み、含んでいなければ1
02に戻る。
るブロックが文字を含んでいれば(要素typeが0又
は1)、ステップS104に進み、含んでいなければ1
02に戻る。
【0030】ステップS104ではブロック内のデータ
をY軸に斜影を行い文字の存在するY軸(行)の抽出を
行う。Y軸への斜影を例として図2(b)のテキスト2
に対して行うと図6に示すようになる。Y軸への斜影を
より具体的に説明するために図9にフローチャートを示
す。
をY軸に斜影を行い文字の存在するY軸(行)の抽出を
行う。Y軸への斜影を例として図2(b)のテキスト2
に対して行うと図6に示すようになる。Y軸への斜影を
より具体的に説明するために図9にフローチャートを示
す。
【0031】尚、以下の説明に先立ち、変数line_
h[]、line_sy[]は共にRAMに確保された
配列変数であり、line_h[]は各行分の文字列の
高さ情報を格納し、line_sy[]は各行の左上隅
の、注目ブロックの左上隅座標からの相対的なy座標を
記憶する。また、変数iはブロック内における相対的な
x座標を、変数jは同y座標を示す。また、flag
は、1行分の切り出し処理を行っている最中か否かを示
す変数ものであり、kuroは着目している1ドットラ
イン中に黒画素があるか否かの情報を記憶する変数であ
る。また、nlineは、注目ブロック中に何行分の文
字列行があるかをカウントする変数である。
h[]、line_sy[]は共にRAMに確保された
配列変数であり、line_h[]は各行分の文字列の
高さ情報を格納し、line_sy[]は各行の左上隅
の、注目ブロックの左上隅座標からの相対的なy座標を
記憶する。また、変数iはブロック内における相対的な
x座標を、変数jは同y座標を示す。また、flag
は、1行分の切り出し処理を行っている最中か否かを示
す変数ものであり、kuroは着目している1ドットラ
イン中に黒画素があるか否かの情報を記憶する変数であ
る。また、nlineは、注目ブロック中に何行分の文
字列行があるかをカウントする変数である。
【0032】さて、ステップS901においては、変数
nline、flag,jをそれぞれ“0”クリアす
る。そして、ステップS902で変数i,ステップS9
03で変数kuroをそれぞれ“0”クリアする。
nline、flag,jをそれぞれ“0”クリアす
る。そして、ステップS902で変数i,ステップS9
03で変数kuroをそれぞれ“0”クリアする。
【0033】次いで、ステップS904に進んで、変数
jが注目ブロックの高さ(注目ブロックがk番目である
場合には、BLK[K].heightで得られる)を
越えたか否かを判断する。もし、超えていれば、注目ブ
ロック内の全てのラインに対しての処理が完了したこと
になるから、本処理を終える。
jが注目ブロックの高さ(注目ブロックがk番目である
場合には、BLK[K].heightで得られる)を
越えたか否かを判断する。もし、超えていれば、注目ブ
ロック内の全てのラインに対しての処理が完了したこと
になるから、本処理を終える。
【0034】従って、ここでは変数jの値が注目ブロッ
クの高さに満たないとして、説明を続ける。
クの高さに満たないとして、説明を続ける。
【0035】この場合、処理はステップS905に進
み、画像メモリ7に格納された画像データのx座標がs
tartx+i,y座標がstarty+jの位置の画
素データを読み出し、それが黒画素かどうかを判断す
る。ここで、startx、startyは注目ブロッ
クの構造体の要素名であることは理解できよう。
み、画像メモリ7に格納された画像データのx座標がs
tartx+i,y座標がstarty+jの位置の画
素データを読み出し、それが黒画素かどうかを判断す
る。ここで、startx、startyは注目ブロッ
クの構造体の要素名であることは理解できよう。
【0036】さて、変数i,jで示される位置の画素が
黒画素でないと判断した場合には、ステップS906に
進み、その時の変数iと注目ブロックの横幅width
を比較する。この結果、i<widthであると判断し
た場合には、ステップS907に進んで、変数iを
“1”だけインクリメントする。
黒画素でないと判断した場合には、ステップS906に
進み、その時の変数iと注目ブロックの横幅width
を比較する。この結果、i<widthであると判断し
た場合には、ステップS907に進んで、変数iを
“1”だけインクリメントする。
【0037】こうして、注目ブロックの第jラインにお
いて、変数iが順次インクメントさせていって注目画素
が黒画素であると判断されると、処理はステップS90
8に進み、変数kuroに“1”を代入し、注目ライン
(変数jで示されるライン)には少なくとも黒画素が存
在したことを示すようにする。
いて、変数iが順次インクメントさせていって注目画素
が黒画素であると判断されると、処理はステップS90
8に進み、変数kuroに“1”を代入し、注目ライン
(変数jで示されるライン)には少なくとも黒画素が存
在したことを示すようにする。
【0038】この後、処理はステップS909に進み、
flagが“0”であるかどうかを判断する。flag
が“0”というのは、直前までのラインは空白部分であ
って、変数jで示されるラインになってはじめて黒画素
が発生したことを意味する。従って、この場合には、ス
テップS910に進み、文字列パターンの発生を検出し
たことになるから、その時点での変数jを配列変数li
ne_sy[nline]に代入する。文字パターンは
複数のドットラインに存在するから、次のラインでステ
ップS910の処理を行なわないように、flagに
“1”を代入させておく。
flagが“0”であるかどうかを判断する。flag
が“0”というのは、直前までのラインは空白部分であ
って、変数jで示されるラインになってはじめて黒画素
が発生したことを意味する。従って、この場合には、ス
テップS910に進み、文字列パターンの発生を検出し
たことになるから、その時点での変数jを配列変数li
ne_sy[nline]に代入する。文字パターンは
複数のドットラインに存在するから、次のラインでステ
ップS910の処理を行なわないように、flagに
“1”を代入させておく。
【0039】また、変数jで示されるライン中に黒画素
の存在を検出した場合には、同ラインにおけるそれより
右側に位置する画素の状態を検出することは不要になる
のでステップS907の処理を行わず、注目ラインの処
理を終えたものとして、ステップS912に進む。
の存在を検出した場合には、同ラインにおけるそれより
右側に位置する画素の状態を検出することは不要になる
のでステップS907の処理を行わず、注目ラインの処
理を終えたものとして、ステップS912に進む。
【0040】ステップS912では、kuro=0、且
つ、flag=1であるかどうかを判断する。
つ、flag=1であるかどうかを判断する。
【0041】つまり、黒画素が存在するラインが連続し
て検出されている最中に、空白ラインが検出されたかど
うかを判断する。より分かりやすく説明すると、1行分
の文字列パターンの領域が決定したかどうかを判断す
る。
て検出されている最中に、空白ラインが検出されたかど
うかを判断する。より分かりやすく説明すると、1行分
の文字列パターンの領域が決定したかどうかを判断す
る。
【0042】否の場合には、ステップS913に進ん
で、変数jを“1”だけインクリメントし、ステップS
902以降の処理を繰り返す。
で、変数jを“1”だけインクリメントし、ステップS
902以降の処理を繰り返す。
【0043】こうして、1行分の文字列パターンの検出
がなされたと判断した場合には、ステップS914に進
んで、配列変数line_h[nline]に、そのと
きの変数jからline_sy[nline]を引いた
値をセットする。先に説明したように、line_sy
[nline]には文字列パターンの左上隅のy座標が
格納されているから、line_h[nline]には
黒画素が連続するラインの本数、すなわち、文字列パタ
ーンの高さ情報が格納されることになる。
がなされたと判断した場合には、ステップS914に進
んで、配列変数line_h[nline]に、そのと
きの変数jからline_sy[nline]を引いた
値をセットする。先に説明したように、line_sy
[nline]には文字列パターンの左上隅のy座標が
格納されているから、line_h[nline]には
黒画素が連続するラインの本数、すなわち、文字列パタ
ーンの高さ情報が格納されることになる。
【0044】次いで、ステップS915で、次の文字列
パターン(文字列行)の検出に備えて変数flagを
“0”クリアし、nlineを“1”だけインクリメン
トする。
パターン(文字列行)の検出に備えて変数flagを
“0”クリアし、nlineを“1”だけインクリメン
トする。
【0045】以上の結果、最終的に変数jが注目ブロッ
クの高さheightを越えることになり、その時点で
本処理を終了する。このとき、nlineは注目ブロッ
クにおいて検出された文字列行数が格納され、line
_sy[0]〜line_sy[nline]には各文
字列パターンの左上隅のy座標値が、line_h
[0]〜line[nline]には各文字列パターン
の高さ情報が格納されることになる。
クの高さheightを越えることになり、その時点で
本処理を終了する。このとき、nlineは注目ブロッ
クにおいて検出された文字列行数が格納され、line
_sy[0]〜line_sy[nline]には各文
字列パターンの左上隅のy座標値が、line_h
[0]〜line[nline]には各文字列パターン
の高さ情報が格納されることになる。
【0046】以上の図9の処理により各ブロックの文字
画像から行数、各行のスタート点および高さを抽出する
ことができる。
画像から行数、各行のスタート点および高さを抽出する
ことができる。
【0047】図1の説明に戻る。ステップS105では
抽出された行データの処理のためにループを回す。全て
の行の処理が終わっていない場合にはステップS102
に戻り、それ以外はステップS106に進む。
抽出された行データの処理のためにループを回す。全て
の行の処理が終わっていない場合にはステップS102
に戻り、それ以外はステップS106に進む。
【0048】ステップS106では、図7に示すよう
に、各行のX軸への射影を行ない、文字の切り出しを行
う。X軸への射影処理は、先に説明したY軸への射影処
理と比較して、射影の対象軸が異なるだけであるので、
その説明は省略する。但し、この処理でもって、図9の
フローチャート中のline_h[]に相当する配列変数には、
文字幅が格納され、nlineに相当する変数には文字
数が格納されることになる。
に、各行のX軸への射影を行ない、文字の切り出しを行
う。X軸への射影処理は、先に説明したY軸への射影処
理と比較して、射影の対象軸が異なるだけであるので、
その説明は省略する。但し、この処理でもって、図9の
フローチャート中のline_h[]に相当する配列変数には、
文字幅が格納され、nlineに相当する変数には文字
数が格納されることになる。
【0049】日本語文字列である図7(a)のX軸への
射影によって文字の存在位置(正確にはドットの連続す
る位置)は全部で16個である。ここで、文字“は”
は、2つの文字として検出されているが、全体として見
た場合には問題にはならない。さて、各文字の横幅は wordW[16]={8.0,7.5,1.5,3.5,7.0,6.5,7.0,6.5,7.0,8.
0,8.0,5.0,6.0,3.0,1.5,6.5}(mm) である。文字の平均幅ave_wordWは、 ave_wordW=ΣwordW/16=5.78 となる。従って、縦横比Rは、 R=平均幅ave_wordW/高さline_h[] で求められる。ここで、高さline_h=7.0mmとすると、 R=5.78/7=0.83 となる。
射影によって文字の存在位置(正確にはドットの連続す
る位置)は全部で16個である。ここで、文字“は”
は、2つの文字として検出されているが、全体として見
た場合には問題にはならない。さて、各文字の横幅は wordW[16]={8.0,7.5,1.5,3.5,7.0,6.5,7.0,6.5,7.0,8.
0,8.0,5.0,6.0,3.0,1.5,6.5}(mm) である。文字の平均幅ave_wordWは、 ave_wordW=ΣwordW/16=5.78 となる。従って、縦横比Rは、 R=平均幅ave_wordW/高さline_h[] で求められる。ここで、高さline_h=7.0mmとすると、 R=5.78/7=0.83 となる。
【0050】同様に、図7(b)の文字パターンに対し
て同様の処理を行うと、 ave_wordW=2.93 R=2.93/7.0=0.43 となる。
て同様の処理を行うと、 ave_wordW=2.93 R=2.93/7.0=0.43 となる。
【0051】従って、算出した縦横比の値の大小でもっ
てその行が日本語文字か、英語文字かを判断することが
可能になる。
てその行が日本語文字か、英語文字かを判断することが
可能になる。
【0052】図1におけるステップS107では、まさ
に、この判断処理を行っている。すなわち、縦横比R
を、予め設定された閾値T以上であるか否かを判断し、
その判断結果が是であれば、ステップS108で注目行
は日本語文字として判断し、下位の処理である文字認識
処理に日本語辞書を参照して、もしくは日本語辞書を優
先して認識するよう指示する。また、ステップS107
の判断結果が非であれば、注目行が英語文字であると判
断できるから、英語認識辞書を参照、もしくは優先して
認識処理を行うよう指示する。
に、この判断処理を行っている。すなわち、縦横比R
を、予め設定された閾値T以上であるか否かを判断し、
その判断結果が是であれば、ステップS108で注目行
は日本語文字として判断し、下位の処理である文字認識
処理に日本語辞書を参照して、もしくは日本語辞書を優
先して認識するよう指示する。また、ステップS107
の判断結果が非であれば、注目行が英語文字であると判
断できるから、英語認識辞書を参照、もしくは優先して
認識処理を行うよう指示する。
【0053】以上説明したように本実施例によれば、行
単位に英語か日本語かを判断できるので、後の文字認識
処理においては、適正な認識辞書が選択させることが可
能となり、認識率を向上させることが可能になる。ま
た、場合によっては、認識アルゴリズム自身を切り替え
るようにしても良い。
単位に英語か日本語かを判断できるので、後の文字認識
処理においては、適正な認識辞書が選択させることが可
能となり、認識率を向上させることが可能になる。ま
た、場合によっては、認識アルゴリズム自身を切り替え
るようにしても良い。
【0054】<第2の実施例の説明>上記第1の実施例
においてアルファベット日本語判別を文字画像の1行毎
に行ったがその限りでない。
においてアルファベット日本語判別を文字画像の1行毎
に行ったがその限りでない。
【0055】例えば、文字画像の1行目を抽出し、その
1行目にY軸への斜影を行いRを算出しアルファベット
日本語判別を行ったらその結果をその画像全体の判別結
果としてもよい。
1行目にY軸への斜影を行いRを算出しアルファベット
日本語判別を行ったらその結果をその画像全体の判別結
果としてもよい。
【0056】または文字画像をX軸への斜影により行切
りを行い、Y軸への斜影により文字切りを行なった後、
任意にm文字分選びだし、m文字のRの平均を算出しそ
の文字画像全体のアルファベット日本語判別を行う方法
もある。
りを行い、Y軸への斜影により文字切りを行なった後、
任意にm文字分選びだし、m文字のRの平均を算出しそ
の文字画像全体のアルファベット日本語判別を行う方法
もある。
【0057】これらの方法により、計算時間の短縮が計
れる。
れる。
【0058】<第3の実施例の説明>上述の第1の実施
例における図7(a)を見ると「は」や「い」などの2
つのオブジェクトによって構成される文字がX軸への斜
影という文字切りにより、それぞれの文字は2つに分割
された状態(御分割)で検出されてします。
例における図7(a)を見ると「は」や「い」などの2
つのオブジェクトによって構成される文字がX軸への斜
影という文字切りにより、それぞれの文字は2つに分割
された状態(御分割)で検出されてします。
【0059】また、図7(b)のアルファベットである
英語は「qualified」のfが右側のiにかぶさって位置
しているためにこれら2つの文字で1文字として検出さ
れてしまう。
英語は「qualified」のfが右側のiにかぶさって位置
しているためにこれら2つの文字で1文字として検出さ
れてしまう。
【0060】実際、このような状況が発生したとして
も、1行当たりの文字数がある程度あれば、正しく判別
できることが確かめられたが、「は」や「い」等の文字
や、「fi」等のように2つの文字がかぶっている場合が
多く発生する可能性は否定できない。
も、1行当たりの文字数がある程度あれば、正しく判別
できることが確かめられたが、「は」や「い」等の文字
や、「fi」等のように2つの文字がかぶっている場合が
多く発生する可能性は否定できない。
【0061】本第3の実施例では、かかる問題点を一掃
する。
する。
【0062】上述の誤分割の結果の特徴として日本語文
内では相対的に細く文字切りされたものが誤分割である
ことが多く、アルファベットでは相対的に太く分割され
たものが誤分割であることが多い。
内では相対的に細く文字切りされたものが誤分割である
ことが多く、アルファベットでは相対的に太く分割され
たものが誤分割であることが多い。
【0063】そこで、図1におけるステップS107の
文字切りのパラメータ計算においては、行中の文字切り
による分割数ncharを幅の太いものから細いものま
で順番に並べ、上位a個と下位b個を除いて縦横比R計
算を行う。
文字切りのパラメータ計算においては、行中の文字切り
による分割数ncharを幅の太いものから細いものま
で順番に並べ、上位a個と下位b個を除いて縦横比R計
算を行う。
【0064】このようにすると、誤分割の影響が少なく
できるので、判断結果は第1の実施例と比較して高くな
る。
できるので、判断結果は第1の実施例と比較して高くな
る。
【0065】具体的に図7の縦横比Rを計算してみる。
【0066】日本語である図7(a)はY軸への斜影に
よって16個分に分割され、その値はwordW[16]は先に
示した通りである。
よって16個分に分割され、その値はwordW[16]は先に
示した通りである。
【0067】ここで、wordW[16]を大きい順に並べると
(wordW2[]とする)、以下の通りである。すなわち、 wordW2[16]={8.0,8.0,8.0,7.5,7.0,7.0,7.0,6.5,6.5,
6.5,6.0,5.0,3.5,3.0,1.5,1.5}(mm) となる。
(wordW2[]とする)、以下の通りである。すなわち、 wordW2[16]={8.0,8.0,8.0,7.5,7.0,7.0,7.0,6.5,6.5,
6.5,6.0,5.0,3.5,3.0,1.5,1.5}(mm) となる。
【0068】ここで、間引きする個数a、bを、nch
ar/4、すなわち、それぞれを検出された文字数の1
/4として決定すると、a=b=4となる。
ar/4、すなわち、それぞれを検出された文字数の1
/4として決定すると、a=b=4となる。
【0069】この結果、間引き後の平均文字幅ave_word
W2は、 ave_wordW2=(wordW2[11]+wordW2[10]+wordW2[9]+wordW
2[8]+wordW2[7]+wordW2[6]+wordW2[5]+wordW2[4])/8 =52.0/8=6.5(mm) となる。この結果、縦横比Rは、R=平均幅/縦=6.
50/7.0=0.93の値が得られる。
W2は、 ave_wordW2=(wordW2[11]+wordW2[10]+wordW2[9]+wordW
2[8]+wordW2[7]+wordW2[6]+wordW2[5]+wordW2[4])/8 =52.0/8=6.5(mm) となる。この結果、縦横比Rは、R=平均幅/縦=6.
50/7.0=0.93の値が得られる。
【0070】この値と、第1の実施例で得られた値
“0.83”と比較すると、「Rが大きいという日本語
の特徴」を強調させることができるのがわかる。
“0.83”と比較すると、「Rが大きいという日本語
の特徴」を強調させることができるのがわかる。
【0071】一方、英語である図7(b)はY軸への斜
影によって30個に分割され、その値は、 wordW[30]={5.5,4.0,3.0,3.0,3.0,3.5,3.0,3.0,1.5,3.
0,3.0,3.0,2.5,3.5,2.5,3.0,3.0,3.0,2.5,2.5,1.5,2.5,
3.5,3.0,3.0,1.5,1.5,4.0,3.0,3.5}(mm) となる。
影によって30個に分割され、その値は、 wordW[30]={5.5,4.0,3.0,3.0,3.0,3.5,3.0,3.0,1.5,3.
0,3.0,3.0,2.5,3.5,2.5,3.0,3.0,3.0,2.5,2.5,1.5,2.5,
3.5,3.0,3.0,1.5,1.5,4.0,3.0,3.5}(mm) となる。
【0072】日本語の場合と同じように、間引き数a、
bをnchar/4とすると、a=b=7になる。
bをnchar/4とすると、a=b=7になる。
【0073】従って、大きい順に並べ変えた場合の、上
下7個のデータを無視して、平均文字幅ave_wordW2を
算出すると、ave_wordW2=(wordW2[22]〜w
ordW[7]の合計)/16=3.00(mm)とな
る。
下7個のデータを無視して、平均文字幅ave_wordW2を
算出すると、ave_wordW2=(wordW2[22]〜w
ordW[7]の合計)/16=3.00(mm)とな
る。
【0074】従って、縦横比Rは3.00/7.0=
0.43となる。
0.43となる。
【0075】この値は、第1の実施例と比較して0.0
1だけRが高くなるという結果になってしまったが、
「fi」の様にくっついてしまった文字が今回は1個し
かなかったためであり、複数ある場合は有効に作用す
る。
1だけRが高くなるという結果になってしまったが、
「fi」の様にくっついてしまった文字が今回は1個し
かなかったためであり、複数ある場合は有効に作用す
る。
【0076】また、a=nchar/8,b=ncha
r/4などのように英語の誤分割(太くなる)が日本語
の誤分割(細くなる)に比べて少ないという前提でaと
bとを同じにするのではなく、異なるようにしても良い
であろう。
r/4などのように英語の誤分割(太くなる)が日本語
の誤分割(細くなる)に比べて少ないという前提でaと
bとを同じにするのではなく、異なるようにしても良い
であろう。
【0077】以上説明したように第3の実施例によれ
ば、第1の実施例と比較して、その判別の精度を上げる
ことが可能になる。
ば、第1の実施例と比較して、その判別の精度を上げる
ことが可能になる。
【0078】<第4の実施例の説明>上述の実施例にお
いて行抽出手段は文字画像に対する軸への射影としたが
その限りでなくたとえば、図1のステップS101の領
域分割により行ってもいい。
いて行抽出手段は文字画像に対する軸への射影としたが
その限りでなくたとえば、図1のステップS101の領
域分割により行ってもいい。
【0079】具体的には、図3のステップS301の解
像度変換、ステップS302の輪郭線追跡を行なったあ
と、輪郭線追跡により抽出されたオブジェクトのうち細
長いものを文字と判定するが、ステップS303の同一
グループ結合を行わずに、行として領域分割をする。こ
の処理により図2(a)を実行した結果は図8の様にな
り、軸への射影は必要なくなる。しかし、解像度変換の
影響で抽出された行の精度が低いのでそれを考慮してし
きい値Tの値をチューニングしなければならない。
像度変換、ステップS302の輪郭線追跡を行なったあ
と、輪郭線追跡により抽出されたオブジェクトのうち細
長いものを文字と判定するが、ステップS303の同一
グループ結合を行わずに、行として領域分割をする。こ
の処理により図2(a)を実行した結果は図8の様にな
り、軸への射影は必要なくなる。しかし、解像度変換の
影響で抽出された行の精度が低いのでそれを考慮してし
きい値Tの値をチューニングしなければならない。
【0080】<第5の実施例の説明>上述の実施例にお
いて、本処理を施す1画素1ビットの画像にノイズが存
在していては本アルファベット日本語判別の能力を生か
せられない。従って明らかにノイズとわかる孤立ドット
などを除去すると良いだろう。孤立ドット除去の方法と
しては画像をウインドリングしパタンマッチングで消去
する方法などがある。
いて、本処理を施す1画素1ビットの画像にノイズが存
在していては本アルファベット日本語判別の能力を生か
せられない。従って明らかにノイズとわかる孤立ドット
などを除去すると良いだろう。孤立ドット除去の方法と
しては画像をウインドリングしパタンマッチングで消去
する方法などがある。
【0081】<第6の実施例の説明>上述の実施例にお
いて図1のステップS101の領域分離処理を施す画像
は1画素1ビットの画像としたがその限りでなく、例え
ば1画素8ビットの多値画像でもよい。その場合、領域
分離は微分フィルタをかけて高周波成分を抽出し、文字
部、写真部にわける方法がある。本アルファベット日本
語判別を実施するには上記1画素8ビットの多値画像を
一定しきい値で2値化する必要がある。
いて図1のステップS101の領域分離処理を施す画像
は1画素1ビットの画像としたがその限りでなく、例え
ば1画素8ビットの多値画像でもよい。その場合、領域
分離は微分フィルタをかけて高周波成分を抽出し、文字
部、写真部にわける方法がある。本アルファベット日本
語判別を実施するには上記1画素8ビットの多値画像を
一定しきい値で2値化する必要がある。
【0082】<第7の実施例の説明>本アルファベット
日本語自動判別法を施す前に、文字画像の傾きを補正す
ることによって、原稿が傾いた画像に対してより良好な
結果を得ることができる。傾き補正は例えば抽出した行
の傾きを求めて、座標変換することによって実現でき
る。
日本語自動判別法を施す前に、文字画像の傾きを補正す
ることによって、原稿が傾いた画像に対してより良好な
結果を得ることができる。傾き補正は例えば抽出した行
の傾きを求めて、座標変換することによって実現でき
る。
【0083】<第8の実施例の説明>本アルファベット
日本語自動判別法を施す前に、文字画像の方向を検出す
ることによって、原稿の方向に依存しない結果を得るこ
とができる。文字画像方向の検出は例えば領域分割によ
って抽出した文字画像を行抽出、文字抽出を実行し、抽
出した数画像を0°回転、90°回転、180°回転、
270°回転を行いOCRを行う。OCRの確信度が得
られるのでそれを利用して文字画像の方向を検出し原画
像回転を行う。
日本語自動判別法を施す前に、文字画像の方向を検出す
ることによって、原稿の方向に依存しない結果を得るこ
とができる。文字画像方向の検出は例えば領域分割によ
って抽出した文字画像を行抽出、文字抽出を実行し、抽
出した数画像を0°回転、90°回転、180°回転、
270°回転を行いOCRを行う。OCRの確信度が得
られるのでそれを利用して文字画像の方向を検出し原画
像回転を行う。
【0084】<第9の実施例の説明>第1の実施例で
は、文字画像の行抽出を行い、すべての行を抽出した後
で1番目の行の文字抽出を行なったが、この限りでな
く、文字画像の行抽出を行い、1番目の行が見つかった
時点で、その行に対し文字抽出を行い、本アルファベッ
ト日本語自動判別を実施することも出来るメモリなどが
少なくてすむメリットがある。
は、文字画像の行抽出を行い、すべての行を抽出した後
で1番目の行の文字抽出を行なったが、この限りでな
く、文字画像の行抽出を行い、1番目の行が見つかった
時点で、その行に対し文字抽出を行い、本アルファベッ
ト日本語自動判別を実施することも出来るメモリなどが
少なくてすむメリットがある。
【0085】以上説明したように本実施例によれば、文
字画像を、Y軸に射影し行を抽出する行抽出手段と、上
記抽出された行に対しX軸への斜影を行い文字数(nc
har)および文字幅(wordW[nchar])を
抽出する文字抽出手段と、文字幅の平均値ave_wo
rdW=(ΣwordW)/ncharと行の高さ(l
ineH)との比Rを算出する算出手段と、Rとしきい
値Tを比較する比較手段と、R>=Tのときは日本語と
判別し、R<Tのときはアルファベットと判別する判別
手段を持つ、アルファベット日本語自動判別方法である
ので、ユーザの手間なしにアルファベットと日本語を良
好に判別できるようになる。
字画像を、Y軸に射影し行を抽出する行抽出手段と、上
記抽出された行に対しX軸への斜影を行い文字数(nc
har)および文字幅(wordW[nchar])を
抽出する文字抽出手段と、文字幅の平均値ave_wo
rdW=(ΣwordW)/ncharと行の高さ(l
ineH)との比Rを算出する算出手段と、Rとしきい
値Tを比較する比較手段と、R>=Tのときは日本語と
判別し、R<Tのときはアルファベットと判別する判別
手段を持つ、アルファベット日本語自動判別方法である
ので、ユーザの手間なしにアルファベットと日本語を良
好に判別できるようになる。
【0086】また、上記X軸への斜影により文字切りさ
れた結果から文字幅の大きいものを上から順にa文字、
文字幅の小さいものを下から順にb文字除きRを計算す
ることにより、文字切りの誤分割結果をかなりの確率で
除くことができ、さらに良好にアルファベットと日本語
を判別することが可能となる。
れた結果から文字幅の大きいものを上から順にa文字、
文字幅の小さいものを下から順にb文字除きRを計算す
ることにより、文字切りの誤分割結果をかなりの確率で
除くことができ、さらに良好にアルファベットと日本語
を判別することが可能となる。
【0087】また、上記処理を施す前にノイズ除去を行
うといっそう良好にアルファベットと日本語を判別する
ことが可能となる。
うといっそう良好にアルファベットと日本語を判別する
ことが可能となる。
【0088】尚、各実施例では、いずれも日本語と英語
について説明したが、英語の代わりにドイツ語やフラン
ス語を用いても同様であり、且つ、日本語の代わりに漢
字圏(例えば中国語)にしても同様であるので、上記例
によって本発明が限定されるものではない。
について説明したが、英語の代わりにドイツ語やフラン
ス語を用いても同様であり、且つ、日本語の代わりに漢
字圏(例えば中国語)にしても同様であるので、上記例
によって本発明が限定されるものではない。
【0089】また、実施例ではイメージスキャナ6から
入力される画像に対して処理を行なったが、画像は例え
ば通信回線を介して送られてきても良いし、例えば所定
の記憶媒体(例えばフロッピーディスク等)に記憶させ
ておいて、そこから画像を読出しても同様に処理できる
ので、上記実施例によって限定されるものではない。
入力される画像に対して処理を行なったが、画像は例え
ば通信回線を介して送られてきても良いし、例えば所定
の記憶媒体(例えばフロッピーディスク等)に記憶させ
ておいて、そこから画像を読出しても同様に処理できる
ので、上記実施例によって限定されるものではない。
【0090】尚、本発明は、複数の機器から構成される
システムに適用しても、1つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置にプログ
ラムを供給することによって達成される場合にも適用で
きることはいうまでもない。
システムに適用しても、1つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置にプログ
ラムを供給することによって達成される場合にも適用で
きることはいうまでもない。
【発明の効果】以上説明したように、本発明によれば、
入力された原稿画像中の文字種を効率良く判定すること
で、下位の処理、例えば文字認識処理における処理精度
を上げることが可能になる。
入力された原稿画像中の文字種を効率良く判定すること
で、下位の処理、例えば文字認識処理における処理精度
を上げることが可能になる。
【0091】
【図1】本発明の一例を説明するフローチャートであ
る。
る。
【図2】図1のステップS101の領域分離処理の概要
を説明するための図である。
を説明するための図である。
【図3】領域分離の一例を説明するフローチャートであ
る。
る。
【図4】図3のステップS301の解像度変換処理の概
要を説明するための図である。
要を説明するための図である。
【図5】図1のステップS101の領域分離処理により
作成される構造体データの構造及び実際のデータの例を
示す図である。
作成される構造体データの構造及び実際のデータの例を
示す図である。
【図6】Y軸への斜影によって行抽出される様子を示し
たものである。
たものである。
【図7】X軸への斜影によって文字抽出される様子を示
したものである。
したものである。
【図8】第4の実施例による行抽出の一例を説明する図
である。
である。
【図9】Y軸への斜影の一例を説明するフローチャート
である。
である。
【図10】本実施例の文字認識装置のブロック構成図で
ある。
ある。
1 CPU 2 ROM 3 RAM 4 外部記憶装置 5 入力装置 6 イメージスキャナ 7 画像メモリ 8 表示装置
Claims (20)
- 【請求項1】 原稿画像を入力して、当該原稿中の文字
の種別を判定し下位の処理に渡す画像処理装置であっ
て、 入力された原稿画像中の文字列パターンを含む行を判別
する判別手段と、 該判別手段によって判別された行の高さ、仮文字数、及
び個々の仮文字の幅をドット分布に基づいて検出する検
出手段と、 該検出手段で検出された行高、仮文字数及び仮文字の幅
に基づいて注目行の文字種を判定する判定手段とを備え
ることを特徴とする画像処理装置。 - 【請求項2】 前記下位処理は文字認識処理であって、
前記判定手段で判定された結果に応じて認識処理すると
きに使用する認識辞書を選択させることを特徴とする請
求項第1項に記載の画像処理装置。 - 【請求項3】 前記下位処理は文字認識処理であって、
前記判定手段で判定された結果に応じて認識処理すると
きに使用する認識アルゴリズムを選択させることを特徴
とする請求項第1項に記載の画像処理装置。 - 【請求項4】 前記文字種は、アルファベット文字と漢
字圏文字のいずれかであることを特徴とする請求項第1
項に記載の画像処理装置。 - 【請求項5】 前記判定手段は、1文字当たりの高さと
幅の比の平均値でもって注目行の文字種を判定すること
を特徴とする請求項第1項に記載の画像処理装置。 - 【請求項6】 前記判定手段は、注目行中の仮文字の文
字幅の大きさに従って並べ替え、両端から所定個数の仮
文字を除く仮文字で得られるの高さと幅の平均値でもっ
て判定することを特徴とする請求項第5項に記載の画像
処理装置。 - 【請求項7】 前記所定個数は、仮文字数の個数に依存
して変動することを特徴とする請求項第6項に記載の画
像処理装置。 - 【請求項8】 更に、前記入力された原稿画像中のノイ
ズ除去するノイズ除去手段を備えることを特徴とする請
求項第1項に記載の画像処理装置。 - 【請求項9】 更に、前記入力された画像を所定角度だ
け回転させて、正立画像としての方向を決定する手段を
備えることを特徴とする請求項第1項に記載の画像処理
装置。 - 【請求項10】 更に、前記入力された原稿画像が傾い
ていると判断された場合に画像の傾きを補正する補正手
段を備えることを特徴とする請求項第1項に記載の画像
処理装置。 - 【請求項11】 原稿画像を入力して、当該原稿中の文
字の種別を判定し下位の処理に渡す画像処理方法であっ
て、 入力された原稿画像中の文字列パターンを含む行を判別
する判別工程と、 該判別工程によって判別された行の高さ、仮文字数、及
び個々の仮文字の幅をドット分布に基づいて検出する検
出工程と、 該検出工程で検出された行高、仮文字数及び仮文字の幅
に基づいて注目行の文字種を判定する判定工程とを備え
ることを特徴とする画像処理方法。 - 【請求項12】 前記下位処理は文字認識処理であっ
て、前記判定工程で判定された結果に応じて認識処理す
るときに使用する認識辞書を選択させることを特徴とす
る請求項第11項に記載の画像処理方法。 - 【請求項13】 前記下位処理は文字認識処理であっ
て、前記判定工程で判定された結果に応じて認識処理す
るときに使用する認識アルゴリズムを選択させることを
特徴とする請求項第11項に記載の画像処理装置。 - 【請求項14】 前記文字種は、アルファベット文字と
漢字圏文字のいずれかであることを特徴とする請求項第
11項に記載の画像処理方法。 - 【請求項15】 前記判定工程は、1文字当たりの高さ
と幅の比の平均値でもって注目行の文字種を判定するこ
とを特徴とする請求項第11項に記載の画像処理方法。 - 【請求項16】 前記判定工程は、注目行中の仮文字の
文字幅の大きさに従って並べ替え、両端から所定個数の
仮文字を除く仮文字で得られるの高さと幅の平均値でも
って判定することを特徴とする請求項第15項に記載の
画像処理方法。 - 【請求項17】 前記所定個数は、仮文字数の個数に依
存して変動することを特徴とする請求項第16項に記載
の画像処理方法。 - 【請求項18】 更に、前記入力された原稿画像中のノ
イズ除去するノイズ除去工程を備えることを特徴とする
請求項第11項に記載の画像処理方法。 - 【請求項19】 更に、前記入力された画像を所定角度
だけ回転させて、正立画像としての方向を決定する工程
を備えることを特徴とする請求項第11項に記載の画像
処理方法。 - 【請求項20】 更に、前記入力された原稿画像が傾い
ていると判断された場合に画像の傾きを補正する補正工
程を備えることを特徴とする請求項第11項に記載の画
像処理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7143366A JPH08339424A (ja) | 1995-06-09 | 1995-06-09 | 画像処理装置及び方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7143366A JPH08339424A (ja) | 1995-06-09 | 1995-06-09 | 画像処理装置及び方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08339424A true JPH08339424A (ja) | 1996-12-24 |
Family
ID=15337119
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7143366A Withdrawn JPH08339424A (ja) | 1995-06-09 | 1995-06-09 | 画像処理装置及び方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08339424A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2009085491A3 (en) * | 2007-12-26 | 2009-08-27 | Intel Corporation | Ocr multi-resolution method and apparatus |
-
1995
- 1995-06-09 JP JP7143366A patent/JPH08339424A/ja not_active Withdrawn
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2009085491A3 (en) * | 2007-12-26 | 2009-08-27 | Intel Corporation | Ocr multi-resolution method and apparatus |
| US8611661B2 (en) | 2007-12-26 | 2013-12-17 | Intel Corporation | OCR multi-resolution method and apparatus |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6975762B2 (en) | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof | |
| US5410611A (en) | Method for identifying word bounding boxes in text | |
| US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
| US5197107A (en) | Character recognition apparatus | |
| US20020051574A1 (en) | Character recognition method, program and recording medium | |
| US5625710A (en) | Character recognition apparatus using modification of a characteristic quantity | |
| JPH0721310A (ja) | 文書認識装置 | |
| WO2013121647A1 (ja) | 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム | |
| KR20010015025A (ko) | 문자인식장치의 문자추출방법 및 장치 | |
| JPH09311905A (ja) | 行検出方法および文字認識装置 | |
| JPH0773271A (ja) | 領域分割方法 | |
| JPH08339424A (ja) | 画像処理装置及び方法 | |
| JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
| JP3710164B2 (ja) | 画像処理装置及び方法 | |
| JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
| JP2917427B2 (ja) | 図面読取装置 | |
| EP0767941B1 (en) | Automatic determination of landscape scan in binary images | |
| JPH1021336A (ja) | 文字列種別判定方法及び装置 | |
| JPH117493A (ja) | 文字認識処理装置 | |
| JP2993533B2 (ja) | 情報処理装置及び文字認識装置 | |
| JPH08161432A (ja) | 文字切り出し方法および文字切り出し装置 | |
| JP2000207491A (ja) | 文字列読取方法及び装置 | |
| JPH0757047A (ja) | 文字切出し方式 | |
| JPH05135204A (ja) | 文字認識装置 | |
| JP2004013188A (ja) | 帳票読取り装置および帳票読取り方法ならびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20020903 |