JPH103516A - 情報処理方法及び装置 - Google Patents
情報処理方法及び装置Info
- Publication number
- JPH103516A JPH103516A JP8155507A JP15550796A JPH103516A JP H103516 A JPH103516 A JP H103516A JP 8155507 A JP8155507 A JP 8155507A JP 15550796 A JP15550796 A JP 15550796A JP H103516 A JPH103516 A JP H103516A
- Authority
- JP
- Japan
- Prior art keywords
- application
- information processing
- processing method
- language mode
- displayed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】
【課題】 入力画像から判別された言語モードの確認を
容易にし、かつ認識結果の保存後にアプリケーションを
起動する場合の操作性を向上させる。 【解決手段】 入力画像から切り出した領域の言語モー
ド属性をイメージ表示部に表示して、修正可能とし、そ
の言語モード属性に応じて認識された結果の保存時に、
保存終了後自動起動するアプリケーションを指定可能と
する。
容易にし、かつ認識結果の保存後にアプリケーションを
起動する場合の操作性を向上させる。 【解決手段】 入力画像から切り出した領域の言語モー
ド属性をイメージ表示部に表示して、修正可能とし、そ
の言語モード属性に応じて認識された結果の保存時に、
保存終了後自動起動するアプリケーションを指定可能と
する。
Description
【0001】
【発明の属する技術分野】本発明は、入力画像の文字を
認識する情報処理方法及び装置に関するものである。
認識する情報処理方法及び装置に関するものである。
【0002】本発明は、異なる言語が存在し得る原稿画
像を処理し得る情報処理方法及び装置に関するものであ
る。
像を処理し得る情報処理方法及び装置に関するものであ
る。
【0003】本発明は、汎用コンピュータ上で動作する
アプリケーションの起動を制御する情報処理方法及び装
置に関するものである。
アプリケーションの起動を制御する情報処理方法及び装
置に関するものである。
【0004】
【従来の技術】2種類以上の言語によって書かれた文書
を対象に文字認識を行う場合、言語別に最適な固有処理
を行なう複数の認識処理系を用意し、入力文書別あるい
は入力文書中の文字領域別にユーザーが言語を指定する
操作を行い、各言語に特化した認識処理を行うことで、
どの言語の文字に対しても高い認識率を持つ文字認識装
置が得られる。このような文字認識装置においては、操
作者が文字認識装置に、文書ごとあるいは文書中の文字
領域ごとに正しい言語モードを指定した後、文字認識処
理を行なわせている。
を対象に文字認識を行う場合、言語別に最適な固有処理
を行なう複数の認識処理系を用意し、入力文書別あるい
は入力文書中の文字領域別にユーザーが言語を指定する
操作を行い、各言語に特化した認識処理を行うことで、
どの言語の文字に対しても高い認識率を持つ文字認識装
置が得られる。このような文字認識装置においては、操
作者が文字認識装置に、文書ごとあるいは文書中の文字
領域ごとに正しい言語モードを指定した後、文字認識処
理を行なわせている。
【0005】文字認識処理の出力結果に対しては確認お
よび修正が必要である。従来の文字認識アプリケーショ
ンでは、認識結果に対して、 1.文字認識アプリケーションプログラム内で簡単なテ
キストエディタを持ち、それを用いて確認、修正を行
う。 2.ファイルに出力結果を保存する。操作者は他のテキ
ストエディタや文書エディタなどのアプリケーションを
起動し、前記ファイルを開いて確認、修正を行う。とい
う2種類の方法を提供していた。
よび修正が必要である。従来の文字認識アプリケーショ
ンでは、認識結果に対して、 1.文字認識アプリケーションプログラム内で簡単なテ
キストエディタを持ち、それを用いて確認、修正を行
う。 2.ファイルに出力結果を保存する。操作者は他のテキ
ストエディタや文書エディタなどのアプリケーションを
起動し、前記ファイルを開いて確認、修正を行う。とい
う2種類の方法を提供していた。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
装置では、設定された言語モードはプログラム内部の変
数値としてのみ存在していた。この変数値は領域を指定
して領域情報のダイアログを開くことで確認できるが、
画像中の各領域毎の言語モードを知る為には、領域ひと
つひとつを指定して領域情報のダイアログを開き値を確
認するという操作を必要としていた。
装置では、設定された言語モードはプログラム内部の変
数値としてのみ存在していた。この変数値は領域を指定
して領域情報のダイアログを開くことで確認できるが、
画像中の各領域毎の言語モードを知る為には、領域ひと
つひとつを指定して領域情報のダイアログを開き値を確
認するという操作を必要としていた。
【0007】このため、言語の異なる複数の文書を連続
処理する場合や、文書中の多数の文字領域に異なる言語
モードを指定した後などに、注目領域に対する言語モー
ドが正しく設定されているかどうかを確認する作業は非
常に繁雑であり、操作者の負担となっていた。
処理する場合や、文書中の多数の文字領域に異なる言語
モードを指定した後などに、注目領域に対する言語モー
ドが正しく設定されているかどうかを確認する作業は非
常に繁雑であり、操作者の負担となっていた。
【0008】また、認識結果に対する修正等の方法とし
て提供されるもののうち、1.の方法は、主に誤認識文
字を個々に修正することを目的としたものである。文字
認識処理によって派生した下位候補を操作者に提示する
などして、効果的な誤認識文字修正環境が提供される。
て提供されるもののうち、1.の方法は、主に誤認識文
字を個々に修正することを目的としたものである。文字
認識処理によって派生した下位候補を操作者に提示する
などして、効果的な誤認識文字修正環境が提供される。
【0009】しかし、認識結果に単純なテキストエディ
タでは処理できない情報が含まれる場合、上記方法では
不十分である。例えば、表や写真も混在する複雑なフォ
ーマット文書に対する認識結果など、認識結果に文字だ
けではなくイメージ情報、及び文書の構造情報を含む場
合である。
タでは処理できない情報が含まれる場合、上記方法では
不十分である。例えば、表や写真も混在する複雑なフォ
ーマット文書に対する認識結果など、認識結果に文字だ
けではなくイメージ情報、及び文書の構造情報を含む場
合である。
【0010】その点、2.の方法では、アプリケーショ
ンを適当に選択することで、複雑なフォーマットの認識
結果も確認・修正することが出来る。例えば、前述の構
造情報を含む認識結果を表示する際には、構造情報に対
応する文書エディタを用いればよい。
ンを適当に選択することで、複雑なフォーマットの認識
結果も確認・修正することが出来る。例えば、前述の構
造情報を含む認識結果を表示する際には、構造情報に対
応する文書エディタを用いればよい。
【0011】しかしこの際には、文字認識結果のファイ
ル出力を待って所望のアプリケーションを起動し、その
アプリケーション上で保存された出力結果ファイルを開
く、という操作を必要とするために、出力結果の確認に
手間がかかった。
ル出力を待って所望のアプリケーションを起動し、その
アプリケーション上で保存された出力結果ファイルを開
く、という操作を必要とするために、出力結果の確認に
手間がかかった。
【0012】
【課題を解決する手段】上記課題を解決する為に、本発
明は、入力画像と、該画像を構成する複数の領域を表す
枠と、前記領域の言語モード属性を表示し、前記表示さ
れている領域における所望の領域を指定し、前記指定さ
れた領域の言語モード属性を指示し、前記指示に応じて
前記表示されている言語モード属性を変更する情報処理
方法及び装置。
明は、入力画像と、該画像を構成する複数の領域を表す
枠と、前記領域の言語モード属性を表示し、前記表示さ
れている領域における所望の領域を指定し、前記指定さ
れた領域の言語モード属性を指示し、前記指示に応じて
前記表示されている言語モード属性を変更する情報処理
方法及び装置。
【0013】上記課題を解決する為に、本発明は好まし
くは、前記言語モード属性に応じて異なる文字認識処理
を行う。
くは、前記言語モード属性に応じて異なる文字認識処理
を行う。
【0014】上記課題を解決する為に、本発明は好まし
くは、言語モード属性に応じて、異なるシンボルパター
ンを表示する。
くは、言語モード属性に応じて、異なるシンボルパター
ンを表示する。
【0015】上記課題を解決する為に、本発明は好まし
くは、前記言語モード属性に応じて言語毎に異なる処理
を前記画像に対して行う。
くは、前記言語モード属性に応じて言語毎に異なる処理
を前記画像に対して行う。
【0016】上記課題を解決する為に、本発明は好まし
くは、前記言語モード属性に応じて、異なる色のシンボ
ルパターンを表示する。
くは、前記言語モード属性に応じて、異なる色のシンボ
ルパターンを表示する。
【0017】上記課題を解決する為に、本発明は好まし
くは、前記言語モード属性に応じて、異なる形状のシン
ボルパターンを表示する。
くは、前記言語モード属性に応じて、異なる形状のシン
ボルパターンを表示する。
【0018】上記課題を解決する為に、本発明は好まし
くは、前記画像をスキャナにより入力する。
くは、前記画像をスキャナにより入力する。
【0019】上記課題を解決する為に、本発明は、汎用
コンピュータ上で動作する文字認識アプリケーションに
おける情報処理方法であって、入力画像を文字認識し、
前記文字認識の結果を保存し、前記文字認識結果の保存
後、他のアプリケーションを自動起動する情報処理方法
及び装置を提供する。
コンピュータ上で動作する文字認識アプリケーションに
おける情報処理方法であって、入力画像を文字認識し、
前記文字認識の結果を保存し、前記文字認識結果の保存
後、他のアプリケーションを自動起動する情報処理方法
及び装置を提供する。
【0020】上記課題を解決する為に、本発明は好まし
くは、前記文字認識は、認識結果として複数の出力形式
を持つ。
くは、前記文字認識は、認識結果として複数の出力形式
を持つ。
【0021】上記課題を解決する為に、本発明は好まし
くは、前記自動起動するアプリケーションは、前記出力
形式に対応したアプリケーションを選択起動する。
くは、前記自動起動するアプリケーションは、前記出力
形式に対応したアプリケーションを選択起動する。
【0022】上記課題を解決する為に、本発明は好まし
くは、前記自動起動するアプリケーションを、所望のも
のに指定する。
くは、前記自動起動するアプリケーションを、所望のも
のに指定する。
【0023】上記課題を解決する為に、本発明は、アプ
リケーションを特定し、指定された処理の実行を指示
し、前記指示に応答して前記指定された処理を実行した
後、前記特定されているアプリケーションを起動する情
報処理方法及び装置を提供する。
リケーションを特定し、指定された処理の実行を指示
し、前記指示に応答して前記指定された処理を実行した
後、前記特定されているアプリケーションを起動する情
報処理方法及び装置を提供する。
【0024】上記課題を解決する為に、本発明は好まし
くは、前記アプリケーションの特定は、前記処理の実行
指示画面上にアプリケーションを特定する手段を設け、
そこで行う。
くは、前記アプリケーションの特定は、前記処理の実行
指示画面上にアプリケーションを特定する手段を設け、
そこで行う。
【0025】上記課題を解決する為に、本発明は好まし
くは、前記特定されたアプリケーションは、前記処理の
実行指示画面に対して記憶され、該処理の実行指示画面
が表示される度に該記憶されているアプリケーションを
表示し、編集可能とする。
くは、前記特定されたアプリケーションは、前記処理の
実行指示画面に対して記憶され、該処理の実行指示画面
が表示される度に該記憶されているアプリケーションを
表示し、編集可能とする。
【0026】上記課題を解決する為に、本発明は好まし
くは、前記アプリケーションの起動は、前記指定された
処理を終了した後に行う。
くは、前記アプリケーションの起動は、前記指定された
処理を終了した後に行う。
【0027】上記課題を解決する為に、本発明は好まし
くは、前記アプリケーションの特定は、アプリケーショ
ン名を入力することにより行う。
くは、前記アプリケーションの特定は、アプリケーショ
ン名を入力することにより行う。
【0028】
【発明の実施の形態】以下、添付図面に従って本発明に
かかる実施の形態を詳細に説明する。
かかる実施の形態を詳細に説明する。
【0029】〔装置の構成〕図1は発明の実施の形態に
おける装置の構成を示すブロック図である。図1におい
て、1は装置であり、2は装置1全体を制御する演算処
理用の中央処理装置(以下、CPUという)であり、C
PU2は、メモリ3に記憶されている制御プログラムに
従って例えば後述するフローチャートに示すような、本
実施の形態において説明する各種処理を実行する。3は
ROM、或はRAMを含むメモリであって、CPU3が
実行する為の制御プログラムや、各種データを記憶する
とともに、CPU3のワークエリアや、入力部4より入
力された文書画像データを記憶する領域、更にはイメー
ジの中で認識を行う領域を表すブロック枠座標やその属
性情報を格納する場合にも使用する。
おける装置の構成を示すブロック図である。図1におい
て、1は装置であり、2は装置1全体を制御する演算処
理用の中央処理装置(以下、CPUという)であり、C
PU2は、メモリ3に記憶されている制御プログラムに
従って例えば後述するフローチャートに示すような、本
実施の形態において説明する各種処理を実行する。3は
ROM、或はRAMを含むメモリであって、CPU3が
実行する為の制御プログラムや、各種データを記憶する
とともに、CPU3のワークエリアや、入力部4より入
力された文書画像データを記憶する領域、更にはイメー
ジの中で認識を行う領域を表すブロック枠座標やその属
性情報を格納する場合にも使用する。
【0030】4は文書画像を読取って入力する入力部
で、例えばスキャナ等により構成され、原稿画像データ
をデジタルデータとして入力する。4’はスキャナ4を
接続し、データの授受、及び制御を行うインターフェイ
ス部である。なお、画像の入力は装置1に直接接続され
たスキャナ4から行うものと限定されるものではなく、
他の情報処理装置で入力された画像のデジタルデータを
通信回線等を介したり、外部記憶装置に記憶されている
画像のデジタルデータをインターフェイス部4’から入
力しても良い。
で、例えばスキャナ等により構成され、原稿画像データ
をデジタルデータとして入力する。4’はスキャナ4を
接続し、データの授受、及び制御を行うインターフェイ
ス部である。なお、画像の入力は装置1に直接接続され
たスキャナ4から行うものと限定されるものではなく、
他の情報処理装置で入力された画像のデジタルデータを
通信回線等を介したり、外部記憶装置に記憶されている
画像のデジタルデータをインターフェイス部4’から入
力しても良い。
【0031】5は記憶装置(ハードディスク、FD、C
D−ROM、磁気テープ、ROMなど)であって、イン
ターフェイス5’を介して装置本体1間でデータの授
受、制御が行われる。メモリ3に記憶される制御プログ
ラムも、この記憶装置から提供されても良い。
D−ROM、磁気テープ、ROMなど)であって、イン
ターフェイス5’を介して装置本体1間でデータの授
受、制御が行われる。メモリ3に記憶される制御プログ
ラムも、この記憶装置から提供されても良い。
【0032】6は属性変更部であって、後述のポインテ
ィングデバイス等による操作によって、属性とそれに伴
うブロックシンボル(詳細は後述する)の変更を行う。
変更指示に応じて、属性変更部6はメモリ3に記憶され
ている属性情報の記憶更新も行う。7は文字認識前処理
部で、メモリ3に記憶された文書画像の画像的特徴を解
析して、ブロック切り出しや、更にそのブロックに含ま
れる1文字毎のパターン画像を切り出す等の、認識の前
処理を行う。8は認識部であり、8−1の日本語認識部
では、前処理部7によって前処理されたパターンが像か
ら幾何学的特徴を抽出し、あらかじめ日本語認識用辞書
8−2に格納されている標準パターンと照合して文書画
像の文字認識を行う。同様に8−3は英語認識部であ
り、英語辞書8−4に格納されているパターンを用いて
文字認識を行う。この2つの認識部のどちらを用いて認
識処理が行われるかはブロック毎に指定された言語モー
ド属性に従う。この言語モード属性は、メモリ3に記憶
されている情報に従う。日本語用認識辞書8−2及び英
語用認識辞書8−4は、各言語に使用される文字の標準
パターンデータ及び、その文字認識結果を言語解析する
認識後処理の為の言語毎の文法情報等が記憶されてい
る。この認識用辞書を他の言語の辞書に切り替えること
により、日本語、英語のみならず、フランス語、イタリ
ア語等、どのような言語にも対応できる。
ィングデバイス等による操作によって、属性とそれに伴
うブロックシンボル(詳細は後述する)の変更を行う。
変更指示に応じて、属性変更部6はメモリ3に記憶され
ている属性情報の記憶更新も行う。7は文字認識前処理
部で、メモリ3に記憶された文書画像の画像的特徴を解
析して、ブロック切り出しや、更にそのブロックに含ま
れる1文字毎のパターン画像を切り出す等の、認識の前
処理を行う。8は認識部であり、8−1の日本語認識部
では、前処理部7によって前処理されたパターンが像か
ら幾何学的特徴を抽出し、あらかじめ日本語認識用辞書
8−2に格納されている標準パターンと照合して文書画
像の文字認識を行う。同様に8−3は英語認識部であ
り、英語辞書8−4に格納されているパターンを用いて
文字認識を行う。この2つの認識部のどちらを用いて認
識処理が行われるかはブロック毎に指定された言語モー
ド属性に従う。この言語モード属性は、メモリ3に記憶
されている情報に従う。日本語用認識辞書8−2及び英
語用認識辞書8−4は、各言語に使用される文字の標準
パターンデータ及び、その文字認識結果を言語解析する
認識後処理の為の言語毎の文法情報等が記憶されてい
る。この認識用辞書を他の言語の辞書に切り替えること
により、日本語、英語のみならず、フランス語、イタリ
ア語等、どのような言語にも対応できる。
【0033】9は表示部で、入力された文書画像を表示
するイメージ表示部9−1、その文書画像を認識した結
果のテキストを表示する認識結果表示部9−2、文書画
像から前処理部7により切り出されたブロックを識別で
きるようにブロックの境界線を表示する為のブロック枠
表示部9−3、各ブロックから判定された属性を識別で
きるように属性表示部9−4からなる。10はLCDや
CRT等のディスプレイであって、表示部9の制御によ
り、画像や図形、文字、等を様々な属性を付加して表示
することができる。
するイメージ表示部9−1、その文書画像を認識した結
果のテキストを表示する認識結果表示部9−2、文書画
像から前処理部7により切り出されたブロックを識別で
きるようにブロックの境界線を表示する為のブロック枠
表示部9−3、各ブロックから判定された属性を識別で
きるように属性表示部9−4からなる。10はLCDや
CRT等のディスプレイであって、表示部9の制御によ
り、画像や図形、文字、等を様々な属性を付加して表示
することができる。
【0034】11は外部の出力装置、例えばLBPやイ
ンクジェットプリンタ等のプリンタであり、インターフ
ェイス部11’の制御のもと、各種データを印字する。
12はキーボード及びマウス等の、ユーザが各種データ
の入力、指示を行う為のものであって、インターフェイ
ス部12’の制御のもと、指示がなされる。13はシス
テムバスであって、CPU2のデータバス、アドレスバ
ス、及び制御信号バス等を含んでいる。
ンクジェットプリンタ等のプリンタであり、インターフ
ェイス部11’の制御のもと、各種データを印字する。
12はキーボード及びマウス等の、ユーザが各種データ
の入力、指示を行う為のものであって、インターフェイ
ス部12’の制御のもと、指示がなされる。13はシス
テムバスであって、CPU2のデータバス、アドレスバ
ス、及び制御信号バス等を含んでいる。
【0035】以上のような構成において、入力部4から
原稿画像を入力し、メモリ3に格納する。そして、格納
された原画像とは別個に、縮小画像を生成し、メモリ3
に格納する。この縮小画像は、原画像のn×nの画素ブ
ロックを1つの縮小画素とするもので、n×nの画素ブ
ロック中に1つでも黒画素が存在する場合に縮小画素を
黒画素として決定するものである。この処理を行うと、
結局原画像を縦横それぞれ1/n倍にしたのと同じこと
になり、かつ連接する文字イメージ(文字パターンのド
ットイメージ)が互いに連結された状態となる。この連
結されたドット分布に外接する矩形を順次定義してい
き、領域分割していく。
原稿画像を入力し、メモリ3に格納する。そして、格納
された原画像とは別個に、縮小画像を生成し、メモリ3
に格納する。この縮小画像は、原画像のn×nの画素ブ
ロックを1つの縮小画素とするもので、n×nの画素ブ
ロック中に1つでも黒画素が存在する場合に縮小画素を
黒画素として決定するものである。この処理を行うと、
結局原画像を縦横それぞれ1/n倍にしたのと同じこと
になり、かつ連接する文字イメージ(文字パターンのド
ットイメージ)が互いに連結された状態となる。この連
結されたドット分布に外接する矩形を順次定義してい
き、領域分割していく。
【0036】以下の説明では、領域分割処理を上記のよ
うにして処理したものとして説明するが、領域分割処理
はこれに限らずいかなる処理で行っても良い。
うにして処理したものとして説明するが、領域分割処理
はこれに限らずいかなる処理で行っても良い。
【0037】図2は本発明の実施の形態における、図1
の装置(コンピュータ)1上で動作するソフトウェアの
ブロック図である。装置1のオペレーションシステム2
01が、各アプリケーションに対して、CPU2やメモ
リ3、及び各種外部機器の使用を管理する。このオペレ
ーションシステム201の管理下で、本発明に係る文字
認識アプリケーション202、テキストエディタ20
3、文書エディタ204、イメージ表示アプリケーショ
ン205が選択的に、あるいは同時に実行される。
の装置(コンピュータ)1上で動作するソフトウェアの
ブロック図である。装置1のオペレーションシステム2
01が、各アプリケーションに対して、CPU2やメモ
リ3、及び各種外部機器の使用を管理する。このオペレ
ーションシステム201の管理下で、本発明に係る文字
認識アプリケーション202、テキストエディタ20
3、文書エディタ204、イメージ表示アプリケーショ
ン205が選択的に、あるいは同時に実行される。
【0038】図3は、本発明の実施の形態における全体
的な処理を表すフローチャートであって、文書画像がス
キャナ4等により入力され(S301)、文字認識アプ
リケーション202により入力画像を前処理部7が解析
して領域分割し、各領域の属性(テキスト、図、表、罫
線、テキストの種類等)を判断し、各領域(ブロック)
の位置情報や、属性情報をメモリ3に記憶する(S30
2)。S301で入力された画像に含まれる文字の認識
を文字認識アプリケーション202により行い(S30
3)、認識結果のテキスト(文字コード列)や、領域情
報等、入力文書に関する情報を一つのファイルとして保
存(S304)する。各処理において行われるイメージ
の表示(例えばS502等)は、イメージ表示アプリケ
ーション205により実行しても良い。
的な処理を表すフローチャートであって、文書画像がス
キャナ4等により入力され(S301)、文字認識アプ
リケーション202により入力画像を前処理部7が解析
して領域分割し、各領域の属性(テキスト、図、表、罫
線、テキストの種類等)を判断し、各領域(ブロック)
の位置情報や、属性情報をメモリ3に記憶する(S30
2)。S301で入力された画像に含まれる文字の認識
を文字認識アプリケーション202により行い(S30
3)、認識結果のテキスト(文字コード列)や、領域情
報等、入力文書に関する情報を一つのファイルとして保
存(S304)する。各処理において行われるイメージ
の表示(例えばS502等)は、イメージ表示アプリケ
ーション205により実行しても良い。
【0039】図4は、S302で行われた領域分割処理
における、領域分割の結果を表示するウインドウの例で
ある。
における、領域分割の結果を表示するウインドウの例で
ある。
【0040】入力された文書画像(メモリ3に格納され
ている)と領域分割結果及び領域の属性とを合せてイメ
ージウインドウとしてイメージ表示部9−1の処理によ
りディスプレイ10に表示する。
ている)と領域分割結果及び領域の属性とを合せてイメ
ージウインドウとしてイメージ表示部9−1の処理によ
りディスプレイ10に表示する。
【0041】図4において、41は入力部4で読み取ら
れた文書画像を表示していることを示すイメージウイン
ドウである。42は領域分割の結果である枠(1つの領
域のサイズを明示する枠)であり、ここではテキスト部
分の段落の位置を示している。43、44及び45はブ
ロックの属性を示すブロックシンボルである。ブロック
の属性とは、ブロック枠内の文字の性質を示すもので、
ブロックの順序、内容(表題、文章)、組み方向(横、
縦)、言語モード(日本語、英語…)などがある。
れた文書画像を表示していることを示すイメージウイン
ドウである。42は領域分割の結果である枠(1つの領
域のサイズを明示する枠)であり、ここではテキスト部
分の段落の位置を示している。43、44及び45はブ
ロックの属性を示すブロックシンボルである。ブロック
の属性とは、ブロック枠内の文字の性質を示すもので、
ブロックの順序、内容(表題、文章)、組み方向(横、
縦)、言語モード(日本語、英語…)などがある。
【0042】ここではブロックシンボルの色によって、
前述の属性のうち言語モードを表示させている。図4の
43、44は枠内の言語モード属性が日本語であること
を示す白地のブロックシンボル、45は枠内の言語モー
ド属性が英語であることを示す黒地のブロックシンボル
である。
前述の属性のうち言語モードを表示させている。図4の
43、44は枠内の言語モード属性が日本語であること
を示す白地のブロックシンボル、45は枠内の言語モー
ド属性が英語であることを示す黒地のブロックシンボル
である。
【0043】〔ブロック属性の表示〕以下、イメージウ
インドウにブロック毎の属性を表示し、属性の修正を受
けつけた上で各属性に応じた認識処理を行う例につい
て、S301〜S303の処理ステップを更に詳細にし
た処理を図5のフローチャートに示し、以下に説明す
る。尚、この処理を実行する制御プログラムはメモリ3
に記憶されている。
インドウにブロック毎の属性を表示し、属性の修正を受
けつけた上で各属性に応じた認識処理を行う例につい
て、S301〜S303の処理ステップを更に詳細にし
た処理を図5のフローチャートに示し、以下に説明す
る。尚、この処理を実行する制御プログラムはメモリ3
に記憶されている。
【0044】まずステップS301で操作者によりセッ
トされた文書画像を入力部4(スキャナ)により読み取
って入力し、メモリ3に記憶する。
トされた文書画像を入力部4(スキャナ)により読み取
って入力し、メモリ3に記憶する。
【0045】次にステップS501に進み、前処理部7
により領域分割を行う。領域分割において、テキストの
段落、図、表、罫線などの各ブロックの属性も取り出
す。
により領域分割を行う。領域分割において、テキストの
段落、図、表、罫線などの各ブロックの属性も取り出
す。
【0046】ステップS502では、S501で取り出
され、メモリ3に記憶された属性情報に従って図4に示
したように、領域の属性をブロックシンボルという形式
で表示すると共に、イメージ表示部で読み取った画像を
表示する。初期状態では全ブロックの属性はデフォルト
値に設定される。
され、メモリ3に記憶された属性情報に従って図4に示
したように、領域の属性をブロックシンボルという形式
で表示すると共に、イメージ表示部で読み取った画像を
表示する。初期状態では全ブロックの属性はデフォルト
値に設定される。
【0047】ステップS503では操作者が表示部に示
された属性情報を確認し、修正の必要があれば、マウス
やキーボード12を用いて領域の属性の修正情報を入力
する。属性が修正された領域があるとS503で判断さ
れた場合は、指示に応じてメモリ3に格納されている属
性情報を変更し、再びステップS502を実行して修正
されたブロックシンボルを再表示する。S503で属性
の修正がなされていないと判断された後、文字認識処理
に移行する。
された属性情報を確認し、修正の必要があれば、マウス
やキーボード12を用いて領域の属性の修正情報を入力
する。属性が修正された領域があるとS503で判断さ
れた場合は、指示に応じてメモリ3に格納されている属
性情報を変更し、再びステップS502を実行して修正
されたブロックシンボルを再表示する。S503で属性
の修正がなされていないと判断された後、文字認識処理
に移行する。
【0048】ステップS505では、ブロック毎に指定
された属性をメモリ3より参照し、言語モード属性が日
本語の場合は日本語認識部8−1によりステップS50
6の日本語文字認識を、言語モード属性が英語の場合は
英語認識部8−3によりステップS507の英語文字認
識を行う。
された属性をメモリ3より参照し、言語モード属性が日
本語の場合は日本語認識部8−1によりステップS50
6の日本語文字認識を、言語モード属性が英語の場合は
英語認識部8−3によりステップS507の英語文字認
識を行う。
【0049】最後にステップS508において認識結果
を出力する。認識結果は操作者の指定によってディスプ
レイ10の表示画面に表示するだけでなく、記憶装置5
やプリンタ11に出力することが可能である。
を出力する。認識結果は操作者の指定によってディスプ
レイ10の表示画面に表示するだけでなく、記憶装置5
やプリンタ11に出力することが可能である。
【0050】最後にステップS508において認識結果
を出力する。認識結果は操作者の指定によってディスプ
レイ10の表示画面に表示するだけでなく、記憶装置5
やプリンタ11に出力することが可能である。
を出力する。認識結果は操作者の指定によってディスプ
レイ10の表示画面に表示するだけでなく、記憶装置5
やプリンタ11に出力することが可能である。
【0051】図6はステップS502におけるブロック
シンボル表示部の処理を示すフローチャートである。S
61において各ブロックの属性をメモリ3より読み出
し、ブロックの言語モード属性が日本語のときはS62
に進み白地のブロックシンボルを、ブロックの言語モー
ド属性が英語のときはS63に進み黒地のブロックシン
ボルを表示する。
シンボル表示部の処理を示すフローチャートである。S
61において各ブロックの属性をメモリ3より読み出
し、ブロックの言語モード属性が日本語のときはS62
に進み白地のブロックシンボルを、ブロックの言語モー
ド属性が英語のときはS63に進み黒地のブロックシン
ボルを表示する。
【0052】図7は本発明の実施の形態における属性の
修正処理を可能とする表示の例示図である。操作パネル
72とイメージウインドウ71を表示している。イメー
ジウインドウ7に示されているのは領域分割処理後のS
502の状態で、全ブロックの言語モード属性はデフォ
ルト値にセットされており、ここでは全て日本語となっ
ている。このため図7中のブロックシンボル73、74
及び75の全てが、枠内の文章が日本語であることを示
す白色地で表示されている。
修正処理を可能とする表示の例示図である。操作パネル
72とイメージウインドウ71を表示している。イメー
ジウインドウ7に示されているのは領域分割処理後のS
502の状態で、全ブロックの言語モード属性はデフォ
ルト値にセットされており、ここでは全て日本語となっ
ている。このため図7中のブロックシンボル73、74
及び75の全てが、枠内の文章が日本語であることを示
す白色地で表示されている。
【0053】ここで、ブロックシンボル75の示す領域
は、実際には英語の文章の領域であるから、認識の前に
ブロックの言語モード属性を英語に変更する必要があ
る。このことは操作者がイメージウインドウの画像とそ
れに上書きされたブロックシンボルの色を比較すること
で容易に確認できる。
は、実際には英語の文章の領域であるから、認識の前に
ブロックの言語モード属性を英語に変更する必要があ
る。このことは操作者がイメージウインドウの画像とそ
れに上書きされたブロックシンボルの色を比較すること
で容易に確認できる。
【0054】操作者は、マウス12でブロックシンボル
75を指定し、更に操作パネル72中の、ブロック属性
を英語に変更するボタン76をクリックすることで、ブ
ロック78の言語モード属性値を英語に変更してメモリ
3を更新する。本操作によってブロックシンボルは枠内
の文章が英語であることを示す黒地のブロックシンボル
に変更され、イメージウインドウは図4の41と同じ状
態になる。なお、本属性変更操作は上記に限らず、他の
操作によって行われるようにしてもよい。
75を指定し、更に操作パネル72中の、ブロック属性
を英語に変更するボタン76をクリックすることで、ブ
ロック78の言語モード属性値を英語に変更してメモリ
3を更新する。本操作によってブロックシンボルは枠内
の文章が英語であることを示す黒地のブロックシンボル
に変更され、イメージウインドウは図4の41と同じ状
態になる。なお、本属性変更操作は上記に限らず、他の
操作によって行われるようにしてもよい。
【0055】以上のように、本発明においては、図7に
おけるような表示によって操作者は表示された画像とブ
ロックシンボルの色との比較から、領域毎に指定すべき
言語モードと、現在設定されている言語モードとの不整
合を容易に発見することができ、多言語文字認識処理の
際の言語モード確認操作の繁雑さを軽減することが出来
る。
おけるような表示によって操作者は表示された画像とブ
ロックシンボルの色との比較から、領域毎に指定すべき
言語モードと、現在設定されている言語モードとの不整
合を容易に発見することができ、多言語文字認識処理の
際の言語モード確認操作の繁雑さを軽減することが出来
る。
【0056】尚、図4においては、ブロックシンボルの
色を、認識に用いられる言語モードの種類により、日本
語では白地、英語では黒地としたが、他の区別の容易な
様々な色を用いることも可能である。
色を、認識に用いられる言語モードの種類により、日本
語では白地、英語では黒地としたが、他の区別の容易な
様々な色を用いることも可能である。
【0057】尚、図7においては、領域分割直後にはす
べてのブロックに等しくデフォルトの言語モードを設定
していたが、枠内の画像を基に言語モードを判別するよ
うな言語判別手段を用い、ブロック毎に言語判別を行っ
た結果を各ブロックのそれぞれの言語モードデフォルト
値としてもよい。このときも、本発明における属性表示
手段によって、操作者はブロックシンボルの色と画像を
比較することで前記の言語判別の正否を容易に確認出来
るので、操作の負担は軽減される。
べてのブロックに等しくデフォルトの言語モードを設定
していたが、枠内の画像を基に言語モードを判別するよ
うな言語判別手段を用い、ブロック毎に言語判別を行っ
た結果を各ブロックのそれぞれの言語モードデフォルト
値としてもよい。このときも、本発明における属性表示
手段によって、操作者はブロックシンボルの色と画像を
比較することで前記の言語判別の正否を容易に確認出来
るので、操作の負担は軽減される。
【0058】尚、図4においては、ブロックシンボルを
区別するために色を用いたが、視覚的に区別が容易であ
るように、言語モード属性によってブロックシンボルの
形を変更してもよい。例えば図8で示すように81と8
2のように形状を変えたり、大きさを変えたり、あるい
は点滅の有無をもって区別してもよい。
区別するために色を用いたが、視覚的に区別が容易であ
るように、言語モード属性によってブロックシンボルの
形を変更してもよい。例えば図8で示すように81と8
2のように形状を変えたり、大きさを変えたり、あるい
は点滅の有無をもって区別してもよい。
【0059】尚、図7においては、言語モードは日本語
と英語の2つであったが、各種多言語を対象とする文字
認識装置においては、それぞれの言語モードを示すブロ
ックシンボル毎に別の色もしくは形状を割り当ててもよ
い。
と英語の2つであったが、各種多言語を対象とする文字
認識装置においては、それぞれの言語モードを示すブロ
ックシンボル毎に別の色もしくは形状を割り当ててもよ
い。
【0060】〔アプリケーション起動制御〕次に、文字
認識アプリケーション202の処理を図9のフローチャ
ートに沿って説明する。しかし、ここでは、特に保存処
理S304についてS901〜S906に詳細に説明す
る。S301〜S303は図5及び図6のフローチャー
トで示した処理と同様であるので、ここでは省略する。
認識アプリケーション202の処理を図9のフローチャ
ートに沿って説明する。しかし、ここでは、特に保存処
理S304についてS901〜S906に詳細に説明す
る。S301〜S303は図5及び図6のフローチャー
トで示した処理と同様であるので、ここでは省略する。
【0061】まずステップS301で、操作者はスキャ
ナ4を用いて文書画像データを文字認識プログラムに入
力する。スキャナのかわりに、入力画像として外部記憶
装置5中の、あるいは図示外のネットワークを介して受
信された文書画像ファイルを指定してもよい。入力され
た画像データはメモリ3に格納される。
ナ4を用いて文書画像データを文字認識プログラムに入
力する。スキャナのかわりに、入力画像として外部記憶
装置5中の、あるいは図示外のネットワークを介して受
信された文書画像ファイルを指定してもよい。入力され
た画像データはメモリ3に格納される。
【0062】次にステップS302では、CPU2は文
書画像に対し領域分割を行う。領域分割によって文書中
のテキスト、表、罫線、図、写真などの各領域を取り出
し、その文書内での座標や大きさなどからなる構造情報
をメモリ3に記憶する。また図や写真のように文字認識
処理が行えない領域に関してはイメージデータをメモリ
3に記憶する。
書画像に対し領域分割を行う。領域分割によって文書中
のテキスト、表、罫線、図、写真などの各領域を取り出
し、その文書内での座標や大きさなどからなる構造情報
をメモリ3に記憶する。また図や写真のように文字認識
処理が行えない領域に関してはイメージデータをメモリ
3に記憶する。
【0063】図10は入力文書の例、図11は図10の
文書画像に対する領域分割の結果の例を示し、各々イメ
ージ表示アプリケーション205によりディスプレイ1
0に表示される。1101、1102、1103はテキ
スト領域、1104は表領域、1105は図の領域、1
106は罫線である。
文書画像に対する領域分割の結果の例を示し、各々イメ
ージ表示アプリケーション205によりディスプレイ1
0に表示される。1101、1102、1103はテキ
スト領域、1104は表領域、1105は図の領域、1
106は罫線である。
【0064】ここで、前記領域分割は、文書画像の縮小
によって得られた連結成分の分布から文字の集合を推定
する方式によって行われるが、この方式に限らずいかな
る処理で行ってもよい。
によって得られた連結成分の分布から文字の集合を推定
する方式によって行われるが、この方式に限らずいかな
る処理で行ってもよい。
【0065】ステップS303では、CPU2はテキス
トとして属性が与えられた領域内の文字を文字認識す
る。文字認識は文字パターンから幾何学的特徴を抽出
し、認識部8において認識用辞書中の標準パターンと照
合し、文字コードに変換される。
トとして属性が与えられた領域内の文字を文字認識す
る。文字認識は文字パターンから幾何学的特徴を抽出
し、認識部8において認識用辞書中の標準パターンと照
合し、文字コードに変換される。
【0066】ステップS901において、操作者は認識
結果を保存するかどうかを選択し、キーボード・マウス
12により指示する。保存される認識結果は、S303
で得たテキスト領域内の文字認識結果である文字コー
ド、S301で記憶された図・写真イメージ、及びそれ
らの構造情報を総合した、文書全体の認識結果である。
結果を保存するかどうかを選択し、キーボード・マウス
12により指示する。保存される認識結果は、S303
で得たテキスト領域内の文字認識結果である文字コー
ド、S301で記憶された図・写真イメージ、及びそれ
らの構造情報を総合した、文書全体の認識結果である。
【0067】S901で保存を選択するよう指示された
場合、S902において、操作者は保存ファイル名をキ
ーボード12により入力する。さらにS903におい
て、認識結果を保存後に結果の確認・修正のために他の
アプリケーションを起動するかどうかを選択し、キーボ
ード或いはマウス12により指示する。
場合、S902において、操作者は保存ファイル名をキ
ーボード12により入力する。さらにS903におい
て、認識結果を保存後に結果の確認・修正のために他の
アプリケーションを起動するかどうかを選択し、キーボ
ード或いはマウス12により指示する。
【0068】認識結果の保存後にアプリケーションを起
動させることが指示されている場合、S904に進み認
識結果をファイルとしてメモリ3或いは記憶装置5に保
存した後、S905において指示に応じて他のアプリケ
ーションを起動する。この際に、他のアプリケーション
に対し、保存された認識結果のファイルを指定して、起
動された他のアプリケーション上で直ちに認識結果内容
が表示されるようにする。
動させることが指示されている場合、S904に進み認
識結果をファイルとしてメモリ3或いは記憶装置5に保
存した後、S905において指示に応じて他のアプリケ
ーションを起動する。この際に、他のアプリケーション
に対し、保存された認識結果のファイルを指定して、起
動された他のアプリケーション上で直ちに認識結果内容
が表示されるようにする。
【0069】アプリケーションを起動しない場合は、S
906で認識結果をメモリ3或いは記憶装置5にファイ
ル保存して、終了する。
906で認識結果をメモリ3或いは記憶装置5にファイ
ル保存して、終了する。
【0070】図9のS901〜S903において表示さ
れているウインドウ例を、図12に示し、操作について
説明する。
れているウインドウ例を、図12に示し、操作について
説明する。
【0071】操作者はキーボードやマウス12を用いて
ダイアログ1202中のテキストボックス1203に認
識結果保存のためのファイル名を入力する。
ダイアログ1202中のテキストボックス1203に認
識結果保存のためのファイル名を入力する。
【0072】また、チェックボックス1203によって
アプリケーションの自動起動を有無を選択する。チェッ
クボックス1203の状態は、マウス12でカーソル1
208をあわせクリックすることによって、クリックす
る度にオン→オフ→オンと交互に変化する。
アプリケーションの自動起動を有無を選択する。チェッ
クボックス1203の状態は、マウス12でカーソル1
208をあわせクリックすることによって、クリックす
る度にオン→オフ→オンと交互に変化する。
【0073】更に1205に起動したいアプリケーショ
ン名をキーボード12により入力することで、操作者の
望む任意のアプリケーションが起動されるようになる。
この入力値は保存用ウインドウ1202に対して保存す
ることが出来、変更のない場合は認識操作の際に毎回入
力しておかなくてもよいようになっている。
ン名をキーボード12により入力することで、操作者の
望む任意のアプリケーションが起動されるようになる。
この入力値は保存用ウインドウ1202に対して保存す
ることが出来、変更のない場合は認識操作の際に毎回入
力しておかなくてもよいようになっている。
【0074】保存ファイル名とアプリケーション起動の
有無を指示した後保存のボタン1206をマウス12に
よりクリックすることで、動作はステップS904また
はS906に移る。保存を望まない場合はキャンセルボ
タン1207をマウス12によりクリックすればよい。
有無を指示した後保存のボタン1206をマウス12に
よりクリックすることで、動作はステップS904また
はS906に移る。保存を望まない場合はキャンセルボ
タン1207をマウス12によりクリックすればよい。
【0075】図13中の1302は、S902において
保存用ウインドウ1202の起動アプリケーションとし
て文書エディタを指示したことにより、ステップS90
5で起動されたアプリケーションの例である。このアプ
リケーションは複雑な文書構造を再現出来、文書中の図
や写真などもイメージとして取り込める文書エディタで
ある。
保存用ウインドウ1202の起動アプリケーションとし
て文書エディタを指示したことにより、ステップS90
5で起動されたアプリケーションの例である。このアプ
リケーションは複雑な文書構造を再現出来、文書中の図
や写真などもイメージとして取り込める文書エディタで
ある。
【0076】以上のように、本発明においては、認識結
果の形式に合った任意のアプリケーションをユーザが指
示できるので、その都度所望のアプリケーションを認識
結果の確認・修正に用いることが可能である上に、それ
らのアプリケーションが認識結果の保存時に自動的に起
動されるので、認識内容を直ちに確認することが出来
る。よって認識後の作業の効率が向上する。
果の形式に合った任意のアプリケーションをユーザが指
示できるので、その都度所望のアプリケーションを認識
結果の確認・修正に用いることが可能である上に、それ
らのアプリケーションが認識結果の保存時に自動的に起
動されるので、認識内容を直ちに確認することが出来
る。よって認識後の作業の効率が向上する。
【0077】尚、文字認識結果の出力形式が、テキスト
のみ、構造情報付きテキスト、あるいはイメージ画像の
ように複数選べる場合、その出力形式の選択によってそ
れぞれ異なるアプリケーションが起動するようにしても
よい。その為には、図14に示すような、文字認識結果
出力形式を選択できるウインドウ1402を表示すれば
良い。認識結果出力の設定ダイアログボックス1402
中の出力形式選択メニュー1403をマウス12で指定
することで出力形式の選択が出来る。また、1404、
1405、1406はそれぞれの形式の出力を表示する
のに用いるアプリケーションで、その内容は操作者によ
ってキーボード12から文字列を入力することによって
変更可能である。
のみ、構造情報付きテキスト、あるいはイメージ画像の
ように複数選べる場合、その出力形式の選択によってそ
れぞれ異なるアプリケーションが起動するようにしても
よい。その為には、図14に示すような、文字認識結果
出力形式を選択できるウインドウ1402を表示すれば
良い。認識結果出力の設定ダイアログボックス1402
中の出力形式選択メニュー1403をマウス12で指定
することで出力形式の選択が出来る。また、1404、
1405、1406はそれぞれの形式の出力を表示する
のに用いるアプリケーションで、その内容は操作者によ
ってキーボード12から文字列を入力することによって
変更可能である。
【0078】上記の選択を認識前、あるいは認識結果保
存前にしておけば、認識結果保存時には出力形式に適合
したアプリケーションが自動的に起動される。よって操
作者は認識結果の形式が如何様であっても内容を直ちに
確認できる。
存前にしておけば、認識結果保存時には出力形式に適合
したアプリケーションが自動的に起動される。よって操
作者は認識結果の形式が如何様であっても内容を直ちに
確認できる。
【0079】尚、テキスト領域の文字認識処理の直後
に、誤認識文字修正処理を加えてもよい。図15はその
処理のフローチャートを示す図であり、図9のフローチ
ャートに対して追加されたステップS1500で誤認識
文字修正処理を行う。
に、誤認識文字修正処理を加えてもよい。図15はその
処理のフローチャートを示す図であり、図9のフローチ
ャートに対して追加されたステップS1500で誤認識
文字修正処理を行う。
【0080】誤認識文字修正処理として、文字修正エデ
ィタを用いる例を図16に示す。文字修正エディタウイ
ンドウ1603は文字認識アプリケーションプログラム
ウインドウ1601の一部として提供されるエディタで
あり、プログラム内部の情報を利用して注目文字毎に候
補1604を提示し、操作者に誤認識を効果的に修正す
る環境を提供する。
ィタを用いる例を図16に示す。文字修正エディタウイ
ンドウ1603は文字認識アプリケーションプログラム
ウインドウ1601の一部として提供されるエディタで
あり、プログラム内部の情報を利用して注目文字毎に候
補1604を提示し、操作者に誤認識を効果的に修正す
る環境を提供する。
【0081】このように、誤認識文字の修正に優れたエ
ディタで文字単位の確認・修正を行ない、その後、文字
修正エディタでは確認・修正出来ない部分を他のアプリ
ケーションを用いて確認・修正を行うことが出来る。
ディタで文字単位の確認・修正を行ない、その後、文字
修正エディタでは確認・修正出来ない部分を他のアプリ
ケーションを用いて確認・修正を行うことが出来る。
【0082】例えば、文書構造を再現出来る文書エディ
タを他のアプリケーションとし起動し、文書の認識結果
のさらなる確認・修正をおこなうことが出来る。この
際、アプリケーションは認識結果の保存時に自動的に起
動され、認識内容を直ちに確認することが出来るので、
認識後の作業の効率は向上する。
タを他のアプリケーションとし起動し、文書の認識結果
のさらなる確認・修正をおこなうことが出来る。この
際、アプリケーションは認識結果の保存時に自動的に起
動され、認識内容を直ちに確認することが出来るので、
認識後の作業の効率は向上する。
【0083】
【発明の効果】以上説明したように、本発明によれば、
入力画像と、該画像を構成する複数の領域を表す枠と、
前記領域の言語モード属性を表示し、前記表示されてい
る領域における所望の領域を指定し、前記指定された領
域の言語モード属性を指示し、前記指示に応じて前記表
示されている言語モード属性を変更することにより、文
字認識処理の確認、修正作業の効率を向上できる。
入力画像と、該画像を構成する複数の領域を表す枠と、
前記領域の言語モード属性を表示し、前記表示されてい
る領域における所望の領域を指定し、前記指定された領
域の言語モード属性を指示し、前記指示に応じて前記表
示されている言語モード属性を変更することにより、文
字認識処理の確認、修正作業の効率を向上できる。
【0084】以上説明したように、本発明によれば、前
記言語モード属性に応じて異なる文字認識処理を行うこ
とにより、文字認識処理の精度を向上させられる。
記言語モード属性に応じて異なる文字認識処理を行うこ
とにより、文字認識処理の精度を向上させられる。
【0085】以上説明したように、本発明によれば、言
語モード属性に応じて、異なるシンボルパターンを表示
することにより、言語モード属性の識別を容易にするこ
とができる。
語モード属性に応じて、異なるシンボルパターンを表示
することにより、言語モード属性の識別を容易にするこ
とができる。
【0086】以上説明したように、本発明によれば、前
記言語モード属性に応じて言語毎に異なる処理を前記画
像に対して行うことにより、言語に合わせた適切な処理
を行うことができる。
記言語モード属性に応じて言語毎に異なる処理を前記画
像に対して行うことにより、言語に合わせた適切な処理
を行うことができる。
【0087】以上説明したように、本発明によれば、前
記言語モード属性に応じて、異なる色のシンボルパター
ンを表示することにより、言語モード属性の識別を容易
に行える。
記言語モード属性に応じて、異なる色のシンボルパター
ンを表示することにより、言語モード属性の識別を容易
に行える。
【0088】以上説明したように、本発明によれば、前
記言語モード属性に応じて、異なる形状のシンボルパタ
ーンを表示することにより、言語モード属性の識別を容
易に行える。
記言語モード属性に応じて、異なる形状のシンボルパタ
ーンを表示することにより、言語モード属性の識別を容
易に行える。
【0089】以上説明したように、本発明によれば、前
記画像をスキャナにより入力することにより、どのよう
な原稿画像に対しても処理を可能とする。
記画像をスキャナにより入力することにより、どのよう
な原稿画像に対しても処理を可能とする。
【0090】以上説明したように、本発明によれば、汎
用コンピュータ上で動作する文字認識アプリケーション
における情報処理方法であって、入力画像を文字認識
し、前記文字認識の結果を保存し、前記文字認識結果の
保存後、他のアプリケーションを自動起動することによ
り、文字認識処理後の修正作業等を効率よく行え、ま
た、その為のアプリケーションを起動させる為の作業能
率を向上させられる。
用コンピュータ上で動作する文字認識アプリケーション
における情報処理方法であって、入力画像を文字認識
し、前記文字認識の結果を保存し、前記文字認識結果の
保存後、他のアプリケーションを自動起動することによ
り、文字認識処理後の修正作業等を効率よく行え、ま
た、その為のアプリケーションを起動させる為の作業能
率を向上させられる。
【0091】以上説明したように、本発明によれば、前
記文字認識は、認識結果として複数の出力形式を持つこ
とにより、必要に応じて必要なデータを得ることができ
る。
記文字認識は、認識結果として複数の出力形式を持つこ
とにより、必要に応じて必要なデータを得ることができ
る。
【0092】以上説明したように、本発明によれば、前
記自動起動するアプリケーションは、前記出力形式に対
応したアプリケーションを選択起動することにより、出
力形式に適したアプリケーションを選択することができ
る。
記自動起動するアプリケーションは、前記出力形式に対
応したアプリケーションを選択起動することにより、出
力形式に適したアプリケーションを選択することができ
る。
【0093】以上説明したように、本発明によれば、前
記自動起動するアプリケーションを、所望のものに指定
することにより、ユーザの所望するアプリケーションを
指定できる。
記自動起動するアプリケーションを、所望のものに指定
することにより、ユーザの所望するアプリケーションを
指定できる。
【0094】以上説明したように、本発明によれば、ア
プリケーションを特定し、指定された処理の実行を指示
し、前記指示に応答して前記指定された処理を実行した
後、前記特定されているアプリケーションを起動するこ
とにより、アプリケーションを起動する時の操作性を向
上させられる。
プリケーションを特定し、指定された処理の実行を指示
し、前記指示に応答して前記指定された処理を実行した
後、前記特定されているアプリケーションを起動するこ
とにより、アプリケーションを起動する時の操作性を向
上させられる。
【0095】以上説明したように、本発明によれば、前
記アプリケーションの特定は、前記処理の実行指示画面
上にアプリケーションを特定する手段を設け、そこで行
うことにより、アプリケーションの指定操作が容易にな
る。
記アプリケーションの特定は、前記処理の実行指示画面
上にアプリケーションを特定する手段を設け、そこで行
うことにより、アプリケーションの指定操作が容易にな
る。
【0096】以上説明したように、本発明によれば、前
記特定されたアプリケーションは、前記処理の実行指示
画面に対して記憶され、該処理の実行指示画面が表示さ
れる度に該記憶されているアプリケーションを表示し、
編集可能とすることにより、デフォルトとして、以前指
定したアプリケーションを提供するので、指定操作が容
易になる。
記特定されたアプリケーションは、前記処理の実行指示
画面に対して記憶され、該処理の実行指示画面が表示さ
れる度に該記憶されているアプリケーションを表示し、
編集可能とすることにより、デフォルトとして、以前指
定したアプリケーションを提供するので、指定操作が容
易になる。
【0097】以上説明したように、本発明によれば、前
記アプリケーションの起動は、前記指定された処理を終
了した後に行うことにより、次に起動するアプリケーシ
ョンを指示する為に、指定された処理の終了を待つ必要
がなくなり、操作性が向上する。
記アプリケーションの起動は、前記指定された処理を終
了した後に行うことにより、次に起動するアプリケーシ
ョンを指示する為に、指定された処理の終了を待つ必要
がなくなり、操作性が向上する。
【0098】以上説明したように、本発明によれば、前
記アプリケーションの特定は、アプリケーション名を入
力することにより行うことにより、アプリケーションの
特定作業が簡単になる。
記アプリケーションの特定は、アプリケーション名を入
力することにより行うことにより、アプリケーションの
特定作業が簡単になる。
【図1】発明の実施の形態における装置の構成を示すブ
ロック図
ロック図
【図2】発明の実施の形態におけるソフトウェア構成図
【図3】全体的な処理のフローチャート
【図4】イメージウインドウの例示図
【図5】属性修正及び認識処理のフローチャート
【図6】属性表示処理のフローチャート
【図7】属性修正処理時の表示例示図
【図8】属性表示の第二の例
【図9】認識結果保存処理のフローチャート
【図10】入力原稿画像の例示図
【図11】図10の画像を領域分割した結果の図
【図12】保存ウインドウ例示図
【図13】他のアプリケーションが起動された時の表示
例示図
例示図
【図14】認識結果出力の設定ウインドウ例示図
【図15】誤認識文字修正ステップを加えた処理のフロ
ーチャート
ーチャート
【図16】誤認識文字修正時の表示例示図
Claims (18)
- 【請求項1】 入力画像と、該画像を構成する複数の領
域を表す枠と、前記領域の言語モード属性を表示し、前
記表示されている領域における所望の領域を指定し、前
記指定された領域の言語モード属性を指示し、前記指示
に応じて前記表示されている言語モード属性を変更する
ことを特徴とする情報処理方法。 - 【請求項2】 前記言語モード属性に応じて異なる文字
認識処理を行うことを特徴とする請求項1に記載の情報
処理方法。 - 【請求項3】 言語モード属性に応じて、異なるシンボ
ルパターンを表示することを特徴とする請求項1に記載
の情報処理方法。 - 【請求項4】 前記言語モード属性に応じて言語毎に異
なる処理を前記画像に対して行うことを特徴とする請求
項1に記載の情報処理方法。 - 【請求項5】 前記言語モード属性に応じて、異なる色
のシンボルパターンを表示することを特徴とする請求項
1に記載の情報処理方法。 - 【請求項6】 前記言語モード属性に応じて、異なる形
状のシンボルパターンを表示することを特徴とする請求
項1に記載の情報処理方法。 - 【請求項7】 前記画像をスキャナにより入力すること
を特徴とする請求項1に記載の情報処理方法。 - 【請求項8】 入力画像と、該画像を構成する複数の領
域を表す枠と、前記領域の言語モード属性を表示する表
示手段と、前記表示されている領域における所望の領域
を指定する領域指定手段と、前記指定された領域の言語
モード属性を指示する属性指示手段とを有することを特
徴とする情報処理装置。 - 【請求項9】 汎用コンピュータ上で動作する文字認識
アプリケーションにおける情報処理方法であって、入力
画像を文字認識し、前記文字認識の結果を保存し、前記
文字認識結果の保存後、他のアプリケーションを自動起
動することを特徴とする情報処理方法。 - 【請求項10】 前記文字認識は、認識結果として複数
の出力形式を持つことを特徴とする請求項9に記載の情
報処理方法。 - 【請求項11】 前記自動起動するアプリケーション
は、前記出力形式に対応したアプリケーションを選択起
動することを特徴とする請求項10に記載の情報処理方
法。 - 【請求項12】 前記自動起動するアプリケーション
を、所望のものに指定することを特徴とする請求項9に
記載の情報処理方法。 - 【請求項13】 アプリケーションを特定し、指定され
た処理の実行を指示し、前記指示に応答して前記指定さ
れた処理を実行した後、前記特定されているアプリケー
ションを起動することを特徴とする情報処理方法。 - 【請求項14】 前記アプリケーションの特定は、前記
処理の実行指示画面上にアプリケーションを特定する手
段を設け、そこで行うことを特徴とする請求項13に記
載の情報処理方法。 - 【請求項15】 前記特定されたアプリケーションは、
前記処理の実行指示画面に対して記憶され、該処理の実
行指示画面が表示される度に該記憶されているアプリケ
ーションを表示し、編集可能とすることを特徴とする請
求項14に記載の情報処理方法。 - 【請求項16】 前記アプリケーションの起動は、前記
指定された処理を終了した後に行うことを特徴とする請
求項1に記載の情報処理方法。 - 【請求項17】 前記アプリケーションの特定は、アプ
リケーション名を入力することにより行うことを特徴と
する請求項13に記載の情報処理方法。 - 【請求項18】 アプリケーションを特定するアプリケ
ーション特定手段と、指定された処理の実行を指示する
実行指示手段と、前記指示に応答して前記指定された処
理を実行した後、前記特定されているアプリケーション
を起動するアプリケーション起動手段とを有することを
特徴とする情報処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8155507A JPH103516A (ja) | 1996-06-17 | 1996-06-17 | 情報処理方法及び装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8155507A JPH103516A (ja) | 1996-06-17 | 1996-06-17 | 情報処理方法及び装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH103516A true JPH103516A (ja) | 1998-01-06 |
| JPH103516A5 JPH103516A5 (ja) | 2004-07-08 |
Family
ID=15607567
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8155507A Pending JPH103516A (ja) | 1996-06-17 | 1996-06-17 | 情報処理方法及び装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH103516A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006011714A (ja) * | 2004-06-24 | 2006-01-12 | Canon Inc | 画像処理装置及びその制御方法、プログラム |
| JP2007102715A (ja) * | 2005-10-07 | 2007-04-19 | Ricoh Co Ltd | 画像処理装置、画像処理方法及び画像処理プログラム |
| JP2018022528A (ja) * | 2017-10-26 | 2018-02-08 | 三菱電機株式会社 | 入力表示装置、入力表示方法及び入力表示プログラム |
| KR20190099347A (ko) * | 2015-05-28 | 2019-08-26 | 미쓰비시덴키 가부시키가이샤 | 입력 표시 장치, 입력 표시 방법, 및 프로그램 |
-
1996
- 1996-06-17 JP JP8155507A patent/JPH103516A/ja active Pending
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006011714A (ja) * | 2004-06-24 | 2006-01-12 | Canon Inc | 画像処理装置及びその制御方法、プログラム |
| JP2007102715A (ja) * | 2005-10-07 | 2007-04-19 | Ricoh Co Ltd | 画像処理装置、画像処理方法及び画像処理プログラム |
| KR20190099347A (ko) * | 2015-05-28 | 2019-08-26 | 미쓰비시덴키 가부시키가이샤 | 입력 표시 장치, 입력 표시 방법, 및 프로그램 |
| US10510322B2 (en) | 2015-05-28 | 2019-12-17 | Mitsubishi Electric Corporation | Input display device, input display method, and computer-readable medium |
| US10748506B2 (en) | 2015-05-28 | 2020-08-18 | Mitsubishi Electric Corporation | Input display device and input display method |
| JP2018022528A (ja) * | 2017-10-26 | 2018-02-08 | 三菱電機株式会社 | 入力表示装置、入力表示方法及び入力表示プログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5703962A (en) | Image processing method and apparatus | |
| JPH06176188A (ja) | 認識文字の情報作成方法及び装置 | |
| US6504540B1 (en) | Method and apparatus for altering one or more attributes of one or more blocks of image data in a document | |
| US11348331B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
| JPH09231039A (ja) | 印刷特性表示装置 | |
| JPH08166865A (ja) | 画面生成方法及びその装置 | |
| JPH103516A (ja) | 情報処理方法及び装置 | |
| JPH10312407A (ja) | 図面表示装置 | |
| JPH08190636A (ja) | 画像編集印刷システム | |
| US6456739B1 (en) | Apparatus for recognizing characters and a method therefor | |
| JPH0962662A (ja) | 文書処理装置 | |
| JPH08202856A (ja) | 画像処理方法 | |
| JP3761923B2 (ja) | 画像処理装置及び方法 | |
| JP3136852B2 (ja) | タッチパネル画面作成方法およびその装置 | |
| JPH05128302A (ja) | 文字認識方法及びその装置 | |
| JPH096974A (ja) | 画像処理方法及び装置 | |
| JPH0973515A (ja) | 文字認識装置 | |
| JPH096894A (ja) | 文字認識装置及び方法 | |
| JPH1021228A (ja) | 文書編集装置 | |
| JP3221969B2 (ja) | 文字認識装置 | |
| JPH0916717A (ja) | 文書読取装置 | |
| JPH096899A (ja) | 画像処理装置及び方法 | |
| JP2005267394A (ja) | 情報処理装置および領域変更方法およびプログラムおよび記録媒体 | |
| JPH0927008A (ja) | 文字認識装置及び方法 | |
| JPH0991398A (ja) | イメージ処理装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060616 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060620 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060821 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061003 |