JPH096892A - 情報処理装置及び方法 - Google Patents

情報処理装置及び方法

Info

Publication number
JPH096892A
JPH096892A JP7151491A JP15149195A JPH096892A JP H096892 A JPH096892 A JP H096892A JP 7151491 A JP7151491 A JP 7151491A JP 15149195 A JP15149195 A JP 15149195A JP H096892 A JPH096892 A JP H096892A
Authority
JP
Japan
Prior art keywords
character
candidate
recognition
candidates
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7151491A
Other languages
English (en)
Inventor
Tadanori Nakatsuka
忠則 中塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7151491A priority Critical patent/JPH096892A/ja
Publication of JPH096892A publication Critical patent/JPH096892A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字認識結果の全体としての良否の判定が容
易に行なえ、どの文字に注意すれば良いのかも一目瞭然
とさせる。 【構成】 入力部2を介して入力した文書画像はメモリ
5に格納され、前処理部7及び認識部8を経て、文字認
識される。そして、認識結果の第1候補を表示部10に
表示する際、候補数の大小に応じて表示形態、たとえば
色を変える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は情報処理装置及び方法、
詳しくは文字認識して得られた結果を出力する情報処理
装置及び方法に関するものである。
【0002】
【従来の技術】一般に、文字認識装置においては、イメ
ージスキャナ等から文書原稿をデジタル画像データとし
て入力し、入力したデジタル画像データに基づいて文字
の分布を検出し、文字イメージを切り出しては認識処理
するという手順を踏む。
【0003】そして、表示画面には、文字認識処理によ
って得られた候補群中の第1候補で構成される文字列
(文章)を表示し、操作者が指定した文字については第
2候補以降を表示し、その中の1つを選択させて正しい
文章に修正する作業を要する。
【0004】また、場合によっては、候補中に意図した
文字がない場合もある。このような場合には、キーボー
ド等から正しい文字を入力することになる。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来例では、認識した得られた結果をまんべんなくチェッ
クしなければならず、操作者に与える負担は無視できな
い。
【0006】また、上記のような文字認識及び修正処理
においては、第2候補以降に意図した文字が存在しない
ことがわかってはじめて、キーボード等の他の手段によ
る文字入力作業を行う。つまり、無駄な作業(第2候補
以降に意図した文字がないことを確認するという作業)
を操作者に強いることになる。
【0007】
【課題を解決するための手段】及び
【作用】本発明は上記課題に鑑みなされたものであり、
文字認識結果の全体としての良否の判定が容易に行な
え、どの文字に注意すれば良いのかも一目瞭然とさせる
情報処理装置及び方法を提供しようとするものである。
【0008】この課題を解決するため、たとえば本発明
の情報処理装置は以下に示す構成を備える。すなわち、
文字認識して得られた結果を出力する情報処理装置であ
って、文字認識して得られたそれぞれの文字イメージの
第1候補の文字を可視出力する出力手段と、得られた認
識結果の候補数に従って前記第1候補の出力形態を制御
する制御手段とを備える。
【0009】また、本発明の好適な実施態様に従えば、
前記制御手段は、候補数がn以上の場合と、n未満の場
合とで第1候補の出力形態を制御することが望ましい。
これによって認識して得られた候補数が多く、確からし
さが低い文字と、候補数が少なく確からしさが高い文字
とが容易に識別可能になる。
【0010】また、前記制御手段における閾値nは
“2”であることが望ましい。この結果、候補数が1つ
だけの文字かどうかが一目瞭然となり、且つ、候補を選
択する作業が無駄になるか否かを事前に把握することも
可能になる。
【0011】
【実施例】以下、添付図面に従って本発明に係る実施例
を詳細に説明する。
【0012】図1は実施例の文字認識装置の概略構成を
示すブロック図である。図1において、1は第1の実施
例の文字認識装置を示している。2は文書画像を読取っ
て入力する入力部で、例えばスキャナ等により構成さ
れ、読み取った原稿画像データをデジタルに変換して出
力する。3は装置1全体を制御する演算処理用の中央処
理装置(以下、CPUという)を示している。4はRO
Mで、CPU3の図3以降のフローチャートで示された
制御プログラムや各種データを格納している。5はメモ
リ(RAM)で、CPU3のワークエリアとして使用さ
れると共に、入力部2より入力された文書画像データを
記憶する領域、前処理部7で切り出された文字パターン
の位置、大きさを記憶する領域を記憶する領域を備えて
いる。6は認識結果修正部で文字認識結果を修正する。
7は前処理部で、メモリ5に記憶された文書画像の1文
字のパターンを切出す。8は認識部で、前処理部7によ
って前処理されたパターンから幾何学的特徴を抽出し、
予め認識用辞書9に格納されている標準パターンと照合
して文書画像の文字認識を行っている。10は表示部
で、入力された文書画像を表示するイメージ表示部1
4、認識結果表示部15からなる。11はシステムバス
で、CPU3よりのデータバス、アドレスバス及び制御
信号バス等を含んでいる。12は外部の出力装置、例え
ばプリンタ13等とのインタフェース制御を行うインタ
フェース部を示している。また、15はキーボード及び
マウス(ポインティングデバイスの一種)である。
【0013】さて、一般に、文字認識処理を行う場合に
は、先ず、入力した画像中の個々の文字イメージの位置
の検出及び文字イメージの切り出し処理を行なう。そし
て、切り出した文字イメージから特徴量を抽出し、それ
と認識辞書に記憶されている情報とを比較し、最も近い
特徴量を持つ文字から第1候補、第2候補として文字コ
ードを出力する。
【0014】尚、文字認識処理結果、1つの文字候補の
みを出力する場合には、その確からしさは高いと判断さ
れる。逆に、候補数が多ければ多いほど候補群を差別化
することが困難であることを意味することから、その第
1候補の確からしさは低いことを意味することが多い。
【0015】本実施例でも、このような文字認識処理を
採用するものとして説明する。尚、第1候補の確からし
さが高いと判断するための根拠は、たとえば内部的に得
られた第1候補と第2候補との確からしさ(認識対象の
文字イメージから得られた特徴量と、辞書に記憶された
標準特徴量との差分が小さいとき確からしさが高いとい
う)の差が、所定以上の場合である。すなわち、第1の
候補が第2の候補に対して十分な確からしさの差を有し
ている場合である。
【0016】但し、文字認識処理自身に本願発明の特徴
があるのではないので、ここではこの程度の説明にし、
詳細は省略する。
【0017】<認識結果ウインドウの説明(図2)>図
2は実施例の文字認識装置1で認識処理された結果の画
面に表示されるウインドウを示している。図示の符号2
1が認識結果を表示する領域であるウインドウを示して
いる。
【0018】図示の如く、実施例における認識結果であ
る表示文字には2種類存在する。1つは図示の符号22
で示される赤色の文字、もう1つは図示の符号23で示
される青色の文字である。文字22(赤色で表示された
文字)は、その認識された候補が2つ以上存在すること
を示している。
【0019】操作者は、たとえばマウス等に連動するカ
ーソル(図示の符号24)で、赤色で表示された文字を
指定すると、第2候補以下(第1候補を含めても良い)
を図示のポップアップメニューに表示する。
【0020】図示では、第1候補“認”も選択文字の1
つとして表示し、第2候補以下の“誌”、“語”、
“話”、“詰”、“訴”の全部で計6個の文字が認識候
補として得られたことを示している。尚、候補文字数が
ある程度の個数以上の場合には、ポップアップメニュー
中にスクロールバー(図示の認識結果ウインドウ21の
右端もしくは下単に表示されたスクロール量を設定する
ためのコントロール)を表示させる。
【0021】以上の結果、操作者にしてみれば、第2候
補を選択できるものとできないものとが表示画面をみれ
ば一目瞭然となる。換言すれば、青色の文字の割合が高
ければ高いほど、文章全体として認識結果は良好であっ
たことが確認できることになり、認識結果として注意す
るべき文字も瞬時に判断できることにもなる。
【0022】図3は上記実施例の処理内容を示すフロー
チャート(CPU3が処理する手順)で、この処理に対
応する制御プログラムはROM4に記憶されている。
【0023】まずステップS31で、操作者によりセッ
トされた文書画像を入力部2(スキャナ)により読取っ
て入力し、メモリ5に記憶する。
【0024】次にステップS32に進み、前処理部7に
よって前処理された個々の文字パターンから幾何学的特
徴を抽出し、予め認識用辞書9に格納されている標準パ
ターンと照合して文書画像の文字認識を行う。認識結果
が確からしい時は候補文字数が少なくなり、確からしい
時は候補文字を多く出力している。
【0025】次にステップS33に進み、認識結果表示
部14で認識結果を表示し、ステップS34では認識結
果修正部6によって操作者の指示に従い認識結果を修正
する。
【0026】図4は、図3のステップS33の認識結果
表示処理を示すフローチャートである。
【0027】まずステップS41で、注目文字イメージ
に対する認識結果の候補数を調べる。ここで、認識した
結果がかなり確からしいと思われる文字は候補が1つ、
あるいは少ない。因みに、図2に示す認識結果「認」の
場合は、ポップアップメニューには全部で6個の認識候
補が存在したことを示している。
【0028】次にステップS42で、注目している文字
イメージに対する認識処理で得られた候補数が2以上で
あるか否かを判断する。
【0029】2以上であると判断した場合には、ステッ
プS43に進み、その第1候補を赤色で表示する。一
方、認識候補が1つだけである場合には、第1候補(1
つしかない)を青色で表示する。
【0030】次いで、ステップS45に進み、全ての認
識文字について処理を終えたか否かを判断し、否の場合
にはステップS41に戻り、上記処理を繰り返す。
【0031】以上の結果、認識結果の表示画面を見ただ
けで、複数候補がある文字と、1つしかない文字とが一
目瞭然となる。従って、確からしい文字と疑わしい文字
とを識別することが可能になり、文章の文字をチェック
する際に注意すべき文字とそうでない文字とを区別する
ことが可能になる。
【0032】また、上記例では、出力先として表示画面
を例にしたが、出力先としてプリンタ13を採用する場
合には、 認識結果内に候補を持つ文字と持たない文字が存在
し、認識結果修正を行う場合でも混乱を招かず容易に修
正ができる. 確からしい文字は候補がない、または少ないので、属
性を変えて表示することによって、ユーザはすべての認
識結果の確認をするのではなく、確からしくない文字の
み認識結果の確認をすればよいので、修正がかなり容易
になり短時間ですむという、ユーザによって使い易い文
字認識装置を実現することができる。
【0033】<第2の実施例>上記実施例(第1の実施
例)では、図4のステップS42において、候補文字の
数の閾値が2以上か否かでもって表示形態を変えたが、
認識結果の第1候補で文章を表示した場合に、全体とし
ての文字認識の信憑性を判断できるという点からすれ
ば、閾値nとしては“2”に限るものではなく、“3”
以上であっても良い。
【0034】但し、第2候補を選択するという作業を行
うのであれば、認識候補が1つの場合と2つ以上の場合
とで区別した方が都合が良いのは勿論である。このた
め、ユーザが自由に閾値を設定できるようにしても良
い。
【0035】<第3の実施例>第1の実施例では、図4
のステップS43、ステップS44において、ステップ
S42を満たす場合は赤で認識結果の文字を表示し、満
たさない場合は青で表示しているが、色はそれぞれどん
な色でも良いし、色に限らず太文字と通常文字や、アン
ダーラインの有無等、フォント(明朝体とかゴシック体
等)または文字の大きさ、色の濃さ、網かけの有無、下
線の有無、囲み罫の有無、圏点の有無、ルビの有無、反
転文字か否か等、如何なる表示形態にしても良い。すな
わち、候補数によってそれぞれの文字を異なる形態で表
示、もしくは出力(プリントアウトも含む)すれば良い
からである。
【0036】また、場合によっては、環境設定という形
で、ユーザが自由に出力形態を選択できるようにしても
良い。
【0037】<第4の実施例>第1の実施例では、図4
のステップS41において、単純に候補の数を調べてい
るが、キーボードなどからの入力した文字、つまり文字
認識結果以外の文字を除いて、文字認識による候補数の
みを調べても良い。
【0038】以上の説明により第4の実施例においても
前述の第1の実施例と同様の作用・効果を得ることがで
きる。
【0039】<第5の実施例>第1の実施例では表示形
態として2種類のいずれかでもって候補文字数の大小を
報知したが、複数の段数にしても良い。たとえば、候補
文字数が1つ、候補文字数が2〜m,候補文字数がm+
1〜n、…という具合に、出力形態を候補の大小の2値
ではなく、候補数に応じて3以上の形態で出力するよう
にしても良い。この場合にも、操作者が任意に設定(候
補数の範囲と出力形態)できるようにすれば、ユーザフ
レンドリーになる。
【0040】以上の説明により第5の実施例においても
前述の第1の実施例と同様の作用・効果を得ることがで
きる。
【0041】以上説明したように本実施例によれば、 認識結果内に候補を持つ文字と持たない文字が存在
し、認識結果修正を行う場合でも混乱を招かずに容易に
修正ができる、 確からしい文字は候補がない、または少ないので、属
性を変えて表示する事によって、ユーザはすべての認識
結果の確認をするのではなく、確からしくない文字を重
点的に確認をすれば良いので、修正が作業に伴う操作者
の負担を軽減させることが可能になる。
【0042】尚、本発明は単独の装置或いは複数の機器
から構成されるシステムに適応しても、装置或いはシス
テムに外部からプログラムを供給することでもって実現
しても良いのは言うまでもないことでである。従って、
本願発明を実現するプログラムを内蔵させた記憶媒体に
も容易に適応することも可能になる。
【0043】また、実施例では、処理対象の原稿画像は
イメージスキャナ等から入力するものとして説明した
が、イメージを記憶した記憶媒体(例えばフロッピーデ
ィスク等)や、回線を介して受信した場合にも適応でき
るので、上記例によって本願発明が限定されるものでは
ない。
【0044】
【発明の効果】以上説明した様に本発明によれば、文字
認識結果の全体としての良否が容易に判定でき、どの文
字に注意すれば良いのかも一目瞭然となる。
【0045】
【図面の簡単な説明】
【図1】第1の実施例の文字認識装置の概略構成を示す
ブロック図である。
【図2】第1の実施例の文字認識装置における認識結果
の表示例を示す図である。
【図3】第1の実施例の文字認識装置の処理を示すフロ
ーチャートである。
【図4】図3におけるステップS33の詳細を示すフロ
ーチャートである。
【符号の説明】
1 文字認識装置 2 入力部 3 CPU 4 ROM 5 メモリ 6 認識結果修正部 7 前処理部 8 認識部 9 認識用辞書 10 表示部 11 システムバス 12 インタフェース部 13 プリンタ 14 イメージ表示部 15 認識結果表示部 21 認識結果ウインドウ

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 文字認識して得られた結果を出力する情
    報処理装置であって、 文字認識して得られたそれぞれの文字イメージの第1候
    補の文字を可視出力する出力手段と、 得られた認識結果の候補数に従って前記第1候補の出力
    形態を制御する制御手段とを備えることを特徴とする情
    報処理装置。
  2. 【請求項2】 前記制御手段は、候補数がn以上の場合
    と、n未満の場合とで第1候補の出力形態を制御するこ
    とを特徴とする請求項第1項に記載の情報処理装置。
  3. 【請求項3】 前記制御手段における閾値nは“2”で
    あることを特徴とする請求項第2項に記載の情報処理装
    置。
  4. 【請求項4】 文字認識して得られた結果を出力する情
    報処理方法であって、 文字認識して得られたそれぞれの文字イメージの第1候
    補の文字を可視出力する出力工程と、 得られた認識結果の候補数に従って前記第1候補の出力
    形態を制御する制御工程とを備えることを特徴とする情
    報処理方法。
  5. 【請求項5】 前記制御工程は、候補数がn以上の場合
    と、n未満の場合とで第1候補の出力形態を制御するこ
    とを特徴とする請求項第4項に記載の情報処理方法。
  6. 【請求項6】 前記制御工程における閾値nは“2”で
    あることを特徴とする請求項第5項に記載の情報処理方
    法。
JP7151491A 1995-06-19 1995-06-19 情報処理装置及び方法 Pending JPH096892A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7151491A JPH096892A (ja) 1995-06-19 1995-06-19 情報処理装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7151491A JPH096892A (ja) 1995-06-19 1995-06-19 情報処理装置及び方法

Publications (1)

Publication Number Publication Date
JPH096892A true JPH096892A (ja) 1997-01-10

Family

ID=15519664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7151491A Pending JPH096892A (ja) 1995-06-19 1995-06-19 情報処理装置及び方法

Country Status (1)

Country Link
JP (1) JPH096892A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016110536A (ja) * 2014-12-10 2016-06-20 カシオ計算機株式会社 商品処理システム及び商品処理方法
JP2019121313A (ja) * 2018-01-11 2019-07-22 キヤノン株式会社 電子機器、情報処理方法、プログラム及び記憶媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016110536A (ja) * 2014-12-10 2016-06-20 カシオ計算機株式会社 商品処理システム及び商品処理方法
JP2019121313A (ja) * 2018-01-11 2019-07-22 キヤノン株式会社 電子機器、情報処理方法、プログラム及び記憶媒体

Similar Documents

Publication Publication Date Title
US5889897A (en) Methodology for OCR error checking through text image regeneration
US7215815B2 (en) Handwriting information processing apparatus, handwriting information processing method, and storage medium having program stored therein for handwriting information processing
US6504540B1 (en) Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
EP0359110B1 (en) Entry text display system
JP3082746B2 (ja) 音声認識システム
US9229911B1 (en) Detecting continuation of flow of a page
JPH096892A (ja) 情報処理装置及び方法
JPH01111226A (ja) 文書処理方法
US5745911A (en) System for performing spell check functions on a printing device without operator intervention
JP2016162211A (ja) 情報処理装置、制御方法及びプログラム
JPH096893A (ja) 情報処理装置及び方法
JPH0916582A (ja) 文書作成装置及び同装置に用いられる認識結果出力方法
JP4189040B2 (ja) 文章校正装置および文章校正方法
JP4594972B2 (ja) 文章校正装置および文章校正方法
US8913294B2 (en) Image processing apparatus and image processing system
JPH08329056A (ja) 作成文書の誤り検出方法及びその誤り検出機能を有する文書作成支援装置
JP3269889B2 (ja) 光学式文字読取システム
JPH09185615A (ja) かな漢字変換方法
JPH0562008A (ja) 文字認識方法
JPH103515A (ja) 画像処理方法及び装置
JP2008192165A (ja) 文章校正装置および文章校正方法
JPH06223221A (ja) 文字認識装置
JP3077580B2 (ja) 文字読取装置
JPH09259225A (ja) 文字認識変換方法及び文字データ処理装置
JPS605470B2 (ja) 組版システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050905

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050930