JPH0816730A - 文字認識システム - Google Patents

文字認識システム

Info

Publication number
JPH0816730A
JPH0816730A JP6170251A JP17025194A JPH0816730A JP H0816730 A JPH0816730 A JP H0816730A JP 6170251 A JP6170251 A JP 6170251A JP 17025194 A JP17025194 A JP 17025194A JP H0816730 A JPH0816730 A JP H0816730A
Authority
JP
Japan
Prior art keywords
character
character recognition
word
unit
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6170251A
Other languages
English (en)
Inventor
Masahiro Iwazawa
正宏 岩沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP6170251A priority Critical patent/JPH0816730A/ja
Publication of JPH0816730A publication Critical patent/JPH0816730A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【構成】 単語認識処理装置100は、任意の文字の前
回までの使用頻度を示す使用頻度テーブル123を備え
ている。使用頻度テーブル123は、テーブルデータ転
送部113によって、文字認識装置200に転送され、
使用頻度テーブル格納部222に格納される。文字認識
装置200の文字認識部212は、各文字毎に文字認識
を行い、各文字に対して複数の候補文字を順位を付けて
選出する。並び替え部213は、文字認識部212で選
出した候補文字の順位を使用頻度テーブル格納部222
に格納されている使用頻度テーブル123の使用頻度に
基づき、使用頻度が高い候補文字の順位が高くなるよう
並べ替えを行う。単語認識処理部111は、並べ替えら
れた順位に基づき単語認識処理を行う。 【効果】 文字認識処理の効率が向上し、オペレータの
負担を軽減できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、帳票上の文字を読取
り、その文字認識処理を行う文字認識システムに関す
る。
【0002】
【従来の技術】帳票上の文字を光学的に読み取り、その
記載内容を認識する文字認識システムとして、文字認識
装置と、この文字認識装置の文字認識結果に基づき漢字
の知識処理等を行う情報処理装置等からなる構成が知ら
れている。このような文字認識システムにおいて、文字
認識装置は、帳票上の文字の読み取りおよび各文字毎の
文字認識処理を行う装置であり、また、情報処理装置
は、このような文字認識装置の文字認識結果に基づき、
単語認識処理や各文字の修正処理といった処理を行うも
のである。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の文字認識システムでは、その文字認識処理は、帳票
毎に独立して行われ、例えば、前回までの文字認識処理
結果を今回の文字認識処理に対して反映させるといった
構成ではなかった。従って、例えば、文字認識装置で文
字の認識誤りが発生した場合、一般的には、単語認識処
理で正しい文字に認識処理されるが、この認識処理に用
いる文字の候補から漏れてしまったり、認識効率が低下
する問題があった。このような点から、前回までの文字
認識処理結果を生かし、文字認識処理の効率を向上させ
ることのできる文字認識システムの実現が望まれてい
た。
【0004】
【課題を解決するための手段】本発明の文字認識システ
ムは、前述の課題を解決するために、各文字の前回まで
の使用頻度を示す使用頻度テーブルを設ける。そして、
各文字に対して複数の候補文字を順位を付けて選出する
文字認識部の候補文字の順位を、使用頻度テーブルの使
用頻度に基づき並べ替える並べ替え部を設ける。更に、
この並べ替え部で並べ替えられた候補文字の順位に基づ
き、各文字の単語認識を行う単語認識処理部を備えたこ
とを特徴とするものである。
【0005】
【作用】本発明の文字認識システムにおいては、文字認
識部は、各文字毎の文字認識を行い、各文字に対して複
数の候補文字を順位を付けて選出する。並べ替え部は、
使用頻度テーブルの使用頻度に基づき、文字認識部が選
出した候補文字の順位を並べ替える。単語認識処理部
は、並べ替えられた候補文字の順位に基づき、各文字か
ら構成される単語認識を行う。
【0006】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。 《実施例1》図1は本発明の文字認識システムの実施例
1を示すブロック図である。図のシステムは、単語認識
処理装置100と、文字認識装置200とからなる。単
語認識処理装置100は、パーソナルコンピュータやワ
ークステーション等の情報処理装置からなるもので、制
御部110、記憶部120、ディスプレイ131、キー
ボード132、マウス133を備えている。
【0007】制御部110は、単語認識処理装置100
としての単語認識処理や各部の制御を行う機能を有し、
単語認識処理部111、テーブルデータ管理部112、
テーブルデータ転送部113を備えている。
【0008】単語認識処理部111は、単語照合処理プ
ログラムや、データ修正処理用プログラムから構成さ
れ、文字認識装置200から受け取った文字認識結果に
基づき、単語単位に文字を認識し、かつ、その認識結果
をディスプレイ131に表示したり、キーボード132
やマウス133からの入力結果により、各文字の認識結
果を修正する機能を有している。
【0009】テーブルデータ管理部112は、記憶部1
20内に格納された後述する使用頻度テーブル123の
データを管理するもので、単語認識処理部111の文字
認識結果に基づき、認識結果の文字が使用頻度テーブル
123にない場合は、新たに加え、あった場合は使用頻
度カウンタのカウンタ値を増加させる機能を有するもの
である。テーブルデータ転送部113は、使用頻度テー
ブル123の内容を文字認識装置200に転送制御する
機能を有するものである。
【0010】記憶部120は、磁気ディスク装置や半導
体メモリ等の記憶装置からなり、帳票フォーマットデー
タ121、辞書ファイル122および使用頻度テーブル
123を備えている。
【0011】帳票フォーマットデータ121は、文字認
識装置200によって文字認識が行われる帳票のフォー
マットデータである。即ち、各帳票には、その帳票の形
状と共に、認識すべき領域(文字が手書きあるいは印字
されるための記入欄の位置)が帳票毎に予め決定されて
おり、フォーマットはこの認識すべき領域(フィール
ド)や帳票の大きさ、および、各記入欄で使用するキャ
ラクタセットテーブル221等のデータである。尚、キ
ャラクタセットテーブル221については後述する。
【0012】辞書ファイル122は、帳票上の各領域毎
の単語認識を行うための辞書データである。即ち、各帳
票は、その記入場所が決められていると共に、各欄に記
入される内容もある程度決まっているものである。例え
ば、住所欄に記入される文字は都道府県名や地名である
ため、これらの単語辞書が必要となる。従って、文字認
識システムでは、予め、各フィールドに記入される予定
の単語を収集した辞書ファイルを作成しているものであ
る。
【0013】また、使用頻度テーブル123は、前回ま
での各文字に対応した使用頻度を示すためのテーブルで
あり、以下のように構成されている。図2は、使用頻度
テーブル123の説明図である。即ち、使用頻度テーブ
ル123は、それまでの認識処理で出現した文字の文字
コードと、各々の文字が辞書ファイル122中のどの辞
書で使用されているかを示す使用辞書情報と、各辞書毎
に何回使用されたかを示す頻度カウンタの情報とで構成
されている。
【0014】例えば、文字コードxの場合、使用辞書情
報には、その文字コードxが辞書A、B、…で使用され
ている旨の情報が記憶され、また、辞書Aでの頻度カウ
ンタ、辞書Bでの頻度カウンタは、文字コードxにおけ
る各辞書A、B、…での使用頻度を示している。
【0015】また、ディスプレイ131〜マウス133
は、オペレータがデータ修正や作業指示を行う場合に用
いる入出力装置である。
【0016】文字認識装置200は、帳票上に記入され
た手書き文字を光学的に読み取って、各文字毎の文字認
識を行う光学式文字読取装置(OCR)であり、文字認
識処理部210と、記憶部220とから構成されてい
る。文字認識処理部210は、文字認識装置200とし
ての認識処理や各部の制御を行う機能を有し、読取部2
11、文字認識部212、並べ替え部213から構成さ
れている。また、記憶部220は、キャラクタセットテ
ーブル221と使用頻度テーブル格納部222とを備え
ている。
【0017】読取部211は、イメージリーダ等から構
成され、帳票上に記入された文字を光学的に読み取り、
イメージデータとして出力する機能を有している。文字
認識部212は、読取部211の読み取り結果を、単語
認識処理装置100からの帳票フォーマットデータ12
1に基づき、記入された文字を1文字ずつ解析・認識
し、キャラクタセットテーブル221から、各文字毎に
複数の候補文字を順位を付けて選出する機能を有してい
る。並べ替え部213は、文字認識部212にて選出さ
れた各候補文字の順位を、使用頻度テーブル格納部22
2に格納された使用頻度テーブルのデータを用いて並べ
替えを行い、その並べ替えた順位の候補文字を単語認識
処理装置100に対して出力する機能を有している。
【0018】また、記憶部220のキャラクタセットテ
ーブル221は、各辞書毎に存在する全ての文字の文字
コードを記録しているテーブルである。即ち、キャラク
タセットテーブル221には、各文字の文字コードと、
各文字がどの辞書で使用されているかを示す辞書のファ
イルNoが記憶されている。更に、使用頻度テーブル格納
部222は、単語認識処理装置100のテーブルデータ
転送部113によって転送された使用頻度テーブル12
3のデータを格納するための領域である。
【0019】次に、上記構成の文字認識システムの動作
を説明する。先ず、本実施例の文字認識システムの動作
を説明する前に、使用頻度テーブルによる並べ替え処理
を除いた文字認識システムにおける基本的な動作を説明
する。
【0020】《文字認識システムにおける基本的な動
作》先ず、文字認識装置200において、帳票の読み取
りが開始されると、予め決められた領域に記載されてい
る帳票の識別データ(例えば帳票番号)が読み取られ
る。これにより、文字認識部212は、その帳票の識別
データと共に、帳票のフォーマットデータを単語認識処
理装置100に対して要求する。単語認識処理装置10
0は、送られた帳票の識別データに基づき、対応する帳
票のフォーマットデータを文字認識装置200に送信す
る。
【0021】文字認識装置200では、このフォーマッ
トデータによって、文字認識すべき帳票上のフィールド
と、そのフィールドにはどのようなデータが記入される
かを認識して文字認識処理を行う。即ち、文字認識部2
12は、フィールド毎に、キャラクタセットテーブル2
21に登録されている文字の中からその文字に類似して
いると考えられる文字を、その字形の特徴から可能性の
高い順に順位を付け、候補文字として選出する。
【0022】例えば、あるフィールドの文字認識処理を
行う場合、フォーマットデータに基づき、そのフィー
ルドで使用される辞書ファイル(例えば、“A”とす
る)を知る。キャラクタセットテーブル221に登録
されている文字のうち、辞書ファイル=“A”を持つ文
字のみを候補文字の対象として選出する。そして、これ
らの候補文字を単語認識処理装置100に転送する。
【0023】単語認識処理装置100の単語認識処理部
111は、転送された候補文字の順位を考慮しながら、
辞書ファイル122から突合せを行って最適な単語を選
出することで文字認識処理を行う。例えば、文字認識装
置200からの都道府県名の文字認識結果が「埼王県」
となっていたとする。即ち、2文字目の候補文字の順位
が1.王 2.玉 …となっていた場合である。
【0024】このような場合、単語認識処理部111
は、そのフィールドに対応する辞書に基づいて単語認識
を行う。即ち、その辞書には「埼王県」が存在せず、2
文字目を、候補文字の順位が2番目である「玉」とした
場合の「埼玉県」が存在するため、これを採用する。そ
して、単語認識処理部111は、帳票に記入された文字
のイメージデータと共に、単語認識結果をディスプレイ
131に表示し、オペレータによる確認を促す。オペレ
ータは、ディスプレイ131上に表示された文字に対し
て修正を行いたい場合は、各文字毎に文字認識装置20
0から送られた候補文字の一覧を表示選択し、キーボー
ド132やマウス133によって、この中から正解と思
われる文字を選択する。
【0025】ところが、このような動作では、文字認識
装置200は、ある文字に対して、その文字に近いと思
われる文字を候補文字として選出するだけである。従っ
て、例えば、キャラクタセットテーブル221に、ある
文字に似た字形の文字が多く登録されている場合等で
は、正解の文字が候補文字から外されてしまう場合も発
生する。即ち、文字認識装置200から単語認識処理装
置100に対して送られる候補文字には、各文字に対し
て何字以内といった制限(単語認識処理装置100側か
ら文字認識装置200に対して何個欲しいかを指定す
る)があるため、正解の文字がそれ以降の順位であった
場合には、候補文字として送られないことになる。
【0026】その結果、単語認識処理装置100側の単
語認識処理部111では、受け取った候補文字の中から
辞書ファイル122での単語認識を行う関係上、候補文
字として正解文字を受け取っていない場合は、認識不可
となってしまう恐れがある。
【0027】また、たとえ、正解文字が候補文字として
単語認識処理装置100に送られた場合でも、その順位
が最下位に近付けば近付くほど、単語認識処理部111
での単語認識の処理効率が低下してしまう。
【0028】このような点から、実施例1では、文字認
識装置200側から送られる候補文字に制限がある場合
でも正確でかつ効率のよい単語認識処理が行えるよう、
文字認識装置200の候補文字選出時に使用頻度テーブ
ルのデータを用いており、その動作を次に実施例1の動
作として説明する。
【0029】《実施例1の動作》図3および図4は、そ
れぞれ、単語認識処理装置100および文字認識装置2
00の動作フローチャートである。先ず、文字認識装置
200に帳票が挿入されると、読取部211が読み取り
を開始し(ステップS41)、上述したように帳票フォ
ーマットデータ要求を行う(ステップS42)。
【0030】単語認識処理装置100は、文字認識装置
200からの受信があった場合、その受信内容を判定す
る(ステップS31)。これが、帳票フォーマットデー
タ要求であった場合は、基本的な動作で説明したよう
に、帳票の識別データに対応する帳票フォーマットデー
タ121を取り出して、これを転送する(ステップS3
2)また、同時に、取り出した帳票フォーマットデータ
121から使用頻度テーブル123を使用するか否かを
判定する(ステップS33)。尚、使用頻度テーブル1
23を使用する/しないは、帳票フォーマットの設計の
時点で帳票フォーマットデータ121に記録されてい
る。
【0031】ステップS33において、使用頻度テーブ
ル123を“使用する”であった場合、テーブルデータ
転送部113は、使用頻度テーブル123を文字認識装
置200に対して転送し(ステップS34)、ステップ
S31に戻る。また、ステップS33において、使用頻
度テーブル123を“使用しない”であった場合は、そ
のままステップS31に戻る。
【0032】文字認識装置200は、単語認識処理装置
100からの帳票フォーマットデータ121が転送さ
れ、また、ステップS34で単語認識処理装置100側
から使用頻度テーブル123が転送された場合は、この
データを受信し(ステップS43)、その後、文字認識
部212は文字解析処理を開始する(ステップS4
4)。
【0033】即ち、文字認識部212は、《基本的な動
作》で説明したように、読取部211で読み取った文字
のイメージデータから、帳票のフォーマットデータに基
づき所定の文字解析処理を行い、キャラクタセットテー
ブル221に登録されている文字の中から、そのフィー
ルドで使用されている辞書ファイルの文字を候補文字の
対象として選出する。そして、これらの対象とする文字
から、解析処理で認識した文字に類似していると考えら
れる文字を、その字形の特徴から可能性の高い順に順位
を付けて候補文字として選出する(ステップS45)。
【0034】次に、並べ替え部213は、ステップS4
3で受信した帳票フォーマットデータから、使用頻度テ
ーブル123を使用するか否かを判定する(ステップS
46)。このステップS46において、使用頻度テーブ
ル123を使用する、であった場合は、この使用頻度テ
ーブル123の内容を加味して候補文字の順位を並べ替
える(ステップS47)。
【0035】即ち、認識された文字に対する選出された
全ての候補文字に対して、対応する辞書での頻度カウン
タの値を調べ、この頻度カウンタの値に基づいて順位を
見直す。例えば、候補文字の順位が低いにもかかわら
ず、使用頻度テーブル123のカウンタ値が高かった場
合は、このカウンタ値を反映させて、その候補文字の順
位を高くする。尚、このカウンタ値の順位への反映度
は、予め経験則的に決定されている。
【0036】ステップS47で候補文字の並べ替えが終
了すると、またはステップS46において使用頻度テー
ブル123を使用しないと判定された場合は、そのまま
の候補文字の順位で、帳票1枚分の候補文字や読み取っ
た記入文字のイメージデータといった文字認識結果を単
語認識処理装置100に対して転送する(ステップS4
8)。
【0037】単語認識処理装置100は、ステップS3
1の受信において、受信内容が文字認識装置200から
の候補文字を含む文字認識結果であった場合、単語認識
処理部111が単語照合処理を行う(ステップS3
5)。即ち、各フィールド毎に、対応する辞書ファイル
122を参照し、単語としての文字認識を行う。これが
終了すると、単語認識処理部111は、その単語認識し
た処理結果や文字認識装置200から受け取った記入文
字のイメージデータを表示し、オペレータによる確認・
修正処理を促す(ステップS36)。
【0038】オペレータが認識内容の確認入力を行う
と、テーブルデータ管理部112は、帳票フォーマット
データ121から、その帳票の、使用頻度テーブル12
3の使用する/しないを調べ(ステップS37)、“使
用する”であった場合は、使用頻度テーブル123の内
容を更新する(ステップS38)。即ち、その文字が登
録されていない場合は、文字コードの登録を行い、登録
されている場合は、対応する辞書での頻度カウンタ値を
インクリメントする。また、ステップS37において、
使用頻度テーブル123を“使用しない”であった場合
は、そのままステップS31に戻る。
【0039】このようにして、文字認識装置200での
帳票の読み取りが1枚1枚行われる毎に、前回までの使
用頻度テーブル123の内容が文字認識装置200に転
送される。従って、最初のうちは候補文字としての順位
の低かった候補も、帳票の読み取りを行っているうち
に、正解文字として順位が高くなり、認識率の向上を図
ることができる。
【0040】尚、上記実施例1では、文字認識装置20
0による帳票フォーマットデータ要求を受信する毎に使
用頻度テーブル123の全データを転送するよう構成し
ているが、更新された文字コードのデータのみ転送する
よう構成してもよい。このようにすることで、使用頻度
テーブル123の転送時間を短縮することができる。
【0041】以上のように、上記実施例1では、単語認
識処理装置100から使用頻度テーブル123のデータ
を文字認識装置200に転送し、文字認識装置200側
では、この使用頻度テーブル123の内容を加味して候
補文字の順位の並べ替えを行うよう構成したので、文字
認識装置200側から出力される候補文字の順位が使用
頻度の高い順序となるため、同一文字の再現性の高い業
務ほど認識率が向上し、かつ、単語照合処理の時間短縮
を図ることができる。また、この実施例1は、文字認識
装置200側から送られる候補文字に制限がある場合で
も正確な単語認識処理を行うことができるものである。
【0042】ところで、上記実施例1では、文字認識装
置200側で候補文字の並べ替えを行うように構成した
が、単語認識処理装置100側でその並べ替えを行うよ
うに構成してもよく、これを実施例2として次に説明す
る。
【0043】《実施例2》図5は、実施例2の文字認識
システムの構成図である。即ち、単語認識処理装置10
0の制御部110には、単語認識処理部111とテーブ
ルデータ管理部112とが設けられていると共に、並べ
替え部114が設けられている。尚、この場合、実施例
1のテーブルデータ転送部113は不要となる。
【0044】この並べ替え部114は、上記実施例1に
おける文字認識装置200の並べ替え部213と同様の
機能を有し、文字認識装置200から受け取った候補文
字に対して使用頻度テーブル123の内容を加味してそ
の順位を並べ替えるものである。尚、単語認識処理装置
100における他の構成は、上記実施例1と同様である
ため、ここでの説明は省略する。
【0045】一方、文字認識装置200側の文字認識処
理部210には、読取部211と文字認識部212とを
備え、また、記憶部220にはキャラクタセットテーブ
ル221を備えている。即ち、実施例1で備えていた並
べ替え部213と使用頻度テーブル格納部222とは不
要となっている。従って、文字認識装置200では、文
字認識装置としての基本的な機能のみを備えていればよ
いことになる。
【0046】次に、このように構成された実施例2の動
作について説明する。 《実施例2の動作》図6および図7はそれぞれ、実施例
2における単語認識処理装置100および文字認識装置
200の動作フローチャートである。先ず、文字認識装
置200に帳票が挿入されると、読取部211が読み取
りを開始し(ステップS71)、実施例1と同様に、帳
票フォーマットデータ要求を行う(ステップS72)。
【0047】単語認識処理装置100は、文字認識装置
200からの受信内容を判定し(ステップS61)、こ
れが、帳票フォーマットデータ要求であった場合、帳票
の識別データに対応する帳票フォーマットデータ121
を取り出して、これを転送し(ステップS62)、ステ
ップS61に戻る。即ち、実施例1とは異なり、使用頻
度テーブル123のデータ転送は行わない。
【0048】文字認識装置200は、単語認識処理装置
100からの帳票フォーマットデータ121を受信する
と(ステップS73)、文字認識部212が文字解析処
理を開始し(ステップS74)、キャラクタセットテー
ブル221から候補文字を選出する(ステップS7
5)。以上の動作は、上記実施例1の動作と同様であ
る。そして、候補文字が選出されると、文字認識処理部
210は、これら候補文字を含む帳票1枚分の文字認識
結果を単語認識処理装置100に転送する(ステップS
77)。
【0049】単語認識処理装置100は、ステップS6
1の受信において、受信内容が文字認識装置200から
の文字認識結果であった場合、単語認識処理部111
は、先ず、帳票フォーマットデータ121に基づき、そ
の帳票が使用頻度テーブル123を使用するか否かを判
定する(ステップS63)。このステップS63におい
て、使用頻度テーブル123を“使用する”であった場
合、並べ替え部114は、使用頻度テーブル123の内
容を加味して候補文字の順位の並べ替えを行う(ステッ
プS64)。
【0050】ステップS64での並べ替えが終了する
と、また、ステップS63において、“使用しない”で
あった場合、単語認識処理部111は、単語照合処理を
行う(ステップS65)。即ち、各フィールド毎に、対
応する辞書ファイル122を参照し、単語としての文字
認識を行う。これが終了すると、単語認識処理部111
は、その単語認識処理の認識結果や文字認識装置200
から受け取った記入文字のイメージデータを表示し、オ
ペレータによる確認・修正処理を促す(ステップS6
6)。
【0051】オペレータが認識内容を確認すると、テー
ブルデータ管理部112は、帳票フォーマットデータ1
21から、その帳票の、使用頻度テーブル123の使用
する/しないを調べ(ステップS67)、“使用する”
であった場合は、使用頻度テーブル123の内容を更新
する(ステップS69)。即ち、その文字が登録されて
いない場合は、文字コードの登録を行い、登録されてい
る場合は、対応する辞書での頻度カウンタ値をインクリ
メントする。また、ステップS67において、使用頻度
テーブル123を“使用しない”であった場合は、その
ままステップS61に戻る。
【0052】このように、実施例2においても、候補文
字の順位に対して、前回までの使用頻度テーブル123
の内容が反映される。従って、最初のうちは候補文字と
しての順位の低かった候補文字も、帳票の読み取りを行
っているうちに、正解文字として順位が高くなり、認識
率の向上を図ることができる。
【0053】更に、この実施例2においては、文字認識
装置200は基本的な動作のみを行うだけであるため、
文字認識装置200の演算処理能力はさほど高いものは
要求されず、相対的に文字認識装置200の演算処理能
力より単語認識処理装置100の演算処理能力が高いシ
ステムに有利である。但し、文字認識装置200側から
転送する候補文字は十分な個数とする必要がある。
【0054】尚、上記各実施例では、帳票フォーマット
データ121を、文字認識装置200が帳票を読み取る
毎に、単語認識処理装置100側から送るよう構成した
が、これに限定されるものではなく、前回と同様の帳票
フォーマットデータ121であった場合は送らないよう
構成してもよい。また、この帳票フォーマットデータ1
21を単語認識処理装置100側から送るのではなく、
文字認識装置200側で持っていてもよい。また、文字
認識装置200は、光学式文字読取装置としたが、特に
光学的に文字を読み取るシステムに限定されるものでは
なく、たとえば、磁気的な読み取り等であってもよい。
【0055】
【発明の効果】以上説明したように、本発明の文字認識
システムによれば、文字認識部が選出する候補文字の順
位を、前回までの単語認識結果に基づく使用頻度を考慮
して並べ替え、この並べ替えた順位で単語認識処理を行
うよう構成したので、文字認識処理の効率の向上が図
れ、かつ、修正時等のオペレータの負担を軽減すること
ができる。
【図面の簡単な説明】
【図1】本発明の文字認識システムにおける実施例1の
構成図である。
【図2】本発明の文字認識システムにおける使用頻度テ
ーブルの説明図である。
【図3】本発明の文字認識システムの実施例1における
単語認識処理装置の動作を示すフローチャートである。
【図4】本発明の文字認識システムの実施例1における
文字認識装置の動作を示すフローチャートである。
【図5】本発明の文字認識システムにおける実施例2の
構成図である。
【図6】本発明の文字認識システムの実施例2における
単語認識処理装置の動作を示すフローチャートである。
【図7】本発明の文字認識システムの実施例2における
文字認識装置の動作を示すフローチャートである。
【符号の説明】
100 単語認識処理装置 111 単語認識処理部 112 テーブルデータ管理部 113 テーブルデータ転送部 114 並べ替え部 123 使用頻度テーブル 200 文字認識装置 212 文字認識部 213 並べ替え部 222 使用頻度テーブル格納部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 帳票上の文字を読み取り、当該帳票上の
    単語認識処理を行う文字認識システムにおいて、 各文字毎の文字認識を行い、当該各文字に対して複数の
    候補文字を順位を付けて選出する文字認識部と、 任意の文字の前回までの使用頻度を示す使用頻度テーブ
    ルと、 前記文字認識部で選出した候補文字の順位を、前記使用
    頻度テーブルの使用頻度に基づき並べ替える並べ替え部
    と、 前記並べ替え部で並べ替えられた候補文字の順位に基づ
    き、前記各文字から構成される単語の認識処理を行う単
    語認識処理部とを備えたことを特徴とする文字認識シス
    テム。
  2. 【請求項2】 帳票上の文字を読み取り、各文字に対し
    て文字認識処理を行う文字認識装置と、この文字認識装
    置から受け取った各文字の文字認識結果に基づき、単語
    認識処理を行う単語認識処理装置とからなる文字認識シ
    ステムにおいて、 前記単語認識処理装置は、 任意の文字の前回までの使用頻度を示す使用頻度テーブ
    ルと、 前記使用頻度テーブルを前記文字認識装置に転送するテ
    ーブルデータ転送部とを備え、 前記文字認識装置は、 各文字毎に文字認識処理を行い、複数の候補文字を前記
    単語認識処理装置が単語認識処理を行う順位とするため
    の候補順を付与して当該各文字毎に選出する文字認識部
    と、 前記テーブルデータ転送部から転送された前記使用頻度
    テーブルを受け取り、 この内容を保持する使用頻度テーブル格納部と、 前記文字認識部が複数の候補文字を選出した場合に、前
    記テーブル格納部に格納された使用頻度テーブルの使用
    頻度に基づき、前記複数の候補文字の候補順位を、使用
    頻度が高い候補文字の順位が高くなるよう並べ替えを行
    い、その並べ替えた順位で各候補文字を前記単語認識処
    理装置に送出する並べ替え部とを備えたことを特徴とす
    る文字認識システム。
  3. 【請求項3】 帳票上の文字を読み取り、各文字に対し
    て文字認識処理を行って各文字毎に複数の候補文字を候
    補順位を付けて選出する文字認識装置と、この文字認識
    装置で選出された候補文字に基づき、単語認識処理を行
    う単語認識処理装置とからなる文字認識システムにおい
    て、 前記単語認識処理装置は、 任意の文字の前回までの使用頻度を示す使用頻度テーブ
    ルと、 前記文字認識装置から受け取った各文字に対する複数の
    候補文字に対して、当該各候補文字の順位を、前記使用
    頻度テーブルを用いて、使用頻度が高い候補文字の順位
    が高くなるよう並べ替えする並べ替え部と、 前記並べ替え部で並べ替えられた候補文字の順位に基づ
    き、単語認識処理を行う単語認識処理部とを備えたこと
    を特徴とする文字認識システム。
JP6170251A 1994-06-29 1994-06-29 文字認識システム Pending JPH0816730A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6170251A JPH0816730A (ja) 1994-06-29 1994-06-29 文字認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6170251A JPH0816730A (ja) 1994-06-29 1994-06-29 文字認識システム

Publications (1)

Publication Number Publication Date
JPH0816730A true JPH0816730A (ja) 1996-01-19

Family

ID=15901482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6170251A Pending JPH0816730A (ja) 1994-06-29 1994-06-29 文字認識システム

Country Status (1)

Country Link
JP (1) JPH0816730A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009440A (ja) * 2008-06-30 2010-01-14 Fujitsu Frontech Ltd 文字認識プログラム、文字認識装置および文字認識方法
JP2022137634A (ja) * 2021-03-09 2022-09-22 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009440A (ja) * 2008-06-30 2010-01-14 Fujitsu Frontech Ltd 文字認識プログラム、文字認識装置および文字認識方法
JP2022137634A (ja) * 2021-03-09 2022-09-22 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム
US12400463B2 (en) 2021-03-09 2025-08-26 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and recording medium

Similar Documents

Publication Publication Date Title
US6456740B1 (en) System and method for identifying form type in a handwriting recognition based form completion system
JP3535624B2 (ja) 検索装置及び方法
EP0680035B1 (en) Erroneous input processing method and apparatus in an information processing system using composite input
US20080150910A1 (en) Handwritten charater input device
US5384785A (en) Electronic image information scanning and filing apparatus
US5255189A (en) Method and system for retrieving ideographic characters and the associated dictionary entries
JP3319203B2 (ja) 文書ファイリング方法及び装置
JPH0816730A (ja) 文字認識システム
US20060188162A1 (en) Common interface for ink trees
JPH0576067B2 (ja)
JPH0256053A (ja) 文書作成装置
JPH0766377B2 (ja) 中国語入力装置
JP3979288B2 (ja) 文書検索装置および文書検索プログラム
JPH03276260A (ja) 文字コードのタイトル処理機能を備えた電子フアイリング装置
US20050050065A1 (en) Automating form transcription
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
JP4791641B2 (ja) 候補文字出力装置、候補文字出力方法、プログラムおよびコンピュータ読み取り可能な記録媒体
JPH09311901A (ja) 帳票処理システムおよびデータ修正装置
JPH11328200A (ja) 画像検索装置および方法ならびに情報記録媒体
JPS63265374A (ja) 文字読み取り装置
JPH1091618A (ja) 文書作成装置及び文書作成装置制御プログラムを記憶した媒体
JPH0237471A (ja) 情報検索装置
JPH0916584A (ja) 文書作成装置及び仮名漢字変換方法
JPH0869477A (ja) 頁画像検索方法及び頁画像検索装置
JP2002092031A (ja) クライアント装置