JPS60205687A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPS60205687A
JPS60205687A JP59060664A JP6066484A JPS60205687A JP S60205687 A JPS60205687 A JP S60205687A JP 59060664 A JP59060664 A JP 59060664A JP 6066484 A JP6066484 A JP 6066484A JP S60205687 A JPS60205687 A JP S60205687A
Authority
JP
Japan
Prior art keywords
dictionary
word
words
section
flag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59060664A
Other languages
English (en)
Inventor
Akizo Kadota
門田 彰三
Toshihiro Hananoi
花野井 歳弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59060664A priority Critical patent/JPS60205687A/ja
Publication of JPS60205687A publication Critical patent/JPS60205687A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は文字読取装置に関し、特に単語辞書をユーザの
業務に合わせて構築可能として、文字読取り精度を向上
させ得る文字読取装置に関するものである。
〔発明の背景〕
例えば、従来の光学文字読取装置においては、文字認識
部で認識した文字列の認識精度を高めるために1文字認
識後処理として、上記文字列を単語に分割し、予め用意
された単語辞書と照合して最も良く一致した単語を答と
して出力していた。
上述の光学文字読取装置においては、上記後処理用に使
用する単語辞書に、文字読取業務に使用する単語が必ず
含まれており、それ以外の単語が殆んど含まれていない
場合が、後処理の効率が最も良くなる。また、単語辞書
の中に必要な単語が含まれていない場合には、入力単語
に一番近い単語が選ばれるために誤読することになる。
一方、単語辞書中に不要な単語が多数台まれている場合
には、単語照合の処理時間がかがるという問題がある。
一般に、後処理用単語辞書は光学文字読取装置のメーカ
ーによって予め作られており、ユーザがその内容を自由
に変更する手段が与えられていないため、上記問題は常
に存在しているものと考えられる。
〔発明の目的〕
本発明は上記事情に鑑みてなされたもので、その目的と
するところは、従来の文字読取装置における上述の如き
問題を解消し、ユーザがその業務に合った単語辞書を自
由に構築できるようにして文字読取精度を向上可能とし
た文字読取装置を提供することにある。
〔発明の概要〕
本発明の上記目的は、文字認識手段と単語保持手段、お
よび上記文字認識手段によって認識された文字列と上記
単語保持手段中に保持された単語とのマツチングを行う
手段とを有する文字読取装置において、前記単語保持手
段に単語をロードするためのローダと、単語ファイルを
保持するマスク辞書とを設けて、該マスク辞書中の単語
のうち、フラグのセットされた単語のみを選択して前記
単語保持手段にロードする如く構成されたことを特徴と
する文字読取装置によって達成される。
〔発明の実施例〕 以下、本発明の詳細な説明した後、実施例を図面に基づ
いて詳細に説明する′。
文字読取装置においては、ユーザがその業務に合った単
語辞書を構築できるように、マスク辞書をフロッピーデ
ィスク、あるいは固定ディスク等の外部メモリに格納し
ておく。単語−書としては、例えば、国語辞書、地名辞
書9人名辞書、事務用語辞書、専門用語辞書等が考えら
れる。ユーザはこれらの辞書のうち、業務において必要
と思われるものを選択して使用する。
本発明に係る文字読取装置はこれらの辞書をマスク辞書
として使用し、実際に単語照合に使用するのはマスク辞
書のうちで、業務に必要なものだけを選択してメモリに
ロードする。マスク辞書は第1図に示す如く、単語名を
示す辞書本体と使用状態を示すフラグ部とから構成する
。ここで、業務に使用する単語については上記フラグを
オンにし、使用しない単語については上記フラグをオフ
にしておく。
辞書ロード時には、文字読取装置はマスク辞書から上記
フラグの立っている単語のみをロードしてメモリに格納
する。
文字読取業務中は上記メモリにロードされた単語のみを
使用する。もし、上記メモリに必要な単語が存在しない
ときには、マスク辞書を参照し、新たに追加したい単語
のフラグをオンにすることにより、常に、必要な単語を
メモリ上に持つことが可能となる。
上記説明においては、使用状態を示すフラグは使用する
場合を′1″、使用しない場合を170 g)とする2
値のみを取るものとしたが、フラグエリアとして1バイ
トに使用するものとすれば、更に変化に富んだ使用方法
を実施することが可能になることは言うまでもない。
例えば、帳票上に幾つかのフィールドを定義し、特定の
フィールドでは特定の単語しか使用しないことがわかっ
ている場合には、フィールドごとに固有の辞書を使用す
ることが考えられる。すなわち、フィールドlは都道府
県欄、フィールド2は重置郡欄、フィールド3は町村欄
、フィールド4は氏名欄と決っている場合には、フィー
ルドlを読取るときは都道府県名辞書を、フィールド2
を読取るときには重置郡名辞書を、フィールド3を読取
るときには町村名辞書を、フィールド4を用爪るときに
は人名辞書を、それぞれ使用するようにすれば、文字読
取り精度を更に向上させることができる。
これらの辞書の、マスク辞書からメモリへのロードは次
のように行う。すなわち、マスク辞書の前記フラグ部に
、フィールド1で使用する単語にはlを、フィールド2
で使用する単語には2をというように、フラグの種類を
変えてフラグ付けを行っておく6辞書ロ一ド時には、フ
ラグの付いている単語のみを選び出して、それぞれのフ
ラグに対応するメモリエリアに格納する。これにより。
辞書lにはフラグlの付いた単語のみが格納され、辞書
2にはフラグ2の付いた単語のみが格納されるようにな
る。
文字読取業務中は、マスク辞書は参照せず、メモリ上に
ロードされた辞書のみを参照することは前述の通りであ
る。すなわち、フィールド1を認識中は辞書1のみを使
用し、フィールド2を認識中は辞書2のみを使用する。
第2図は本発明の一実施例である光学文字読取装置を示
す構成図である。図において、1は文字認識部、2は単
語抽出部、3は単語辞書照合部、4は単語辞書、5は判
定部、6は表示部、7は辞書修正制御部、8はマスタ辞
書、9は辞書ローダを示している。文字認識部1は帳票
上に書かれた文字を認識し、認識結果、候補、距離等単
語照合に必要な情報を、単語抽出部2に送出する機能を
有するものである。
単語抽出部2は上記文字認識部lから受取った文字列か
ら単語を抽出し、単語辞書照合部3に送出する機能を有
するものである。単語辞書照合部3は、入力単語と、単
語辞書4の内容とを1つ1つ照合し距離りを計算する機
能を有するものである。辞書中のi番目の単語と入力単
語との距離をり、とすると、 D、≦Ti(Tt :閾、値) のもののみが判定部5に送られる。
判定部5は上記単語辞書照合部3から送られて来た候補
単語群の中から、最も距離の小さいものを選び出す機能
を有するものである。すなわち、いま、最も小さい距離
をDmln2次に小さい距離をD nextとすると、 D next −Dmin ≧T、(T、:閾値)のと
き、D min を与え、る単語を答として出力する機
能を有するものである。
また、判定部5は、 DneXt−Dmln<T2 のときにはリジェクトして、入力単語および候補単語群
を表示部6に送って画面に表示し、オペレータが画面を
見て候補単語群の中から正しい単語を選択し、キーボー
ドから入力すると、その単語を答として出力する機能を
有するものである。
辞書修正制御部7は上記判定部5から入力された正しい
単語と等しい単語をマスク辞書8の中から探し出し、該
当する単語が見つかればその単語のフラグ部をオンにし
て、マスク辞書8に書込む機能を有するものである。辞
書ローダ9は上記辞書修正制御部7によるマスタ辞書8
の修正が終了また後、単語辞書4のロードを行う機能を
有するものである。
次に、辞書ローダ9の構成と機能について説明する。第
3図は上記単語辞書4.マスタ辞書8および辞書ローダ
9の詳細な構成例を示すものである。辞書ローダ9は、
コントローラ91.ラッチ92および93.フラグ検出
回路94そしてゲート95から構成されている。上記コ
ントローラ91はマスタ辞書8および単語辞書4の読出
し、書込みを以下の如く制御するものである。
まず、アドレスレジスタ82にマスク辞書8の先頭アド
レスを、アドレスレジスタ41に単語辞書4の先頭アド
レスをセットする。また、マスク辞書8の内容を読出し
、データレジスタ83にセットする。該データレジスタ
83の内容は次にラッチ92゜93に送られる。ラッチ
92はデータのうち、単語部のみを保持し、ラッチ93
はフラグ部のみを保持するものである。
上記ラッチ93はフラグ検出回路94に接続されており
、フラグがオンであればゲート95を開きラッチ92の
内容をデータレジスタ42に送出する。フラグがオフで
あればゲート95は開かず、上記データの送出は行われ
ない。
上記ゲート95が開かれると、コントローラ91は単語
辞書4に書込み信号を出力し、データレジスタ42の内
容をアドレスレジスタ41の指すアドレスに書込む。書
込み終了後、アドレスレジスタ41をインクリメントし
ておく。以上の処理を全マスク辞書について行えば、マ
スク辞書8上のフラグのオンしている単語のみが単語辞
書4にロードされることになる。
第2図に戻って上記実施例の動作説明を行う。
単語辞書4のロードが終了すると、文字認識部lは帳票
上に書かれた文字を認識し始める。文字認識部1は認識
結果、候補、距離等単語照合に必要な情報を、単語抽出
部2に送出する。単語抽出部2は文字認識部1から受取
った文字列がら単語を抽出し、単語辞書照合部3に送出
する。
単語辞書照合部3は入力単語と単語辞書4の内容を1つ
1つ照合し、前記距離りを計算して判定部5に送る。判
定部5は前述の動作により、正し6い答を出力するか、
オペレータの判断を仰ぐ画面を表示する。オペレータは
画面を見て候補単語群の中から正しい単語を選択し、キ
ーボードから入力する。これにより、判定部5は該単語
を答として出力する。
もし、表示された候補単語群中に正しい単語が存在しな
い場合、あるいは、候補が無い場合にはオペレータは入
力単語にカーソルを移し、例えば仮名漢字変換機能等を
用いて正しい単語になるように修正を行う。
オペレータによって正しい単語が入力され終ると制御は
辞書修正制御部7に移され、前述のマスク辞書8の修正
に移る。マスク辞書8の修正が終了すると、辞書修正制
御部7は制御を辞書ローダ9に移し、単語辞書4のロー
ドを開始する。ロードが完了すると、単語辞書4の内容
は追加した辞書を含む新たな内容になっている。
第4図は本発明の他の実施例を示すもので、辞書がn種
類ある場合を示すものである。図において、記号1〜9
は第2図に示したと同じ構成要素を示しており、10は
単語辞書選択部、11はフォーマットテーブルを示して
いる。単語辞書選択部IOはn種類ある単語辞書のうち
の1つを選択する機能を有するものである。
また、フォーマットテーブル11はフィールドごとに使
用する単語辞書の辞書番号が書込まれたものである。例
えば、フィールド1が単語辞書2を使用するものである
ときには、フィールドlに2がセットされ、フィールド
2が単語辞書5を使用するものであるときには、フィー
ルド2に5がセットされる。
辞書ローダ9はマスタ辞書8から単語を1つずつ読出し
、フラグのついた単語のみをそのフラグの示す単語辞書
(4の1〜n)にロードする。
第5図は本実施例における辞書ローダ9の動作を説明す
るための図である。91〜95は先に第3図に示したと
同じ構成要素を示している。
まず、アドレスレジスタ82にマスク辞書8の先頭アド
レスを、アドレスレジスタ41 a 、41 b 、・
・・・。
41nに各単語辞書(4の1− n )の先頭アドレス
をセットする。コントローラ91はマスク辞書8の辞書
部8Iからアドレスレジスタ82の示す内容をデータレ
ジスタ83に読出し、アドレスレジスタ82を1インク
リメントする。
上記データレジスタ83の内容は次にラッチ92゜93
に転送される。ラッチ92には単語部が、ラッチ93に
はフラグ部がラッチされるのは前述の通りである。上記
ラッチ93の内容はフラグ検出回路94に送られ、フラ
グが′0”か、110 Nでないかが検出される。上記
フラグがN O#であればゲート95は閉じたままであ
るが II Opgでなければゲート95を開き該ゲー
ト95に接続されたラッチ92の内容をデータレジスタ
42に送出する。
一方、フラグ検出回路94からは、コントローラ91に
フラグの内容が転送される。フラグの内容を見てコント
ローラ91は、アドレスレジスタ41a。
41b、・・・・、41 nのいずれかを選択し、その
レジスタの示すアドレスにデータを格納させる。使用し
たアドレスレジスタは書込み終了後、1だけインクリメ
ントする。
以上の操作を繰り返すことにより、マスク辞書8に中で
フラグの立っている単語のみが、そのフラグの示す単語
辞書にロードされる。
第4図に示した実施例の装置において、上述の如き操作
により単語辞書4がロードされると、文字認識部1が動
作し、認識結果等を単語抽出部2に送出する。単語抽出
部2は受取った文字列から単語を抽出し、単語辞書照合
部3に送出する。
単語辞書照合部3には、前記フォーマットテーブル11
により、フィールドごとに単語辞書4を切換える単語辞
書選択部lOを介して必要な辞書情報が与えられる。単
語辞書照合部3はその辞書情報を用いて入力単語との距
離を計算し、距離りが前記閾値T、より小さいもののみ
を判定部5に送出する。該判定部5以降の動作は先に示
した実施例の動作と同じである。
なお、上記実施例においては、追加したい単語がマスク
辞書8内にあるものとして説明したが、マスク辞書8内
にない場合もあり得る。このような場合には、マスク辞
書8に追加したい単語を書込んだ後、フラグをセットす
れば、上述の手順と同様の手順で新たな辞書をロードす
ることが可能である。
また、上記実施例においては、本発明を光学文字読取装
置に適用した例を示したが、本発明はこれに限られるも
のではなく、他の文字読取装置にも適用可能であること
か言うまでもない。
〔発明の効果〕
以上述べた如く、本発明によれば、文字認識手段と単語
保持手段、および上記文字認識手段によって認識された
文字列と上記単語保持手段中に保持された単語とのマツ
チングを行う手段とを有する文字読取装置において、前
記単語保持手段に単語をロードするためのローダと、単
語ファイルを保持するマスク辞書とを設けて、該マスク
辞書中の単語のうち、フラグのセットされた単語のみを
選択して前記単語保持手段にロードする如く構成したの
で、ユーザがその業務に合った単語辞書を自由に構築で
き、文字読取精度を向上可能とした文字読取装置を実現
できるという顕著な効果を奏するものである。
【図面の簡単な説明】
第1図は本発明に用いるマスク辞書の構成を示す図、第
2図は本発明の第1の実施例である光学文字読取装置を
示す構成図、第3図はその要部を示す詳細図、第4図は
本発明の第2の実施例である光学文字読取装置を示す構
成図、第5図はその要部を示す詳細図である。 l:文字認識部、2:単語抽出部、3:単語辞書照合部
、4:単語辞書、43:単語辞書メモリ、5:判定部、
6:表示部、7:辞書修正制御部、8:マスタ辞書、8
1:マスタ辞書メモリ、9:辞書ローダ、91:コント
ローラ、lO;単語辞書選択部、11:フォーマットテ
ーブル。 第 6 図 第 4 図

Claims (1)

    【特許請求の範囲】
  1. (1)文字認識手段と単語保持手段、および上記文字認
    識手段によって認識された文字列と上記単語保持手段中
    に保持された単語とのマツチングを行う手段とを有する
    文字読取装置において、前記単語保持手段に単語をロー
    ドするためのローダと、単語ファイルを保持するマスク
    辞書とを設けて、該マスタ辞書中の単語のうち、フラグ
    のセットされた単語のみを選択して前記単語保持手段に
    ロードする如く構成されたことを特徴とする文字読取装
    置。
JP59060664A 1984-03-30 1984-03-30 文字読取装置 Pending JPS60205687A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59060664A JPS60205687A (ja) 1984-03-30 1984-03-30 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59060664A JPS60205687A (ja) 1984-03-30 1984-03-30 文字読取装置

Publications (1)

Publication Number Publication Date
JPS60205687A true JPS60205687A (ja) 1985-10-17

Family

ID=13148825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59060664A Pending JPS60205687A (ja) 1984-03-30 1984-03-30 文字読取装置

Country Status (1)

Country Link
JP (1) JPS60205687A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63155391A (ja) * 1986-12-19 1988-06-28 Mitsubishi Electric Corp 単語読取装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63155391A (ja) * 1986-12-19 1988-06-28 Mitsubishi Electric Corp 単語読取装置

Similar Documents

Publication Publication Date Title
JPS59132029A (ja) 仮名漢字変換装置
JPS6087073A (ja) タイトル記号の自動付加機能を有する文章編集装置
JPS60205687A (ja) 文字読取装置
JPH0363101B2 (ja)
JPH028956A (ja) 文書処理装置
JP3077820B2 (ja) 文章の不適正箇所検出装置
JPS6293776A (ja) 情報認識装置
JPH0736188B2 (ja) 文字処理装置
JPS62119665A (ja) ワ−ドプロセツサ
JPH0567080A (ja) かな漢字変換装置
JPH0731679B2 (ja) 文字処理装置
JPS62190571A (ja) 文字選択方式
JP2004038736A (ja) 文字認識処理方法、文字認識処理装置、文字認識プログラム
JP2000067037A (ja) 文書処理方法および装置
JPH0351959A (ja) 電子辞書
JPH06131333A (ja) 文章編集装置
JPH103475A (ja) 文字処理装置
JPH0981555A (ja) 文書処理装置及びその方法
JPH04139568A (ja) 文書処理装置
JPH0731680B2 (ja) 文字処理装置
JPH05158923A (ja) 情報処理装置
JPH0480430B2 (ja)
JPH0644278A (ja) 表データ処理装置
JPS605315A (ja) 文字処理装置
JPH0778791B2 (ja) 文字処理装置