JPH02230488A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH02230488A
JPH02230488A JP1052369A JP5236989A JPH02230488A JP H02230488 A JPH02230488 A JP H02230488A JP 1052369 A JP1052369 A JP 1052369A JP 5236989 A JP5236989 A JP 5236989A JP H02230488 A JPH02230488 A JP H02230488A
Authority
JP
Japan
Prior art keywords
character
word
storage unit
candidate
character kind
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1052369A
Other languages
English (en)
Inventor
Hideya Yamaki
秀哉 山木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1052369A priority Critical patent/JPH02230488A/ja
Publication of JPH02230488A publication Critical patent/JPH02230488A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字詔,識装置に関し、特に都道府県名等の
各種の目的に応した認識対象とすべき単語群を予め記憶
しておき文字認識結果を組合わせててきる単語がこの単
語群の中に存在するか否かを調べるための単語照合の機
能を有する文字認識装置に関する。
〔従来の技術〕
従来、この種の文字認識装置は、文字認識部と単語照合
部とか論理的に離れた構造となっており、文字認識部は
読取対象となる全字種の中から認識結果として妥当な候
補を選ひ出し、単語照合部へ送る動作となっていた。
また、認識部独自で字種限定のためのテーブルを持ち、
認識対象の字種を絞って候補を選び出すm造のものもあ
ったか、このテーブルの作成に当たっては、人間の手を
介する操作により作成されるものであった。
〔発明か解決しようとする課題〕
上述した従来の文字認識装置は、全字種を認識対象とす
る装置の場合、字種の多さに伴い認識部の認識時間が多
くかかる欠点と、不適当な候補文字が単語照合部へ送ら
れるために、余分な彫語叩合時間か取られるという欠点
かあった。
また、認識部に字種限定のためのテーフルを保有する装
置の場合、認識と単語照合の時間を短縮することはでき
るが、テーフルを作成するために多くの人為的操作が必
要てあった。例えは、n個の単語を照合用の単語として
登録する場合、全n個の単語中に使用される字種を拾い
上げ、これらの字種をテーブル中に登録する作業は、人
間か行っていた。このため、単語数nが増大ずる程、人
間が行なう字種のチェックの手間かかかる欠点があり、
また結果的にチェックミスか生じたり、認識率が低下し
たりすることにもなった。
〔課題を解決するための手段〕
本発明は、予め対象となる単語群を記憶する浄語記憶部
と、予め認識対象とする字種を記憶する字種記憶部と、
入力される文字画像を認,識して前記字種記憶部に記憶
された字種に限定された候補文字を出力する文字認識部
と、複数の前記文字画像について前記文字認識部から出
力される候補文字を組み合をぜててきる単語が前記単語
記憶部に記憶されている単語群の中に存在するかを調べ
る機能を有する単語照合部を備える文字認識装置におい
て、 前記単語記憶部に登録されている中語群に使用さ
れている字種を全て拾い上げ前記字種記憶部に記憶させ
る字種抜き取り部を含んで構成される。
〔実施例〕
次に、本発明について、図面を参照して説明する。
第1図は、本発明の読取り装置の構成図である。文字イ
メーシ]は、紙等の媒体から人力される文字のイメージ
画像であり、文字認識部2は文字イメーシ]か何の文字
てあるかを認識し、その結果を複製の候補文字3として
tii語照合部4へ出力する。この時、文字32識部2
は、認識の対象字種を記憶する字種記憶部5を参照しな
から、対象外の字種を候補として取り上げない機能を有
する。単語照合部4は、文字詔,識部2か出力した候補
文字3を複数文字分、一時的に記憶し、候補文字3を組
合わせて7できる単語を、単語記憶部6に格納されてい
る単語群と照合し、一致または類似した単語を候補単語
7として出力する機能を有する。
一方、111語記憶部6と字種記憶部5の間に本発明の
中核である字種抜き取り部8が構成されており、単語記
憶部6に格納されている単語群の中から、各単語を構成
する文字種を拾い上け単語群に対応する限定字種テーブ
ルを字種記憶部5の中に形成する機能を有する。
以下に本発明の効果を明確にずるために、都道府県名を
認識する場合を例にとり、各部の動作を説明する。
認識に先立ち、都道府県名(゛東京都゛′、″神奈川県
′゜等)を全て単語群として単語記憶部6中に登録して
おく。次に、字種拾い」二げ部8を起動し、全都道府県
名に使用されている字種を拾い士け、都道府県名の限定
テーブルを字種記憶部5グ)111Gご形成させる。
認識動作か開始されると、文字イメーシ1か次々と入力
されるか、例として紙面上に“′東京都゛′と書かれた
イメーシか入力されてきた場合について第2図を参照し
て説明する。
文字認識2は“東′”、゛′京”、″都“゜の順に認識
を行ってゆくか、第2図に示すように゛東′″に対する
類似文字として′゛束′”゛京″、“車゛′なとが゛京
′″に対しては“東″、“哀″″、“享′゜なとが、′
゛都”゜に対して“部″′、′゛卸“′、“′郡′”な
とか考えられる(第2図(a))か、字種記憶部5の限
定字種テーフルを参照することにより、“車“′、゛哀
′”、゛享”′、″部゛′、゜“卸″、″郡“′は認識
対象文字から除外されるため、候補文字3としては″東
′″に対して゜゜東″と“京゜′か、また゛′京′”に
対して゛′京″′と“東”′が、“都″に対して゛都″
′たけか妥当な候補として単語照合部4に渡される(第
2図(b))。従って−中語として考えられる組合せは
、゛゜東東都“、“東京都′″一 5 ′“京東都′”“京京都“″の4通りに絞られ、’N語
照合部4ては容易に“′東京都”′を妥当な候補彫語で
あると判定することか可能てある。i;J. lか字種
の限定機能の効果に関する説明である。
次に、字種抜き取り部8の具体例について説明する。、
第3図は字種記憶部5、乍語記憧部6およひ字種抜ぎ取
り部8の一例の模式図である。1}1−語記憶部6には
、都道府県名や都市名、人名、その他任意に単話群を登
録しておくこととする。字種記憶部5には各単語群に対
応ずる字種セッ1−からなる字種限定テーフルを記憶す
るエリアを確保する。字種抜き取り部8の動作としては
都道府県名の屯語群からは′゜東京都″、″神奈川県″
′なとの単語に使われている“東″、“京′″、“都′
″、″神″、′゛奈“″、゛ノ1ビ、゛゜県″といった
字種を拾い上げ、字種記憶部5中の都道府県名字種セッ
トの字種限定テーブルに登録する。同様に、都市名、人
名、その他からも字種の拾い上け行ない、対応ずる字種
セットとして登録を行なう。
文字認識に際しては、都道府県名の認識を行なう時には
字種記憶部5の都道府県名の字種セツ1一の字種限定テ
ーフルに登録された字種に限定して招,識を行なうこと
とし、同様に都市名、人名等に対しても字種セットに登
録それる字種に限定して認識を行なうものとする。
〔発明の効果〕
以上説明したように、本発明は単語群の中から全字種を
抜き取り、字種記憶部に記憶する字種抜き収り部を設け
ることにより、認識対象とする限定字種テーフルの作成
を、自動的に行ない、予め人間の手による登録作業を行
なう必要を無くずことかできる効果かある。
【図面の簡単な説明】
第1図は本発明の一実施例の文字読取装置の構成フロッ
ク図、第2図は第1図に示す文字認識部2におりる字種
の限定の説明図であり、第2図(a)は全字種対象とし
た認識時の候補文字、第2図(1))は字種限定認識時
の候補文字を示す。 第3図は第1図に示す字種抜き取り部8の動作説明図て
ある。 ]・・・・文字イメーシ、2・・・文字詔,識部、3・
・・候補文字、4・・・・・・単語照合部、5・・字種
記憶部、6・・・・即語記憶部、7  候補1林語、8
字種抜き取り部。

Claims (1)

    【特許請求の範囲】
  1. 予め対象とする単語群を記憶する単語記憶部と、予め認
    識対象とする字種を記憶する字種記憶部と、入力される
    文字画像を認識して前記字種記憶部に記憶された字種に
    限定された候補文字を出力する文字認識部と、複数の前
    記文字画像について前記文字認識部から出力される候補
    文字を組み合をせてできる単語が前記単語記憶部に記憶
    されている単語群の中に存在するかを調べる機能を有す
    る単語照合部を備える文字認識装置において、前記単語
    記憶部に登録されている単語群に使用されている字種を
    全て拾い上げ前記字種記憶部に記憶させる字種抜き取り
    部を含むことを特徴とする文字認識装置。
JP1052369A 1989-03-03 1989-03-03 文字認識装置 Pending JPH02230488A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1052369A JPH02230488A (ja) 1989-03-03 1989-03-03 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1052369A JPH02230488A (ja) 1989-03-03 1989-03-03 文字認識装置

Publications (1)

Publication Number Publication Date
JPH02230488A true JPH02230488A (ja) 1990-09-12

Family

ID=12912895

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1052369A Pending JPH02230488A (ja) 1989-03-03 1989-03-03 文字認識装置

Country Status (1)

Country Link
JP (1) JPH02230488A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60207983A (ja) * 1984-03-31 1985-10-19 Toshiba Corp 文字認識用辞書作成方式
JPS60233782A (ja) * 1984-05-07 1985-11-20 Nec Corp 住所読取装置
JPS6286475A (ja) * 1985-10-14 1987-04-20 Hitachi Ltd パターン認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60207983A (ja) * 1984-03-31 1985-10-19 Toshiba Corp 文字認識用辞書作成方式
JPS60233782A (ja) * 1984-05-07 1985-11-20 Nec Corp 住所読取装置
JPS6286475A (ja) * 1985-10-14 1987-04-20 Hitachi Ltd パターン認識装置

Similar Documents

Publication Publication Date Title
KR870011552A (ko) 문서 등록 방식
JPH02230488A (ja) 文字認識装置
JPH0388062A (ja) 文書作成装置
JPH0441388B2 (ja)
JPH0944521A (ja) インデックス作成装置および文書検索装置
JPH10198688A (ja) 定型文書読み取り装置
JP2588261B2 (ja) Ocrによる住所データベース検索装置
JP2874199B2 (ja) 単語辞書照合装置
JPS58123126A (ja) 辞書検索装置
JPH0962700A (ja) 辞書構築方法及び装置
JP3380850B2 (ja) 文字認識装置
JPS6329882A (ja) 情報登録検索装置
JP2865443B2 (ja) カナ氏名もしくはカナ法人名表記の漢字変換装置
JP2530659B2 (ja) 光学文字読取システム
JPS6068425A (ja) 学習機能を備えた仮名漢字変換装置
JPS63138479A (ja) 文字認識装置
JPS63131288A (ja) 単語照合装置
JPH0193876A (ja) 文字読取装置
JPS63303481A (ja) 住所読取装置
JPS585840A (ja) 電子式検索装置
JPS61193257A (ja) 端末装置に中国語の文字記号を入力するための方法および装置
JPH023865A (ja) 漢字文字の検索方式
JPS63298583A (ja) 文字認識後処理方式
JPH04250589A (ja) 単語照合装置及び単語照合方法
JP2006011653A (ja) 類似文字列検索方法及び類似文字列検索装置