JPS6160189A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS6160189A
JPS6160189A JP59181865A JP18186584A JPS6160189A JP S6160189 A JPS6160189 A JP S6160189A JP 59181865 A JP59181865 A JP 59181865A JP 18186584 A JP18186584 A JP 18186584A JP S6160189 A JPS6160189 A JP S6160189A
Authority
JP
Japan
Prior art keywords
kanji
word
circuit
words
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59181865A
Other languages
English (en)
Inventor
Yoshihisa Tanabe
田辺 吉久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59181865A priority Critical patent/JPS6160189A/ja
Publication of JPS6160189A publication Critical patent/JPS6160189A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、日本語文字の読取処理を実行する光学的文字
読取装置に関する。
[発明の技術的背景とその問題点] 近年、漢字を含む日本語の文字を読取る光学的文字読取
装置が開発されている。このような光学的文字読取装置
は、通常漢字及び平仮名文字のそれぞれを個別的に認識
する方式からなる。
しかしなから、日本語文章に使用される漢字には、その
漢字の前後文字を参照することにより正  ・確な認識
処理が可能となる文字が多い。したがって、上記のよう
な方式の光学的文字読取装置では、日本語文章に対する
読取精度が比較的低下する問題がある。
[発明の目的] 本発明は上記の点に鑑みてなされたもので、その目的は
、日本語文章の漢字単語毎の認識処理を実行することに
より、日本語文字に対する読取精度を向上することがで
きる光学的文字読取装置を提供することにある。
[発明の概要コ 本発明では、文字毎の文字認識処理を実行する文字認識
手段の認識結果から漢字単語を漢字コード判定テーブル
に基づいて抽出する漢字単語抽出手段が設けられる。こ
の漢字単語抽出手段で抽出された漢字単語が、単語テー
ブルメモリの単語テーブルに基づいて識別される。単語
テーブルメモリは、予め漢字のみの単語及び平仮名文字
を含む所定の漢字単語からなる単語テーブルを記憶して
いる。
このような構成により、漢字のみ又は平仮名文字を含む
漢字単語単位の認識処理を実行でき、日本語文字の読取
精度を向上することができる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わる光学的文字読取装置の構成を示す
ブロック図である。第1図において、文字認識部10は
、光電変換して得られる1文字毎の文字パターンに対す
る認識処理を実行する。
文字パターンは、例えば第2図に示すように用紙上に記
録された日本語文章が光電変換部(図示せず)により走
査されて得られるものである。ラインバッファ11は、
文字認識部10の認識結果を例えば1行分格納するバッ
ファメモリである。漢字単語抽出回路12は、ラインバ
ッファ11に格納された認識結果の文字列から漢字単語
を、コード判定テニブルに基づいて抽出する。このコー
ド判定テーブルは、各漢字に対応する漢字コード群から
なり、コード判定テーブルメモリ13に予め記憶されて
いる。
整合回路14は、漢字単語抽出回路12で抽出された漢
字単語及び単語辞書テーブルの単語との整合処理を実行
し、その整合結果を識別回路15に出力する。単語辞書
テーブルは、漢字のみからなる単語テーブルA1漢字と
平仮名文字からなる単語テーブルB及び特殊テーブルC
からなり、単語辞書テーブルメモリ16に予め記憶され
ている。識別回路15は、整合回路14の整合結果の中
で最も類似度の高い単語を答として出力する。
このような構成の光学的文字読取装置において、一実施
例に係わる動作を説明する。先ず、例えば第2図に示す
ような日本語文章が用紙に記録されており、この用紙が
光電変換部により走査されたとする。これにより得られ
た1文字毎の文字パターンが、文字認識部10により認
識処理される。文字認識部10の文字認識結果(文字コ
ード、類似度値及び複数の候補文字を含む)はラインバ
ッファ11に格納される。ラインバッファ11には、例
えば1行分の文字認識結果が格納される。
漢字単語抽出回路12は、コード判定テーブルを参照し
て、ラインバッファ11から漢字単語を抽出して整合回
路14に出力する。整合回路14は、例えば第2図に示
すような「漢字」、「時代」、「有力」及び「装置」の
それぞれに対応する各漢字単語コード等からなる単語テ
ーブルAを参照して、この漢字単語コードAと漢字単語
抽出回路12から出力される漢字単語コードとの整合処
理を実行する。識別回路15は、整合回路14の整合結
果から類似度の最も高い漢字単語コードを答として出力
する。
また、漢字単語抽出回路12で抽出された漢字が1文字
からなる場合、その漢字]−ドは整合回路14に出力さ
れて、さらにその前後の平板名文字コードがラインバッ
ファ11から整合回路14に出力される。この動作は、
例えば整合回路14により実行される。整合回路14は
、単語辞書テーブルメモリ16の単語テーブルBを参照
して、漢字と平仮名文字からなる認識結果に対する整合
処理を行なう。
この場合、単語テーブルBは、例えば第1図に示すよう
に「単なる」、「極めて」及び「起きる」等のそれぞれ
に対応する漢字コード群からなる。
識別回路15は、上記と同様に゛整合回路14の整合結
果の中から最も類似度の高い漢字コードを答として出力
する。尚、他の平仮名文字及び片仮名文字は、通常のO
CRにおける読取処理で読取られることになる。
ここで、・識別回路15において答を出力する際に、類
似度が所定の水準以下の場合には例えば類似度の低い順
にCRTディスプレイ装置に表示させる。
この表示に基づいて、オペレータがリジェクトまたは修
正処理を行なう。また、この場合には単語全体をリジェ
クトしてもよい。さらに、単語辞書テーブルメモリ1G
には、特殊テーブルCが記憶されている。この特殊テー
ブルCは、例えば漢字と数字の組合わせからなる単語コ
ード群からなり、例えば1図2」のような単語の識別処
理に必要なテーブルである。
上記のようにして、日本語文章において漢字のみまたは
平仮名文字を含む漢字単語単位の読取処理を確実に実行
できる。即ち、例えば第2図に示すような日本語文章に
おいて、「漢字」、「時代」「有力」、「装置」及び「
極めて」等の漢字単語を確実に読取ることができる。し
たがって、1文字毎の個別認識処理では誤読率の高い漢
字文字の場合でも、単語単位の認識処理を利用すること
により高い精度で認識することができる。
[発明の効果] 以上詳述したように本発明によれば、日本語文章に対し
て漢字単語毎の認識処理を確実に実行することができる
。したがって、漢字文字に対する読取精度を大幅に向上
することができ、結果的に日本語文字に対する読取精度
を高めることができるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図は同実施例の動作を説
明するための日本語文章の一例を示す図である。 10・・・文字認識部、11・・・ラインバッファ、1
2・・・漢字単語抽出回路、13・・・コード判定テー
ブルメモリ、14・・・整合回路、15・・・識別回路
、16・・・単語辞書テーブルメモリ。

Claims (1)

    【特許請求の範囲】
  1. 光電変換して得られる漢字及び平仮名文字等の文字パタ
    ーンに対して文字認識処理を実行する文字認識手段と、
    この文字認識手段の認識結果から漢字単語を漢字コード
    判定テーブルに基づいて抽出する漢字単語抽出手段と、
    予め漢字のみの単語及び平仮名文字を含む所定の漢字単
    語からなる単語テーブルを記憶している単語テーブルメ
    モリと、この単語テーブルメモリの上記単語テーブルに
    基づいて上記漢字単語抽出手段で抽出された漢字単語を
    識別する識別手段とを具備したことを特徴とする光学的
    文字読取装置。
JP59181865A 1984-08-31 1984-08-31 光学的文字読取装置 Pending JPS6160189A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59181865A JPS6160189A (ja) 1984-08-31 1984-08-31 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59181865A JPS6160189A (ja) 1984-08-31 1984-08-31 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPS6160189A true JPS6160189A (ja) 1986-03-27

Family

ID=16108190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59181865A Pending JPS6160189A (ja) 1984-08-31 1984-08-31 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS6160189A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6338495A (ja) * 1986-07-31 1988-02-19 ジューキ株式会社 布厚検知装置
US4984271A (en) * 1987-05-11 1991-01-08 Hitachi, Ltd. Cipher system with closed cipher procedure
JP2007105138A (ja) * 2005-10-12 2007-04-26 Brother Ind Ltd 刺繍枠及び刺繍縫製可能なミシン

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6338495A (ja) * 1986-07-31 1988-02-19 ジューキ株式会社 布厚検知装置
US4984271A (en) * 1987-05-11 1991-01-08 Hitachi, Ltd. Cipher system with closed cipher procedure
JP2007105138A (ja) * 2005-10-12 2007-04-26 Brother Ind Ltd 刺繍枠及び刺繍縫製可能なミシン

Similar Documents

Publication Publication Date Title
US4610025A (en) Cryptographic analysis system
CA1208784A (en) Method and apparatus for character recognition accommodating diacritical marks
JP2713622B2 (ja) 表形式文書読取装置
JPS62221088A (ja) 光学式文字読取装置
JPS6160189A (ja) 光学的文字読取装置
JPS6239793B2 (ja)
JPS63146187A (ja) 文字認識装置
JPS592191A (ja) 手書き日本語文の認識処理方式
JPS6182275A (ja) 自動翻訳装置
JP2939945B2 (ja) ローマ字住所認識装置
JP2749425B2 (ja) 記事抽出方式
JPS6095689A (ja) 光学的文字読取装置
JPS60110089A (ja) 文字認識装置
JP3151866B2 (ja) 英文字認識方法
JP2503259B2 (ja) 全角,半角文字の決定方法
JPH0614376B2 (ja) 日本文誤字自動検出装置
JPS607586A (ja) 文字情報認識装置
JPH03156589A (ja) 誤読文字の検出,修正方法
JPH05225183A (ja) 日本文単語誤り自動検出装置
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPH02101596A (ja) 文字認識装置
Kruatrachue et al. Automatic Thai and English fonts identification without character recognition
JPS6081688A (ja) 情報認識方式
JPS60207983A (ja) 文字認識用辞書作成方式
JPS5757379A (en) Character information input device