JPH0640352B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0640352B2
JPH0640352B2 JP59281244A JP28124484A JPH0640352B2 JP H0640352 B2 JPH0640352 B2 JP H0640352B2 JP 59281244 A JP59281244 A JP 59281244A JP 28124484 A JP28124484 A JP 28124484A JP H0640352 B2 JPH0640352 B2 JP H0640352B2
Authority
JP
Japan
Prior art keywords
character
word
memory
recognition
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59281244A
Other languages
English (en)
Other versions
JPS61160182A (ja
Inventor
由明 黒沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59281244A priority Critical patent/JPH0640352B2/ja
Publication of JPS61160182A publication Critical patent/JPS61160182A/ja
Publication of JPH0640352B2 publication Critical patent/JPH0640352B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 この発明は、たとえば手書入力されたかまたは音声入力
されたn文字からなる単語を簡易に且つ効果的に認識し
得る文字認識、あるいは音声認識装置に関するものであ
る。
〔発明の技術的背景とその問題点〕 文字を認識する場合、基本的にはその文字の特徴を検出
して行われるが、n文字からなる単語を認識するとき、
個々の文字をそれぞれ認識し、その結果を組合わせるだ
けでは不十分なことが多く、或る文字の認識が不充分な
場合には、その単語を認識することが困難となる。そこ
で従来では、第4図3に示すように単語照合部を構成
し、有意の単語が格納されている単語辞書を検索するこ
とによって個々の文字認識が不充分な場合であってもそ
の単語を認識するような工夫が施されている(特願昭56
-138163号参照)。この場合、単語を構成するn文字
が、まず文字認識部Iにおいて認識され、その結果であ
るBj,i(i=1,n;j=1,k)が候補文字レジスタ
5に格納される。ここで、Bj,iは単語内の文字位置iに
ある文字を認識したときのj番目の候補文字の文字コー
ドである。次に単語辞書メモリ4に格納されている単語
の文字コードと、前記文字コードの比較がコンパレータ
6にて行なわれ、その結果これらの一致出力が得られた
時、その候補順位に基づいて一致度計算部9にてこの単
語と入力された単語との一致度計算が行なわれる。
しかしながらこの方式では文字コードの一致検査を行な
うために、文字ごとに候補文字レジスタ5を候補数k回
検索しなければならず、この為の時間を要し処理時間が
長くなり、また制御回路が複雑であり不具合を生じてい
た。
この欠点を解消するために従来(特願昭58-071372号参
照)では第4図の候補文字レジスタ5、コンパレータ6
のかわりに第5図のような回路を用いて一致度計算を行
なっている。この方式は単語データ13の文字コードに
よって、直接的に類似度メモリ17のアドレスを参照
し、このメモリ出力を一致度計算部18に送り、一致度
計算を行なうものである。なお類似度メモリ17には各
文字コードに応じ、その文字の認識結果から得られる類
似度がこの文字コードの示すアドレスに格納されてい
る。しかしながらこの方式で、たとえば文字コードのビ
ット数の大きいもの、たとえば漢字コード(16ビッ
ト)を取り扱おうとすると単語としての類似度メモリが
巨大化し、実現不可能になるという問題点がある。
〔発明の目的〕
この発明はこのような事情を考慮してなされたもので、
その目的とするところは、漢字コードのような文字コー
ドのビット数の大きなものを取扱う場合でも簡易にかつ
高速度に単語辞書と入力単語の比較を行なって単語認識
を効果的に行なう事のできる文字認識装置を提供するこ
とにある。
〔発明の概要〕
この発明はn文字からなる入力単語の各文字Ai(i=
1,2,…,n)につきそれぞれ認識し、各文字ごとに
その文字Aiと、文字認識辞書にL個登録されている認識
対象文字Bk(k=1,2,…L)との類似度Sk,iを求
め、このSk,iを2次元メモリである第2のメモリに格納
する。そして、複数個に分割された第1のメモリに、文
字Bkの文字コードが分割入力した時に、このSn,iの格納
場所を示すようなアドレスポインタを書込み、単語認識
時には、単語辞書の出力である文字コードと文字位置i
を第1のメモリのアドレスに分割入力し、この結果得ら
れるアドレスと文字位置iを第2のメモリに入力し、こ
の出力を一致度計算部に送り、単語の一致度を計算し、
この一致度に基づいて認識候補となる単語を厳選し、こ
れによって高速度で適確な認識を簡易に行う手段を可能
としたものである。
〔発明の効果〕
この発明は以上説明したとおり、一致度計算における類
似度の検索が、第1のメモリと第2のメモリを直列に参
照することによってのみ行われるので、制御回路が簡単
化され、しかも各メモリはアドレスが分割入力になるの
で小さくてすみ、認識処理時間も大幅に短縮され、きわ
めて効果的で実用性の高い文字認識が可能となる効果を
有している。
〔発明の実施例〕
以下、図面を参照してこの発明の一実施例につき説明す
る。なお、以下の説明では第1のメモリの分割数を2と
して説明する。
第2図は文字認識の結果得られる文字コード列で、第1
位候補がMなる文字候補、以下第j位がMjNjであ
る。ここでMは文字コードの上位8ビットコード、N
が下位8ビットコードである。すなわち、この例では
文字コードMjNjは16ビットで分割はそれぞれ8ビット
づつとしている。次にこれらM〜M15(最大候補数
は15に限定されるものとする)に1〜15の番号を割
当て、このとき、M〜M15の中に同一のコードが存
在するならば同じ番号を割当てる。すなわちMj=Mk(j
<k)ならばMj,Mk共に番号Jを割当てる。この番号を
JMjのように記述する。Njについても同様である。次に
第1のメモリ〔M〕(第3図22)のMj(8ビット)を
アドレスとする位置に前記した対応する番号JMjを書込
む。もう1つの第1のメモリ〔M〕(第3図23)のNj
(8ビット)をアドレスとする位置に同様に対応する番
号JNjを書込む。第1のメモリの残りの部分はすべて0
である。さらに第j位候補MjNjに対応する類似度SjをMj
に対応する番号JMj,Njに対応する番号JNjの組により作
られるアドレスJMj,JNjで定義する第2のメモリのアド
レスに格納する。すなわち、入力された文字Aiが実はB
jiである類似度Sjを(JMj,JNj)の2次元マトリクスS
JM,JNに表示すると第3図の第2メモリ28のように書
込まれる。第2のメモリ28の残りの部分はすべて0で
ある。なお、第3図中の26,27は第2のメモリ28
のアドレスの上位4ビット、下位4ビットを表示したも
のである。このようにすることによって、第1のメモリ
〔M〕、〔N〕のそれぞれのアドレスにMjNjなる文字コ
ードが信号線20,21によって入力されると第1のメ
モリはJMj,JNjなる番号を各々信号線24,25に出力
し、これが第2のメモリのアドレスに入力され、第2の
メモリからMjNjに対応する類似度Sjが得られる。一方、
MjNj(j=1,2,……15)以外のコードが入力され
ると、第2のメモリ出力は0となる。
これら第1、第2のメモリのアドレスにそれぞれmビッ
ト付加して文字位置iを第1、第2の追加アドレスmに
入力しておく。こうすることによってn文字からなる単
語の各文字iについて前記した処理によって類似度Sj
得られる。
このようにして得られた各文字の類似度は一致度計算部
29へ送られ、たとえば、これら類似度を加算すること
によって単語の確からしさ、すなわち一致度を得る。こ
の一致度は辞書に登録された一単語と入力文字との間で
計算されるものであり、これを辞書内の単語全部につい
て計算し、たとえば一番高い一致度の候補単語を外部に
結果として出力する。
第1図はこの発明の一実施例の概略構成図であり、その
動作は次の通りである。すなわち、文字認識部31の結
果は前述した処理によって第1、第2のメモリ33,3
6に書かれ、単語辞書メモリ32から出力される文字コ
ードは第1のメモリ33、第2のメモリ36(第3図の
第2のメモリ28と同じもの)、一致度計算部38へ縦
続的に送られて一致度が計算される。制御部はアドレス
カウンタ34、文字位置カウンタ35をコントロールす
ると共に全体をコントロールし、類似度に基づいた結果
を文字認識制御部30へ送る手段を有している。
なお、この発明は前記した実施例以外にも種々変形して
実施することができる。たとえば、第1のメモリの分割
数は任意であり、また、そのアドレスのビット数も任意
である。一致度の計算方法も任意であって、どのような
装置および手段であってもこの発明に適用し得るもので
あればよい。また、文字認識時の最大候補数も特に限定
しない。また、実現すべき手段も特定のハードウェアに
限定するものではない。
なお、以上の記載中で文字として説明されたものは、手
書入力されたパターンおよび音声入力されたパターンの
いずれをも含むものである。
また、文字単位の類似度とは文字の確からしさを表わす
ものであればどのようなものでもよく、たとえば、文字
認識時の候補順位、またはその順位に基づく得点であっ
ても良い。
また、この発明にさらに第1のメモリの出力を直接一致
度計算部へ送る部分を付加して文字コードのビット数が
少ない時は直接的な方式も可能であるような方式にもで
きる。
要するにこの発明はその要旨を逸脱しない限り種々に変
形して実施することができる。
【図面の簡単な説明】
第1図はこの発明の一実施例の概略構成図、第2図、第
3図はこの発明の各手段を説明する図、第4図、第5図
は従来装置の一例を示す概略構成図である。 図において、 1,31……文字認識部、2……編集部、3,39……
単語照合部、4,12,19,32……単語辞書メモ
リ、5……候補文字レジスタ、6……コンパレータ、7
……単語辞書レジスタ、8……レジスタカウンタ、9,
18,29,38……一致度計算部、10,34……ア
ドレスカウンタ、11……ソート処理部、13……単語
データ、14,15,16……類似度格納位置、17…
…類似度メモリ、20,21,24,25……信号線、
22,23,33……第1のメモリ、28,36……第
2のメモリ、26……第2のメモリの下位アドレス、2
7……第2のメモリの上位アドレス、30……文字認識
制御部、35……文字位置カウンタ、37……制御部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】n文字からなる文字列として与えられる音
    声入力単語、または文字入力単語の各文字に対して文字
    認識を行う文字認識手段と、 この文字認識手段での処理時に得られる類似度を格納す
    る第2のメモリ手段と、 この第2のメモリ手段を参照するアドレスを分割格納す
    る複数個の第1のメモリ手段と、 前記第2のメモリ手段に格納された各文字の類似度から
    単語の一致度を計算する一致度計算手段と、 この一致度計算手段で得られた結果に基づいて、単語辞
    書の中から認識候補となる単語を選択する手段とを具備
    し、 前記複数個の第1のメモリ手段は、単語辞書に登録され
    ている単語の各文字の文字コードを複数分割した各々を
    アドレスとし、前記第2のメモリ手段を参照するアドレ
    スを分割格納して成り、 かつ、前記単語辞書からの認識候補となる単語の選定
    は、単語辞書中の単語の各文字について前記複数個の前
    記第1のメモリを参照して各出力を合成し、この合成出
    力をアドレスとして前記第2のメモリを参照し、各文字
    の類似度を用いて計算された単語の一致度に基づいて行
    われることを特徴とする文字認識装置。
JP59281244A 1984-12-29 1984-12-29 文字認識装置 Expired - Lifetime JPH0640352B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59281244A JPH0640352B2 (ja) 1984-12-29 1984-12-29 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59281244A JPH0640352B2 (ja) 1984-12-29 1984-12-29 文字認識装置

Publications (2)

Publication Number Publication Date
JPS61160182A JPS61160182A (ja) 1986-07-19
JPH0640352B2 true JPH0640352B2 (ja) 1994-05-25

Family

ID=17636365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59281244A Expired - Lifetime JPH0640352B2 (ja) 1984-12-29 1984-12-29 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0640352B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0766423B2 (ja) * 1983-04-25 1995-07-19 株式会社東芝 文字認識装置

Also Published As

Publication number Publication date
JPS61160182A (ja) 1986-07-19

Similar Documents

Publication Publication Date Title
US5020117A (en) Handwritten character string recognition system
US5774588A (en) Method and system for comparing strings with entries of a lexicon
US5835635A (en) Method for the recognition and completion of characters in handwriting, and computer system
US4254476A (en) Associative processor
US3618027A (en) Associative memory system with reduced redundancy of stored information
US4327407A (en) Data driven processor
JPS60105039A (ja) 文字列照合方式
US3387274A (en) Memory apparatus and method
JPH0640352B2 (ja) 文字認識装置
US3697951A (en) Pattern recognition by multiple associative transformations
JP3288063B2 (ja) 可変長データの格納および参照システム
JPH0766423B2 (ja) 文字認識装置
JPS63268082A (ja) パタ−ン認識装置
JP2644859B2 (ja) パターン詳細同定装置の同定処理方式
JP2839515B2 (ja) 文字読取システム
JPH01183796A (ja) 文字認識装置
JPH0438026B2 (ja)
JPS63138479A (ja) 文字認識装置
JPS5820075B2 (ja) パタ−ン認識装置
JP2637762B2 (ja) パターン詳細同定方式
JPH0746373B2 (ja) 単語認識装置
JPH0355874B2 (ja)
JP2923295B2 (ja) パターン同定処理方式
JPH0527912B2 (ja)
JPS59160275A (ja) 単語認識装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term