JPH0640352B2 - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JPH0640352B2
JPH0640352B2 JP59281244A JP28124484A JPH0640352B2 JP H0640352 B2 JPH0640352 B2 JP H0640352B2 JP 59281244 A JP59281244 A JP 59281244A JP 28124484 A JP28124484 A JP 28124484A JP H0640352 B2 JPH0640352 B2 JP H0640352B2
Authority
JP
Japan
Prior art keywords
character
word
memory
recognition
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59281244A
Other languages
Japanese (ja)
Other versions
JPS61160182A (en
Inventor
由明 黒沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59281244A priority Critical patent/JPH0640352B2/en
Publication of JPS61160182A publication Critical patent/JPS61160182A/en
Publication of JPH0640352B2 publication Critical patent/JPH0640352B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 この発明は、たとえば手書入力されたかまたは音声入力
されたn文字からなる単語を簡易に且つ効果的に認識し
得る文字認識、あるいは音声認識装置に関するものであ
る。
Description: TECHNICAL FIELD OF THE INVENTION The present invention relates to a character recognition device or a voice recognition device capable of easily and effectively recognizing, for example, a handwritten or voice input word consisting of n characters. It is about.

〔発明の技術的背景とその問題点〕 文字を認識する場合、基本的にはその文字の特徴を検出
して行われるが、n文字からなる単語を認識するとき、
個々の文字をそれぞれ認識し、その結果を組合わせるだ
けでは不十分なことが多く、或る文字の認識が不充分な
場合には、その単語を認識することが困難となる。そこ
で従来では、第4図3に示すように単語照合部を構成
し、有意の単語が格納されている単語辞書を検索するこ
とによって個々の文字認識が不充分な場合であってもそ
の単語を認識するような工夫が施されている(特願昭56
-138163号参照)。この場合、単語を構成するn文字
が、まず文字認識部Iにおいて認識され、その結果であ
るBj,i(i=1,n;j=1,k)が候補文字レジスタ
5に格納される。ここで、Bj,iは単語内の文字位置iに
ある文字を認識したときのj番目の候補文字の文字コー
ドである。次に単語辞書メモリ4に格納されている単語
の文字コードと、前記文字コードの比較がコンパレータ
6にて行なわれ、その結果これらの一致出力が得られた
時、その候補順位に基づいて一致度計算部9にてこの単
語と入力された単語との一致度計算が行なわれる。
[Technical Background of the Invention and Problems Thereof] When recognizing a character, basically, the characteristic of the character is detected, but when recognizing a word consisting of n characters,
It is often not enough to recognize each individual character and combine the results, and if the recognition of a certain character is insufficient, it becomes difficult to recognize the word. Therefore, conventionally, even when individual character recognition is insufficient, a word collating unit is configured as shown in FIG. 4 and a word dictionary in which significant words are stored is searched to search for that word. It has been devised to recognize it (Japanese Patent Application Sho 56).
-See 138163). In this case, n characters forming a word are first recognized by the character recognition unit I, and the result B j , i (i = 1, n; j = 1, k) is stored in the candidate character register 5. . Here, B j , i is the character code of the j-th candidate character when the character at the character position i in the word is recognized. Next, when the comparator 6 compares the character code of the word stored in the word dictionary memory 4 with the character code, and when these match outputs are obtained, the degree of matching is determined based on the candidate rank. The calculation unit 9 calculates the degree of coincidence between this word and the input word.

しかしながらこの方式では文字コードの一致検査を行な
うために、文字ごとに候補文字レジスタ5を候補数k回
検索しなければならず、この為の時間を要し処理時間が
長くなり、また制御回路が複雑であり不具合を生じてい
た。
However, in this method, the candidate character register 5 must be searched for the number of candidates k times for each character in order to carry out a character code matching test, which requires time and processing time, and the control circuit It was complicated and had problems.

この欠点を解消するために従来(特願昭58-071372号参
照)では第4図の候補文字レジスタ5、コンパレータ6
のかわりに第5図のような回路を用いて一致度計算を行
なっている。この方式は単語データ13の文字コードに
よって、直接的に類似度メモリ17のアドレスを参照
し、このメモリ出力を一致度計算部18に送り、一致度
計算を行なうものである。なお類似度メモリ17には各
文字コードに応じ、その文字の認識結果から得られる類
似度がこの文字コードの示すアドレスに格納されてい
る。しかしながらこの方式で、たとえば文字コードのビ
ット数の大きいもの、たとえば漢字コード(16ビッ
ト)を取り扱おうとすると単語としての類似度メモリが
巨大化し、実現不可能になるという問題点がある。
In order to solve this drawback, the candidate character register 5 and the comparator 6 shown in FIG. 4 are conventionally used (see Japanese Patent Application No. 58-071372).
Instead, the circuit shown in FIG. 5 is used to calculate the degree of coincidence. In this method, the address of the similarity memory 17 is directly referred to by the character code of the word data 13, and the output of this memory is sent to the matching degree calculation unit 18 to perform the matching degree calculation. In the similarity memory 17, the similarity obtained from the recognition result of the character corresponding to each character code is stored at the address indicated by this character code. However, with this method, if a character code having a large number of bits, for example, a kanji code (16 bits) is to be handled, the similarity memory as a word becomes huge and it becomes impossible to realize.

〔発明の目的〕[Object of the Invention]

この発明はこのような事情を考慮してなされたもので、
その目的とするところは、漢字コードのような文字コー
ドのビット数の大きなものを取扱う場合でも簡易にかつ
高速度に単語辞書と入力単語の比較を行なって単語認識
を効果的に行なう事のできる文字認識装置を提供するこ
とにある。
This invention was made in consideration of such circumstances.
The purpose is to enable efficient word recognition by easily and quickly comparing the word dictionary with the input word even when handling a character code having a large number of bits such as a kanji code. To provide a character recognition device.

〔発明の概要〕[Outline of Invention]

この発明はn文字からなる入力単語の各文字Ai(i=
1,2,…,n)につきそれぞれ認識し、各文字ごとに
その文字Aiと、文字認識辞書にL個登録されている認識
対象文字Bk(k=1,2,…L)との類似度Sk,iを求
め、このSk,iを2次元メモリである第2のメモリに格納
する。そして、複数個に分割された第1のメモリに、文
字Bkの文字コードが分割入力した時に、このSn,iの格納
場所を示すようなアドレスポインタを書込み、単語認識
時には、単語辞書の出力である文字コードと文字位置i
を第1のメモリのアドレスに分割入力し、この結果得ら
れるアドレスと文字位置iを第2のメモリに入力し、こ
の出力を一致度計算部に送り、単語の一致度を計算し、
この一致度に基づいて認識候補となる単語を厳選し、こ
れによって高速度で適確な認識を簡易に行う手段を可能
としたものである。
This invention uses each character A i (i =
1, 2, ..., N) are respectively recognized, and the character A i for each character and the recognition target character B k (k = 1, 2, ... L) registered in L characters in the character recognition dictionary The similarity S k , i is obtained, and this S k , i is stored in the second memory which is a two-dimensional memory. Then, when the character code of the character B k is divided and input into the first memory divided into a plurality of pieces, an address pointer indicating the storage location of this S n , i is written, and at the time of word recognition, a word dictionary Output character code and character position i
Is divided into the addresses of the first memory, the resulting address and the character position i are input to the second memory, and the output is sent to the matching degree calculation unit to calculate the matching degree of the words.
A word that is a candidate for recognition is carefully selected on the basis of the degree of coincidence, thereby enabling a means for easily performing accurate recognition at high speed.

〔発明の効果〕〔The invention's effect〕

この発明は以上説明したとおり、一致度計算における類
似度の検索が、第1のメモリと第2のメモリを直列に参
照することによってのみ行われるので、制御回路が簡単
化され、しかも各メモリはアドレスが分割入力になるの
で小さくてすみ、認識処理時間も大幅に短縮され、きわ
めて効果的で実用性の高い文字認識が可能となる効果を
有している。
As described above, according to the present invention, the similarity search in the coincidence calculation is performed only by serially referring to the first memory and the second memory, so that the control circuit is simplified and each memory is Since the address is divided input, it can be made small, and the recognition processing time can be greatly shortened, which has the effect of enabling extremely effective and highly practical character recognition.

〔発明の実施例〕Example of Invention

以下、図面を参照してこの発明の一実施例につき説明す
る。なお、以下の説明では第1のメモリの分割数を2と
して説明する。
An embodiment of the present invention will be described below with reference to the drawings. In the following description, the number of divisions of the first memory will be two.

第2図は文字認識の結果得られる文字コード列で、第1
位候補がMなる文字候補、以下第j位がMjNjであ
る。ここでMは文字コードの上位8ビットコード、N
が下位8ビットコードである。すなわち、この例では
文字コードMjNjは16ビットで分割はそれぞれ8ビット
づつとしている。次にこれらM〜M15(最大候補数
は15に限定されるものとする)に1〜15の番号を割
当て、このとき、M〜M15の中に同一のコードが存
在するならば同じ番号を割当てる。すなわちMj=Mk(j
<k)ならばMj,Mk共に番号Jを割当てる。この番号を
JMjのように記述する。Njについても同様である。次に
第1のメモリ〔M〕(第3図22)のMj(8ビット)を
アドレスとする位置に前記した対応する番号JMjを書込
む。もう1つの第1のメモリ〔M〕(第3図23)のNj
(8ビット)をアドレスとする位置に同様に対応する番
号JNjを書込む。第1のメモリの残りの部分はすべて0
である。さらに第j位候補MjNjに対応する類似度SjをMj
に対応する番号JMj,Njに対応する番号JNjの組により作
られるアドレスJMj,JNjで定義する第2のメモリのアド
レスに格納する。すなわち、入力された文字Aiが実はB
jiである類似度Sjを(JMj,JNj)の2次元マトリクスS
JM,JNに表示すると第3図の第2メモリ28のように書
込まれる。第2のメモリ28の残りの部分はすべて0で
ある。なお、第3図中の26,27は第2のメモリ28
のアドレスの上位4ビット、下位4ビットを表示したも
のである。このようにすることによって、第1のメモリ
〔M〕、〔N〕のそれぞれのアドレスにMjNjなる文字コ
ードが信号線20,21によって入力されると第1のメ
モリはJMj,JNjなる番号を各々信号線24,25に出力
し、これが第2のメモリのアドレスに入力され、第2の
メモリからMjNjに対応する類似度Sjが得られる。一方、
MjNj(j=1,2,……15)以外のコードが入力され
ると、第2のメモリ出力は0となる。
FIG. 2 shows a character code string obtained as a result of character recognition.
The position candidate is a character candidate of M 1 N 1 , and the jth position is M j N j . Here, M 1 is the upper 8-bit code of the character code, N
1 is the lower 8-bit code. That is, in this example, the character code M j N j is 16 bits, and each division is 8 bits. Next, these M 1 to M 15 (the maximum number of candidates is limited to 15) are assigned numbers 1 to 15 , and if the same code exists in M 1 to M 15 at this time, Assign the same number. That is, M j = M k (j
If <k), the number J is assigned to both M j and M k . This number
Described as JM j . The same applies to N j . Next, the above-mentioned corresponding number JM j is written in the position of M j (8 bits) of the first memory [M] (FIG. 22) as an address. N j of the other first memory [M] (FIG. 3)
Similarly, the corresponding number JN j is written in a position having (8 bits) as an address. The rest of the first memory is all 0s
Is. Further, the similarity S j corresponding to the jth candidate M j N j is set to M j
Storing the corresponding number JM j, address JM j produced by a set of numbers JN j corresponding to N j, the address of the second memory as defined in JN j to. That is, the input characters A i are actually B
The similarity S j that is ji is the two-dimensional matrix S of (JM j , JN j ).
When it is displayed on JM and JN , it is written like the second memory 28 in FIG. The rest of the second memory 28 is all zeros. Incidentally, 26 and 27 in FIG. 3 are the second memory 28.
The upper 4 bits and the lower 4 bits of the address are displayed. By doing so, when the character codes of M j N j are input to the respective addresses of the first memories [M] and [N] through the signal lines 20 and 21, the first memories are JM j and JN. outputs j becomes numbers each signal line 24, which is input to the address of the second memory, the similarity S j corresponding from the second memory to M j N j is obtained. on the other hand,
When a code other than M j N j (j = 1, 2, ... 15) is input, the second memory output becomes 0.

これら第1、第2のメモリのアドレスにそれぞれmビッ
ト付加して文字位置iを第1、第2の追加アドレスmに
入力しておく。こうすることによってn文字からなる単
語の各文字iについて前記した処理によって類似度Sj
得られる。
The character position i is input to the first and second additional addresses m by adding m bits to the addresses of the first and second memories, respectively. By doing so, the similarity S j is obtained by the above-described processing for each character i of the word consisting of n characters.

このようにして得られた各文字の類似度は一致度計算部
29へ送られ、たとえば、これら類似度を加算すること
によって単語の確からしさ、すなわち一致度を得る。こ
の一致度は辞書に登録された一単語と入力文字との間で
計算されるものであり、これを辞書内の単語全部につい
て計算し、たとえば一番高い一致度の候補単語を外部に
結果として出力する。
The degree of similarity of each character thus obtained is sent to the degree-of-coincidence calculator 29, and, for example, the degree of similarity, that is, degree of coincidence, of the word is obtained by adding these degrees of similarity. This degree of matching is calculated between one word registered in the dictionary and the input character, and this is calculated for all the words in the dictionary. For example, the candidate word with the highest degree of matching is output to the outside as a result. Output.

第1図はこの発明の一実施例の概略構成図であり、その
動作は次の通りである。すなわち、文字認識部31の結
果は前述した処理によって第1、第2のメモリ33,3
6に書かれ、単語辞書メモリ32から出力される文字コ
ードは第1のメモリ33、第2のメモリ36(第3図の
第2のメモリ28と同じもの)、一致度計算部38へ縦
続的に送られて一致度が計算される。制御部はアドレス
カウンタ34、文字位置カウンタ35をコントロールす
ると共に全体をコントロールし、類似度に基づいた結果
を文字認識制御部30へ送る手段を有している。
FIG. 1 is a schematic configuration diagram of an embodiment of the present invention, and its operation is as follows. That is, the result of the character recognition unit 31 is the result of the above-described processing in the first and second memories 33 and 3.
The character code written in 6 and output from the word dictionary memory 32 is cascaded to the first memory 33, the second memory 36 (the same as the second memory 28 in FIG. 3), and the coincidence calculation unit 38. Is sent to and the degree of coincidence is calculated. The control unit has means for controlling the address counter 34 and the character position counter 35 and also for controlling the whole, and sending a result based on the similarity to the character recognition control unit 30.

なお、この発明は前記した実施例以外にも種々変形して
実施することができる。たとえば、第1のメモリの分割
数は任意であり、また、そのアドレスのビット数も任意
である。一致度の計算方法も任意であって、どのような
装置および手段であってもこの発明に適用し得るもので
あればよい。また、文字認識時の最大候補数も特に限定
しない。また、実現すべき手段も特定のハードウェアに
限定するものではない。
The present invention can be implemented in various modifications other than the above-described embodiments. For example, the number of divisions of the first memory is arbitrary, and the number of bits of the address is also arbitrary. The method of calculating the degree of coincidence is also arbitrary, and any device and means can be applied to the present invention. Also, the maximum number of candidates at the time of character recognition is not particularly limited. Also, the means to be realized are not limited to specific hardware.

なお、以上の記載中で文字として説明されたものは、手
書入力されたパターンおよび音声入力されたパターンの
いずれをも含むものである。
It should be noted that what is described as characters in the above description includes both a handwritten input pattern and a voice input pattern.

また、文字単位の類似度とは文字の確からしさを表わす
ものであればどのようなものでもよく、たとえば、文字
認識時の候補順位、またはその順位に基づく得点であっ
ても良い。
Further, the similarity on a character-by-character basis may be any value as long as it indicates the likelihood of a character, and may be, for example, a candidate rank at the time of character recognition, or a score based on the rank.

また、この発明にさらに第1のメモリの出力を直接一致
度計算部へ送る部分を付加して文字コードのビット数が
少ない時は直接的な方式も可能であるような方式にもで
きる。
Further, a system for directly sending the output of the first memory to the coincidence degree calculating unit may be added to the present invention so that a direct system is possible when the bit number of the character code is small.

要するにこの発明はその要旨を逸脱しない限り種々に変
形して実施することができる。
In short, the present invention can be variously modified and implemented without departing from the gist thereof.

【図面の簡単な説明】[Brief description of drawings]

第1図はこの発明の一実施例の概略構成図、第2図、第
3図はこの発明の各手段を説明する図、第4図、第5図
は従来装置の一例を示す概略構成図である。 図において、 1,31……文字認識部、2……編集部、3,39……
単語照合部、4,12,19,32……単語辞書メモ
リ、5……候補文字レジスタ、6……コンパレータ、7
……単語辞書レジスタ、8……レジスタカウンタ、9,
18,29,38……一致度計算部、10,34……ア
ドレスカウンタ、11……ソート処理部、13……単語
データ、14,15,16……類似度格納位置、17…
…類似度メモリ、20,21,24,25……信号線、
22,23,33……第1のメモリ、28,36……第
2のメモリ、26……第2のメモリの下位アドレス、2
7……第2のメモリの上位アドレス、30……文字認識
制御部、35……文字位置カウンタ、37……制御部。
FIG. 1 is a schematic configuration diagram of an embodiment of the present invention, FIGS. 2 and 3 are diagrams for explaining each means of the present invention, and FIGS. 4 and 5 are schematic configuration diagrams showing an example of a conventional device. Is. In the figure, 1,31 ... Character recognition unit, 2 ... Editing unit, 3,39 ...
Word collating unit, 4, 12, 19, 32 ... Word dictionary memory, 5 ... Candidate character register, 6 ... Comparator, 7
...... Word dictionary register, 8 ...... Register counter, 9,
18, 29, 38 ... Matching degree calculation section, 10, 34 ... Address counter, 11 ... Sort processing section, 13 ... Word data, 14, 15, 16 ... Similarity storage position, 17 ...
... Similarity memory, 20, 21, 24, 25 ... Signal line,
22, 23, 33 ... First memory, 28, 36 ... Second memory, 26 ... Lower address of second memory, 2
7 ... Upper address of second memory, 30 ... Character recognition control unit, 35 ... Character position counter, 37 ... Control unit.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】n文字からなる文字列として与えられる音
声入力単語、または文字入力単語の各文字に対して文字
認識を行う文字認識手段と、 この文字認識手段での処理時に得られる類似度を格納す
る第2のメモリ手段と、 この第2のメモリ手段を参照するアドレスを分割格納す
る複数個の第1のメモリ手段と、 前記第2のメモリ手段に格納された各文字の類似度から
単語の一致度を計算する一致度計算手段と、 この一致度計算手段で得られた結果に基づいて、単語辞
書の中から認識候補となる単語を選択する手段とを具備
し、 前記複数個の第1のメモリ手段は、単語辞書に登録され
ている単語の各文字の文字コードを複数分割した各々を
アドレスとし、前記第2のメモリ手段を参照するアドレ
スを分割格納して成り、 かつ、前記単語辞書からの認識候補となる単語の選定
は、単語辞書中の単語の各文字について前記複数個の前
記第1のメモリを参照して各出力を合成し、この合成出
力をアドレスとして前記第2のメモリを参照し、各文字
の類似度を用いて計算された単語の一致度に基づいて行
われることを特徴とする文字認識装置。
1. A character recognition means for performing character recognition on a voice input word, which is given as a character string consisting of n characters, or each character of the character input word, and a similarity obtained at the time of processing by the character recognition means. Second memory means for storing, a plurality of first memory means for dividing and storing an address referencing the second memory means, and a word based on the similarity of each character stored in the second memory means. And a means for selecting a word as a recognition candidate from the word dictionary based on the result obtained by the coincidence degree calculating means. The first memory means has a plurality of character codes of the respective characters of the word registered in the word dictionary as addresses, and stores the addresses referencing the second memory means in a divided manner. dictionary The selection of words as recognition candidates is performed by referring to the plurality of first memories for each character of the word in the word dictionary, synthesizing each output, and using the synthesized output as an address in the second memory. The character recognition device is characterized in that it is performed based on the matching degree of words calculated using the similarity of each character.
JP59281244A 1984-12-29 1984-12-29 Character recognition device Expired - Lifetime JPH0640352B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59281244A JPH0640352B2 (en) 1984-12-29 1984-12-29 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59281244A JPH0640352B2 (en) 1984-12-29 1984-12-29 Character recognition device

Publications (2)

Publication Number Publication Date
JPS61160182A JPS61160182A (en) 1986-07-19
JPH0640352B2 true JPH0640352B2 (en) 1994-05-25

Family

ID=17636365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59281244A Expired - Lifetime JPH0640352B2 (en) 1984-12-29 1984-12-29 Character recognition device

Country Status (1)

Country Link
JP (1) JPH0640352B2 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0766423B2 (en) * 1983-04-25 1995-07-19 株式会社東芝 Character recognition device

Also Published As

Publication number Publication date
JPS61160182A (en) 1986-07-19

Similar Documents

Publication Publication Date Title
US5020117A (en) Handwritten character string recognition system
US5774588A (en) Method and system for comparing strings with entries of a lexicon
US5835635A (en) Method for the recognition and completion of characters in handwriting, and computer system
US4254476A (en) Associative processor
US3618027A (en) Associative memory system with reduced redundancy of stored information
JPS6120038B2 (en)
US4327407A (en) Data driven processor
JPS60105039A (en) Collation system of character string
US3387274A (en) Memory apparatus and method
JPH0640352B2 (en) Character recognition device
US3697951A (en) Pattern recognition by multiple associative transformations
JP3288063B2 (en) Variable length data storage and reference system
JPH0766423B2 (en) Character recognition device
JPS63268082A (en) Pattern recognizing device
JP2644859B2 (en) Identification processing method of detailed pattern identification device
JP2839515B2 (en) Character reading system
JPH01183796A (en) Character recognizing device
JPH0438026B2 (en)
JPS63138479A (en) Character recognizing device
JPS5820075B2 (en) pattern recognition device
JP2942375B2 (en) Character reader
JP2637762B2 (en) Pattern detail identification method
JPH0746373B2 (en) Word recognizer
JPH0355874B2 (en)
JP2923295B2 (en) Pattern identification processing method

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term