JPH11154231A - Pattern recognition dictionary learning method, pattern recognition dictionary creation method, pattern recognition dictionary learning device, pattern recognition dictionary creation device, pattern recognition method, and pattern recognition device - Google Patents
Pattern recognition dictionary learning method, pattern recognition dictionary creation method, pattern recognition dictionary learning device, pattern recognition dictionary creation device, pattern recognition method, and pattern recognition deviceInfo
- Publication number
- JPH11154231A JPH11154231A JP9321200A JP32120097A JPH11154231A JP H11154231 A JPH11154231 A JP H11154231A JP 9321200 A JP9321200 A JP 9321200A JP 32120097 A JP32120097 A JP 32120097A JP H11154231 A JPH11154231 A JP H11154231A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- learning
- dictionary
- pattern
- pattern recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
(57)【要約】
【課題】 複数の認識方式を用いるパターン認識処理に
おける辞書学習において、学習による弊害を最小限に抑
え、各々の認識方式の長所を活かすようにしたパターン
認識学習方法を提供すること。
【解決手段】 複数の認識方式を用いるパターン認識処
理における認識辞書を学習する方法において、入力パタ
ーンに対するパターン認識処理を実行し、このパターン
認識処理の認識結果および各認識方式の認識結果に少な
くとも基づいて前記認識辞書の学習基準を定め、この学
習基準により定められる認識辞書を学習すべき認識方式
と学習方法に従って、前記認識辞書を学習することを特
徴とする。
(57) [Summary] [PROBLEMS] To provide a pattern recognition learning method that minimizes the adverse effects of learning and makes use of the advantages of each recognition method in dictionary learning in pattern recognition processing using a plurality of recognition methods. thing. In a method of learning a recognition dictionary in a pattern recognition process using a plurality of recognition methods, a pattern recognition process is performed on an input pattern, and at least a recognition result of the pattern recognition process and a recognition result of each recognition method are used. A learning criterion for the recognition dictionary is determined, and the recognition dictionary is learned according to a recognition method and a learning method for learning the recognition dictionary determined by the learning criterion.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、パターン認識にお
ける辞書を学習するためのパターン認識学習方法及びパ
ターン認識作成方法、パターン認識における辞書を作成
するためのパターンパターン認識辞書学習装置及びパタ
ーン認識辞書作成装置、並びにこの辞書を用いたパター
ン認識方法及びパターン認識装置に関する。The present invention relates to a pattern recognition learning method and a pattern recognition creating method for learning a dictionary in pattern recognition, a pattern pattern recognition dictionary learning device for creating a dictionary in pattern recognition, and a pattern recognition dictionary creation. The present invention relates to a device, a pattern recognition method and a pattern recognition device using the dictionary.
【0002】[0002]
【従来の技術】パターン認識における認識方式およびそ
の辞書の学習方法あるいは作成方法には種々のものが知
られている。例えば、文献「The Self−Org
anizing Map」、Proceedings
of the IEEE(1990)には、LVQ(L
earning Vector Quanizatio
n)が紹介されている。これは入力ベクトルをxとし、
それぞれのカテゴリに対してmを参照ベクトルとし、相
違度をsとして、s=‖x−m‖と定義するものであ
る。各カテゴリ中で最大の相違度を持つカテゴリをxの
認識結果として出力する。2. Description of the Related Art There are known various recognition methods in pattern recognition and methods for learning or creating a dictionary thereof. For example, the document “The Self-Org”
anizing Map ", Proceedings
of the IEEE (1990) includes LVQ (L
learning Vector Quantizatio
n) is introduced. This assumes that the input vector is x,
For each category, m is defined as a reference vector, and the difference is defined as s, and s = {x−m} is defined. The category having the highest degree of difference among the categories is output as the recognition result of x.
【0003】このとき、mの学習には次の手順を使う。
学習パターンxを認識したときに認識結果として得られ
たカテゴリをc、参照ベクトルをmc として、 mc ´=mc +α(x−mc ) (1) mc ´=mc −α(x−mc ) (2) のようにして辞書を更新する。At this time, the following procedure is used for learning m.
Category obtained as the recognition results when recognizing the training pattern x c, a reference vector as a m c, m c '= m c + α (x-m c) (1) m c' = m c -α ( x- mc ) Update the dictionary as in (2).
【0004】上記以外の方法にLVQ2、LVQ3があ
り、認識結果として得られる相違度に基づいて式(1)
と式(2)を使い分けている。また、GPD(Gene
ralized Probabilistic Dec
ent)と呼ばれる考え方をユークリッド距離に適用す
る方式も知られている。R(x)をxを認識したときに
得られる認識結果とし、α(R(x))をR(x)によ
って決まる係数として、一般的にいって、 mc ´=mc +α(R(x))(x−mc ) を更新ルールとするものである。There are LVQ2 and LVQ3 as methods other than the above, and based on the difference obtained as a recognition result, equation (1)
And equation (2). In addition, GPD (Gene
rarized Probabilistic Dec
A method of applying a concept called “ent) to the Euclidean distance is also known. R (x) is a recognition result obtained when x is recognized, and α (R (x)) is a coefficient determined by R (x). In general, mc ′ = mc + α (R ( x)) (x- mc ) as the update rule.
【0005】文献「パターン認識と部分空間法」、産業
図書(1986)には、学習部分空間法(LSM)が紹
介されている。これは入力ベクトルをxとし、それぞれ
のカテゴリに対してPをプロジェクションとし、類似度
をsとして、s=xT Pxと定義するものである。な
お、xT はxの転置行列である。各カテゴリ中で最大の
類似度を持つカテゴリをxの認識結果として出力する。[0005] The document "Pattern Recognition and Subspace Method", Sangyo Tosho (1986), introduces a learning subspace method (LSM). This defines s = x T Px, where x is an input vector, P is projection for each category, and similarity is s. In addition, x T is the transpose matrix of x. The category having the highest similarity in each category is output as the result of x recognition.
【0006】Pを構成する正規直交ベクトルをψi とし
たとき、Gをψi をr個並べた行列としてP=GGT と
表せるものとする。R(x)をxを認識したときに得ら
れる認識結果とし、α(R(x))をR(x)によって
決まる係数として、 ψi ´=ψi +α(R(x))(x,ψ)x とし、ψi ´をたとえばシュミットの直交化法で正規直
交化して新しいψi ´を求めることにより学習を行う。[0006] When the orthonormal vectors constituting the P was set to [psi i, shall be expressed as P = GG T to a G [psi i as the r arranged matrix. Let R (x) be the recognition result obtained when x is recognized, and α (R (x)) be a coefficient determined by R (x), and ψ i ′ = ψ i + α (R (x)) (x, ψ) x, and learning is performed by orthogonally transforming た と え ばi ′ by, for example, the Schmidt orthogonalization method to obtain a new ψ i ′.
【0007】平均ベクトルmを持つ形式で、 s=‖x−m‖2 −(x−m)T P(x−m) も投影距離として知られているが、ψi については上と
同様に求め、またmについて、 m´=m+2α(R(x))((x−m)−P(x−
m)) によって更新する方式も知られている。[0007] format with a mean vector m, s = ‖x-m‖ 2 - (x-m) T P (x-m) is also known as projection distance, the [psi i as above is M ′ = m + 2α (R (x)) ((x−m) −P (x−
m)) is also known.
【0008】また、同じ文献に紹介されている平均部分
空間法(ALSM)や特開昭56−137483は次の
ようなものである。Kを正値対称行列として、Kの固有
ベクトルの一部を用いてPを構成し、類似度をs=xT
Pxと定義する。The average subspace method (ALSM) and JP-A-56-137483 introduced in the same document are as follows. Using K as a positive symmetric matrix, P is constructed using a part of the eigenvectors of K, and the similarity is expressed as s = x T
Defined as Px.
【0009】学習は認識が不正解であった場合に、 K´=K+αxxT …(正解カテゴリに対して) K´=K−βxxT …(不正解カテゴリに対して) によってKを更新することによって行う。In the learning, when the recognition is incorrect, K is updated by K ′ = K + αxx T (for the correct category) K ′ = K−βxx T (for the incorrect category) Done by
【0010】ところで、昨今、文字認識装置や音声認識
装置など既に実用化されているパターン認識装置におい
ては、パターン入力から認識処理後の誤認識結果の修正
まで含めた作業の効率化が求められてきており、これに
応えるために認識処理の高速化や高精度化が必要である
が、これを実現するためには1つの認識方式による認識
処理では難しくなってきている。[0010] By the way, in a pattern recognition device that has been already put into practical use, such as a character recognition device or a voice recognition device, it has been required to improve the efficiency of the operation from the input of the pattern to the correction of the erroneous recognition result after the recognition process. In order to respond to this, it is necessary to increase the speed and accuracy of the recognition process. However, it is difficult to realize this by a recognition process using one recognition method.
【0011】そこで、複数の認識方式を統合化して用い
るパターン認識手法が種々考えられている。すなわち、
各認識方式にはそれぞれ長所短所があるので、統合化方
式により認識方式を使い分けることによって、各々の認
識方式の長所を活かした優れた認識処理を実現すること
が期待できる。Therefore, various pattern recognition methods using a plurality of recognition methods integrated have been considered. That is,
Since each recognition method has its advantages and disadvantages, it is expected that excellent recognition processing utilizing the advantages of each recognition method can be realized by properly using the recognition methods according to the integrated method.
【0012】この複数の認識方式を用いるパターン認識
手法において辞書学習を行う際、従来は、不正解パター
ンやリジェクトパターンに対して全ての認識方式の辞書
を対象としてそれぞれ学習していた。When dictionary learning is performed in the pattern recognition method using a plurality of recognition methods, conventionally, an incorrect answer pattern or a reject pattern is learned for all the recognition method dictionaries.
【0013】ところが、複数の認識方式のうちのあるも
のは、上記に例示したような辞書学習を例えば他のカテ
ゴリとの間に曖昧性の高いパターンに対して行うなどし
たことによって、かえって辞書のバランスが崩れ、今ま
で正解していたパターンが不正解になってしまうことが
ある。そして、このような学習による弊害により、各々
の認識方式の長所を十分活かすことができるような辞書
学習の実現が難しく、複数の認識方式を用いたパターン
認識手法全体としての認識性能を十分引き出すことがで
きなかった。However, some of the plurality of recognition methods perform the dictionary learning as exemplified above, for example, for a pattern having a high degree of ambiguity between other categories, so that the dictionary is not recognized. The balance may be lost, and the correct pattern may become incorrect. Because of the adverse effects of such learning, it is difficult to realize dictionary learning that can fully utilize the advantages of each recognition method, and to fully exploit the recognition performance of the entire pattern recognition method using multiple recognition methods. Could not.
【0014】[0014]
【発明が解決しようとする課題】以上のように、従来、
複数の認識方式を用いるパターン認識手法のための辞書
学習として、複数の認識方式それぞれの特性を活かすよ
うに辞書学習可能な学習方法が存在しなかった。As described above, conventionally,
As a dictionary learning method for a pattern recognition method using a plurality of recognition methods, there is no learning method capable of learning a dictionary so as to make use of the characteristics of the plurality of recognition methods.
【0015】本発明は、上記事情を考慮してなされたも
ので、複数の認識方式を用いるパターン認識処理におけ
る辞書学習において、学習による弊害を最小限に抑え、
各々の認識方式の長所を活かすようにしたパターン認識
学習方法、パターン認識作成方法、パターン認識辞書学
習装置、パターン認識辞書作成装置、パターン認識方法
及びパターン認識装置を提供することを目的とする。The present invention has been made in consideration of the above circumstances, and minimizes the adverse effects of learning in dictionary learning in pattern recognition processing using a plurality of recognition methods.
An object of the present invention is to provide a pattern recognition learning method, a pattern recognition creation method, a pattern recognition dictionary learning device, a pattern recognition dictionary creation device, a pattern recognition method, and a pattern recognition device that make use of the advantages of each recognition method.
【0016】[0016]
【課題を解決するための手段】最初に語句の定義を行
う。学習基準とは、第1位候補の類似度や第1位候補の
カテゴリや第1位候補と第2位候補の類似度の差のよう
な認識結果から一定のアルゴリズムで演繹することがで
きるパラメータをいう。学習指針とは、学習基準に対す
る条件によって、学習する辞書や学習方法を決定するア
ルゴリズムである。Means for Solving the Problems First, terms are defined. The learning criterion is a parameter that can be deduced by a certain algorithm from a recognition result such as the similarity of the first candidate, the category of the first candidate, or the difference between the similarities of the first and second candidates. Say. The learning guideline is an algorithm that determines a dictionary to be learned and a learning method according to a condition with respect to a learning criterion.
【0017】本発明(請求項1)は、複数の認識方式を
用いるパターン認識処理における認識辞書を学習するパ
ターン認識辞書学習方法であって、入力パターンに対す
る各認識方式の認識結果に少なくとも基づいて定められ
た学習基準に従って、前記認識辞書を学習することを特
徴とする。The present invention (claim 1) is a pattern recognition dictionary learning method for learning a recognition dictionary in a pattern recognition process using a plurality of recognition methods, wherein the method is determined based at least on the recognition result of each recognition method for an input pattern. Learning the recognition dictionary according to the obtained learning criterion.
【0018】本発明(請求項2)は、複数の認識方式を
用いるパターン認識処理における認識辞書を学習するパ
ターン認識辞書学習方法であって、入力パターンに対す
るパターン認識処理を実行し、このパターン認識処理の
認識結果および各認識方式の認識結果に少なくとも基づ
いて前記認識辞書の学習基準を定め、定められた前記学
習基準に従って、前記認識辞書を学習することを特徴と
する。According to a second aspect of the present invention, there is provided a pattern recognition dictionary learning method for learning a recognition dictionary in a pattern recognition process using a plurality of recognition methods, wherein the pattern recognition process is performed on an input pattern. And a learning criterion for the recognition dictionary is determined based at least on the recognition result of each recognition method and the recognition result of each recognition method, and the recognition dictionary is learned according to the determined learning criterion.
【0019】好ましくは、前記パターン認識処理におけ
る前記複数の認識方式の統合化方式に従属した学習指針
を定めるようにしてもよい。好ましくは、前記学習基準
は、学習指針を定めるものであって、その学習指針によ
って学習を行うようにしてもよい。[0019] Preferably, a learning guideline depending on an integrated system of the plurality of recognition systems in the pattern recognition process may be determined. Preferably, the learning criterion defines a learning guideline, and learning may be performed according to the learning guideline.
【0020】好ましくは、前記学習基準は、認識方式に
おける認識候補と正解候補の類似度の差、正解候補の類
似度、認識候補の類似度、認識候補カテゴリ、正解候補
カテゴリおよび正解候補の候補順位のうち少なくとも1
つを含むものであってもよい。Preferably, the learning criterion includes a difference in similarity between the recognition candidate and the correct candidate in the recognition method, a similarity of the correct candidate, a similarity of the recognition candidate, a recognition candidate category, a correct candidate category, and a candidate rank of the correct candidate. At least one of
May be included.
【0021】好ましくは、前記学習基準は、認識辞書を
学習すべき認識方式と学習方法を定めるものであっても
よい。本発明(請求項6)は、複数の認識方式を用いる
パターン認識処理における認識辞書を、初期的な認識辞
書を学習することにより作成するパターン認識辞書作成
方法であって、入力パターンに対する各認識方式の認識
結果に少なくとも基づいて定められた学習基準に従っ
て、前記認識辞書を学習することを特徴とする。[0021] Preferably, the learning criterion may determine a recognition method and a learning method for learning a recognition dictionary. The present invention (Claim 6) is a pattern recognition dictionary creating method for creating a recognition dictionary in a pattern recognition process using a plurality of recognition methods by learning an initial recognition dictionary. And learning the recognition dictionary in accordance with a learning criterion determined based at least on the recognition result.
【0022】本発明(請求項7)は、複数の認識方式を
用いるパターン認識処理における認識辞書を、初期的な
認識辞書を学習することにより作成するパターン認識辞
書作成方法であって、入力パターンに対するパターン認
識処理を実行し、このパターン認識処理の認識結果およ
び各認識方式の認識結果に少なくとも基づいて前記認識
辞書の学習基準を定め、定められた前記学習基準に従っ
て、前記認識辞書を学習することを特徴とする。The present invention (claim 7) is a pattern recognition dictionary creating method for creating a recognition dictionary in a pattern recognition process using a plurality of recognition methods by learning an initial recognition dictionary. Executing a pattern recognition process, determining a learning criterion of the recognition dictionary based on at least the recognition result of the pattern recognition process and the recognition result of each recognition method, and learning the recognition dictionary according to the determined learning criterion. Features.
【0023】好ましくは、前記パターン認識処理におけ
る前記複数の認識方式の統合化方式に従属した学習指針
を定めるようにしてもよい。好ましくは、前記学習基準
は、学習指針を定めるものであって、その学習指針によ
って学習を行うようにしてもよい。[0023] Preferably, a learning guideline depending on an integrated system of the plurality of recognition systems in the pattern recognition processing may be determined. Preferably, the learning criterion defines a learning guideline, and learning may be performed according to the learning guideline.
【0024】好ましくは、前記学習基準は、認識方式に
おける認識候補と正解候補の類似度の差、正解候補の類
似度、認識候補の類似度、認識候補カテゴリ、正解候補
カテゴリおよび正解候補の候補順位のうち少なくとも1
つを含むものであってもよい。Preferably, the learning criterion is a similarity difference between a recognition candidate and a correct answer candidate in a recognition method, a similarity degree of a correct answer candidate, a similarity degree of a recognition candidate, a recognition candidate category, a correct answer candidate category, and a candidate rank of a correct answer candidate. At least one of
May be included.
【0025】好ましくは、前記学習基準は、認識辞書を
学習すべき認識方式と学習方法を定めるものであっても
よい。本発明(請求項11)に係るパターン認識辞書学
習装置は、複数の認識方式を用いてパターン認識処理を
行うパターン認識手段と、前記複数の認識方式それぞれ
の認識辞書を格納するための辞書格納手段と、入力パタ
ーンに対する各認識方式の認識結果に少なくとも基づい
て定められた学習基準に従って、前記認識辞書を学習す
る学習手段とを特徴とする。Preferably, the learning criterion may determine a recognition method and a learning method for learning a recognition dictionary. A pattern recognition dictionary learning apparatus according to the present invention (claim 11) includes: a pattern recognition unit that performs a pattern recognition process using a plurality of recognition methods; and a dictionary storage unit that stores a recognition dictionary for each of the plurality of recognition methods. And learning means for learning the recognition dictionary in accordance with a learning criterion determined based at least on the recognition result of each recognition method for the input pattern.
【0026】本発明(請求項11)に係るパターン認識
辞書作成装置は、複数の認識方式を用いてパターン認識
処理を行うパターン認識手段と、前記複数の認識方式そ
れぞれの認識辞書を格納するための辞書格納手段と、前
記辞書格納手段に格納される初期的な認識辞書を作成す
る初期辞書作成手段と、前記認識辞書を学習する学習手
段と、入力パターンに対する各認識方式の認識結果に少
なくとも基づいて定められた学習基準に従って、前記認
識辞書を学習する学習手段とを特徴とする。[0026] A pattern recognition dictionary creating apparatus according to the present invention (claim 11) includes a pattern recognition means for performing a pattern recognition process using a plurality of recognition methods, and a storage unit for storing the recognition dictionaries of the plurality of recognition methods. A dictionary storage unit, an initial dictionary creation unit that creates an initial recognition dictionary stored in the dictionary storage unit, a learning unit that learns the recognition dictionary, and at least based on a recognition result of each recognition method for an input pattern. Learning means for learning the recognition dictionary in accordance with a predetermined learning criterion.
【0027】本発明(請求項13)は、コンピュータ
に、複数の認識方式を用いた所定のパターン認識処理に
よる入力パターンに対する認識処理を実行させ、このパ
ターン認識処理で実行された各認識方式の認識結果に少
なくとも基づいて前記認識辞書の学習基準を定めさせ、
定められた前記学習基準に従って前記認識辞書を学習さ
せるためのプログラムを記録したコンピュータ読取り可
能な記録媒体を要旨とする。The present invention (claim 13) causes a computer to execute a recognition process for an input pattern by a predetermined pattern recognition process using a plurality of recognition systems, and recognizes each recognition system executed in the pattern recognition process. A learning criterion for the recognition dictionary is determined based on at least the result,
A computer-readable recording medium that records a program for learning the recognition dictionary according to the determined learning criterion is summarized.
【0028】本発明(請求項14)は、コンピュータ
に、複数の認識方式を用いた所定のパターン認識処理に
よる入力パターンに対する認識処理を実行させ、このパ
ターン認識処理で実行された各認識方式の認識結果に少
なくとも基づいて前記認識辞書の学習基準を定めさせ、
この学習基準により定められる認識辞書を学習すべき認
識方式と学習方法に従って前記認識辞書を学習させるた
めのプログラムを記録したコンピュータ読取り可能な記
録媒体を要旨とする。The present invention (claim 14) causes a computer to execute a recognition process for an input pattern by a predetermined pattern recognition process using a plurality of recognition systems, and recognizes each recognition system executed in the pattern recognition process. A learning criterion for the recognition dictionary is determined based on at least the result,
The gist of the present invention is a computer-readable recording medium storing a program for learning the recognition dictionary according to a recognition method and a learning method for learning the recognition dictionary determined by the learning criterion.
【0029】本発明(請求項15)は、複数の認識方式
を用いるパターン認識方法であって、請求項1ないし5
のいずれか1項に記載のパターン認識辞書学習方法によ
って学習された認識辞書を少なくとも用いて、入力され
たパターンを認識することを特徴とする。The present invention (claim 15) relates to a pattern recognition method using a plurality of recognition methods.
The input pattern is recognized using at least a recognition dictionary learned by the pattern recognition dictionary learning method according to any one of the above.
【0030】本発明(請求項16)は、複数の認識方式
を用いるパターン認識方法であって、請求項6ないし1
0のいずれか1項に記載のパターン認識辞書作成方法に
よって作成された認識辞書を少なくとも用いて、入力さ
れたパターンを認識することを特徴とする。The present invention (claim 16) relates to a pattern recognition method using a plurality of recognition methods.
0, the input pattern is recognized using at least a recognition dictionary created by the pattern recognition dictionary creating method described in any one of the above items.
【0031】本発明(請求項17)は、複数の認識方式
を用いるパターン認識装置であって、請求項1ないし5
のいずれか1項に記載のパターン認識辞書学習方法によ
って学習された認識辞書を格納した辞書格納手段と、入
力されたパターンを、少なくとも前記認識辞書を用いて
認識するパターン認識手段とを備えたことを特徴とす
る。The present invention (claim 17) relates to a pattern recognition apparatus using a plurality of recognition methods.
A dictionary storage unit that stores a recognition dictionary learned by the pattern recognition dictionary learning method according to any one of the above, and a pattern recognition unit that recognizes an input pattern using at least the recognition dictionary. It is characterized by.
【0032】本発明(請求項18)は、複数の認識方式
を用いるパターン認識装置であって、請求項6ないし1
0のいずれか1項に記載のパターン認識辞書作成方法に
よって作成された認識辞書を格納した辞書格納手段と、
入力されたパターンを、少なくとも前記認識辞書を用い
て認識するパターン認識手段とを備えたことを特徴とす
る。The present invention (claim 18) relates to a pattern recognition apparatus using a plurality of recognition methods.
0, a dictionary storage unit storing a recognition dictionary created by the pattern recognition dictionary creation method according to any one of 0
Pattern recognition means for recognizing the input pattern using at least the recognition dictionary.
【0033】本発明によれば、複数の認識方式を統合し
1つの認識結果を出すようなパターン認識処理における
認識辞書学習において、学習に関する弊害を最小限に抑
え、各認識方式の長所を活かす適切な方向に各認識辞書
を学習していくことができる。According to the present invention, in the recognition dictionary learning in the pattern recognition processing in which a plurality of recognition methods are integrated and one recognition result is obtained, adverse effects relating to the learning are minimized, and appropriate advantages utilizing the advantages of each recognition method are obtained. Each recognition dictionary can be learned in various directions.
【0034】また、このようにして学習/作成された認
識辞書により、各認識方式の長所を活かした高精度なパ
ターン認識処理を実現することができる。なお、装置に
係る本発明は方法に係る発明としても成立し、方法に係
る本発明は装置に係る発明としても成立する。Further, with the recognition dictionary learned / created in this way, a highly accurate pattern recognition process utilizing the advantages of each recognition method can be realized. Note that the present invention relating to the apparatus is also realized as an invention relating to a method, and the present invention relating to a method is also realized as an invention relating to an apparatus.
【0035】また、装置または方法に係る本発明は、コ
ンピュータに当該発明に相当する手順を実行させるため
の(あるいはコンピュータを当該発明に相当する手段と
して機能させるための、あるいはコンピュータに当該発
明に相当する機能を実現させるための)プログラムを記
録したコンピュータ読取り可能な記録媒体としても成立
する。The present invention relating to an apparatus or a method is provided for causing a computer to execute a procedure corresponding to the present invention (or for causing a computer to function as means corresponding to the present invention, or a computer corresponding to the present invention). The present invention is also realized as a computer-readable recording medium in which a program for realizing the function of performing the above is recorded.
【0036】[0036]
【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。図1に、本発明の一実施形態に
係るパターン認識辞書作成装置の基本構成を示す。Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 shows a basic configuration of a pattern recognition dictionary creating apparatus according to an embodiment of the present invention.
【0037】本パターン認識辞書作成装置は、パターン
入力部2、初期辞書作成部4、辞書変更部10、認識処
理部8、辞書データ格納部6を備えている。パターン入
力部2は、学習用パターンデータを入力するためのもの
である。The present pattern recognition dictionary creation device includes a pattern input unit 2, an initial dictionary creation unit 4, a dictionary change unit 10, a recognition processing unit 8, and a dictionary data storage unit 6. The pattern input unit 2 is for inputting learning pattern data.
【0038】なお、パターン入力部2は、文字認識の場
合には、文字をイメージセンサなどの光電変換素子を用
いて光学的に読取ってデジタル化し、音声認識の場合に
は、音声をマイクロホンなどの電気音響変換素子を用い
て電気信号に変換した後にA/D変換してデジタル化す
る。In the case of character recognition, the pattern input unit 2 optically reads and digitizes characters by using a photoelectric conversion element such as an image sensor, and in the case of voice recognition, converts voice into a microphone or the like. After conversion into an electric signal using an electroacoustic conversion element, the signal is A / D converted and digitized.
【0039】辞書データ格納部6は、辞書データを格納
するためのものである。認識処理部8は、辞書を用い
て、入力されたパターンの認識を行う。ここで、本実施
形態では、認識処理部8は、複数の互いに相違する認識
方式を持ち、複数の認識方式に基づいた認識結果を出力
するものである。したがって、辞書データ格納部6に
は、複数の認識方式のそれぞれに対応した辞書が格納さ
れる。The dictionary data storage section 6 is for storing dictionary data. The recognition processing unit 8 recognizes the input pattern using the dictionary. Here, in the present embodiment, the recognition processing unit 8 has a plurality of different recognition methods and outputs a recognition result based on the plurality of recognition methods. Therefore, the dictionary data storage unit 6 stores a dictionary corresponding to each of the plurality of recognition methods.
【0040】複数の認識方式により認識処理には、種々
の形態があるが、大きく分けて2種類あり、並列型と直
列型である。並列型は、各認識方式による個別の認識結
果を統合して最終的な認識結果を得るものであり、簡単
な例としては最も多くの認識方式が第1位候補としたカ
テゴリを認識結果とするものである。There are various forms of recognition processing using a plurality of recognition methods, but there are roughly two types of processing, a parallel type and a serial type. The parallel type is to obtain the final recognition result by integrating the individual recognition results of each recognition method. As a simple example, the category in which the most recognition methods are the first candidates is used as the recognition result. Things.
【0041】直列型は、予め複数の認識方式の実行順序
を定めておくもので、例えば、(1)各認識方式が1つ
の認識結果とそのアクセプト/リジェクトを出力し、実
行の順に従って、認識方式がリジェクトをした場合に、
次の認識方式に移り、最初にアクセプトした認識方式の
第1位候補を認識結果とするもの、(2)上記の(1)
において、ある認識方式のいくつかの上位候補のみを、
次の認識方式の認識候補とする認識方式が含まれるもの
などがある。In the serial type, the execution order of a plurality of recognition methods is determined in advance. For example, (1) each recognition method outputs one recognition result and its accept / reject, and performs recognition in accordance with the execution order. If the method rejects,
Move to the next recognition method, and use the first candidate of the first accepted recognition method as the recognition result. (2) The above (1)
In, only some top candidates of a certain recognition method,
There is a method including a recognition method as a recognition candidate of the next recognition method.
【0042】なお、直列型には、少なくとも1つの段階
が上記の並列型または直列型になっているものも考えら
れる。辞書変更部10は、詳しくは後述するが、学習用
パターンとこの学習用パターン学習に対する認識結果に
基づいて、辞書の学習を行い、辞書の内容を変更する。
また、認識処理部8における認識処理や複数の認識方式
それぞれのアルゴリズムに応じた学習を行う。It should be noted that the serial type may be such that at least one stage is of the above-mentioned parallel type or serial type. As will be described later in detail, the dictionary change unit 10 learns the dictionary based on the learning pattern and the recognition result of the learning pattern learning, and changes the contents of the dictionary.
In addition, the recognition processing unit 8 performs learning according to the recognition process and the algorithm of each of the plurality of recognition methods.
【0043】初期辞書作成部4は、初期辞書作成アルゴ
リズムを用いて、入力された初期辞書作成用パターン・
セットをもとに、初期的な辞書データ(初期辞書)を作
成する。初期辞書は、各認識方式ごとに作成される。初
期辞書作成用パターン・セットは、例えば、辞書に登録
するカテゴリ(例えば文字)ごとに、いくつかの標準パ
ターンを用意したものである。初期辞書作成アルゴリズ
ムとしては種々の方法が知られているが、最も簡単な方
法は各標準パターンから得た特徴ベクトルの平均を初期
辞書データとするものである。The initial dictionary creating section 4 uses the initial dictionary creating algorithm to input the input initial dictionary creating pattern
Initial dictionary data (initial dictionary) is created based on the set. An initial dictionary is created for each recognition method. The initial dictionary creation pattern set is, for example, one in which several standard patterns are prepared for each category (for example, characters) registered in the dictionary. Although various methods are known as initial dictionary creation algorithms, the simplest method is to use the average of feature vectors obtained from each standard pattern as initial dictionary data.
【0044】なお、外部から初期辞書もしくは学習され
た辞書を辞書データ格納部6に格納して学習もしくは再
学習することを前提とする場合には、初期辞書作成部4
は設けなくても構わない。If it is assumed that an external initial dictionary or a learned dictionary is stored in the dictionary data storage unit 6 for learning or re-learning, the initial dictionary creating unit 4
Need not be provided.
【0045】以上のような構成において、辞書学習を行
う場合、まず、上記パターン・セットから初期辞書を作
成して辞書データ格納部6に格納するか、外部から初期
辞書もしくは学習された辞書を読み込んで辞書データ格
納部6に格納する。In the above configuration, when dictionary learning is performed, first, an initial dictionary is created from the pattern set and stored in the dictionary data storage unit 6, or an initial dictionary or a learned dictionary is read from outside. To store it in the dictionary data storage unit 6.
【0046】次に、初期辞書または学習途中の辞書を用
いて学習させたいパターンに対する認識処理を行い、そ
の結果と学習パターンに基づいて学習処理を行い認識辞
書を更新する。この辞書学習/更新を適宜繰り返すこと
により、辞書の学習、改良を行う。Next, a recognition process for a pattern to be learned is performed using the initial dictionary or the dictionary during learning, and a learning process is performed based on the result and the learning pattern to update the recognition dictionary. This dictionary learning / updating is repeated as needed to learn and improve the dictionary.
【0047】なお、この繰り返しの終了条件としては、
例えば、全学習パターンに対する学習を1ラウンドとし
て、予め規定した回数のラウンドを行う方法、予め規定
したラウンド回数を上限として、所定の評価パラメータ
が一定基準を満たす(例えば、正読率>基準値および/
またはリジェクト率<基準値および/または誤読率<基
準値)ようになるまで行う方法など、種々の方法が考え
られる。The conditions for terminating the repetition are as follows:
For example, a method in which learning for all learning patterns is defined as one round and a predetermined number of rounds are performed, and a predetermined evaluation parameter satisfies a certain criterion with a predetermined number of rounds as an upper limit (for example, correct reading rate> reference value /
Alternatively, various methods are conceivable, such as a method of performing until the rejection rate <reference value and / or misreading rate <reference value).
【0048】なお、本パターン認識辞書作成装置は、パ
ターン認識辞書学習装置としても機能することは言うま
でもない。図2に、本発明の一実施形態に係るパターン
認識装置の基本構成を示す。It goes without saying that the present pattern recognition dictionary creation device also functions as a pattern recognition dictionary learning device. FIG. 2 shows a basic configuration of a pattern recognition device according to one embodiment of the present invention.
【0049】本パターン認識装置は、パターン入力部1
2、認識処理部16、辞書データ格納部14、認識結果
出力部18を備えている。これらパターン入力部12、
認識処理部16、辞書データ格納部14は、それぞれ、
図1のパターン入力部2、認識処理部8、辞書データ格
納部6と同様である。The present pattern recognition apparatus includes a pattern input unit 1
2, a recognition processing unit 16, a dictionary data storage unit 14, and a recognition result output unit 18. These pattern input units 12,
The recognition processing unit 16 and the dictionary data storage unit 14
This is the same as the pattern input unit 2, the recognition processing unit 8, and the dictionary data storage unit 6 in FIG.
【0050】認識結果出力部18は、認識結果を出力す
る。図2において、まず、辞書データ格納部14に、図
1のパターン認識辞書作成装置により作成もしくは改良
された辞書を格納する。The recognition result output section 18 outputs a recognition result. In FIG. 2, first, a dictionary created or improved by the pattern recognition dictionary creating apparatus of FIG. 1 is stored in the dictionary data storage unit 14.
【0051】そして、認識処理部16は、この辞書を用
いて、入力されたパターンの認識を行う。なお、図1の
構成に図2の認識結果出力部18を付加して、辞書学習
機能あるいは辞書作成機能を有するパターン認識装置を
構成してもよい。Then, the recognition processing section 16 recognizes the input pattern using the dictionary. The recognition result output unit 18 of FIG. 2 may be added to the configuration of FIG. 1 to form a pattern recognition device having a dictionary learning function or a dictionary creation function.
【0052】以下では、図1のような基本構成を有する
パターン認識辞書作成装置における、辞書学習に関する
いくつかの実施形態について説明する。なお、以下の各
実施形態において、入力パターンは図1のパターン入力
部2から入力され、認識処理は図1の認識処理部8にお
いて実行され、学習処理は図1の辞書変更部10におい
て実行され、各認識方式の認識辞書は図1の辞書データ
格納部6に格納されるものとする。In the following, several embodiments relating to dictionary learning in a pattern recognition dictionary creating apparatus having the basic configuration as shown in FIG. 1 will be described. In each of the following embodiments, an input pattern is input from the pattern input unit 2 in FIG. 1, a recognition process is performed in the recognition processing unit 8 in FIG. 1, and a learning process is performed in the dictionary change unit 10 in FIG. The recognition dictionary of each recognition method is stored in the dictionary data storage unit 6 of FIG.
【0053】(第1の実施形態)本実施形態は、複数の
認識方式を使ってそれを統合することによって1つの認
識結果を出力する認識処理において、入力パターンに対
する各認識方式における認識結果から得られる一定の基
準に従って辞書学習を行う例を示す。(First Embodiment) In the present embodiment, in a recognition process in which a plurality of recognition methods are integrated and used to output one recognition result, an input pattern is obtained from the recognition results of each recognition method in each recognition method. An example in which dictionary learning is performed according to a given standard will be described.
【0054】ここでは、複数の認識方式を用いる並列型
認識処理として、複数の認識方式によれそれぞれ得られ
た第1位候補がすべて同一でない場合すなわち複数種類
ある場合に、それらの候補のうちから多数決によって1
つを選択しこれを認識結果と決定する並列型認識処理を
用いるものとする。ただし、ここでは、最終的な認識結
果をアクセプトするために過半数の認識方式で第1位候
補となっている必要はないものとする。また、2以上の
候補カテゴリが同数の認識方式で第1位候補となった場
合には、他の基準を用いてさらに候補を絞るものとす
る。Here, as a parallel type recognition process using a plurality of recognition methods, when the first candidates obtained by the plurality of recognition methods are not all the same, that is, when there are a plurality of types, first candidates are selected from among the candidates. 1 by majority vote
It is assumed that a parallel recognition process of selecting one and determining this as a recognition result is used. However, in this case, it is assumed that it is not necessary for the majority recognition method to be the first candidate in order to accept the final recognition result. Further, when two or more candidate categories are the first candidates in the same number of recognition methods, the candidates are further narrowed down using other criteria.
【0055】本実施形態では、このような認識処理にお
いてある学習パターンに対して不正解が起こった場合
に、以下のような学習基準と学習指針に基づいて学習を
行う。本認識処理における認識方式の総数をn、n個の
認識方式のうちで第1位候補が正解であった認識方式の
数をmとする。また、全体の認識結果(ここでは不正
解)となった候補カテゴリを第1位候補とした認識方式
の数をkとする。In the present embodiment, when an incorrect answer occurs for a certain learning pattern in such recognition processing, learning is performed based on the following learning criteria and learning guidelines. It is assumed that the total number of recognition methods in this recognition processing is n, and the number of recognition methods for which the first candidate is the correct answer among the n recognition methods is m. In addition, the number of recognition methods in which the candidate category having the overall recognition result (here, an incorrect answer) is the first candidate is k.
【0056】このとき、n−m個の(第1位候補が)不
正解になった認識方式のうち、第1位候補と正解候補の
類似度の差が小さいものから順にk−m+1個の認識方
式を選択し、この選択されたk−m+1個の認識方式に
対して認識辞書学習をそれぞれ行うものとする。At this time, among the mn (first-order candidates) recognition methods in which an incorrect answer is obtained, km−m + 1 (in the order of the difference in similarity between the first-order candidate and the correct-answer candidate) in ascending order. A recognition method is selected, and recognition dictionary learning is performed for each of the selected (k−m + 1) recognition methods.
【0057】このk−m+1個の認識方式に対する各々
の認識辞書学習では、当該学習パターンに対する第1位
候補が正解となるように、学習を行う。なお、k−m+
1は、どのような条件であっても上記の多数決を確実に
逆転させて、正解候補を最終的な認識結果とすることが
できる、最も小さい値になっている。In each of the recognition dictionary learning for the (k−m + 1) recognition methods, learning is performed so that the first candidate for the learning pattern is a correct answer. Note that km-m +
1 is the smallest value that can reliably reverse the majority decision under any condition and make the correct answer candidate the final recognition result.
【0058】このようにすることにより、当該パターン
を認識するのに適した(もしくは認識しやすい)認識方
式の認識辞書のみに学習をさせ、他の認識方式について
は学習させないようにしながら、当該入力パターンに対
し正解候補が第1位候補となるように学習することが可
能になる。すなわち、このことにより、学習による弊害
を避け、統合化の良さを活かした辞書学習を実現でき
る。In this way, only the recognition dictionary of a recognition method suitable (or easy to recognize) for recognizing the pattern is trained, and learning is not performed for the other recognition methods. It becomes possible to learn so that the correct answer candidate becomes the first candidate for the pattern. In other words, this makes it possible to avoid the adverse effects of learning and realize dictionary learning utilizing the good integration.
【0059】さらに、各認識方式の辞書を学習するにあ
たって、学習する認識方式の認識結果から、例えば第1
位候補と正解候補の類似度の差によって学習の重み係数
αを変えるなどの処理を行うことができる。このとき、
類似度の差が大きい認識方式ほど大きな学習係数で学習
するのが望ましい。このようにした場合、正解認識でき
なかった認識方式のうち認識しやすい認識方式について
はゆっくりと弊害がないように、認識しにくかった認識
方式については半ば強制的にそのパターンを認識させる
ことができる。Further, when learning the dictionary of each recognition method, for example, the first result is obtained from the recognition result of the recognition method to be learned.
Processing such as changing the learning weighting coefficient α can be performed based on the difference in the similarity between the position candidate and the correct answer candidate. At this time,
It is desirable that a recognition method having a larger similarity difference learns with a larger learning coefficient. In this case, the recognition method that is difficult to recognize can be forcibly recognized halfway for the recognition method that is difficult to recognize, so that the recognition method that is easy to recognize among the recognition methods that cannot be correctly recognized has no adverse effect slowly. .
【0060】図3に、本実施形態における学習アルゴリ
ズムの一例を示す。まず、ある学習パターンを入力し
(ステップS1)、入力されたこの学習パターンに対し
て複数の認識方式でそれぞれ認識処理を行い、各認識方
式における認識結果に基づいて最終的な認識結果(認識
カテゴリ)を得る(ステップS2)。FIG. 3 shows an example of a learning algorithm in the present embodiment. First, a certain learning pattern is input (step S1), recognition processing is performed on the input learning pattern by a plurality of recognition methods, and a final recognition result (recognition category ) Is obtained (step S2).
【0061】この認識カテゴリが正解である場合(ステ
ップS3)、次のパターンがあれば次の学習に移り、全
パターンについて学習が済めば、処理を終了する(ステ
ップS4)。If the recognition category is correct (step S3), the process proceeds to the next learning if there is a next pattern, and the process is completed if all the patterns have been learned (step S4).
【0062】一方、ステップS2で得た認識結果が不正
解である場合(ステップS3)、第1位候補が正解とな
っている認識方式の数mと、上記の最終的な認識結果が
第1位候補となっている認識方式の数kを求める(ステ
ップS5,S6)。On the other hand, if the recognition result obtained in step S2 is incorrect (step S3), the number m of recognition methods in which the first candidate is correct and the final recognition result are the first The number k of recognition methods that are rank candidates is obtained (steps S5 and S6).
【0063】次に、第1位候補が不正解であった認識方
式のうち、第1位候補と正解候補の類似度の差が小さい
認識方式をk−m+1個ピックアップする(ステップS
7)。このk−m+1の認識方式をS1 ,…,S
(k-m)+1 とする。Next, among the recognition methods in which the first candidate was incorrect, km-m + 1 pickup methods having a small difference in similarity between the first candidate and the correct candidate are picked up (step S).
7). This km−m + 1 recognition method is represented by S 1 ,.
(km) +1 .
【0064】次に、認識方式S1 ,…,S(k-m)+1 に対
してそれぞれ、入力パターンの辞書学習を行う(ステッ
プS8)。これで1つの学習パターンに対する学習が行
われたことになる。Next, dictionary learning of an input pattern is performed for each of the recognition methods S 1 ,..., S (km) +1 (step S 8). This means that learning for one learning pattern has been performed.
【0065】さらに、次のパターンがあれば次の学習に
移り、全パターンについて学習が済めば、処理を終了す
る(ステップS9)。なお、前述したように、図3の手
順を1ラウンドとして、複数ラウンドの学習処理を行う
ようにしてもよい。また、予め規定したラウンド回数を
上限として、当該並列型認識処理全体としての正読率等
が一定基準を満たすようになるまで処理を行うようにし
てもよい。Further, if there is the next pattern, the process proceeds to the next learning, and if the learning is completed for all the patterns, the process ends (step S9). As described above, the learning process of a plurality of rounds may be performed with the procedure of FIG. 3 as one round. Further, the processing may be performed with the number of rounds defined in advance as an upper limit until the correct reading rate or the like as the whole parallel type recognition processing satisfies a certain standard.
【0066】ところで、上記では、(第1位候補が)不
正解になったn−m個の認識方式のうち、第1位候補と
正解候補の類似度の差が小さいものから順にk−m+1
個の認識方式を選択したが、選択する個数としてもう少
し大きい数あるいはもう少し小さい数を用いても構わな
い。By the way, in the above description, among the nm recognition methods (in which the first candidate is the wrong answer), km−m + 1 are sequentially selected from the one having the smallest similarity difference between the first candidate and the correct candidate.
Although the number of recognition methods is selected, a slightly larger number or a slightly smaller number may be used as the number to be selected.
【0067】また、認識結果をアクセプトするために過
半数の認識方式で第1位候補となっている必要があるよ
うな並列型認識処理の場合には、(第1位候補が)不正
解になったn−m個の認識方式のうち、第1位候補と正
解候補の類似度の差が小さいものから順に[n/2]+
1−m個の認識方式を選択するようにしてもよい。ここ
で、[x]はxの整数部を表すものとする。Further, in the case of the parallel recognition processing in which the majority of the recognition methods need to be the first candidate in order to accept the recognition result, the (first candidate) becomes incorrect. [N / 2] + in the order of the difference in similarity between the first candidate and the correct candidate among the nm recognition methods.
You may make it select 1-m recognition methods. Here, [x] represents an integer part of x.
【0068】また、上記では多数決による認識処理につ
いて示したが、多数決による認識処理以外の並列型認識
処理の場合にも、複数の認識方式の統合のさせ方に応じ
て、学習すべき認識方式を選択するようすることが可能
である。Although the recognition processing based on majority decision has been described above, in the case of parallel recognition processing other than the recognition processing based on majority decision, the recognition method to be learned is determined in accordance with how to integrate a plurality of recognition methods. It is possible to choose.
【0069】なお、上記の説明では、第1位候補と正解
候補の類似度の差が小さいものから順に学習すべき認識
方式を選択したが、第1位候補の確信度が小さいものか
ら順に認識方式を選択するようにしてもよい。また、正
解候補の確信度を求める手段を持つ場合には、正解候補
の確信度の高いものから順に認識方式を選択するように
してもよい。In the above description, the recognition method to be learned is selected in order from the one with the smallest similarity difference between the first candidate and the correct answer candidate. A method may be selected. In the case where there is a means for obtaining the certainty factor of the correct answer candidate, the recognition method may be selected in order from the one with the highest certainty factor of the correct answer candidate.
【0070】(第2の実施形態)本実施形態では、各認
識方式の認識率を基に定められた順番に認識する統合化
方式に本発明を適用する場合について説明する。(Second Embodiment) In the present embodiment, a case will be described in which the present invention is applied to an integrated system that performs recognition in a predetermined order based on the recognition rates of the respective recognition systems.
【0071】図4に、統合化方式のアルゴリズムの一例
を示す。図4に示す統合化方式ではN個の認識方式を直
列に統合化する処理を考えている。FIG. 4 shows an example of the algorithm of the integration system. In the integration method shown in FIG. 4, a process of integrating N recognition methods in series is considered.
【0072】パターンが入力されると(ステップS1
1)、第1の認識方式で認識処理し(ステップS12,
S13)、その認識結果(第1位候補)から認識結果の
確信度を求め、求められた確信度が予め定められた基準
以上か否かを判定する(ステップS14)。When a pattern is input (step S1)
1), performing recognition processing using the first recognition method (step S12,
S13), the degree of certainty of the recognition result is obtained from the recognition result (the first candidate), and it is determined whether or not the obtained degree of certainty is equal to or higher than a predetermined reference (step S14).
【0073】確信度が上記条件を満たすと判定された場
合(ステップS14)、その認識結果を全体の認識結果
としてアクセプトし、出力する(ステップS15)。確
信度が上記条件を満たさないと判定された場合(ステッ
プS14)、次の第2の認識方式による認識処理を行い
(ステップS16,S17,S13)、その認識結果か
ら認識結果の確信度を求め、その確信度が予め定められ
た基準以上か否かを判定する(ステップS14)。If it is determined that the certainty satisfies the above condition (step S14), the recognition result is accepted and output as the whole recognition result (step S15). If it is determined that the certainty does not satisfy the above condition (step S14), a recognition process using the following second recognition method is performed (steps S16, S17, S13), and the certainty of the recognition result is obtained from the recognition result. Then, it is determined whether or not the certainty factor is equal to or higher than a predetermined reference (step S14).
【0074】もし、ここで上記条件が満たされれば(ス
テップS14)、その結果を全体の認識結果としてアク
セプトし、出力する(ステップS15)。出力された認
識結果は正解の場合と不正解の場合がある。If the above condition is satisfied here (step S14), the result is accepted and output as the overall recognition result (step S15). The output recognition result may be correct or incorrect.
【0075】もし、ここでも上記条件が満たされなけれ
ば、第3の認識方式以降について同様の処理を繰り返し
行い、最終の認識方式である第Nの認識方式でも認識さ
れない場合には(ステップS14,S16,S17)、
認識結果をリジェクトする(ステップS18)。If the above conditions are not satisfied, the same processing is repeated for the third and subsequent recognition methods. If the Nth recognition method as the final recognition method is not recognized (step S14, S16, S17),
The recognition result is rejected (step S18).
【0076】ここで、認識結果から確信度を求める方法
としては、種々の方法があるが、例えば認識カテゴリ毎
の事前確率を用いる方法がある。これは、各カテゴリご
との正読率をあらかじめシミュレーションで算出してお
き、その正読率を確信度として利用するというものであ
る。また、他にもより信頼性の高い確信度の計算方法が
あり、例えば特開平9−153113号公報などに詳し
く開示されている。Here, there are various methods for obtaining the degree of certainty from the recognition result. For example, there is a method using a prior probability for each recognition category. In this method, the correct reading rate for each category is calculated in advance by simulation, and the correct reading rate is used as a certainty factor. In addition, there is another more reliable calculation method of the certainty factor, which is disclosed in detail in, for example, Japanese Patent Application Laid-Open No. 9-153113.
【0077】さて、図4に示したような統合化方式の本
質的な特徴すなわち(a)最初にアクセプトとなった認
識方式の第1位候補が正解ならば認識処理全体の結果が
正解となり、不正解ならば認識処理全体の結果が不正解
となる(言い換えると、最初にアクセプトとなった認識
方式より前のすべての認識方式の結果はリジェクト(第
1位候補の確信度が基準に達していない)であり、最初
にアクセプトとなった認識方式より後のすべての認識方
式は実行されない)、(b)すべての認識方式において
リジェクトとなった場合にかぎり、認識処理全体の結果
がリジェクトとなる、を考慮すると、本統合化方式にお
ける不正解パターンやリジェクトパターンに対する辞書
学習としては、次に示すようにいくつかの基本的なもの
が考えられる。 (1)途中の認識方式でアクセプトされ、不正解となっ
たパターンを、その認識方式で正解もしくはリジェクト
にするように学習すること。 (2)途中の認識方式でアクセプトされ、不正解となっ
たパターンをそれ以前に正しく認識していた認識方式に
おいて基準以上の確信度を与えるように学習すること。 (3)最終的に(すなわち全ての認識方式で)リジェク
トされてしまったパターンをそのパターンを正しく認識
していた認識方式において基準以上の確信度が与えられ
るように学習すること。Now, the essential feature of the integration method as shown in FIG. 4, namely, (a) if the first candidate of the recognition method which is initially accepted is the correct answer, the result of the entire recognition processing becomes the correct answer. If the answer is incorrect, the result of the entire recognition process is incorrect (in other words, the results of all the recognition methods before the recognition method that was initially accepted are rejected (the certainty factor of the first candidate has reached the standard). And no recognition method after the first recognition method is executed), and (b) the result of the entire recognition process is rejected only when all the recognition methods are rejected. In consideration of the above, some basic dictionary learning can be considered as a dictionary learning for an incorrect answer pattern and a reject pattern in the present integrated system. (1) To learn to accept or reject a pattern that has been accepted by an intermediate recognition method and becomes incorrect, using the recognition method. (2) Learning to give a certain level of certainty higher than the standard in a recognition method that has correctly recognized a pattern that has been accepted and incorrectly accepted by an intermediate recognition method. (3) To learn a pattern that is finally rejected (that is, in all the recognition methods) so that the recognition method that has correctly recognized the pattern provides a certainty factor that is higher than a reference.
【0078】このような考え方に基づいた種々の学習ア
ルゴリズムが考えられる。図5に、本実施形態における
学習アルゴリズムの一例を示す。このアルゴリズムは入
力パターンに対して図4の統合化方式を用いた認識処理
を行い、その結果が不正解もしくはリジェクトであった
場合に、後に例示するような学習基準と学習指針に基づ
いて学習を行うものである。Various learning algorithms based on such a concept can be considered. FIG. 5 shows an example of a learning algorithm in the present embodiment. This algorithm performs recognition processing on the input pattern using the integrated method of FIG. 4, and if the result is incorrect or rejected, the learning is performed based on learning criteria and learning guidelines as exemplified later. Is what you do.
【0079】まず、ある学習パターンを入力し(ステッ
プS21)、入力されたこの学習パターンに対して図4
の統合化方式で認識処理を行う(ステップS22)。こ
の認識結果が正解である場合(ステップS23)、次の
パターンがあれば次の学習に移り、全パターンについて
学習が済めば、処理を終了する(ステップS24)。First, a certain learning pattern is inputted (step S21).
(Step S22). If the recognition result is a correct answer (step S23), if there is a next pattern, the process proceeds to the next learning, and if learning is completed for all the patterns, the process ends (step S24).
【0080】ステップS22で得た認識結果がリジェク
トである場合(ステップS23,S25)、リジェクト
パターンの学習を行い(ステップS26)、不正解であ
る場合(ステップS23,S25)、不正解パターンの
学習を行う(ステップS27)。If the recognition result obtained in step S22 is a reject (steps S23 and S25), learning of a reject pattern is performed (step S26). If the recognition result is incorrect (steps S23 and S25), learning of an incorrect answer pattern is performed. Is performed (step S27).
【0081】これで1つの学習パターンに対する1回の
学習が行われたことになる。さらに、次のパターンがあ
れば次の学習に移り、全パターンについて学習が済め
ば、処理を終了する(ステップS28)。This means that one learning for one learning pattern has been performed. Further, if there is the next pattern, the process proceeds to the next learning, and if the learning is completed for all the patterns, the process is terminated (step S28).
【0082】なお、前述したように、図5の手順を1ラ
ウンドとして、複数ラウンドの学習処理を行うようにし
てもよい。また、予め規定したラウンド回数を上限とし
て、当該直列型認識処理全体としての正読率等が一定基
準を満たすようになるまで処理を行うようにしてもよ
い。As described above, the learning process of a plurality of rounds may be performed with the procedure of FIG. 5 as one round. Further, the processing may be performed with the number of rounds defined in advance as an upper limit until the correct reading rate or the like as the whole serial type recognition processing satisfies a certain standard.
【0083】次に、図6に、リジェクトパターンの辞書
学習処理のアルゴリズムの一例を示す。図4の統合化方
式によればリジェクトパターンはN種類の認識方式全て
においてリジェクトになったパターンである。そこで、
この処理手順では、いずれかの認識方式で正解候補がア
クセプトされるように学習する。FIG. 6 shows an example of an algorithm of a dictionary learning process of a reject pattern. According to the integrated system of FIG. 4, the reject pattern is a pattern that has been rejected in all N types of recognition systems. Therefore,
In this processing procedure, learning is performed so that the correct answer candidate is accepted by any of the recognition methods.
【0084】まず、N種類の認識方式のうちで第1位候
補が正解となっているものがあれば(ステップS3
1)、そのうち確信度が最も高い認識方式の辞書を学習
する(ステップS33)。このように最も確信度の高い
認識方式の辞書を学習させることにより、辞書学習によ
る弊害を極力減らし、未知のパターンに強い辞書学習が
実現される。First, among the N types of recognition methods, if the first candidate has a correct answer (step S3).
1) The dictionary of the recognition method having the highest certainty is learned (step S33). By learning the dictionary of the recognition method with the highest certainty in this way, the adverse effects of dictionary learning are reduced as much as possible, and dictionary learning that is strong against unknown patterns is realized.
【0085】また、同様の趣旨で、第1位候補が正解と
なっている認識方式が存在しない場合、正解候補が最も
上位に来ている認識方式の辞書学習を行う(ステップS
31,S32)。このような認識方式が2つ以上あった
場合は第1位候補の確信度が最も小さい認識方式の辞書
を学習する。Further, for the same purpose, if there is no recognition method in which the first candidate is the correct answer, dictionary learning is performed for the recognition method in which the correct candidate comes first (step S).
31, S32). If there are two or more such recognition methods, the dictionary of the recognition method with the smallest certainty factor of the first candidate is learned.
【0086】もちろん、第1位候補が正解となる認識方
式が存在しない場合において、正解候補の確信度を計算
できるならば、上記の代わりに正解候補の確信度を用い
ることにより(例えば正解候補の確信度が最も大きい認
識方式を選択する)、図6の候補順位による学習辞書決
定方法よりも安定的で普遍的な辞書学習を実現すること
ができる。Of course, if there is no recognition method in which the first candidate is a correct answer, if the certainty of the correct candidate can be calculated, the certainty of the correct candidate is used instead of the above (for example, The recognition method having the highest certainty is selected), and a more stable and universal dictionary learning can be realized than the learning dictionary determination method based on the candidate ranking in FIG.
【0087】次に、図7に、認識結果が不正解であった
場合の辞書学習アルゴリズムの一例を示す。ここでは、
第i方式でアクセプトされ不正解となったものとする。Next, FIG. 7 shows an example of a dictionary learning algorithm when the recognition result is incorrect. here,
It is assumed that it is accepted by the i-th method and becomes incorrect.
【0088】i=1の場合、他に選択肢はなく第1番目
の認識方式の辞書を学習して、処理を終了する(ステッ
プS41,S42)。そうでない場合は、2つの辞書を
学習する。この2つの辞書は、アクセプトされた第1位
候補が不正解となった第i番目の認識方式の辞書と、第
1番目〜第i−1番目までの認識方式のなかで最も当該
パターンを認識できそうな認識方式の辞書である。前者
は当該パターンを少なくともリジェクト(うまくすれば
正解)させるための学習で、後者は当該パターンを正解
させるためのものである。If i = 1, there is no other option, the dictionary of the first recognition method is learned, and the process is terminated (steps S41 and S42). Otherwise, learn two dictionaries. The two dictionaries are the i-th recognition method dictionary in which the accepted first-rank candidate is incorrect, and the most recognizable pattern in the first to (i-1) -th recognition methods. It is a dictionary of a recognition method that can be done. The former is for learning at least to reject (correctly correct) the pattern, and the latter is for learning the pattern correctly.
【0089】あるパターンを少なくともリジェクト(う
まくすれば正解)させるように学習するためには、例え
ば、学習の重み係数αを小さくして学習する方法があ
る。この場合、誤読パターンをすぐに正解にすることは
できないが、ゆっくりと弊害がないように学習させるこ
とができる。In order to perform learning so as to reject a certain pattern at least (correctly if it is successful), for example, there is a method in which the learning is performed by reducing the learning weight coefficient α. In this case, the erroneous reading pattern cannot be immediately converted to the correct answer, but the learning can be slowly performed without any adverse effect.
【0090】まず、第i番目の認識方式の辞書を学習す
る(ステップS41)。これは不正解をリジェクトもし
くは正解にするためである。さらに、第1番目〜第i−
1番目までの認識方式のうち第1位候補が正解となって
いる認識方式のうち最も確信度が高い認識方式の辞書を
学習する(ステップS42〜S44)。First, the dictionary of the i-th recognition method is learned (step S41). This is to reject or correct incorrect answers. Furthermore, the first to i-th
The dictionary of the recognition method having the highest certainty among the recognition methods for which the first candidate is the correct answer among the first recognition methods is learned (steps S42 to S44).
【0091】また、第1位候補が正解となっている認識
方式がない場合は、正解候補が最も上位に来ている認識
方式の辞書を学習する(ステップS42,S43,S4
5)。このとき正解候補が最も上位に来ている認識方式
が複数あった場合には、第1位候補の確信度が最も小さ
い認識方式の辞書を学習する。この学習の趣旨はリジェ
クトパターンの学習の趣旨と同様である。If there is no recognition method in which the first candidate is correct, the dictionary of the recognition method in which the correct candidate comes first is learned (steps S42, S43, S4).
5). At this time, when there are a plurality of recognition methods in which the correct candidate comes at the top, the dictionary of the recognition method with the smallest certainty of the first candidate is learned. The purpose of this learning is the same as the purpose of learning the reject pattern.
【0092】もちろん、前述と同様に、第1位候補が正
解となる認識方式が存在しない場合において、正解候補
の確信度を計算できるならば、上記の代わりに正解候補
の確信度を用いることにより(例えば正解候補の確信度
が最も大きい認識方式を選択する)、図7の候補順位に
よる学習辞書決定方法よりも安定的で普遍的な辞書学習
を実現することができる。Of course, as described above, if there is no recognition method in which the first candidate is the correct answer, and if the certainty of the correct candidate can be calculated, the certainty of the correct candidate is used instead of the above. (For example, a recognition method having the highest certainty of the correct answer candidate is selected), and more stable and universal dictionary learning can be realized than the learning dictionary determination method based on the candidate order of FIG.
【0093】なお、不正解パターンの学習の結果、全て
の認識方式でリジェクトになる場合があるが、このよう
な場合にも、その後、例えば異なるパターンで図4の学
習が実行された結果、いずれかの認識方式で正解がアク
セプトになることもある。たとえそうでなくても、また
同じパターンで図5の学習を再度実行すれば、リジェク
トパターンの学習を行うことができる。Note that as a result of learning an incorrect answer pattern, rejection may occur in all recognition methods. Even in such a case, for example, the result of the learning shown in FIG. The correct answer may be accepted by such a recognition method. Even if this is not the case, if the learning of FIG. 5 is executed again with the same pattern, the reject pattern can be learned.
【0094】次に、図8に、認識結果が不正解であった
場合の辞書学習アルゴリズムの他の例を示す。上記した
不正解パターンの学習アルゴリズムでは、入力パターン
に関して2つの辞書(ただし、i=1の場合のみ1つの
辞書)に学習を行ったが、1つの辞書のみ学習する方式
で不正解パターンの学習を行うこともできる。このよう
にすることによって、特に曖昧性の高いパターンなどを
学習する際、学習による悪影響を最小限にして当該パタ
ーンを正しく認識できる認識系を構成することができ
る。Next, FIG. 8 shows another example of the dictionary learning algorithm when the recognition result is incorrect. In the learning algorithm of the incorrect pattern described above, learning of the input pattern is performed in two dictionaries (one dictionary only when i = 1), but learning of the incorrect pattern is performed by a method of learning only one dictionary. You can do it too. By doing so, it is possible to configure a recognition system capable of correctly recognizing a pattern, particularly when learning a highly ambiguous pattern or the like, while minimizing the adverse effect of the learning.
【0095】図8に示されるように、まず、第1番目の
認識方式で不正解となった場合は、第1番目の認識方式
の辞書を学習して、処理を終了する(ステップS51,
S52)。As shown in FIG. 8, first, when the answer is incorrect in the first recognition method, the dictionary of the first recognition method is learned, and the processing is terminated (step S51,
S52).
【0096】そうでない場合は(ステップS51,S5
3)、不正解となった認識方式が第i番目の認識方式で
あるとすると、第1番目〜第i−1番目までの認識方式
のうちに正解を第1位候補とする認識方式があるならば
(ステップS55)、それらの認識方式のうち最も確信
度が高い認識方式の辞書を学習させる(ステップS5
6)。これは本実施形態の統合化方式の性質上、第i番
目の認識方式で不正解となった場合にはそれ以前の認識
方式(第1番目〜第i−1番目までの認識方式)ではリ
ジェクトになっていることによる。If not (steps S51, S5
3) Assuming that the incorrectly recognized recognition method is the i-th recognition method, there is a recognition method in which the correct answer is the first candidate among the first to (i-1) -th recognition methods. If it is (step S55), the dictionary of the recognition method having the highest certainty among those recognition methods is learned (step S5).
6). This is because, due to the nature of the integrated system of the present embodiment, if an incorrect answer is obtained in the i-th recognition system, the previous recognition system (the first to (i-1) -th recognition systems) will be rejected. It is due to becoming.
【0097】正解を第1位候補としているのにリジェク
トになっている認識方式があれば、その認識方式に当該
パターンを学習させ、正解としてアクセプトさせるよう
にするのが学習による弊害を少なくするという観点で最
適と考えられる。If there is a rejected recognition method while the correct answer is the first candidate, letting the recognition method learn the pattern and accepting it as the correct answer reduces the adverse effects of the learning. Considered optimal from a viewpoint.
【0098】また、第1番目〜第i番目までの認識方式
のうちに正解を第1位候補とする認識方式がない場合に
は(ステップS53)、第i番目の認識方式の辞書に学
習を行い、当該パターンを少なくともリジェクトさせる
方向で学習し(ステップS54)、正解認識は第i+1
番目以降の認識方式にまかせるようにする。If there is no recognition method in which the correct answer is the first candidate among the first to i-th recognition methods (step S53), learning is performed in the dictionary of the i-th recognition method. Then, the pattern is learned at least in a direction to reject the pattern (step S54), and the correct answer recognition is the (i + 1) th.
Leave it to the third and subsequent recognition methods.
【0099】(第3の実施形態)本実施形態は、第2の
実施形態と同じN種類の認識方式の統合化方式における
辞書学習に関するものである。(Third Embodiment) The present embodiment relates to dictionary learning in an integrated system of N kinds of recognition systems as in the second embodiment.
【0100】本実施形態は、不正解の場合の学習アルゴ
リズムのみ第2の実施形態と相違し、他の部分は同様で
あるので、以下では、この相違点についてのみ説明す
る。さて、第2の実施形態における不正解の場合の学習
では、統合化方式によって第1番目〜第i番目までの認
識方式だけで認識処理することとなり、第i+1番目以
降の認識方式については考慮されなかったが、本実施形
態は、第i番目の認識方式で不正解パターンとなった場
合にも第i+1番目以降の認識方式をも考慮するように
したものである。This embodiment differs from the second embodiment only in the learning algorithm in the case of an incorrect answer, and the other parts are the same. Therefore, only the difference will be described below. By the way, in the learning in the case of an incorrect answer in the second embodiment, the recognition processing is performed only by the first to ith recognition methods by the integrated method, and the (i + 1) th and subsequent recognition methods are considered. However, in the present embodiment, even when an incorrect answer pattern is obtained in the i-th recognition method, the i + 1-th and subsequent recognition methods are also considered.
【0101】図9に、本実施形態における不正解パター
ンの辞書学習処理のアルゴリズムの一例を示す。まず、
第1番目の認識方式で不正解となったかどうかを判定す
る(ステップS61)。FIG. 9 shows an example of an algorithm of a dictionary learning process of an incorrect answer pattern in the present embodiment. First,
It is determined whether or not the answer is incorrect in the first recognition method (step S61).
【0102】第1番目の認識方式で不正解となっていた
場合は、無条件で第1番目の認識方式の辞書を学習し、
処理を終了する(ステップS62)。そうでない場合、
第1番目〜第i−1番目までの認識方式のうち正解を第
1位候補としているものがあるか否かチェックする(ス
テップS63)。もし、そのような認識方式が存在すれ
ば、それらのうちで最も確信度の高い認識方式を見出し
その辞書を学習する(ステップS64,S65)。If the answer is incorrect in the first recognition method, the dictionary of the first recognition method is learned unconditionally,
The process ends (step S62). If not,
It is checked whether any of the first to (i-1) -th recognition methods has the correct answer as the first candidate (step S63). If there is such a recognition method, a recognition method having the highest certainty is found among them, and the dictionary is learned (steps S64 and S65).
【0103】ここでは、統合化方式の性質上、不正解と
なる認識方式(ここでは第i番目の認識方式)の認識処
理に入る以前で、正解を第1位候補とする認識方式をア
クセプトしてしまえば、当該パターンは正解となるの
で、このようなアルゴリズムをとっている。Here, due to the nature of the integration method, a recognition method in which the correct answer is the first candidate is accepted before the recognition processing of a recognition method which is incorrect (here, the i-th recognition method) is started. If this is the case, the pattern will be the correct answer, so this algorithm is used.
【0104】実際、不正解となる認識方式は正解を第1
位候補にしていないことから、当該パターンを認識する
のに不向きであると考えられる。そこで、そのような認
識方式以前の序列の認識方式のうちで最も認識しやすい
認識方式に先に認識させてしまおうとするものである。[0104] In practice, the recognition method that is incorrect is that the correct answer is the first.
Since it is not a position candidate, it is considered that it is not suitable for recognizing the pattern. Therefore, an attempt is made to first recognize the most easily recognizable recognition method among the recognition methods in the hierarchy before such a recognition method.
【0105】もっとも、たとえ正解が第1位候補になっ
ていなくとも、正解候補の確信度が高く、学習の効果が
現れやすい場合もある。このような場合のために、第1
番目〜第i番目までの認識方式のうちから学習すべき辞
書を選ぶ指針を、正解候補の確信度の最も高いものとす
ることもできる。However, even if the correct answer is not the first candidate, there is a case where the certainty of the correct answer is high and the effect of the learning is likely to appear. For such a case, the first
The guideline for selecting a dictionary to be learned from the recognition methods from the i-th to the i-th recognition method may be the one with the highest certainty of the correct answer candidate.
【0106】次に、第1番目〜第i−1番目までの認識
方式のうちに正解を第1位候補とするものがない場合
(ステップS63)、i=Nであれば第N番目の認識方
式の辞書を学習し、処理を終了する(ステップS66,
S67)。Next, if no correct answer is the first candidate among the first to (i-1) -th recognition methods (step S63), if i = N, the N-th recognition method is used. The system dictionary is learned, and the process is terminated (step S66,
S67).
【0107】なお、図9のフローチャートには示されて
いないが、ここでも第N番目の認識方式を除くN−1種
類の認識方式のうちで正解候補の確信度が最も高い認識
方式の辞書をも併せて学習するようにしてもよい。Although not shown in the flowchart of FIG. 9, the dictionary of the recognition method with the highest certainty of the correct answer candidate among the N-1 types of recognition methods except the N-th recognition method is also used here. May also be learned together.
【0108】次に、ステップS66においてi<Nであ
れば、第i+1番目〜第N番目の認識方式までの認識処
理を行い(ステップS68)、第i+1番目〜第N番目
の認識方式のうちで正解を第1位候補としている認識方
式があるかをチェックし、そのような認識方式がある場
合には(ステップS69)、それらのうちで最も確信度
の高い認識方式(第j番目の認識方式とする)を見出し
(ステップS71)、第i番目の認識方式の辞書および
第j番目の認識方式の辞書をそれぞれ学習する(ステッ
プS72)。Next, if i <N in step S66, the recognition processing from the (i + 1) th to the Nth recognition method is performed (step S68), and among the (i + 1) th to the Nth recognition methods, It is checked whether there is a recognition method that has the correct answer as the first candidate, and if there is such a recognition method (step S69), the recognition method with the highest certainty among them (the j-th recognition method) ) Is learned (step S71), and the dictionary of the i-th recognition method and the dictionary of the j-th recognition method are learned (step S72).
【0109】これは、まず不正解となってしまった第i
番目の認識方式の辞書を学習して、当該パターンを少な
くともリジェクトにし、それ以降の序列の認識方式で正
解にできるように、最も正解しやすい認識方式を上記の
確信度から判断する方法で探し求め、求められたその第
j番目の認識方式の辞書に(正解候補がアクセプトされ
るように)学習させるものである。[0109] This is because the i-th
Learning the dictionary of the second recognition method, at least rejecting the pattern, and searching for the most easily correct recognition method by the method of judging from the above-mentioned certainty factor so as to be able to obtain the correct answer by the recognition method of the subsequent rank, The obtained dictionary of the j-th recognition method is learned (so that correct candidates are accepted).
【0110】もっとも、ここで選ばれた第j番目の認識
方式が、学習しなくとも既に当該パターンをアクセプト
するような方式であれば学習するには及ばない。したが
って、当該認識方式が正解候補をアクセプトするか否か
のチェックを学習に先だって(例えばステップS69に
おいて)行い、当該認識方式が正解候補をアクセプトす
ると判断された場合には、ステップ72において第i番
目の認識方式の辞書についてのみ学習するようにしても
よい。However, if the j-th recognition method selected here is a method that already accepts the pattern without learning, it does not extend to learning. Therefore, a check as to whether or not the recognition method accepts the correct answer candidate is performed prior to the learning (for example, in step S69), and if it is determined that the recognition method accepts the correct answer candidate, the i-th determination is made in step 72. The learning may be performed only for the dictionary of the recognition method.
【0111】次に、ステップS69において第i+1番
目〜第N番目までの認識方式のうちに正解を第1位候補
とする認識方式がない場合、不正解となった第i番目の
認識方式のみを学習する(ステップS70)。この場合
にも、前述と同様に、第1番目〜第i−1番目までの認
識方式のうち正解候補の確信度が最大の認識方式の辞書
も併せて学習するようにしてもよい。Next, in step S69, if there is no recognition method in which the correct answer is the first candidate among the (i + 1) -th to N-th recognition methods, only the i-th recognition method which is incorrect is used. Learning is performed (step S70). Also in this case, similarly to the above, the dictionary of the recognition method in which the certainty of the correct answer candidate is the maximum among the first to (i-1) -th recognition methods may also be learned.
【0112】(第4の実施形態)本実施形態は、第2の
実施形態および第3の実施形態と同様の統合化方式を用
い、さらに統合化方式に依存した学習方法を提供するも
のである。(Fourth Embodiment) The present embodiment provides a learning method that uses the same integration method as the second and third embodiments and further depends on the integration method. .
【0113】本実施形態は、不正解の場合の学習アルゴ
リズムのみ第2および第3の実施形態と相違し、他の部
分は同様であるので、以下では、この相違点についての
み説明する。This embodiment is different from the second and third embodiments only in the learning algorithm in the case of an incorrect answer, and the other parts are the same. Therefore, only the difference will be described below.
【0114】図10に、本実施形態における不正解パタ
ーンの辞書学習処理のアルゴリズムの一例を示す。本実
施形態の処理手順は、第3の実施形態の処理手順におい
て、第1番目〜第i−1番目までの認識方式のうちに正
解を第1位候補としているものがない場合(図9のステ
ップS63)で、かつ、不正解となった認識方式が最後
の序列の認識方式でない(すなわちi<Nである)場合
(図9のステップS63)の処理内容のみが相違してい
る。FIG. 10 shows an example of an algorithm of a dictionary learning process for an incorrect answer pattern in the present embodiment. The processing procedure of the present embodiment is the same as the processing procedure of the third embodiment, except that the correct answer is not the first candidate among the first to (i-1) -th recognition methods (see FIG. 9). Only the processing content in the case where the incorrectly recognized recognition method is not the last recognition method in step S63) (that is, i <N) (step S63 in FIG. 9) is different.
【0115】すなわち、本実施形態は、上記の場合にお
いて、第i番目の認識方式(不正解となった認識方式)
での認識結果をリジェクトにする方針で学習させ、さら
に第i+1番目以降の認識処理において統合化のアルゴ
リズムにそって正解をアクセプトさせる方針で学習する
ようにしたものである。That is, in the present embodiment, in the above case, the i-th recognition method (an incorrectly recognized recognition method)
The learning is performed with the policy of rejecting the recognition result in step (i), and the learning is performed with the policy of accepting the correct answer in accordance with the integration algorithm in the (i + 1) th and subsequent recognition processes.
【0116】図10のステップS81〜S87は、図9
のステップS61〜S67とそれぞれ同じであるので、
以下では、図10のステップS86でNOとなった場
合、すなわちステップS88〜S97の処理についての
み説明する。Steps S81 to S87 in FIG.
Are the same as steps S61 to S67, respectively.
Hereinafter, only the case where the determination in step S86 of FIG. 10 is NO, that is, the processing of steps S88 to S97 will be described.
【0117】ステップS86でNOとなった場合、ま
ず、第i番目の認識方式の認識辞書を学習する(ステッ
プS88)。続いて、j=i+1とし(ステップS8
9)、第j番目の認識方式による認識を実行し、その認
識結果を求める(ステップS90)。When the answer to the determination of step S86 is NO, the recognition dictionary of the i-th recognition method is first learned (step S88). Subsequently, j = i + 1 is set (step S8).
9) Recognition by the j-th recognition method is performed, and the recognition result is obtained (step S90).
【0118】この結果がリジェクトであれば(ステップ
S91)、第1位候補が正解かどうかをチェックし(ス
テップS92)、正解であれば第j番目の認識方式の辞
書を学習し(ステップS93)、処理を終了する。If the result is reject (step S91), it is checked whether the first candidate is the correct answer (step S92). If the answer is correct, the dictionary of the j-th recognition method is learned (step S93). , And the process ends.
【0119】ステップS92において正解でなければ、
この認識方式の第1位候補は不正解であるから、学習せ
ずに、jをj=j+1により更新し(ステップS9
6)、次の認識方式に移る。If the answer is not correct in step S92,
Since the first candidate in this recognition method is incorrect, j is updated by j = j + 1 without learning (step S9).
6), proceed to the next recognition method.
【0120】また、ステップS91において、リジェク
トでなければ(すなわちアクセプトであれば)、第1位
候補が正解かどうかをチェックし(ステップS94)、
正解であれば、学習するまでもなく当該認識方式で認識
できるので、この第j番目の認識方式の辞書は学習せず
に処理を終了する。In step S91, if it is not reject (ie, if it is accept), it is checked whether the first candidate is correct (step S94).
If the answer is correct, it can be recognized by the recognition method without learning, and the process ends without learning the dictionary of the j-th recognition method.
【0121】しかし、アクセプトされた第1位候補が不
正解の場合、先の第i番目の認識方式の辞書の学習の結
果、そこでリジェクトされるようになっても、この第j
番目の認識方式で誤認識が起こるので、この認識方式の
辞書を少なくともリジェクトになるように学習する(ス
テップS95)。そして、jをj=j+1により更新し
(ステップS96)、次の認識方式に移る。However, in the case where the accepted first candidate is incorrect, the j-th candidate is rejected as a result of learning the dictionary of the i-th recognition method.
Since erroneous recognition occurs in the second recognition method, the dictionary of this recognition method is learned so as to be at least rejected (step S95). Then, j is updated by j = j + 1 (step S96), and the process proceeds to the next recognition method.
【0122】以上のループ処理を、上記のステップS9
3の後にまたはステップS94でYESとなって終了す
るか、ステップS97でj>Nとなるまで、jを1ずつ
増やしながら、繰り返し実行する。The above loop processing is performed in step S9.
After 3 or until the determination is YES in step S94 and the processing ends, or until j> N in step S97, the processing is repeatedly executed while j is incremented by one.
【0123】(第5の実施形態)本実施形態は、複数の
認識方式を用いる直列型認識処理の例として、1つ前の
認識方式のいくつかの上位候補のみを、次の認識方式に
おける認識対象カテゴリとするような統合化方式に本発
明を適用する場合について説明する。(Fifth Embodiment) In the present embodiment, as an example of serial recognition processing using a plurality of recognition methods, only some upper candidates of the previous recognition method are recognized by the next recognition method. A case in which the present invention is applied to an integrated system that is a target category will be described.
【0124】この統合化方式は、漢字など認識すべきパ
ターンの種類が多い文字セットの認識の場合に有効とな
るものである。図11に、統合化方式のアルゴリズムの
一例を示す。This integration method is effective in the case of recognizing a character set having many types of patterns to be recognized such as Chinese characters. FIG. 11 shows an example of the algorithm of the integration method.
【0125】図11に示す統合化方式では、一例とし
て、2個の認識方式を直列に統合化する場合について示
している。パターンが入力されると(ステップS10
1)、まず、大分類と呼ばれる認識処理で、認識候補の
絞り込みを行う(ステップS102)。次に、その絞り
込んだ認識候補だけで認識処理を行い、詳細識別などと
呼ばれる最終的な認識を行う(ステップS103)。In the integration system shown in FIG. 11, as an example, a case where two recognition systems are integrated in series is shown. When a pattern is input (step S10)
1) First, recognition candidates are narrowed down by a recognition process called a large classification (step S102). Next, recognition processing is performed only with the narrowed down recognition candidates, and final recognition called detailed identification is performed (step S103).
【0126】このようにすることによって、例えば漢字
のように4000カテゴリ余りもある文字セットを認識
する際、最初に、計算量のかからない認識方式を用い
て、入力パターンと全く類似しないカテゴリをはじき、
入力パターンに類似したカテゴリに絞り、本格的な(大
分類よりは計算量のかかる)認識処理を行うようにする
ことができ、これによって全体の計算量を大幅に削減す
ることができる。In this way, when recognizing a character set having more than 4000 categories such as Chinese characters, for example, a category which is completely similar to the input pattern is rejected by using a recognition method which does not require a large amount of calculation.
It is possible to narrow down the category to a category similar to the input pattern and perform a full-fledged (computation amount is greater than a large classification) recognition process, thereby greatly reducing the overall computation amount.
【0127】このような認識処理において最終的な認識
結果が不正解となる原因は次の2つに大別される。 (1)大分類で絞り込まれた認識候補に正解が含まれて
いない。 (2)大分類で絞り込まれた認識候補には正解が含まれ
ていたが、詳細識別での認識が不正解となった。In such recognition processing, the cause of the incorrect final recognition result is roughly classified into the following two. (1) The recognition candidates narrowed down by the large classification do not include a correct answer. (2) The recognition candidates narrowed down by the large classification included correct answers, but the recognition in the detailed identification was incorrect.
【0128】この原因の違いによって学習方法を変える
必要がある。図12に、本実施形態における学習アルゴ
リズムの一例を示す。ここでは、大分類による候補カテ
ゴリに正解カテゴリが含まれているか否かで学習させる
認識辞書を変えている。It is necessary to change the learning method depending on the difference between the causes. FIG. 12 shows an example of a learning algorithm in the present embodiment. Here, the recognition dictionary to be learned is changed depending on whether or not the correct category is included in the candidate category according to the large classification.
【0129】まず、ある学習パターンを入力し(ステッ
プS111)、入力されたこの学習パターンに対して図
11の第1番目の認識方式である大分類認識処理を行う
(ステップS112)。First, a certain learning pattern is input (step S111), and a large classification recognition process, which is the first recognition method in FIG. 11, is performed on the input learning pattern (step S112).
【0130】ここで、大分類認識処理により得られた候
補カテゴリに正解カテゴリが含まれているかどうか調
べ、含まれていない場合には(ステップS113)、大
分類辞書を学習する(ステップS114)。Here, it is checked whether or not the correct category is included in the candidate categories obtained by the large classification recognition processing. If the correct category is not included (step S113), the large classification dictionary is learned (step S114).
【0131】大分類認識処理により得られた候補カテゴ
リに正解カテゴリが含まれている場合には(ステップS
113)、続いて第2番目の認識方式である詳細識別処
理を行う(ステップS116)。When the correct category is included in the candidate categories obtained by the large classification recognition process (step S
113) Then, a detailed identification process, which is the second recognition method, is performed (step S116).
【0132】ここで、詳細識別処理により得られた最終
的な認識結果か調べ、正解でなければ(ステップS11
7)、詳細識別辞書を学習する(ステップS118)。
もちろん、詳細識別処理により得られた最終的な認識結
果が正解であれば(ステップS117)、学習は不要で
ある。Here, it is checked whether the final recognition result obtained by the detailed identification processing is correct, and if it is not correct (step S11).
7), learn the detailed identification dictionary (step S118).
Of course, if the final recognition result obtained by the detailed identification processing is a correct answer (step S117), learning is unnecessary.
【0133】これで1つの学習パターンに対する学習処
理が行われたことになる。さらに、ステップS115ま
たはステップS119で次のパターンがあれば次の学習
に移り、全パターンについて学習が済めば、処理を終了
する。This means that the learning processing for one learning pattern has been performed. Further, if there is a next pattern in step S115 or step S119, the process proceeds to the next learning, and if the learning is completed for all the patterns, the process ends.
【0134】なお、前述したように、図12の手順を1
ラウンドとして、複数ラウンドの学習処理を行うように
してもよい。また、予め規定したラウンド回数を上限と
して、当該直列型認識処理全体としての正読率等が一定
基準を満たすようになるまで処理を行うようにしてもよ
い。As described above, the procedure shown in FIG.
As a round, a plurality of rounds of learning processing may be performed. Further, the processing may be performed with the number of rounds defined in advance as an upper limit until the correct reading rate or the like as the whole serial type recognition processing satisfies a certain standard.
【0135】なお、上記では、ステップS113で大分
類認識処理により得られた候補カテゴリに正解カテゴリ
が含まれているかどうかを判断したが、例えば、上記の
大分類の候補絞り込みが上位N位までの候補カテゴリと
規定されている場合に、正解候補がN/2位以内に入っ
ていないことを大分類辞書を学習する条件とするように
してもよい。このようにすれば、ぎりぎりで候補カテゴ
リに入っていたパターンも安定して候補カテゴリに含ま
れるようにすることができ有効である。In the above, it is determined whether or not the correct category is included in the candidate categories obtained by the large classification recognition processing in step S113. When the candidate category is specified, the fact that the correct answer candidate does not fall within the N / 2 rank may be used as a condition for learning the large classification dictionary. In this way, it is possible to stably include a pattern that has just entered a candidate category into a candidate category, which is effective.
【0136】また、上記のような統合方式では、大分類
を何段階かに分けて行う場合もあるが、そのような場合
にも、各段階ごとに結果をチェックし、候補カテゴリか
ら洩れた(あるいは規定された順位までの上位候補から
洩れた)段階で当該辞書を学習することにすればよい。In the above-described integration method, the large classification may be divided into several stages. In such a case, the result is checked for each stage, and the result is omitted from the candidate category ( Alternatively, the dictionary may be learned at the stage when the dictionary has been omitted from the top candidates up to the specified order).
【0137】また、詳細識別が複数の認識方式を統合化
したものである場合には、第1〜第4の実施形態で示し
たような方法で学習することができる。なお、以上の各
手順、手段、機能は、ソフトウェアとしても実現可能で
ある。また、コンピュータに上記各手順を実行させるた
めの(あるいはコンピュータを上記各手段として機能さ
せるための、あるいはコンピュータに上記各機能を実現
させるための)プログラムを記録したコンピュータ読取
り可能な記録媒体として実施することもできる。本発明
は、上述した実施の形態に限定されるものではなく、そ
の技術的範囲において種々変形して実施することができ
る。In the case where the detailed identification is obtained by integrating a plurality of recognition methods, learning can be performed by the methods shown in the first to fourth embodiments. The above procedures, means, and functions can be realized as software. Further, the present invention is embodied as a computer-readable recording medium on which a program for causing a computer to execute the above-described procedures (or for causing the computer to function as the above-described units, or for causing the computer to realize each of the above-described functions) is recorded. You can also. The present invention is not limited to the above-described embodiment, and can be implemented with various modifications within the technical scope.
【0138】[0138]
【発明の効果】本発明によれば、複数の認識方式を統合
し1つの認識結果を出すようなパターン認識処理におけ
る認識辞書学習において、学習に関する弊害を最小限に
抑え、各認識方式の長所を活かす適切な方向に各認識辞
書を学習していくことができる。この結果、各認識方式
の長所を活かした高精度なパターン認識処理を実現する
ことができる。According to the present invention, in the recognition dictionary learning in the pattern recognition processing in which a plurality of recognition methods are integrated and one recognition result is obtained, the adverse effects on the learning are minimized, and the advantages of each recognition method are obtained. Each recognition dictionary can be learned in an appropriate direction to utilize. As a result, highly accurate pattern recognition processing utilizing the advantages of each recognition method can be realized.
【図1】本発明の一実施形態に係るパターン認識辞書作
成装置の基本構成を示す図FIG. 1 is a diagram showing a basic configuration of a pattern recognition dictionary creation device according to an embodiment of the present invention.
【図2】本発明の一実施形態に係るパターン認識装置の
基本構成を示す図FIG. 2 is a diagram showing a basic configuration of a pattern recognition device according to an embodiment of the present invention.
【図3】本発明の第1の実施形態における学習アルゴリ
ズムの一例を示すフローチャートFIG. 3 is a flowchart illustrating an example of a learning algorithm according to the first embodiment of the present invention.
【図4】本発明の第2、第3、第4の実施形態における
直列型認識処理アルゴリズムの一例を示すフローチャー
トFIG. 4 is a flowchart illustrating an example of a serial recognition processing algorithm according to the second, third, and fourth embodiments of the present invention;
【図5】本発明の第2、第3、第4の実施形態における
学習アルゴリズムの一例を示すフローチャートFIG. 5 is a flowchart illustrating an example of a learning algorithm according to the second, third, and fourth embodiments of the present invention;
【図6】本発明の第2の実施形態におけるリジェクトパ
ターンの学習処理のアルゴリズムの一例を示すフローチ
ャートFIG. 6 is a flowchart illustrating an example of an algorithm of a reject pattern learning process according to the second embodiment of the present invention;
【図7】同実施形態における不正解パターンの学習処理
のアルゴリズムの一例を示すフローチャートFIG. 7 is an exemplary flowchart illustrating an example of an algorithm of a learning process of an incorrect answer pattern in the embodiment.
【図8】同実施形態における不正解パターンの学習処理
のアルゴリズムの他の例を示すフローチャートFIG. 8 is a flowchart showing another example of the algorithm of the incorrect answer pattern learning process in the embodiment.
【図9】本発明の第3の実施形態における不正解パター
ンの学習処理のアルゴリズムの一例を示すフローチャー
トFIG. 9 is a flowchart illustrating an example of an algorithm of a learning process of an incorrect answer pattern according to the third embodiment of the present invention.
【図10】本発明の第4の実施形態における不正解パタ
ーンの学習処理のアルゴリズムの一例を示すフローチャ
ートFIG. 10 is a flowchart illustrating an example of an algorithm of a learning process of an incorrect answer pattern according to the fourth embodiment of the present invention.
【図11】本発明の第5の実施形態における直列型認識
処理アルゴリズムの一例を示すフローチャートFIG. 11 is a flowchart illustrating an example of a serial recognition processing algorithm according to a fifth embodiment of the present invention.
【図12】同実施形態における学習アルゴリズムの一例
を示すフローチャートFIG. 12 is a flowchart illustrating an example of a learning algorithm according to the embodiment;
2,12…パターン入力部 4…初期辞書作成部 10…辞書変更部 8,16…認識処理部 6,14…辞書データ格納部 18…認識結果出力部 2, 12 ... pattern input unit 4 ... initial dictionary creation unit 10 ... dictionary change unit 8, 16 ... recognition processing unit 6, 14 ... dictionary data storage unit 18 ... recognition result output unit
Claims (18)
における認識辞書を学習するパターン認識辞書学習方法
であって、 入力パターンに対する各認識方式の認識結果に少なくと
も基づいて定められた学習基準に従って、前記認識辞書
を学習することを特徴とするパターン認識辞書学習方
法。1. A pattern recognition dictionary learning method for learning a recognition dictionary in a pattern recognition process using a plurality of recognition methods, the method comprising: a learning criterion determined at least based on a recognition result of each recognition method for an input pattern; A pattern recognition dictionary learning method characterized by learning a recognition dictionary.
における認識辞書を学習するパターン認識辞書学習方法
であって、 入力パターンに対するパターン認識処理を実行し、 このパターン認識処理の認識結果および各認識方式の認
識結果に少なくとも基づいて前記認識辞書の学習基準を
定め、 定められた前記学習基準に従って、前記認識辞書を学習
することを特徴とするパターン認識辞書学習方法。2. A pattern recognition dictionary learning method for learning a recognition dictionary in a pattern recognition process using a plurality of recognition methods, wherein the pattern recognition process is performed on an input pattern, the recognition result of the pattern recognition process and each recognition method A learning criterion of the recognition dictionary based on at least the recognition result of the above, and learning the recognition dictionary according to the determined learning criterion.
あって、その学習指針によって学習を行うことを特徴と
する請求項1または2に記載のパターン認識辞書学習方
法。3. The pattern recognition dictionary learning method according to claim 1, wherein the learning criterion defines a learning guideline, and learning is performed according to the learning guideline.
補と正解候補の類似度の差、正解候補の類似度、認識候
補の類似度、認識候補カテゴリ、正解候補カテゴリおよ
び正解候補の候補順位のうち少なくとも1つを含むもの
であることを特徴とする請求項1ないし3のいずれか1
項に記載のパターン認識辞書学習方法。4. The learning criterion includes a difference in similarity between a recognition candidate and a correct answer candidate in a recognition method, a similarity of a correct answer candidate, a similarity of a recognition candidate, a recognition candidate category, a correct answer candidate category, and a candidate rank of a correct answer candidate. 4. The method according to claim 1, wherein at least one of them is included.
The pattern recognition dictionary learning method described in the section.
識方式と学習方法を定めるものであることを特徴とする
請求項1ないし4のいずれか1項に記載のパターン認識
辞書学習方法。5. The pattern recognition dictionary learning method according to claim 1, wherein the learning criterion defines a recognition method and a learning method for learning the recognition dictionary.
における認識辞書を、初期的な認識辞書を学習すること
により作成するパターン認識辞書作成方法であって、 入力パターンに対する各認識方式の認識結果に少なくと
も基づいて定められた学習基準に従って、前記認識辞書
を学習することを特徴とするパターン認識辞書作成方
法。6. A pattern recognition dictionary creating method for creating a recognition dictionary in a pattern recognition process using a plurality of recognition methods by learning an initial recognition dictionary, wherein a recognition result of each recognition method for an input pattern is obtained. A method for creating a pattern recognition dictionary, characterized by learning the recognition dictionary according to at least a learning criterion determined based on the reference.
における認識辞書を、初期的な認識辞書を学習すること
により作成するパターン認識辞書作成方法であって、 入力パターンに対するパターン認識処理を実行し、 このパターン認識処理の認識結果および各認識方式の認
識結果に少なくとも基づいて前記認識辞書の学習基準を
定め、 定められた前記学習基準に従って、前記認識辞書を学習
することを特徴とするパターン認識辞書作成方法。7. A pattern recognition dictionary creating method for creating a recognition dictionary in a pattern recognition process using a plurality of recognition methods by learning an initial recognition dictionary, comprising: executing a pattern recognition process for an input pattern; A learning criterion for the recognition dictionary is determined based at least on the recognition result of the pattern recognition process and the recognition result of each recognition method, and the recognition dictionary is learned according to the determined learning criterion. Method.
あって、その学習指針によって学習を行うことを特徴と
する請求項6または7に記載のパターン認識辞書作成方
法。8. The pattern recognition dictionary creating method according to claim 6, wherein the learning criterion defines a learning guideline, and learning is performed according to the learning guideline.
補と正解候補の類似度の差、正解候補の類似度、認識候
補の類似度、認識候補カテゴリ、正解候補カテゴリおよ
び正解候補の候補順位のうち少なくとも1つを含むもの
であることを特徴とする請求項6ないし8のいずれか1
項に記載のパターン認識辞書作成方法。9. The learning criterion includes a difference in similarity between a recognition candidate and a correct answer candidate in a recognition method, a similarity of a correct answer candidate, a similarity of a recognition candidate, a recognition candidate category, a correct answer candidate category, and a candidate rank of a correct answer candidate. 9. The method according to claim 6, wherein at least one of them is included.
Method for creating a pattern recognition dictionary described in the section.
認識方式と学習方法を定めるものであることを特徴とす
る請求項6ないし9のいずれか1項に記載のパターン認
識辞書作成方法。10. The pattern recognition dictionary creation method according to claim 6, wherein the learning criterion defines a recognition method and a learning method for learning the recognition dictionary.
理を行うパターン認識手段と、 前記複数の認識方式それぞれの認識辞書を格納するため
の辞書格納手段と、 入力パターンに対する各認識方式の認識結果に少なくと
も基づいて定められた学習基準に従って、前記認識辞書
を学習する学習手段とを特徴とするパターン認識辞書学
習装置。11. Pattern recognition means for performing pattern recognition processing using a plurality of recognition methods; dictionary storage means for storing recognition dictionaries of the plurality of recognition methods; and recognition results of each recognition method for an input pattern. Learning means for learning the recognition dictionary in accordance with a learning criterion determined at least based on the pattern recognition dictionary learning device.
理を行うパターン認識手段と、 前記複数の認識方式それぞれの認識辞書を格納するため
の辞書格納手段と、 前記辞書格納手段に格納される初期的な認識辞書を作成
する初期辞書作成手段と、 前記認識辞書を学習する学習手段と、 入力パターンに対する各認識方式の認識結果に少なくと
も基づいて定められた学習基準に従って、前記認識辞書
を学習する学習手段とを特徴とするパターン認識辞書作
成装置。12. A pattern recognition means for performing pattern recognition processing using a plurality of recognition methods, a dictionary storage means for storing recognition dictionaries of the plurality of recognition methods, and an initial state stored in the dictionary storage means. Initial dictionary creating means for creating a typical recognition dictionary; learning means for learning the recognition dictionary; and learning for learning the recognition dictionary according to a learning criterion determined based at least on the recognition result of each recognition method for an input pattern. Means for creating a pattern recognition dictionary.
た所定のパターン認識処理による入力パターンに対する
認識処理を実行させ、このパターン認識処理で実行され
た各認識方式の認識結果に少なくとも基づいて前記認識
辞書の学習基準を定めさせ、定められた前記学習基準に
従って前記認識辞書を学習させるためのプログラムを記
録したコンピュータ読取り可能な記録媒体。13. A computer that executes a recognition process for an input pattern by a predetermined pattern recognition process using a plurality of recognition methods, and performs the recognition based on at least a recognition result of each recognition method executed in the pattern recognition process. A computer-readable recording medium storing a program for causing a dictionary learning standard to be determined and for learning the recognition dictionary according to the determined learning standard.
た所定のパターン認識処理による入力パターンに対する
認識処理を実行させ、このパターン認識処理で実行され
た各認識方式の認識結果に少なくとも基づいて前記認識
辞書の学習基準を定めさせ、この学習基準により定めら
れる認識辞書を学習すべき認識方式と学習方法に従って
前記認識辞書を学習させるためのプログラムを記録した
コンピュータ読取り可能な記録媒体。14. A computer which executes a recognition process for an input pattern by a predetermined pattern recognition process using a plurality of recognition methods, and performs the recognition based at least on the recognition result of each recognition method executed in the pattern recognition process. A computer-readable recording medium storing a dictionary learning standard, and a program for learning the recognition dictionary according to a recognition method and a learning method for learning the recognition dictionary defined by the learning standard.
法であって、 請求項1ないし5のいずれか1項に記載のパターン認識
辞書学習方法によって学習された認識辞書を少なくとも
用いて、入力されたパターンを認識することを特徴とす
るパターン認識方法。15. A pattern recognition method using a plurality of recognition methods, wherein a pattern is input using at least a recognition dictionary learned by the pattern recognition dictionary learning method according to any one of claims 1 to 5. A pattern recognition method characterized by recognizing a pattern.
法であって、 請求項6ないし10のいずれか1項に記載のパターン認
識辞書作成方法によって作成された認識辞書を少なくと
も用いて、入力されたパターンを認識することを特徴と
するパターン認識方法。16. A pattern recognition method using a plurality of recognition methods, wherein a pattern is input using at least a recognition dictionary created by the pattern recognition dictionary creation method according to any one of claims 6 to 10. A pattern recognition method characterized by recognizing a pattern.
置であって、 請求項1ないし5のいずれか1項に記載のパターン認識
辞書学習方法によって学習された認識辞書を格納した辞
書格納手段と、 入力されたパターンを、少なくとも前記認識辞書を用い
て認識するパターン認識手段とを備えたことを特徴とす
るパターン認識装置。17. A pattern recognition device using a plurality of recognition methods, a dictionary storage means storing a recognition dictionary learned by the pattern recognition dictionary learning method according to any one of claims 1 to 5, A pattern recognition device comprising: pattern recognition means for recognizing an input pattern using at least the recognition dictionary.
置であって、 請求項6ないし10のいずれか1項に記載のパターン認
識辞書作成方法によって作成された認識辞書を格納した
辞書格納手段と、 入力されたパターンを、少なくとも前記認識辞書を用い
て認識するパターン認識手段とを備えたことを特徴とす
るパターン認識装置。18. A pattern recognition device using a plurality of recognition methods, a dictionary storage means for storing a recognition dictionary created by the pattern recognition dictionary creation method according to any one of claims 6 to 10, A pattern recognition device comprising: pattern recognition means for recognizing an input pattern using at least the recognition dictionary.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9321200A JPH11154231A (en) | 1997-11-21 | 1997-11-21 | Pattern recognition dictionary learning method, pattern recognition dictionary creation method, pattern recognition dictionary learning device, pattern recognition dictionary creation device, pattern recognition method, and pattern recognition device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9321200A JPH11154231A (en) | 1997-11-21 | 1997-11-21 | Pattern recognition dictionary learning method, pattern recognition dictionary creation method, pattern recognition dictionary learning device, pattern recognition dictionary creation device, pattern recognition method, and pattern recognition device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH11154231A true JPH11154231A (en) | 1999-06-08 |
Family
ID=18129918
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9321200A Pending JPH11154231A (en) | 1997-11-21 | 1997-11-21 | Pattern recognition dictionary learning method, pattern recognition dictionary creation method, pattern recognition dictionary learning device, pattern recognition dictionary creation device, pattern recognition method, and pattern recognition device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH11154231A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019028950A (en) * | 2017-08-03 | 2019-02-21 | 株式会社大塚商会 | AI service use support system |
| WO2020065840A1 (en) * | 2018-09-27 | 2020-04-02 | 株式会社オプティム | Computer system, speech recognition method, and program |
| JP2022082304A (en) * | 2020-11-20 | 2022-06-01 | 株式会社日立ソリューションズ・クリエイト | Worker management support system and worker management support processing method |
-
1997
- 1997-11-21 JP JP9321200A patent/JPH11154231A/en active Pending
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019028950A (en) * | 2017-08-03 | 2019-02-21 | 株式会社大塚商会 | AI service use support system |
| WO2020065840A1 (en) * | 2018-09-27 | 2020-04-02 | 株式会社オプティム | Computer system, speech recognition method, and program |
| CN113168836A (en) * | 2018-09-27 | 2021-07-23 | 株式会社OPTiM | Computer system, speech recognition method and program |
| JPWO2020065840A1 (en) * | 2018-09-27 | 2021-08-30 | 株式会社オプティム | Computer systems, speech recognition methods and programs |
| CN113168836B (en) * | 2018-09-27 | 2024-04-23 | 株式会社OPTiM | Computer system, speech recognition method and program product |
| JP2022082304A (en) * | 2020-11-20 | 2022-06-01 | 株式会社日立ソリューションズ・クリエイト | Worker management support system and worker management support processing method |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11741356B2 (en) | Data processing apparatus by learning of neural network, data processing method by learning of neural network, and recording medium recording the data processing method | |
| CN114782791B (en) | Scene graph generation method based on transform model and category association | |
| US5119438A (en) | Recognizing apparatus | |
| CN114357151B (en) | Processing method, device, equipment and storage medium of text category recognition model | |
| US20240037335A1 (en) | Methods, systems, and media for bi-modal generation of natural languages and neural architectures | |
| US20200293807A1 (en) | Adaptive image cropping for face recognition | |
| JP4039708B2 (en) | Pattern recognition method and pattern recognition apparatus | |
| KR20090090280A (en) | A storage medium storing a pattern recognition method and a pattern recognition program | |
| Tian et al. | Discovering underlying plans based on distributed representations of actions | |
| US10733483B2 (en) | Method and system for classification of data | |
| CN120470143A (en) | A cross-modal image and text retrieval method and system | |
| JPH06176160A (en) | Method of input classification, method of training and device | |
| CN120278859A (en) | Teaching object interaction method, system and device | |
| JPH11154231A (en) | Pattern recognition dictionary learning method, pattern recognition dictionary creation method, pattern recognition dictionary learning device, pattern recognition dictionary creation device, pattern recognition method, and pattern recognition device | |
| CN120448561A (en) | Cross-modal retrieval method and system based on robust double hash consensus learning | |
| CN112488180A (en) | Feature selection method based on RealifF | |
| JPH09245125A (en) | Pattern recognition device and dictionary correction method in the device | |
| US6219658B1 (en) | Method for learning data classification in two separate classes separated by a region divider of order 1 or 2 | |
| Dietterich | The divide-and-conquer manifesto | |
| JP3222699B2 (en) | Pattern recognition device | |
| JPH05314320A (en) | Evaluation method of recognition result using difference of recognition distance and candidate order | |
| JP7514141B2 (en) | Learning device, information classification device, and program | |
| CN116308103A (en) | Dialogue flowchart generation method and related device | |
| CN114116669A (en) | A Houghding Tree-Based Multi-label Streaming Data Classification Method | |
| CN121166662B (en) | Automatic data management method and system based on large model |