JPH0570839B2 - - Google Patents

Info

Publication number
JPH0570839B2
JPH0570839B2 JP59234541A JP23454184A JPH0570839B2 JP H0570839 B2 JPH0570839 B2 JP H0570839B2 JP 59234541 A JP59234541 A JP 59234541A JP 23454184 A JP23454184 A JP 23454184A JP H0570839 B2 JPH0570839 B2 JP H0570839B2
Authority
JP
Japan
Prior art keywords
category
candidate
string
candidates
input pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59234541A
Other languages
Japanese (ja)
Other versions
JPS61114385A (en
Inventor
Koichiro Hatasaki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59234541A priority Critical patent/JPS61114385A/en
Publication of JPS61114385A publication Critical patent/JPS61114385A/en
Publication of JPH0570839B2 publication Critical patent/JPH0570839B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To reduce the time during which the input of an input pattern is started and then the result of recognition is obtained, by carrying out the production of a candidate graph from the input pattern and the detection of a candidate of a significant category train out of the candidate flag. CONSTITUTION:A category train candidate producing part 108 receives a significant category train candidate from a significance deciding part 109 and adds a new category candidate at the termination of the category train candidate for production of plural new category train candidates. These new candidates are added to a category train candidate memory part 106. A new category candidate to be added is obtained from the candidate graphs of a candidate graph memory part 103. Here the category train candidate is stored temporarily to a category train candidate memory part 110 to interrupt the processing in case the coincidence is obtained between the termination of the category train candidate and the termination of a candidate graph. Then the processing is started again when a start signal (a') is received from a candidate graph producing part 102.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、入力パタンを認識し、認識結果とし
て入力パタンに対応するカテゴリ列を出力するパ
タン認識装置に関し、特に、入力パタンから得ら
れるカテゴリ列候補から有意なカテゴリ列のみを
認識結果として出力するパタン認識装置に関す
る。
Detailed Description of the Invention (Field of Industrial Application) The present invention relates to a pattern recognition device that recognizes an input pattern and outputs a category string corresponding to the input pattern as a recognition result. The present invention relates to a pattern recognition device that outputs only significant category columns from column candidates as recognition results.

(従来技術とその問題点) 入力パタンをカテゴリ列として認識する場合、
入力パタン中に含まれる各カテゴリを個々に認識
し、その認識結果のカテゴリ列を入力パタンの認
識結果とすることができれば、任意のカテゴリ列
の入力パタンを認識することができる。
(Prior art and its problems) When recognizing an input pattern as a category sequence,
If each category included in an input pattern can be individually recognized and a category string resulting from the recognition can be used as a recognition result of the input pattern, it is possible to recognize an input pattern of an arbitrary category string.

しかしながら、入力パタン中の各カテゴリを個
個に認識することは一般に困難である。特に、連
続発声された音声を音節列として認識する場合の
ように入力パタン中のカテゴリ間の境界が不明確
な場合には、入力パタン中の各カテゴリの位置す
る区間を一意に決定することから困難である。
However, it is generally difficult to individually recognize each category in an input pattern. In particular, when the boundaries between categories in an input pattern are unclear, such as when recognizing continuously uttered speech as a string of syllables, it is necessary to uniquely determine the interval in which each category in the input pattern is located. Have difficulty.

そこで、特開昭58−55995号公報「音声認識シ
ステム」(文献1)に見られるように、次に述べ
る方法が従来から用いられている。
Therefore, as shown in Japanese Patent Application Laid-Open No. 58-55995 entitled "Voice Recognition System" (Reference 1), the following method has been conventionally used.

まず入力パタン中の各部分に対して複数個のカ
テゴリ候補を検出し、かつ各カテゴリ候補には認
識結果としての信頼度を与えておく。入力パタン
中のすべての部分に対してのカテゴリ候補を検出
した後に、それらのカテゴリ候補を並べて入力パ
タンに対応するカテゴリ列の候補を得る。これら
のカテゴリ列候補のうちで、認識結果として有意
であつて、しかも前記信頼度から求めたカテゴリ
列としての信頼度のできるだけ高いカテゴリ列を
認識結果とすることによつて、認識率を向上させ
ることができる。
First, a plurality of category candidates are detected for each part of the input pattern, and each category candidate is given a degree of reliability as a recognition result. After detecting category candidates for all parts of the input pattern, these category candidates are arranged to obtain category string candidates corresponding to the input pattern. Among these category sequence candidates, the recognition rate is improved by selecting a category sequence that is significant as a recognition result and has the highest possible reliability as a category sequence determined from the reliability level as a recognition result. be able to.

しかしながらこの方法は、カテゴリ列の有意性
を判定するために、有意なカテゴリ列の辞書を検
索したり、カテゴリ列同士の接続可能性を判定し
たりすることが必要であり、多大な計算量を必要
とするという欠点を有する。
However, this method requires searching a dictionary of significant category columns and determining the possibility of connection between category columns in order to determine the significance of category columns, which requires a large amount of calculation. It has the disadvantage of requiring

そこで文献1では、入力パタンから得られるす
べてのカテゴリ列候補のうちから、カテゴリ列と
しての信頼度の高いものから順に、カテゴリ列の
有意性判定を行なつている。
Therefore, in Document 1, the significance of category strings is determined from among all category string candidates obtained from an input pattern, in descending order of reliability as a category string.

これによつて、有意性判定の回数を減少させ必
要な計算量を減少させている。
This reduces the number of significance determinations and the amount of calculation required.

しかしながら、前記公開特許では、一旦すべて
のカテゴリ列候補を求めていたため、多大の計算
量および記憶量を必要とするという欠点があつ
た。
However, in the above-mentioned published patent, all category sequence candidates are once determined, which has the drawback of requiring a large amount of calculation and storage.

そこで特願昭58−214544号明細書「パタン認識
システム」(文献2)では、以下に述べる方法に
よつてすべてのカテゴリ列候補を求めることな
く、有意でかつ信頼度の高いカテゴリ列を求める
ことを可能にした。
Therefore, in Japanese Patent Application No. 58-214544 "Pattern Recognition System" (Reference 2), a significant and highly reliable category string is obtained by the method described below without obtaining all category string candidates. made possible.

この方法は、人工知能の分野で知られているヒ
ユーリステイツク探索法(人工知能ハンドブツク
第1巻PP.67−83.共立出版、1983年4月)を応用
したものである。
This method is an application of the heuristic search method (Artificial Intelligence Handbook Vol. 1 pp.67-83, Kyoritsu Shuppan, April 1983), which is known in the field of artificial intelligence.

この方法では、入力パタンから得られたすべて
のカテゴリ列候補を候補グラフという形で保持し
ておき、入力パタンの始端に対応する候補グラフ
の始節点から途中の任意の節点に至る種々の長さ
のカテゴリ列候補のそれぞれに対して、該カテゴ
リ列候補を終端からさらに候補グラフの終節点ま
で伸ばして得た、入力パタン全体に対するカテゴ
リ列候補の信頼度を推定する。この推定された信
頼度を用いると、種々の長さのカテゴリ列候補同
士の信頼度の比較を行なうことが可能となる。従
つて候補グラフから、すべてのカテゴリ列候補を
求めることなく、信頼度の高い順にカテゴリ列候
補を求めることが可能となり、計算量・記憶量を
減少させることができる。
In this method, all category sequence candidates obtained from an input pattern are retained in the form of a candidate graph, and various lengths from the starting node of the candidate graph corresponding to the starting edge of the input pattern to an arbitrary node along the way are stored. For each category string candidate, the reliability of the category string candidate with respect to the entire input pattern is estimated, which is obtained by extending the category string candidate from the terminal end to the terminal node of the candidate graph. Using this estimated reliability, it becomes possible to compare the reliability of category sequence candidates of various lengths. Therefore, category string candidates can be found in descending order of reliability without having to find all category string candidates from the candidate graph, and the amount of calculation and storage can be reduced.

特に、前記文献2では信頼度の推定を該カテゴ
リ列候補の終端から、候補グラフの終節点までの
カテゴリ候補の実際の信頼度から算出しているた
めに、推定の確度が高く、計算量・記憶量の大巾
な削減が可能となつた。
In particular, in Document 2, the reliability estimation is calculated from the actual reliability of the category candidates from the end of the category string candidate to the final node of the candidate graph, so the estimation accuracy is high and the amount of calculation is reduced. It has become possible to drastically reduce the amount of memory.

しかしながら、文献2においては、前述のよう
に、信頼度を、入力パタン全体のカテゴリ候補の
信頼度から算出していたために、入力パタン全体
に対するカテゴリ候補の検出が終了した後、従つ
て入力パタン全体が入力された後でなければ、有
意性判定を行なうことができなかつた。このため
入力パタンを入力し始めてから、認識結果が出力
されるまでの時間が長いという欠点が存在してい
た。
However, in Document 2, as mentioned above, since the reliability is calculated from the reliability of category candidates for the entire input pattern, after the detection of category candidates for the entire input pattern is completed, the reliability for the entire input pattern is Significance judgment could not be made until after the input was made. For this reason, there was a drawback that it took a long time from the start of inputting an input pattern until the recognition result was output.

(発明の目的) 本発明の目的は、入力パタンからの候補グラフ
の作成と候補グラフからの有意カテゴリ列候補検
出とを並列して行なうことにより、前記欠点を取
り除いて、入力パタンの入力開始から認識結果が
得られるまでの時間がより少ないパタン認識装置
を提供することにある。
(Object of the Invention) An object of the present invention is to eliminate the above-mentioned drawbacks by performing the creation of a candidate graph from an input pattern and the detection of significant category string candidates from the candidate graph in parallel, and to To provide a pattern recognition device that takes less time to obtain recognition results.

(発明の構成) 本発明のパタン認識装置は、入力パタンを分析
し、当該入力パタンの各部分に対して複数個のカ
テゴリ候補を検出し、当該入力パタン中の位置情
報および信頼度と共に出力するカテゴリ候補検出
手段と、前記複数個のカテゴリ候補を、その位置
情報に従つてカテゴリ候補相互の位置関係および
候補グラフ記憶手段にすでに前記入力パタンの他
の部分のカテゴリ候補が記憶されている場合には
これらのカテゴリ候補との位置関係を保ちかつ各
候補が前記信頼度を表わすコストを持つ候補グラ
フを作成し、該候補グラフを前記候補グラフ記憶
手段に格納する候補グラフ作成手段と、前記候補
グラフ記憶手段に記憶されている候補グラフの節
点に対して現時点の終節点までの最小累計コスト
を計算する最小コスト計算手段と、第1のカテゴ
リ列記憶手段に記憶されているカテゴリ列に対し
て、前記最小累計コストおよび各候補のコストを
用いて評価値を計算する評価値計算手段と、前記
第1のカテゴリ列記憶手段から前記評価値が最良
のカテゴリ列を取り出す最良カテゴリ列選択手段
と、前記最良カテゴリ列選択手段が取り出したカ
テゴリ列が認識結果としての有意性を判定し、有
意なカテゴリ列を出力する有意性判定手段と、前
記有意性判定手段が出力した有意なカテゴリ列の
終端が前記候補グラフ記憶手段に記憶されている
候補グラフの終節点でない場合には該カテゴリ列
に新たなカテゴリ候補を追加した新たなカテゴリ
列候補を一般に複数個作成し、前記第1のカテゴ
リ列記憶手段に追加し、該カテゴリ列の終端が前
記候補グラフの終節点ではあるが入力パタンの終
端でないときには該カテゴリ列を第2のカテゴリ
列記憶手段に一旦格納しておき、前記候補グラフ
に新たなカテゴリ候補が追加されたときに処理を
再開して新たなカテゴリ列を作成し前記第1のカ
テゴリ列記憶手段に格納し、該カテゴリ列の終端
が入力パタンの終端に一致するときには該カテゴ
リ列を認識結果として出力するカテゴリ列作成手
段とを含んで構成される。
(Structure of the Invention) The pattern recognition device of the present invention analyzes an input pattern, detects a plurality of category candidates for each part of the input pattern, and outputs the detected category candidates along with position information and reliability in the input pattern. A category candidate detection means detects the plurality of category candidates according to their positional information, and determines the positional relationship between the category candidates when category candidates for other parts of the input pattern are already stored in the candidate graph storage means. creates a candidate graph that maintains a positional relationship with these category candidates and each candidate has a cost representing the reliability, and stores the candidate graph in the candidate graph storage means; Minimum cost calculation means for calculating the minimum cumulative cost up to the current end node for the node of the candidate graph stored in the storage means; and for the category string stored in the first category string storage means; an evaluation value calculation means for calculating an evaluation value using the minimum cumulative cost and the cost of each candidate; a best category string selection means for extracting a category string with the best evaluation value from the first category string storage means; a significance determining means for determining the significance of the category string retrieved by the best category string selecting means as a recognition result and outputting a significant category string; If it is not the final node of the candidate graph stored in the candidate graph storage means, generally a plurality of new category sequence candidates are created by adding a new category candidate to the category sequence, and the new category sequence candidates are stored in the first category sequence storage means. When the end of the category string is the end node of the candidate graph but not the end of the input pattern, the category string is temporarily stored in the second category string storage means, and a new category candidate is added to the candidate graph. is added, the process is restarted to create a new category string and stored in the first category string storage means, and when the end of the category string matches the end of the input pattern, the recognition result of the category string is and category string creation means for outputting the category string.

(実施例 1) 以下、図面を参照して、実施例に従つて本発明
を詳細に説明する。
(Example 1) Hereinafter, the present invention will be described in detail according to examples with reference to the drawings.

第1図は本発明の一実施例を示すブロツク図で
ある。本実施例は、日本語連続音声を入力パタン
とし、認識結果として日本語音節列を出力するパ
タン認識装置を構成する。
FIG. 1 is a block diagram showing one embodiment of the present invention. This embodiment constitutes a pattern recognition device that uses continuous Japanese speech as an input pattern and outputs a Japanese syllable string as a recognition result.

カテゴリ候補検出部101は、入力パタンの各
部分に対してそれぞれ対応するカテゴリ候補を複
数個検出して、各部分の検出が終了する毎に、該
当するカテゴリ候補を入力パタン中での位置情報
と共に候補グラフ作成部102に送る。
The category candidate detection unit 101 detects a plurality of category candidates corresponding to each part of the input pattern, and each time the detection of each part is completed, the corresponding category candidate is detected along with the position information in the input pattern. It is sent to the candidate graph creation unit 102.

入力パタンが日本語連続音声の場合には、認識
すべきカテゴリとして音節を考えることができ
る。すなわち、カテゴリ候補検出部101として
は、入力パタンから音節候補を検出することがで
きるものであればよい。このために例えば第2図
に示すカテゴリ候補検出部を用いることができ
る。第2図において、入力パタンである音声は入
力パタンバツフア201に一旦格納される。20
1に格納された音声に対して、母音候補検出部2
02は母音の候補をまず1つ検出する。この検出
は、母音辞書203にあらかじめ格納されている
各母音カテゴリの標準パタンと入力パタンの一部
とをマツチングすることによつて行なわれる。母
音の信号は比較的定常であるので検出は容易であ
る。母音候補検出部202は母音候補を1つ検出
すると、これを子音候補検出部204に送る。1
つの母音候補は少なくとも母音カテゴリ、信頼
度、入力パタン中での位置の情報を含んでいる。
日本語においては、音節は子音(C)−母音(V)の
組で構成されている。従つて、入力パタン中で
は、2つの母音に狭まれた区間のうちある長さ以
下の区間(これをVCV区間)および入力パタン
の始端から1つの母音までの区間のうちある長さ
以下の区間(これをCV区間)において、それぞ
れ1つの子音が存在することになる。
When the input pattern is Japanese continuous speech, syllables can be considered as the category to be recognized. That is, the category candidate detection unit 101 may be any device that can detect syllable candidates from an input pattern. For this purpose, for example, a category candidate detection section shown in FIG. 2 can be used. In FIG. 2, the voice which is an input pattern is temporarily stored in an input pattern buffer 201. In FIG. 20
1, the vowel candidate detection unit 2
02 first detects one vowel candidate. This detection is performed by matching a part of the input pattern with a standard pattern of each vowel category stored in advance in the vowel dictionary 203. Since the vowel signal is relatively stationary, it is easy to detect. When the vowel candidate detection unit 202 detects one vowel candidate, it sends it to the consonant candidate detection unit 204. 1
Each vowel candidate includes at least information on vowel category, confidence level, and position in the input pattern.
In Japanese, a syllable is composed of a consonant (C)-vowel (V) pair. Therefore, in the input pattern, the section narrowed by two vowels has a length less than or equal to a certain length (this is called a VCV section), and the section from the start of the input pattern to one vowel has a length less than or equal to a certain length. (This is the CV section), there is one consonant in each.

子音候補検出部204は、202から母音候補
(V1とする)を受け取ると、これを母音候補記憶
部206に格納する。これと共に、この母音候補
と206にすでに格納されていた他の母音候補
(V2とする)あるいは入力パタンの始端とから上
記のV2CV1区間、CV1区間をすべて検出する。こ
れらの区間のそれぞれに対して、子音辞書205
にあらかじめ格納されているVCVおよびCV標準
パタンのうちV2,V1の一致するものをマツチン
グすることによつて、子音候補を複数個求める。
When the consonant candidate detection unit 204 receives a vowel candidate (referred to as V 1 ) from the vowel candidate detection unit 202 , the consonant candidate detection unit 204 stores this in the vowel candidate storage unit 206 . At the same time, all of the above-mentioned V 2 CV 1 section and CV 1 section are detected from this vowel candidate, another vowel candidate already stored in 206 (referred to as V 2 ), or the start end of the input pattern. For each of these intervals, consonant dictionary 205
A plurality of consonant candidates are obtained by matching those with matching V 2 and V 1 among the VCV and CV standard patterns stored in advance in the .

この子音候補と母音候補V1を組み合わせて、
入力パタンの1つの区間に対して複数個の音節候
補をカテゴリ候補として出力する。このカテゴリ
候補は少なくとも音節カテゴリ、信頼度、入力パ
タン中での位置の情報を含んでいる。
Combining this consonant candidate and vowel candidate V 1 ,
A plurality of syllable candidates are output as category candidates for one section of the input pattern. This category candidate includes at least information on syllable category, confidence level, and position in the input pattern.

以上の処理を繰り返して、入力パタン中のすべ
てのカテゴリ候補を順に出力する。
The above process is repeated to sequentially output all category candidates in the input pattern.

第1図にもどつて、 候補グラフ作成部102はカテゴリ候補検出部
101から新たなカテゴリ候補を受け取ると、候
補グラフ記憶部103にそれまでの処理によつて
すでに格納されている候補グラフにこの新たなカ
テゴリ候補を追加する。候補グラフはそれまでに
得られたすべてのカテゴリ候補をそれら相互の位
置関係と共に保持しており、グラフの枝がカテゴ
リ候補を表わす。
Returning to FIG. 1, when the candidate graph creation unit 102 receives a new category candidate from the category candidate detection unit 101, it adds this new candidate graph to the candidate graph already stored in the candidate graph storage unit 103 through the previous processing. Add category suggestions. The candidate graph holds all the category candidates obtained so far along with their mutual positional relationships, and the branches of the graph represent the category candidates.

第4図に候補グラフの一例として、「オシエテ
イタダイタ」と発声された音声において第2音節
すなわち「オシ」の部分に対して得られた音節候
補を保持している候補グラフを示す。第4図にお
いて、,,…で示した節点が入力パタン中
での音節境界の候補を表し、節点は入力パタン
の始端である。音節候補は、音節カテゴリと信頼
度の組で表わされており、例えば、枝−には
3つの音節候補があり、その一つは「ウ」で信頼
度は72である。なお、本実施例では信頼度は標準
パタンと入力パタンとのマツチング距離で与えて
おり、この値が小さい程、信頼度が高い。
As an example of a candidate graph, FIG. 4 shows a candidate graph that holds syllable candidates obtained for the second syllable, that is, the part of "oshi" in the voice uttered "Oshie teita daita." In FIG. 4, the nodes indicated by , . . . represent syllable boundary candidates in the input pattern, and the nodes are the starting ends of the input pattern. The syllable candidates are represented by a combination of a syllable category and a confidence level. For example, there are three syllable candidates for the - branch, one of which is ``u'' and has a confidence level of 72. In this embodiment, the reliability is given by the matching distance between the standard pattern and the input pattern, and the smaller this value is, the higher the reliability is.

候補グラフ作成部102は新たな候補を候補グ
ラフ記憶部103に追加した後、最小累計コスト
計算部104とカテゴリ列候補作成部108に開
始信号a,a′を送信する。
After adding a new candidate to the candidate graph storage section 103, the candidate graph creation section 102 sends start signals a, a' to the minimum cumulative cost calculation section 104 and the category string candidate creation section 108.

最小累計コスト計算部104は開始信号aを受
け取ると、候補グラフ記憶部103に格納されて
いる候補グラフのすべての節点について、当該節
点から現時点での候補グラフの終節点までの最小
累計コストを計算して付与する。ここで累計コス
トは候補グラフ中の任意の経略すなわち候補列に
対して、その候補列を構成するカテゴリ候補のそ
れぞれのコストの総和として与えられる。カテゴ
リ候補のコストとはその候補の信頼度を表わす値
であり、値が小さいほど信頼度が高くなる。本実
施例では、先に各候補に信頼度として与えた標準
パタンとのマツチング距離をそのまま用いること
とする。
When the minimum cumulative cost calculation unit 104 receives the start signal a, it calculates the minimum cumulative cost for all nodes of the candidate graph stored in the candidate graph storage unit 103 from the node to the current terminal node of the candidate graph. and grant it. Here, the cumulative cost is given as the sum of the costs of each of the category candidates that make up the candidate sequence for any route in the candidate graph, that is, the candidate sequence. The cost of a category candidate is a value representing the reliability of the candidate, and the smaller the value, the higher the reliability. In this embodiment, the matching distance with respect to the standard pattern previously given to each candidate as the reliability is used as is.

最小累計コストの計算は動的計画法を用いるこ
とにより効率的に行なうことができる。すなわち
候補グラフの節点をn(n=1,…,i,…,j,
…,N−K,…,N)(ただし1を始節点、N−
K,…,Nを終節点とする)、節点i,j間の枝
の数をM,節点i,j間のm番目の枝に対する候
補のコストをd(i,j,m)とすると、節点n
から終節点までの最小累積コストc(n)は次の
漸化式から求めることができる。
Calculation of the minimum cumulative cost can be performed efficiently by using dynamic programming. In other words, let the nodes of the candidate graph be n (n=1,...,i,...,j,
..., N-K, ..., N) (where 1 is the starting node, N-
K,...,N are the end nodes), the number of edges between nodes i and j is M, and the cost of the candidate for the m-th edge between nodes i and j is d(i, j, m), Node n
The minimum cumulative cost c(n) from to the final node can be found from the following recurrence formula.

c(N−K)=……=c(N)=φ(初期値) c(n)=min〔min d(n,j,m)+c(j)〕 n<j≦N 1≦m≦M (n=N−K−1,N−K−2,……,1)…
… (1) 最小累計コスト計算部104は、候補グラフ作
成部102から開始信号aを受け取る毎に、候補
グラフ記憶部103中の候補グラフに対して各節
点の最小累計コストを計算するが、毎回すべての
節点に対して上述の漸化式(1)を解く必要はない。
例えば、第4図の候補グラフにおいて、102に
よつて新たに−の枝および節点が追加され
たときの計算では、節点,,に対してはそ
れまでの値に対して節点の最小累計コストの増
加分を加えることで新たな最小累計コストを求め
ることができ計算効率をさらに向上させることが
できる。
c(N-K)=...=c(N)=φ (initial value) c(n)=min [min d(n, j, m)+c(j)] n<j≦N 1≦m≦ M (n=N-K-1, N-K-2,..., 1)...
(1) Each time the minimum cumulative cost calculation unit 104 receives the start signal a from the candidate graph creation unit 102, it calculates the minimum cumulative cost of each node for the candidate graph in the candidate graph storage unit 103. It is not necessary to solve the above recurrence formula (1) for all nodes.
For example, in the candidate graph of Figure 4, when a new - edge and node are added by 102, the calculation for the node , , calculates the minimum cumulative cost of the node with respect to the previous value. By adding the increment, a new minimum cumulative cost can be determined, and calculation efficiency can be further improved.

最小累計コスト計算部104は計算が終了する
と、評価値計算部105に開始信号bを送出す
る。
When the minimum cumulative cost calculation unit 104 completes the calculation, it sends a start signal b to the evaluation value calculation unit 105.

評価値計算部105は、開始信号bを受け取る
とカテゴリ列候補記憶部106に格納されている
カテゴリ列候補のそれぞれについて、その評価値
を計算して付与する。特別な場合として、初期状
態では、106は空であり、このときは評価値の
計算は行なわれない。
Upon receiving the start signal b, the evaluation value calculation unit 105 calculates and assigns an evaluation value to each of the category sequence candidates stored in the category sequence candidate storage unit 106. As a special case, 106 is empty in the initial state, and no evaluation value is calculated at this time.

カテゴリ列候補の評価値は、複数個の種々の長
さのカテゴリ列候補の信頼度をその長さの違いに
依らずに正しく評価できるものであればよい。本
実施例では、候補グラフの始節点から途中の節点
iに至る或る経路を成すカテゴリ列候補S(i)
の評価値f(S(i))を次式で計算する。
The evaluation value of a category string candidate may be any value that can correctly evaluate the reliability of a plurality of category string candidates of various lengths without depending on the difference in length. In this example, a category sequence candidate S(i) that forms a certain path from the starting node of the candidate graph to the intermediate node i
The evaluation value f(S(i)) is calculated using the following formula.

f(S(i))=g(S(i))+h(S(i))…
…(2) ここで、g(S(i))は、カテゴリ列候補S
(i)に対応する始節点から途中節点iに至る経
路累計コスト、すなわちこの経路に含まれるすべ
てのカテゴリ候補のコストの総和である。h(S
(i))は途中節点iから現時点の終節点までの経
路の推定コストである。この終節点までの経路は
複数個あり、今後の処理においてどの経路を通る
か評価値計算の段階では決定できない。このた
め、h(S(i))を次式(3)により計算する。
f(S(i))=g(S(i))+h(S(i))...
…(2) Here, g(S(i)) is the category sequence candidate S
This is the cumulative cost of the route from the starting node to the intermediate node i corresponding to (i), that is, the total cost of all category candidates included in this route. h(S
(i)) is the estimated cost of the route from intermediate node i to the current final node. There are multiple routes to this final node, and which route to take in future processing cannot be determined at the evaluation value calculation stage. Therefore, h(S(i)) is calculated using the following equation (3).

h(S(i))=α・c(i) ……(3) ここでc(i)は節点iから現時点での終節点
までの最小累計コストであり、最小累計コスト計
算部104よつてすでに計算され、候補グラフに
付与されている値である。αは係数である。
h(S(i))=α・c(i)...(3) Here, c(i) is the minimum cumulative cost from node i to the current final node, and is calculated by the minimum cumulative cost calculation unit 104. This is a value that has already been calculated and assigned to the candidate graph. α is a coefficient.

以上のように計算したf(S(i))を用いれば、
種々の長さのカテゴリ列候補同士の信頼度を比較
することができる。
Using f(S(i)) calculated as above,
It is possible to compare the reliability of category string candidates of various lengths.

なお、評価値を計算しようとするカテゴリ列に
は、以前の処理ですでに評価値を与えられている
ものもあるが、候補グラフの終節点が変更されて
いる場合があるため再計算の必要がある。この場
合には、新たな評価値は、以前の終節点に付与さ
れている最小累積コストの以前の評価値計算の段
階からの増加分と以前の評価値とから容易に計算
することもできる。
Note that some category columns for which evaluation values are to be calculated may have already been given evaluation values in previous processing, but the final node of the candidate graph may have changed, so recalculation may be necessary. There is. In this case, the new evaluation value can be easily calculated from the previous evaluation value and the increase in the minimum cumulative cost given to the previous end node from the previous evaluation value calculation stage.

評価値計算部105はカテゴリ列候補記憶10
6中のすべてのカテゴリ列候補についての評価値
計算が終了すると、最良カテゴリ列候補選択部1
07に開始信号Cを送出する。
The evaluation value calculation unit 105 stores the category string candidate storage 10.
When evaluation value calculations for all category string candidates in 6 are completed, the best category string candidate selection unit 1
The start signal C is sent at 07.

最良カテゴリ列候補選択部107はカテゴリ列
候補記憶部106から、前記評価値計算部105
で計算された評価値が最良であるカテゴリ列候補
を取り出し、有意性判定部109に送る。
The best category sequence candidate selection unit 107 selects the evaluation value calculation unit 105 from the category sequence candidate storage unit 106.
The category sequence candidate with the best evaluation value calculated in is extracted and sent to the significance determination unit 109.

有意性判定部109は最良カテゴリ列候補選択
部107から受け取つたカテゴリ列候補が認識結
果としての有意性を判定し、有意ならカテゴリ列
候補作成部108に該カテゴリ列候補を送る。
The significance determination unit 109 determines the significance of the category sequence candidate received from the best category sequence candidate selection unit 107 as a recognition result, and if significant, sends the category sequence candidate to the category sequence candidate generation unit 108 .

本実施例では日本語音声の認識を目的としてい
るため、カテゴリ列候補が正しい日本語の音節系
列の一部または全部であるか否かを判定する。こ
のために例えば第3図のブロツク図に示すような
有意性判定部を用いる。第3図において、単語辞
書301は認識結果に出現し得るすべての単語を
音節系列として保持している。単語接続表302
は301に含まれる単語相互の接続可能性を保持
している。判定部303は受け取つたカテゴリ列
候補が301に含まれ、かつ302の接続可能性
を満足する単語系列の一部または全部を構成すれ
ば該カテゴリ列候補は有意であるとし、該カテゴ
リ列候補をカテゴリ列候補作成部108に送出す
る。該カテゴリ列候補には、108によつて新た
なカテゴリ候補が終端に追加された後に再び有意
性判定が行なわれることがある。このため、見い
出された単語列を該カテゴリ列候補に付与してお
くことにより、次回以降の有意性判定の際の処理
を効率よくすることができる。
Since the purpose of this embodiment is to recognize Japanese speech, it is determined whether the category string candidate is part or all of a correct Japanese syllable sequence. For this purpose, for example, a significance determining section as shown in the block diagram of FIG. 3 is used. In FIG. 3, a word dictionary 301 holds all words that can appear in the recognition results as syllable sequences. Word connection table 302
holds the possibility of mutual connection between the words included in 301. The determining unit 303 determines that the received category sequence candidate is significant if it is included in 301 and forms part or all of a word sequence that satisfies the connectability of 302, and determines that the category sequence candidate is significant. It is sent to the category string candidate creation unit 108. After a new category candidate is added to the end of the category string candidate in step 108, the significance determination may be performed again. Therefore, by adding the found word string to the category string candidate, it is possible to improve the efficiency of the processing in subsequent significance determinations.

カテゴリ列候補作成部108は有意性判定部1
09から有意なカテゴリ列候補を受け取ると、該
カテゴリ列候補の終端に新たなカテゴリ候補を追
加することによつて複数個の新たなカテゴリ列候
補を作成し、カテゴリ列候補記憶部106に追加
する。追加する新たなカテゴリ候補は候補グラフ
記憶部103の候補グラフから得るが、該カテゴ
リ列候補の終端が候補グラフの終端に一致してい
る場合には、該カテゴリ列候補を一旦カテゴリ列
候補記憶部110に格納し処理を中断する。この
後、候補グラフ作成部から開始信号a′を受け取る
ことによつて、処理を再開する。また該カテゴリ
列候補の終端が入力パタンの終端に一致している
場合には、該カテゴリ列候補を認識結果として出
力する。
The category string candidate creation unit 108 is the significance determination unit 1
When a significant category string candidate is received from 09, a plurality of new category string candidates are created by adding a new category candidate to the end of the category string candidate, and added to the category string candidate storage section 106. . A new category candidate to be added is obtained from the candidate graph in the candidate graph storage section 103, but if the end of the category string candidate matches the end of the candidate graph, the category string candidate is temporarily stored in the category string candidate storage section. 110 and interrupts the process. Thereafter, the processing is restarted by receiving the start signal a' from the candidate graph creation section. Furthermore, if the end of the category string candidate matches the end of the input pattern, the category string candidate is output as a recognition result.

例として、候補グラフ記憶部103に第4図の
候補グラフが格納されており、カテゴリ列候補作
成部108がカテゴリ列候補−ウ−を受け取
つた場合には、カテゴリ列候補−ウ−−シ−
とカテゴリ列候補−ウ−−ジ−が新たに
作成されカテゴリ列候補記憶部106に追加され
る。
For example, if the candidate graph shown in FIG. 4 is stored in the candidate graph storage unit 103 and the category sequence candidate generation unit 108 receives the category sequence candidate -W, then the category sequence candidate -W
A new category string candidate - Woozi - is created and added to the category string candidate storage section 106.

以上述べたように、本発明のパタン認識装置で
は入力パタンから候補グラフを作成する処理と、
候補グラフから有意カテゴリ列候補を求める処理
とを並列して行ないつつ、入力パタンの始端から
終端に至る有意なカテゴリ列を検出して認識結果
とする。
As described above, in the pattern recognition device of the present invention, the process of creating a candidate graph from an input pattern,
While performing the process of finding significant category string candidates from the candidate graph in parallel, significant category strings from the beginning to the end of the input pattern are detected and used as recognition results.

(実施例 2) 第1図のブロツク図において、カテゴリ候補検
出部101として、単音節毎に区切つて入力され
る入力パタンの個々の単音節に対して複数個の候
補を検出する回路を用いれば、単音節単位に発声
された音声の認識装置を構成することができる。
(Example 2) In the block diagram of FIG. 1, if a circuit is used as the category candidate detection unit 101 to detect a plurality of candidates for each monosyllable of an input pattern that is inputted separately for each monosyllable. , it is possible to configure a recognition device for speech uttered in units of monosyllables.

(実施例 3) 第1図のブロツク図において、カテゴリ候補検
出部101として、文字認識回路を使用すれば、
文字認識装置を構成することができる。
(Embodiment 3) In the block diagram of FIG. 1, if a character recognition circuit is used as the category candidate detection unit 101,
A character recognition device can be configured.

(実施例 4) 第1図のブロツク図において、有意性判定部1
09においては、日本語以外の他の自然言語ある
いは形式言語の文法知識を用いることもでき、こ
れによつて日本語以外の任意の入力パタンを認識
する装置を構成することができる。
(Example 4) In the block diagram of FIG.
In 09, grammatical knowledge of natural languages or formal languages other than Japanese can be used, thereby making it possible to configure a device that recognizes any input pattern other than Japanese.

(発明の効果) 以上詳述したように、本発明によれば、入力パ
タンを分析し、候補グラフを作成する処理と、候
補グラフから有意カテゴリ列候補を求める処理と
を並列して行なうことができるため、入力パタン
を入力し始めてから、認識結果を得るまでの時間
を大巾に短縮することが可能になる。また、入力
パタン全体の入力が終了する以前に有意カテゴリ
列候補を求める処理を開始することも可能とな
る。これらの効果は、実時間認識装置のような高
速な応答性が要求される場合には特に有効であ
る。
(Effects of the Invention) As detailed above, according to the present invention, the process of analyzing an input pattern and creating a candidate graph, and the process of determining significant category sequence candidates from the candidate graph can be performed in parallel. This makes it possible to significantly shorten the time from inputting an input pattern to obtaining a recognition result. Furthermore, it is also possible to start the process of finding significant category sequence candidates before the input of the entire input pattern is completed. These effects are particularly effective in cases where high-speed responsiveness is required, such as in real-time recognition devices.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示すブロツク図、
第2図はカテゴリ候補検出部の一例を示すブロツ
ク図、第3図は有意性判定部の一例を示すブロツ
ク図、第4図は候補グラフの一例を示す図であ
る。 図において、101……カテゴリ候補検出部、
102……候補グラフ作成部、103……候補グ
ラフ記憶部、104……最小累計コスト計算部、
105……評価値計算部、106……カテゴリ列
候補記憶部、107……最良カテゴリ列候補選択
部、108……カテゴリ列候補作成部、109…
…有意性判定部、110……カテゴリ列候補記憶
部、201……入力パタンバツフア、202……
母音候補検出部、203……母音辞書、204…
…子音候補検出部、205……子音辞書、206
……母音候補記憶部、301……単語辞書、30
2……単語接続表、303……判定部である。
FIG. 1 is a block diagram showing one embodiment of the present invention;
FIG. 2 is a block diagram showing an example of a category candidate detection section, FIG. 3 is a block diagram showing an example of a significance determination section, and FIG. 4 is a diagram showing an example of a candidate graph. In the figure, 101...category candidate detection unit;
102... Candidate graph creation unit, 103... Candidate graph storage unit, 104... Minimum cumulative cost calculation unit,
105... Evaluation value calculation section, 106... Category string candidate storage section, 107... Best category string candidate selection section, 108... Category string candidate creation section, 109...
...Significance determination section, 110...Category string candidate storage section, 201...Input pattern buffer, 202...
Vowel candidate detection unit, 203... Vowel dictionary, 204...
... Consonant candidate detection unit, 205 ... Consonant dictionary, 206
... Vowel candidate storage section, 301 ... Word dictionary, 30
2...word connection table, 303...determination section.

Claims (1)

【特許請求の範囲】[Claims] 1 入力パタンを分析し、当該入力パタンの各部
分に対して複数個のカテゴリ候補を検出し、当該
入力パタン中の位置情報および信頼度と共に出力
するカテゴリ候補検出手段と、前記複数個のカテ
ゴリ候補を、その位置情報に従つてカテゴリ候補
相互の位置関係および候補グラフ記憶手段にすで
に前記入力パタンの他の部分のカテゴリ候補が記
憶されている場合にはこれらのカテゴリ候補との
位置関係を保ちかつ各候補が前記信頼度を表わす
コストを持つ候補グラフを作成し、該候補グラフ
を前記候補グラフ記憶手段に格納する候補グラフ
作成手段と、前記候補グラフ記憶手段に記憶され
ている候補グラフの節点に対して現時点の終節点
までの最小累計コストを計算する最小コスト計算
手段と、第1のカテゴリ列記憶手段に記憶されて
いるカテゴリ列に対して、前記最小累計コストお
よび各候補のコストを用いて評価値を計算する評
価値計算手段と、前記第1のカテゴリ列記憶手段
から前記評価値が最良のカテゴリ列を取り出す最
良カテゴリ列選択手段と、前記最良カテゴリ列選
択手段が取り出したカテゴリ列が認識結果として
の有意性を判定し、有意なカテゴリ列を出力する
有意性判定手段と、前記有意性判定手段が出力し
た有意なカテゴリ列の終端が前記候補グラフ記憶
手段に記憶されている候補グラフの終節点でない
場合には該カテゴリ列に新たなカテゴリ候補を追
加した新たなカテゴリ列候補を一般に複数個作成
し前記第1のカテゴリ列記憶手段に追加し、該カ
テゴリ列の終端が前記候補グラフの終節点ではあ
るが入力パタンの終端でないときには該カテゴリ
列を第2のカテゴリ列記憶手段に一旦格納してお
き前記候補グラフに新たなカテゴリ候補が追加さ
れたときに処理を再開して新たなカテゴリ列を作
成し前記第1のカテゴリ列記憶手段に格納し、該
カテゴリ列の終端が入力パタンの終端に一致する
ときには該カテゴリ列を認識結果として出力する
カテゴリ列作成手段とを具備するパタン認識装
置。
1 Category candidate detection means that analyzes an input pattern, detects a plurality of category candidates for each part of the input pattern, and outputs the position information and reliability in the input pattern, and the plurality of category candidates. According to the position information, maintain the positional relationship between the category candidates and, if category candidates for other parts of the input pattern are already stored in the candidate graph storage means, maintain the positional relationship with these category candidates. candidate graph creation means for creating a candidate graph in which each candidate has a cost representing the reliability, and storing the candidate graph in the candidate graph storage means; A minimum cost calculation means for calculating the minimum cumulative cost up to the current terminal node, and a category string stored in the first category string storage means, using the minimum cumulative cost and the cost of each candidate. an evaluation value calculation means for calculating an evaluation value; a best category string selection means for taking out the category string with the best evaluation value from the first category string storage means; and a category string taken out by the best category string selection means is recognized. a significance determining means for determining the significance as a result and outputting a significant category string; and a candidate graph whose terminal end of the significant category string output by the significance determining means is stored in the candidate graph storage means. If it is not the terminal node, generally a plurality of new category string candidates are created by adding a new category candidate to the category string and added to the first category string storage means, and the end node of the category string is added to the candidate graph. If it is the terminal node but not the terminal of the input pattern, the category string is temporarily stored in the second category string storage means, and when a new category candidate is added to the candidate graph, the processing is restarted to create a new category. A pattern recognition device comprising: a category sequence creation means for creating a sequence and storing it in the first category sequence storage means, and outputting the category sequence as a recognition result when the end of the category sequence matches the end of the input pattern. .
JP59234541A 1984-11-07 1984-11-07 Pattern recognizer Granted JPS61114385A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59234541A JPS61114385A (en) 1984-11-07 1984-11-07 Pattern recognizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59234541A JPS61114385A (en) 1984-11-07 1984-11-07 Pattern recognizer

Publications (2)

Publication Number Publication Date
JPS61114385A JPS61114385A (en) 1986-06-02
JPH0570839B2 true JPH0570839B2 (en) 1993-10-05

Family

ID=16972640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59234541A Granted JPS61114385A (en) 1984-11-07 1984-11-07 Pattern recognizer

Country Status (1)

Country Link
JP (1) JPS61114385A (en)

Also Published As

Publication number Publication date
JPS61114385A (en) 1986-06-02

Similar Documents

Publication Publication Date Title
CN100449611C (en) Lexical Stress Prediction
US5884259A (en) Method and apparatus for a time-synchronous tree-based search strategy
CN108074562A (en) Speech recognition equipment, audio recognition method and storage medium
EP0200347B1 (en) Knowledge-guided automatic speech recognition apparatus and method
JPH0247760B2 (en)
EP0103258B1 (en) Pattern matching apparatus
JPH0570839B2 (en)
EP0987681B1 (en) Speech recognition method and apparatus
JPH0464077B2 (en)
JP3440840B2 (en) Voice recognition method and apparatus
RU2101782C1 (en) Method for recognition of words in continuous speech and device which implements said method
JPH08202384A (en) Speech recognizing method and apparatus therefor
US7818172B2 (en) Voice recognition method and system based on the contexual modeling of voice units
JP3039453B2 (en) Voice recognition device
JPS6147999A (en) Voice recognition system
US5956677A (en) Speech recognizer having a speech data memory storing speech data and a reference pattern memory storing partial symbol trains of words for recognition
JPS59173884A (en) pattern comparison device
KR0136426B1 (en) Speech Recognition in Hidden Markov Modeling System (HMM)
JPH0361957B2 (en)
JP2001255888A (en) Speech recognition device, speech recognition method, and storage medium storing program for implementing the method
JPS61200596A (en) Continuous voice recognition equipment
JPH0566599B2 (en)
JPH0638198B2 (en) Continuous speech recognizer
JP2003208194A (en) Voice recognition method
JPS615300A (en) Voice input unit with learning function