JPS59196A - パタ−ン比較装置 - Google Patents
パタ−ン比較装置Info
- Publication number
- JPS59196A JPS59196A JP57110527A JP11052782A JPS59196A JP S59196 A JPS59196 A JP S59196A JP 57110527 A JP57110527 A JP 57110527A JP 11052782 A JP11052782 A JP 11052782A JP S59196 A JPS59196 A JP S59196A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- frame
- monosyllable
- input
- standard pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は特徴ベクトルの系列として登録された標準パタ
ーンのそれぞれと、特徴ベクトルの系列に変換された入
カバターンとの比較を行い、入カバターンを認識するパ
ターン比較装置、特に標準パターンとしてパターンの一
部のみが異なるのみで他のパターン部分が非常に類似し
ている標準パターンの認識に適したパターン比較装置に
関する。
ーンのそれぞれと、特徴ベクトルの系列に変換された入
カバターンとの比較を行い、入カバターンを認識するパ
ターン比較装置、特に標準パターンとしてパターンの一
部のみが異なるのみで他のパターン部分が非常に類似し
ている標準パターンの認識に適したパターン比較装置に
関する。
人間にとって最も自然な情報発生手段である音声が、人
間−機械系の入力手段としで実現されることに対する期
待は大きい。近年、ワ・−ドブロセサの入力を、仮名漢
字変換の技術と組合せ、仮名キーによる入力の代りに単
音節音声の発声により実行することが訊られCいる。こ
の場庁、各単音節は孤立して発生されるが、「−タ」、
「パ」。
間−機械系の入力手段としで実現されることに対する期
待は大きい。近年、ワ・−ドブロセサの入力を、仮名漢
字変換の技術と組合せ、仮名キーによる入力の代りに単
音節音声の発声により実行することが訊られCいる。こ
の場庁、各単音節は孤立して発生されるが、「−タ」、
「パ」。
「−力」のようにそのパターンの一部が異なるのみで全
体として非常に類似した入カバターン(以下、類似パタ
ーンという)の場合、誤認識の問題が生じている。
体として非常に類似した入カバターン(以下、類似パタ
ーンという)の場合、誤認識の問題が生じている。
ところで標準パターンと入カバターンとを比較し、その
類似度や距離を計算して音声認識を行う場合、類似度や
距離の計算に動的31画法(以下、DP法という)の手
法が用いられる。この動的計画法を用いた音声認識にお
いて前記類似パターンの誤認識の問題を解決しようとす
ると、単音節1個当りの特徴ベクトルの数を増したり、
ベクトルの次元を増したりするととが必要である。しか
しながら特徴ベクトルの数や次元を増すと計算量は飛躍
的に増大し、実用化することができなくなる。
類似度や距離を計算して音声認識を行う場合、類似度や
距離の計算に動的31画法(以下、DP法という)の手
法が用いられる。この動的計画法を用いた音声認識にお
いて前記類似パターンの誤認識の問題を解決しようとす
ると、単音節1個当りの特徴ベクトルの数を増したり、
ベクトルの次元を増したりするととが必要である。しか
しながら特徴ベクトルの数や次元を増すと計算量は飛躍
的に増大し、実用化することができなくなる。
また単音節を孤立して発生した場合でなく、連続して発
生しIコ場合の認識、すなわち連続単音節認識において
は、的記問題に加えて単音節間の境界を分離するという
問題があり、これも計算量の増大に影響する。
生しIコ場合の認識、すなわち連続単音節認識において
は、的記問題に加えて単音節間の境界を分離するという
問題があり、これも計算量の増大に影響する。
このようなh]N凧の増大は音声認識をリアル戸イムで
行おうとする場合に大きな障害となる。
行おうとする場合に大きな障害となる。
本発明は以上の点に鑑み、類似パターンの認識を、計算
量をほとんど増すことなく行い、リアルタイムで人カバ
ターンの認識を行うことができるパターン比較装置を提
供することを目的とする。
量をほとんど増すことなく行い、リアルタイムで人カバ
ターンの認識を行うことができるパターン比較装置を提
供することを目的とする。
この目的を達成するために本発明は、動的計画法を用い
てパターンマツチングの計算を行う場合に、9準パター
ンの全パターン部分と人カバターンとのマツチングを行
って累積距離を求めるとともにこの累積距離の計算にお
いて同時に得られる部分的な累積距離すなわち標準パタ
ーンの特定部分と入カバターンとの累積距離を求め、^
l記2種の累積距離を用いて入カバターンの認識を乃う
ように構成している。
てパターンマツチングの計算を行う場合に、9準パター
ンの全パターン部分と人カバターンとのマツチングを行
って累積距離を求めるとともにこの累積距離の計算にお
いて同時に得られる部分的な累積距離すなわち標準パタ
ーンの特定部分と入カバターンとの累積距離を求め、^
l記2種の累積距離を用いて入カバターンの認識を乃う
ように構成している。
以下、第1図を用いて本発明の原理について連続単音節
認識を例にとり説明する。
認識を例にとり説明する。
第1図は入カバターンの第1フレームを始端として標準
パターンである単音節nとマツチングした場合のマツチ
ングの様子をポしたものである。
パターンである単音節nとマツチングした場合のマツチ
ングの様子をポしたものである。
すなわち、41口はそれぞれ傾きL−′2、2の直線で
マツチングはこの両者の直線で囲まれた領域で行われる
。この領域は必要な認識精度siil算速変速度を考慮
して定められる。第1図の場合は標準パターン長に対し
人カバターンが0.5〜2の範囲で変化するのを許要す
るように定めたものである。
マツチングはこの両者の直線で囲まれた領域で行われる
。この領域は必要な認識精度siil算速変速度を考慮
して定められる。第1図の場合は標準パターン長に対し
人カバターンが0.5〜2の範囲で変化するのを許要す
るように定めたものである。
ハは第1フレームを始端とし、第1フレームを終端とし
たときのマツチングの径路を示している。
たときのマツチングの径路を示している。
inは標準パターンnを構成する単音節の子音部とIす
音部を分けるフレームであって、標準パターンとしてこ
の子音部を登録するときに同時に登録しておくものであ
る。従って、α録04音節nの第1フレームから第++
フし・−ノ\まではその単音節の子音部、第j”+iフ
レームから第JIIフレーl\まではその1(1音節の
fU、′ff部ということになる。eは径路ハにおいて
、j”′に対応する人カバターンのフレームである。
音部を分けるフレームであって、標準パターンとしてこ
の子音部を登録するときに同時に登録しておくものであ
る。従って、α録04音節nの第1フレームから第++
フし・−ノ\まではその単音節の子音部、第j”+iフ
レームから第JIIフレーl\まではその1(1音節の
fU、′ff部ということになる。eは径路ハにおいて
、j”′に対応する人カバターンのフレームである。
ここで、第1〜1フレーノ\までの入カバターンと、各
標準パターンの最適な組み合せの結合バタの −ン罎パターン間の距離(以下、最小累積距離という)
をI)(1)とする。従ってこのD(i)は両者の類似
の程度を表わす尺度として用いられ、次の式で定義され
る。
標準パターンの最適な組み合せの結合バタの −ン罎パターン間の距離(以下、最小累積距離という)
をI)(1)とする。従ってこのD(i)は両者の類似
の程度を表わす尺度として用いられ、次の式で定義され
る。
なお、I)(i′−1)は入カバターンの第i′−1フ
レームまでの最小累積距離であり、D:(i′:i)は
標準パターンnに対し、入カバターンの第1〜1フレー
ノ\のパターン(以下、部分入カバタ1)ぐターン ンという)との、間の距#E(以下、部分距離という)
である。
レームまでの最小累積距離であり、D:(i′:i)は
標準パターンnに対し、入カバターンの第1〜1フレー
ノ\のパターン(以下、部分入カバタ1)ぐターン ンという)との、間の距#E(以下、部分距離という)
である。
従来のDP法を用いたパターン比較装置においては前記
D(i)を決定するのにD(i′−1)l−11;(i
′:i)を最小にするi′(−′r′)とn(□′+マ
)をNについて求めたのであるが、本発明のパターン比
較装置においてはD8(i′:l)のみでなく、子音部
のみの1マツチンク結果、すなわち第1〕・−eフレー
ムのパターン間の距離をも加味してI)(1)、n(i
)、N(1)を求めるものである。なお、B(1)−♀
′1eN(i)=Itである。本発明における■)(1
)としては例えば以下のものがある。第1図の量−j平
面において、D?o(1′tj)を径路ハに沿う始点(
c、j”)から点(1′、j)までのパ・9一ン間の距
削、L”(I′、j)を第1フレームから第1フレーム
までの入力のフレーム数とするとき、D′io(h、1
)/L”(b、1)と■3′(1)との荷重和(Jソ、
下余白) が最小になる単音節11(−n)を求め、1)(i)−
=D(b1)+D5(b:+)・・・・・・・・・・・
・・・・・・・・(3)B(1)i−b−] N(i)=−9 とす°る。
D(i)を決定するのにD(i′−1)l−11;(i
′:i)を最小にするi′(−′r′)とn(□′+マ
)をNについて求めたのであるが、本発明のパターン比
較装置においてはD8(i′:l)のみでなく、子音部
のみの1マツチンク結果、すなわち第1〕・−eフレー
ムのパターン間の距離をも加味してI)(1)、n(i
)、N(1)を求めるものである。なお、B(1)−♀
′1eN(i)=Itである。本発明における■)(1
)としては例えば以下のものがある。第1図の量−j平
面において、D?o(1′tj)を径路ハに沿う始点(
c、j”)から点(1′、j)までのパ・9一ン間の距
削、L”(I′、j)を第1フレームから第1フレーム
までの入力のフレーム数とするとき、D′io(h、1
)/L”(b、1)と■3′(1)との荷重和(Jソ、
下余白) が最小になる単音節11(−n)を求め、1)(i)−
=D(b1)+D5(b:+)・・・・・・・・・・・
・・・・・・・・(3)B(1)i−b−] N(i)=−9 とす°る。
たlごしI)”(i)は式(1)でnを固定し、i′に
ついてのみへ1小化したものであり、そのときのi′を
bとしている。
ついてのみへ1小化したものであり、そのときのi′を
bとしている。
まlこD(i)とし−C以「のように定義することもで
きる。
きる。
B(1)=i′−1
N(i)=n
ただしIInは式(31を満たすi′およびnである。
以上の原理を用いた本発明の実施例について、以下、説
明する。
明する。
第2図は本発明のパターン比較装置を連続単音節音声の
認識に適用した場合の一実施例を示すブロック図である
。
認識に適用した場合の一実施例を示すブロック図である
。
図において、音声信号入力端子01に入力された音声信
号は、特徴抽出部Qυで特徴ベクトルの系列A”=al
a2・・・・・・alに変換される。0埠はこのそれぞ
れの特徴ベクトルを母音とみなして認識する母音認識部
で、0葎は母音認識部02で前記特徴ベクトルを母音と
みなして認識するために必要な識別函数を記憶している
識別函数記憶部である。識別函数による認識は通常の良
く知られたパターン認識の手法がそのまま使用される。
号は、特徴抽出部Qυで特徴ベクトルの系列A”=al
a2・・・・・・alに変換される。0埠はこのそれぞ
れの特徴ベクトルを母音とみなして認識する母音認識部
で、0葎は母音認識部02で前記特徴ベクトルを母音と
みなして認識するために必要な識別函数を記憶している
識別函数記憶部である。識別函数による認識は通常の良
く知られたパターン認識の手法がそのまま使用される。
0→は母音認識部0埠で前記のように母音として認識さ
れた結果をフレーム番号と共に記憶する母音認識結果記
憶部である。θeは単音節標準パターン記憶部で、それ
ぞれの単音節は特徴ベクトルの系列の形で記憶されてい
る。0ゆは入力音声信号の第iフレームにおいて、単音
節標準パターン記憶部09に記憶されている第n単音節
bn、br・・・・・1)?hを構成するベクトルのそ
れぞれと、特徴抽出部01)の出力の特徴ベクトルの系
列al−2JII+Ial−2Jn+2°”””aIの
それぞれのベクトルとのベクトル距”d″(”*j)(
1−2J”−1−1<1′<i)を第1図の直線42口
で囲まれた部分についてH1算し、その計算結果を一時
的に記憶するベクトル間11”J4111ff計算部で
ある。ベクトルal′=(altad2.・−*atb
s)とベクトルb”、=(l弓)e162、、。
れた結果をフレーム番号と共に記憶する母音認識結果記
憶部である。θeは単音節標準パターン記憶部で、それ
ぞれの単音節は特徴ベクトルの系列の形で記憶されてい
る。0ゆは入力音声信号の第iフレームにおいて、単音
節標準パターン記憶部09に記憶されている第n単音節
bn、br・・・・・1)?hを構成するベクトルのそ
れぞれと、特徴抽出部01)の出力の特徴ベクトルの系
列al−2JII+Ial−2Jn+2°”””aIの
それぞれのベクトルとのベクトル距”d″(”*j)(
1−2J”−1−1<1′<i)を第1図の直線42口
で囲まれた部分についてH1算し、その計算結果を一時
的に記憶するベクトル間11”J4111ff計算部で
ある。ベクトルal′=(altad2.・−*atb
s)とベクトルb”、=(l弓)e162、、。
*16M、!:(7J距離d′(itJ)ハ例7Li、
fd”(IIj)−1′フレームからiフレームまでの
ベクトルの系列a+′a+′++′−′−at(i−2
J′罫1<+′<+−−J”)よりなるパターンと第n
!Ji音節bnbr:、・・・b”i、とのマ)ヂング
距離D:(i′:I)と、子音部のみのマツチング距m
+r7o(H′、1)と、子音部の入力方向のフレーム
数1r(i′、1)とをベクトル間距離計算部0呻の出
力から計算し、その結果を一時的に記憶する部分累積距
離計算部である。なおり奮(i′:I)は次のように計
算される。
fd”(IIj)−1′フレームからiフレームまでの
ベクトルの系列a+′a+′++′−′−at(i−2
J′罫1<+′<+−−J”)よりなるパターンと第n
!Ji音節bnbr:、・・・b”i、とのマ)ヂング
距離D:(i′:I)と、子音部のみのマツチング距m
+r7o(H′、1)と、子音部の入力方向のフレーム
数1r(i′、1)とをベクトル間距離計算部0呻の出
力から計算し、その結果を一時的に記憶する部分累積距
離計算部である。なおり奮(i′:I)は次のように計
算される。
マツチング径路の拘束条件として第8図に示すものを用
いた場合、始点(i、J・・)から(i′、j)までの
パターン間の距離Djl′(1′l、l)は次のように
なる。すなわち標準パターンnの第jフレームに対応す
る人カバターンのフレームi′の範囲は第1図に示すよ
うに であるから、この範囲のi′に対して j=argmln(1)′;(i′−H,j′))−=
−−(41」<、j′−、j+2 D′:(+′*J)”=Dri(i′+le3)+(1
”(+*3)・・・・・・(5)なる漸化式を Dt(i、Jn)−dn(i9.■n)・・・・・・・
・・・・・・・・・(6)を初期値として解く。ここで
、argmin()なる記法は(二〕内の値を最小にす
るXという意味である。従って、 D3(*′:i)−L)S′(+′、1)−=−−−(
7)となる。
いた場合、始点(i、J・・)から(i′、j)までの
パターン間の距離Djl′(1′l、l)は次のように
なる。すなわち標準パターンnの第jフレームに対応す
る人カバターンのフレームi′の範囲は第1図に示すよ
うに であるから、この範囲のi′に対して j=argmln(1)′;(i′−H,j′))−=
−−(41」<、j′−、j+2 D′:(+′*J)”=Dri(i′+le3)+(1
”(+*3)・・・・・・(5)なる漸化式を Dt(i、Jn)−dn(i9.■n)・・・・・・・
・・・・・・・・・(6)を初期値として解く。ここで
、argmin()なる記法は(二〕内の値を最小にす
るXという意味である。従って、 D3(*′:i)−L)S′(+′、1)−=−−−(
7)となる。
また、この41算を行っているとき、同時にDl。
C+′ej、l、I−′(+′9J、)も求める。すな
わち、1)j=j“(またはj=J−1かつj=J1−
1)のときは ■)to(i′、j)−4n(i′、j)・・・・・・
・・・・・・・・・・・・(8)I−”(1′$3)=
′・・・・・・・・・・・・・・・・・(9)2)■)
以外のj<j”−1に対し′Cは1)70(i′、j)
:=DYo口′H,j)+d(i′、j)−01L”(
i′、j)−L′(i′ll、j)11=・・・・=−
・(++)なる計算をするのである。従って、DS′0
(i′ej)はI)ro(1′:l)を求めたときの径
路に沿ったj=jnまたはJ=j“−1からjまでの子
音部のみの累積マツチング距離として求まり、L“”C
+′*j)はj=j′またはj=j′−1からjまでの
前記径路の入力方向のフレームの数として求まる。単音
節nに対する第i′フレームから第iフレームまでの入
カバターンの子音部のみのマツチング結果はDig(+
′e1)*記項目1は、子音部の始点が、マツチング径
路がjnを通るときはjt″であり、nを通らないとき
はjn−1となることを意味している。
わち、1)j=j“(またはj=J−1かつj=J1−
1)のときは ■)to(i′、j)−4n(i′、j)・・・・・・
・・・・・・・・・・・・(8)I−”(1′$3)=
′・・・・・・・・・・・・・・・・・(9)2)■)
以外のj<j”−1に対し′Cは1)70(i′、j)
:=DYo口′H,j)+d(i′、j)−01L”(
i′、j)−L′(i′ll、j)11=・・・・=−
・(++)なる計算をするのである。従って、DS′0
(i′ej)はI)ro(1′:l)を求めたときの径
路に沿ったj=jnまたはJ=j“−1からjまでの子
音部のみの累積マツチング距離として求まり、L“”C
+′*j)はj=j′またはj=j′−1からjまでの
前記径路の入力方向のフレームの数として求まる。単音
節nに対する第i′フレームから第iフレームまでの入
カバターンの子音部のみのマツチング結果はDig(+
′e1)*記項目1は、子音部の始点が、マツチング径
路がjnを通るときはjt″であり、nを通らないとき
はjn−1となることを意味している。
0枠は第iフレームが最終フレームと仮定したとき、最
終単音節がnのときのi=1からの累積距離D”(i)
と単音節nのバックポインタB“(1)をd1算すると
ともにそれらを記憶する累積距離81算部であるすなわ
ち、 i′=argmin(1)(i′−1)月JS(i′:
i))−(II7つλ″) 1)′(1)=IN+1)+D3(+:l)・・・・・
・・・・・(11B“(1)=i′−1・・・−・・・
・・・・・・・・・・・(+4として求まる。
終単音節がnのときのi=1からの累積距離D”(i)
と単音節nのバックポインタB“(1)をd1算すると
ともにそれらを記憶する累積距離81算部であるすなわ
ち、 i′=argmin(1)(i′−1)月JS(i′:
i))−(II7つλ″) 1)′(1)=IN+1)+D3(+:l)・・・・・
・・・・・(11B“(1)=i′−1・・・−・・・
・・・・・・・・・・・(+4として求まる。
OIは最後尾単音節母音フレーム81算部であって、0
→、αカ、(ト)における計算をn=1,2.・・・・
、Nについて実行した結果から、最後尾単音節をn=a
rgminj−D”(i)II として求めると共に、単音節分に対し、そのマツチング
径路に関し、jnに対応する入力フレームと第1フレー
ムの中点(母音の定常部に相当)i′を求めるものであ
る。なお簡便なi′の決め方として、第1フレームから
一定数のフレームを潤ったフレームとして決めることが
できる。
→、αカ、(ト)における計算をn=1,2.・・・・
、Nについて実行した結果から、最後尾単音節をn=a
rgminj−D”(i)II として求めると共に、単音節分に対し、そのマツチング
径路に関し、jnに対応する入力フレームと第1フレー
ムの中点(母音の定常部に相当)i′を求めるものであ
る。なお簡便なi′の決め方として、第1フレームから
一定数のフレームを潤ったフレームとして決めることが
できる。
?1は候補単音節発生部であって、最後尾単音節母音フ
レーム計算部0呻で計算されたi#に対し、既に第1′
フレームが何れの母音であったか記憶されている母音認
識結果記憶部θ→の第i′フレームに対応する出力から
、その母音を母音部としてもつ単音節を発生するもので
ある7、 Ql)はこの候補単音節をkとするとき、1)、o(B
(i)−1−t、+)、T−(R(i)l−1*1)を
部分累積距離計算部Qカから読み出し、1)k(i)を
累積距離計算部0綽から読み出]ッ、WI、w2を重み
係数とするとき、 ・・・・(ハ) を#I算する最後尾単音節決定部である。このようにし
て、第iフレームにおける最後尾r(を音節はζである
と決定される。
レーム計算部0呻で計算されたi#に対し、既に第1′
フレームが何れの母音であったか記憶されている母音認
識結果記憶部θ→の第i′フレームに対応する出力から
、その母音を母音部としてもつ単音節を発生するもので
ある7、 Ql)はこの候補単音節をkとするとき、1)、o(B
(i)−1−t、+)、T−(R(i)l−1*1)を
部分累積距離計算部Qカから読み出し、1)k(i)を
累積距離計算部0綽から読み出]ッ、WI、w2を重み
係数とするとき、 ・・・・(ハ) を#I算する最後尾単音節決定部である。このようにし
て、第iフレームにおける最後尾r(を音節はζである
と決定される。
(ハ)は最後尾+11音節記憶部であって、N(i)=
・k としで記憶される。
・k としで記憶される。
また、最後尾単音節が′iであると決定されると、累積
距離計算部0樽に記憶されているDk(1)91′、k
(i)がそれぞれ累積距離記憶部(ハ)、バツクボイン
ク記憶部(ハ)に記憶される。累積距離計算部(11に
おいて求められる式(ハ)の計算中のD(1′−1)は
、この累積距離記憶部軸に前記のようにして既に記憶さ
れているものである。ただしD(0)=0である。
距離計算部0樽に記憶されているDk(1)91′、k
(i)がそれぞれ累積距離記憶部(ハ)、バツクボイン
ク記憶部(ハ)に記憶される。累積距離計算部(11に
おいて求められる式(ハ)の計算中のD(1′−1)は
、この累積距離記憶部軸に前記のようにして既に記憶さ
れているものである。ただしD(0)=0である。
(2)は音声区間検出部であって、入力信号の大きさ等
から音声区間を判定するものであり、この音声区間検出
部(ハ)が音声入力が開始された仁とを検出すると、フ
レーム数計数器(ハ)は、フレーム毎に計数をはじめる
。前記母音認識より最後尾単音節の決定までの処理は第
1フレームについての処理であったが、このフレーム数
計数器(ハ)の旧数値がすなわちこのiを設定している
。従って、前記と同様の処理がフレームが1進む毎に行
われることになる。フレーム数記数器(至)は音声区間
が検出されると計数を始め、音声区間が終了するとリセ
ットされる。最後尾単音節記憶部(イ)、バックポイン
タ記憶部(ハ)には、従って、N(])、B(i)が1
=1゜2、・・・・・・、■について記憶されることに
なる。
から音声区間を判定するものであり、この音声区間検出
部(ハ)が音声入力が開始された仁とを検出すると、フ
レーム数計数器(ハ)は、フレーム毎に計数をはじめる
。前記母音認識より最後尾単音節の決定までの処理は第
1フレームについての処理であったが、このフレーム数
計数器(ハ)の旧数値がすなわちこのiを設定している
。従って、前記と同様の処理がフレームが1進む毎に行
われることになる。フレーム数記数器(至)は音声区間
が検出されると計数を始め、音声区間が終了するとリセ
ットされる。最後尾単音節記憶部(イ)、バックポイン
タ記憶部(ハ)には、従って、N(])、B(i)が1
=1゜2、・・・・・・、■について記憶されることに
なる。
セグメンテーション部(財)はバックポインタ記憶部(
ハ)に対し、所定のバックポインタを読み出すべき命令
を発するものである。すなわち、セグメンテーション部
に)がiなる値をバックポインタ記憶部(ハ)に発する
と、バックポインタ記憶部(財)からはバックポインタ
B(i)が読み出される。セグメンテーション部に)は
バックポインタ記憶部(ハ)からB(1)なる値を受は
取ると、その同じ値をバックポインタ記憶部(ハ)に発
する。従って、音声区間検出部@が音声入力の終了を検
知すると、フレーム数計数器に)の最終値■がセグメン
テーション部(財)に供給され、セグメンテーション部
(財)は先ずIなる値をバックポインタ記憶部(ハ)に
発する。以後、前記説明の動作に従って、バックポイン
タ記憶部(ハ)には、、B(1)、B(B(1))、B
(B(B(1)))、・・・・・・。
ハ)に対し、所定のバックポインタを読み出すべき命令
を発するものである。すなわち、セグメンテーション部
に)がiなる値をバックポインタ記憶部(ハ)に発する
と、バックポインタ記憶部(財)からはバックポインタ
B(i)が読み出される。セグメンテーション部に)は
バックポインタ記憶部(ハ)からB(1)なる値を受は
取ると、その同じ値をバックポインタ記憶部(ハ)に発
する。従って、音声区間検出部@が音声入力の終了を検
知すると、フレーム数計数器に)の最終値■がセグメン
テーション部(財)に供給され、セグメンテーション部
(財)は先ずIなる値をバックポインタ記憶部(ハ)に
発する。以後、前記説明の動作に従って、バックポイン
タ記憶部(ハ)には、、B(1)、B(B(1))、B
(B(B(1)))、・・・・・・。
0なる出力が順次得られることになる。これらの値は、
最後から2番目の単音節の終りのフレーム、同8番目の
終りのフレーム、同4番目の終りのフレーム、・・・・
・・というものであり、N(1)はiフレームで終る単
音節であったから、この値をそのまま最後尾単音節記憶
部に)に与えると、最後の単音節から逆の順序で認識結
果が得られることになる、なお、これを避けるtこめに
は、この順序の変換をバックポインタ記憶部(ハ)の出
力に対して行うか、最後尾単音節記憶部(イ)の出力に
対して行えばよい。
最後から2番目の単音節の終りのフレーム、同8番目の
終りのフレーム、同4番目の終りのフレーム、・・・・
・・というものであり、N(1)はiフレームで終る単
音節であったから、この値をそのまま最後尾単音節記憶
部に)に与えると、最後の単音節から逆の順序で認識結
果が得られることになる、なお、これを避けるtこめに
は、この順序の変換をバックポインタ記憶部(ハ)の出
力に対して行うか、最後尾単音節記憶部(イ)の出力に
対して行えばよい。
第4図は前記実施例装置の機能をソフトウェアで実現し
た場合のフローチャートであり、以下前記実施例装置の
各部の動作と結びつけて説明する。
た場合のフローチャートであり、以下前記実施例装置の
各部の動作と結びつけて説明する。
ステップ101は初期値設定であって、累積距離記憶部
(至)においてD(0)=Oであることを示す、。
(至)においてD(0)=Oであることを示す、。
ステップ102は入力のフレーム番号であって、1=1
.2.・・・・・・、■のそれぞれについてステップ1
08〜121の処理が行われる。実際にはこの値はフレ
ーム数81数器に)で設定される。
.2.・・・・・・、■のそれぞれについてステップ1
08〜121の処理が行われる。実際にはこの値はフレ
ーム数81数器に)で設定される。
ステップ10Bは各フレームiを母音とみなして認識す
る部分であって、19音認識部(IJ、母音認識結果記
憶部α4で行う動作である。
る部分であって、19音認識部(IJ、母音認識結果記
憶部α4で行う動作である。
ステップ105は認識すべき単音節n=1.2゜・・、
Nについ′Cステップ105〜117の処理を行うこと
を示している。
Nについ′Cステップ105〜117の処理を行うこと
を示している。
ステップ106、10′l、108は、ベクトル間距離
計算部0Qの動作を示し、第7図の直線49口で囲まれ
た部分について、標準パターンと入カバターンの対応す
る特徴ベクトルの間の距離を求める。
計算部0Qの動作を示し、第7図の直線49口で囲まれ
た部分について、標準パターンと入カバターンの対応す
る特徴ベクトルの間の距離を求める。
ステップ109〜116は部分累積距離計箕部いの動作
であって、r′AI記範囲定範囲て1式(i′:i)、
T):。
であって、r′AI記範囲定範囲て1式(i′:i)、
T):。
”e′)*7−′(1′@I)を計算する部分である。
ステップ117は累積距離計算部θ績の動作を示し、最
後尾用語をnとしたときの累積距離D”(i)とそのと
きのバックポインタBn(i)を計7する部分である。
後尾用語をnとしたときの累積距離D”(i)とそのと
きのバックポインタBn(i)を計7する部分である。
ステップ118〜119は最後尾単音節母音フし・−ム
計算部OIIの動作であって、ステップ117の結果か
ら最適の最後尾単音節を決定し、そのときの母音とおぼ
しきフレームi′を前記の方法で求める部分である。
計算部OIIの動作であって、ステップ117の結果か
ら最適の最後尾単音節を決定し、そのときの母音とおぼ
しきフレームi′を前記の方法で求める部分である。
ステップ120はステップ119で求めたi′フレーム
が何れの母音であったかはステップ108の結果を参照
すればわかるから、その母音段の単音節kについて、最
適のものを見つけ出す部分であって、この計算は最後尾
単音節決定部6!pで行っているステップ121はステ
ップ120で求まった最適の単音節kに対し、N(i)
=にとして最後尾単音節記憶部に)に、D(1)−D↑
(1)として累積距離記憶部&1に、B(()二Bk(
i)としてバックポインタ記憶部(ハ)にそれぞれ格納
されることを示している。
が何れの母音であったかはステップ108の結果を参照
すればわかるから、その母音段の単音節kについて、最
適のものを見つけ出す部分であって、この計算は最後尾
単音節決定部6!pで行っているステップ121はステ
ップ120で求まった最適の単音節kに対し、N(i)
=にとして最後尾単音節記憶部に)に、D(1)−D↑
(1)として累積距離記憶部&1に、B(()二Bk(
i)としてバックポインタ記憶部(ハ)にそれぞれ格納
されることを示している。
ステップ122〜125は以上のようにして求められた
N(i)、B(1)から逆の順序で単音節の認識結果を
求める部分である。
N(i)、B(1)から逆の順序で単音節の認識結果を
求める部分である。
以上のように本実施例においては、連続して発声された
音声を精度よく単音節列に変換することができ、音声タ
イプライタ等への応用が可能となる。
音声を精度よく単音節列に変換することができ、音声タ
イプライタ等への応用が可能となる。
また本実施例においては母音部の認識を先に行い、その
結果を用いてア段、イ段、つ段、二段。
結果を用いてア段、イ段、つ段、二段。
オ段のいずれの単音節であるかを決めているので、全パ
ターンに対する荷重和を求める必要がなくなり、計算量
は115に削減されCいる。さらに母音部の認識方法と
して精度の高い方法が採用できるので認識率を向上する
ことができる。
ターンに対する荷重和を求める必要がなくなり、計算量
は115に削減されCいる。さらに母音部の認識方法と
して精度の高い方法が採用できるので認識率を向上する
ことができる。
なお、前記実施例においては、子音プラス母音のいオ〕
ゆるCvを単位とする単音節にづいて説明したが、VC
V(母音十子音十母音)を単位とする場合にも本発明は
適用することができる。この場合、第5図に示すように
、j”tjn2を標準パターンの子音部と母音部の境界
とするとき、マツチング径路翰において、j−j02〜
1の部分の累積距離からj−j′I〜1の部分の累積距
離を差し引いたものをjr+I□jn2の累積距離とし
て評価すればよい。j′n2〜1′あるいはjilIの
部分の累積距離は、Cvの場合のjnをjn2あるいは
j71におきかえればよいから、結局前記実施例におい
て次のiiキ換えをすればよいだけである。すなわち、
jnl〜1の間の累積距離は、前記実施例において、j
nをjn1,Ln(i′,J)をLn1(i′,j),
Dn0(i′,j)をDn10(+′#3)にそれぞれ
おきかえればよく、jn2〜1の間の累積距離は、jo
をj′pL′(PI))をL′′(Lj)e′:o(t
′sj)をDH)(PpJ)にそれぞれおきかえればよ
い。従って、子音部のみの累積距離DI″o(b。
ゆるCvを単位とする単音節にづいて説明したが、VC
V(母音十子音十母音)を単位とする場合にも本発明は
適用することができる。この場合、第5図に示すように
、j”tjn2を標準パターンの子音部と母音部の境界
とするとき、マツチング径路翰において、j−j02〜
1の部分の累積距離からj−j′I〜1の部分の累積距
離を差し引いたものをjr+I□jn2の累積距離とし
て評価すればよい。j′n2〜1′あるいはjilIの
部分の累積距離は、Cvの場合のjnをjn2あるいは
j71におきかえればよいから、結局前記実施例におい
て次のiiキ換えをすればよいだけである。すなわち、
jnl〜1の間の累積距離は、前記実施例において、j
nをjn1,Ln(i′,J)をLn1(i′,j),
Dn0(i′,j)をDn10(+′#3)にそれぞれ
おきかえればよく、jn2〜1の間の累積距離は、jo
をj′pL′(PI))をL′′(Lj)e′:o(t
′sj)をDH)(PpJ)にそれぞれおきかえればよ
い。従って、子音部のみの累積距離DI″o(b。
1)、入力軸方向の長さL′(b、′1)は次のように
なる。
なる。
D;′O(be1)−Dlo(be1)Dbo(L1)
Ln(b、1)=L(b、1)−L(b、1)=g−f
第2図に示した実施例装置における部分累積距離計算部
αカを以上の動作を行う機能を有するものに置き換えれ
ば、前記実施例装置はそのままvCVを標準パターンと
する場合のものになる。
Ln(b、1)=L(b、1)−L(b、1)=g−f
第2図に示した実施例装置における部分累積距離計算部
αカを以上の動作を行う機能を有するものに置き換えれ
ば、前記実施例装置はそのままvCVを標準パターンと
する場合のものになる。
また本発明は実施例としては連続して発声された単音節
の認識について説明したが、孤立して発声された単音節
の認識にも用いることができ、単音節全体としてのマツ
チング結果と、子音部のみのマツチング結果の両方から
最終的な認識結果を得ることができる。すなわち、入力
音声が単に1つの単音節であ“ちと仮定すれば、本発明
はそのまま孤立単音節音声の認識に適用することができ
る。
の認識について説明したが、孤立して発声された単音節
の認識にも用いることができ、単音節全体としてのマツ
チング結果と、子音部のみのマツチング結果の両方から
最終的な認識結果を得ることができる。すなわち、入力
音声が単に1つの単音節であ“ちと仮定すれば、本発明
はそのまま孤立単音節音声の認識に適用することができ
る。
またマツチング方法としては2段DP法を用いた実施例
について説明したが、その他のDPマツチングの手法を
用いたマツチング方法を用いてもよい。
について説明したが、その他のDPマツチングの手法を
用いたマツチング方法を用いてもよい。
また実施例では単音節音声について説明したが、ベクト
ルの系列で表わされるあらゆるパターンのマツチングに
本発明は用いることができる。
ルの系列で表わされるあらゆるパターンのマツチングに
本発明は用いることができる。
以上のように本発明のパターン比較装置は標準パターン
と入カバターンの全体としての動的計画法によるマツチ
ング結果と、この全体としてのマツチング結果の計算の
過程で得られる標準パターンの一部分とそれに対応する
入カバターンの一部分のマツチング結果とを用いて入カ
バターンに最も近い標準パターンを識別するように構成
したので、蚕体として類似し、一部のみが微妙に異なる
ような入カバターンの識別を計算量をほとんど増すこと
なく行うことができる。
と入カバターンの全体としての動的計画法によるマツチ
ング結果と、この全体としてのマツチング結果の計算の
過程で得られる標準パターンの一部分とそれに対応する
入カバターンの一部分のマツチング結果とを用いて入カ
バターンに最も近い標準パターンを識別するように構成
したので、蚕体として類似し、一部のみが微妙に異なる
ような入カバターンの識別を計算量をほとんど増すこと
なく行うことができる。
第1図ば本発明の詳細な説明するための図、第2図は本
発明におけるパターン比較装置の一実施例のブロック図
、第8図はマツチング径路の拘束条件を示す図、第4図
は第2図に示した実施例装置の機能を実現したソフトウ
ェアのフローチャート、第5図は標準パターンがVCV
音節の場合の説明図である。 0υ・・・・・・・・・特徴抽出部、αQ:・・・・・
・・単音節標準パターン記憶部、0Q・・・・・・・・
・ベクトル間距離計算部、θ乃・・・・・・・・・部分
累積距離計算部、0→・・・・・・・・・累積距離計算
部、シ0・・・・・・・・・最後尾単音節決定部、翰・
・・・最後尾単音節記憶部、勾・・・・・・・・・累積
距離記憶部、(ハ)・・・・・・・・・バックポインタ
記憶部、(ハ)・・・・・・・・音声区間検出部、(ホ
)・・・・・・・・フレーム数計数器、(財)・・・・
・・・セグメンテーション部。 代理人森本義弘 第1図 第3図 第5図 上院yl、<
発明におけるパターン比較装置の一実施例のブロック図
、第8図はマツチング径路の拘束条件を示す図、第4図
は第2図に示した実施例装置の機能を実現したソフトウ
ェアのフローチャート、第5図は標準パターンがVCV
音節の場合の説明図である。 0υ・・・・・・・・・特徴抽出部、αQ:・・・・・
・・単音節標準パターン記憶部、0Q・・・・・・・・
・ベクトル間距離計算部、θ乃・・・・・・・・・部分
累積距離計算部、0→・・・・・・・・・累積距離計算
部、シ0・・・・・・・・・最後尾単音節決定部、翰・
・・・最後尾単音節記憶部、勾・・・・・・・・・累積
距離記憶部、(ハ)・・・・・・・・・バックポインタ
記憶部、(ハ)・・・・・・・・音声区間検出部、(ホ
)・・・・・・・・フレーム数計数器、(財)・・・・
・・・セグメンテーション部。 代理人森本義弘 第1図 第3図 第5図 上院yl、<
Claims (1)
- 【特許請求の範囲】 1、人力信号を特徴ベクトルal(i=1.2.・・・
・・。 ■)の時系列に変換する特徴抽出手段と、標準パターン
l1=Jb2・・・・I)Jn(n==1、2.−・・
・−。 N)を記憶する標準パターン記憶手段と、前記標準パタ
ーンのそれぞれと、前記特徴ベクトル町の系列で表わさ
れた入カバターンとの動的81画法を用いたマツチング
結果を行うマツチング計算手段と、標準パターンと入カ
バターンの全体としてのマツチング結果と、それぞれの
標準パターンの登録時に予め指定されている各標準パタ
ーンの一部分と対応する入カバターンの一部分とのマツ
チング結果とから、前記入カバターンに最も近い標準パ
ターンを識別する手段とを備えたことを特徴とするパタ
ーン比較装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57110527A JPS59196A (ja) | 1982-06-25 | 1982-06-25 | パタ−ン比較装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57110527A JPS59196A (ja) | 1982-06-25 | 1982-06-25 | パタ−ン比較装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS59196A true JPS59196A (ja) | 1984-01-05 |
| JPH0247756B2 JPH0247756B2 (ja) | 1990-10-22 |
Family
ID=14538059
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57110527A Granted JPS59196A (ja) | 1982-06-25 | 1982-06-25 | パタ−ン比較装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS59196A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60164798A (ja) * | 1984-02-03 | 1985-08-27 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | 単音節音声認識方法 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5255413A (en) * | 1975-10-31 | 1977-05-06 | Nec Corp | Continous voice recognition equipment |
| JPS5255414A (en) * | 1975-10-31 | 1977-05-06 | Nec Corp | Continuous voice recognition equipment |
| JPS54145409A (en) * | 1978-05-06 | 1979-11-13 | Hiroya Fujisaki | Monosyllable speech recognition system |
-
1982
- 1982-06-25 JP JP57110527A patent/JPS59196A/ja active Granted
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5255413A (en) * | 1975-10-31 | 1977-05-06 | Nec Corp | Continous voice recognition equipment |
| JPS5255414A (en) * | 1975-10-31 | 1977-05-06 | Nec Corp | Continuous voice recognition equipment |
| JPS54145409A (en) * | 1978-05-06 | 1979-11-13 | Hiroya Fujisaki | Monosyllable speech recognition system |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60164798A (ja) * | 1984-02-03 | 1985-08-27 | インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション | 単音節音声認識方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0247756B2 (ja) | 1990-10-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN113327574B (zh) | 一种语音合成方法、装置、计算机设备和存储介质 | |
| US6236965B1 (en) | Method for automatically generating pronunciation dictionary in speech recognition system | |
| Vicens | Aspects of speech recognition by computer | |
| EP0265692B1 (en) | System for continuous speech recognition | |
| Kohonen et al. | Microprocessor implementation of a large vocabulary speech recognizer and phonetic typewriter for Finish and Japanese | |
| Paliwal | Lexicon-building methods for an acoustic sub-word based speech recognizer | |
| JPS59196A (ja) | パタ−ン比較装置 | |
| Park et al. | Real-time continuous phoneme recognition system using class-dependent tied-mixture hmm with hbt structure for speech-driven lip-sync | |
| JP3129164B2 (ja) | 音声認識方法 | |
| JP2006040150A (ja) | 音声データ検索装置 | |
| JPH0283595A (ja) | 音声認識方法 | |
| Sugamura et al. | Japanese text input system based on continuous speech recognition | |
| JPH0247757B2 (ja) | ||
| JP2019219598A (ja) | 音声認識装置、音声認識方法及びプログラム | |
| JPH07113838B2 (ja) | 音声認識方法 | |
| Olusanya | Tone in Yoruba ASR: Evaluating the Impact of Tone Recognition on Transformer-Based ASR Models | |
| Chetouani et al. | Learning vector quantization and neural predictive coding for nonlinear speech feature extraction | |
| JPH0333280B2 (ja) | ||
| JPH0552516B2 (ja) | ||
| Zhou et al. | Multisegment multiple VQ codebooks-based speaker independent isolated-word recognition using unbiased mel cepstrum | |
| CN120431913A (zh) | 一种人员密集环境下语音的语义解析方法 | |
| JPH0320759B2 (ja) | ||
| JP2951332B2 (ja) | 音声認識における文節候補削減方式 | |
| JPS60150098A (ja) | 音声認識装置 | |
| JPS60182499A (ja) | 音声認識装置 |