JPS6131477B2 - - Google Patents
Info
- Publication number
- JPS6131477B2 JPS6131477B2 JP53087849A JP8784978A JPS6131477B2 JP S6131477 B2 JPS6131477 B2 JP S6131477B2 JP 53087849 A JP53087849 A JP 53087849A JP 8784978 A JP8784978 A JP 8784978A JP S6131477 B2 JPS6131477 B2 JP S6131477B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- word
- input
- similarity
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/12—Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Description
本発明は1個以上の単語を連続して発声した連
続音声を自動的に認識する連続音声認識装置の改
良に関する。 音声認識装置は計算機等へのデータや制御命令
等の入力手段として多くの優れた特徴をもつてい
る。しかし、現在までに開発されている音声認識
装置では、連続音声を認識することができず、単
語を1個ずつ区切つて発声して入力しないと正確
に動作しないという欠点を持つている。この結果
として多桁の数字データーを入力する場合には、
1桁ずつ区切らなければならず、このため、従来
の音声認識装置はデータの入力速度が低く、使用
者にとつて不便なものである。 音声認識の手法としては従来から種々の方法が
試みられてる。それらの中で最も簡単でしかも有
効な方法としてパタンマツチング法と呼ばれるも
のがある。この方法は認識すべき語彙の各単語に
標準的なパタン(以下標準パタンと称する)を用
意しておき、入力された未知の音声パタン(以下
入力パタンと称する)との間で比較操作(すなわ
ちパタンマツチング)を行なつて、一致の度合を
表わす量(以下類似度と称する)を算出し、最も
類似した、すなわち、類似度が最大になる標準パ
タンと同じ単語に属すると判定する方法である。 「特願昭50−132003号」には上記パタンマツチ
ング法を基礎として動作する連続音声認識装置の
動作原理が記載されている。この原理は大略次の
ようである。すなわち、何個かの標準パタンをあ
らゆる順列で接続することによつて得られるパタ
ンを連続音声の標準パタンと考えて入力パタン全
体とのマツチングを行なう。この結果得られる類
似度が最大となるような標準パタンの個数と標準
パタンの順列組合せを定めることによつて認識を
行なう。実際には上記最大化を単語単位としての
最大化処理と全体としての最大化処理との2段階
に分割し、それぞれの最大化を動的計画法を利用
して実行することによつて処理量を低減して実用
的な処理速度を達成している。以上述べた「特願
昭50−132003号」記載の方法が従来では最も有効
な連続音声認識法であると考えられる。 実際の音声認識装置では常に多少の誤認識が発
生する傾向がある。これは標準パタンを入力する
ための発声と、実際のデータを入力するための発
声とが異なるために生じるもので、発声者が注意
して発声してもある程度の確率で誤認識が生じる
のは避けられない。したがつて、運用面でさしつ
かえない範囲での制約を設け誤認識を低減する努
力が必要となる。今、実際の適用業務例として商
店における売上データ入力を考えて見る。この場
合、入力データフオーマツトとして(1)商品名、(2)
売上個数の順序を考える。商品名は“キヤラメ
ル”“チヨレート”“アメ”、等のように直接品名
を入力し、売上個数は必らず3桁の数字で入力す
るものとする(例“003”、“019”、“100”)。この
ような場合には、フオーマツト情報を利用しない
と、入力される最初の単語(商品名)を数字とし
て判定してしまうとか、逆に数字の部分を商品名
と誤るといつた誤認識が発生する可能性がある。
もし、認識処理の過程でフオーマツト情報を利用
し、第1単語は必らず商品名と判定し次の3単語
は数字であるとの条件のもとに判定することがで
きれば上例のような誤認識は防止できる。別の例
として生年月日データの入力を考える。例えば
280925(ニイハチゼロキユウニーゴー)の形式で
昭和28年9月25日と言う生年月日を入力するもの
とする。この場合、昭和は現時点で53年までであ
るから第1桁は0〜5、第2桁は0〜9の数字が
発生し得る。また、月は01〜12であるから第3桁
は0か1、第4桁は0〜9となる。最後の2桁は
表わすから第5桁は0〜3、第4桁は0〜9の範
囲となる。したがつて、第1桁は0〜5、第3桁
0〜1、第5桁は0〜3と制限すると、68年と
か、29月あるいは47日というような異常なデータ
への誤認識は防止できる。 本発明の目的は前記「特願昭50−132003号明細
書」記載の連続音声認識装置にフオーマツトに基
づいて判定を行なう機能を付加し実用業務に当つ
てより誤認識の少ない連続音声認識装置を提供す
ることにある。 本発明による装置の構成を述べるに先だつて音
声パタン認識に関連する基礎的事項を説明してお
く。音声パタンはスペクトラム分析法等による分
析と分析結果の時間標本化とによつて特徴ベクト
ルaiの時系列として表現できる。 A=a1、a2、………、ai、………、aI (1) いま、単語をその分類を表わす番号nによつて
指定するものとしてn=1、2、………、Nとい
うN種類の単語セツトを語彙として考える。単語
nの標準パタンをBnで示すことにする。 Bn=bn 1、bn 2、………、bn j、………bn J
n(2) 上記の如き入力パタンAと標準パタンB(標準
パタンを一般的に代表するもの)との間の類似性
の尺度として類似度なる量を定義し、S(A、
B)と示す。また、上に述べたフオーマツト指定
を F=f1、f2、………、fx、………、fk (3) によつて示す。ここにfは第x単語として指定さ
れる単語群を与えるもので例えば次の形式で与え
られる。 fx={n1 x、n2 x、n3 x} (4) これは第x桁として単語n1 x、n2 xn、3 xのい
ずれ
かのみが許されることを意味する。 本発明の連続音声認識装置は入力音声を特徹ベ
クトルaiの時系列として表現される入力パタン
A=a1、a2、………、ai、………、aIに変換す
るための入力部と、単語nの標準パタンB=b
n 1、bn 2、………bn j、………、bn Jnを各単
語に対
して記憶するための標準パタン記憶部と、前記入
力パタンAとして連続発声入力が許容される単語
数kと、連続発声中の第x単語として許容される
単語群fxの時系列F=f1、f2、………fx、……
…fkとしてフオーマツトを指定するためのフオ
ーマツト指定部と、前記入力パタンAの時間点i
=lを始端とし時間点i=mを終端とする部分時
系例al+1、al+2………、anとして定義される部
分パタンA(l、m)と前記標準パタン標準パタ
ンBnとの類似度S(l、m、n)をすべての単
語類nに関して算出するための類似度計算部と、
前記入力パタンAを前記フオーマツト指定部によ
り指定される単語数たるk個の部分パタンA
(l、m)の群A(0、l(1))、A(l(1)、l
(2))、………、A(l(k−1)、I)に分解しそ
れぞれの部分パタンに前記フオーマツト指定部に
よつてそれぞれ許容される条件、すなわちn
(x)∈fxの条件のもとに単語n(1)、n(2)、……
…n(k)を割り当て前記類似度の群S(0、l(1)
n(1))、S(l(1)、l(2)、n(1))、………S(l
(k−1)、I、n(k))の総和が区分点群l(1)、l
(2)、………、l(k−1)及び単語群n(1)、n
(2)、………、n(k)の定め方に関して最大になるよ
うに前記区分点群と、単語群とを決定する機能を
有する全体マツチング部とから構成されている。 このような構成によると、フオーマツト指定に
違反した結果に誤認識される可能性は排除され、
従来装置に比べてより高い認識性能を備えた連続
音声認識装置が実現できる。 次に図面を参照して本発明を詳細に説明する。 第1図は本発明の装置が実行する認識原理を既
念的に示すための図である。説明を容易にするた
めに、先に述べた生年月日データ入力業務を例に
とつて説明する。信号線SPを経由して入力され
る音声波形は入力部10によつて分析処理され、
(1)式のような入力パタンAに変換され入力パタン
バツフア11に送られ一時保持される。標準パタ
ン記憶13には(2)式の形式で数字“0”〜“9”
の標準パタン群B0、B1、………Bn、………B10が
記憶されている。また、フオーマツト指定部には
入力されるデータの桁数としてk=6が、また各
桁に許される数字が F=f1、f2、f3、f4、f5、f6 (5) の形式で与えられる。年月日データと言う制約か
ら f1={0、1、2、3、4、5} f3={0、1} f5={0、1、2、3} f2=f4=f6 ={0、1、2、3、4、5、6、7、8、
9} と定義され記憶されている。接続部14は前記標
準パタン記憶13より複数個の標準パタンBn
(1)、Bn(2)、………Bn(6)を読み出し接続すること
によつて連続音声標準パタン =Bn(1)Bn(2)………Bn(x)………Bn(6) (6) を生成して標準パタンバツフア15に送る。ここ
になる記号はパタンの接続を表わす演算子であ
る。例えば、BnBmは BnBm=bn 1、bn 2、………bm Jo、bm 1、bm 2、………bm Jn (7) であることを意味する。なお、(6)式におけるn(6)
の6はフオーマツト指定部12により指定される
単語数kである。また、各桁の単語n(x)は(5)
式のフオマツト指定に従うものとする。すなわ
ち、 n(x)∈fx (8) なる制約が課せられる。この制約のもとに許され
るすべてのn(x)の順列組合せに関して(6)式の
連続音声標準パタンが接続部14によつて生成
され標準パタンバツフア15に送られる。マツチ
ング部16では前記入力パタンバツフア11に保
持される入力パタンAと前記標準パタンバツフア
15に保持される前記連続音声標準パタンとの
パタンマツチングが行なわれ、類似度Sが出力さ
れる。この処理は接続部14によつて生成される
すべての連続音声標準パタンに対して行なわ
れ、それぞれの場合の類似度Sが算出され順次出
力される。判定部17では前記マツチング部16
によつて算出される類似度Sを比較してその最大
値を決定するとともに、その最大値を与える連続
単語標準パタンを決定する。このに対応する
単語n(1)、n(2)、………n(6)を定めることによつ
て入力パタンAは単語群n^(1)、n^(2)、………、n
^
(6)であると判定する。かくの如き原理によると、
接続部14ではフオーマツト指定の範囲内での連
続単語標準パタンののみが生成されるのでフオ
ーマツト指定外の認識結果が出力される恐れはな
い。 上記の原理を数式的に表現すると次のようにな
る。すなわち最大問題 T=max〔S(A、Bn(1)Bn(2)………Bn(x)………Bn(6))〕n(x)∈fx (12) を計算し、最適パラメタn(x)=n^(x)、x=
1、2、………6を求める。認識結果はn^(1)、n^
(2)、………、n^(6)で与えられる。しかし、上記原
理を単語n(x)の組合せに関する総当りで処理
すると膨大な計算量が必要となる。それはn(1)、
n(2)、………、n(6)の組合せが多くなるからであ
つて、この例では6×10×3×10×4×10=
72000の組合せとなる。したがつて、これだけの
回数のパタンマツチングがマツチング部16によ
つてなされる必要がある。 本発明では前記「特願昭50−132003号」明細書
記載の装置で行なわれているのと同様に、(12)式の
最大化を分解して計算することによつて実用的な
処理速度を可能とする。すなわち入力パタンAの
時間軸上に(k−1)すなわち5個の区分点l
(1)、l(2)、………、l(x)、………、l(5)を仮
定して入力パタンAをkすなわち6個の部分パタ
ンに分解して考える。 A=A(l(0)、l(1))A(l(1)、l(2))………A(l(x−1)、l(x))………A(l(5)、l
(6)) (13) ここにl(0)=0、l(6)=I((1)式参照)と
仮定している。部分パタンは一般に次のように定
義される。 A(l、m)=aI+1、aI+1、………、am(14) 今、2個の音声パタンA=a1、a2、………ai、
………aIとB=b1、b2、………、bj、………b
Jとの間の類似度を前記引用文献と同様に と定義する。ここに、r(i、j)はベクトルa
iとbjとの間の類似の度合を示す量であり、例え
ば、相関値である。関数j=j(i)は単調増加
な関数であつて 始端に関して j(1)=1 終端に関して j(I)=J なる条件を満足するものとする。このような定義
による類似度S(A、B)はパタンの接続部分に
関して次の性質を有する。 S(A、BmBn)=max〔S(A(0、l)、Bm)S(A(l、I)、Bn)〕 (12)式に(13)式を代入してさらに(16)式の関
係を繰返し適用し整理すると、 ここにS(l、m、n)なる記法は部分パタン
A(l、m)と標準パタンBnとの間の類似度S
(A(l、m)、Bn)を簡単化して記したもので
ある。(17)式の最大問題は次のように3段階に
分解して計算できる。 〈第1段〉 類似度S(l、m、n)=S(A(l、m)、B
n) (18) をすべての部分区間A(l、m)と標準パタンB
nとの組合せに関して算出する。 〈第2段〉 部分類似度 及び部分判定結果 をすべてのl、m、xの組合せに対して計算す
る。ここにargmax〔 〕なる記号はn∈fxなる
条件のことで〔 〕内の値を最大にするパラメタ
nを求めることを意味する。 〈第3段〉 なる最大問題を計算し最適なパラメタl(x)=
l^(x)、x=1、2、………、6を求める。特
願昭50−132003号明細書に記載されるごとく、
(21)式の最大問題は次の漸化式計算によつて解
かれる。 初期条件T(o、o)=o 漸化式 仮区分点 (22)式と(23)式の計算は1≦x≦6、1≦
m≦1の範囲でxとmに関しては増加方向に計算
する。 以上の処理が終了すると(23)式のL(m、
x)から区分点l^(x)が次の如く決定される。 (a) 初期条件x=6、l^(6)=I (24−a) (b) 漸化式(x=5、4、3、2、1) l(x)=L(l^(x+1)、x+1)
(24−b) かくして得られる区分点l(x)をもとにして
(20)式を部分伴定結果N^(l、m、x)を参照
することにより (c) n(x)=N^(l(x−1)、l(x)、x)
、 x=1、2、………、6 (24−c) なる認識結果が得られる。本発明による装置は以
上の動作原理を効率よく実行するものである。 第2図は本発明の一実施例を示す図である。信
号線SPより入力される音声波形信号はスペクト
ラムアナライザで構成される入力部10によつて
周波数分析され時間標本化、デイジタル化の処理
を受けて(1)式の如き入力パタンAに変換され入力
パタンバツフア11に入力される。なお、スペク
トラムアナライザは一例として「特願昭52−
23610号」に記載されたデイジタル周波数分析装
置によつて構成することができる。また、この入
力部10には入力音声のエネルギーレベルを検定
することによつて音声の始端と終端を決定する機
能を有する。これにより音声の始端時点でパルス
Psを、終端時点でパルスPeをそれぞれ発生す
る。他の各部は前記パルスPsが発生された時点
以後動作を開始する。制御部31は前記始端時点
パルスPsが与えられて以後内蔵するカウンタに
よつて時刻信号m1を1より始めて計数し続け
る。なお、この計数は入力部10より特徴ベクト
ルaiが1個入力される毎に行なわれる。パルス
信号Ps、Pe及びカウンタ信号m1の変化の様子を
第3図のタイムチヤートに示す。 類似度計算部は入力パタンバツフア11と第1
マツチング部21とから構成されている。以下に
入力パタンバツフア11に特徴ベクトルan(m
はカウンタ信号m1によつて指定される)が1個
入力される毎に各部によつて実行される動作を説
明する。第1マツチング部21では標準パタン記
憶部13に記憶される標準パタンBnと、入力パ
タンバツフア11に記憶される現時点までに入力
された音声パタンa1、a2、………、ai、………a
nとを基にして(18)式の類似度S(l、m、
n)を計算する。具体的には次の動的計画計算に
よつて行なわれるが、これは前記「特願昭50−
132003号」記載の装置と同一である。すなわち、 初期条件 g(i、Jn)=r(m、Jn)、 i=m =o 、
i=m (25) 漸化式
続音声を自動的に認識する連続音声認識装置の改
良に関する。 音声認識装置は計算機等へのデータや制御命令
等の入力手段として多くの優れた特徴をもつてい
る。しかし、現在までに開発されている音声認識
装置では、連続音声を認識することができず、単
語を1個ずつ区切つて発声して入力しないと正確
に動作しないという欠点を持つている。この結果
として多桁の数字データーを入力する場合には、
1桁ずつ区切らなければならず、このため、従来
の音声認識装置はデータの入力速度が低く、使用
者にとつて不便なものである。 音声認識の手法としては従来から種々の方法が
試みられてる。それらの中で最も簡単でしかも有
効な方法としてパタンマツチング法と呼ばれるも
のがある。この方法は認識すべき語彙の各単語に
標準的なパタン(以下標準パタンと称する)を用
意しておき、入力された未知の音声パタン(以下
入力パタンと称する)との間で比較操作(すなわ
ちパタンマツチング)を行なつて、一致の度合を
表わす量(以下類似度と称する)を算出し、最も
類似した、すなわち、類似度が最大になる標準パ
タンと同じ単語に属すると判定する方法である。 「特願昭50−132003号」には上記パタンマツチ
ング法を基礎として動作する連続音声認識装置の
動作原理が記載されている。この原理は大略次の
ようである。すなわち、何個かの標準パタンをあ
らゆる順列で接続することによつて得られるパタ
ンを連続音声の標準パタンと考えて入力パタン全
体とのマツチングを行なう。この結果得られる類
似度が最大となるような標準パタンの個数と標準
パタンの順列組合せを定めることによつて認識を
行なう。実際には上記最大化を単語単位としての
最大化処理と全体としての最大化処理との2段階
に分割し、それぞれの最大化を動的計画法を利用
して実行することによつて処理量を低減して実用
的な処理速度を達成している。以上述べた「特願
昭50−132003号」記載の方法が従来では最も有効
な連続音声認識法であると考えられる。 実際の音声認識装置では常に多少の誤認識が発
生する傾向がある。これは標準パタンを入力する
ための発声と、実際のデータを入力するための発
声とが異なるために生じるもので、発声者が注意
して発声してもある程度の確率で誤認識が生じる
のは避けられない。したがつて、運用面でさしつ
かえない範囲での制約を設け誤認識を低減する努
力が必要となる。今、実際の適用業務例として商
店における売上データ入力を考えて見る。この場
合、入力データフオーマツトとして(1)商品名、(2)
売上個数の順序を考える。商品名は“キヤラメ
ル”“チヨレート”“アメ”、等のように直接品名
を入力し、売上個数は必らず3桁の数字で入力す
るものとする(例“003”、“019”、“100”)。この
ような場合には、フオーマツト情報を利用しない
と、入力される最初の単語(商品名)を数字とし
て判定してしまうとか、逆に数字の部分を商品名
と誤るといつた誤認識が発生する可能性がある。
もし、認識処理の過程でフオーマツト情報を利用
し、第1単語は必らず商品名と判定し次の3単語
は数字であるとの条件のもとに判定することがで
きれば上例のような誤認識は防止できる。別の例
として生年月日データの入力を考える。例えば
280925(ニイハチゼロキユウニーゴー)の形式で
昭和28年9月25日と言う生年月日を入力するもの
とする。この場合、昭和は現時点で53年までであ
るから第1桁は0〜5、第2桁は0〜9の数字が
発生し得る。また、月は01〜12であるから第3桁
は0か1、第4桁は0〜9となる。最後の2桁は
表わすから第5桁は0〜3、第4桁は0〜9の範
囲となる。したがつて、第1桁は0〜5、第3桁
0〜1、第5桁は0〜3と制限すると、68年と
か、29月あるいは47日というような異常なデータ
への誤認識は防止できる。 本発明の目的は前記「特願昭50−132003号明細
書」記載の連続音声認識装置にフオーマツトに基
づいて判定を行なう機能を付加し実用業務に当つ
てより誤認識の少ない連続音声認識装置を提供す
ることにある。 本発明による装置の構成を述べるに先だつて音
声パタン認識に関連する基礎的事項を説明してお
く。音声パタンはスペクトラム分析法等による分
析と分析結果の時間標本化とによつて特徴ベクト
ルaiの時系列として表現できる。 A=a1、a2、………、ai、………、aI (1) いま、単語をその分類を表わす番号nによつて
指定するものとしてn=1、2、………、Nとい
うN種類の単語セツトを語彙として考える。単語
nの標準パタンをBnで示すことにする。 Bn=bn 1、bn 2、………、bn j、………bn J
n(2) 上記の如き入力パタンAと標準パタンB(標準
パタンを一般的に代表するもの)との間の類似性
の尺度として類似度なる量を定義し、S(A、
B)と示す。また、上に述べたフオーマツト指定
を F=f1、f2、………、fx、………、fk (3) によつて示す。ここにfは第x単語として指定さ
れる単語群を与えるもので例えば次の形式で与え
られる。 fx={n1 x、n2 x、n3 x} (4) これは第x桁として単語n1 x、n2 xn、3 xのい
ずれ
かのみが許されることを意味する。 本発明の連続音声認識装置は入力音声を特徹ベ
クトルaiの時系列として表現される入力パタン
A=a1、a2、………、ai、………、aIに変換す
るための入力部と、単語nの標準パタンB=b
n 1、bn 2、………bn j、………、bn Jnを各単
語に対
して記憶するための標準パタン記憶部と、前記入
力パタンAとして連続発声入力が許容される単語
数kと、連続発声中の第x単語として許容される
単語群fxの時系列F=f1、f2、………fx、……
…fkとしてフオーマツトを指定するためのフオ
ーマツト指定部と、前記入力パタンAの時間点i
=lを始端とし時間点i=mを終端とする部分時
系例al+1、al+2………、anとして定義される部
分パタンA(l、m)と前記標準パタン標準パタ
ンBnとの類似度S(l、m、n)をすべての単
語類nに関して算出するための類似度計算部と、
前記入力パタンAを前記フオーマツト指定部によ
り指定される単語数たるk個の部分パタンA
(l、m)の群A(0、l(1))、A(l(1)、l
(2))、………、A(l(k−1)、I)に分解しそ
れぞれの部分パタンに前記フオーマツト指定部に
よつてそれぞれ許容される条件、すなわちn
(x)∈fxの条件のもとに単語n(1)、n(2)、……
…n(k)を割り当て前記類似度の群S(0、l(1)
n(1))、S(l(1)、l(2)、n(1))、………S(l
(k−1)、I、n(k))の総和が区分点群l(1)、l
(2)、………、l(k−1)及び単語群n(1)、n
(2)、………、n(k)の定め方に関して最大になるよ
うに前記区分点群と、単語群とを決定する機能を
有する全体マツチング部とから構成されている。 このような構成によると、フオーマツト指定に
違反した結果に誤認識される可能性は排除され、
従来装置に比べてより高い認識性能を備えた連続
音声認識装置が実現できる。 次に図面を参照して本発明を詳細に説明する。 第1図は本発明の装置が実行する認識原理を既
念的に示すための図である。説明を容易にするた
めに、先に述べた生年月日データ入力業務を例に
とつて説明する。信号線SPを経由して入力され
る音声波形は入力部10によつて分析処理され、
(1)式のような入力パタンAに変換され入力パタン
バツフア11に送られ一時保持される。標準パタ
ン記憶13には(2)式の形式で数字“0”〜“9”
の標準パタン群B0、B1、………Bn、………B10が
記憶されている。また、フオーマツト指定部には
入力されるデータの桁数としてk=6が、また各
桁に許される数字が F=f1、f2、f3、f4、f5、f6 (5) の形式で与えられる。年月日データと言う制約か
ら f1={0、1、2、3、4、5} f3={0、1} f5={0、1、2、3} f2=f4=f6 ={0、1、2、3、4、5、6、7、8、
9} と定義され記憶されている。接続部14は前記標
準パタン記憶13より複数個の標準パタンBn
(1)、Bn(2)、………Bn(6)を読み出し接続すること
によつて連続音声標準パタン =Bn(1)Bn(2)………Bn(x)………Bn(6) (6) を生成して標準パタンバツフア15に送る。ここ
になる記号はパタンの接続を表わす演算子であ
る。例えば、BnBmは BnBm=bn 1、bn 2、………bm Jo、bm 1、bm 2、………bm Jn (7) であることを意味する。なお、(6)式におけるn(6)
の6はフオーマツト指定部12により指定される
単語数kである。また、各桁の単語n(x)は(5)
式のフオマツト指定に従うものとする。すなわ
ち、 n(x)∈fx (8) なる制約が課せられる。この制約のもとに許され
るすべてのn(x)の順列組合せに関して(6)式の
連続音声標準パタンが接続部14によつて生成
され標準パタンバツフア15に送られる。マツチ
ング部16では前記入力パタンバツフア11に保
持される入力パタンAと前記標準パタンバツフア
15に保持される前記連続音声標準パタンとの
パタンマツチングが行なわれ、類似度Sが出力さ
れる。この処理は接続部14によつて生成される
すべての連続音声標準パタンに対して行なわ
れ、それぞれの場合の類似度Sが算出され順次出
力される。判定部17では前記マツチング部16
によつて算出される類似度Sを比較してその最大
値を決定するとともに、その最大値を与える連続
単語標準パタンを決定する。このに対応する
単語n(1)、n(2)、………n(6)を定めることによつ
て入力パタンAは単語群n^(1)、n^(2)、………、n
^
(6)であると判定する。かくの如き原理によると、
接続部14ではフオーマツト指定の範囲内での連
続単語標準パタンののみが生成されるのでフオ
ーマツト指定外の認識結果が出力される恐れはな
い。 上記の原理を数式的に表現すると次のようにな
る。すなわち最大問題 T=max〔S(A、Bn(1)Bn(2)………Bn(x)………Bn(6))〕n(x)∈fx (12) を計算し、最適パラメタn(x)=n^(x)、x=
1、2、………6を求める。認識結果はn^(1)、n^
(2)、………、n^(6)で与えられる。しかし、上記原
理を単語n(x)の組合せに関する総当りで処理
すると膨大な計算量が必要となる。それはn(1)、
n(2)、………、n(6)の組合せが多くなるからであ
つて、この例では6×10×3×10×4×10=
72000の組合せとなる。したがつて、これだけの
回数のパタンマツチングがマツチング部16によ
つてなされる必要がある。 本発明では前記「特願昭50−132003号」明細書
記載の装置で行なわれているのと同様に、(12)式の
最大化を分解して計算することによつて実用的な
処理速度を可能とする。すなわち入力パタンAの
時間軸上に(k−1)すなわち5個の区分点l
(1)、l(2)、………、l(x)、………、l(5)を仮
定して入力パタンAをkすなわち6個の部分パタ
ンに分解して考える。 A=A(l(0)、l(1))A(l(1)、l(2))………A(l(x−1)、l(x))………A(l(5)、l
(6)) (13) ここにl(0)=0、l(6)=I((1)式参照)と
仮定している。部分パタンは一般に次のように定
義される。 A(l、m)=aI+1、aI+1、………、am(14) 今、2個の音声パタンA=a1、a2、………ai、
………aIとB=b1、b2、………、bj、………b
Jとの間の類似度を前記引用文献と同様に と定義する。ここに、r(i、j)はベクトルa
iとbjとの間の類似の度合を示す量であり、例え
ば、相関値である。関数j=j(i)は単調増加
な関数であつて 始端に関して j(1)=1 終端に関して j(I)=J なる条件を満足するものとする。このような定義
による類似度S(A、B)はパタンの接続部分に
関して次の性質を有する。 S(A、BmBn)=max〔S(A(0、l)、Bm)S(A(l、I)、Bn)〕 (12)式に(13)式を代入してさらに(16)式の関
係を繰返し適用し整理すると、 ここにS(l、m、n)なる記法は部分パタン
A(l、m)と標準パタンBnとの間の類似度S
(A(l、m)、Bn)を簡単化して記したもので
ある。(17)式の最大問題は次のように3段階に
分解して計算できる。 〈第1段〉 類似度S(l、m、n)=S(A(l、m)、B
n) (18) をすべての部分区間A(l、m)と標準パタンB
nとの組合せに関して算出する。 〈第2段〉 部分類似度 及び部分判定結果 をすべてのl、m、xの組合せに対して計算す
る。ここにargmax〔 〕なる記号はn∈fxなる
条件のことで〔 〕内の値を最大にするパラメタ
nを求めることを意味する。 〈第3段〉 なる最大問題を計算し最適なパラメタl(x)=
l^(x)、x=1、2、………、6を求める。特
願昭50−132003号明細書に記載されるごとく、
(21)式の最大問題は次の漸化式計算によつて解
かれる。 初期条件T(o、o)=o 漸化式 仮区分点 (22)式と(23)式の計算は1≦x≦6、1≦
m≦1の範囲でxとmに関しては増加方向に計算
する。 以上の処理が終了すると(23)式のL(m、
x)から区分点l^(x)が次の如く決定される。 (a) 初期条件x=6、l^(6)=I (24−a) (b) 漸化式(x=5、4、3、2、1) l(x)=L(l^(x+1)、x+1)
(24−b) かくして得られる区分点l(x)をもとにして
(20)式を部分伴定結果N^(l、m、x)を参照
することにより (c) n(x)=N^(l(x−1)、l(x)、x)
、 x=1、2、………、6 (24−c) なる認識結果が得られる。本発明による装置は以
上の動作原理を効率よく実行するものである。 第2図は本発明の一実施例を示す図である。信
号線SPより入力される音声波形信号はスペクト
ラムアナライザで構成される入力部10によつて
周波数分析され時間標本化、デイジタル化の処理
を受けて(1)式の如き入力パタンAに変換され入力
パタンバツフア11に入力される。なお、スペク
トラムアナライザは一例として「特願昭52−
23610号」に記載されたデイジタル周波数分析装
置によつて構成することができる。また、この入
力部10には入力音声のエネルギーレベルを検定
することによつて音声の始端と終端を決定する機
能を有する。これにより音声の始端時点でパルス
Psを、終端時点でパルスPeをそれぞれ発生す
る。他の各部は前記パルスPsが発生された時点
以後動作を開始する。制御部31は前記始端時点
パルスPsが与えられて以後内蔵するカウンタに
よつて時刻信号m1を1より始めて計数し続け
る。なお、この計数は入力部10より特徴ベクト
ルaiが1個入力される毎に行なわれる。パルス
信号Ps、Pe及びカウンタ信号m1の変化の様子を
第3図のタイムチヤートに示す。 類似度計算部は入力パタンバツフア11と第1
マツチング部21とから構成されている。以下に
入力パタンバツフア11に特徴ベクトルan(m
はカウンタ信号m1によつて指定される)が1個
入力される毎に各部によつて実行される動作を説
明する。第1マツチング部21では標準パタン記
憶部13に記憶される標準パタンBnと、入力パ
タンバツフア11に記憶される現時点までに入力
された音声パタンa1、a2、………、ai、………a
nとを基にして(18)式の類似度S(l、m、
n)を計算する。具体的には次の動的計画計算に
よつて行なわれるが、これは前記「特願昭50−
132003号」記載の装置と同一である。すなわち、 初期条件 g(i、Jn)=r(m、Jn)、 i=m =o 、
i=m (25) 漸化式
【表】
制約条件(整合窓)と呼ぶ)
j+m−Jn−r≦i≦j+m−Jn+r (27)
なる漸化式計算をj=Jn、Jn−1、Jn−2、
………、1の順序で行なうことによつて、次の類
似度 S(l、m、n)=g(l+1、1) (28) をm−Jn−r≦1≦m−Jn+r (29) なる範囲で算出し、信号Sとして出力する。この
マツチング部21の構成は「特願昭51−18346
号」明細書第3図に記載された回路によつて構成
される(28)式の類似度は各標準パタンBnに対
して(29)式の範囲で算出される。(27)式の整
合窓の広さrは、実際の発声において生じる発声
速度変化あるいはそれによつて引き起される標準
パタンと入力パタンとの間に時間軸のずれを包含
できるように十分大きく設定される。それゆえ、
類似度(28)式は(29)式の範囲内のみで考えれ
ば十分である。それ以外では類似度S(l、m、
n)=−∞(負の無限大)として処理する。 フオーマツト指定部22にはフオーマツト指定
(5)が記憶されており、カウンタ信号m1のサイク
ル内にf1、f2、f3、f4、f5が次々にフオーマツト信
号fxとして出力される。全体マツチングは最大
値選択回路23、バツフア24、バツフア25、
第2マツチング部26、レジスタ27、バツフア
28、バツフア29、及び判定部30から構成さ
れている。最大値検出部23では前記第1マツチ
ング部21より信号Sとして入力されるS(l、
m、n)とフオーマツト指定部22より入力され
るフオーマツト信号fxとに基づいて部分類似度
S^(l、m、x)(19)式と部分判定結果N^
(l、m、x)(20)式とが計算されそれぞれ信号
S1と信号l1として出力される。この処理は、例え
ばf5={0、1、2、3}の場合次のように行な
われる。(a)類似度群S(l、m、0)、S(l、
m、1)、S(l、m、2)、S(l、m、3)の
最大値を決定して信号S1として出力する。(b)前記
最大値を与える単語番号nを定めて信号n1として
出力する。かくして、計算される部分類似度S^
(l、m、x)と部分判定結果N^(l、m、x)
はそれぞれバツフア24及びバツフア25の
(l、x)番地(lは信号線l1によりxは信号線
x1によつて指定される)に記憶される。なお、カ
ウンタ信号m1の各サイクル毎に対して上記バツ
フア24と25内の内容は、ただちに処理され、
次のサイクルでは更新されるので、カウンタ信号
m1にるアドレス指定は不要である。部分類似度
S^(l、m、x)と部分判定結果N^(l、m、
x)は必要なすべての(l、x)の組合せに対し
て計算される。当然l<m、0≦x≦9(10数字
の場合)である。 カウンタ信号m1の各サイクルの前半で以上の
処理が終了すると、(22)、(23)式の計算が開始
される。レジスタ27は(30)式のT(m、x)
を記憶するためのメモリーである。第2マツチン
グ部26からはアドレス信号l2とx2が発生され
る。これによつ(30)式のl及びxが指定され、
前記バツフア24より部分類似度S^(l、m、
x)が、バツフア25からは部分判定結果N^
(l、m、x)が、レジスタ27より漸化式値T
(l、x−1)が出力される。なお、アドレス信
号l2は0≦l≦mの範囲でアドレス信号x2は1≦
x≦6の範囲でそれぞれ変化される。これらをも
とに(22)、(23)式の計算を行なう回路は一例と
して「特願昭51−13846号明細書第5図」に示さ
れた如く構成できる。なお、本実施例では以上の
処理と並行して 仮判定結果 N(m、x)=N^(l^、m、x)、
(29) なる計算が行なわれる。 ただし、l^=L(m、x)((23)式参照)。 かくして得られる漸化式値T(m、x)、仮区
分点L(m、x)、仮判定結果N(m、x)はそ
れぞれレジスタ27、バツフア28、バツフア2
6に、カウンタ信号m1及びアドレス信号x2によ
り番地指定されて書込まれる。 以上述べた第1マツチング部と第2マツチング
部の動作は入力パタンバツフア11に新たなベク
トルanが入力される毎に繰り返され、これに同
期してカウンタ信号m1(=m)は1ずつ増加さ
れる。音声信号の入力が終了すると第3図のタイ
ムチヤートに示すように終端検出を意味するパル
スPeが入力部10により発生される。この時点
以後判定部30は(24−a)、(24−b)、(24−
c)式に示される判定動作を実行する。最初、
(24−a)式の初期条件を設定する。すなわち、
xをカウントするための信号x4にフオーマツト指
定部22から信号線Kにより与えられる単語数k
=6がセツトされる。同時に、その時点で信号
m1によつて指定されている入力パタン長Iを信
号m4とする。以下は(24−b)式を実行するこ
とによつて区分点l^(x)をバツフア28より信
号線l4を経由して読み出す。なお、(24−b)式
における引数l^(x+1)は信号m4によつて指
定される。認識結果は仮判定結果N(m、x)の
バツフア29から n^(x)=N(ln^(x)、x) (30) の形で信号m4として読み出される。(30)式にお
ける引数l^(x+1)は信号m4により、xは信
号x4により指定される。かくして最初の認識結果
n^(6)が得られ信号n0として出力される。次にm4
=l^(x)としかつカウンタ信号x4を1だけ減じ
た後以上の動作を繰返すことによつて次の認識結
果n^(5)が得られる。同様の繰返しによつて認識結
果n^(4)、n^(3)、n^(2)、n^(1)が順次(逆順に
)得ら
れ、信号線n0より出力される。かくの如き動作を
実行するための、判定部30は一例として「特願
昭51−13846号明細書第7図」に記載された如き
回路によつて構成できる。 以上本発明の原理を実施例にもとづいて説明し
たが、これらの記載は本発明の範囲を限定するを
のではない。特に、フオーマツト指定部によるフ
オーマツト指定の方法は種々考えられる。例え
ば、フオーマツトは固定されたものではなく外部
からの制御によつて変化する形態であつてもよ
い。また、本明細書では類似度を基にして認識す
る動作を説明したが、距離のように大小関係が逆
の尺度によつても同様な処理が可能である。この
場合には上記実例中における最大化処理をすべて
最小化処理に置換するとよい。
………、1の順序で行なうことによつて、次の類
似度 S(l、m、n)=g(l+1、1) (28) をm−Jn−r≦1≦m−Jn+r (29) なる範囲で算出し、信号Sとして出力する。この
マツチング部21の構成は「特願昭51−18346
号」明細書第3図に記載された回路によつて構成
される(28)式の類似度は各標準パタンBnに対
して(29)式の範囲で算出される。(27)式の整
合窓の広さrは、実際の発声において生じる発声
速度変化あるいはそれによつて引き起される標準
パタンと入力パタンとの間に時間軸のずれを包含
できるように十分大きく設定される。それゆえ、
類似度(28)式は(29)式の範囲内のみで考えれ
ば十分である。それ以外では類似度S(l、m、
n)=−∞(負の無限大)として処理する。 フオーマツト指定部22にはフオーマツト指定
(5)が記憶されており、カウンタ信号m1のサイク
ル内にf1、f2、f3、f4、f5が次々にフオーマツト信
号fxとして出力される。全体マツチングは最大
値選択回路23、バツフア24、バツフア25、
第2マツチング部26、レジスタ27、バツフア
28、バツフア29、及び判定部30から構成さ
れている。最大値検出部23では前記第1マツチ
ング部21より信号Sとして入力されるS(l、
m、n)とフオーマツト指定部22より入力され
るフオーマツト信号fxとに基づいて部分類似度
S^(l、m、x)(19)式と部分判定結果N^
(l、m、x)(20)式とが計算されそれぞれ信号
S1と信号l1として出力される。この処理は、例え
ばf5={0、1、2、3}の場合次のように行な
われる。(a)類似度群S(l、m、0)、S(l、
m、1)、S(l、m、2)、S(l、m、3)の
最大値を決定して信号S1として出力する。(b)前記
最大値を与える単語番号nを定めて信号n1として
出力する。かくして、計算される部分類似度S^
(l、m、x)と部分判定結果N^(l、m、x)
はそれぞれバツフア24及びバツフア25の
(l、x)番地(lは信号線l1によりxは信号線
x1によつて指定される)に記憶される。なお、カ
ウンタ信号m1の各サイクル毎に対して上記バツ
フア24と25内の内容は、ただちに処理され、
次のサイクルでは更新されるので、カウンタ信号
m1にるアドレス指定は不要である。部分類似度
S^(l、m、x)と部分判定結果N^(l、m、
x)は必要なすべての(l、x)の組合せに対し
て計算される。当然l<m、0≦x≦9(10数字
の場合)である。 カウンタ信号m1の各サイクルの前半で以上の
処理が終了すると、(22)、(23)式の計算が開始
される。レジスタ27は(30)式のT(m、x)
を記憶するためのメモリーである。第2マツチン
グ部26からはアドレス信号l2とx2が発生され
る。これによつ(30)式のl及びxが指定され、
前記バツフア24より部分類似度S^(l、m、
x)が、バツフア25からは部分判定結果N^
(l、m、x)が、レジスタ27より漸化式値T
(l、x−1)が出力される。なお、アドレス信
号l2は0≦l≦mの範囲でアドレス信号x2は1≦
x≦6の範囲でそれぞれ変化される。これらをも
とに(22)、(23)式の計算を行なう回路は一例と
して「特願昭51−13846号明細書第5図」に示さ
れた如く構成できる。なお、本実施例では以上の
処理と並行して 仮判定結果 N(m、x)=N^(l^、m、x)、
(29) なる計算が行なわれる。 ただし、l^=L(m、x)((23)式参照)。 かくして得られる漸化式値T(m、x)、仮区
分点L(m、x)、仮判定結果N(m、x)はそ
れぞれレジスタ27、バツフア28、バツフア2
6に、カウンタ信号m1及びアドレス信号x2によ
り番地指定されて書込まれる。 以上述べた第1マツチング部と第2マツチング
部の動作は入力パタンバツフア11に新たなベク
トルanが入力される毎に繰り返され、これに同
期してカウンタ信号m1(=m)は1ずつ増加さ
れる。音声信号の入力が終了すると第3図のタイ
ムチヤートに示すように終端検出を意味するパル
スPeが入力部10により発生される。この時点
以後判定部30は(24−a)、(24−b)、(24−
c)式に示される判定動作を実行する。最初、
(24−a)式の初期条件を設定する。すなわち、
xをカウントするための信号x4にフオーマツト指
定部22から信号線Kにより与えられる単語数k
=6がセツトされる。同時に、その時点で信号
m1によつて指定されている入力パタン長Iを信
号m4とする。以下は(24−b)式を実行するこ
とによつて区分点l^(x)をバツフア28より信
号線l4を経由して読み出す。なお、(24−b)式
における引数l^(x+1)は信号m4によつて指
定される。認識結果は仮判定結果N(m、x)の
バツフア29から n^(x)=N(ln^(x)、x) (30) の形で信号m4として読み出される。(30)式にお
ける引数l^(x+1)は信号m4により、xは信
号x4により指定される。かくして最初の認識結果
n^(6)が得られ信号n0として出力される。次にm4
=l^(x)としかつカウンタ信号x4を1だけ減じ
た後以上の動作を繰返すことによつて次の認識結
果n^(5)が得られる。同様の繰返しによつて認識結
果n^(4)、n^(3)、n^(2)、n^(1)が順次(逆順に
)得ら
れ、信号線n0より出力される。かくの如き動作を
実行するための、判定部30は一例として「特願
昭51−13846号明細書第7図」に記載された如き
回路によつて構成できる。 以上本発明の原理を実施例にもとづいて説明し
たが、これらの記載は本発明の範囲を限定するを
のではない。特に、フオーマツト指定部によるフ
オーマツト指定の方法は種々考えられる。例え
ば、フオーマツトは固定されたものではなく外部
からの制御によつて変化する形態であつてもよ
い。また、本明細書では類似度を基にして認識す
る動作を説明したが、距離のように大小関係が逆
の尺度によつても同様な処理が可能である。この
場合には上記実例中における最大化処理をすべて
最小化処理に置換するとよい。
第1図は本発明の原理を説明するための図、第
2図は本発明の一実施例を示す図および第3図は
前第2図の動作を説明するためのタイムチヤート
である。 第1図および第2図において、10は入力部、
11は入力パタンバツフア、12はフオーマツト
指定部、13は標準パタン記憶、14は接続部、
15は標準パタンバツフア、16はマツチング
部、17は判定部、21は第1マツチング部、2
2はフオーマツト指定部、23は最大値検出部、
24と25はバツフア、26は第2マツチング
部、27はレジスタ、28と29はバツフア、3
0は判定部である。
2図は本発明の一実施例を示す図および第3図は
前第2図の動作を説明するためのタイムチヤート
である。 第1図および第2図において、10は入力部、
11は入力パタンバツフア、12はフオーマツト
指定部、13は標準パタン記憶、14は接続部、
15は標準パタンバツフア、16はマツチング
部、17は判定部、21は第1マツチング部、2
2はフオーマツト指定部、23は最大値検出部、
24と25はバツフア、26は第2マツチング
部、27はレジスタ、28と29はバツフア、3
0は判定部である。
Claims (1)
- 1 入力音声を分析して特徴ベクトルaiの時系
列たる入力パタンA=a1、a2、………、ai……
…、aIに変換するための入力部と、単語nの標
準パタンBn=bn 1、bn 2、………bn j、………
、b
n Jnを各単語に対して記憶するための標準パタン
記憶部と、前記入力パタンAとして連続発声入力
が許容される単語数kと、連続発声中の第x単語
として許容される単語群fxの時系列F=f1、f2、
………fx………fkとして単語生起順序たるフオ
ーマツトとを指定するためのフオーマツト指定部
と、前記入力パタンAの時間点i=lを始端とし
時間点i=mを終端とする部分パタンA(l、
m)と前記標準パタンBnとの間の類似度S
(l、m、n)をすべての単語類nに関して算出
するための類似度計算部と、前記入力パタンAを
前記フオーマツト指定部により指定される単語数
であるk個の部分パタンA(l、m)の群A
(0、l(1))、A(l(1)、l(2))、………、A(l
(k−1)、I)に分解しそれぞれの部分パタンに
対して前記フオーマツト指定部によつて許容され
る条件、すなわちn(x)∈fxの条件のもとに
単語n(1)、n(2)、………、n(k)を割り当て前記類
似度の群S(0、l(1)、n(1))、S(l(1)、l
(2)、n(2))、………、S(l(k−1)、I、n
(k))の総和が区分点群l(1)、l(2)、………、l
(k−1)、及び単語群n(1)、n(2)、………、n(k)
の定め方に関して最大となるようにし最適なパラ
メタn^(1)、n^(2)、………、n^(k)を認識結果と
して
出力する処理を実行する全体マツチング部とから
構成されたことを特徴とする連続音声認識装置。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8784978A JPS5529803A (en) | 1978-07-18 | 1978-07-18 | Continuous voice discriminating device |
| GB7924805A GB2031206B (en) | 1978-07-18 | 1979-07-17 | System for recognizing words continuously spoken accordingto a format |
| US06/058,598 US4286115A (en) | 1978-07-18 | 1979-07-18 | System for recognizing words continuously spoken according to a format |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8784978A JPS5529803A (en) | 1978-07-18 | 1978-07-18 | Continuous voice discriminating device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5529803A JPS5529803A (en) | 1980-03-03 |
| JPS6131477B2 true JPS6131477B2 (ja) | 1986-07-21 |
Family
ID=13926324
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8784978A Granted JPS5529803A (en) | 1978-07-18 | 1978-07-18 | Continuous voice discriminating device |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US4286115A (ja) |
| JP (1) | JPS5529803A (ja) |
| GB (1) | GB2031206B (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6449273U (ja) * | 1987-09-21 | 1989-03-27 |
Families Citing this family (30)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6024994B2 (ja) * | 1980-04-21 | 1985-06-15 | シャープ株式会社 | パタ−ン類似度計算方式 |
| AU7529981A (en) * | 1980-09-19 | 1982-03-25 | Hitachi Limited | Language analysis by pattern recognition |
| JPS57147781A (en) * | 1981-03-06 | 1982-09-11 | Nec Corp | Pattern matching device |
| JPS57178578A (en) * | 1981-04-27 | 1982-11-02 | Toshiba Corp | Pattern recognition system |
| JPS57201300A (en) * | 1981-06-05 | 1982-12-09 | Hitachi Ltd | Voice recognizer |
| JPS5842098A (ja) * | 1981-09-04 | 1983-03-11 | 電子計算機基本技術研究組合 | 音声認識装置 |
| US4592086A (en) * | 1981-12-09 | 1986-05-27 | Nippon Electric Co., Ltd. | Continuous speech recognition system |
| US4570232A (en) * | 1981-12-21 | 1986-02-11 | Nippon Telegraph & Telephone Public Corporation | Speech recognition apparatus |
| JPS58115490A (ja) * | 1981-12-29 | 1983-07-09 | 日本電気株式会社 | パタン間距離計算装置 |
| US4567606A (en) * | 1982-11-03 | 1986-01-28 | International Telephone And Telegraph Corporation | Data processing apparatus and method for use in speech recognition |
| JPS5998387A (ja) * | 1982-11-26 | 1984-06-06 | Nec Corp | メモリ回路 |
| JPS59121098A (ja) * | 1982-12-28 | 1984-07-12 | 株式会社東芝 | 連続音声認識装置 |
| US4624008A (en) | 1983-03-09 | 1986-11-18 | International Telephone And Telegraph Corporation | Apparatus for automatic speech recognition |
| US4817158A (en) * | 1984-10-19 | 1989-03-28 | International Business Machines Corporation | Normalization of speech signals |
| JPS61145599A (ja) * | 1984-12-19 | 1986-07-03 | 日本電気株式会社 | 連続音声認識装置 |
| US4748670A (en) * | 1985-05-29 | 1988-05-31 | International Business Machines Corporation | Apparatus and method for determining a likely word sequence from labels generated by an acoustic processor |
| US4975960A (en) * | 1985-06-03 | 1990-12-04 | Petajan Eric D | Electronic facial tracking and detection system and method and apparatus for automated speech recognition |
| GB8610809D0 (en) * | 1986-05-02 | 1986-06-11 | Smiths Industries Plc | Speech recognition apparatus |
| US4866778A (en) * | 1986-08-11 | 1989-09-12 | Dragon Systems, Inc. | Interactive speech recognition apparatus |
| EP0283902B1 (en) * | 1987-03-16 | 1993-06-30 | Nec Corporation | Pattern matching system |
| US5228087A (en) * | 1989-04-12 | 1993-07-13 | Smiths Industries Public Limited Company | Speech recognition apparatus and methods |
| GB8908205D0 (en) * | 1989-04-12 | 1989-05-24 | Smiths Industries Plc | Speech recognition apparatus and methods |
| JPH03203488A (ja) * | 1989-12-29 | 1991-09-05 | Pioneer Electron Corp | 音声リモートコントロール装置 |
| US5247580A (en) * | 1989-12-29 | 1993-09-21 | Pioneer Electronic Corporation | Voice-operated remote control system |
| US5222187A (en) | 1989-12-29 | 1993-06-22 | Texas Instruments Incorporated | Grammar-based checksum constraints for high performance speech recognition circuit |
| WO1991013431A1 (en) * | 1990-02-26 | 1991-09-05 | Motorola, Inc | Method and apparatus for recognizing string of word commands in a hierarchical command structure |
| JP2808906B2 (ja) * | 1991-02-07 | 1998-10-08 | 日本電気株式会社 | 音声認識装置 |
| US6073097A (en) * | 1992-11-13 | 2000-06-06 | Dragon Systems, Inc. | Speech recognition system which selects one of a plurality of vocabulary models |
| JP3576272B2 (ja) * | 1995-06-22 | 2004-10-13 | シャープ株式会社 | 音声認識装置および方法 |
| TWI312981B (en) * | 2006-11-30 | 2009-08-01 | Inst Information Industr | Voice detection apparatus, method, computer program product, and computer readable medium for adjusting a window size dynamically |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3816722A (en) * | 1970-09-29 | 1974-06-11 | Nippon Electric Co | Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer |
| US4059725A (en) * | 1975-03-12 | 1977-11-22 | Nippon Electric Company, Ltd. | Automatic continuous speech recognition system employing dynamic programming |
| GB1557286A (en) * | 1975-10-31 | 1979-12-05 | Nippon Electric Co | Speech recognition |
| JPS52140204A (en) * | 1976-05-18 | 1977-11-22 | Nec Corp | Automatic voice recognition device |
| US4156868A (en) * | 1977-05-05 | 1979-05-29 | Bell Telephone Laboratories, Incorporated | Syntactic word recognizer |
| JPS5938600A (ja) * | 1982-08-27 | 1984-03-02 | Toshiba Corp | 伝熱管の疲労抑制剤 |
-
1978
- 1978-07-18 JP JP8784978A patent/JPS5529803A/ja active Granted
-
1979
- 1979-07-17 GB GB7924805A patent/GB2031206B/en not_active Expired
- 1979-07-18 US US06/058,598 patent/US4286115A/en not_active Expired - Lifetime
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6449273U (ja) * | 1987-09-21 | 1989-03-27 |
Also Published As
| Publication number | Publication date |
|---|---|
| GB2031206A (en) | 1980-04-16 |
| US4286115A (en) | 1981-08-25 |
| GB2031206B (en) | 1983-02-02 |
| JPS5529803A (en) | 1980-03-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS6131477B2 (ja) | ||
| EP0355748A2 (en) | A pattern recognition apparatus and method for doing the same | |
| JPS63259697A (ja) | 音声認識方法 | |
| CN110136689B (zh) | 基于迁移学习的歌声合成方法、装置及存储介质 | |
| JPS6350747B2 (ja) | ||
| JPS6326400B2 (ja) | ||
| JP4570509B2 (ja) | 読み生成装置、読み生成方法及びコンピュータプログラム | |
| JP2980026B2 (ja) | 音声認識装置 | |
| JPH0981730A (ja) | パターン認識方法及び装置及びコンピュータ制御装置 | |
| CN119649894B (zh) | 基因调控网络的预测模型生成方法、装置、服务器和介质 | |
| JPH08115408A (ja) | 手話認識装置 | |
| US6374218B2 (en) | Speech recognition system which displays a subject for recognizing an inputted voice | |
| JP2964881B2 (ja) | 音声認識装置 | |
| EP0215573B1 (en) | Apparatus and methods for speech recognition | |
| JP3477751B2 (ja) | 連続単語音声認識装置 | |
| KR100355453B1 (ko) | 동시에 병렬적으로 문자인식 및 음성인식을 사용한 컴퓨터 사용자 인터페이스 방법 | |
| JP2980382B2 (ja) | 話者適応音声認識方法および装置 | |
| JPH03223799A (ja) | 分離しているワード、特に非常に大きい語いの認識方法と装置 | |
| CN115240661B (zh) | 佩戴防护设备的语音识别方法、装置、设备和存储介质 | |
| JPS6232799B2 (ja) | ||
| JP2757356B2 (ja) | 単語音声認識方法および装置 | |
| CN113255361B (zh) | 语音内容的自动检测方法、装置、设备以及存储介质 | |
| JP2002229589A (ja) | 音声認識装置 | |
| CN118230718A (zh) | 语言模型训练方法、系统、终端及介质 | |
| JP3812779B2 (ja) | 統合性能評価方法及びシステム並びに情報記録媒体 |