JPH06214595A - 音声認識方法 - Google Patents
音声認識方法Info
- Publication number
- JPH06214595A JPH06214595A JP5007396A JP739693A JPH06214595A JP H06214595 A JPH06214595 A JP H06214595A JP 5007396 A JP5007396 A JP 5007396A JP 739693 A JP739693 A JP 739693A JP H06214595 A JPH06214595 A JP H06214595A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- dsp
- arithmetic
- processing
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【目的】 2つの演算処理プロセッサにより音声認識処
理を繰り返し行う場合の周期(フレーム長)を短縮す
る。 【構成】 2つの演算(デジタル)プロセッサ10,2
0の実行タイミングを1フレーム以上ずらし、各演算プ
ロセッサは自己に割当てられた演算処理をフレーム毎に
繰り返し実行する。
理を繰り返し行う場合の周期(フレーム長)を短縮す
る。 【構成】 2つの演算(デジタル)プロセッサ10,2
0の実行タイミングを1フレーム以上ずらし、各演算プ
ロセッサは自己に割当てられた演算処理をフレーム毎に
繰り返し実行する。
Description
【0001】
【産業上の利用分野】本発明は、フレームのような一定
周期で音声認識処理を実行する音声認識方法に関し、よ
り詳しくは、複数のデジタル処理プロセッサで処理を分
担する音声認識方法に関する。
周期で音声認識処理を実行する音声認識方法に関し、よ
り詳しくは、複数のデジタル処理プロセッサで処理を分
担する音声認識方法に関する。
【0002】
【従来の技術】従来、一般的な音声認識方法では、音声
を電気信号に変換し、その信号波形の特徴を抽出し、予
め定めた標準パターンと特徴比較を行う。最も類似した
標準パターンに付加された識別ラベル(音素や音韻につ
いての識別番号)を音声認識結果として信号出力する。
を電気信号に変換し、その信号波形の特徴を抽出し、予
め定めた標準パターンと特徴比較を行う。最も類似した
標準パターンに付加された識別ラベル(音素や音韻につ
いての識別番号)を音声認識結果として信号出力する。
【0003】このような音声認識方法では音声信号を一
定周期(フレーム周期と呼ばれる)毎に特徴抽出を行
い、その結果に基づいて音声認識を行う。信号波形の特
徴抽出や標準パターンの類似度の算出(距離計算)には
複雑な計算処理が伴なうために、その演算処理に時間が
かかる。そこで、最近では、複数のデジタル処理プロセ
ッサにより演算処理を分担して行い、フレーム周期を短
縮させることによって音声認識精度の向上を図った音声
認識装置が提案されている。
定周期(フレーム周期と呼ばれる)毎に特徴抽出を行
い、その結果に基づいて音声認識を行う。信号波形の特
徴抽出や標準パターンの類似度の算出(距離計算)には
複雑な計算処理が伴なうために、その演算処理に時間が
かかる。そこで、最近では、複数のデジタル処理プロセ
ッサにより演算処理を分担して行い、フレーム周期を短
縮させることによって音声認識精度の向上を図った音声
認識装置が提案されている。
【0004】従来、この種、音声認識装置の部分回路構
成を図2に示す。図2において、第1のデジタル(演
算)処理プロセッサ(DSP)10と第2のDSP20
の間にバッファ15が設けられている。
成を図2に示す。図2において、第1のデジタル(演
算)処理プロセッサ(DSP)10と第2のDSP20
の間にバッファ15が設けられている。
【0005】このような構成において、第1のDSP1
0は音声信号から抽出された特徴パラメータを用いて音
声認識のための第1の演算処理を実行すると、バッファ
15にその演算結果P(t)を転送する。バッファ15
は転送タイミングの調整のために演算結果P(t)を一
時格納し、第2のDSP20に一時格納後の演算結果
P′(t)を引渡す。
0は音声信号から抽出された特徴パラメータを用いて音
声認識のための第1の演算処理を実行すると、バッファ
15にその演算結果P(t)を転送する。バッファ15
は転送タイミングの調整のために演算結果P(t)を一
時格納し、第2のDSP20に一時格納後の演算結果
P′(t)を引渡す。
【0006】第2のDSP20はこの演算結果P′
(t)を用いて音声認識に関わる第2の演算処理を行
う。この演算結果Q(t)はバッファ15に一時格納
後、Q′(t)として第1のDSP10に引渡される。
第1のDSP10は第2の演算結果Q′(t)を用い
て、第3の演算処理を行って音声認識結果を出力する。
(t)を用いて音声認識に関わる第2の演算処理を行
う。この演算結果Q(t)はバッファ15に一時格納
後、Q′(t)として第1のDSP10に引渡される。
第1のDSP10は第2の演算結果Q′(t)を用い
て、第3の演算処理を行って音声認識結果を出力する。
【0007】このような一連の処理が1フレームの中で
実行される。参考のために、上述の処理の実行タイミン
グを図3に示した。図3から明らかなように1フレーム
内で実行される処理は、以下の処理、すなわち、第1の
DSP10の演算→バッファ15への転送→第2のDS
P20の演算→バッファ15への転送→第1のDSP1
0の演算の処理があるため、1フレーム長は上述の処理
時間の合計となる。
実行される。参考のために、上述の処理の実行タイミン
グを図3に示した。図3から明らかなように1フレーム
内で実行される処理は、以下の処理、すなわち、第1の
DSP10の演算→バッファ15への転送→第2のDS
P20の演算→バッファ15への転送→第1のDSP1
0の演算の処理があるため、1フレーム長は上述の処理
時間の合計となる。
【0008】
【発明が解決しようとする課題】また、上述の第1,第
2のDSP10,20の一方が演算処理を実行している
間、他方のDSPは待ち時間となる(図3参照)。加え
て、DSPの処理速度には限界があるので、DSPの最
高処理速度を用いても1フレーム長に限界が生じ1フレ
ーム長の短縮が難しいという解決すべき課題が従来方法
にはあった。
2のDSP10,20の一方が演算処理を実行している
間、他方のDSPは待ち時間となる(図3参照)。加え
て、DSPの処理速度には限界があるので、DSPの最
高処理速度を用いても1フレーム長に限界が生じ1フレ
ーム長の短縮が難しいという解決すべき課題が従来方法
にはあった。
【0009】そこで、上述の点に鑑みて、本発明の目的
は、音声の認識処理を複数のDSPで分担して実行する
場合、DSPの待ち時間を減少させ、1フレーム長を短
縮することの可能な音声認識方法を提供することにあ
る。
は、音声の認識処理を複数のDSPで分担して実行する
場合、DSPの待ち時間を減少させ、1フレーム長を短
縮することの可能な音声認識方法を提供することにあ
る。
【0010】
【課題を解決するための手段】このような目的を達成す
るために、本発明は、第1の演算プロセッサにより第1
の演算処理を実行し、その第1の演算結果を用いて、第
2の演算プロセッサにより第2の演算処理を実行し、そ
の第2の演算処理結果を用いて前記第1の演算プロセッ
サにより第3の演算処理を実行して、音声認識に関わる
処理をフレーム毎に繰り返し実行する音声認識方法にお
いて、前記第2の演算プロセッサは、前記第1の演算プ
ロセッサの第1の演算処理の後、少なくとも1フレーム
以上の時間だけ遅延させて前記第2の演算処理をフレー
ム毎に繰り返し実行し、前記第1の演算プロセッサは、
前記第2の演算処理より少なくとも1フレーム以上の時
間だけ遅延させた前記第3の演算処理を新たな前記第1
の演算処理と共にフレーム毎に繰り返し実行することを
特徴とする。
るために、本発明は、第1の演算プロセッサにより第1
の演算処理を実行し、その第1の演算結果を用いて、第
2の演算プロセッサにより第2の演算処理を実行し、そ
の第2の演算処理結果を用いて前記第1の演算プロセッ
サにより第3の演算処理を実行して、音声認識に関わる
処理をフレーム毎に繰り返し実行する音声認識方法にお
いて、前記第2の演算プロセッサは、前記第1の演算プ
ロセッサの第1の演算処理の後、少なくとも1フレーム
以上の時間だけ遅延させて前記第2の演算処理をフレー
ム毎に繰り返し実行し、前記第1の演算プロセッサは、
前記第2の演算処理より少なくとも1フレーム以上の時
間だけ遅延させた前記第3の演算処理を新たな前記第1
の演算処理と共にフレーム毎に繰り返し実行することを
特徴とする。
【0011】
【作用】本発明では、1つのデータについて関連して2
つの演算処理プロセッサにより実行される、第1の演算
処理〜第3の演算処理までの一連の処理は複数フレーム
時間で実行されるが、各演算プロセッサは自己に割当て
られた処理をフレーム毎に実行して時系列的に入力され
るデータに対して演算処理を施す。
つの演算処理プロセッサにより実行される、第1の演算
処理〜第3の演算処理までの一連の処理は複数フレーム
時間で実行されるが、各演算プロセッサは自己に割当て
られた処理をフレーム毎に実行して時系列的に入力され
るデータに対して演算処理を施す。
【0012】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。
に説明する。
【0013】図1は本発明実施例の処理順序を示す。
【0014】なお、本実施例の回路構成は図2の従来例
と同様であり、また構成回路の処理内容も従来例と同様
である。本実施例では、従来、1フレーム内で実行して
いた複数の処理を1フレームずつ順次に遅延させて実行
させるように処理順序を変えることによりDSPの待ち
時間をなくし、しかもフレーム単位で音声認識結果を出
力する。以下、本実施例の処理順序を説明する。
と同様であり、また構成回路の処理内容も従来例と同様
である。本実施例では、従来、1フレーム内で実行して
いた複数の処理を1フレームずつ順次に遅延させて実行
させるように処理順序を変えることによりDSPの待ち
時間をなくし、しかもフレーム単位で音声認識結果を出
力する。以下、本実施例の処理順序を説明する。
【0015】図1において、第1のDSP10が、音声
認識に用いる特徴パラメータを時刻tで入力すると、第
1の演算処理を実行し、その演算結果P(t)をバッフ
ァ15に引渡す。次の時刻t+1で、時刻tの演算結果
がP′(t)として第2のDSP20に引渡される。第
2のDSP20は時刻t+2で、第1のDSP10の時
刻tの演算結果を用いて第2の演算を行う。その演算結
果Q(t)がバッファ15へ転送され、時刻t+3でバ
ッファ15から第1のDSP10に引渡される。第1の
DSPは時刻t+4で第2の演算結果Q′(t)に対す
る第3の演算処理を実行して音声認識結果を出力する。
なお、第1のDSPは時刻t+4で従来と同様、第1の
演算処理をも行うが、この時刻の第1の演算処理に用い
る特徴パラメータは時刻t+4で入力したデータであ
る。以上がある時刻tの特徴パラメータが時刻t+4で
音声認識結果に変換されるまでの処理順序である。
認識に用いる特徴パラメータを時刻tで入力すると、第
1の演算処理を実行し、その演算結果P(t)をバッフ
ァ15に引渡す。次の時刻t+1で、時刻tの演算結果
がP′(t)として第2のDSP20に引渡される。第
2のDSP20は時刻t+2で、第1のDSP10の時
刻tの演算結果を用いて第2の演算を行う。その演算結
果Q(t)がバッファ15へ転送され、時刻t+3でバ
ッファ15から第1のDSP10に引渡される。第1の
DSPは時刻t+4で第2の演算結果Q′(t)に対す
る第3の演算処理を実行して音声認識結果を出力する。
なお、第1のDSPは時刻t+4で従来と同様、第1の
演算処理をも行うが、この時刻の第1の演算処理に用い
る特徴パラメータは時刻t+4で入力したデータであ
る。以上がある時刻tの特徴パラメータが時刻t+4で
音声認識結果に変換されるまでの処理順序である。
【0016】第1のDSP10では、第1の演算処理と
第3の演算処理を各時刻で繰り返して行く。したがって
第1のDSPでは一定時間毎に音声認識結果を出力して
行くことができる。
第3の演算処理を各時刻で繰り返して行く。したがって
第1のDSPでは一定時間毎に音声認識結果を出力して
行くことができる。
【0017】本実施例ではフレーム毎に、各構成間のデ
ータ転送の同期がとられているので、1フレーム内でデ
ータ転送を行う従来例に比べ第1DSP10および第2
DSP20共に相手側とデータ転送を行う間の待ち時間
がなくなる。したがって、この待ち時間を短縮した分だ
け1フレーム長を短縮することができる。
ータ転送の同期がとられているので、1フレーム内でデ
ータ転送を行う従来例に比べ第1DSP10および第2
DSP20共に相手側とデータ転送を行う間の待ち時間
がなくなる。したがって、この待ち時間を短縮した分だ
け1フレーム長を短縮することができる。
【0018】より具体的には、従来の1フレーム長は第
1のDSP10の第1,第3の演算処理の時間+バッフ
ァ15のデータ転送時間+第2のDSP20の第2の演
算処理時間である。本実施例では第1,第3演算処理の
時間か、バッファ15のデータ転送時間かまたは、第2
のDSP20の第2の演算処理時間の中のいずれかの最
大となる時間が1フレーム長となる。
1のDSP10の第1,第3の演算処理の時間+バッフ
ァ15のデータ転送時間+第2のDSP20の第2の演
算処理時間である。本実施例では第1,第3演算処理の
時間か、バッファ15のデータ転送時間かまたは、第2
のDSP20の第2の演算処理時間の中のいずれかの最
大となる時間が1フレーム長となる。
【0019】本実施例の他に次の例を実施できる。
【0020】(1) 本実施例では、第1のDSP10
および第2のDSP20の間にデータ転送用バッファを
設ける例を示しているが、バッファを特に設ける必要は
なく、第1のDSP10と第2のDSP20との間で直
接データの授受を行うこともできる。この場合は、上記
両プロセッサ間でデータ転送用の通信制御信号の授受を
行う。また、本実施例ではバッファ15は第1のDSP
10のデータの入力用および出力用に兼用しているが、
入力用と出力用に2つのバッファを用いてもよい。
および第2のDSP20の間にデータ転送用バッファを
設ける例を示しているが、バッファを特に設ける必要は
なく、第1のDSP10と第2のDSP20との間で直
接データの授受を行うこともできる。この場合は、上記
両プロセッサ間でデータ転送用の通信制御信号の授受を
行う。また、本実施例ではバッファ15は第1のDSP
10のデータの入力用および出力用に兼用しているが、
入力用と出力用に2つのバッファを用いてもよい。
【0021】(2) 本実施例では、2つのDSPで音
声認識処理を実行する場合を例にしているが、2つ以上
のDSPを直列的に接続し、最下流のDSPの処理結果
を用いて最下流以外のDSPが再び演算処理を実行する
場合にも本発明を適用できる。
声認識処理を実行する場合を例にしているが、2つ以上
のDSPを直列的に接続し、最下流のDSPの処理結果
を用いて最下流以外のDSPが再び演算処理を実行する
場合にも本発明を適用できる。
【0022】(3) 本実施例では音声認識処理に関わ
る3つの処理を2つのDSPで実行する例であるが、2
つのDSPで実行する処理は、3つ以上でもよく、この
場合は、授受を行う関連データについて2つのDSPが
実行する処理のフレームタイミングを異ならせることに
なる。
る3つの処理を2つのDSPで実行する例であるが、2
つのDSPで実行する処理は、3つ以上でもよく、この
場合は、授受を行う関連データについて2つのDSPが
実行する処理のフレームタイミングを異ならせることに
なる。
【0023】
【発明の効果】以上、説明したように、本発明によれ
ば、各演算処理プロセッサの待ち時間がなくなり、ま
た、フレーム長を短くできるので、音声認識精度の向上
に寄与することができる。
ば、各演算処理プロセッサの待ち時間がなくなり、ま
た、フレーム長を短くできるので、音声認識精度の向上
に寄与することができる。
【図1】本発明実施例の処理順序を示す説明図である。
【図2】音声認識装置の部分構成を示すブロック図であ
る。
る。
【図3】従来例の処理順序を示す説明図である。
10 第1のデジタル処理プロセッサ(第1のDSP) 15 バッファ 20 第2のデジタル処理プロセッサ(第2のDSP)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 武田 一哉 東京都新宿区西新宿2丁目3番2号 国際 電信電話株式会社内 (72)発明者 黒岩 眞吾 東京都新宿区西新宿2丁目3番2号 国際 電信電話株式会社内
Claims (1)
- 【請求項1】 第1の演算プロセッサにより第1の演算
処理を実行し、その第1の演算結果を用いて、第2の演
算プロセッサにより第2の演算処理を実行し、その第2
の演算処理結果を用いて前記第1の演算プロセッサによ
り第3の演算処理を実行して、音声認識に関わる処理を
フレーム毎に繰り返し実行する音声認識方法において、 前記第2の演算プロセッサは、前記第1の演算プロセッ
サの第1の演算処理の後、少なくとも1フレーム以上の
時間だけ遅延させて前記第2の演算処理をフレーム毎に
繰り返し実行し、 前記第1の演算プロセッサは、前記第2の演算処理より
少なくとも1フレーム以上の時間だけ遅延させた前記第
3の演算処理を新たな前記第1の演算処理と共にフレー
ム毎に繰り返し実行することを特徴とする音声認識方
法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5007396A JPH06214595A (ja) | 1993-01-20 | 1993-01-20 | 音声認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5007396A JPH06214595A (ja) | 1993-01-20 | 1993-01-20 | 音声認識方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH06214595A true JPH06214595A (ja) | 1994-08-05 |
Family
ID=11664747
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5007396A Pending JPH06214595A (ja) | 1993-01-20 | 1993-01-20 | 音声認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH06214595A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2006075648A1 (ja) * | 2005-01-17 | 2006-07-20 | Nec Corporation | 音声認識システム、音声認識方法及び音声認識プログラム |
| US7343288B2 (en) | 2002-05-08 | 2008-03-11 | Sap Ag | Method and system for the processing and storing of voice information and corresponding timeline information |
| US7406413B2 (en) | 2002-05-08 | 2008-07-29 | Sap Aktiengesellschaft | Method and system for the processing of voice data and for the recognition of a language |
| CN119541517A (zh) * | 2023-08-29 | 2025-02-28 | 华为技术有限公司 | 处理声音信号的方法和电子设备 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS62124600A (ja) * | 1985-11-26 | 1987-06-05 | 株式会社東芝 | 音声認識装置 |
| JPH0262879A (ja) * | 1988-08-26 | 1990-03-02 | Agency Of Ind Science & Technol | フォトクロミック化合物及びその製造方法 |
| JPH0345840A (ja) * | 1989-07-12 | 1991-02-27 | Matsushita Electric Ind Co Ltd | 空調機器における室外ユニット |
-
1993
- 1993-01-20 JP JP5007396A patent/JPH06214595A/ja active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS62124600A (ja) * | 1985-11-26 | 1987-06-05 | 株式会社東芝 | 音声認識装置 |
| JPH0262879A (ja) * | 1988-08-26 | 1990-03-02 | Agency Of Ind Science & Technol | フォトクロミック化合物及びその製造方法 |
| JPH0345840A (ja) * | 1989-07-12 | 1991-02-27 | Matsushita Electric Ind Co Ltd | 空調機器における室外ユニット |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7343288B2 (en) | 2002-05-08 | 2008-03-11 | Sap Ag | Method and system for the processing and storing of voice information and corresponding timeline information |
| US7406413B2 (en) | 2002-05-08 | 2008-07-29 | Sap Aktiengesellschaft | Method and system for the processing of voice data and for the recognition of a language |
| WO2006075648A1 (ja) * | 2005-01-17 | 2006-07-20 | Nec Corporation | 音声認識システム、音声認識方法及び音声認識プログラム |
| JPWO2006075648A1 (ja) * | 2005-01-17 | 2008-08-07 | 日本電気株式会社 | 音声認識システム、音声認識方法及び音声認識プログラム |
| US7930180B2 (en) | 2005-01-17 | 2011-04-19 | Nec Corporation | Speech recognition system, method and program that generates a recognition result in parallel with a distance value |
| JP5103907B2 (ja) * | 2005-01-17 | 2012-12-19 | 日本電気株式会社 | 音声認識システム、音声認識方法及び音声認識プログラム |
| CN119541517A (zh) * | 2023-08-29 | 2025-02-28 | 华为技术有限公司 | 处理声音信号的方法和电子设备 |
| CN119541517B (zh) * | 2023-08-29 | 2026-04-24 | 华为技术有限公司 | 处理声音信号的方法和电子设备 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH06214595A (ja) | 音声認識方法 | |
| US8453003B2 (en) | Communication method | |
| JP2000322087A (ja) | 多チャンネル入力音声認識装置 | |
| JPS6059441A (ja) | デ−タ制御回路 | |
| JPH05110441A (ja) | 予測出力型d/a変換器 | |
| CN114007176A (zh) | 用于降低信号延时的音频信号处理方法、装置及存储介质 | |
| JPH0693240B2 (ja) | プログラム同期回路 | |
| JPS62175831A (ja) | タグ付きパイプライン制御方式 | |
| JPS6277651A (ja) | デ−タフロ−型計算機の分岐処理方式 | |
| JPS6059461A (ja) | プログラムメモリ装置 | |
| JPS60164861A (ja) | デ−タ転送処理方法 | |
| JPH07141288A (ja) | Dma転送方式 | |
| JP2634919B2 (ja) | マルチプロセッサ装置 | |
| JPS6135496A (ja) | 音声認識装置 | |
| JPS59138147A (ja) | デ−タ伝送装置 | |
| JPH07117938B2 (ja) | 計算機間の処理の同期方式 | |
| JPH06152546A (ja) | マイクロプロセッサ | |
| JPH07112186B2 (ja) | 同期処理lsiインタフェース方式 | |
| JPS59231628A (ja) | チヤネルの割込み制御方式 | |
| JPH06195197A (ja) | 音声符号化演算装置 | |
| JPH0398163A (ja) | ベクトルデータ処理装置 | |
| JPH09319576A (ja) | パイプライン処理装置 | |
| JPH05291959A (ja) | 予測出力型d/a変換器 | |
| JPS6363944B2 (ja) | ||
| JPH0287721A (ja) | アナログ入力装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 19980220 |