JPH03257500A - 音声のスペクトル包絡パラメータ符号化装置 - Google Patents
音声のスペクトル包絡パラメータ符号化装置Info
- Publication number
- JPH03257500A JPH03257500A JP2056235A JP5623590A JPH03257500A JP H03257500 A JPH03257500 A JP H03257500A JP 2056235 A JP2056235 A JP 2056235A JP 5623590 A JP5623590 A JP 5623590A JP H03257500 A JPH03257500 A JP H03257500A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- phoneme
- phonological
- code word
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0018—Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は、音韻ベクトルを一定個数まとめて音韻マト
リクスとし、この音韻マトリクスを1単位としてマトリ
クス量子化を行う音声のスペクトル包絡パラメータ符号
化装置に関するものである。
リクスとし、この音韻マトリクスを1単位としてマトリ
クス量子化を行う音声のスペクトル包絡パラメータ符号
化装置に関するものである。
第3図は例えば、アイイーイーイー トランザクション
オン アコースティックス スピーチアンド シグナ
ル プロセシング(IEEETransaction
on Acoustics、5peech、and S
ignalProcess ing)第ASSP−34
巻 第6号(1986年12月)の第1427〜143
9頁に示された、従来の音声のスペクトル包絡パラメー
タ符号化装置を示すブロック図である。
オン アコースティックス スピーチアンド シグナ
ル プロセシング(IEEETransaction
on Acoustics、5peech、and S
ignalProcess ing)第ASSP−34
巻 第6号(1986年12月)の第1427〜143
9頁に示された、従来の音声のスペクトル包絡パラメー
タ符号化装置を示すブロック図である。
図において、1は入力音声信号を一定時間(例えば10
m5ec)の分析フレーム毎に分析して得られる、入力
音声のスペクトル包絡情報を表すパラメータである音韻
ベクトルが入力される入力端子であり、2はこの入力端
子1より入力された音韻ベクトルを時間方向にL個まと
めて音韻マトリクスを生成する音韻マトリクス生成手段
である。3は有限M個の典型的な音韻マトリクス符号語
を蓄積している符号帳であり、4はこの符号帳3に蓄積
されたM個の音韻マトリクス符号語を順番に読み出すた
めの切り換えスイッチである。
m5ec)の分析フレーム毎に分析して得られる、入力
音声のスペクトル包絡情報を表すパラメータである音韻
ベクトルが入力される入力端子であり、2はこの入力端
子1より入力された音韻ベクトルを時間方向にL個まと
めて音韻マトリクスを生成する音韻マトリクス生成手段
である。3は有限M個の典型的な音韻マトリクス符号語
を蓄積している符号帳であり、4はこの符号帳3に蓄積
されたM個の音韻マトリクス符号語を順番に読み出すた
めの切り換えスイッチである。
5は前記音韻マトリクス生成手段2からの音韻マトリク
スと、符号帳3から切り換えスイッチ4にて順次読み出
される音韻マトリクス符号語の間の距離を計算する距離
計算手段である。6はこの距離計算手段5I/C,て計
算された距離を比較し、最も小さな値を与える音韻マト
リクス符号語を求めて最適音韻マトリクス符号語とし、
その最適音韻マトリクス符号語番号を出力する最適符号
語選択手段であり、7はその最適音韻マトリクス符号語
番号が出力される出力端子である。
スと、符号帳3から切り換えスイッチ4にて順次読み出
される音韻マトリクス符号語の間の距離を計算する距離
計算手段である。6はこの距離計算手段5I/C,て計
算された距離を比較し、最も小さな値を与える音韻マト
リクス符号語を求めて最適音韻マトリクス符号語とし、
その最適音韻マトリクス符号語番号を出力する最適符号
語選択手段であり、7はその最適音韻マトリクス符号語
番号が出力される出力端子である。
次に動作について説明する。入力端子1に入力音声のス
ペクトル包絡情報を表すパラメータである音韻ベクトル
が入力されると、音韻マトリクス生成手段2はその音韻
ベクトルを一定のLフレム分蓄積し、そのL個の音韻ベ
クトルによって構成した音韻マトリクスをLフレーム毎
に出力する。
ペクトル包絡情報を表すパラメータである音韻ベクトル
が入力されると、音韻マトリクス生成手段2はその音韻
ベクトルを一定のLフレム分蓄積し、そのL個の音韻ベ
クトルによって構成した音韻マトリクスをLフレーム毎
に出力する。
この音韻マトリクスは音韻マトリクス生成手段より距離
計算手段5に入力される。一方、符号帳3に蓄積されて
いるM個の音韻マトリクス符号語も切り換えスイッチ4
を介して順番に読み出され、距離計算手段5VC入力さ
れる。
計算手段5に入力される。一方、符号帳3に蓄積されて
いるM個の音韻マトリクス符号語も切り換えスイッチ4
を介して順番に読み出され、距離計算手段5VC入力さ
れる。
距離計算手段5は音韻マトリクス生成手段2から入力さ
れた音韻マトリクスと、切り換えスイッチ4を介して順
番に入力される各音韻マトリクス符号語との間の距離を
順次計算する。この距離の計算尺度としては、例えばユ
ークリッド距離などが用いられる。計算結果は最適符号
語選択手段6に入力されて比較され、最も小さな距離を
与える音韻マ) IJクス符号語が最適音韻マトリクス
符号語として選択される。最適符号語選択手段6はこの
最適音韻マトリクス符号語の符号語番号を最適音韻マト
リクス符号語番号として出力端子7より出力する。
れた音韻マトリクスと、切り換えスイッチ4を介して順
番に入力される各音韻マトリクス符号語との間の距離を
順次計算する。この距離の計算尺度としては、例えばユ
ークリッド距離などが用いられる。計算結果は最適符号
語選択手段6に入力されて比較され、最も小さな距離を
与える音韻マ) IJクス符号語が最適音韻マトリクス
符号語として選択される。最適符号語選択手段6はこの
最適音韻マトリクス符号語の符号語番号を最適音韻マト
リクス符号語番号として出力端子7より出力する。
復号化装置では、前述のものと同一の符号帳を備えてい
て、逆量子化手段は前記最適音韻7トリクス符号語番号
を受信すると、それによって指定される音韻マトリクス
符号語をその符号帳より読み出し、L個の出力音韻ベク
トルに分解して出力する。
て、逆量子化手段は前記最適音韻7トリクス符号語番号
を受信すると、それによって指定される音韻マトリクス
符号語をその符号帳より読み出し、L個の出力音韻ベク
トルに分解して出力する。
しかしながら、音韻マトリクス上での距離が最小である
最適音韻マトリクス符号語と、音韻的な特徴において入
力音声に最も近くなる音韻マ) IJクス符号語とは必
ずしも一致しない。第4図はそのような場合の具体例を
示す説明図であり、音韻ベクトルを1次元として、5フ
レームをまとめて音韻マトリクスに形成した場合を模式
的に示している。第4図(a)は符号化対象となる音韻
マトリクス、同図(b)はそれをある音韻マトリクス符
号語Aで符号化する場合、同図(C)はそれとは異なる
音韻マトリクス符号語Bで符号化する場合をそれぞれ示
しており、横軸は時間、縦軸は音韻ベクトルの値である
。
最適音韻マトリクス符号語と、音韻的な特徴において入
力音声に最も近くなる音韻マ) IJクス符号語とは必
ずしも一致しない。第4図はそのような場合の具体例を
示す説明図であり、音韻ベクトルを1次元として、5フ
レームをまとめて音韻マトリクスに形成した場合を模式
的に示している。第4図(a)は符号化対象となる音韻
マトリクス、同図(b)はそれをある音韻マトリクス符
号語Aで符号化する場合、同図(C)はそれとは異なる
音韻マトリクス符号語Bで符号化する場合をそれぞれ示
しており、横軸は時間、縦軸は音韻ベクトルの値である
。
図示のように、音韻マトリクス符号語Aで符号化した場
合、合成音は入力音声の音韻的特徴をあまり保持してい
ないのに対して、音韻マトリクス符号語Bで符号化した
場合には、その合成音は時間方向にわずかなずれはある
ものの、入力音声の音韻的特徴をよく保持している。し
かしながら、符号化対象となる音韻マトリクスとの距離
は、音韻マトリクス符号語Aとの距離dAの方が音韻マ
トリクス符号語Bとの距離dBよりも小さくなる。
合、合成音は入力音声の音韻的特徴をあまり保持してい
ないのに対して、音韻マトリクス符号語Bで符号化した
場合には、その合成音は時間方向にわずかなずれはある
ものの、入力音声の音韻的特徴をよく保持している。し
かしながら、符号化対象となる音韻マトリクスとの距離
は、音韻マトリクス符号語Aとの距離dAの方が音韻マ
トリクス符号語Bとの距離dBよりも小さくなる。
従って、最適音韻マトリクス符号語としては音韻マトリ
クス符号語Aが選択されることになり、時間方向の歪み
に対する影響を大きく受けて、しばしば不的確な音韻的
特徴を持つ音韻マトリクス符号語が選択されることにな
る。
クス符号語Aが選択されることになり、時間方向の歪み
に対する影響を大きく受けて、しばしば不的確な音韻的
特徴を持つ音韻マトリクス符号語が選択されることにな
る。
その解決のため、符号化対象となる音韻マトリクスを固
定時間長とはせずに可変時間長として、最適音韻マトリ
クス符号語番号に加えて、各音韻マトリクスの継続時間
情報を伝送する方式も、例えば日本音響学会の音声研究
会資料(1985年11月22日 資料番号885−4
5)などに報告されている。
定時間長とはせずに可変時間長として、最適音韻マトリ
クス符号語番号に加えて、各音韻マトリクスの継続時間
情報を伝送する方式も、例えば日本音響学会の音声研究
会資料(1985年11月22日 資料番号885−4
5)などに報告されている。
この方式では、入力音韻ベクトル系列に対して最適被覆
となるように符号帳内の音韻マトリクス符号語を動的計
画法を用いて線形圧縮伸張を行い、その時の最適音韻マ
トリクス符号語と継続時間を求めて符号イヒを行う。こ
れによって、符号化時の距離が小さくなって音韻的な特
徴がよく保持される。
となるように符号帳内の音韻マトリクス符号語を動的計
画法を用いて線形圧縮伸張を行い、その時の最適音韻マ
トリクス符号語と継続時間を求めて符号イヒを行う。こ
れによって、符号化時の距離が小さくなって音韻的な特
徴がよく保持される。
従来の音声のスペクトル包絡パラメータ符号化装置は以
上のように構成されているので、第3図に示すものでは
、時間方向の歪みに対する影響を大きく受けてしばしば
不的確な音韻的特徴を持つ音韻マトリクス符号語が選択
されることになり、また、最適音韻マl−17クス符号
語に各音韻マトリクスの継続時間情報を付加して伝送す
る方式は、音韻的特徴をよく保持するものの、そのまま
では固定フレーム周期で伝送が行われる実時間通信系に
は適用できないばかりか、処理演算量が膨大で(7) 遅延時間も大きくなるなどの課題があった。
上のように構成されているので、第3図に示すものでは
、時間方向の歪みに対する影響を大きく受けてしばしば
不的確な音韻的特徴を持つ音韻マトリクス符号語が選択
されることになり、また、最適音韻マl−17クス符号
語に各音韻マトリクスの継続時間情報を付加して伝送す
る方式は、音韻的特徴をよく保持するものの、そのまま
では固定フレーム周期で伝送が行われる実時間通信系に
は適用できないばかりか、処理演算量が膨大で(7) 遅延時間も大きくなるなどの課題があった。
この発明は上記のような課題を解消するためになされた
もので、固定フレーム周期による伝送が可能で、時間方
向の歪みの影響による合成音の音韻的特徴の劣化を低減
した音声のスペクトル包絡パラメータ符号化装置を得る
ことを目的とする。
もので、固定フレーム周期による伝送が可能で、時間方
向の歪みの影響による合成音の音韻的特徴の劣化を低減
した音声のスペクトル包絡パラメータ符号化装置を得る
ことを目的とする。
この発明に係る音声のスペクトル包絡パラメータ符号化
装置は、入力された音声信号の音韻マトリクスに対して
有限N種の時間方向のシフト・圧縮・伸張を行う拘束付
き時間方向変形手段を設け、距離計算手段に、この拘束
付き時間方向変形手段から出力されるN個の変形音韻マ
トリクスと、符号帳から読み出したM個の各音韻マトリ
クス符号語との間の距離を計算させるものである。
装置は、入力された音声信号の音韻マトリクスに対して
有限N種の時間方向のシフト・圧縮・伸張を行う拘束付
き時間方向変形手段を設け、距離計算手段に、この拘束
付き時間方向変形手段から出力されるN個の変形音韻マ
トリクスと、符号帳から読み出したM個の各音韻マトリ
クス符号語との間の距離を計算させるものである。
この発明における拘束・付き時間方向変形手段は、入力
された音声信号の音韻マトリクスに対して、聴覚的に歪
みの少ない一定の範囲内であらかじめ与えられた有限N
種の時間方向のシフト・圧縮・(8) 伸張を行って、N個の変形音韻マトリクスを生成して距
離計算手段に送り、それを受けた距離計算手段は、符号
帳から順次読み出したM個の各音韻マトリクス符号語と
このN個の変形音韻マトリクスとの間の距離を計算して
最適符号語選択手段に出力することにより、固定フレー
ム周期による伝送が可能で、時間方向の歪みの影響によ
る合成音の音韻的特徴の劣化の少ない音声のスペクトル
包絡パラメータ符号化装置を実現する。
された音声信号の音韻マトリクスに対して、聴覚的に歪
みの少ない一定の範囲内であらかじめ与えられた有限N
種の時間方向のシフト・圧縮・(8) 伸張を行って、N個の変形音韻マトリクスを生成して距
離計算手段に送り、それを受けた距離計算手段は、符号
帳から順次読み出したM個の各音韻マトリクス符号語と
このN個の変形音韻マトリクスとの間の距離を計算して
最適符号語選択手段に出力することにより、固定フレー
ム周期による伝送が可能で、時間方向の歪みの影響によ
る合成音の音韻的特徴の劣化の少ない音声のスペクトル
包絡パラメータ符号化装置を実現する。
以下、この発明の一実施例を図について説明する。第1
図において、1は入力端子、2は音韻マトリクス生成手
段、3は符号帳、4は切り換えスイッチ、5は距離計算
手段、6は最適符号語選択手段、7は出力端子であり、
第3図に同一符号を付した従来のそれらと同一、あるい
は相当部分であるため詳細な説明は省略する。また、8
は前記音韻マトリクス生成手段2からの音韻マトリクス
に対して、聴覚的に歪みの少ない一定の範囲内であらか
じめ与えられた有限N種の時間方向のシフト・圧縮・伸
張を行い、N個の変形音韻マトリクスを生成して前記距
離計算手段5に出力する拘束付き時間方向変形手段であ
る。
図において、1は入力端子、2は音韻マトリクス生成手
段、3は符号帳、4は切り換えスイッチ、5は距離計算
手段、6は最適符号語選択手段、7は出力端子であり、
第3図に同一符号を付した従来のそれらと同一、あるい
は相当部分であるため詳細な説明は省略する。また、8
は前記音韻マトリクス生成手段2からの音韻マトリクス
に対して、聴覚的に歪みの少ない一定の範囲内であらか
じめ与えられた有限N種の時間方向のシフト・圧縮・伸
張を行い、N個の変形音韻マトリクスを生成して前記距
離計算手段5に出力する拘束付き時間方向変形手段であ
る。
次に動作について説明する。入力端子1に入力音声のス
ペクトル包絡情報を表すパラメータである音韻ベクトル
が入力されると、音韻マトリクス生成手段2はその音韻
ベクトルを一定の(L+2p)フレーム分蓄積し、その
(L+2p)個の音韻ベクトルによって構成した音韻マ
トリクスをLフレーム毎に出力する。この音韻マトリク
スは音韻マ) IJクス生成手段2より拘束付き時間方
向変形手段8に入力される。拘束付き時間方向変形手段
8は入力された音韻マトリクスに対して、有限N種類の
時間方向のシフト・圧縮−伸張を行ってN個の変形音韻
マトリクスを生成する。
ペクトル包絡情報を表すパラメータである音韻ベクトル
が入力されると、音韻マトリクス生成手段2はその音韻
ベクトルを一定の(L+2p)フレーム分蓄積し、その
(L+2p)個の音韻ベクトルによって構成した音韻マ
トリクスをLフレーム毎に出力する。この音韻マトリク
スは音韻マ) IJクス生成手段2より拘束付き時間方
向変形手段8に入力される。拘束付き時間方向変形手段
8は入力された音韻マトリクスに対して、有限N種類の
時間方向のシフト・圧縮−伸張を行ってN個の変形音韻
マトリクスを生成する。
ここで、第2図はこの拘束付き時間方向変形手段8の動
作を示す説明図で、横軸は時間、縦軸は音韻ベクトルの
値であり、音韻ベクトルを1次元、前記りを5、pを1
とした場合について模式的に示したものである。第2図
(a)に示す符号化対象である7フレームの音韻マトリ
クスを、同図(b)に示すN種類の切り出し窓を用いて
、同図(C)に示すN個の音韻マトリクスを切り出す。
作を示す説明図で、横軸は時間、縦軸は音韻ベクトルの
値であり、音韻ベクトルを1次元、前記りを5、pを1
とした場合について模式的に示したものである。第2図
(a)に示す符号化対象である7フレームの音韻マトリ
クスを、同図(b)に示すN種類の切り出し窓を用いて
、同図(C)に示すN個の音韻マトリクスを切り出す。
この第2図(b3に示された切り出し窓は、聴覚的に歪
みの少ない一定の範囲内であらかじめ与えられている。
みの少ない一定の範囲内であらかじめ与えられている。
そして、切り出された各音韻マトリクスを、時間方向が
L次元になるように、例えば線形圧縮伸張して、第2図
(d)に示すN個の変形音韻マトリクスを生成する。
L次元になるように、例えば線形圧縮伸張して、第2図
(d)に示すN個の変形音韻マトリクスを生成する。
この変形音韻マトリクスは拘束付き時間方向変形手段8
より距離計算手段5に入力される。一方、符号帳3に蓄
積されているM個の音韻マトリクス符号語も切り換えス
イッチ4を介して順番に読み出され、距離計算手段5に
入力される。距離計算手段5はこのN個の変形音韻マト
リクスとM個の音韻マトリクス符号語との間の各距離を
順次計算して最適符号語選択手段6に出力する。最適符
号語選択手段6では、その距離が最も小さな値を与える
音韻マトリクス符号語を最適音韻マトリクス符号語とし
、その符号語番号を最適音韻マトリク(11) ス符号語番号として出力端子7より出力する。
より距離計算手段5に入力される。一方、符号帳3に蓄
積されているM個の音韻マトリクス符号語も切り換えス
イッチ4を介して順番に読み出され、距離計算手段5に
入力される。距離計算手段5はこのN個の変形音韻マト
リクスとM個の音韻マトリクス符号語との間の各距離を
順次計算して最適符号語選択手段6に出力する。最適符
号語選択手段6では、その距離が最も小さな値を与える
音韻マトリクス符号語を最適音韻マトリクス符号語とし
、その符号語番号を最適音韻マトリク(11) ス符号語番号として出力端子7より出力する。
なお、上記実施例では、切り出された音韻マトリクスの
圧縮伸張を、線形圧縮伸張方式の一種類としたものを示
したが、非線形圧縮伸張方式、音韻定常部に重み付けを
した圧縮伸張方式等、複数種類としてもよい。
圧縮伸張を、線形圧縮伸張方式の一種類としたものを示
したが、非線形圧縮伸張方式、音韻定常部に重み付けを
した圧縮伸張方式等、複数種類としてもよい。
また、上記実施例では、出力端子からは最適音韻マトリ
クス符号語番号のみを出力する場合について説明したが
、さらに時間方向変形に関する情報を付加して出力する
ようにしてもよい。その場合、復号化装置側に、受信し
た時間方向変形に関する情報に基づいて最適音韻マトリ
クス符号語を変形する手段を設げる必要がある。
クス符号語番号のみを出力する場合について説明したが
、さらに時間方向変形に関する情報を付加して出力する
ようにしてもよい。その場合、復号化装置側に、受信し
た時間方向変形に関する情報に基づいて最適音韻マトリ
クス符号語を変形する手段を設げる必要がある。
以上のように、この発明によれば、拘束付き時間方向変
形手段を設けて、入力された音声信号の音韻マトリクス
に対して、あらかじめ与えられた有限N種の時間方向の
シフト・圧縮・伸張を行ってN個の変形音韻マトリクス
を生威し、それを距離計算手段に入力するように権威し
たので、固定(12) フレーム周期による伝送が可能で、時間方向の歪みの影
響による合成音の音韻的特徴の劣化を低減することので
きる音声のスペクトル包絡パラメータ符号化装置が得ら
れ、また、符号帳内の音韻マトリクス符号語に時間方向
のバラエティを持たせる必要性が低くなることから、符
号帳のサイズを小さくできるなどの効果がある。
形手段を設けて、入力された音声信号の音韻マトリクス
に対して、あらかじめ与えられた有限N種の時間方向の
シフト・圧縮・伸張を行ってN個の変形音韻マトリクス
を生威し、それを距離計算手段に入力するように権威し
たので、固定(12) フレーム周期による伝送が可能で、時間方向の歪みの影
響による合成音の音韻的特徴の劣化を低減することので
きる音声のスペクトル包絡パラメータ符号化装置が得ら
れ、また、符号帳内の音韻マトリクス符号語に時間方向
のバラエティを持たせる必要性が低くなることから、符
号帳のサイズを小さくできるなどの効果がある。
第1図はこの発明の一実施例による音声のスペクトル包
絡パラメータ符号化装置を示すブロック図、第2図はそ
の拘束付き時間方向変形手段の動作を示す説明図、第3
図は従来の音声のスペクトル包絡パラメータ符号化装置
を示すブロック図、第4図はその動作を示す説明図であ
る。 3は符号帳、5は距離計算手段、6は最適符号語選択手
段、8は拘束付き時間方向変形手段。 なお、図中、同一符号は同一、又は相当部分を示す。
絡パラメータ符号化装置を示すブロック図、第2図はそ
の拘束付き時間方向変形手段の動作を示す説明図、第3
図は従来の音声のスペクトル包絡パラメータ符号化装置
を示すブロック図、第4図はその動作を示す説明図であ
る。 3は符号帳、5は距離計算手段、6は最適符号語選択手
段、8は拘束付き時間方向変形手段。 なお、図中、同一符号は同一、又は相当部分を示す。
Claims (1)
- 入力された音声信号のスペクトル包絡情報を表すスペク
トル包絡パラメータから成る音韻ベクトルを、時間方向
に一定個数まとめた音韻マトリクスに対して、有限N種
の時間方向のシフト・圧縮・伸張を行い、N個の変形音
韻マトリクスを出力する拘束付き時間方向変形手段と、
前記拘束付き時間方向変形手段から出力される前記各変
形音韻マトリクスと比較される有限M個の音韻マトリク
ス符号語が蓄積された符号帳と、前記拘束付き時間方向
変形手段から出力されるN個の前記変形音韻マトリクス
と前記符号帳から順番に読み出されるM個の前記各音韻
マトリクス符号語との間の距離を計算する距離計算手段
と、前記距離計算手段にて計算された前記各距離を比較
して、最も小さな距離を与える前記音韻マトリクス符号
語を求めて最適音韻マトリクス符号語とし、その最適音
韻マトリクス符号語番号を出力する最適符号語選択手段
とを備えた音声のスペクトル包絡パラメータ符号化装置
。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2056235A JP2834260B2 (ja) | 1990-03-07 | 1990-03-07 | 音声のスペクトル包絡パラメータ符号化装置 |
| US07/662,929 US5268991A (en) | 1990-03-07 | 1991-02-28 | Apparatus for encoding voice spectrum parameters using restricted time-direction deformation |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2056235A JP2834260B2 (ja) | 1990-03-07 | 1990-03-07 | 音声のスペクトル包絡パラメータ符号化装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03257500A true JPH03257500A (ja) | 1991-11-15 |
| JP2834260B2 JP2834260B2 (ja) | 1998-12-09 |
Family
ID=13021443
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2056235A Expired - Fee Related JP2834260B2 (ja) | 1990-03-07 | 1990-03-07 | 音声のスペクトル包絡パラメータ符号化装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5268991A (ja) |
| JP (1) | JP2834260B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2023502386A (ja) * | 2019-11-20 | 2023-01-24 | 維沃移動通信有限公司 | 対話方法及び電子機器 |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6169970B1 (en) | 1998-01-08 | 2001-01-02 | Lucent Technologies Inc. | Generalized analysis-by-synthesis speech coding method and apparatus |
| JP3268750B2 (ja) * | 1998-01-30 | 2002-03-25 | 株式会社東芝 | 音声合成方法及びシステム |
| JP2001166789A (ja) * | 1999-12-10 | 2001-06-22 | Matsushita Electric Ind Co Ltd | 初頭/末尾の音素類似度ベクトルによる中国語の音声認識方法及びその装置 |
| RU2180974C2 (ru) * | 2000-03-29 | 2002-03-27 | Поволжская государственная академия телекоммуникаций и информатики | Способ сжатия изолированных слов |
| US7136811B2 (en) * | 2002-04-24 | 2006-11-14 | Motorola, Inc. | Low bandwidth speech communication using default and personal phoneme tables |
| US20070129945A1 (en) * | 2005-12-06 | 2007-06-07 | Ma Changxue C | Voice quality control for high quality speech reconstruction |
| EP2159790B1 (en) * | 2007-06-27 | 2019-11-13 | NEC Corporation | Audio encoding method, audio decoding method, audio encoding device, audio decoding device, program, and audio encoding/decoding system |
| US20090055140A1 (en) * | 2007-08-22 | 2009-02-26 | Mks Instruments, Inc. | Multivariate multiple matrix analysis of analytical and sensory data |
| JP4455633B2 (ja) * | 2007-09-10 | 2010-04-21 | 株式会社東芝 | 基本周波数パターン生成装置、基本周波数パターン生成方法及びプログラム |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4670851A (en) * | 1984-01-09 | 1987-06-02 | Mitsubishi Denki Kabushiki Kaisha | Vector quantizer |
| US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
| US4910781A (en) * | 1987-06-26 | 1990-03-20 | At&T Bell Laboratories | Code excited linear predictive vocoder using virtual searching |
| US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
| US4965580A (en) * | 1988-09-26 | 1990-10-23 | Mitsubishi Denki Kabushiki Kaisha | Quantizer and inverse-quantizer |
-
1990
- 1990-03-07 JP JP2056235A patent/JP2834260B2/ja not_active Expired - Fee Related
-
1991
- 1991-02-28 US US07/662,929 patent/US5268991A/en not_active Expired - Lifetime
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2023502386A (ja) * | 2019-11-20 | 2023-01-24 | 維沃移動通信有限公司 | 対話方法及び電子機器 |
Also Published As
| Publication number | Publication date |
|---|---|
| US5268991A (en) | 1993-12-07 |
| JP2834260B2 (ja) | 1998-12-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100427753B1 (ko) | 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치 | |
| US6721700B1 (en) | Audio coding method and apparatus | |
| US4821324A (en) | Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate | |
| KR101437127B1 (ko) | 가중 윈도우들을 사용한 저-지연 변환 코딩 | |
| KR100574031B1 (ko) | 음성합성방법및장치그리고음성대역확장방법및장치 | |
| US7065338B2 (en) | Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound | |
| US5953698A (en) | Speech signal transmission with enhanced background noise sound quality | |
| JPH096397A (ja) | 音声信号の再生方法、再生装置及び伝送方法 | |
| US6865534B1 (en) | Speech and music signal coder/decoder | |
| JPH03257500A (ja) | 音声のスペクトル包絡パラメータ符号化装置 | |
| US6269332B1 (en) | Method of encoding a speech signal | |
| JP2658816B2 (ja) | 音声のピッチ符号化装置 | |
| JP2796408B2 (ja) | 音声情報圧縮装置 | |
| JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
| KR100304137B1 (ko) | 음성압축/신장방법및시스템 | |
| JP3252285B2 (ja) | 音声帯域信号符号化方法 | |
| JPH08129400A (ja) | 音声符号化方式 | |
| JPH02146100A (ja) | 音声符号化・復号化装置 | |
| JPH10111700A (ja) | 音声圧縮符号化方法および音声圧縮符号化装置 | |
| JP3107620B2 (ja) | 音声符号化方法 | |
| EP1717796B1 (en) | Method for converting code and code conversion apparatus therefor | |
| JP3230380B2 (ja) | 音声符号化装置 | |
| JP3099844B2 (ja) | 音声符号化復号化方式 | |
| JP2817196B2 (ja) | 音声符号化方式 | |
| JP3714786B2 (ja) | 音声符号化装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |