JPH06503186A - 音声合成方法 - Google Patents
音声合成方法Info
- Publication number
- JPH06503186A JPH06503186A JP5500767A JP50076792A JPH06503186A JP H06503186 A JPH06503186 A JP H06503186A JP 5500767 A JP5500767 A JP 5500767A JP 50076792 A JP50076792 A JP 50076792A JP H06503186 A JPH06503186 A JP H06503186A
- Authority
- JP
- Japan
- Prior art keywords
- coefficients
- signal
- wavelets
- method described
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
- G10L19/0216—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation using wavelet decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detergent Compositions (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
音声合成方法
本発明は音声合成方法に関する。
数々の音声合成応用分野の中には、対話形制御装置(車両制御、工業プロセス制
御等)のように、簡単なメツセージ(切り離されたワード又は所定のフェーズ)
の合成のみを必要とする分野がある。このような応用分野では、音声合成装置の
コストをできるだけ抑えることがめられている。量産回路を使用し且つメツセー
ジの記憶に必要なメモリ容量を小さくすることによって実質的なコストの削減が
得られる。
このメモリ容量を小さくするために、従来技術では種々の型のコーディングを使
用している。最も広範に使用されているコーディングの中では、離散的各瞬間に
おいて2進コードを信号の振幅に対応付けるタイムコーディングが知られており
、更に正確に言えば、むしろ信号と信号の予測可能成分との差く差分コーディン
グ)がメモリに記憶される。分析及び合成による音声のコーディングも行われる
。
このコーディングでは、ごくjかの有意パラメータのみが記憶される(“チャネ
ルボコーダ又はパ線形予測ボコーダとして知られている装り。Mf&に、前述し
た2つの方法を組み合わせることによって得られる方法:特にサブバンドコーデ
ィングにおける“適応型予測可能ボコーダ又は“音声励起ボコーダが知られてい
る。
周波数領域でのコーディングであるサブバンドコーディングの場合、コーディン
グすべき信号のスペクトルは、(互いに等しいか又は異なる)幅Bヶを有する複
数のサブバンドに分割される。(指数がkの)各サブバンドは次に、シャノン周
波数、即ち2B、で再度サンプリングされる。各サブバンドフィルタから出力さ
れる信号は周波数に応じて様々に量子化される。即ち、基音(fondasen
tal )及びフォルマントでは細かな量子化が、エネルギの低い領域では粗い
量子化が行われる。信号を再111Ir!i、するためには逆の操作が行われる
。
記憶及び伝送の前に、信号は例えば、64 kbits/秒に正規化されたPC
M (パルスコード変調)コーディング法則に従ってコーディングされる(信号
は300〜3600Hz帯域で8ビツト、8 kHzでサンプリングされ且つ対
数法則に従って圧縮される)。32 kbits/秒(4ビツトで8kflz
)の速度でのADPCMコーディング(適応型差分PCM)か普及しつつある。
2つのサブバンドを有するコーディング装置1の理論的ダイヤグラムを第1図に
示す、音声信号Xは(パルス応答hl、h2を有する)2つのフィルタF1.F
2によってr波される。Fl、F2の2つの出力サブバンドの各々は、それぞれ
回路2゜3によって半分に間引かれ(dI!c i+*eepar2)(2つの
サンプルのうち1つが削除)、次に例えばA、 D P CMでコーディングさ
れ(4)、且つ記憶される(か又は伝送される)、読取り時(又は受信時)には
、音声信号の再構成は、復号化(5,6)、及び2つの復号化されたサブバンド
用の対応の分析及び加算バンド(9)の補間器と同一の補間器内でのP波(7,
8)によって実施される。フ1ルダF1゜F2は線形位相FIR(有限インパル
ス応答)−フィルタであり且つ以下の条件を満たしている。
h:(n> −(−1)’hl (n): H+ (e”> l ” l H2
(e”) l 2# 1これらのフィルタのテンプレートを第2図に示す。
ナシバンドコーディングの原理は、フィルタバンクを介して音声信号をP波し、
;欠にこれらめフィルタからの出力信号をサブサシプリングすることにある。受
信時には、対応する分析帯域のフィルタと同一のフィルタによって補間された各
復号化サブバンドの加算によって再構成が実施される。この型のコーディングは
まず、分離しており且つ隣接する有限インパルス応答フィルタに基づいて行われ
た。
次にコーディングに、直交ミラーフィルタが使用されるようになり、それによっ
て量子化エラーの発生しない状態で初期信号をほぼ完全に再構成することが可能
になった。
音声信号を分解するフィルタを合成するには大別して2種類の方法がある。即ち
、
一最適化されたフィルタによって入力が2つの帯域に分割され、各帯域について
アルゴリズムが更新されるか、又は−帯域通過フィルタのテンプレートが周波数
軸上を移動させられる。この場合、基本フィルタの応答はh(n)、帯域幅はn
/2M (Mはサブバンドの数)である。移動によって、式:
%式%))
■は正規化された標本化半周波数である。サブサンプリング中におけるフィルタ
のエイリアシングの問題は、位相シフト余弦関数の位相項によって補償可能であ
る。
チンプレー1・が第2図に示される半帯域フィルタは通常の線形フィルタであ−
って、その変換間数はfe/4(fe−・標本化周波数)において]、、、′2
に等しく、且つこの点に対して非対称である。即ち、式。
H、[f e y′4 + f ] = 1− H[f e / 4−f ]が
成り立つ。
偶数h (n)はhoの堝きを除いて、nが偶数のときにゼロである。テンプレ
ートは通過帯域及び遮断帯域でのり・・lプルと、遷移帯域幅と表すΔfとによ
って定義される。所望のテンプレートの関数としてのフィルタの係数の数Nはく
式中、δ−61−δ2は通過帯域及び遮断帯域でのり・・/プル分示す)で表さ
れる。P半帯域フィルタを縦続させることにより、標本化周波数が高くなったり
低くなったりする。
中間周波数fiは比率2: fe=2p−f iの標本化周波数の約数(sou
s−multiple)である。
音声信号の多重分解能分析を実施し且つ本質的にディスクリートフィルタと°“
デシメーション”回路(2つのサンプルのうち1つを除去)とを含んでいる装置
もある。小波(ondelettes)への変換を使用するディジタル画像圧縮
用高速アルゴリズムも知られている(“信号処理”vol、7. n・、2.1
990)。しかしこのアルゴリズムは画像にのみ適している(HF成分のみが保
持される)。
公知の装置はいずれもあまりにも初歩的なものであり、復元時に十分理解できる
音声信号を得ることができないか又は複雑すぎて高価である。 本発明の目的は
、音声信号をできるだけ簡単に合成することを可能とし且つ既存の安価な回路の
みを使用する音声合成方法である。
本発明方法は、音声信号をディジタル化し、圧縮支持体(5upport co
mpact )を有する小波の直交成分(base )にこのディジタル化信号
を切断し、音声信号を表す係数を記憶し、復元時にP波、補間及び低周波増幅に
よって音声信号を再構成することにある。
添付図面に図示されている以下の非制限的実施例の詳細な説明により、本発明が
更によく理解されるであろう。
−既に記述した第1図は公知のコーディングシステムのブロック図である。
一第2図は第1図のシステムで使用可能な半帯域フィルタのテンプレートである
。
一第3図は本発明方法を使用する合成システムのブロック図である。
一第4図は第3図のシステムの分析装置のブロック図である。
一第5図は本発明の分解(breakclown )アルゴリズムを例示するダ
イヤグラムである。
一第6図は本発明の再構成アルゴリズムを例示するダイヤグラムである。
一第7図は本発明方法を使用する音声合成装置の簡略ブロック図である。
一第8図は本発明によって使用される尺度関数(fonctiond’&che
lle)及び小波のタイムチャートである。
−第9図は本発明方法を使用する合成装!のダイヤグラムである。
後述する音声メツセージ合成装置は2つの主要部分、即ち分析部分14と音声合
成部分15(第3図)とを含んでいる。
部分14では、音源16(例えばマイクロホン)からの信号が量子化され、次に
17で分析され且つ18でコーディングされる。その結果得られる適切な基準が
19(例えばEEPROM型メモリ)で記憶される。これら全ての作業は現状で
は実験室で行われている。
記憶装置19を含んでいる第2の部分では、装置20が、(19で)選択記憶さ
れた係数から信号を再構成し、再構成された信号はラウドスピーカを備えた増幅
器21に送られる。
本発明によれば、コーディング及び再構成のために、圧縮支持体を有する小波の
直交成分に音声信号を分解するアルゴリズムが使用される。これらの小波は例え
ばDaubech ies小波(第8図参照)である。初めの音声信号を表すも
のと判定され且つ再構成メツセージの完全な明瞭性を堤供する係数のみが記憶さ
れ、これによって記憶すべき信号のスルーブツトが大幅に制限される。
第4図のフローチャートは、本発明の音声分析手順を示している。
例えば10kHzの標本化周波数で、(変換時間が約60μs以下の)°“フラ
ッシュ”変換器又は連続近似変換器を使用して、低周波信号源22く音響センサ
、磁気記憶手段′*)によって発生される低周波信号が例えば16ビツトでディ
ジタル化される(23)、次にサンプリングされた信号は例えば128点のフレ
ームに切断される(フレームの持続時間:12.8ns)。他の実施例によれば
、復元の品質をそれほど損なわずに256点のフレームを使用することができる
。次に、本発明の主要段階を構成する分析(24)が実施される。この分析は特
に、圧縮支持体を有する小波の直交成分上でディジタル化信号を分解することに
あり且つそのパルス応答が対称であってもなくてもよいフィルタを使用している
。この応答が対称の場合には、(エツジ効果の原因となる)極大の(extre
:me )係数の記憶が信号の一方の側に制限され、他方の側は対称によって推
定される(フィルタの周期は楕遣上暗黙である)。
従って、この分解によって、128の初期点から、観測基準の128の別個の線
形組み合わせが得られる。分解フィルタの形状を条件付ける波の規則性は分解の
2つの主要パラメータの1つであり、(分解レベルはフィルタの幅を条件付ける
)。これら128の組み合わせの中で、例えば32の組み合わせが保持されて(
最も有意であると推定されて)、コード化される(25)。本実施例の8ビツト
の場合には、記憶すべき値のスループット・20 kbi ts/秒が得られる
。16ビツトでコード化された16個の係数が選択されても、記憶すべき値のス
ループットは変わらないが、復元された信号の品質は低下する。
時間尺度(!chelle de temps)の拡張による分析(第8図の破
線で示す尺度関数を参照のこと)は、分析小波を拡張させるのではなく、分析す
べき信号と因子2pによってサブサンプリングして行われる。これによって、レ
ベルpの分解の場合、(p+1>組の係数が得られる。更には、(点の数=N/
2+N/4+、、、N/2”’の)直交成分上への投影によって、情報の損失も
冗長性も生じない。
(式中、S、は分解能21での信号の近似であり、DJは分解2jの詳細に相当
する)で表される。
パラメータがコーディングされる(25)と、パラメータを記憶する前に、絶え
ず実験室内において、後述するような合成を実施することによって評価(26)
が行われる。
く27において)音声信号の復元の品質が良くなければ、分析(24)によって
得られるパラメータの選択は変更され(28) 、これらのパラメータは新たな
評価(25)のためにコーディングされる(25)、この品質が良好であると判
定されれば、パラメータフレームが形成され(29)、これらのフレームは例え
ば直列R5422リンク(30)を介して記憶手段に伝送される。
本発明の分解アルゴリズムの実施態様を第5図に示す。
種々の成分S。〜SJはそれぞれ同様に、即ち(j+1>個のフィルタG(31
,0〜31.j)及びフィルタのくj+1)個のミラーH(32,0〜32.j
>による畳み込み、並びに半減化(それぞれ32.0〜32.j及び34゜0−
34.j)によって処理される。
規則性nに対して、フィルタの支持体は2・nの値を含んでいる。初めのN個の
係数から、n=1のときにはN/2個の係数が2回、N=2のときにはN/4個
の係数が4回というように得られるが、N / 2 n Lか記憶されない。
例えばn=6のときには、12ケ所の点で畳み込みが実施される。この値は、畳
み込みが時間領域で実施されることを意味している。しかしながら規則性が約1
6よりも大きいときには、分析処理装置の計算時間の観点から、畳み込みの代わ
りに二重周波数空間内での乗算を使用することが好ましいくこれは局部畳み込み
と同じことになる)。
部分ヒストグラムから又は更に簡単には予め決定されたエネルギレベルに結びつ
けられた量子化によって、(25で)パラメータのコーディングを実施しても良
い。
評価段階(26)では、再構成されたメツセージを聞き、ヒヤリングが申し分な
いと判定されなければ、記憶すべきパラメータを変更する(28)。この再構成
は、後で詳しく説明するように、ディジタル/アナログ変換、平滑化用低域通過
ろ波及び低周波増幅によって実施される。再構成されたメツセージの品質が申し
分ないと判定されれば、係数が形成され(29)、これらの係数は適切なメモリ
内にロードされる(30)、上記形成は、本質的に、データをフォーマットし、
対応するアドレスを作成し、且つデータの連続フレームを順序付けすることにあ
る。
本発明方法を実施するのに適した音声合成アルゴリズムを第6図に示す。このア
ルゴリズムは、パラメータ選択の評価に使用されていた前述の実験室での合成装
置とは異なる自己メツセージ発生手段を構成している。この音声合成アルゴリズ
ムは、補間(S、〜SJで35.0〜35.j、D0〜D、で36.0〜36.
j)、F波(それぞれ370〜37.j及び38、O〜38.j)、加算(39
,0〜39.j)、乗算(400〜40.j)及び低周波増幅による処理によっ
て、最初の信号を再構成する。実際には、レベルp(通常p=2〜3)での小波
尺度への分解から、レベル(p−1)での分解を再構成することができる。
そのためには、レベルpでの各分解値間にゼロの値を挿入し、次に先に詳述した
再構成アルゴリズムに従って逆尺度・波間数(fonctions ondel
ettes et eehelles 1nverses)で畳み込みを行うだ
けで十分である。
好ましくは本発明が使用するDaubech ies小波は、圧縮支持体を有す
る小波であることから、小波のパルス応答点の、従って畳み込み点の数を最小に
する。
分解用フィルタは再構成用フィルタと同一であるが、対称ではなく、メモリに記
憶すべき係数のフレームの最初及び最後でのエツジ効果に起因する係数を記憶す
る必要がある6二重直交小波を使用してこの問題を避けることができる。そのた
めに分解用フィルタとは異なる再構成用フィルタを使用せねばならないが、これ
らのフィルタの応答は対称的であり、一方の側の係数のみが記憶される。
本発明方法を実行する音声合成袋Wの概略図を第7図に示した。再構成用フィル
タの係数はメモリ41に記憶され、且つ専用コンピュータ又はマイクロプロセッ
サ42によって使用される。このコンピュータ又はマイクロプロセッサは、種々
の再構成用フィルタのインパルス応答の値によって、プログラムメモリ43に記
憶された前記再構成アルゴリズムの制御下で音声信号を再構成する。再構成され
た信号のディジタル値が、(例えば遮断周波数が4 kHzの)低域通過アナロ
グフィルタを有する増幅器45及び利得制御器46に続く変換器44によってア
ナログ値に変換される。
増幅器45からの出力はラウドスピーカ47に結合される。
増幅器が、適切な記録装置に結合される高インピーダンス出力48を含んでいれ
ば有利である。更にはマイクロプロセッサ42が入力49(例えば直列R323
2又はR3422人力)に結合され、マイクロプロセッサはこの入力によって音
声メツセージの合成要求を受信する。これらの要求は警報回路から発生させるこ
とができる。
第9図の音声合成装置の詳細なダイヤグラムに、アドレスバス51、データバス
52、及び特に論理シーケンサ54に結合された制御バス53と共にプロセッサ
50と示した。シーケンサは直列入力インタフェース55及び直列出力インタフ
ェース56に結合され、更には光絶縁(opt。
iso fat ion )回路57を介してメツセージ合成制御装置(図示せ
ず)に結合されている。該メツセージ合成制御装置は合成すべきメツセージのア
ドレスをシーケンサに送る。プログラムメモリ58は3つのバス51〜53に結
合されている0gk数は、アドレスバス及びシーケンサ54に直接結合され且つ
トライステートゲート60を介してデータバスに結合されたメモリ59に記憶さ
れる。ゲート60はシーケンサ54によって制御される。
バス51〜53は、試験又は保守タスクを実行するために、係数をリモートロー
ドするか又は再構成プログラムを変更する外部コネクタに結合することができる
。
シーケンサ54は、低域通過フィルタ62及び低周波増幅器63に続くディジタ
ル/′アナログ変換器61に結合されている。低周波増幅器の利得はポテンショ
メータ64によって調整可能である。増幅器63は1つ又はそれ以上のラウドス
ピーカ65及び高インピーダンス出力端子66に結きされている。
高レベルの分解が用いられるときには、エツジ効果の処理は不可欠になる。この
処理は、1つの音声フレームの片側に又は両側にこのフレームの一部分のコピー
を加疋て、音声フレームを人工的に奇数にすることによって行うことができる8
例えば256点のフレームの場合、128点が片側又は両側に加えられる。
時間外挿によって持続時間を人為的に伸ばすために、有声音フレーム(25,6
−9)の自己回帰モデリングを採用することができる。
先にブロックで説明した合成処理は、N個の個別の縦続フィルタ(ボコーダ型)
によって実施可能である。この方法は、P波値の再生に起因するエツジ効果を制
限するが、プロセッサには不利である。何故ならば、2項分解時に前記最適化は
使用されないからである。
選択される直交成分は圧縮支持体を有するものであり、それによってr波の畳み
込みの計算時間が最適化される。
係数は実数であり、それによって絶対値及び符号の簡囃な解釈が可能となり且つ
モジュロ2πの物理的利用に関連する制約が緩和される(成分が複素数であると
きに)。使用される点の数が約30を下回るときには、時間畳み込みが実行され
る。異なる規則性を有する複数の直交成分を使用することができる。
一分解は所与のレベルでは確立されないが、各フィルタの幅は、音声に関係する
最適化の関数として変動し得るレベルのために適応化される(例えば斜め(ob
lique)分解し辺でより細かな切断を実施することができる。
−合成小波の規則性の選択は例えば、音声フレームの事前分析によって(例えば
3つのクラスの音声化又はガウス曲線の第3の導関数(deriv6e tro
isieme d’une gaussienne)から決定される平均小波で
ある“音声小波(ondelette devoisement )”によって
)決定され得る。
−有声フレーム(調和構造):規則性は約6〜10;−兼声フレームく破裂音、
窄擦音):規則性は低い(1〜6)。
一周波数位置に応じて小波係数くスカラー積の結果)を再配置することによって
、時間尺度(Leaps−1!ehel le )分析をより簡単に実施し、且
つそれを時間−周波数分析として見ることができる。
一ベクトル量子化は、コーディングを周波数ランク及びコーディングすべきニオ
・ルギの関数として採用することによって、スループットの最適化を可能とする
。使用される方法の如何を問わす(例えば二分法)、目的は常(ご多重分解“コ
ードブック″(コードブックは、多数の点の重心を特徴付ける全ての“クラス”
即ちベクトルを含んでいる全ベクトルである)の作成である。最後に、できるだ
け不利にならない最小ひずみ(少ない2次エラー)の選択に努める6−コードブ
ックのベクトルのコーディングビット数は処理されるエネルギの関数である(数
は基音の場合は多く、極大の周波数では少ない)6
FIG、 I
FIG、2
FIG、3
FIG、フ
イr、方^フ#ライン1;ハシfをf$の字1’F4FIG、8
1、、I CJ
%t31 1
Claims (11)
- 1.音声信号をディジタル化し、圧縮支持体を有する小波の少なくとも1つの直 交成分にこのディジタル化信号を切断し、音声信号を表す係数を記憶し、復元時 にはろ波、補間及び低周波増幅によって音声信号を再構成することを特徴とする 音声合成方法。
- 2.係数が実数であることを特徴とする請求項1に記載の方法。
- 3.合成小波の規則性の選択が、音声フレームの事前分析によって決定されるこ とを特徴とする請求項1又は2に記載の方法。
- 4.有声音フレームの合成小波の規則性が約6から10であることを特徴とする 請求項1から3のいずれか一項に記載の方法。
- 5.無声音フレームの合成小波の規則性が1から6であることを特徴とする請求 項1かち3のいずれか一項に記載の方法。
- 6.エッジ効果を処理するために、音声フレームが人為的に奇数にされることを 特徴とする請求項1から5のいずれか一項に記載の方法。
- 7.小波がDaubechiess小波であることを特徴とする請求項1から6 のいずれか一項に記載の方法。
- 8.二重直交小波が使用されることを特徴とする請求項1から7のいずれか一項 に記載の方法。
- 9.記憶される前に、係数が評価合成(26)のために使用され且つ復元品質が 申し分ないと判定されたときにのみ記憶されることを特徴とする請求項1から8 のいずれか一項に記載の方法。
- 10.ろ波が畳み込みによって実施されることを特徴とする請求項1から9のい ずれか一項に記載の方法。
- 11.約16よりも大きい規則性の場合、ろ波が二重周波数空間内での乗算によ って実施されることを特徴とする請求項1から10のいずれか一項に記載の方法 。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR9107424A FR2678103B1 (fr) | 1991-06-18 | 1991-06-18 | Procede de synthese vocale. |
| FR91/07424 | 1991-06-18 | ||
| PCT/FR1992/000538 WO1992022890A1 (fr) | 1991-06-18 | 1992-06-16 | Procede de synthese vocale a l'aide d'ondelettes |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH06503186A true JPH06503186A (ja) | 1994-04-07 |
Family
ID=9413950
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5500767A Withdrawn JPH06503186A (ja) | 1991-06-18 | 1992-06-16 | 音声合成方法 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US5826232A (ja) |
| EP (1) | EP0519802A1 (ja) |
| JP (1) | JPH06503186A (ja) |
| FR (1) | FR2678103B1 (ja) |
| WO (1) | WO1992022890A1 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11503240A (ja) * | 1995-03-27 | 1999-03-23 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | フェーザ測定用単一側波帯フィルタバンクの効率的実施装置 |
Families Citing this family (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5701392A (en) * | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
| DE19538852A1 (de) * | 1995-06-30 | 1997-01-02 | Deutsche Telekom Ag | Verfahren und Anordnung zur Klassifizierung von Sprachsignalen |
| US5781881A (en) * | 1995-10-19 | 1998-07-14 | Deutsche Telekom Ag | Variable-subframe-length speech-coding classes derived from wavelet-transform parameters |
| FR2744277B1 (fr) * | 1996-01-26 | 1998-03-06 | Sextant Avionique | Procede de reconnaissance vocale en ambiance bruitee, et dispositif de mise en oeuvre |
| US6032113A (en) * | 1996-10-02 | 2000-02-29 | Aura Systems, Inc. | N-stage predictive feedback-based compression and decompression of spectra of stochastic data using convergent incomplete autoregressive models |
| US6182035B1 (en) * | 1998-03-26 | 2001-01-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for detecting voice activity |
| EP1078354B1 (de) * | 1998-05-11 | 2002-03-20 | Siemens Aktiengesellschaft | Verfahren und anordnung zur bestimmung spektraler sprachcharakteristika in einer gesprochenen äusserung |
| US6898756B1 (en) * | 1999-03-15 | 2005-05-24 | Georgia Tech Research Corporation | System and method for enabling efficient error correction and encryption using wavelet transforms over finite fields |
| JP3430985B2 (ja) * | 1999-08-05 | 2003-07-28 | ヤマハ株式会社 | 合成音生成装置 |
| US6622121B1 (en) | 1999-08-20 | 2003-09-16 | International Business Machines Corporation | Testing speech recognition systems using test data generated by text-to-speech conversion |
| US20030220801A1 (en) * | 2002-05-22 | 2003-11-27 | Spurrier Thomas E. | Audio compression method and apparatus |
| DE102004025566A1 (de) | 2004-04-02 | 2005-10-27 | Conti Temic Microelectronic Gmbh | Verfahren und Vorrichtung zum Analysieren und Bewerten eines Signals, insbesondere eines Sensorsignals |
| US7623826B2 (en) | 2004-07-22 | 2009-11-24 | Frank Pergal | Wireless repeater with arbitrary programmable selectivity |
| US8219398B2 (en) * | 2005-03-28 | 2012-07-10 | Lessac Technologies, Inc. | Computerized speech synthesizer for synthesizing speech from text |
| US8185316B2 (en) * | 2007-05-25 | 2012-05-22 | Prime Geoscience Corporation | Time-space varying spectra for seismic processing |
| JP5159279B2 (ja) * | 2007-12-03 | 2013-03-06 | 株式会社東芝 | 音声処理装置及びそれを用いた音声合成装置。 |
| FR3093493B1 (fr) * | 2019-03-04 | 2021-04-09 | Commissariat Energie Atomique | Procédé de détection d’anomalie de matériel roulant exploitant un signal de déformation d’un support de rail |
| CN113129911B (zh) * | 2021-03-19 | 2024-09-17 | 江门市华恩电子研究院有限公司 | 一种音频信号编码压缩和传输的方法及电子设备 |
| CN113744714B (zh) * | 2021-09-27 | 2024-04-05 | 深圳市木愚科技有限公司 | 语音合成方法、装置、计算机设备及存储介质 |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4384169A (en) * | 1977-01-21 | 1983-05-17 | Forrest S. Mozer | Method and apparatus for speech synthesizing |
| US4398059A (en) * | 1981-03-05 | 1983-08-09 | Texas Instruments Incorporated | Speech producing system |
| US4520499A (en) * | 1982-06-25 | 1985-05-28 | Milton Bradley Company | Combination speech synthesis and recognition apparatus |
| US4599567A (en) * | 1983-07-29 | 1986-07-08 | Enelf Inc. | Signal representation generator |
| JPH0632020B2 (ja) * | 1986-03-25 | 1994-04-27 | インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン | 音声合成方法および装置 |
| US5086475A (en) * | 1988-11-19 | 1992-02-04 | Sony Corporation | Apparatus for generating, recording or reproducing sound source data |
| FR2648567B1 (fr) * | 1989-05-24 | 1991-10-04 | Inst Nat Sante Rech Med | Procede de traitement numerique d'un signal par transformation reversible en ondelettes |
| US4974187A (en) * | 1989-08-02 | 1990-11-27 | Aware, Inc. | Modular digital signal processing system |
-
1991
- 1991-06-18 FR FR9107424A patent/FR2678103B1/fr not_active Expired - Lifetime
-
1992
- 1992-06-16 JP JP5500767A patent/JPH06503186A/ja not_active Withdrawn
- 1992-06-16 EP EP92401663A patent/EP0519802A1/fr not_active Ceased
- 1992-06-16 WO PCT/FR1992/000538 patent/WO1992022890A1/fr not_active Ceased
- 1992-06-16 US US07/972,486 patent/US5826232A/en not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH11503240A (ja) * | 1995-03-27 | 1999-03-23 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | フェーザ測定用単一側波帯フィルタバンクの効率的実施装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| FR2678103A1 (fr) | 1992-12-24 |
| US5826232A (en) | 1998-10-20 |
| FR2678103B1 (fr) | 1996-10-25 |
| WO1992022890A1 (fr) | 1992-12-23 |
| EP0519802A1 (fr) | 1992-12-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH06503186A (ja) | 音声合成方法 | |
| KR100427753B1 (ko) | 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치 | |
| EP0657873B1 (en) | Speech signal bandwidth compression and expansion apparatus, and bandwidth compressing speech signal transmission method, and reproducing method | |
| JPH10307599A (ja) | スプラインを使用する波形補間音声コーディング | |
| JPS5853352B2 (ja) | 音声合成器 | |
| US5425130A (en) | Apparatus for transforming voice using neural networks | |
| EP0287741B1 (en) | Process for varying speech speed and device for implementing said process | |
| WO1995021490A1 (en) | Method and device for encoding information and method and device for decoding information | |
| JPH10319996A (ja) | 雑音の効率的分解と波形補間における周期信号波形 | |
| JPH06337699A (ja) | ピッチ・エポック同期線形予測符号化ボコーダおよび方法 | |
| JP3310682B2 (ja) | 音響信号の符号化方法及び再生方法 | |
| US7024008B2 (en) | Acoustic quality enhancement via feedback and equalization for mobile multimedia systems | |
| Carson et al. | Resampling filter design for multirate neural audio effect processing | |
| EP0772185A2 (en) | Speech decoding method and apparatus | |
| JP3297751B2 (ja) | データ数変換方法、符号化装置及び復号化装置 | |
| US5727125A (en) | Method and apparatus for synthesis of speech excitation waveforms | |
| JP3211832B2 (ja) | ディジタルオーディオ信号のプリエコーを低減するためのフィルタリング方法およびその装置 | |
| JPH09127987A (ja) | 信号符号化方法及び装置 | |
| JPH0235320B2 (ja) | ||
| JP2010515090A (ja) | 音声コード化の方法および装置 | |
| JP3266920B2 (ja) | 音声符号化装置及び音声復号化装置並びに音声符号化復号化装置 | |
| JP3504485B2 (ja) | 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体 | |
| JPH0876798A (ja) | 広帯域音声信号復元方法 | |
| JPH09198088A (ja) | 声質変換再生器 | |
| JPH09127994A (ja) | 信号符号化方法及び装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |