JP2000209663A - 音声チャネル上で非音声情報を送信する方法 - Google Patents
音声チャネル上で非音声情報を送信する方法Info
- Publication number
- JP2000209663A JP2000209663A JP2766A JP2000002766A JP2000209663A JP 2000209663 A JP2000209663 A JP 2000209663A JP 2766 A JP2766 A JP 2766A JP 2000002766 A JP2000002766 A JP 2000002766A JP 2000209663 A JP2000209663 A JP 2000209663A
- Authority
- JP
- Japan
- Prior art keywords
- information
- voice
- output
- codebook
- vocoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
- Transmitters (AREA)
Abstract
(57)【要約】
【課題】 無線音声チャネルにおける特に非音声信号の
データの送信を改善する。 【解決手段】 対応するコードブックのゲインをゼロに
セットすることにより、一方または両方のコードブック
出力に割り当てられたビットで情報を送る。ゲインをゼ
ロにセットすることにより、コードブックの出力は受け
側ボコーダによって解釈されない。この方式により、ボ
コーダに完全に透過性のある方法で更なる情報を送るこ
とが可能になる。「秘密」メッセージを送るこの技術の
アプリケーションとして、非音声信号を生成するパラメ
ータを送ることがある。例えば、呼び待ちトーン、DT
MFトーンまたはTTY/TDD文字を生成する情報を
圧縮ビットストリームに秘密的に埋め込み、非音声トー
ンを再生成することができる。
データの送信を改善する。 【解決手段】 対応するコードブックのゲインをゼロに
セットすることにより、一方または両方のコードブック
出力に割り当てられたビットで情報を送る。ゲインをゼ
ロにセットすることにより、コードブックの出力は受け
側ボコーダによって解釈されない。この方式により、ボ
コーダに完全に透過性のある方法で更なる情報を送るこ
とが可能になる。「秘密」メッセージを送るこの技術の
アプリケーションとして、非音声信号を生成するパラメ
ータを送ることがある。例えば、呼び待ちトーン、DT
MFトーンまたはTTY/TDD文字を生成する情報を
圧縮ビットストリームに秘密的に埋め込み、非音声トー
ンを再生成することができる。
Description
【0001】
【発明の属する技術分野】本発明は、通信に関し、特
に、無線音声チャネルにおけるデータの送信に関する。
に、無線音声チャネルにおけるデータの送信に関する。
【0002】
【従来の技術】音声信号を圧縮するために音声エンコー
ダ/デコーダ(ボコーダ)が用いられ、通信チャネル上
の伝送バンド幅を減らしている。呼び当たりのバンド幅
を減らすことによって、同じチャネル上の呼びを増やす
ことができる。符号励起線形予測(CELP)ボコーダ
として知られる種類のボコーダがあり、これらボコーダ
においては、音声は一連のフィルターによりモデル化さ
れている。これらフィルターのパラメータは元の音声よ
りも遙かに少ないビット数で送ることができる。
ダ/デコーダ(ボコーダ)が用いられ、通信チャネル上
の伝送バンド幅を減らしている。呼び当たりのバンド幅
を減らすことによって、同じチャネル上の呼びを増やす
ことができる。符号励起線形予測(CELP)ボコーダ
として知られる種類のボコーダがあり、これらボコーダ
においては、音声は一連のフィルターによりモデル化さ
れている。これらフィルターのパラメータは元の音声よ
りも遙かに少ないビット数で送ることができる。
【0003】また、これらフィルターに入力(励起)を
送り、元の音声を再構築する必要がある。励起を直接送
るのには多すぎるバンド幅が必要なので、励起を少ない
数の非ゼロパルスで置き換えることにより粗い(crud
e)近似を行う。これらパルスの位置は非常に少ないビ
ット数で送ることができ、この元の励起に対するクルー
ド近似は高品質音声を再生するために適切である。この
励起は、固定したコードブック貢献および対応するゲイ
ンで表される。また、音声に存在する擬似周期性は、適
用性コードブック出力と対応するゲインで表される。固
定コードブック出力とその対応するゲイン、適用性コー
ドブック出力とその対応するゲイン、フィルターパラメ
ータ(線形予測コーダパラメータとしても知られる)が
エンコードされた音声信号を表すために送られる。
送り、元の音声を再構築する必要がある。励起を直接送
るのには多すぎるバンド幅が必要なので、励起を少ない
数の非ゼロパルスで置き換えることにより粗い(crud
e)近似を行う。これらパルスの位置は非常に少ないビ
ット数で送ることができ、この元の励起に対するクルー
ド近似は高品質音声を再生するために適切である。この
励起は、固定したコードブック貢献および対応するゲイ
ンで表される。また、音声に存在する擬似周期性は、適
用性コードブック出力と対応するゲインで表される。固
定コードブック出力とその対応するゲイン、適用性コー
ドブック出力とその対応するゲイン、フィルターパラメ
ータ(線形予測コーダパラメータとしても知られる)が
エンコードされた音声信号を表すために送られる。
【0004】ボコーダは、その特性をモデル化し、音声
自体を送るよりも遙かに少ないビット数でそのパラメー
タを送ることにより音声を圧縮するように初期には設計
されていた。無線電話が一般的になるにつれ、ボイスメ
ールにアクセスすることや呼び待ち音を受けることのよ
うな伝統的な地上電話で用いられるように、人々は無線
電話を非音声アプリケーションの同じ領域で用いること
を益々期待している。最近になり、米国連邦通信委員会
(FCC)は、デジタルセルラー電話を用いる聴覚障害
者用テキスト電話(TTY/TDD)を規定した。
自体を送るよりも遙かに少ないビット数でそのパラメー
タを送ることにより音声を圧縮するように初期には設計
されていた。無線電話が一般的になるにつれ、ボイスメ
ールにアクセスすることや呼び待ち音を受けることのよ
うな伝統的な地上電話で用いられるように、人々は無線
電話を非音声アプリケーションの同じ領域で用いること
を益々期待している。最近になり、米国連邦通信委員会
(FCC)は、デジタルセルラー電話を用いる聴覚障害
者用テキスト電話(TTY/TDD)を規定した。
【0005】
【発明が解決しようとする課題】非音声アプリケーショ
ンにまつわる問題として、それらのボコーダの音声モデ
ルに合致しないことがある。非音声信号がボコーダによ
って処理される場合、デコードされた結果は必ずしも満
足いくものではない。また、この問題は無線電話がエラ
ーに弱い環境にて稼働することにより更に悪くなってい
る。伝送エラーから回復するために、ボコーダがランダ
ムエラーから回復するために音声モデルに依存する。こ
のように、非音声信号はこのモデルに合致せず再構築は
適切ではなくなってしまう。
ンにまつわる問題として、それらのボコーダの音声モデ
ルに合致しないことがある。非音声信号がボコーダによ
って処理される場合、デコードされた結果は必ずしも満
足いくものではない。また、この問題は無線電話がエラ
ーに弱い環境にて稼働することにより更に悪くなってい
る。伝送エラーから回復するために、ボコーダがランダ
ムエラーから回復するために音声モデルに依存する。こ
のように、非音声信号はこのモデルに合致せず再構築は
適切ではなくなってしまう。
【0006】
【課題を解決するための手段】本発明は、対応するコー
ドブックのゲインをゼロにセットすることにより、一方
または両方のコードブック出力に割り当てられたビット
で情報を送る。ゲインをゼロにセットすることにより、
コードブックの出力は受け側ボコーダによって解釈され
ない。この方式により、ボコーダに完全に透過性のある
方法で更なる情報を送ることが可能になる。「秘密」メ
ッセージを送るこの技術のアプリケーションとして、非
音声信号を生成するパラメータを送ることがある。例え
ば、呼び待ちトーン、DTMFトーン、またはTTY/
TDD文字を生成する情報を圧縮ビットストリームに秘
密的に(clandestinely)埋め込み、非音声トーンを再
生成することができる。
ドブックのゲインをゼロにセットすることにより、一方
または両方のコードブック出力に割り当てられたビット
で情報を送る。ゲインをゼロにセットすることにより、
コードブックの出力は受け側ボコーダによって解釈され
ない。この方式により、ボコーダに完全に透過性のある
方法で更なる情報を送ることが可能になる。「秘密」メ
ッセージを送るこの技術のアプリケーションとして、非
音声信号を生成するパラメータを送ることがある。例え
ば、呼び待ちトーン、DTMFトーン、またはTTY/
TDD文字を生成する情報を圧縮ビットストリームに秘
密的に(clandestinely)埋め込み、非音声トーンを再
生成することができる。
【0007】
【発明の実施の形態】図1は、典型的なボコーダのブロ
ック図を示す。ボコーダ10は入力12にてデジタル化
した音声を受信する。このデジタル化した音声はA/D
変換器を通過したアナログ音声信号であり、典型的には
20msのオーダの各フレームへと分けられている。入
力12における信号はエンコーダ部14にわたされ、こ
れは音声伝送に用いられるバンド幅量を減らすために音
声をエンコードする。エンコードされた音声は出力16
にて利用可能となる。
ック図を示す。ボコーダ10は入力12にてデジタル化
した音声を受信する。このデジタル化した音声はA/D
変換器を通過したアナログ音声信号であり、典型的には
20msのオーダの各フレームへと分けられている。入
力12における信号はエンコーダ部14にわたされ、こ
れは音声伝送に用いられるバンド幅量を減らすために音
声をエンコードする。エンコードされた音声は出力16
にて利用可能となる。
【0008】エンコードされた音声は通信チャネルの他
端における同様なボコーダのデコーダ部によって受信さ
れる。通信チャネルの他端におけるデコーダは、ボコー
ダ10のデコーダ部と同様ないし同一である。各音声は
入力18を介してボコーダ10によって受信され、デコ
ーダ部20へとわたされる。デコーダ部20は、送信ボ
コーダから受信したエンコードされた信号を用いて出力
22にてデジタル化した音声を作る。
端における同様なボコーダのデコーダ部によって受信さ
れる。通信チャネルの他端におけるデコーダは、ボコー
ダ10のデコーダ部と同様ないし同一である。各音声は
入力18を介してボコーダ10によって受信され、デコ
ーダ部20へとわたされる。デコーダ部20は、送信ボ
コーダから受信したエンコードされた信号を用いて出力
22にてデジタル化した音声を作る。
【0009】ボコーダは通信分野において周知である。
例えば、ボコーダは、文献、Speechand audio coding f
or wireless and network applications, Bishnu S. At
al,Vladimir Cuperman, Allen Gersho編集, 1993, Kluw
er Academic Publishersに記載されている。ボコーダは
広く利用可能であり、Qualcomm IncorporatedやLucent
Technologies Inc.のような会社によって製造されてい
る。
例えば、ボコーダは、文献、Speechand audio coding f
or wireless and network applications, Bishnu S. At
al,Vladimir Cuperman, Allen Gersho編集, 1993, Kluw
er Academic Publishersに記載されている。ボコーダは
広く利用可能であり、Qualcomm IncorporatedやLucent
Technologies Inc.のような会社によって製造されてい
る。
【0010】図2は、ボコーダ10のエンコーダ14の
主な機能を示す。デジタル化した音声信号は入力12に
て受けられ、線形予測コーダ40へとわたされる。線形
予測コーダはフレーム当たり1回の入音声の線形予測解
析を行う。線形予測解析はこの分野において周知であ
り、入力音声信号に基づいた声道(vocal tract)の線
形予測合成モデルを作る。このモデルを記述する線形予
測パラメータないし係数が出力16を介してエンコード
された音声信号の一部として送られる。
主な機能を示す。デジタル化した音声信号は入力12に
て受けられ、線形予測コーダ40へとわたされる。線形
予測コーダはフレーム当たり1回の入音声の線形予測解
析を行う。線形予測解析はこの分野において周知であ
り、入力音声信号に基づいた声道(vocal tract)の線
形予測合成モデルを作る。このモデルを記述する線形予
測パラメータないし係数が出力16を介してエンコード
された音声信号の一部として送られる。
【0011】コーダ40はこのモデルを用いて、入力音
声信号をこのモデルが作る際に用いる励起を表す残余
(residual)音声信号を作る。この残余音声信号は出力
42にて利用可能となる。出力42からの残余音声は開
ループピッチサーチユニット50の入力48へ、適用コ
ードブックユニット72の入力へ、そして固定コードブ
ックユニット82へと与えられる。インパルス応答ユニ
ット60は線形予測コーダから線形予測パラメータを受
信し、コーダ40にて生成されたモデルのインパルス応
答を生成する。このインパルス応答は適用および固定コ
ードブックユニットにて用いられる。
声信号をこのモデルが作る際に用いる励起を表す残余
(residual)音声信号を作る。この残余音声信号は出力
42にて利用可能となる。出力42からの残余音声は開
ループピッチサーチユニット50の入力48へ、適用コ
ードブックユニット72の入力へ、そして固定コードブ
ックユニット82へと与えられる。インパルス応答ユニ
ット60は線形予測コーダから線形予測パラメータを受
信し、コーダ40にて生成されたモデルのインパルス応
答を生成する。このインパルス応答は適用および固定コ
ードブックユニットにて用いられる。
【0012】開ループピッチサーチユニット50はコー
ダ40からの残余音声信号を用いてそのピッチをモデル
化し、出力52にて、ピッチ、すなわち、ピッチ周期ま
たはピッチ遅延信号と一般に呼ばれているものを与え
る。この出力52からのピッチ遅延信号およびインパル
ス応答ユニット60の出力64からのインパルス応答信
号は、適用コードブックユニット72の入力70にて受
けられる。適用コードブックユニット72はピッチゲイ
ン出力およびピッチインデックス出力を作り、これはボ
コーダ10のエンコードされた音声出力16の一部とな
る。適用コードブックユニット72の出力74は、固定
コードブックユニット82の入力80へピッチゲインピ
ッチインデックス信号をも与える。また、適用コードブ
ックユニット72は入力80へと励起信号および適用コ
ードブックターゲット信号を与える。
ダ40からの残余音声信号を用いてそのピッチをモデル
化し、出力52にて、ピッチ、すなわち、ピッチ周期ま
たはピッチ遅延信号と一般に呼ばれているものを与え
る。この出力52からのピッチ遅延信号およびインパル
ス応答ユニット60の出力64からのインパルス応答信
号は、適用コードブックユニット72の入力70にて受
けられる。適用コードブックユニット72はピッチゲイ
ン出力およびピッチインデックス出力を作り、これはボ
コーダ10のエンコードされた音声出力16の一部とな
る。適用コードブックユニット72の出力74は、固定
コードブックユニット82の入力80へピッチゲインピ
ッチインデックス信号をも与える。また、適用コードブ
ックユニット72は入力80へと励起信号および適用コ
ードブックターゲット信号を与える。
【0013】適用コードブック72は入力12からのデ
ジタル化した音声信号および線形予測コーダ40が作ら
れた残余音声信号を用いてその出力を作る。適用コード
ブック72はデジタル化した音声信号および線形予測コ
ーダ40の残余音声信号を用いて適用コードブックター
ゲット信号を形成する。適用コードブックターゲット信
号は固定コードブックユニット82への入力として用い
られ、また、適用コードブックユニット72のピッチゲ
イン、ピッチインデックス、励起出力を作る演算手段へ
の入力として用いる。また、適用コードブックターゲッ
ト信号、開ループピッチサーチユニット50からのピッ
チ遅延信号、インパルス応答ユニット60からのインパ
ルス応答はピッチインデックス、ピッチゲイン、励起信
号を作るために用いられ、これらは固定コードブックユ
ニット82へとわたされる。これら信号が演算される方
式はボコーダの分野において周知である。
ジタル化した音声信号および線形予測コーダ40が作ら
れた残余音声信号を用いてその出力を作る。適用コード
ブック72はデジタル化した音声信号および線形予測コ
ーダ40の残余音声信号を用いて適用コードブックター
ゲット信号を形成する。適用コードブックターゲット信
号は固定コードブックユニット82への入力として用い
られ、また、適用コードブックユニット72のピッチゲ
イン、ピッチインデックス、励起出力を作る演算手段へ
の入力として用いる。また、適用コードブックターゲッ
ト信号、開ループピッチサーチユニット50からのピッ
チ遅延信号、インパルス応答ユニット60からのインパ
ルス応答はピッチインデックス、ピッチゲイン、励起信
号を作るために用いられ、これらは固定コードブックユ
ニット82へとわたされる。これら信号が演算される方
式はボコーダの分野において周知である。
【0014】固定コードブックユニット82は入力80
から受信した入力を用いて、固定ゲイン出力および固定
インデックス出力を作り、これらは出力16にてエンコ
ードされた音声の一部として用いられる。固定コードブ
ックユニットは線形予測コーダ40の残余音声信号の確
率的(stochastic)部分をモデル化しようと試みる。固
定コードブックサーチのターゲットは、現在の適用コー
ドブックターゲット信号と残余音声信号の間のエラーを
判断することにより作られる。固定コードブックサーチ
は、励起パルスに対する固定ゲインと固定インデックス
信号を作り、このエラーを最小化する。適用コードブッ
クユニット72からの出力を用いて固定ゲインと固定イ
ンデックス信号が計算される方式はボコーダの分野にお
いて周知である。
から受信した入力を用いて、固定ゲイン出力および固定
インデックス出力を作り、これらは出力16にてエンコ
ードされた音声の一部として用いられる。固定コードブ
ックユニットは線形予測コーダ40の残余音声信号の確
率的(stochastic)部分をモデル化しようと試みる。固
定コードブックサーチのターゲットは、現在の適用コー
ドブックターゲット信号と残余音声信号の間のエラーを
判断することにより作られる。固定コードブックサーチ
は、励起パルスに対する固定ゲインと固定インデックス
信号を作り、このエラーを最小化する。適用コードブッ
クユニット72からの出力を用いて固定ゲインと固定イ
ンデックス信号が計算される方式はボコーダの分野にお
いて周知である。
【0015】スイッチ90、92は、固定コードブック
出力と適用コードブック出力をそれぞれ送るのに用いら
れるビット群に置き換わるデータを送るのに用いられ
る。これらスイッチ90,92の接点が位置Aにあれ
ば、対応するコードブック出力はデータないし他の情報
で置き換わり、対応するコードブックゲインはゼロない
しほぼゼロにセットされる。結果として、受信器におい
て作られるスケールされたコードブック出力ないし励起
はゼロないしほぼゼロになり、通常送信される音声をモ
デル化するために受信側ボコーダによって用いられるフ
ィルターに対して悪影響を与えずに済む。
出力と適用コードブック出力をそれぞれ送るのに用いら
れるビット群に置き換わるデータを送るのに用いられ
る。これらスイッチ90,92の接点が位置Aにあれ
ば、対応するコードブック出力はデータないし他の情報
で置き換わり、対応するコードブックゲインはゼロない
しほぼゼロにセットされる。結果として、受信器におい
て作られるスケールされたコードブック出力ないし励起
はゼロないしほぼゼロになり、通常送信される音声をモ
デル化するために受信側ボコーダによって用いられるフ
ィルターに対して悪影響を与えずに済む。
【0016】図3は、ボコーダ10のデコーダ部20の
機能的ブロック図を示す。エンコードされた音声信号は
エンコーダ20の入力18にて受信される。このエンコ
ードされた音声信号はデコーダ100によって受信され
る。デコーダ100は固定インデックスおよびピッチイ
ンデックス信号それぞれに対応する固定および適用コー
ドベクトルを作る。これらコードベクトルはピッチゲイ
ンおよび固定ゲイン信号とともにユニット110の励起
構築部分にわたされる。ピッチゲイン信号は、ピッチイ
ンデックス信号を用いて作られた適用ベクトルをスケー
ルするのに用いられ、固定ゲイン信号は、固定インデッ
クス信号を用いてえられた固定ベクトルをスケールする
のに用いられる。
機能的ブロック図を示す。エンコードされた音声信号は
エンコーダ20の入力18にて受信される。このエンコ
ードされた音声信号はデコーダ100によって受信され
る。デコーダ100は固定インデックスおよびピッチイ
ンデックス信号それぞれに対応する固定および適用コー
ドベクトルを作る。これらコードベクトルはピッチゲイ
ンおよび固定ゲイン信号とともにユニット110の励起
構築部分にわたされる。ピッチゲイン信号は、ピッチイ
ンデックス信号を用いて作られた適用ベクトルをスケー
ルするのに用いられ、固定ゲイン信号は、固定インデッ
クス信号を用いてえられた固定ベクトルをスケールする
のに用いられる。
【0017】デコーダ100は、線形予測コードパラメ
ータをフィルターにわたす。フィルターまたはユニット
110のモデル合成部分へとわたす。続いて、ユニット
110はスケールされたベクトルを用いて線形予測コー
ダが作った線形予測係数を用いて合成されたフィルター
を励起し、入力12にて元々受信したデジタル化した音
声を表す出力信号を作る。随意に、ポストフィルター1
20を用いて出力20にて作られるデジタル化した音声
信号のスペクトルを整形するのに用いることができる。
ータをフィルターにわたす。フィルターまたはユニット
110のモデル合成部分へとわたす。続いて、ユニット
110はスケールされたベクトルを用いて線形予測コー
ダが作った線形予測係数を用いて合成されたフィルター
を励起し、入力12にて元々受信したデジタル化した音
声を表す出力信号を作る。随意に、ポストフィルター1
20を用いて出力20にて作られるデジタル化した音声
信号のスペクトルを整形するのに用いることができる。
【0018】音声情報ではなくデータが送信される場
合、ピッチインデックス(適用コードブック出力)およ
び/または固定インデックス(固定コードブック出力)
がデータを受信するのに用いられる。ユニット110に
よるフィルター合成に対しての非データ信号の影響は除
去される。なぜなら、ピッチないしコードインデックス
に対応するゲイン値がゼロであるからである。
合、ピッチインデックス(適用コードブック出力)およ
び/または固定インデックス(固定コードブック出力)
がデータを受信するのに用いられる。ユニット110に
よるフィルター合成に対しての非データ信号の影響は除
去される。なぜなら、ピッチないしコードインデックス
に対応するゲイン値がゼロであるからである。
【0019】このような機能的ブロック図は多くの形態
にて実装することができる。各ブロックは、マイクロプ
ロセッサやマイクロコンピュータを用いて個別に実装し
てもよいが、1つのマイクロプロセッサやマイクロコン
ピュータを用いて実装してもよい。前期会社や他の半導
体会社から利用可能なプログラマブルデジタルシグナル
プロセッシングデバイスや特殊用途デバイスを用いて機
能ブロックの一部ないし全てを実装することができる。
にて実装することができる。各ブロックは、マイクロプ
ロセッサやマイクロコンピュータを用いて個別に実装し
てもよいが、1つのマイクロプロセッサやマイクロコン
ピュータを用いて実装してもよい。前期会社や他の半導
体会社から利用可能なプログラマブルデジタルシグナル
プロセッシングデバイスや特殊用途デバイスを用いて機
能ブロックの一部ないし全てを実装することができる。
【図1】典型的なボコーダのブロック図。
【図2】ボコーダ10のエンコーダ14の主な機能を示
す図。
す図。
【図3】ボコーダ10のデコーダ部20の機能的なブロ
ック図。
ック図。
10 ボコーダ 14 エンコーダ 20 デコーダ 12 音声信号 40 線形予測コーダ 50 開ループピッチサーチユニット 60 インパルス応答ユニット 72 適用コードブックユニット 82 固定コードブックユニット 20 デコーダ部 100 デコーダ 110 ユニット 120 ポストフィルター
───────────────────────────────────────────────────── フロントページの続き (71)出願人 596077259 600 Mountain Avenue, Murray Hill, New Je rsey 07974−0636U.S.A. (72)発明者 スティーブン エー.ベンノ アメリカ合衆国、07801 ニュージャージ ー、ドーバー、プリンストン アベニュー 53 (72)発明者 マイケル チャールズ リッチオン アメリカ合衆国、07110 ニュージャージ ー、ナッツリー、パザイック アベニュー 565
Claims (5)
- 【請求項1】 音声チャネル上で非音声情報を送信する
方法であって、 (A)ピッチインデックス情報の代わりに非音声情報を
送信するステップと、 (B)ほぼゼロの値のピッチゲイン値を送信するステッ
プとを有することを特徴とする方法。 - 【請求項2】 前期非音声情報は、DTMFトーン情報
であることを特徴とする請求項1記載の方法。 - 【請求項3】 前期非音声情報は、聴覚障害者用テキス
ト電話の情報であることを特徴とする請求項1記載の方
法。 - 【請求項4】 音声チャネル上で非音声情報を送信する
方法であって、 (A)固定インデックス情報の代わりに第1の非音声情
報を送信するステップと、 (B)ほぼゼロの値のインデックスゲイン値を送信する
ステップとを有することを特徴とする方法。 - 【請求項5】 (C)ピッチインデックス情報の代わり
に第2の非音声情報を送信するステップと、 (D)ほぼゼロの値のピッチゲイン値を送信するステッ
プとを有することを特徴とする請求項4記載の方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US22810299A | 1999-01-11 | 1999-01-11 | |
| US09/228102 | 1999-01-11 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000209663A true JP2000209663A (ja) | 2000-07-28 |
Family
ID=22855803
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2766A Pending JP2000209663A (ja) | 1999-01-11 | 2000-01-11 | 音声チャネル上で非音声情報を送信する方法 |
Country Status (7)
| Country | Link |
|---|---|
| EP (1) | EP1020848A2 (ja) |
| JP (1) | JP2000209663A (ja) |
| KR (1) | KR20000053407A (ja) |
| CN (1) | CN1262577A (ja) |
| AU (1) | AU6533799A (ja) |
| BR (1) | BR0000002A (ja) |
| CA (1) | CA2293165A1 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7310596B2 (en) | 2002-02-04 | 2007-12-18 | Fujitsu Limited | Method and system for embedding and extracting data from encoded voice code |
Families Citing this family (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2002039762A2 (en) * | 2000-11-07 | 2002-05-16 | Ericsson Inc. | Method of and apparatus for detecting tty type calls in cellular systems |
| JP4330346B2 (ja) * | 2002-02-04 | 2009-09-16 | 富士通株式会社 | 音声符号に対するデータ埋め込み/抽出方法および装置並びにシステム |
| US7932851B1 (en) * | 2002-10-15 | 2011-04-26 | Itt Manufacturing Enterprises, Inc. | Ranging signal structure with hidden acquisition code |
| US7970606B2 (en) | 2002-11-13 | 2011-06-28 | Digital Voice Systems, Inc. | Interoperable vocoder |
| US7634399B2 (en) | 2003-01-30 | 2009-12-15 | Digital Voice Systems, Inc. | Voice transcoder |
| EP1455509A3 (de) * | 2003-03-03 | 2005-01-05 | FREQUENTIS GmbH | Verfahren und Anordnung zur Sprachaufzeichnung |
| US8359197B2 (en) | 2003-04-01 | 2013-01-22 | Digital Voice Systems, Inc. | Half-rate vocoder |
| FR2859566B1 (fr) | 2003-09-05 | 2010-11-05 | Eads Telecom | Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre |
| US7752039B2 (en) | 2004-11-03 | 2010-07-06 | Nokia Corporation | Method and device for low bit rate speech coding |
| DE102007007627A1 (de) * | 2006-09-15 | 2008-03-27 | Rwth Aachen | Steganographie in digitalen Signal-Codierern |
| US8036886B2 (en) | 2006-12-22 | 2011-10-11 | Digital Voice Systems, Inc. | Estimation of pulsed speech model parameters |
| US11270714B2 (en) | 2020-01-08 | 2022-03-08 | Digital Voice Systems, Inc. | Speech coding using time-varying interpolation |
| US12254895B2 (en) | 2021-07-02 | 2025-03-18 | Digital Voice Systems, Inc. | Detecting and compensating for the presence of a speaker mask in a speech signal |
| US11990144B2 (en) | 2021-07-28 | 2024-05-21 | Digital Voice Systems, Inc. | Reducing perceived effects of non-voice data in digital speech |
| US12451151B2 (en) | 2022-04-08 | 2025-10-21 | Digital Voice Systems, Inc. | Tone frame detector for digital speech |
| US12462814B2 (en) | 2023-10-06 | 2025-11-04 | Digital Voice Systems, Inc. | Bit error correction in digital speech |
-
1999
- 1999-12-17 AU AU65337/99A patent/AU6533799A/en not_active Abandoned
- 1999-12-30 CA CA002293165A patent/CA2293165A1/en not_active Abandoned
-
2000
- 2000-01-03 BR BR0000002-7A patent/BR0000002A/pt not_active Application Discontinuation
- 2000-01-06 EP EP00300042A patent/EP1020848A2/en not_active Withdrawn
- 2000-01-07 KR KR1020000000557A patent/KR20000053407A/ko not_active Withdrawn
- 2000-01-10 CN CN00101021A patent/CN1262577A/zh active Pending
- 2000-01-11 JP JP2766A patent/JP2000209663A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7310596B2 (en) | 2002-02-04 | 2007-12-18 | Fujitsu Limited | Method and system for embedding and extracting data from encoded voice code |
Also Published As
| Publication number | Publication date |
|---|---|
| BR0000002A (pt) | 2002-01-02 |
| CN1262577A (zh) | 2000-08-09 |
| CA2293165A1 (en) | 2000-07-11 |
| KR20000053407A (ko) | 2000-08-25 |
| EP1020848A2 (en) | 2000-07-19 |
| AU6533799A (en) | 2000-07-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0920693B1 (en) | Method and apparatus for improving the voice quality of tandemed vocoders | |
| JP2000209663A (ja) | 音声チャネル上で非音声情報を送信する方法 | |
| KR20030076646A (ko) | 음성 비활동 동안에 보이스 송신 시스템들 사이에상호운용성을 제공하는 방법 및 장치 | |
| US8340959B2 (en) | Method and apparatus for transmitting wideband speech signals | |
| CN101006495A (zh) | 语音编码装置、语音解码装置、通信装置以及语音编码方法 | |
| JP2006099124A (ja) | デジタル無線チャネル上の自動音声/話者認識 | |
| US8259629B2 (en) | System and method for transmitting and receiving wideband speech signals with a synthesized signal | |
| CN1200404C (zh) | 具有脉冲序列约束的码激励线性预测语音编码器译码器 | |
| AU6203300A (en) | Coded domain echo control | |
| JP2003533902A5 (ja) | ||
| US6633840B1 (en) | Method and system for transmitting data on a speech channel | |
| JP3722366B2 (ja) | パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム | |
| JP2001265397A (ja) | 入力信号をボコーディングする方法と装置 | |
| KR100542435B1 (ko) | 패킷 망에서의 프레임 손실 은닉 방법 및 장치 | |
| JP4373693B2 (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
| JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
| Choudhary et al. | Study and performance of amr codecs for gsm | |
| CN1964244B (zh) | 一种用声码器收发数字信号的方法 | |
| Viswanathan et al. | Medium and low bit rate speech transmission | |
| JPH034300A (ja) | 音声符号化復号化方式 | |
| Kulakcherla | Non linear adaptive filters for echo cancellation of speech coded signals | |
| GB2365297A (en) | Data modem compatible with speech codecs | |
| KR20050059572A (ko) | 음성 레벨 변경 장치 및 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040127 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040706 |