JP2000209663A

JP2000209663A - 音声チャネル上で非音声情報を送信する方法

Info

Publication number: JP2000209663A
Application number: JP2766A
Authority: JP
Inventors: A Benno Stephen; エー．ベンノスティーブン; Charles Ricchion Michael; チャールズリッチオンマイケル
Original assignee: Lucent Technologies Inc
Current assignee: Nokia of America Corp
Priority date: 1999-01-11
Filing date: 2000-01-11
Publication date: 2000-07-28
Also published as: BR0000002A; CN1262577A; CA2293165A1; KR20000053407A; EP1020848A2; AU6533799A

Abstract

(57)【要約】【課題】無線音声チャネルにおける特に非音声信号の
データの送信を改善する。【解決手段】対応するコードブックのゲインをゼロに
セットすることにより、一方または両方のコードブック
出力に割り当てられたビットで情報を送る。ゲインをゼ
ロにセットすることにより、コードブックの出力は受け
側ボコーダによって解釈されない。この方式により、ボ
コーダに完全に透過性のある方法で更なる情報を送るこ
とが可能になる。「秘密」メッセージを送るこの技術の
アプリケーションとして、非音声信号を生成するパラメ
ータを送ることがある。例えば、呼び待ちトーン、ＤＴ
ＭＦトーンまたはＴＴＹ／ＴＤＤ文字を生成する情報を
圧縮ビットストリームに秘密的に埋め込み、非音声トー
ンを再生成することができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、通信に関し、特
に、無線音声チャネルにおけるデータの送信に関する。

【０００２】

【従来の技術】音声信号を圧縮するために音声エンコー
ダ／デコーダ（ボコーダ）が用いられ、通信チャネル上
の伝送バンド幅を減らしている。呼び当たりのバンド幅
を減らすことによって、同じチャネル上の呼びを増やす
ことができる。符号励起線形予測（ＣＥＬＰ）ボコーダ
として知られる種類のボコーダがあり、これらボコーダ
においては、音声は一連のフィルターによりモデル化さ
れている。これらフィルターのパラメータは元の音声よ
りも遙かに少ないビット数で送ることができる。

【０００３】また、これらフィルターに入力（励起）を
送り、元の音声を再構築する必要がある。励起を直接送
るのには多すぎるバンド幅が必要なので、励起を少ない
数の非ゼロパルスで置き換えることにより粗い（crud
e）近似を行う。これらパルスの位置は非常に少ないビ
ット数で送ることができ、この元の励起に対するクルー
ド近似は高品質音声を再生するために適切である。この
励起は、固定したコードブック貢献および対応するゲイ
ンで表される。また、音声に存在する擬似周期性は、適
用性コードブック出力と対応するゲインで表される。固
定コードブック出力とその対応するゲイン、適用性コー
ドブック出力とその対応するゲイン、フィルターパラメ
ータ（線形予測コーダパラメータとしても知られる）が
エンコードされた音声信号を表すために送られる。

【０００４】ボコーダは、その特性をモデル化し、音声
自体を送るよりも遙かに少ないビット数でそのパラメー
タを送ることにより音声を圧縮するように初期には設計
されていた。無線電話が一般的になるにつれ、ボイスメ
ールにアクセスすることや呼び待ち音を受けることのよ
うな伝統的な地上電話で用いられるように、人々は無線
電話を非音声アプリケーションの同じ領域で用いること
を益々期待している。最近になり、米国連邦通信委員会
（ＦＣＣ）は、デジタルセルラー電話を用いる聴覚障害
者用テキスト電話（ＴＴＹ／ＴＤＤ）を規定した。

【０００５】

【発明が解決しようとする課題】非音声アプリケーショ
ンにまつわる問題として、それらのボコーダの音声モデ
ルに合致しないことがある。非音声信号がボコーダによ
って処理される場合、デコードされた結果は必ずしも満
足いくものではない。また、この問題は無線電話がエラ
ーに弱い環境にて稼働することにより更に悪くなってい
る。伝送エラーから回復するために、ボコーダがランダ
ムエラーから回復するために音声モデルに依存する。こ
のように、非音声信号はこのモデルに合致せず再構築は
適切ではなくなってしまう。

【０００６】

【課題を解決するための手段】本発明は、対応するコー
ドブックのゲインをゼロにセットすることにより、一方
または両方のコードブック出力に割り当てられたビット
で情報を送る。ゲインをゼロにセットすることにより、
コードブックの出力は受け側ボコーダによって解釈され
ない。この方式により、ボコーダに完全に透過性のある
方法で更なる情報を送ることが可能になる。「秘密」メ
ッセージを送るこの技術のアプリケーションとして、非
音声信号を生成するパラメータを送ることがある。例え
ば、呼び待ちトーン、ＤＴＭＦトーン、またはＴＴＹ／
ＴＤＤ文字を生成する情報を圧縮ビットストリームに秘
密的に（clandestinely）埋め込み、非音声トーンを再
生成することができる。

【０００７】

【発明の実施の形態】図１は、典型的なボコーダのブロ
ック図を示す。ボコーダ１０は入力１２にてデジタル化
した音声を受信する。このデジタル化した音声はＡ／Ｄ
変換器を通過したアナログ音声信号であり、典型的には
２０ｍｓのオーダの各フレームへと分けられている。入
力１２における信号はエンコーダ部１４にわたされ、こ
れは音声伝送に用いられるバンド幅量を減らすために音
声をエンコードする。エンコードされた音声は出力１６
にて利用可能となる。

【０００８】エンコードされた音声は通信チャネルの他
端における同様なボコーダのデコーダ部によって受信さ
れる。通信チャネルの他端におけるデコーダは、ボコー
ダ１０のデコーダ部と同様ないし同一である。各音声は
入力１８を介してボコーダ１０によって受信され、デコ
ーダ部２０へとわたされる。デコーダ部２０は、送信ボ
コーダから受信したエンコードされた信号を用いて出力
２２にてデジタル化した音声を作る。

【０００９】ボコーダは通信分野において周知である。
例えば、ボコーダは、文献、Speechand audio coding f
or wireless and network applications, Bishnu S. At
al,Vladimir Cuperman, Allen Gersho編集, 1993, Kluw
er Academic Publishersに記載されている。ボコーダは
広く利用可能であり、Qualcomm IncorporatedやLucent
Technologies Inc.のような会社によって製造されてい
る。

【００１０】図２は、ボコーダ１０のエンコーダ１４の
主な機能を示す。デジタル化した音声信号は入力１２に
て受けられ、線形予測コーダ４０へとわたされる。線形
予測コーダはフレーム当たり１回の入音声の線形予測解
析を行う。線形予測解析はこの分野において周知であ
り、入力音声信号に基づいた声道（vocal tract）の線
形予測合成モデルを作る。このモデルを記述する線形予
測パラメータないし係数が出力１６を介してエンコード
された音声信号の一部として送られる。

【００１１】コーダ４０はこのモデルを用いて、入力音
声信号をこのモデルが作る際に用いる励起を表す残余
（residual）音声信号を作る。この残余音声信号は出力
４２にて利用可能となる。出力４２からの残余音声は開
ループピッチサーチユニット５０の入力４８へ、適用コ
ードブックユニット７２の入力へ、そして固定コードブ
ックユニット８２へと与えられる。インパルス応答ユニ
ット６０は線形予測コーダから線形予測パラメータを受
信し、コーダ４０にて生成されたモデルのインパルス応
答を生成する。このインパルス応答は適用および固定コ
ードブックユニットにて用いられる。

【００１２】開ループピッチサーチユニット５０はコー
ダ４０からの残余音声信号を用いてそのピッチをモデル
化し、出力５２にて、ピッチ、すなわち、ピッチ周期ま
たはピッチ遅延信号と一般に呼ばれているものを与え
る。この出力５２からのピッチ遅延信号およびインパル
ス応答ユニット６０の出力６４からのインパルス応答信
号は、適用コードブックユニット７２の入力７０にて受
けられる。適用コードブックユニット７２はピッチゲイ
ン出力およびピッチインデックス出力を作り、これはボ
コーダ１０のエンコードされた音声出力１６の一部とな
る。適用コードブックユニット７２の出力７４は、固定
コードブックユニット８２の入力８０へピッチゲインピ
ッチインデックス信号をも与える。また、適用コードブ
ックユニット７２は入力８０へと励起信号および適用コ
ードブックターゲット信号を与える。

【００１３】適用コードブック７２は入力１２からのデ
ジタル化した音声信号および線形予測コーダ４０が作ら
れた残余音声信号を用いてその出力を作る。適用コード
ブック７２はデジタル化した音声信号および線形予測コ
ーダ４０の残余音声信号を用いて適用コードブックター
ゲット信号を形成する。適用コードブックターゲット信
号は固定コードブックユニット８２への入力として用い
られ、また、適用コードブックユニット７２のピッチゲ
イン、ピッチインデックス、励起出力を作る演算手段へ
の入力として用いる。また、適用コードブックターゲッ
ト信号、開ループピッチサーチユニット５０からのピッ
チ遅延信号、インパルス応答ユニット６０からのインパ
ルス応答はピッチインデックス、ピッチゲイン、励起信
号を作るために用いられ、これらは固定コードブックユ
ニット８２へとわたされる。これら信号が演算される方
式はボコーダの分野において周知である。

【００１４】固定コードブックユニット８２は入力８０
から受信した入力を用いて、固定ゲイン出力および固定
インデックス出力を作り、これらは出力１６にてエンコ
ードされた音声の一部として用いられる。固定コードブ
ックユニットは線形予測コーダ４０の残余音声信号の確
率的（stochastic）部分をモデル化しようと試みる。固
定コードブックサーチのターゲットは、現在の適用コー
ドブックターゲット信号と残余音声信号の間のエラーを
判断することにより作られる。固定コードブックサーチ
は、励起パルスに対する固定ゲインと固定インデックス
信号を作り、このエラーを最小化する。適用コードブッ
クユニット７２からの出力を用いて固定ゲインと固定イ
ンデックス信号が計算される方式はボコーダの分野にお
いて周知である。

【００１５】スイッチ９０、９２は、固定コードブック
出力と適用コードブック出力をそれぞれ送るのに用いら
れるビット群に置き換わるデータを送るのに用いられ
る。これらスイッチ９０，９２の接点が位置Ａにあれ
ば、対応するコードブック出力はデータないし他の情報
で置き換わり、対応するコードブックゲインはゼロない
しほぼゼロにセットされる。結果として、受信器におい
て作られるスケールされたコードブック出力ないし励起
はゼロないしほぼゼロになり、通常送信される音声をモ
デル化するために受信側ボコーダによって用いられるフ
ィルターに対して悪影響を与えずに済む。

【００１６】図３は、ボコーダ１０のデコーダ部２０の
機能的ブロック図を示す。エンコードされた音声信号は
エンコーダ２０の入力１８にて受信される。このエンコ
ードされた音声信号はデコーダ１００によって受信され
る。デコーダ１００は固定インデックスおよびピッチイ
ンデックス信号それぞれに対応する固定および適用コー
ドベクトルを作る。これらコードベクトルはピッチゲイ
ンおよび固定ゲイン信号とともにユニット１１０の励起
構築部分にわたされる。ピッチゲイン信号は、ピッチイ
ンデックス信号を用いて作られた適用ベクトルをスケー
ルするのに用いられ、固定ゲイン信号は、固定インデッ
クス信号を用いてえられた固定ベクトルをスケールする
のに用いられる。

【００１７】デコーダ１００は、線形予測コードパラメ
ータをフィルターにわたす。フィルターまたはユニット
１１０のモデル合成部分へとわたす。続いて、ユニット
１１０はスケールされたベクトルを用いて線形予測コー
ダが作った線形予測係数を用いて合成されたフィルター
を励起し、入力１２にて元々受信したデジタル化した音
声を表す出力信号を作る。随意に、ポストフィルター１
２０を用いて出力２０にて作られるデジタル化した音声
信号のスペクトルを整形するのに用いることができる。

【００１８】音声情報ではなくデータが送信される場
合、ピッチインデックス（適用コードブック出力）およ
び／または固定インデックス（固定コードブック出力）
がデータを受信するのに用いられる。ユニット１１０に
よるフィルター合成に対しての非データ信号の影響は除
去される。なぜなら、ピッチないしコードインデックス
に対応するゲイン値がゼロであるからである。

【００１９】このような機能的ブロック図は多くの形態
にて実装することができる。各ブロックは、マイクロプ
ロセッサやマイクロコンピュータを用いて個別に実装し
てもよいが、１つのマイクロプロセッサやマイクロコン
ピュータを用いて実装してもよい。前期会社や他の半導
体会社から利用可能なプログラマブルデジタルシグナル
プロセッシングデバイスや特殊用途デバイスを用いて機
能ブロックの一部ないし全てを実装することができる。

【図面の簡単な説明】

【図１】典型的なボコーダのブロック図。

【図２】ボコーダ１０のエンコーダ１４の主な機能を示
す図。

【図３】ボコーダ１０のデコーダ部２０の機能的なブロ
ック図。

【符号の説明】

１０ボコーダ１４エンコーダ２０デコーダ１２音声信号４０線形予測コーダ５０開ループピッチサーチユニット６０インパルス応答ユニット７２適用コードブックユニット８２固定コードブックユニット２０デコーダ部１００デコーダ１１０ユニット１２０ポストフィルター

───────────────────────────────────────────────────── フロントページの続き (71)出願人 596077259 600 ＭｏｕｎｔａｉｎＡｖｅｎｕｅ, ＭｕｒｒａｙＨｉｌｌ，ＮｅｗＪｅｒｓｅｙ 07974−0636Ｕ．Ｓ．Ａ. (72)発明者スティーブンエー．ベンノアメリカ合衆国、07801 ニュージャージー、ドーバー、プリンストンアベニュー 53 (72)発明者マイケルチャールズリッチオンアメリカ合衆国、07110 ニュージャージー、ナッツリー、パザイックアベニュー 565

Claims

【特許請求の範囲】

【請求項１】音声チャネル上で非音声情報を送信する
方法であって、（Ａ）ピッチインデックス情報の代わりに非音声情報を
送信するステップと、（Ｂ）ほぼゼロの値のピッチゲイン値を送信するステッ
プとを有することを特徴とする方法。
【請求項２】前期非音声情報は、ＤＴＭＦトーン情報
であることを特徴とする請求項１記載の方法。
【請求項３】前期非音声情報は、聴覚障害者用テキス
ト電話の情報であることを特徴とする請求項１記載の方
法。
【請求項４】音声チャネル上で非音声情報を送信する
方法であって、（Ａ）固定インデックス情報の代わりに第１の非音声情
報を送信するステップと、（Ｂ）ほぼゼロの値のインデックスゲイン値を送信する
ステップとを有することを特徴とする方法。
【請求項５】（Ｃ）ピッチインデックス情報の代わり
に第２の非音声情報を送信するステップと、（Ｄ）ほぼゼロの値のピッチゲイン値を送信するステッ
プとを有することを特徴とする請求項４記載の方法。