JPS6132900A - 信号符号化装置とその方法 - Google Patents
信号符号化装置とその方法Info
- Publication number
- JPS6132900A JPS6132900A JP14687785A JP14687785A JPS6132900A JP S6132900 A JPS6132900 A JP S6132900A JP 14687785 A JP14687785 A JP 14687785A JP 14687785 A JP14687785 A JP 14687785A JP S6132900 A JPS6132900 A JP S6132900A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- value
- detection
- statistics
- step size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 10
- 238000001514 detection method Methods 0.000 claims abstract description 36
- 230000007774 longterm Effects 0.000 claims abstract description 5
- 238000004364 calculation method Methods 0.000 claims description 9
- 206010002953 Aphonia Diseases 0.000 claims description 8
- 238000009499 grossing Methods 0.000 claims description 3
- 235000019800 disodium phosphate Nutrition 0.000 description 17
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000009432 framing Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241001661918 Bartonia Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
通常の人の音声は無声の期間を含むが、ここではこの期
間を″音声不在期間″′と呼ぶ。
間を″音声不在期間″′と呼ぶ。
音声が電子的に伝送される場合、例えば、通信ネットワ
ークなどにおいては、この音声不在期間が全伝送時間の
大きな部分を占める。
ークなどにおいては、この音声不在期間が全伝送時間の
大きな部分を占める。
これは、音声不在期間の間に伝送される情報は、この期
間の長さと関係なく、この期間の存在とその長さを示す
のみであるため、結果として、通信ネットワークの使用
効率を低下することとなる。
間の長さと関係なく、この期間の存在とその長さを示す
のみであるため、結果として、通信ネットワークの使用
効率を低下することとなる。
他の情報、例えば、データ等を時間割当てベースにてこ
の音声不在期間内に挿入することによって、伝送の効率
を向上させる試がなされている。このようなアプローチ
は、現在、大陸間ケーブル及び衛星通信などに使用され
ており、TAS工(時間割当て及び音声補間)システム
として知られている。このタイプのシステムは、例えば
、合衆国特許第4,100,377号において説明され
ている。
の音声不在期間内に挿入することによって、伝送の効率
を向上させる試がなされている。このようなアプローチ
は、現在、大陸間ケーブル及び衛星通信などに使用され
ており、TAS工(時間割当て及び音声補間)システム
として知られている。このタイプのシステムは、例えば
、合衆国特許第4,100,377号において説明され
ている。
音声不在期間は既にパルス符号変調(PCM)形式にデ
ジタル的に符号化された音声信号内で検出することもで
きる。これは、例えば、合衆国特許第3,909,53
2号において説明されている。
ジタル的に符号化された音声信号内で検出することもで
きる。これは、例えば、合衆国特許第3,909,53
2号において説明されている。
符号化された音声信号とデータ信号の両方が時間割当て
ベースにて搬送波を共有する場合、再構成音声の劣化な
しに音声不在期間を最大限に利用するためには、音声不
在期間を高精度にて検出することが必要できる。従って
、これと関連しての第1の問題は、音声の存在−不在の
境界を知ることである。これらは、音声期間から沈黙期
間への遷移、あるいは沈黙期間から音声期間への遷移の
いずれかである。従って、音声の存在−不在期間の境界
の検出の精度を向上することが要求される。
ベースにて搬送波を共有する場合、再構成音声の劣化な
しに音声不在期間を最大限に利用するためには、音声不
在期間を高精度にて検出することが必要できる。従って
、これと関連しての第1の問題は、音声の存在−不在の
境界を知ることである。これらは、音声期間から沈黙期
間への遷移、あるいは沈黙期間から音声期間への遷移の
いずれかである。従って、音声の存在−不在期間の境界
の検出の精度を向上することが要求される。
本発明による新規の方法及び装置においては、音声の存
在−不在境界は音声信号の少なくとも2つのサブバンド
の所のデジタル的に符号化されたデータ内で検出される
。短期音声エネルギーを推定するための検出統計値を生
成するために個々の周波数サブバンドについてのエネル
ギーの推定が行なわれる。長期音声レベルとして使用さ
れるいき値が計算される。このいき値が検出統計値と比
較され、これによって、沈黙期間の存在の判定が行なわ
れる。この検出力法は1つの周波数ハンドを使用する方
法と比較して精度を著しく向上することができる。
在−不在境界は音声信号の少なくとも2つのサブバンド
の所のデジタル的に符号化されたデータ内で検出される
。短期音声エネルギーを推定するための検出統計値を生
成するために個々の周波数サブバンドについてのエネル
ギーの推定が行なわれる。長期音声レベルとして使用さ
れるいき値が計算される。このいき値が検出統計値と比
較され、これによって、沈黙期間の存在の判定が行なわ
れる。この検出力法は1つの周波数ハンドを使用する方
法と比較して精度を著しく向上することができる。
第1図に示す音声検出を伴なう2ハンドサブバンド符号
器10は低域直角位相ミラーフィルタ14、ハイ−ツウ
−デシメータ16、及びADPCM (適応デジタルパ
ルス符号器A)符号器18からなる下側周波数サブバン
ドあるいは低域バンド符号器回路12を含む。
器10は低域直角位相ミラーフィルタ14、ハイ−ツウ
−デシメータ16、及びADPCM (適応デジタルパ
ルス符号器A)符号器18からなる下側周波数サブバン
ドあるいは低域バンド符号器回路12を含む。
低域バンド回路12と平行して、高域直角位相ミラーフ
ィルタ22、ハイ−ツウ−デシメータ24、及びADP
CM符号器26から構成される上側周波数サブバンドあ
るいは高ハンド符号器回路20が存在する。符号器回路
12及び20の両方は12 kHz (キロヘルツ)の
サンプリング速度にて動作し、同一の55kHzアナロ
グ音声入力信号を受信する。これらはこれらの出力を伝
送の目的でマルチプレクサ28に送信する。サブバンド
符号器回路、例えば、回路12.20及びマルチプレク
サ28は当技術において周知の−ものであり、例えば、
合衆国特許第4,048,443号、ベルシステムテク
ニカルジャーナル(Be1l SystemTechn
ical Journal ) vol、 60、N(
L7、パート2、ページ1633−1653.1981
年9月号において発表のR,E、クローチャー(R,E
、 Crochjer、e )による論文〔サブバンド
コーディング(5ub−band Coding)
’J 、並びにIEEE トランザクション オン
コミュニケーション(IEEE Transactio
ns OnCommunications )、198
2年、2月、vol。
ィルタ22、ハイ−ツウ−デシメータ24、及びADP
CM符号器26から構成される上側周波数サブバンドあ
るいは高ハンド符号器回路20が存在する。符号器回路
12及び20の両方は12 kHz (キロヘルツ)の
サンプリング速度にて動作し、同一の55kHzアナロ
グ音声入力信号を受信する。これらはこれらの出力を伝
送の目的でマルチプレクサ28に送信する。サブバンド
符号器回路、例えば、回路12.20及びマルチプレク
サ28は当技術において周知の−ものであり、例えば、
合衆国特許第4,048,443号、ベルシステムテク
ニカルジャーナル(Be1l SystemTechn
ical Journal ) vol、 60、N(
L7、パート2、ページ1633−1653.1981
年9月号において発表のR,E、クローチャー(R,E
、 Crochjer、e )による論文〔サブバンド
コーディング(5ub−band Coding)
’J 、並びにIEEE トランザクション オン
コミュニケーション(IEEE Transactio
ns OnCommunications )、198
2年、2月、vol。
C0M30、NIL 2、ページ336−345に発表
のJ、 L、フラナカン(J、 L、 Flanaga
n )、J、 D、ジョンストン(J、 D、 Joh
nston )、及びJ、W。アブトン(J、 W’、
Upton )らによる論文〔マイクロプロセッサ内
へのテジタル音声格H13(Digital Voic
e Storage In a Micropro −
cessor ) )において説明されている。
のJ、 L、フラナカン(J、 L、 Flanaga
n )、J、 D、ジョンストン(J、 D、 Joh
nston )、及びJ、W。アブトン(J、 W’、
Upton )らによる論文〔マイクロプロセッサ内
へのテジタル音声格H13(Digital Voic
e Storage In a Micropro −
cessor ) )において説明されている。
音声いき値計算サブユニット32、音声統計値計算サブ
ユニット34、及び音声検出サブユニット36を含む音
声検出器30はマルチプレクサ28に出力を提供するよ
うに設計されているが、これは、伝送される出力に音声
存在指標、あるいは音声標識を挿入する。
ユニット34、及び音声検出サブユニット36を含む音
声検出器30はマルチプレクサ28に出力を提供するよ
うに設計されているが、これは、伝送される出力に音声
存在指標、あるいは音声標識を挿入する。
音声いき埴計算サブユニット32への入力は低域ハンド
符号器12からのステップサイズ情報である。音声統計
値計鏝−サフユニット34への入力は低域ハンド符号器
12及び高域ハンド符号器200両方からのサンプルス
テップサイズ情報である。いき値サブユニット32及び
統計値サブユニット340両方はこれら出力を音声検出
サブユニット3Gに与える。
符号器12からのステップサイズ情報である。音声統計
値計鏝−サフユニット34への入力は低域ハンド符号器
12及び高域ハンド符号器200両方からのサンプルス
テップサイズ情報である。いき値サブユニット32及び
統計値サブユニット340両方はこれら出力を音声検出
サブユニット3Gに与える。
第2図には統計値計算サブユニット34の詳細を示す。
音声検出は符号器12及び2゜から情報を派生し、これ
を使用して音声が存在するか否かを検出するのに使用さ
れる。正規の符号器機能の動作において、符号器12及
び20の各々は、その対応するサブバンド内の信号振幅
に基づいて、量子化器ステップサイズの個別の測定を行
なう。計算の効率上、ステップサイズのログが測定され
、ステップ−サイズテーフルへのポインタとして使用さ
れる。このログステップーサイズパラメータは任意の時
間における各ハンド内の音声パワーの推定値として使用
される。
を使用して音声が存在するか否かを検出するのに使用さ
れる。正規の符号器機能の動作において、符号器12及
び20の各々は、その対応するサブバンド内の信号振幅
に基づいて、量子化器ステップサイズの個別の測定を行
なう。計算の効率上、ステップサイズのログが測定され
、ステップ−サイズテーフルへのポインタとして使用さ
れる。このログステップーサイズパラメータは任意の時
間における各ハンド内の音声パワーの推定値として使用
される。
第2図の説明にうつり、音声サンプリング期間はτ0に
よって表わされる。低域ハンド内のステップサイズのロ
グはdL(iτ0)によって衣わされ、一方、高域ハン
ド内のステップサイズのログは時間t=jτ0における
dH(iτO)によって表わされる。T(iτO)を音
声レベルを決定するのに使用される音声検出統計値を表
わすものとする。σL及びσHをdL(iτ0)及びd
H(iτO)と関連する固定の重みを表わすものとし、
そして、βDSをOくβDS < 1であるような固定
の重みを衣わすものとする4゜すると、検出統計値T(
iτ0)は以下のように計算できる。
よって表わされる。低域ハンド内のステップサイズのロ
グはdL(iτ0)によって衣わされ、一方、高域ハン
ド内のステップサイズのログは時間t=jτ0における
dH(iτO)によって表わされる。T(iτO)を音
声レベルを決定するのに使用される音声検出統計値を表
わすものとする。σL及びσHをdL(iτ0)及びd
H(iτO)と関連する固定の重みを表わすものとし、
そして、βDSをOくβDS < 1であるような固定
の重みを衣わすものとする4゜すると、検出統計値T(
iτ0)は以下のように計算できる。
T(iτO)−βDST[(i−1)τ0〕十σLdL
(lτO)+σHd)((iτ0)・・・・(1)検出
統計値T(iτ0)は個々のサブバンドから取られた音
声情報の低域ろ波総和となる゛ 工うに平滑化される。
(lτO)+σHd)((iτ0)・・・・(1)検出
統計値T(iτ0)は個々のサブバンドから取られた音
声情報の低域ろ波総和となる゛ 工うに平滑化される。
重みβDSは情報の必要な平滑化を制御する特定の時定
数にT(iτO)を与えるように選択される。16ミリ
秒の時定数が過当でおることが知られている。
数にT(iτO)を与えるように選択される。16ミリ
秒の時定数が過当でおることが知られている。
定数σL及びσHは各々のサブバンドに与えられる相対
恵みを決定する。σHをσLの値の約1.5から25倍
の値にセットするのが特に有利であることが知られてい
る。これは高域サブバンド内の弁別を強調するが、これ
は摩擦音及び他の子音の検出に対する詳細な情報を含む
。特定のアプリケーションに対するこれら定数の値は当
業者にとって、実験室での試験によって容易に決定でき
る。
恵みを決定する。σHをσLの値の約1.5から25倍
の値にセットするのが特に有利であることが知られてい
る。これは高域サブバンド内の弁別を強調するが、これ
は摩擦音及び他の子音の検出に対する詳細な情報を含む
。特定のアプリケーションに対するこれら定数の値は当
業者にとって、実験室での試験によって容易に決定でき
る。
第3図は音声存在エネルギーいき値λON及び音声不在
エネルギーいき値λOFFを計算する方法を示す。この
方法はADPCM音声検出に使用される方法と非常に類
似しており、下側サブバンドのみからのログステップサ
イズdL(iτO)を使用する。M (iτO)は値σ
MdL(iσO)の最大であり、0Mは一定の重みであ
る。従って、0M dL (i ro)が増加すると、
M(lτO)はσMdL(iτO)が減少すると増加し
、M(iτO)はリーク係数βMに従って非常に緩やか
に減少する。M (iτ0)はその下限(MO)以下に
減少するのを抑止されるため、M(lτO)は下側サブ
バンド内の最大音声エネルギーを測定する。
エネルギーいき値λOFFを計算する方法を示す。この
方法はADPCM音声検出に使用される方法と非常に類
似しており、下側サブバンドのみからのログステップサ
イズdL(iτO)を使用する。M (iτO)は値σ
MdL(iσO)の最大であり、0Mは一定の重みであ
る。従って、0M dL (i ro)が増加すると、
M(lτO)はσMdL(iτO)が減少すると増加し
、M(iτO)はリーク係数βMに従って非常に緩やか
に減少する。M (iτ0)はその下限(MO)以下に
減少するのを抑止されるため、M(lτO)は下側サブ
バンド内の最大音声エネルギーを測定する。
変数d′は以下のように定義できる。
d’L(iτQ)−dL(iτO) +32・・・・・
(2)この32のバイアスはd’L及びMが常に正であ
ることを確保するために使用される。時間iτOにおけ
るMの値は次式によって表わすことができる。
(2)この32のバイアスはd’L及びMが常に正であ
ることを確保するために使用される。時間iτOにおけ
るMの値は次式によって表わすことができる。
M(i ro)=max (βMM(i−i ) ro
aMa’ L(lτO)、MO)・・・・・(3) このいき埴はM以下の冗距離であり、音声がOFFから
ONに変化する時期を検出するのに使用される、いき値
λONは、以下のように計算することができる。
aMa’ L(lτO)、MO)・・・・・(3) このいき埴はM以下の冗距離であり、音声がOFFから
ONに変化する時期を検出するのに使用される、いき値
λONは、以下のように計算することができる。
λ0N(iτO)−M(iτ0)−CON ・・・・
(4)音声がONからOFFに変化する時期を検出する
のに使用される、いき値λOFFは、以下によって衣わ
される。
(4)音声がONからOFFに変化する時期を検出する
のに使用される、いき値λOFFは、以下によって衣わ
される。
λOFF (iτO)−M(iτO) −COFF・・
・・ (5)CON及びCOFFの値はCOFF >
CON である定数である。
・・ (5)CON及びCOFFの値はCOFF >
CON である定数である。
第4図はいかにして比較が行なわれるかを示す。音声サ
ンプルはある適当な長さのブロックに分割される。(こ
の場合、ブロック当たり24のサンプルが使用される。
ンプルはある適当な長さのブロックに分割される。(こ
の場合、ブロック当たり24のサンプルが使用される。
)ブロック当たり1度、音声がONであるかOFFであ
るかの判定が行なわれる。前のブロックで、音声がON
であったときは、ONのいき値が使用され、OFFであ
ったときは、OFFのいき値が使用される。第4図のス
イッチは、−正しいいき値を選択するが、これが検出統
計値と比較される。音声標識が検出統計値がいき値より
上か下かによってONあるいはOFFにセットされる。
るかの判定が行なわれる。前のブロックで、音声がON
であったときは、ONのいき値が使用され、OFFであ
ったときは、OFFのいき値が使用される。第4図のス
イッチは、−正しいいき値を選択するが、これが検出統
計値と比較される。音声標識が検出統計値がいき値より
上か下かによってONあるいはOFFにセットされる。
τDSを1ブロツクと関連する時間間隔を表わすものと
する。(この場合、τDS=24τOとなる)。Sが2
つの可能な値の音声状態を表わすものとすると、Sは以
下のように表わされる。
する。(この場合、τDS=24τOとなる)。Sが2
つの可能な値の音声状態を表わすものとすると、Sは以
下のように表わされる。
時間t=iτDSの時の音声状態S(iτDS)は以下
のように音声状態S[:(i−1)τDs〕に依存する
。5C(i−1)τDS、)=1の場合は、以下のよう
に表わされる。
のように音声状態S[:(i−1)τDs〕に依存する
。5C(i−1)τDS、)=1の場合は、以下のよう
に表わされる。
・・・・(7)
sc(i−1)rDsl]=1の場合は、以下のように
表わされる。
表わされる。
・・・(8)
システム10はサブバンド符号化の分野に通常の知識を
持つ者であれは、2個あるいはその以上のデジタル信号
プロセッサ マイクロコンピュータを適当に構成するこ
とによって実現することができる。このようなマイクロ
コンピュータは現在使用されており、単一のVLS I
回路内にメモリ装置、演算装置、制御装置、入/出力装
置、及びマシーン言語記憶装置を含む。別の方法として
、これら機能は相互接続された数個の異なるVLSI回
路の組合せによって提供することもできる。
持つ者であれは、2個あるいはその以上のデジタル信号
プロセッサ マイクロコンピュータを適当に構成するこ
とによって実現することができる。このようなマイクロ
コンピュータは現在使用されており、単一のVLS I
回路内にメモリ装置、演算装置、制御装置、入/出力装
置、及びマシーン言語記憶装置を含む。別の方法として
、これら機能は相互接続された数個の異なるVLSI回
路の組合せによって提供することもできる。
システム10を実現するのに適当な1つのマイクロコン
ピュータとして、合衆国、ニューヨーク州の会社である
エイティ アント ティ テクノロジー社(AT&T
Technologies 。
ピュータとして、合衆国、ニューヨーク州の会社である
エイティ アント ティ テクノロジー社(AT&T
Technologies 。
Inc )によって製造され、例えば、前述のヘルシス
テム テクニカル ジャーナル(BellSystem
Technical Journal )に説明のD
SP(デジタル信号プロセッサ)を挙げることができる
。
テム テクニカル ジャーナル(BellSystem
Technical Journal )に説明のD
SP(デジタル信号プロセッサ)を挙げることができる
。
2個のDSPによって実現されるシステムの一例におい
ては、1つのDSPが音声の符号化及び伝送に使用され
、もう1つのDSPが音声の受信及び復号に使用される
。外部論理が個々のDSPのPCM(パルス符号変調)
ビット流を音声の入力及び出力のためにアナログ−デジ
タル変換器及びデジタル−アナログ変換器の両方にイン
タフェースするのに使用される。DSPマイクロコンピ
ュータは音声信号の音声存在不在の検出を遂行し、不在
期間がユーザ供給データを伝送するのに使用゛できるよ
うにする。
ては、1つのDSPが音声の符号化及び伝送に使用され
、もう1つのDSPが音声の受信及び復号に使用される
。外部論理が個々のDSPのPCM(パルス符号変調)
ビット流を音声の入力及び出力のためにアナログ−デジ
タル変換器及びデジタル−アナログ変換器の両方にイン
タフェースするのに使用される。DSPマイクロコンピ
ュータは音声信号の音声存在不在の検出を遂行し、不在
期間がユーザ供給データを伝送するのに使用゛できるよ
うにする。
DSPマイクロコンピュータは2ミリ秒ごとに音声状態
を−べる。送信DSPは外部回路に対し音声状態の状態
を提供し、伝送のための112ビツト フレームを生成
する。このフレームは3ビツトのフレーム指示パターン
、1ビツトの音声標識、及びサブバンド符号化音声の2
4サンプルから成る。この音声は12 Khzの速度の
所でサンプルされ、低域ハンド内の5ヒツト精度及び高
域ハンド内の4ビット精度にて符号化される。DSPが
音声標識がONであることを示すと、外部回線インタフ
ェース回路はDSP生成フレームを無変換のま捷で送信
する。音声標識がOFFのときは、音声の24のサンプ
ルがユーザ供紹データの108ビツトにて交換される。
を−べる。送信DSPは外部回路に対し音声状態の状態
を提供し、伝送のための112ビツト フレームを生成
する。このフレームは3ビツトのフレーム指示パターン
、1ビツトの音声標識、及びサブバンド符号化音声の2
4サンプルから成る。この音声は12 Khzの速度の
所でサンプルされ、低域ハンド内の5ヒツト精度及び高
域ハンド内の4ビット精度にて符号化される。DSPが
音声標識がONであることを示すと、外部回線インタフ
ェース回路はDSP生成フレームを無変換のま捷で送信
する。音声標識がOFFのときは、音声の24のサンプ
ルがユーザ供紹データの108ビツトにて交換される。
構築の後、フレームが56 Kbps (キロビット/
秒)デジタル チャネルを通じて復号するために別の端
末に送られる。
秒)デジタル チャネルを通じて復号するために別の端
末に送られる。
受信機内においては、DSPファームウェアと外部回線
インタフェース回路との組合せによって単一フレーム指
示アルゴリスムが実現される。フレーム指示アルゴリス
ムは3ビツト フレーム指示パターンの方位を検出する
ために入り56 Kbps信号を検索する。受信DSP
が自体をフレーム指示パターンと同期させると、これは
音声状態標識を読出す。音声状態標識が存在する場合は
、DSPはりスニングのために入り音声信号の復号を開
始するが、標識が不在の場合は、DSPは外部回路にテ
ークを除去し、これをユーザ インタフェースに送信す
るよう指令する。このパターンは、正当フレーム指示パ
ターンが検出される限り、毎2ミリ秒毎に反復される。
インタフェース回路との組合せによって単一フレーム指
示アルゴリスムが実現される。フレーム指示アルゴリス
ムは3ビツト フレーム指示パターンの方位を検出する
ために入り56 Kbps信号を検索する。受信DSP
が自体をフレーム指示パターンと同期させると、これは
音声状態標識を読出す。音声状態標識が存在する場合は
、DSPはりスニングのために入り音声信号の復号を開
始するが、標識が不在の場合は、DSPは外部回路にテ
ークを除去し、これをユーザ インタフェースに送信す
るよう指令する。このパターンは、正当フレーム指示パ
ターンが検出される限り、毎2ミリ秒毎に反復される。
上述の直角位相は音声検出器によって必要とされる量を
決定する一般概念を記述する。
決定する一般概念を記述する。
有限ヒツト長であること、及びDSP内のタイミングの
問題から、これら直角位相の幾つかは、好捷しくは、多
少の修正を行なう。例えば、システム10は、24−サ
ンプル フレームに基づくため、24サンプルごとく音
声が存在するか否かの判定が行なわれる。この音声検出
統計値はこのフレームワーク内でDSPによって以下の
ように計算される。
問題から、これら直角位相の幾つかは、好捷しくは、多
少の修正を行なう。例えば、システム10は、24−サ
ンプル フレームに基づくため、24サンプルごとく音
声が存在するか否かの判定が行なわれる。この音声検出
統計値はこのフレームワーク内でDSPによって以下の
ように計算される。
T(iτ1)S)−βD8’r[(+−1)τDS”+
σHd’H[jτo+(i−1)τDS)、j=1.2
’=・・・・ (9) このためT(iτDS)は各サンプル期間毎にこれにσ
Ld’L+σHd’を加えることによって更新され、こ
れは24サンプルのフロック当た1171iリークされ
る。最大レベルMの値もDSPの正確な結果が得られる
ように少し異って計算される。τMAX f Mがリー
クされる2つの連続ポイント間の時間間隔を表わすもの
とすると、経験的上から、τMAX−8秒が適当である
ことが知られている。DSP内に実現可−能なMに関す
る式は以下のように表わすことができる。
σHd’H[jτo+(i−1)τDS)、j=1.2
’=・・・・ (9) このためT(iτDS)は各サンプル期間毎にこれにσ
Ld’L+σHd’を加えることによって更新され、こ
れは24サンプルのフロック当た1171iリークされ
る。最大レベルMの値もDSPの正確な結果が得られる
ように少し異って計算される。τMAX f Mがリー
クされる2つの連続ポイント間の時間間隔を表わすもの
とすると、経験的上から、τMAX−8秒が適当である
ことが知られている。DSP内に実現可−能なMに関す
る式は以下のように表わすことができる。
1°“°4・MAX ’”O″′0・”−1・2パ°°
゛゛いき値は24サンプルに一度計算することが必要で
あるのみで、これらは音声が存在するか否かを検出する
のに使用することができる。
゛゛いき値は24サンプルに一度計算することが必要で
あるのみで、これらは音声が存在するか否かを検出する
のに使用することができる。
λ0FF(’τD3)=M(ifDS)C□FF音声状
態はセクション11.2に説明と同様の方法にて式(6
−8)によって決定される。
態はセクション11.2に説明と同様の方法にて式(6
−8)によって決定される。
本発明は2ハンド サブバンド符号化に限定されるもの
でない。検出統計IDIT(iτO)及び最大レベルM
’(iτO)はより多くの数のサブバンドからの情報を
含むが、これは上述の式(1) −(11)と類似の公
式を使用する。5バンド−サブバンド符号の沈黙期間検
出がとの例である。j−1、・・・・5に対するdj(
1τO)を5ハンドの各々に対するログ ステップ サ
イズ値を表わすものとし、σJ1J−1、・・・・・・
5を固定の重みを表わすものとし、そしてβDS を
1より少し小さなリーク係数を表わすものとする。式(
1)と類比して、音声検出統計値を記述する一般式は以
下のように表わすことができる。
でない。検出統計IDIT(iτO)及び最大レベルM
’(iτO)はより多くの数のサブバンドからの情報を
含むが、これは上述の式(1) −(11)と類似の公
式を使用する。5バンド−サブバンド符号の沈黙期間検
出がとの例である。j−1、・・・・5に対するdj(
1τO)を5ハンドの各々に対するログ ステップ サ
イズ値を表わすものとし、σJ1J−1、・・・・・・
5を固定の重みを表わすものとし、そしてβDS を
1より少し小さなリーク係数を表わすものとする。式(
1)と類比して、音声検出統計値を記述する一般式は以
下のように表わすことができる。
μ、J=1% ・・・・・・5を固定の重み、βMを1
より少し小さな固定リーク係数とすると、最大レベルに
対する一般式は以下のように衣わすことができる。
より少し小さな固定リーク係数とすると、最大レベルに
対する一般式は以下のように衣わすことができる。
・・・・ (13)
幾つかの重み係数σJ あるいはμはゼロであり得る。
式(9)、−(11)と同様、式(12) −(13)
は特定のハードウェア構成、例えば、DSPマイクロプ
ロセッサを使用する構成にあうように多少の修正を行な
°うことができる。式(12) 7 (13) 内の
パラメータの特定の値を選択することも必要である。上
側周波数ハンドにより大きな重みを与える検出統計値、
σ1−σ2、及びσ3−σ4−2σ1の計算には、ハン
ド5は使用されず、従って、σ5−0で−ある。最大レ
ベルの計算では、μm−μ2、及びμ3−μ4−μ5−
0 である。この最大レベルは低域周波数バンド内のエ
ネルギーに依存し、平滑長期平均を与える。
は特定のハードウェア構成、例えば、DSPマイクロプ
ロセッサを使用する構成にあうように多少の修正を行な
°うことができる。式(12) 7 (13) 内の
パラメータの特定の値を選択することも必要である。上
側周波数ハンドにより大きな重みを与える検出統計値、
σ1−σ2、及びσ3−σ4−2σ1の計算には、ハン
ド5は使用されず、従って、σ5−0で−ある。最大レ
ベルの計算では、μm−μ2、及びμ3−μ4−μ5−
0 である。この最大レベルは低域周波数バンド内のエ
ネルギーに依存し、平滑長期平均を与える。
理論上、式(12)及び(13)は任意の数のハンドに
拡張できる。しかし、ハンドの数が増大すると、検出統
計値及び最大レヘルの計算と関連する時間遅延も増大す
る。従って、ネジステム内に使用できるハンド数には実
現上の限界がある。
拡張できる。しかし、ハンドの数が増大すると、検出統
計値及び最大レヘルの計算と関連する時間遅延も増大す
る。従って、ネジステム内に使用できるハンド数には実
現上の限界がある。
第1図は本発明の一例に従って音声の検出を行なうため
の2ハンド サブバンド符号器の機能上のフロック回路
図を示す。 第2図は第1図の装置の音声統計値計算サブユニットを
より詳細に示す機能流れ図を示す。 第3図は第1図の装置のいき値計算すブユニットをより
詳細に示す機能流れ図を示す。 第4図は第1図の装置の音声検出サブユニットをより詳
細に示す機能流れ図を示す。 〈主要部分の符号の説明〉 サブバンド符号器 ・・・・・・ 10高バンド符号器
具路・・・−・・・ 20音声検出器 ・・・・
・ 30 FT、”;、 +
の2ハンド サブバンド符号器の機能上のフロック回路
図を示す。 第2図は第1図の装置の音声統計値計算サブユニットを
より詳細に示す機能流れ図を示す。 第3図は第1図の装置のいき値計算すブユニットをより
詳細に示す機能流れ図を示す。 第4図は第1図の装置の音声検出サブユニットをより詳
細に示す機能流れ図を示す。 〈主要部分の符号の説明〉 サブバンド符号器 ・・・・・・ 10高バンド符号器
具路・・・−・・・ 20音声検出器 ・・・・
・ 30 FT、”;、 +
Claims (1)
- 【特許請求の範囲】 1、信号符号化装置において、 個々のサブバンドの信号サンプルに対する 電圧ステップサイズ値を生成するための装置を含む信号
の複数の周波数サブバンド部を符号化するための装置; 一つの周波数サブバンドに対する電圧ステ ップサイズ値及びもう一つの周波数サブバンドに対する
電圧ステップサイズ値に基づいて音声統計値を計算する
ための装置;及び 音声統計値に対して音声存在エネルギーい き値及び音声不在エネルギーいき値を比較して音声存在
出力信号を選択的に生成するための装置を含むことを特
徴とする信号符号化装置。 2、特許請求の範囲第1項に記載の装置において、該音
声統計値計算装置が、 各々のサブバンドのステップサイズ値に対 応する音声検出係数を掛けることによつて対応する音声
検出値の積を生成するための装置;該音声検出値の積を
総和することによつて 音声検出値の総和を生成するための装置、及び 音声検出値の総和を平滑化するための装置 を含むことを特徴とする装置。 3、特許請求の範囲第2項に記載の装置において、 該平滑化装置が個々の音声検出値総和に遅 延値を加算して音声検出統計出力値を生成するための装
置を含み、該遅延値が検出定数と前の検出統計出力値と
の積であることを特徴とする装置。 4、特許請求の範囲第3項に記載の装置において、 サブバンドの1つに対する電圧ステップサ イズ値に基づいて音声エネルギーいき値及び音声不在い
き値を計算するための装置が含まれることを特徴とする
装置。 5、特許請求の範囲第4項に記載の装置において、該音
声統計値計算装置が、 最大エネルギーレベル値から音声存在いき 値及び音声不在値を生成するための装置を含み、該最大
エネルギーレベル値が第1及び第2のエネルギーレベル
の最大を選択することによつて生成され、該第1のエネ
ルギーレベルが低周波数サブバンドのステップサイズ値
の積であり、該第2のエネルギーレベルが前のサンプル
の最大エネルギーレベル値に係数を掛けた値か下限のい
ずれか大きな方であることを特徴とする装置。 6、特許請求の範囲第5項に記載の装置において、 制御信号に応答して該生成装置からの該音 声いき値か該音声不在値のいずれかを比較器の1つの入
力に接続し、該比較器の他の入力は該音声検出統計値を
受信するように接続するためのスイッチ装置、及び 該比較器の該出力と該スイッチの間に接続 され該制御信号を生成するための1サンプル遅延装置を
含む帰還装置を含むことを特徴とする装置。 7、信号内の音声内容の存在を検出するための方法にお
いて、 該サブバンドの少なくとも2つのステップ サイズ値情報から短期音声統計値を計算し、そして 該音声統計値を長期音声エネルギーいき値 と比較して選択的に音声存在指標信号を生成するステッ
プからなることを特徴とする方法。 8、特許請求の範囲第7項に記載の方法において、さら
に サブバンドの少なくとも1つのステップサ イズ情報から長期音声エネルギーいき値を計算するステ
ップが含まれることを特徴とする方法。 9、特許請求の範囲第8項に記載の方法において、 短期音声統計値を計算するとき上側周波数 サブバンドに対して下側周波数サブバンドにより大きな
重みを与えることを特徴とする方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US62858384A | 1984-07-06 | 1984-07-06 | |
| US628583 | 2003-07-29 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS6132900A true JPS6132900A (ja) | 1986-02-15 |
Family
ID=24519496
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP14687785A Pending JPS6132900A (ja) | 1984-07-06 | 1985-07-05 | 信号符号化装置とその方法 |
Country Status (2)
| Country | Link |
|---|---|
| EP (1) | EP0167364A1 (ja) |
| JP (1) | JPS6132900A (ja) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2631147B1 (fr) * | 1988-05-04 | 1991-02-08 | Thomson Csf | Procede et dispositif de detection de signaux vocaux |
| FI90934C (fi) * | 1992-04-13 | 1994-04-11 | Salon Televisiotehdas Oy | Menetelmä digitaalisen informaation sisällyttämiseksi audiosignaaliin ennen sen kanavakoodausta |
| US5579431A (en) * | 1992-10-05 | 1996-11-26 | Panasonic Technologies, Inc. | Speech detection in presence of noise by determining variance over time of frequency band limited energy |
| US5826230A (en) * | 1994-07-18 | 1998-10-20 | Matsushita Electric Industrial Co., Ltd. | Speech detection device |
| US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
| US6182035B1 (en) * | 1998-03-26 | 2001-01-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for detecting voice activity |
| FI118359B (fi) * | 1999-01-18 | 2007-10-15 | Nokia Corp | Menetelmä puheentunnistuksessa ja puheentunnistuslaite ja langaton viestin |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2451680A1 (fr) * | 1979-03-12 | 1980-10-10 | Soumagne Joel | Discriminateur parole/silence pour interpolation de la parole |
| JPS5852695A (ja) * | 1981-09-25 | 1983-03-28 | 日産自動車株式会社 | 車両用音声検出装置 |
| DE3243231A1 (de) * | 1982-11-23 | 1984-05-24 | Philips Kommunikations Industrie AG, 8500 Nürnberg | Verfahren zur erkennung von sprachpausen |
-
1985
- 1985-06-28 EP EP85304627A patent/EP0167364A1/en not_active Withdrawn
- 1985-07-05 JP JP14687785A patent/JPS6132900A/ja active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| EP0167364A1 (en) | 1986-01-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CA1139884A (en) | Half duplex integral vocoder modem system | |
| EP0145332B1 (en) | Digital audio transmission | |
| Yatsuzuka | Highly sensitive speech detector and high-speed voiceband data discriminator in DSI-ADPCM systems | |
| ITMI942079A1 (it) | Ricevitore a larghezza di banda adattativa | |
| KR20040004421A (ko) | 가변율 보코더의 인코딩 속도를 선택하기 위한 방법 및 장치 | |
| NO146521B (no) | Fremgangsmaate og innretning for detektering av naervaer eller fravaer av et talesignal paa en talekanal | |
| JPS61273017A (ja) | 適応予測器 | |
| GB1602499A (en) | Digital communication system and method | |
| JPH03181232A (ja) | 可変レート符号化方式 | |
| CA2173399A1 (en) | Mobile communication equipment | |
| JP3992545B2 (ja) | 信号の音声活動を検知する方法と、この方法の実施装置を含む音声信号コーダ | |
| JP2654320B2 (ja) | 非線形符号化装置およびその方法、非線形復号装置およびその方法、および非線形チャネルによるデータ伝送方法 | |
| RU2249860C2 (ru) | Способ и система для устранения насыщения квантователя при связи с передачей данных в полосе речевого сигнала (дпрс) | |
| EP0701352A2 (en) | Automatic adaptatioof prewarping for transmission over a non-linear channel | |
| JPS6132900A (ja) | 信号符号化装置とその方法 | |
| US7933216B2 (en) | Method and apparatus for coding modem signals for transmission over voice networks | |
| CN1042185C (zh) | 检测信号处理器中噪涌的方法和装置 | |
| CA2309525C (en) | Method of detecting silence in a packetized voice stream | |
| EP0486232A2 (en) | ADPCM decoder with error detection | |
| US4912765A (en) | Voice band data rate detector | |
| JP3004664B2 (ja) | 可変レート符号化方法 | |
| JPH0242258B2 (ja) | ||
| JPH0748696B2 (ja) | 音声符号化方式 | |
| JPH0431449B2 (ja) | ||
| WO2003065693A2 (en) | Analog voice activity detector for telephone |