JP3779320B2 - 信号を群符号化するための方法および装置 - Google Patents

信号を群符号化するための方法および装置 Download PDF

Info

Publication number
JP3779320B2
JP3779320B2 JP52178295A JP52178295A JP3779320B2 JP 3779320 B2 JP3779320 B2 JP 3779320B2 JP 52178295 A JP52178295 A JP 52178295A JP 52178295 A JP52178295 A JP 52178295A JP 3779320 B2 JP3779320 B2 JP 3779320B2
Authority
JP
Japan
Prior art keywords
encoders
rate
encoder
signal
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP52178295A
Other languages
English (en)
Other versions
JPH08509348A (ja
Inventor
スチュワート,ケネス・エー
コッジン,ミカエル・ディー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of JPH08509348A publication Critical patent/JPH08509348A/ja
Application granted granted Critical
Publication of JP3779320B2 publication Critical patent/JP3779320B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/20Arrangements for detecting or preventing errors in the information received using signal quality detector
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0014Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the source coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

発明の分野
本発明は、コード分割多重アクセス(CDMA)技術を利用する通信システムに関し、更に特定すれば、かかる通信システムにおいて、システムの自己干渉(self-interference)の低減、およびコロケーテッド・デジタル音声符号化(colocated digital speech encoding)とのポイント−マルチポイント多重アクセス・リンクにおけるシステム容量の増大を図る、可変レート音声符号化方法に関するものである。
発明の背景
近年、種々の技法を用いて、限られた利用可能な無線周波数スペクトル以内でのマルチ−ユーザ移動通信が提供されている。これらの方法には、周波数分割多重アクセス(FDMA)、時分割多重アクセス(TDMA)、およびコード分割多重アクセス(CDMA)、あるいは、より一般的には、これらの方法の混成が含まれている。これらの方法は全て、過去10年間に商用セルラ遠隔通信システムの設計に採用されたものである。即ち、North American AMPS systemにおけるFDMAの使用、European Groupe Speciale Mobile(GSM)標準におけるFD/TDMA、およびより最近になってIS−95標準において具現化されているように、United States Telecommunications Industry Associationによる直接シーケンスFD/CDMA法の採用(adoption)に見ることができる。IS−95標準では、加入者はセルラ帯域内の数個の広帯域無線チャンネルの1つを共用する。いわゆる個人通信システム(PCS:personal communication systems)に対する提案にも、同様なFD/CDMAの原理に基づいて設計されたものがいくつかある。
近年のセルラおよびPCSシステムは殆ど全て、デジタル音声コーティングおよびフォーワード・チャンネル・エラー訂正を、音声通信の物理層として用いている。この中でより興味深いのは、音声アクティヴィティ検出(VAD:voice activity detection)を用いて、いずれかの発呼側の部分における音声の存在または不存在を認識することである。音声がない場合、音声エンコーダはそれが連結されている変調器または送信機に、その出力電力をゼロに低下させるか、あるいはいずれかのユーザ地点における背景ノイズのみを記述する情報パケットを時折送信するように指令する。このようにして無線送信機のデューティ・サイクルを減少させることによって、電力消費の低減(移動機の場合には電池の寿命が延びる)、および同一RFスペクトルを共用するユーザ間の干渉の減少という二重の利点を得ることができる。会話の状況にしたがって、40%ないし65%の送信電力の低減を達成することができる。電力低減量の限界は、最終的には、重要なVAD技法を伴う音質の低下が、どの程度まで受け入れ可能と見なされるかによって決められる。
電力低減の可能性は、CDMAシステムでは特に重要である。かかるシステムでは、ユーザ容量は、システムの自己干渉量に反比例する。TIA IS−95FD/CDMA行順では、単純なオン−オフまたは不連続送信方法の代わりに可変レート音声エンコーダを用いることによって、その手法はいくらか広くなっている。IS−95標準では、符号化音声は20ms間隔に分離され、音声エンコーダは、8000bps、4000bps、2000bpsまたは800bpsの有効ビット・レートを選択して、それをエンコードする。基地局から移動局(フォーワード)および移動局から基地局(逆)のIS−95リンクは、双方とも可変レート符号化を利用している。フォーワード・リンクの場合、平均送信電力は、符号化レートの減少に伴って出力電力を低下(scaling down)させることによって低減される。チャンネル・シンボルを繰り返すことによって、移動受信機においてシンボルの結合が可能となり、シンボル当たりのエネルギを、リンク性能を決定するノイズ電力スペクトル密度比に維持することができる。平均送信電力、即ちシステムの自己干渉は、800bpsでの送信の間では、1/4に減少されることを指摘すべきであろう。典型的な双方向会話のための集合音声アクティヴィティ(aggregate voice activity)を平均化することによって、標準音声符号化およびTIA標準IS−96に規定されている音声アクティヴィティ検出アルゴリズムを用いて、平均送信電力がいつその通常値の約41%に低下するかを予測していた。これは、システムのフォーワード・リンク容量に大きな効果がある。
しかしながら、IS−95エア・インターフェース標準およびそれに関連するI96音声エンコーダ標準の現在における実施形態では、各フォーワード音声リンクは分離して(in isolation)符号化される。即ち、音声エンコーダは、同一RFスペクトルを共用する他の音声チャンネルには関係なく、受け入れ可能な音質を維持するために必要な最少符号化レートを別個に判断する。このために、各音声エンコーダ内のレート判断アルゴリズムは、同一スペクトルを共用する他の音声エンコーダのエンコード・レートが必要としなくても、常にそのエンコード・レートを最少化しなければならない。例えば、ある基地局において同一チャンネルを共用する全ての音声エンコーダが同時に低いレートで送信しようとした場合、当該基地局における全出力電力は低下するので、各音声エンコーダが次に高いレートに緩和しても、システム容量には負担をかけないことを意味する。可変レート音声エンコーダの平均送信レートを最小化するには音質で妥協する必要があるので、別個に音声符号化を行うと、不必要に音質を犠牲にする(give up)することになる。また、CDMAシステムは容量を対象とし(approach)、各音声エンコーダの送信レートに制約を設けて一時的に容量を高めようとするため、かかる制約は無差別に適用されなければならず、音質への影響を考慮せずに、全ての音声リンクが同じ制約を受けることになる。音質は多くの異なる要因に左右されるものであるということは公知であり、セクタ/セル内に生じる音質に対する全体的影響を最少に抑えながら、特定のエンコーダのレートを低下させる機会が存在するのであるから、これは無駄である。
したがって、同一セクタ/セルおよびRFチャンネルを供給する他の全ての音声エンコーダと調和するように、個々の音声エンコーダについてレート選択を決定し、FD/CDMAシステムのフォーワード・リンク上での全体的な音声符号化を行う方法および装置が必要とされている。
【図面の簡単な説明】
第1図は、従来技術のCDMA基地局送信機を、ブロック図形状で全体的に示す。
第2図は、音声符号化標準TIA IS−96において指定されている従来技術のレート決定装置を、ブロック図形状で全体的に示す。
第3図は、好適実施例において利用され音声符号化標準TIA IS−96に記載されている形式の、コードブック励起線形予測音声エンコーダ(codebook excited linear predictive speech encoder)を、ブロック図形状で全体的に示す。
第4図は、本発明による群音声符号化を行うための監視プロセッサ即ちレート制御器の用法を、ブロック図形状で概略的に示す。
第5図は、セクタ/セルからの送信電力に対する制約を受けるセクタ/セルの全体の音質を最適化する、本発明による多数のアルゴリズムの一部として、レート制御器によって利用される、レート/音質表を概略的に示す。
第6図は、本発明によるCDMA群符号化方法を実施するための装置を、ブロック図形状で全体的に示す。
第7図は、本発明による群符号化を有利に実施するレート制御器を、ブロック図形状で概略的に示す。
好適実施例の詳細な説明
コード分割多重アクセス(CDMA)通信システムは、他の通信エンコーダとの調和するように、個々の音声エンコーダのレート選択を決定することによって、自己干渉を低減し、システム容量を増大させる。システムは、知覚的に加重されたエラー・メトリック(error metric)(401)を、レート制御器(404)への入力として利用し、レート制御器(404)は選択したレート(402)を逆にエンコーダ(105)に供給する。システムは、必要に応じて特定のエンコーダのレートを低下させて容量を改善する一方、他のエンコーダにはそれらのレートを保持させるることによって、最適な音声品質およびシステム容量を提供する。これによって、システム容量を一時的に増大させる必要があるときに、音声品質を不必要に低下させるのを防止する。
本発明の好適実施例を、Telecommunications Industry Association標準IS−95およびIS−96に基づくCDMAデジタル・セルラ通信システムに関連するものとして説明する。本発明は、可変レート音声符号化による自己干渉低下を適用すべき、いかなるCDMAポイント−マルチポイント・リンク(通常、デジタル・セルラ・システムのフォーワード・リンク)にも適用できることは、当業者には認められよう。しかしながら、ここで論じられる技法は、いかなる通信システムにも有利に利用でき、事実上通信システムには制約されない。例えば、メモリ空間が限られているメモリ手段に記憶するために音声符号化を行う場合にも、本技法を利用できる。本質的に、本技法は、符号化(音声、映像、データなど)が利用され、当該符号化に関連する制約(電力レベル、符号化の品質、システム容量、メモリ空間等)が存在するようなあらゆる用途に適用可能である。
本方法および装置は、少なくとも2つのエンコーダからのレート決定情報を受け入れ、これら少なくとも2つのエンコーダのレート決定情報に基づいて、少なくとも1つのエンコーダのレートを決定することにより、信号を群符号化(group encoded)する。好適実施例では、レート決定情報は、符号化レート(20msセグメント毎の)の関数としての、再生品質に関連する品質情報である。品質情報には、分析/合成音声エンコーダ(analysis-by-synthesis speech encoders)によって発生される知覚加重エラー・メトリクス(perceptual weighting error metrics)、信号対ノイズ(S/N)比、区分S/N(segumented S/N)、ケプストラム距離(cepstral distance)、LPC距離測定、BARKスペクトル距離測定が含まれるが、これらに限定される訳ではない。これらは全て当技術では公知である。
少なくとも1つのエンコーダのレートの決定は、スレシホールド基準(通常予め決められている)に基づいて行われる。好適実施例では、スレシホールド基準には、エンコーダが割り当てられるセクタ/セルの全出力電力、隣接するセクタ/セルの全出力電力、稼働中の基地局(serving base-station)による送信の現出力レベル、少なくとも2つのエンコーダの現データ・レート、メモリ手段内で使用可能なメモリ、処理手段において使用可能な処理力(processing power)、および所定のスペクトルにおいて使用可能な帯域が含まれるが、これらに限定される訳ではない。また、好適実施例では、エンコーダは、可変レート分析/合成エンコーダである。これらのエンコーダは、音声信号、映像信号およびデータ信号を含む信号をエンコードすることができる。また、信号もこれらに限定される訳ではない。
第1図は、TIA IS−95デジタル・セルラ無線機の標準の好適実施例のために設計された、CDMA基地局(102)のフォーワード・リンクの高レベル・アーキテクチャを示す。第1図の基地局(102)は、特に、可変レート音声符号化、フォーワード・エラー訂正、フォーワード・リンク電力制御、多重アクセス拡散、ならびに変調および送信を行う。第1図において、公衆電話交換網(PSTN)(100)からの、数個の標準μ−低符号化されかつ多重化された(standard μ -law encoded, multiplexed)、64kbpsパルス・コード変調された(PCM)T1リンク(101)が、デマルチプレクサに搬送される。各64kbps音声リンク(104)は、次に、デジタル音声エンコーダ(105)を通される。従来の実施形態では、音声符号化機能は、Motorola DSP56156プロセッサ、ROMコード化DSP(ROM coded DSP)、または特定用途集積回路(ASIC)のような、多数の汎用デジタル信号プロセッサ(DSP)によって行われる。かかるプロセッサのいくつかは、単一のプリント基板上に纏められ(本発明には必要でないが)、多重化音声チャンネルの全T1トランク(T1 trunk)を処理することができる。音声符号化の後、エラー訂正(106)を従来の畳み込みおよび巡回コードの形で適用し、その後BPSKベースバンド変調(107)、ウオルシュ・カバーおよび短縮疑似ノイズ(PN)シーケンス拡散(Walsh cover and short pserudo-noise sequence spreading)(108)、ローパス・フィルタ処理(109)、送信電力レベル調節(110)および電力増幅(111)、ならびに移動局(113)への最終送信が続く(簡略化のために、RFへの周波数シフトは示されていない)。
音声エンコーダ(105)を実施するために用いられるDSPまたはその他の素子によって行われる、TIA IS−96標準処理のブロック図を第2図に示す。図示のように、音声エンコーダ(105)は、2つの主要要素、レート決定および符号化に分割することができる。最初にレート決定機能について考える。IS−96標準では、各音声エンコーダ(105)は、それに関連するPCM信号ストリームを、ソース音声波形の160サンプルからなる、連続する20msのフレームに分割する。各フレーム(これは、自己相関予測器(200)によって生成されるフレームの自己相関関数予測のゼロ次遅れR(0)である)の電力レベルは、比較器(203)の集合体に供給され、3つの単調増加スレシホールド・レベルのどれを、フレームの電力が超過しているかを確定する。
これらのレベルは、ブロック(201)によって形成される音声信号の電力レベルの非線形平均の二次補間によって発生される。これらの処理段階は完全にTIA標準IS−96に規定されることを指摘しておく。現フレーム・エネルギが3つのスレシホールドの最低よりも低い場合、このフレームを1/8レート・フレームと宣言(declare)する。フレーム・エネルギが最低と中間のスレシホールドとの間にある場合、このフレームを1/4レート・フレームと宣言する。中間と最高スレシホールドとの間にある場合、これを1/2レート・フレームと宣言する。最後に、フレーム・エネルギが最高スレシホールド・レベルを超過する場合、このフレームを最大レート・フレームと宣言する。この最後の段階は、比較器(203)とデコーダ(204)とによって行われ、選択レート(205)が生成される。
次に、選択レート(205)をコードブック励起線形予測(CELP)音声符号化機能(206)に入力し、そのレートに対する特定数のビットを用いて、音声フレームのパラメータ記述(parameteric description)を形成する。好適実施例では、1/8レート・フレームの符号化パラメータを表現するために用いられるビット数は16(エラー訂正/検出に用いられる付加ビットは無視する)であり、1/4レート・フレームでは40ビット、1/2レート・フレームでは72ビット、そして最大レート・フレームでは160ビットである。好適実施例ではCELPについて図示しかつ論じているが、他の符号化技法、特に、波形コーディング、線形予測コーディング(LPC)、サブバンド・コーディング(SBC)、コード励起線形予測(CELP:code excided linear prediction)、確率的励起線形予測(SELP:stochastically excited linear prediction)、ベクトル加算励起線形予測(VSELP:vector sum excited linear prediction)、改良マルチバンド励起(IMBE:improved multi-band excitation)、および適応予測符号化変調(ADPCM:adaptive differential pulse code modulation)コーディング・アルゴリズムも、同様に有利に用いることができる。
明確化のために、CELP音声符号化手順について詳細に説明する必要がある。好適実施例のCELP音声エンコーダに用いられる信号処理の高レベル・ブロック図を第3図に示す。第3図に示すように、まず、64kbps音声信号(104)の連続20msフレームの相関関数の予測(309)が、得られる(これは、通常、レート決定手順のブロック(200)と共通に行われる)。次に、例えば、シュール反復(Schur Recursion)(301)を用いたいわゆる通常方程式(Normal Equation)の解が、短期線形予測(STP:short term linear predictive)フィルタ係数(310)を発生する。多くの場合、STPフィルタ(303)は格子フィルタであり、STP係数は格子フィルタ反射係数(lattice filter reflection coefficient)である。ライン・スペクトル・ペアリング(line spectral pairing)またはその他の安定した量子化方法による量子化(302)の後、STP係数を用いて音声信号を濾波する。得られた信号を次に、長期予測(LTP:long term prediction)フィルタ(313)および(CELP線形予測コーダの場合)コードブック検索手順に渡す。LTPフィルタは通常一次繰り返しフィルタであり、そのフィードバック遅れおよび利得は可変である。これらは、第3図にLTP遅れL(304)およびLTP利得G(305)として示されている。次に、符号化を進めて、LTP遅れおよび利得ならびにコードブック・インデックスI(312)を同時に調節し、LTPフィルタの出力における二乗誤差を最少にする。次に、L、G、およびIを量子化し(多くの場合単純なバイアス線形量子化方法(biased linear quantizers method)を用いる)、STP係数と共にエラー訂正ブロックに渡す。この分析/合成手順の性能は、最少にすべきエラー・メトリックに人の可聴周波数応答(human auditory frequency response)による重み付けを行うことによって、改善することができる。これは、エラー・メトリック(308)を修正し人の耳に最も感応する周波数成分を強調する、知覚加重フィルタ(307)によって行われる。知覚的に加重されたエラー・メトリックは、殆ど全ての精巧な分析/合成音声エンコーダによって利用可能とされることは、当業者は認めよう。したがって、上述のように、本発明はCELP音声エンコーダのみに限定されるのではない。
この背景を念頭にいれて、本発明による群音声符号化についてこれより説明する。第1図および第2図から、従来技術では、各フォーワード・リンク音声エンコーダのエンコード・レートが別個に決定されることは明確である。即ち、各64kbps音声リンクの符号化レートは、当該音声信号を信号処理することによってのみ決定される。CDMAシステムのフォーワード・リンクにおける自己干渉量(したがって容量)は、各エンコーダの平均符号化レートによって変わる。しかも、各エンコーダは別個に動作しており、基地局のアンテナ(112)から送出される全電力(したがってシステムの自己干渉)について知識がないので、可能な限り最大容量で動作するためには、各音声エンコーダのレート決定アルゴリズムは、常に可能な限り最低のレートを求めるように設計されなければならないことは明白である。平均符号化レートを低下させるには音声品質が犠牲にされなければならないので、システムがその最大容量でないとき、即ち、等価的に、最大に割り当てられた電力を送信していないとき、システム全体の音声品質は不必要に犠牲にされることになる。言い換えると、音声符号化が別個に行われるので、基地局における瞬間的出力電力の合計は大きな分散(variance)を有する可能性がある。
多くのCDMA電力制御アルゴリズムでは、セルまたはセクタからの全送出電力に厳しい制限が設けられているので、個々のリンクを符号化するために用いられるレートは、不必要に低く保持されなければならない。加えて、デジタル的に符号化された音声リンクの知覚品質(perceptual quality)は、使用される音声エンコーダのみでなく、性、アクセント、話し手の声の大きさのような要因、および音響的背景ノイズ(acoustic background noise)の種類/レベルのような環境的要因にも左右されることは公知である。したがって、各リンクを別個に符号化することによって、あるリンクでレートを低下させた場合、他のリンク上で即ち他の話し手にて同等のレート低下を行った場合よりも、知覚される音声品質全体の損失を小さく抑えることができるという状況についての認識が得られなくなる。更に、TIA標準IS−96に具現化された現行の技術は、レートの決定を行う際に、知覚加重符号化エラーを利用していない。
第4図に示す方法はこれらの欠陥を克服するために用いることができる。第4図では、各音声エンコーダ(105)が各20msフレーム毎に評価し、4つの候補レート(他の実施例では3つより多いレートも可能である)の各々において音声フレームを符号化することによって、知覚加重エラー・メトリック(401)を生成する。この情報は、次に監視するレート制御器(404)に戻される。レート制御器(404)は次に、第5図と同様のレート/品質表を形成する。第5図は、レート制御器に報告されたN個の音声エンコーダの各々について、候補レートの各々で符号化することによって生成される知覚加重エラーを表にしたものである。
セルまたはセクタの音声品質全体を最適化するための簡単な手法は、N個の音声チャンネル全てが同一送信出力を有すると仮定することによって開始される。エンコーダ(105)は全て、最低の候補レートに置かれ、全送信電力Pがレート制御器(404)によって計算される。この場合、Pは単にN個全てのエンコーダのレート値の和に等しく、1/8レートに対するレート値は1/8であり、1/4レートでは1/4、等である。次に、レート制御器(404)は、N個のエンコーダ全てについて、現在の候補レートに対応する最大エントリをレート/品質表内で見つける。これは、現在選択されているレート集合について、音声品質が最悪の(即ち、知覚的加重エラーが最大)エンコーダを識別することと等価である。そのエンコーダのレートを最高から2番目のレートに上昇させ、Pを再度計算する。このプロセスは、Pがある全電力スレシホールドTを超過するまで続く。超過したとき、この手順は終了する。この手法を改善するには、各エンコーダに関連する送信利得で重み付けされたレート/品質表のエントリに、この手順を適用することであろう。これは、電力レベル・ブロック(110)から抽出される。この手順の全体的な効果は、低いレートで動作させても質の低下が最も少ないエンコーダのレートを犠牲にすることによって、電力を低減することであるということは、当業者には認められよう。
より複雑な手法は以下に示すようなものとなろう。上述のように、高トラフィック負荷期間におけるレート低減方式の目標(即ち、所定の基準)は、全体としての送信電力をあるスレシホールドT未満に保持することであると仮定する。ここで、Tは現在の負荷状態に応じて設定される。
基地局によって供給されるセクタ/セルの音声品質の大域的測定Qを、N個の音声チャンネルに選択された現レートの集合に対する知覚エラーの和と定義する。各エンコーダを、最大レートで符号化するように初期化する。次に、Qを評価し、同等の電力仮定または上述の加重送信電力のいずれかを用いて、対応する送信電力を計算する。
レート制御器(404)が入手できないが、各DSPはそれぞれ使用可能な計算資源をタイム・シェアリングで共用することによっていくつかの音声リンクを符号化している場合、この方法を簡略化したものとなろう。この場合、レート選択手順は、DSPが符号化を行っている数の音声チャンネル全体に適用されよう。第6図は、この筋書き(scenario)を実施するために用いることができる装置を、概略的に図示したものである。第6図において、Motorola DSP56156のような単一のDSP(603)が、時分割多重直列バスまたは従来の並列アドレス/データ・バスを通じて通信を行う。レート決定情報およびレート選択が、制御側DSP(603)と、バス(604)を通じて音声符号化に用いられるDSP(602)との間で受け渡される。或いは、制御側DSP(603)を除去し、エンコーダDSP(602)の内の1台を多機能化(promote)させて、全体的レート制御器の機能と、1つ以上の音声チャンネルの音声符号化とを持たせてもよい。
第7図は、本発明による群符号化を有利に実施することができるレート制御器(404)を、ブロック図状で概略的に示すものである。レート制御器(404)は、複数のエンコーダ(105)からレート決定情報(401)を受け入れる(700)手段を備えている。好適実施例では、レート決定情報は、知覚加重エラー・メトリックを含む品質情報である。受け入れ手段(700)は、所定の基準に基づいて符号化要件を決定する、出力入力決定手段(703)を有する。所定の基準には、スレシホールド基準として上述したものが含まれる。決定手段(703)の出力は調節手段(706)に入力され、レート決定情報と所定の基準とに基づいて、複数のエンコーダの内の全エンコーダの符号化レートを調節する。所定の基準が全送信電力または使用可能なメモリ空間であるような筋書きでは、上述のように、調節手段(706)は、典型的に、品質が最も悪いエンコーダの符号化レートを上昇させる(送信電力または使用可能なメモリ空間のいずれかの判定/計算とスレシホールドとに基づいて)。しかしながら、システム容量のようなある所定の基準では、調節手段(706)が特定のエンコーダの符号化レートを低下させなければならない場合もある。
以上、本発明について特定実施例を参照しながら特定的に示しかつ記載したが、本発明の精神および範囲から逸脱することなく、形状および詳細における種々の変更が可能であることは、当業者には理解されよう。

Claims (8)

  1. 信号を群符号化する方法であって、
    少なくとも2つの複数のエンコーダから前記少なくとも2つのエンコーダによって生成された品質情報を含むレート決定情報を受け入れる段階、
    前記少なくとも2つのエンコーダに供給される信号の各々の電力レベル及びスレシホールド基準に基づいて、前記少なくともつのエンコーダの符号化レートを決定する段階;および
    記少なくとも2つのエンコーダの前記品質情報に基づいて、少なくとも1つのエンコーダの符号化レートを調節する段階、
    から成ることを特徴とする方法。
  2. 前記前記スレシホールド基準は、更に、前記エンコーダが割り当てられるセクタ/セルの全出力電力、隣接するセクタ/セルの全出力電力、稼働中の基地局による送信の現電力レベル、少なくとも2つのエンコーダの現データ・レート、メモリ手段において使用可能なメモリ、処理手段において使用可能な処理能力、および所定のスペクトル内で使用可能な帯域のいずれかを含むことを特徴とする、請求項1記載の方法。
  3. 信号を群符号化する装置であって、
    少なくとも2つのエンコーダから前記少なくとも2つのエンコーダによって生成された品質情報を含むレート決定情報を受け入れる手段
    前記受け入れ手段に結合され、前記少なくとも2つのエンコーダに供給される信号の各々の電力レベル及びスレシホールド基準に基づいて、前記少なくともつのエンコーダの符号化レートを決定する手段、および
    前記決定する手段に結合され、前記少なくとも2つのエンコーダの前記品質情報に基づいて少なくとも1つのエンコーダの符号化レートを調節する手段、
    から成ることを特徴とする装置。
  4. 前記少なくとも2つのエンコーダは、更に、分析/合成エンコーダを含むことを特徴とする、請求項3記載の装置。
  5. 前記品質情報は、前記分析/合成音声エンコーダによって発生される知覚加重エラー・メトリック、信号対ノイズ(S/N)比、区分S/N、ケプストラム距離、LPC距離測定、およびBARKスペクトル距離測定を含むことを特徴とする、請求項3記載の装置。
  6. 前記スレシホールド基準は、更に、前記エンコーダが割り当てられるセクタ/セルの全出力電力、隣接するセクタ/セルの全出力電力、稼働中の基地局による送信の現電力レベル、少なくとも2つのエンコーダの現データ・レート、メモリ手段において使用可能なメモリ、処理手段において使用可能な処理能力、および所定のスペクトル内で使用可能な帯域のいずれかを含むことを特徴とする、請求項3記載の装置。
  7. 前記少なくとも2つのエンコーダは、更に、少なくとも2つの可変レート・エンコーダを含むことを特徴とする、請求項3記載の装置。
  8. 前記信号は、更に、音声信号、映像信号、またはデータ信号のいずれかを含むことを特徴とする、請求項3記載の装置。
JP52178295A 1994-02-17 1994-12-22 信号を群符号化するための方法および装置 Expired - Lifetime JP3779320B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US19875094A 1994-02-17 1994-02-17
US08/198,750 1994-02-17
PCT/US1994/014775 WO1995022818A1 (en) 1994-02-17 1994-12-22 Method and apparatus for group encoding signals

Publications (2)

Publication Number Publication Date
JPH08509348A JPH08509348A (ja) 1996-10-01
JP3779320B2 true JP3779320B2 (ja) 2006-05-24

Family

ID=22734667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP52178295A Expired - Lifetime JP3779320B2 (ja) 1994-02-17 1994-12-22 信号を群符号化するための方法および装置

Country Status (11)

Country Link
US (1) US5761634A (ja)
EP (1) EP0699334B1 (ja)
JP (1) JP3779320B2 (ja)
KR (1) KR100193196B1 (ja)
CN (1) CN1129263C (ja)
CA (1) CA2157024C (ja)
DE (1) DE69429917T2 (ja)
FI (1) FI116180B (ja)
IL (1) IL112165A0 (ja)
RU (1) RU2129737C1 (ja)
WO (1) WO1995022818A1 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI964975A7 (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
US7751370B2 (en) * 2001-07-13 2010-07-06 Qualcomm Incorporated Method and apparatus for forward link rate scheduling
US6175590B1 (en) * 1997-08-08 2001-01-16 Qualcomm Inc. Method and apparatus for determining the rate of received data in a variable rate communication system
WO1999009674A2 (en) * 1997-08-13 1999-02-25 Qualcomm Incorporated Method and apparatus for interference cancellation for a high data rate user in a cdma system
US6389000B1 (en) * 1997-09-16 2002-05-14 Qualcomm Incorporated Method and apparatus for transmitting and receiving high speed data in a CDMA communication system using multiple carriers
KR100407342B1 (ko) * 1998-05-30 2003-11-28 삼성전자주식회사 부호분할다중접속 통신시스템의 통신장치 및 방법
US6034971A (en) * 1998-06-30 2000-03-07 Motorola, Inc. Method and apparatus for controlling communication system capacity
US7457415B2 (en) 1998-08-20 2008-11-25 Akikaze Technologies, Llc Secure information distribution system utilizing information segment scrambling
EP1129451A1 (en) * 1998-11-13 2001-09-05 QUALCOMM Incorporated Closed-loop variable-rate multimode predictive speech coder
US6674807B1 (en) * 1999-01-21 2004-01-06 Samsung Electronics Co., Ltd. Communication apparatus and method for a CDMA communication system
US7023839B1 (en) * 1999-01-26 2006-04-04 Siemens Communications, Inc. System and method for dynamic codec alteration
US6757277B1 (en) 1999-01-26 2004-06-29 Siemens Information And Communication Networks, Inc. System and method for coding algorithm policy adjustment in telephony-over-LAN networks
JP2000295119A (ja) * 1999-04-06 2000-10-20 Toshiba Corp 無線送信機
EP1059782A3 (en) * 1999-06-10 2004-02-04 Lucent Technologies Inc. Method and apparatus for dynamically allocating bandwidth utilization in a packet telephony network
US6731734B1 (en) 1999-08-19 2004-05-04 Siemens Information & Communication Networks, Inc. Apparatus and method for intelligent conference call codec selection
US6483814B1 (en) * 1999-08-25 2002-11-19 Hrl Laboratories, Llc Channel-adaptive radio modem
AU5976699A (en) 1999-09-09 2001-04-10 Nokia Corporation Determination of data rate, based on power spectral density estimates
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6574593B1 (en) * 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
KR100347752B1 (ko) * 2000-01-25 2002-08-09 주식회사 하이닉스반도체 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법
US7127390B1 (en) * 2000-02-08 2006-10-24 Mindspeed Technologies, Inc. Rate determination coding
US6856954B1 (en) * 2000-07-28 2005-02-15 Mindspeed Technologies, Inc. Flexible variable rate vocoder for wireless communication systems
ES2164613B1 (es) * 2000-08-16 2003-05-16 Fuente Vicente Diaz Metodo, transmisor y receptor para comunicacion digital de espectro ensanchado mediante modulacion de secuencias complementarias golay.
US6731668B2 (en) * 2001-01-05 2004-05-04 Qualcomm Incorporated Method and system for increased bandwidth efficiency in multiple input—multiple output channels
US7076316B2 (en) * 2001-02-02 2006-07-11 Nortel Networks Limited Method and apparatus for controlling an operative setting of a communications link
CA2399265C (en) * 2001-08-29 2007-02-06 At&T Corp. Multi-frequency data transmission channel power allocation
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US7996234B2 (en) * 2003-08-26 2011-08-09 Akikaze Technologies, Llc Method and apparatus for adaptive variable bit rate audio encoding
US7437135B2 (en) 2003-10-30 2008-10-14 Interdigital Technology Corporation Joint channel equalizer interference canceller advanced receiver
US7400692B2 (en) 2004-01-14 2008-07-15 Interdigital Technology Corporation Telescoping window based equalization
US20060007955A1 (en) * 2004-07-06 2006-01-12 Kotzin Michael D Communication network capacity allocation method
WO2007036355A2 (en) 2005-09-29 2007-04-05 Syngenta Participations Ag Fungicidal compositions
EP2082397B1 (en) 2006-10-16 2011-12-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
AU2007312598B2 (en) 2006-10-16 2011-01-20 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
CN101572092B (zh) * 2008-04-30 2012-11-21 华为技术有限公司 编解码端的固定码本激励的搜索方法及装置
RU2426257C1 (ru) * 2010-04-09 2011-08-10 Государственное образовательное учреждение высшего профессионального образования "Московский государственный университет путей сообщения" (МИИТ) Адаптивный дифференциальный импульсно-кодовый модулятор
CN102723968B (zh) * 2012-05-30 2017-01-18 中兴通讯股份有限公司 一种提升空口容量的方法及装置
RU2480904C1 (ru) * 2012-06-01 2013-04-27 Анна Валерьевна Хуторцева Способ совместной фильтрации и дифференциальной импульсно-кодовой модуляции-демодуляции сигналов
CN118016081B (zh) * 2024-04-10 2024-06-21 山东省计算中心(国家超级计算济南中心) 基于语音质量分级模型的变速率语音编码方法及系统

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4210780A (en) * 1978-03-27 1980-07-01 The Mitre Corporation Multiple access digital communications system
US4375581A (en) * 1980-06-30 1983-03-01 Bell Telephone Laboratories, Incorporated Digital transmission error reduction
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
JPH0648796B2 (ja) * 1988-02-05 1994-06-22 日本電気株式会社 デマンドアサイン方式衛星通信装置
US4956871A (en) * 1988-09-30 1990-09-11 At&T Bell Laboratories Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
AU644119B2 (en) * 1989-10-17 1993-12-02 Motorola, Inc. Lpc based speech synthesis with adaptive pitch prefilter
US5150387A (en) * 1989-12-21 1992-09-22 Kabushiki Kaisha Toshiba Variable rate encoding and communicating apparatus
US5367608A (en) * 1990-05-14 1994-11-22 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit allocation unit for subband coding a digital signal
US5659569A (en) * 1990-06-25 1997-08-19 Qualcomm Incorporated Data burst randomizer
US5103459B1 (en) * 1990-06-25 1999-07-06 Qualcomm Inc System and method for generating signal waveforms in a cdma cellular telephone system
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5204876A (en) * 1991-03-13 1993-04-20 Motorola, Inc. Method and apparatus for providing high data rate traffic channels in a spread spectrum communication system
US5159447A (en) * 1991-05-23 1992-10-27 At&T Bell Laboratories Buffer control for variable bit-rate channel
US5349645A (en) * 1991-12-31 1994-09-20 Matsushita Electric Industrial Co., Ltd. Word hypothesizer for continuous speech decoding using stressed-vowel centered bidirectional tree searches
IL118832A (en) * 1992-01-16 1998-03-10 Qualcomm Inc Method and apparatus for combining data for transmission and using excess capacity
US5383219A (en) * 1993-11-22 1995-01-17 Qualcomm Incorporated Fast forward link power control in a code division multiple access system

Also Published As

Publication number Publication date
DE69429917D1 (de) 2002-03-28
CA2157024A1 (en) 1995-08-24
US5761634A (en) 1998-06-02
FI954622L (fi) 1995-09-29
JPH08509348A (ja) 1996-10-01
CA2157024C (en) 1999-08-10
FI116180B (fi) 2005-09-30
EP0699334A1 (en) 1996-03-06
DE69429917T2 (de) 2002-07-18
EP0699334A4 (en) 1998-09-30
IL112165A0 (en) 1995-03-15
KR100193196B1 (ko) 1999-06-15
RU2129737C1 (ru) 1999-04-27
EP0699334B1 (en) 2002-02-20
FI954622A0 (fi) 1995-09-29
CN1129263C (zh) 2003-11-26
CN1121375A (zh) 1996-04-24
KR960702146A (ko) 1996-03-28
WO1995022818A1 (en) 1995-08-24

Similar Documents

Publication Publication Date Title
JP3779320B2 (ja) 信号を群符号化するための方法および装置
US8019599B2 (en) Speech codecs
EP1107231B1 (en) Variable rate vocoder
KR100923891B1 (ko) 음성 비활동 동안에 보이스 송신 시스템들 사이에상호운용성을 제공하는 방법 및 장치
KR100713677B1 (ko) 음성 디코딩 장치, 음성 디코딩 방법 및 음성 디코딩장치를 포함하는 전송 시스템
EP1515308A1 (en) Multi-rate coding
US5778026A (en) Reducing electrical power consumption in a radio transceiver by de-energizing selected components when speech is not present
HU216370B (hu) Eljárás és rendszer teljesítményszint szabályozására kommunikációs rendszerben
US6445686B1 (en) Method and apparatus for improving the quality of speech signals transmitted over wireless communication facilities
US7653539B2 (en) Communication device, signal encoding/decoding method
Gardner et al. QCELP: A variable rate speech coder for CDMA digital cellular
CN100385842C (zh) 自适应多速率编解码器的编解码模式自适应方法和设备
RU2237296C2 (ru) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
KR19980046880A (ko) 음성 부호화기의 전송률 결정방법
JP2001249691A (ja) 音声符号化装置及び音声復号装置
Miet Evolution of Speech Coding for Wireless Communications: A system standard: the AMR (Adaptive Multi Rate codec)
Christopoulos et al. Kambiz Homayounfar

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040317

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040520

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20040527

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20050831

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20050912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060302

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100310

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110310

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110310

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120310

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120310

Year of fee payment: 6

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120310

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130310

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130310

Year of fee payment: 7

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130310

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130310

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140310

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term