JPH11122120A - 符号化方法及び装置、並びに復号化方法及び装置 - Google Patents

符号化方法及び装置、並びに復号化方法及び装置

Info

Publication number
JPH11122120A
JPH11122120A JP9285903A JP28590397A JPH11122120A JP H11122120 A JPH11122120 A JP H11122120A JP 9285903 A JP9285903 A JP 9285903A JP 28590397 A JP28590397 A JP 28590397A JP H11122120 A JPH11122120 A JP H11122120A
Authority
JP
Japan
Prior art keywords
encoding
output
coding
decoding
convolutional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9285903A
Other languages
English (en)
Inventor
Yuji Maeda
祐児 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP9285903A priority Critical patent/JPH11122120A/ja
Priority to US09/170,726 priority patent/US6230124B1/en
Priority to EP98308454A priority patent/EP0910066A3/en
Priority to KR1019980043296A priority patent/KR19990037152A/ko
Priority to CNB98113100XA priority patent/CN1154283C/zh
Publication of JPH11122120A publication Critical patent/JPH11122120A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/007Unequal error protection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0041Arrangements at the transmitter end
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0061Error detection codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0059Convolutional codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0064Concatenated codes
    • H04L1/0065Serial concatenated codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 低ビットレート、例えば2kbps又は4k
bpsの音声符号化方式により得られた符号化ビット
は、特定のオーディオ情報内容にとらわれない、一般的
なオーディオとして、通信、コンピュータ、放送などの
分野に広く適用されるため、伝送路で発生する誤りに対
して強く保護する必要がある。 【解決手段】 音声符号化器3は、入力音声信号を時間
軸上で所定の符号化単位で区分して各符号化単位で符号
化を行って複数種類の音声符号化パラメータを出力す
る。CRC符号計算部5は、この音声符号化器3からの
複数種類の音声符号化パラメータの内で聴感上重要な重
要ビット群を選択し、この重要ビット群からCRC検査
符号を生成する。畳み込み符号化器6は、CRC符号計
算部5からの上記CRC検査符号と上記重要ビット群に
畳み込み符号化を施す。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力音声信号をブ
ロックやフレームなどの所定の符号化単位で区分して、
区分された符号化単位毎に符号化処理を行うような符号
化方法及び装置、並びにこの符号化された信号を復号化
する復号化方法及び装置に関する。
【0002】
【従来の技術】オーディオ信号(音声信号や音響信号を
含む)の時間領域や周波数領域における統計的性質と人
間の聴感上の特性を利用して信号圧縮を行うような符号
化方法が種々知られている。この符号化方法として、い
わゆるCELP(Code ExcitedLinear Prediction:符
号励起線形予測)符号化系の符号化方式であるVSEL
P(Vector Sum Excited Linear Prediction:ベクトル
和励起線形予測)符号化方式や、PSI−CELP(Pi
tch Synchronus Innovation - CELP:ピッチ同期雑音励
振源−CELP)符号化方式等が低ビットレートの音声
符号化方式として近年着目されている。
【0003】このCELP符号化方式等の波形符号化方
式においては、入力音声信号の所定数のサンプルを符号
化単位としてブロック化あるいはフレーム化し、ブロッ
クあるいはフレーム毎の音声時間軸波形に対して、合成
による分析(analysis by synthesis) 法を用いて最適
ベクトルのクローズドループサーチを行うことにより波
形のベクトル量子化を行い、そのベクトルのインデック
スを出力している。
【0004】
【発明が解決しようとする課題】ところで、上記低ビッ
トレート、例えば2kbps又は4kbpsの音声符号
化方式により得られた符号化ビットは、特定のオーディ
オ情報内容にとらわれない、一般的なオーディオとし
て、通信、コンピュータ、放送などの分野に広く適用さ
れるため、伝送路で発生する誤りに対して強く保護する
必要がある。
【0005】伝送路で連続的に誤りが発生した場合、音
声復号時に音の欠け等が長い時間にわたり続いてしま
い、音声品質の低下を招いてしまうことになる。
【0006】本発明は、上記実情に鑑みてなされたもの
であり、伝送路の誤りに強く、品質の低下を改善できる
符号化方法及び装置、並びに復号化方法及び装置の提供
を目的とする。
【0007】
【課題を解決するための手段】本発明に係る符号化方法
は、上記課題を解決するために、入力音声信号を時間軸
上で所定の符号化単位で区分して各符号化単位で符号化
を行って複数種類の音声符号化パラメータを出力する音
声符号化工程と、上記音声符号化工程からの複数種類の
音声符号化パラメータの内で聴感上重要な重要ビット群
を選択し、この重要ビット群から誤り検査符号を生成す
る誤り検査符号生成工程と、上記誤り検査符号生成工程
からの上記誤り検査符号と上記重要ビット群に畳み込み
符号化を施す畳み込み符号化工程とを備える。このた
め、聴感上重要なビット群を伝送路誤りから保護でき
る。
【0008】ここで、上記音声符号化工程は、入力音声
信号の短期予測残差を求める短期予測残差算出工程と、
求められた短期予測残差をサイン波分析符号化するサイ
ン波分析符号化工程と、上記入力音声信号を波形符号化
により符号化する波形符号化工程とを備えてなる。
【0009】そして、上記誤り検査符号生成工程は、上
記短期予測残差算出工程が短期予測残差を求めるときに
生成したパラメータの一部又は全部と、上記サイン波分
析符号化工程の符号化出力の一部又は全部と、上記波形
符号化工程の符号化出力の一部又は全部を上記重要ビッ
ト群として選択し、これらの重要ビット群から誤り検査
符号を生成する。
【0010】なお、上記短期予測残差算出工程が短期予
測残差を求めるために生成したパラメータとは上記入力
音声信号の周波数スペクトルの概形を形成する線スペク
トル対パラメータであり、上記サイン波分析符号化工程
の符号化出力とは上記入力音声信号が有声音か無声音か
を示す有声音/無声音判定パラメータ、及び上記入力音
声信号が有声音であるときのピッチパラメータ、及び上
記短期予測符号化残差信号のスペクトルエンベロープを
示すスペクトル符号帳インデクス及びゲインインデクス
であり、また上記波形符号化工程の符号化出力とは入力
信号が無声音であるときの短期予測残差に基づいた雑音
符号帳インデクス及びゲインインデクスである。
【0011】また、本発明に係る符号化装置は、上記課
題を解決するために、入力音声信号を時間軸上で所定の
符号化単位で区分して各符号化単位で符号化を行って複
数種類の音声符号化パラメータを出力する音声符号化手
段と、上記音声符号化手段からの複数種類の音声符号化
パラメータの内で聴感上重要な重要ビット群を選択し、
この重要ビット群から誤り検査符号を生成する誤り検査
符号生成手段と、上記誤り検査符号生成手段からの上記
誤り検査符号と上記重要ビット群に畳み込み符号化を施
す畳み込み符号化手段とを備える。このため、聴感上重
要なビット群を伝送路誤りから保護できる。
【0012】また、本発明に係る復号化方法は、入力音
声信号を時間軸上で所定の符号化単位で区分し、この符
号化単位で符号化を行って得られる複数種類の音声符号
化パラメータの内で聴感上重要な重要ビット群から生成
した誤り検査符号と、上記重要ビット群とに畳み込み符
号化を施して得た畳み込み符号化出力に、上記重要ビッ
ト群を除いたビット群を接合して伝送されてきた符号化
データを復号化するものであり、上記課題を解決するた
めに、上記畳み込み符号化出力に畳み込み復号化を施
し、上記誤り検査符号が付加されたままの上記重要ビッ
ト群と、上記重要ビット群を除いたビット群とを畳み込
み復号化出力とする畳み込み復号化工程と、上記畳み込
み復号化工程からの畳み込み復号化出力に付加されてい
る上記誤り検査符号を用いて伝送誤りを検査する誤り検
査工程と、上記誤り検査工程での誤り検査結果に応じて
上記畳み込み復号化出力を調整する出力調整工程と、上
記出力調整工程からの畳み込み復号化出力に音声復号化
処理を施す音声復号化工程とを備える。
【0013】ここで、上記出力調整工程は、上記誤り検
査工程で誤りが検出されたときには、上記畳み込み復号
化出力の代わりに、補間処理により得た補間データを出
力する。
【0014】また、上記出力調整工程は、上記誤り検査
結果に応じて上記畳み込み復号化出力にバッドフレーム
マスキング処理を施す。
【0015】また、本発明に係る復号化装置は、入力音
声信号を時間軸上で所定の符号化単位で区分し、この符
号化単位で符号化を行って得られる複数種類の音声符号
化パラメータの内で聴感上重要な重要ビット群から生成
した誤り検査符号と、上記重要ビット群とに畳み込み符
号化を施して得た畳み込み符号化出力に、上記重要ビッ
ト群を除いたビット群を接合して伝送されてきた符号化
データを復号化する装置であり、上記課題を解決するた
めに、上記畳み込み符号化出力に畳み込み復号化を施
し、上記誤り検査符号が付加されたままの上記重要ビッ
ト群と、上記重要ビット群を除いたビット群とを畳み込
み復号化出力とする畳み込み復号化手段と、上記畳み込
み復号化手段からの畳み込み復号化出力に付加されてい
る上記誤り検査符号を用いて伝送誤りを検査し、この検
査結果に応じて上記畳み込み復号化出力を調整する誤り
検査及び出力調整手段と、上記誤り検査及び出力調整手
段からの畳み込み復号化出力に音声復号化処理を施す音
声復号化手段とを備える。
【0016】
【発明の実施の形態】以下、本発明に係る符号化方法及
び装置、並びに復号化方法及び装置の実施の形態につい
て説明する。
【0017】この実施の形態は、本発明に係る符号化方
法及び装置、並びに復号化方法及び装置を図1に示すよ
うに、音声符号化器3と伝送路符号化器4とからなる符
号化装置として、並びに伝送路復号化器14と音声復号
化器17とからなる復号化装置として用いた携帯電話装
置である。伝送路符号化器4はCRC符号計算部5と畳
み込み符号化器6からなり、伝送路復号化器14は畳み
込み復号化器16とCRC符号比較部&フレームマスク
部15からなる。
【0018】すなわち、この携帯電話装置において、本
発明に係る符号化方法を適用した符号化装置は、入力音
声信号を時間軸上で所定の符号化単位で区分して各符号
化単位で符号化を行って複数種類の音声符号化パラメー
タを出力する音声符号化器3と、この音声符号化器3か
らの複数種類の音声符号化パラメータの内で聴感上重要
な重要ビット群を選択し、この重要ビット群からCRC
(Cyclic RedundancyCheck :巡回冗長チェック)検査
符号を生成するCRC符号計算部5と、このCRC符号
計算部5からの上記CRC検査符号と上記重要ビット群
に畳み込み符号化を施す畳み込み符号化器6とを備えて
なる。
【0019】また、この携帯電話装置において、本発明
に係る復号化方法を適用した復号化装置は、入力音声信
号を時間軸上で所定の符号化単位で区分し、この符号化
単位で符号化を行って得られる複数種類の音声符号化パ
ラメータの内で聴感上重要な重要ビット群から生成した
CRC検査符号と、上記重要ビット群とに畳み込み符号
化を施して得た畳み込み符号化出力に、上記重要ビット
群を除いたビット群を接合して伝送されてきた符号化デ
ータを復号化する装置であり、上記畳み込み符号化出力
に畳み込み復号化を施し、上記誤り検査符号が付加され
たままの上記重要ビット群と、上記重要ビット群を除い
たビット群とを畳み込み復号化出力とする畳み込み復号
化器16と、この畳み込み復号化器16からの畳み込み
復号化出力に付加されている上記CRC検査符号と上記
重要ビット群を除いたビット群より計算したCRC誤り
検査符号とを比較し、その比較結果に応じて上記畳み込
み復号化出力を調整するCRC符号比較&フレームマス
ク部15と、このCRC符号比較&フレームマスク部1
5からの畳み込み復号化出力に音声復号化処理を施す音
声復号化器17とを備えてなる。
【0020】この携帯電話装置において、送信時には、
マイクロホン1から入力された音声信号を、A/D変換
器2によりディジタル信号に変換し、音声符号化器3に
より2kbps/4kbpsという低ビットレートの符
号化を施し、伝送路符号化器4により伝送路の品質が音
声品質に影響を受けにくいように符号化した後、変調器
7で変調し、送信機8で出力ビットに送信処理を施し、
アンテナ共用器9を通して、アンテナ10から送信す
る。
【0021】また、受信時には、アンテナ10で捉えた
電波を、アンテナ共用器9を通じて受信機11で受信
し、復調器13で復調し、伝送路復号化器14で伝送路
誤りを訂正し、音声復号化器17で復号し、D/A変換
器18でアナログ音声信号に戻して、スピーカ19から
出力する。
【0022】また、制御部20は上記各部をコントロー
ルし、シンセサイザ12は送受信周波数を送信機8、及
び受信機11に与えている。また、キーパッド21及び
LCD表示器22はマンマシンインターフェースに利用
される。
【0023】このような構成の携帯電話装置の中で、伝
送路符号化器4を構成するCRC符号計算部5は、上記
重要ビット群として、上記音声信号の周波数スペクトル
の概形を形成する線スペクトル対(LSP)パラメータ
の一部又は全部、上記音声信号が有声音(Voice:V)
か無声音(Un Voice:UV)かを示す有声音(V)/無
声音(UV)判定パラメータの全部、上記音声信号が有
声音であるときのピッチ(Pith)パラメータの一部又は
全部、同じく上記音声信号が有声音でるあるときの線形
予測符号化(LPC)残差信号のスペクトルエンベロー
プを示すスペクトル符号帳インデクス及びゲインインデ
クスの一部又は全部、及び上記音声信号が無声音である
ときの線形予測符号化(LPC)残差信号の雑音符号帳
インデクス及びゲインインデクスの一部又は全部を選択
し、これらの重要ビット群からCRC検査符号を生成す
る。
【0024】これらの各重要ビット群は、音声符号化器
3により得られる。この音声符号化器3が行う音声符号
化工程は、入力音声信号の短期予測残差を求める短期予
測残差算出工程と、求められた短期予測残差をサイン波
分析符号化するサイン波分析符号化工程と、上記入力音
声信号を波形符号化により符号化する波形符号化工程と
を備えてなる。この音声符号化器3について図2及び図
3を用いて説明する。
【0025】図2の音声符号化器3の基本的な考え方
は、入力音声信号の短期予測残差例えばLPC(線形予
測符号化)残差を求めてサイン波分析(sinusoidal ana
lysis)符号化、例えばハーモニックコーディング(har
monic coding )を行う第1の符号化部110と、入力
音声信号に対して位相再現性のある波形符号化により符
号化する第2の符号化部120とを有し、入力信号の有
声音(V:Voiced)の部分の符号化に第1の符号化部1
10を用い、入力信号の無声音(UV:Unvoiced)の部
分の符号化には第2の符号化部120を用いるようにす
ることである。
【0026】上記第1の符号化部110には、例えばL
PC残差をハーモニック符号化やマルチバンド励起(M
BE)符号化のようなサイン波分析符号化を行う構成が
用いられる。上記第2の符号化部120には、例えば合
成による分析法を用いて最適ベクトルのクローズドルー
プサーチによるベクトル量子化を用いた符号励起線形予
測(CELP)符号化の構成が用いられる。
【0027】図2の例では、入力端子101に供給され
た音声信号が、第1の符号化部110のLPC逆フィル
タ111及びLPC分析・量子化部113に送られてい
る。LPC分析・量子化部113から得られたLPC係
数あるいはいわゆるαパラメータは、LPC逆フィルタ
111に送られて、このLPC逆フィルタ111により
入力音声信号の線形予測残差(LPC残差)が取り出さ
れる。また、LPC分析・量子化部113からは、後述
するようにLSP(線スペクトル対)の量子化出力が取
り出され、これが出力端子102に送られる。LPC逆
フィルタ111からのLPC残差は、サイン波分析符号
化部114に送られる。サイン波分析符号化部114で
は、ピッチ検出やスペクトルエンベロープ振幅計算が行
われると共に、V(有声音)/UV(無声音)判定部1
15によりV/UVの判定が行われる。サイン波分析符
号化部114からのスペクトルエンベロープ振幅データ
がベクトル量子化部116に送られる。スペクトルエン
ベロープのベクトル量子化出力としてのベクトル量子化
部116からのコードブックインデクスは、スイッチ1
17を介して出力端子103に送られ、サイン波分析符
号化部114からの出力は、スイッチ118を介して出
力端子104に送られる。また、V/UV判定部115
からのV/UV判定出力は、出力端子105に送られる
と共に、スイッチ117、118の制御信号として送ら
れており、上述した有声音(V)のとき上記インデクス
及びピッチが選択されて各出力端子103及び104か
らそれぞれ取り出される。
【0028】図2の第2の符号化部120は、この例で
はCELP(符号励起線形予測)符号化構成を有してお
り、雑音符号帳121からの出力を、重み付きの合成フ
ィルタ122により合成処理し、得られた重み付き音声
を減算器123に送り、入力端子101に供給された音
声信号を聴覚重み付けフィルタ125を介して得られた
音声との誤差を取り出し、この誤差を距離計算回路12
4に送って距離計算を行い、誤差が最小となるようなベ
クトルを雑音符号帳121でサーチするような、合成に
よる分析(Analysis by Synthesis )法を用いたクロー
ズドループサーチを用いた時間軸波形のベクトル量子化
を行っている。このCELP符号化は、上述したように
無声音部分の符号化に用いられており、雑音符号帳12
1からのUVデータとしてのコードブックインデクス
は、上記V/UV判定部115からのV/UV判定結果
が無声音(UV)のときオンとなるスイッチ127を介
して、出力端子107より取り出される。
【0029】図3は、上記図2に示した音声符号化器3
のより具体的な構成を示す図である。なお、この図3に
おいて、上記図2の各部と対応する部分には同じ指示符
号を付している。
【0030】この図3に示された音声符号化器3におい
て、入力端子101に供給された音声信号は、ハイパス
フィルタ(HPF)109にて不要な帯域の信号を除去
するフィルタ処理が施された後、LPC(線形予測符号
化)分析・量子化部113のLPC分析回路132と、
LPC逆フィルタ回路111とに送られる。
【0031】LPC分析・量子化部113のLPC分析
回路132は、入力信号波形の256サンプル程度の長
さを1ブロックとしてハミング窓をかけて、自己相関法
により線形予測係数、いわゆるαパラメータを求める。
データ出力の単位となるフレーミングの間隔は、160
サンプル程度とする。サンプリング周波数fsが例えば
8kHzのとき、1フレーム間隔は160サンプルで20
msec となる。
【0032】LPC分析回路132からのαパラメータ
は、α→LSP変換回路133に送られて、線スペクト
ル対(LSP)パラメータに変換される。これは、直接
型のフィルタ係数として求まったαパラメータを、例え
ば10個、すなわち5対のLSPパラメータに変換す
る。変換は例えばニュートン−ラプソン法等を用いて行
う。このLSPパラメータに変換するのは、αパラメー
タよりも補間特性に優れているからである。
【0033】α→LSP変換回路133からのLSPパ
ラメータは、LSP量子化器134によりマトリクスあ
るいはベクトル量子化される。このとき、フレーム間差
分をとってからベクトル量子化してもよく、複数フレー
ム分をまとめてマトリクス量子化してもよい。ここで
は、20msec を1フレームとし、20msec 毎に算出
されるLSPパラメータを2フレーム分まとめて、マト
リクス量子化及びベクトル量子化している。
【0034】このLSP量子化器134からの量子化出
力、すなわちLSP量子化のインデクスは、端子102
を介して取り出され、また量子化済みのLSPベクトル
は、LSP補間回路136に送られる。
【0035】LSP補間回路136は、上記20msec
あるいは40msec 毎に量子化されたLSPのベクトル
を補間し、8倍のレートにする。すなわち、2.5mse
c 毎にLSPベクトルが更新されるようにする。これ
は、残差波形をハーモニック符号化復号化方法により分
析合成すると、その合成波形のエンベロープは非常にな
だらかでスムーズな波形になるため、LPC係数が20
msec 毎に急激に変化すると異音を発生することがある
からである。すなわち、2.5msec 毎にLPC係数が
徐々に変化してゆくようにすれば、このような異音の発
生を防ぐことができる。
【0036】このような補間が行われた2.5msec 毎
のLSPベクトルを用いて入力音声の逆フィルタリング
を実行するために、LSP→α変換回路137により、
LSPパラメータを例えば10次程度の直接型フィルタ
の係数であるαパラメータに変換する。このLSP→α
変換回路137からの出力は、上記LPC逆フィルタ回
路111に送られ、このLPC逆フィルタ111では、
2.5msec 毎に更新されるαパラメータにより逆フィ
ルタリング処理を行って、滑らかな出力を得るようにし
ている。このLPC逆フィルタ111からの出力は、サ
イン波分析符号化部114、具体的には例えばハーモニ
ック符号化回路、の直交変換回路145、例えばDFT
(離散フーリエ変換)回路に送られる。
【0037】LPC分析・量子化部113のLPC分析
回路132からのαパラメータは、聴覚重み付けフィル
タ算出回路139に送られて聴覚重み付けのためのデー
タが求められ、この重み付けデータが後述する聴覚重み
付きのベクトル量子化器116と、第2の符号化部12
0の聴覚重み付けフィルタ125及び聴覚重み付きの合
成フィルタ122とに送られる。
【0038】ハーモニック符号化回路等のサイン波分析
符号化部114では、LPC逆フィルタ111からの出
力を、ハーモニック符号化の方法で分析する。すなわ
ち、ピッチ検出、各ハーモニクスの振幅Amの算出、有
声音(V)/無声音(UV)の判別を行い、ピッチによ
って変化するハーモニクスのエンベロープあるいは振幅
Amの個数を次元変換して一定数にしている。
【0039】図3に示すサイン波分析符号化部114の
具体例においては、一般のハーモニック符号化を想定し
ているが、特に、MBE(Multiband Excitation: マル
チバンド励起)符号化の場合には、同時刻(同じブロッ
クあるいはフレーム内)の周波数軸領域いわゆるバンド
毎に有声音(Voiced)部分と無声音(Unvoiced)部分と
が存在するという仮定でモデル化することになる。それ
以外のハーモニック符号化では、1ブロックあるいはフ
レーム内の音声が有声音か無声音かの択一的な判定がな
されることになる。なお、以下の説明中のフレーム毎の
V/UVとは、MBE符号化に適用した場合には全バン
ドがUVのときを当該フレームのUVとしている。ここ
で上記MBEの分析合成手法については、本件出願人が
先に提案した特願平4−91422号明細書及び図面に
詳細な具体例を開示している。
【0040】図3のサイン波分析符号化部114のオー
プンループピッチサーチ部141には、上記入力端子1
01からの入力音声信号が、またゼロクロスカウンタ1
42には、上記HPF(ハイパスフィルタ)109から
の信号がそれぞれ供給されている。サイン波分析符号化
部114の直交変換回路145には、LPC逆フィルタ
111からのLPC残差あるいは線形予測残差が供給さ
れている。オープンループピッチサーチ部141では、
入力信号のLPC残差をとってオープンループによる比
較的ラフなピッチのサーチが行われ、抽出された粗ピッ
チデータは高精度ピッチサーチ146に送られて、後述
するようなクローズドループによる高精度のピッチサー
チ(ピッチのファインサーチ)が行われる。また、オー
プンループピッチサーチ部141からは、上記粗ピッチ
データと共にLPC残差の自己相関の最大値をパワーで
正規化した正規化自己相関最大値r(p) が取り出され、
V/UV(有声音/無声音)判定部115に送られてい
る。
【0041】直交変換回路145では例えばDFT(離
散フーリエ変換)等の直交変換処理が施されて、時間軸
上のLPC残差が周波数軸上のスペクトル振幅データに
変換される。この直交変換回路145からの出力は、高
精度ピッチサーチ部146及びスペクトル振幅あるいは
エンベロープを評価するためのスペクトル評価部148
に送られる。
【0042】高精度(ファイン)ピッチサーチ部146
には、オープンループピッチサーチ部141で抽出され
た比較的ラフな粗ピッチデータと、直交変換部145に
より例えばDFTされた周波数軸上のデータとが供給さ
れている。この高精度ピッチサーチ部146では、上記
粗ピッチデータ値を中心に、0.2〜0.5きざみで±数サ
ンプルずつ振って、最適な小数点付き(フローティン
グ)のファインピッチデータの値へ追い込む。このとき
のファインサーチの手法として、いわゆる合成による分
析 (Analysis by Synthesis)法を用い、合成されたパワ
ースペクトルが原音のパワースペクトルに最も近くなる
ようにピッチを選んでいる。このようなクローズドルー
プによる高精度のピッチサーチ部146からのピッチデ
ータについては、スイッチ118を介して出力端子10
4に送っている。
【0043】スペクトル評価部148では、LPC残差
の直交変換出力としてのスペクトル振幅及びピッチに基
づいて各ハーモニクスの大きさ及びその集合であるスペ
クトルエンベロープが評価され、高精度ピッチサーチ部
146、V/UV(有声音/無声音)判定部115及び
聴覚重み付きのベクトル量子化器116に送られる。
【0044】V/UV(有声音/無声音)判定部115
は、直交変換回路145からの出力と、高精度ピッチサ
ーチ部146からの最適ピッチと、スペクトル評価部1
48からのスペクトル振幅データと、オープンループピ
ッチサーチ部141からの正規化自己相関最大値r(p)
と、ゼロクロスカウンタ142からのゼロクロスカウン
ト値とに基づいて、当該フレームのV/UV判定が行わ
れる。さらに、MBEの場合の各バンド毎のV/UV判
定結果の境界位置も当該フレームのV/UV判定の一条
件としてもよい。このV/UV判定部115からの判定
出力は、出力端子105を介して取り出される。
【0045】ところで、スペクトル評価部148の出力
部あるいはベクトル量子化器116の入力部には、デー
タ数変換(一種のサンプリングレート変換)部が設けら
れている。このデータ数変換部は、上記ピッチに応じて
周波数軸上での分割帯域数が異なり、データ数が異なる
ことを考慮して、エンベロープの振幅データ|Am|を
一定の個数にするためのものである。すなわち、例えば
有効帯域を3400kHzまでとすると、この有効帯域が
上記ピッチに応じて、8バンド〜63バンドに分割され
ることになり、これらの各バンド毎に得られる上記振幅
データ|Am|の個数mMX+1も8〜63と変化するこ
とになる。このためデータ数変換部119では、この可
変個数mMX+1の振幅データを一定個数M個、例えば4
4個、のデータに変換している。
【0046】このスペクトル評価部148の出力部ある
いはベクトル量子化器116の入力部に設けられたデー
タ数変換部からの上記一定個数M個(例えば44個)の
振幅データあるいはエンベロープデータが、ベクトル量
子化器116により、所定個数、例えば44個のデータ
毎にまとめられてベクトルとされ、重み付きベクトル量
子化が施される。この重みは、聴覚重み付けフィルタ算
出回路139からの出力により与えられる。ベクトル量
子化器116からの上記エンベロープのインデクスは、
スイッチ117を介して出力端子103より取り出され
る。なお、上記重み付きベクトル量子化に先だって、所
定個数のデータから成るベクトルについて適当なリーク
係数を用いたフレーム間差分をとっておくようにしても
よい。
【0047】次に、第2の符号化部120について説明
する。第2の符号化部120は、いわゆるCELP(符
号励起線形予測)符号化構成を有しており、特に、入力
音声信号の無声音部分の符号化のために用いられてい
る。この無声音部分用のCELP符号化構成において、
雑音符号帳、いわゆるストキャスティック・コードブッ
ク(stochastic code book)121からの代表値出力で
ある無声音のLPC残差に相当するノイズ出力を、ゲイ
ン回路126を介して、聴覚重み付きの合成フィルタ1
22に送っている。重み付きの合成フィルタ122で
は、入力されたノイズをLPC合成処理し、得られた重
み付き無声音の信号を減算器123に送っている。減算
器123には、上記入力端子101からHPF(ハイパ
スフィルタ)109を介して供給された音声信号を聴覚
重み付けフィルタ125で聴覚重み付けした信号が入力
されており、合成フィルタ122からの信号との差分あ
るいは誤差を取り出している。なお、聴覚重み付けフィ
ルタ125の出力から聴覚重み付き合成フィルタの零入
力応答を事前に差し引いておくものとする。この誤差を
距離計算回路124に送って距離計算を行い、誤差が最
小となるような代表値ベクトルを雑音符号帳121でサ
ーチする。このような合成による分析(Analysisby Syn
thesis )法を用いたクローズドループサーチを用いた
時間軸波形のベクトル量子化を行っている。
【0048】このCELP符号化構成を用いた第2の符
号化部120からのUV(無声音)部分用のデータとし
ては、雑音符号帳121からのコードブックのシェイプ
インデクスと、ゲイン回路126からのコードブックの
ゲインインデクスとが取り出される。雑音符号帳121
からのUVデータであるシェイプインデクスは、スイッ
チ127sを介して出力端子107sに送られ、ゲイン
回路126のUVデータであるゲインインデクスは、ス
イッチ127gを介して出力端子107gに送られてい
る。
【0049】ここで、これらのスイッチ127s、12
7g及び上記スイッチ117、118は、上記V/UV
判定部115からのV/UV判定結果によりオン/オフ
制御され、スイッチ117、118は、現在伝送しよう
とするフレームの音声信号のV/UV判定結果が有声音
(V)のときオンとなり、スイッチ127s、127g
は、現在伝送しようとするフレームの音声信号が無声音
(UV)のときオンとなる。
【0050】以上のように構成される音声符号化器3が
出力した各パラメータ、すなわち、LSPパラメータ、
有声音/無声音判定パラメータ、ピッチパラメータ、ス
ペクトルエンベロープの符号帳パラメータ及びゲインイ
ンデクス、雑音符号帳パラメータ及びゲインインデクス
を2k/4kbps符号化に分けて示したのが次の表1
である。この表1には、割り当てのビット数も記載して
いる。
【0051】
【表1】
【0052】そして、上記伝送路符号化器4は、上記表
1に示した各パラメータの一部又は全部を聴感上重要な
ビット群としてCRC符号計算部5で選択し、さらにC
RC符号を計算し、このCRC符号と上記重要ビット群
とを畳み込み符号化器6で畳み込み符号化する。
【0053】2kbpsの場合では、2フレーム40ms
ec当たりの120ビットに対し、表2に示すように、重
要ビット群80ビットをクラスIとし、その他の40ビ
ットをクラスIIとする。
【0054】
【表2】
【0055】クラスIの80ビットを基にCRC符号計
算部5は、CRC符号を14ビット生成する。そして、
畳み込み符号化器6は、クラス1の80ビットと上記1
4ビットのCRC符号と、テールビット10ビットとを
使って畳み込み符号化を行う。
【0056】この畳み込み符号化器6によって得られた
104ビットと、クラスIIの40ビットの合計144ビ
ットに対してビットインターリーブ及び2フレームにわ
たるインターリーブを施して伝送することにより2kb
psでの音声符号化を実現できる。なお、実際に伝送す
るときには、他の冗長ビットを付加している。
【0057】また、4kbpsの場合では、表2に示す
ように、重要ビット群112ビットをクラスIとし、そ
の他の104ビットをクラスIIとする。
【0058】クラスIの112ビットを基にCRC符号
計算部5は、CRC符号を14ビット生成する。そし
て、畳み込み符号化器6は、クラス1の112ビットと
上記14ビットのCRC符号と、テールビット10ビッ
トとを使って畳み込み符号化を行う。
【0059】この畳み込み符号化器6によって得られた
136ビットと、クラスIIの104ビットの合計240
ビットに対してビットインターリーブ及び2フレームに
わたるインターリーブを施して伝送することにより4k
bpsでの音声符号化を実現できる。なお、実際に伝送
するときには、他の冗長ビットを付加している。
【0060】ここで、表3には、2kbps時の各パラ
メータに対するクラスIとクラスIIとの割り当て例を示
す。クラスIが保護ビット数として割り当てられている
重要ビットであり、クラスIIが非保護ビット数として割
り当てられているビットである。なお、ここでは、1フ
レーム20msec当たりの割り当て例を示す。
【0061】
【表3】
【0062】また、表4には、4kbps時の各パラメ
ータに対するクラスIとクラスIIとの割り当て例を示
す。
【0063】
【表4】
【0064】上記表2及び表3に示した保護ビット/非
保護ビットの割り当て例、すなわち聴感上重要なビット
の割り当て例は、上記音声信号の周波数スペクトルの概
形を形成する線スペクトル対(LSP)パラメータの一
部又は全部、上記音声信号が有声音(Voice:V)か無
声音(Un Voice:UV)かを示す有声音(V)/無声音
(UV)判定パラメータの全部、上記音声信号が有声音
であるときのピッチ(Pith)パラメータの一部又は全
部、同じく上記音声信号が有声音でるあるときの線形予
測符号化(LPC)残差信号のスペクトルエンベロープ
を示すスペクトル符号帳インデクス及びゲインインデク
スの一部又は全部、及び上記音声信号が無声音であると
きの線形予測符号化(LPC)残差信号の雑音符号帳イ
ンデクス及びゲインインデクスの一部又は全部を対象と
している。
【0065】携帯電話装置では、通話の品質を維持する
必要上、上記LSPパラメータの初段LSP0は符号帳
より求めた実際のLSP係数に近時したLSP周波数で
あり、正確な伝送が望まれるので、保護ビットを総数6
ビットの全てとしている。また、V/UV判定パラメー
タであるVUVパラメータはその信号の質を表している
ので総数2ビットの全てを保護している。また、ピッチ
パラメータ(PCH)は信号の基本周波数であるので、
総数7ビットの内の6ビットまでを保護している。ま
た、有声音時のLPC残差信号のスペクトルエンベロー
プを示す符号帳のゲインインデクスは信号の音量(レベ
ル)になっており、正確な伝達が望まれるので、総数5
ビットの全てを保護ビットとしている。
【0066】つまり、このような重要ビット群は、伝送
路誤りの起きやすい環境下においてある程度通話品質を
維持し、そのビットが誤ることで生じ得る異音の発生を
未然に防止できるという目的で選定される。
【0067】次に、CRC符号計算部5でのCRC符号
計算と、畳み込み符号化器6での畳み込み符号化の詳細
について説明する。
【0068】なお、以下の表5と表6には、2kbps
時のクラスI、4kbps時のクラスIのCRC生成多項
式への入力ビット順P[i]を示す。ここで、各パラメー
タの添え字“p”は1フレーム前のパラメータを示すも
のである。また、ビット0はLSBを示す。1つの項に
2個のパラメータが書かれているのは、上段が有声音
時、下段が無声音時である。
【0069】
【表5】
【0070】
【表6】
【0071】CRC符号計算部5は、次の(1)式に示
すCRC多項式により、1フレーム当たり7ビットのC
RC符号CRC[i]を得る。
【0072】
【数1】
【0073】但し、
【0074】
【数2】
【0075】
【数3】
【0076】である。
【0077】上記(2)式において、2kbps時には
N=39、4kbps時にはN=55である。以下、特
にことわりのないときにはこれに従う。
【0078】そして、上記(1)式〜(3)式により求
めたCRC符号CRC[i]と、上記表5、表6に示した
P[i]を使って、以下の(4)式に示すように畳み込み
符号化器6の入力ビット列CVin[i]を作成する。
【0079】
【数4】
【0080】畳み込み符号化器6は、上記入力ビット列
CVin[i]と上記重要ビット群を入力し、次の(5)
式、(6)式に示す二つの生成多項式により畳み込み符
号化を行う。
【0081】
【数5】
【0082】
【数6】
【0083】この畳み込み符号化器6は、G1(D)か
ら始まり、上記(5)式、(6)式の多項式により交互
に畳み込み符号化を実行する。
【0084】なお、下記の表7、表8には、2kbp
s、4kbpsのクラスIIのビット順を示す。この入力
順に、クラスIIのビット群を上記畳み込み符号化器6の
符号化出力と接合して伝送する。
【0085】
【表7】
【0086】
【表8】
【0087】なお、表8に示した4kbpsのクラスII
のビット順では、ビット数が104と多いため、2フレ
ームセットで並んでいる分の片方だけを示している。実
際には前のフレームと次のフレームのビットが交互に並
べてある。
【0088】次に、上記復号化装置側では、例えば他の
携帯電話装置の符号化装置からの受信した畳み込み符号
化出力であるビット列を復調した後、畳み込み復号化器
16で畳み込み復号化し、CRC符号比較&フレームマ
スク部15でこの畳み込み復号化器16からの畳み込み
復号化出力に付加されている上記CRC検査符号と上記
重要ビット群を除いたビット群より計算したCRC誤り
検査符号とを比較し、その比較結果に応じて上記畳み込
み復号化出力を調整する。
【0089】CRC符号比較&フレームマスク部15
は、畳み込み復号化器16が実行する上記畳み込み復号
化工程からの畳み込み復号化出力に付加されている上記
誤り検査符号を用いて伝送誤りを検査する誤り検査工程
と、上記誤り検査工程での誤り検査結果に応じて上記畳
み込み復号化出力を調整する出力調整工程とを実行す
る。
【0090】特に、CRC符号が一致しない時には、そ
のフレームのデータを用いて音声復号化を行うと、音声
品質を非常に劣化させるので、誤りの検出の連続する度
合いに応じて、パラメータ置換などの処理を行った後
に、音声復号化器17に調整出力を供給する。パラメー
タ置換処理としては、バッドフレームマスキング(BadF
rame Masking)処理が考えられる。
【0091】図4は、バッドフレームマスキング処理に
よる状態遷移図である。CRC符号検査工程の結果によ
り、現フレームの状態変数(state)を変更する。各状
態(状態0から状態7)は、矢印で示した方向に遷移す
る。遷移は状態0から始まり、遷移線上の“1”は誤り
フレームの場合の遷移方向を、“0”は誤りのないフレ
ームの場合の遷移方向を表す。
【0092】通常は、「状態0」でCRC誤りがないこ
とを示す。例えば、「状態6」には、最低6回連続でC
RC不成立となる場合に遷移する。また、「状態0」で
は何も処理しない。すなわち、通常の復号化が行われ
る。
【0093】例えば、上記LSPパラメータを復号する
場合、状態変数stateが「状態1」〜「状態6」である
ときには、LSPパラメータは1フレーム前のものを用
いる。また、「状態7」のときで、LSPパラメータが
ストレートモードのときにはLSP0〜LSP5を使っ
て求め、差分モードのときには第0LSP符号インデク
スLSP0のみを使って求める。
【0094】また、例えば、上記状態変数state変数の
値に応じて、出力音の音量を制御するミュート変数mute
を以下の表9のように設定する。ただし、状態変数stat
e=7でのmute(p)は1フレーム前のmute変数を示す。
【0095】
【表9】
【0096】また、例えば、VUV判定パラメータがV
であるときには、状態変数state=1〜6では、スペク
トルパラメータidS0、idS1、スペクトルゲインパラメー
タidG、4kbps用スペクトルパラメータidS0_4k〜
idS3_4kは1フレーム前のものを使う。
【0097】また、出力音声の音量を制御する意味で残
差信号の周波数スペクトル変数Am[00..44]を次の(7)
式のようにする。ここで、パラメータより求めたAm[i]
をAm( org)[i]とする。
【0098】
【数7】
【0099】また、例えば、VUV判定パラメータがU
Vであるときには、状態変数state=1〜6のとき、雑
音符号帳ゲインパラメータidGL00、idGL01、4kbps用雑
音符号帳ゲインパラメータidGL10〜idGL13は1フレーム
前のものを使う。雑音符号帳パラメータidSL00、idSL0
1、4kbps用雑音符号帳パラメータidSL10〜idSL13は個々
のビット数の範囲で一様乱数を発生させてできたものを
使う。
【0100】また、出力音声の音量を制御する意味で生
成された残差信号res[00..159]を次の(8)式のよう
にする。ここで、パラメータより求めたres[i]をres
(org)[i]とする。
【0101】
【数8】
【0102】このようにしてCRC符号比較部&フレー
ムマスク部15でバッドフレームマスキング処理が施さ
れた畳み込み符号化出力は、音声復号化器17に供給さ
れる。
【0103】この音声復号化器17の構成を図5及び図
6に示す。CRC符号比較部&フレームマスク部15か
らは、端子202を介して上記図3の端子102からの
上記LSP(線スペクトル対)の量子化出力に相当する
コードブックインデクスが、端子203、204、及び
205を介して、上記図3の各端子103、104、及
び105からの各出力に相当するエンベロープ量子化出
力としてのインデクス、ピッチ、及びV/UV判定出力
がそれぞれ取り出され、また、端子207を介して、上
記図3の端子107からの出力に相当するUV(無声
音)用のデータとしてのインデクスが取り出される。さ
らに、CRC符号比較部&フレームマスク部15でCR
C検査されて得られたCRCエラー信号は、無声音合成
部220に送られている。
【0104】端子203からのエンベロープ量子化出力
としてのインデクスは、逆ベクトル量子化器212に送
られて逆ベクトル量子化され、LPC残差のスペクトル
エンベロープが求められて有声音合成部211に送られ
る。有声音合成部211は、サイン波合成により有声音
部分のLPC(線形予測符号化)残差を合成するもので
あり、この有声音合成部211には端子204及び20
5からのピッチ及びV/UV判定出力も供給されてい
る。有声音合成部211からの有声音のLPC残差は、
LPC合成フィルタ214に送られる。また、端子20
7からのUVデータのインデクスは、無声音合成部22
0に送られて、雑音符号帳を参照することにより無声音
部分の励起ベクトルであるLPC残差が取り出される。
このLPC残差もLPC合成フィルタ214に送られ
る。LPC合成フィルタ214では、上記有声音部分の
LPC残差と無声音部分のLPC残差とがそれぞれ独立
に、LPC合成処理が施される。あるいは、有声音部分
のLPC残差と無声音部分のLPC残差とが加算された
ものに対してLPC合成処理を施すようにしてもよい。
ここで端子202からのLSPのインデクスは、LPC
パラメータ再生部213に送られて、LPCのαパラメ
ータが取り出され、これがLPC合成フィルタ214に
送られる。LPC合成フィルタ214によりLPC合成
されて得られた音声信号は、出力端子201より取り出
される。
【0105】次に、図6は、上記図5に示した音声復号
化器17のより具体的な構成を示している。この図6に
おいて、上記図5の各部と対応する部分には、同じ指示
符号を付している。
【0106】この図6において、入力端子202には、
上記CRC符号比較部&フレームマスク部15を介した
図2、3の出力端子102からの出力に相当するLSP
のベクトル量子化出力、いわゆるコードブックのインデ
クスが供給されている。
【0107】このLSPのインデクスは、LPCパラメ
ータ再生部213のLSPの逆ベクトル量子化器231
に送られてLSP(線スペクトル対)データに逆ベクト
ル量子化され、LSP補間回路232、233に送られ
てLSPの補間処理が施された後、LSP→α変換回路
234、235でLPC(線形予測符号)のαパラメー
タに変換され、このαパラメータがLPC合成フィルタ
214に送られる。ここで、LSP補間回路232及び
LSP→α変換回路234は有声音(V)用であり、L
SP補間回路233及びLSP→α変換回路235は無
声音(UV)用である。またLPC合成フィルタ214
は、有声音部分のLPC合成フィルタ236と、無声音
部分のLPC合成フィルタ237とを分離している。す
なわち、有声音部分と無声音部分とでLPCの係数補間
を独立に行うようにして、有声音から無声音への遷移部
や、無声音から有声音への遷移部で、全く性質の異なる
LSP同士を補間することによる悪影響を防止してい
る。
【0108】また、図4の入力端子203には、上記C
RC符号比較部&フレームマスク部15を介した図2、
図3のエンコーダ側の端子103からの出力に対応する
スペクトルエンベロープ(Am)の重み付けベクトル量
子化されたコードインデクスデータが供給され、入力端
子204には、上記CRC符号比較部&フレームマスク
部15を介した上記図2、図3の端子104からのピッ
チのデータが供給され、入力端子205には、上記CR
C符号比較部&フレームマスク部15を介した上記図
2、図3の端子105からのV/UV判定データが供給
されている。
【0109】入力端子203からのスペクトルエンベロ
ープAmのベクトル量子化されたインデクスデータは、
逆ベクトル量子化器212に送られて逆ベクトル量子化
が施され、上記データ数変換に対応する逆変換が施され
て、スペクトルエンベロープのデータとなって、有声音
合成部211のサイン波合成回路215に送られてい
る。
【0110】なお、エンコード時にスペクトルのベクト
ル量子化に先だってフレーム間差分をとっている場合に
は、ここでの逆ベクトル量子化後にフレーム間差分の復
号を行ってからデータ数変換を行い、スペクトルエンベ
ロープのデータを得る。
【0111】サイン波合成回路215には、入力端子2
04からのピッチ及び入力端子205からの上記V/U
V判定データが供給されている。サイン波合成回路21
5からは、上述した図2、図3のLPC逆フィルタ11
1からの出力に相当するLPC残差データが取り出さ
れ、これが加算器218に送られている。このサイン波
合成の具体的な手法については、例えば本件出願人が先
に提案した、特願平4−91422号の明細書及び図
面、あるいは特願平6−198451号の明細書及び図
面に開示されている。
【0112】また、逆ベクトル量子化器212からのエ
ンベロープのデータと、入力端子204、205からの
ピッチ、V/UV判定データとは、有声音(V)部分の
ノイズ加算のためのノイズ合成回路216に送られてい
る。このノイズ合成回路216からの出力は、重み付き
重畳加算回路217を介して加算器218に送ってい
る。これは、サイン波合成によって有声音のLPC合成
フィルタへの入力となるエクサイテイション(Excitati
on:励起、励振)を作ると、男声等の低いピッチの音で
鼻づまり感がある点、及びV(有声音)とUV(無声
音)とで音質が急激に変化し不自然に感じる場合がある
点を考慮し、有声音部分のLPC合成フィルタ入力すな
わちエクサイテイションについて、音声符号化データに
基づくパラメータ、例えばピッチ、スペクトルエンベロ
ープ振幅、フレーム内の最大振幅、残差信号のレベル等
を考慮したノイズをLPC残差信号の有声音部分に加え
ているものである。
【0113】加算器218からの加算出力は、LPC合
成フィルタ214の有声音用の合成フィルタ236に送
られてLPCの合成処理が施されることにより時間波形
データとなり、さらに有声音用ポストフィルタ238v
でフィルタ処理された後、加算器239に送られる。
【0114】次に、図6の入力端子207s及び207
gには、上記図3の出力端子107s及び107gから
のUVデータとしてのシェイプインデクス及びゲインイ
ンデクスがそれぞれ供給され、無声音合成部220に送
られている。端子207sからのシェイプインデクス
は、無声音合成部220の雑音符号帳221に、端子2
07gからのゲインインデクスはゲイン回路222にそ
れぞれ送られている。雑音符号帳221から読み出され
た代表値出力は、無声音のLPC残差に相当するノイズ
信号成分であり、これがゲイン回路222で所定のゲイ
ンの振幅となり、窓かけ回路223に送られて、上記有
声音部分とのつなぎを円滑化するための窓かけ処理が施
される。
【0115】窓かけ回路223からの出力は、無声音合
成部220からの出力として、LPC合成フィルタ21
4のUV(無声音)用の合成フィルタ237に送られ
る。合成フィルタ237では、LPC合成処理が施され
ることにより無声音部分の時間波形データとなり、この
無声音部分の時間波形データは無声音用ポストフィルタ
238uでフィルタ処理された後、加算器239に送ら
れる。
【0116】加算器239では、有声音用ポストフィル
タ238vからの有声音部分の時間波形信号と、無声音
用ポストフィルタ238uからの無声音部分の時間波形
データとが加算され、出力端子201より取り出され
る。
【0117】この出力端子201から取り出された音声
復号化出力は、D/A変換器18によりアナログ音声信
号とされ、スピーカ19から音声として発せられる。
【0118】図7及び図8には、上記携帯電話装置が行
う符号化方法と、音声復号化工程をまとめたフローチャ
ートを示す。
【0119】すなわち、携帯電話装置の符号化装置側が
実行する音声符号化処理とは、ステップS1の音声符号
化工程により入力音声信号を符号化し、ステップS2で
ステップS1からの複数種類の音声符号化パラメータの
内で聴感上重要な重要ビット群を選択し、この重要ビッ
ト群からCRC検査符号を計算し、ステップS3でステ
ップS2で計算したCRC検査符号と上記重要ビット群
に畳み込み符号化を行う処理である。
【0120】また、上記携帯電話装置の復号化装置側が
実行する音声復号化処理とは、ステップS11で他の携
帯電話装置からの畳み込み符号化出力に畳み込み復号化
を施し、ステップS12でステップS11からの畳み込
み復号化出力に付加されているCRC検査符号を用いて
CRC誤り検査を行い、ステップS13でCRC符号に
エラーが有るときには、ステップS14に進み、バッド
フレームマスキング処理を行い、そして、ステップS1
5で音声復号化を行う処理である。
【0121】このように、本発明に係る符号化方法及び
装置を適用した伝送路符号化器4と、符号化器3を符号
化装置として送信側に備える携帯電話装置では、伝送路
の誤りに強い符号化データを出力することができる。
【0122】また、本発明に係る復号化方法及び装置を
適用した伝送路復号化器と、音声復号化器とを復号化装
置として受信側に備えた携帯電話装置では、伝送路誤り
による品質の低下を抑えた音声を復号できる。
【0123】
【発明の効果】本発明に係る符号化方法及び装置は、伝
送路の誤りに強い符号化データを出力することができ
る。
【0124】また、本発明に係る復号化方法及び装置
は、伝送路誤りによる品質の低下を抑えた音声を復号で
きる。
【図面の簡単な説明】
【図1】本発明に係る符号化方法及び装置、並びに復号
化方法及び装置の実施の形態となる携帯電話装置の構成
を示すブロック図である。
【図2】上記携帯電話装置を構成する音声符号化器の基
本的な構成を示すブロック図である。
【図3】上記音声符号化器の詳細な構成を示すブロック
図である。
【図4】上記携帯電話装置を構成する伝送路復号化器の
動作を説明するための状態遷移図である。
【図5】上記携帯電話装置を構成する音声復号化器の基
本的な構成を示すブロック図である。
【図6】上記音声復号化器の詳細な構成を示すブロック
図である。
【図7】上記携帯電話装置が行う符号化方法を説明する
ためのフローチャートである。
【図8】上記携帯電話装置が行う復号化方法を説明する
ためのフローチャートである。
【符号の説明】
4 伝送路符号化器、5 CRC符号計算部、6 畳み
込み符号化器、14伝送路復号化器、15 CRC符号
比較部&フレームマスク部、16 畳み込み復号化器

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 入力音声信号を時間軸上で所定の符号化
    単位で区分して各符号化単位で符号化を行って複数種類
    の音声符号化パラメータを出力する音声符号化工程と、 上記音声符号化工程からの複数種類の音声符号化パラメ
    ータの内で聴感上重要な重要ビット群を選択し、この重
    要ビット群から誤り検査符号を生成する誤り検査符号生
    成工程と、 上記誤り検査符号生成工程からの上記誤り検査符号と上
    記重要ビット群に畳み込み符号化を施す畳み込み符号化
    工程とを備えることを特徴とする符号化方法。
  2. 【請求項2】 上記音声符号化工程は、入力音声信号の
    短期予測残差を求める短期予測残差算出工程と、求めら
    れた短期予測残差をサイン波分析符号化するサイン波分
    析符号化工程と、上記入力音声信号を波形符号化により
    符号化する波形符号化工程とを備えてなることを特徴と
    する請求項1記載の符号化方法。
  3. 【請求項3】 上記誤り検査符号生成工程は、上記短期
    予測残差算出工程が短期予測残差を求めるときに生成し
    たパラメータの一部又は全部と、上記サイン波分析符号
    化工程の符号化出力の一部又は全部と、上記波形符号化
    工程の符号化出力の一部又は全部を上記重要ビット群と
    して選択し、これらの重要ビット群から誤り検査符号を
    生成することを特徴とする請求項2記載の符号化方法。
  4. 【請求項4】 上記誤り検査符号生成工程は、上記短期
    予測残差算出工程が短期予測残差を求めるときに生成し
    た線スペクトル対パラメータの一部又は全部、有声音/
    無声音判定パラメータの全部、ピッチパラメータの一部
    又は全部、上記サイン波分析符号化工程の符号化出力で
    ある短期予測残差信号のスペクトルエンベロープゲイン
    パラメータの一部又は全部、上記短期予測残差の波形符
    号化出力である雑音コードブックゲインパラメータの一
    部又は全部を上記重要ビット群として選択し、これらの
    重要ビット群から誤り検査符号を生成することを特徴と
    する請求項2記載の符号化方法。
  5. 【請求項5】 上記短期予測残差算出工程が短期予測残
    差を求めるために生成したパラメータとは上記入力音声
    信号の周波数スペクトルの概形を形成する線スペクトル
    対パラメータであり、上記サイン波分析符号化工程の符
    号化出力とは上記入力音声信号が有声音か無声音かを示
    す有声音/無声音判定パラメータ、及び上記入力音声信
    号が有声音であるときのピッチパラメータ、及び上記短
    期予測符号化残差信号のスペクトルエンベロープを示す
    スペクトル符号帳インデクス及びゲインインデクスであ
    り、また上記波形符号化工程の符号化出力とは入力音声
    信号が無声音であるときの短期予測残差に基づいた雑音
    符号帳インデクス及びゲインインデクスであることを特
    徴とする請求項3記載の符号化方法。
  6. 【請求項6】 上記音声符号化工程は、2k/4kbp
    sの音声符号化を上記入力音声信号に施すことを特徴と
    する請求項1記載の符号化方法。
  7. 【請求項7】 入力音声信号を時間軸上で所定の符号化
    単位で区分して各符号化単位で符号化を行って複数種類
    の音声符号化パラメータを出力する音声符号化手段と、 上記音声符号化手段からの複数種類の音声符号化パラメ
    ータの内で聴感上重要な重要ビット群を選択し、この重
    要ビット群から誤り検査符号を生成する誤り検査符号生
    成手段と、 上記誤り検査符号生成手段からの上記誤り検査符号と上
    記重要ビット群に畳み込み符号化を施す畳み込み符号化
    手段とを備えることを特徴とする符号化装置。
  8. 【請求項8】 入力音声信号を時間軸上で所定の符号化
    単位で区分し、この符号化単位で符号化を行って得られ
    る複数種類の音声符号化パラメータの内で聴感上重要な
    重要ビット群から生成した誤り検査符号と、上記重要ビ
    ット群とに畳み込み符号化を施して得た畳み込み符号化
    出力に、上記重要ビット群を除いたビット群を接合して
    伝送されてきた符号化データを復号化する復号化方法で
    あって、 上記畳み込み符号化出力に畳み込み復号化を施し、上記
    誤り検査符号が付加されたままの上記重要ビット群と、
    上記重要ビット群を除いたビット群とを畳み込み復号化
    出力とする畳み込み復号化工程と、 上記畳み込み復号化工程からの畳み込み復号化出力に付
    加されている上記誤り検査符号を用いて伝送誤りを検査
    する誤り検査工程と、 上記誤り検査工程での誤り検査結果に応じて上記畳み込
    み復号化出力を調整する出力調整工程と、 上記出力調整工程からの畳み込み復号化出力に音声復号
    化処理を施す音声復号化工程とを備えることを特徴とす
    る復号化方法。
  9. 【請求項9】 上記誤り検査工程は、上記畳み込み符号
    化出力の内、上記短期予測残差算出工程が短期予測残差
    を求めるときに生成した線スペクトル対パラメータの一
    部又は全部、有声音/無声音判定パラメータの全部、ピ
    ッチパラメータの一部又は全部、上記サイン波分析符号
    化工程の符号化出力である短期予測残差信号のスペクト
    ルエンベロープゲインパラメータの一部又は全部、上記
    短期予測残差の波形符号化出力である雑音コードブック
    ゲインパラメータの一部又は全部を上記重要ビット群と
    して選択し、これらの重要ビット群から生成した誤り検
    査符号と上記畳み込み符号化出力より得られた上記誤り
    検査符号を用いて伝送誤りを検出することを特徴とする
    請求項8記載の復号化方法。
  10. 【請求項10】 上記出力調整工程は、上記誤り検査工
    程で誤りが検出されたときには、上記畳み込み復号化出
    力の代わりに、補間処理により得た補間データを出力す
    ることを特徴とする請求項8記載の復号化方法。
  11. 【請求項11】 上記出力調整工程は、上記誤り検査結
    果に応じて上記畳み込み復号化出力にバッドフレームマ
    スキング処理を施すことを特徴とする請求項8記載の復
    号化方法。
  12. 【請求項12】 上記符号化データは、2k/4kbp
    sの音声符号化を上記入力音声信号に施して得られたも
    のであることを特徴とする請求項8記載の復号化方法。
  13. 【請求項13】 入力音声信号を時間軸上で所定の符号
    化単位で区分し、この符号化単位で符号化を行って得ら
    れる複数種類の音声符号化パラメータの内で聴感上重要
    な重要ビット群から生成した誤り検査符号と、上記重要
    ビット群とに畳み込み符号化を施して得た畳み込み符号
    化出力に、上記重要ビット群を除いたビット群を接合し
    て伝送されてきた符号化データを復号化する復号化装置
    であって、 上記畳み込み符号化出力に畳み込み復号化を施し、上記
    誤り検査符号が付加されたままの上記重要ビット群と、
    上記重要ビット群を除いたビット群とを畳み込み復号化
    出力とする畳み込み復号化手段と、 上記畳み込み復号化手段からの畳み込み復号化出力に付
    加されている上記誤り検査符号を用いて伝送誤りを検査
    し、この検査結果に応じて上記畳み込み復号化出力を調
    整する誤り検査及び出力調整手段と、 上記誤り検査及び出力調整手段からの畳み込み復号化出
    力に音声復号化処理を施す音声復号化手段とを備えるこ
    とを特徴とする復号化装置。
JP9285903A 1997-10-17 1997-10-17 符号化方法及び装置、並びに復号化方法及び装置 Pending JPH11122120A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP9285903A JPH11122120A (ja) 1997-10-17 1997-10-17 符号化方法及び装置、並びに復号化方法及び装置
US09/170,726 US6230124B1 (en) 1997-10-17 1998-10-14 Coding method and apparatus, and decoding method and apparatus
EP98308454A EP0910066A3 (en) 1997-10-17 1998-10-15 Coding method and apparatus, and decoding method and apparatus
KR1019980043296A KR19990037152A (ko) 1997-10-17 1998-10-16 부호화 방법 및 장치 및 복호화 방법 및 장치
CNB98113100XA CN1154283C (zh) 1997-10-17 1998-10-17 编码方法和装置以及解码方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9285903A JPH11122120A (ja) 1997-10-17 1997-10-17 符号化方法及び装置、並びに復号化方法及び装置

Publications (1)

Publication Number Publication Date
JPH11122120A true JPH11122120A (ja) 1999-04-30

Family

ID=17697519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9285903A Pending JPH11122120A (ja) 1997-10-17 1997-10-17 符号化方法及び装置、並びに復号化方法及び装置

Country Status (5)

Country Link
US (1) US6230124B1 (ja)
EP (1) EP0910066A3 (ja)
JP (1) JPH11122120A (ja)
KR (1) KR19990037152A (ja)
CN (1) CN1154283C (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004310088A (ja) * 2003-04-01 2004-11-04 Digital Voice Systems Inc 半レート・ボコーダ
JP2006523971A (ja) * 2003-04-17 2006-10-19 トムソン ライセンシング データストリングを復号化する方法

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6681203B1 (en) * 1999-02-26 2004-01-20 Lucent Technologies Inc. Coupled error code protection for multi-mode vocoders
JP4218134B2 (ja) * 1999-06-17 2009-02-04 ソニー株式会社 復号装置及び方法、並びにプログラム提供媒体
US7110947B2 (en) * 1999-12-10 2006-09-19 At&T Corp. Frame erasure concealment technique for a bitstream-based feature extractor
US20010041981A1 (en) * 2000-02-22 2001-11-15 Erik Ekudden Partial redundancy encoding of speech
FI115178B (fi) * 2000-10-31 2005-03-15 Nokia Corp Menetelmä ja järjestely bittien suojaamiseksi parhaalla mahdollisella tavalla tiedonsiirtovirheitä vastaan
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
KR100440055B1 (ko) * 2002-05-02 2004-07-14 엘지전자 주식회사 보코더 및 그 보코더를 이용한 비트 오류율 시험 방법
US7321559B2 (en) * 2002-06-28 2008-01-22 Lucent Technologies Inc System and method of noise reduction in receiving wireless transmission of packetized audio signals
US7047475B2 (en) * 2003-02-04 2006-05-16 Hewlett-Packard Development Company, L.P. CRC encoding scheme for conveying status information
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP4542405B2 (ja) * 2004-09-30 2010-09-15 株式会社ケンウッド ベースバンド信号生成装置、ベースバンド信号生成方法及びプログラム
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
MX2010003638A (es) * 2007-10-15 2010-04-21 Lg Electronics Inc Un metodo y un aparato para procesar una se?al.
US20110026581A1 (en) * 2007-10-16 2011-02-03 Nokia Corporation Scalable Coding with Partial Eror Protection
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
WO2011144112A2 (zh) * 2011-05-27 2011-11-24 华为技术有限公司 语音信号处理方法、装置和接入网系统
BR112014009647B1 (pt) * 2011-10-24 2021-11-03 Koninklijke Philips N.V. Aparelho de atenuação do ruído e método de atenuação do ruído
CN111370009B (zh) * 2013-10-18 2023-12-22 弗朗霍夫应用科学研究促进协会 使用语音相关的频谱整形信息编码音频信号和解码音频信号的概念
CA2927722C (en) * 2013-10-18 2018-08-07 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
JP7240387B2 (ja) * 2018-05-11 2023-03-15 株式会社三共製作所 角度検出器

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5073940A (en) * 1989-11-24 1991-12-17 General Electric Company Method for protecting multi-pulse coders from fading and random pattern bit errors
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
US5255343A (en) * 1992-06-26 1993-10-19 Northern Telecom Limited Method for detecting and masking bad frames in coded speech signals
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004310088A (ja) * 2003-04-01 2004-11-04 Digital Voice Systems Inc 半レート・ボコーダ
JP2006523971A (ja) * 2003-04-17 2006-10-19 トムソン ライセンシング データストリングを復号化する方法

Also Published As

Publication number Publication date
KR19990037152A (ko) 1999-05-25
EP0910066A3 (en) 2000-03-29
EP0910066A2 (en) 1999-04-21
US6230124B1 (en) 2001-05-08
CN1221169A (zh) 1999-06-30
CN1154283C (zh) 2004-06-16

Similar Documents

Publication Publication Date Title
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
JPH11122120A (ja) 符号化方法及び装置、並びに復号化方法及び装置
JP3343965B2 (ja) 音声符号化方法及び復号化方法
US8595002B2 (en) Half-rate vocoder
US20020077812A1 (en) Voice code conversion apparatus
EP1598811B1 (en) Decoding apparatus and method
GB2324689A (en) Dual subframe quantisation of spectral magnitudes
KR100526829B1 (ko) 음성부호화방법및장치음성복호화방법및장치
US10607624B2 (en) Signal codec device and method in communication system
KR20060135699A (ko) 신호 복호화 장치 및 신호 복호화 방법
CA2293165A1 (en) Method for transmitting data in wireless speech channels
JPH06204983A (ja) 音声符号化の誤り制御方法
KR20010005669A (ko) 래그 파라미터의 부호화 방법 및 그 장치, 그리고 부호 리스트 작성 방법
JP2962623B2 (ja) 音声符号の誤り検出方法
JPH11119798A (ja) 音声符号化方法及び装置、並びに音声復号化方法及び装置
Sasaki et al. A low bit rate speech codec using mixed excitation linear prediction for private mobile radio
Fumoto et al. A low‐bit‐rate speech codec using multiband excitation and LPC modeling of harmonic magnitudes for private mobile radio
JPH07143075A (ja) 音声符号化通信方式及びその装置
JPH11316600A (ja) ラグパラメ―タの符号化方法及びその装置並びに符号帳作成方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040803

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041201