JPH03132228A - 直交変換信号符号化復号化方式 - Google Patents
直交変換信号符号化復号化方式Info
- Publication number
- JPH03132228A JPH03132228A JP1271010A JP27101089A JPH03132228A JP H03132228 A JPH03132228 A JP H03132228A JP 1271010 A JP1271010 A JP 1271010A JP 27101089 A JP27101089 A JP 27101089A JP H03132228 A JPH03132228 A JP H03132228A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- gain control
- orthogonal transform
- encoding method
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000009466 transformation Effects 0.000 title claims abstract description 11
- 230000003044 adaptive effect Effects 0.000 claims abstract description 18
- 230000005236 sound signal Effects 0.000 claims abstract description 13
- 238000000034 method Methods 0.000 claims description 40
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000000630 rising effect Effects 0.000 claims description 5
- 230000006978 adaptation Effects 0.000 claims 1
- 230000011218 segmentation Effects 0.000 claims 1
- 238000013139 quantization Methods 0.000 abstract description 25
- 238000001514 detection method Methods 0.000 abstract description 16
- 230000001052 transient effect Effects 0.000 abstract description 13
- 230000007423 decrease Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 14
- 230000008859 change Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- FBOUIAKEJMZPQG-AWNIVKPZSA-N (1E)-1-(2,4-dichlorophenyl)-4,4-dimethyl-2-(1,2,4-triazol-1-yl)pent-1-en-3-ol Chemical compound C1=NC=NN1/C(C(O)C(C)(C)C)=C/C1=CC=C(Cl)C=C1Cl FBOUIAKEJMZPQG-AWNIVKPZSA-N 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、DCT (Discrete Co51n
e Transrors)。
e Transrors)。
DFT (Dlscrete Pourler Tr
ansform)等の直交変換を用いた音声符号化にお
いて、量子化ノイズによる信号の劣化が減少するように
、時間軸上での前処理す、るようにした直交変換(音声
)信号符号化(復合化)方式に関する。
ansform)等の直交変換を用いた音声符号化にお
いて、量子化ノイズによる信号の劣化が減少するように
、時間軸上での前処理す、るようにした直交変換(音声
)信号符号化(復合化)方式に関する。
(従来の技術)
デジタル音声信号の圧縮符号化において、高品位でしか
も低いビットレート(例えば4 b1ts/5aspl
a以下)の符号化を行う場合には、DCT。
も低いビットレート(例えば4 b1ts/5aspl
a以下)の符号化を行う場合には、DCT。
DFT等を用いた直交変換符号化が用いられる。
その基本的なブロック図を第8図に示す。これは量子化
において信号レベルに応じて量子化ステップサイズを可
変するような非一様量子化(対数量子化等)を行う場合
である。
において信号レベルに応じて量子化ステップサイズを可
変するような非一様量子化(対数量子化等)を行う場合
である。
1は入力信号(音声信号)が入力されるウィンド回路(
手段) (lflndovlng and Frame
Bul’fer)、2は直交変換回路(手段)(DP
T、DCT等)、3は量子化回路(手段) (Quan
tlzation)、4は符号化回路(手段) (Co
der)であり、これらの符号化部により入力された(
音声)信号が符号化される。
手段) (lflndovlng and Frame
Bul’fer)、2は直交変換回路(手段)(DP
T、DCT等)、3は量子化回路(手段) (Quan
tlzation)、4は符号化回路(手段) (Co
der)であり、これらの符号化部により入力された(
音声)信号が符号化される。
5は復合化回路(手段) (Decoder) 、6は
逆量子化回路(手段) (Dequantizatlo
n)、7は直交変換回路(手段) (IDET、 I
DcT) 、8はウィンド回路(手段) (lNndo
ving and Addltlon)であり、これら
の復合部により入力された符号化信号が復合化されて出
力される。
逆量子化回路(手段) (Dequantizatlo
n)、7は直交変換回路(手段) (IDET、 I
DcT) 、8はウィンド回路(手段) (lNndo
ving and Addltlon)であり、これら
の復合部により入力された符号化信号が復合化されて出
力される。
同図の構成から明らかなように、直交変換(直交逆変換
)に際しては、ウィンド回路2(,6)によるブロック
長処理が必要である。
)に際しては、ウィンド回路2(,6)によるブロック
長処理が必要である。
一方、第9図(A)及び(B)は、カスタネット及びト
ライアングルの信号の時間波形を示している。
ライアングルの信号の時間波形を示している。
このように、これらの楽器の音は、極めて急峻なトラン
ジェントを持っており、音の立ち上がり。
ジェントを持っており、音の立ち上がり。
立ち下がりの前後で、振幅レベルの差が非常に大きい。
ここで、DCT、DFTを行なう単位のサンプルブロッ
ク長として、これらのトランジェントより十分長い値(
−船釣にはサンプリング周波数48kl(z時に258
〜204Bサンプル、11〜41ssec)を用いると
、ブロックの中には、大振幅の部分と小振幅の部分が混
在することになる。
ク長として、これらのトランジェントより十分長い値(
−船釣にはサンプリング周波数48kl(z時に258
〜204Bサンプル、11〜41ssec)を用いると
、ブロックの中には、大振幅の部分と小振幅の部分が混
在することになる。
これらの信号に非一様量子化を施した場合には量子化ノ
イズが生じる。量子化ノイズの時間軸上での分布の様子
を第10図(A)及び(B)に示す。
イズが生じる。量子化ノイズの時間軸上での分布の様子
を第10図(A)及び(B)に示す。
同図から明らかなように原信号の大振幅部の量子化によ
る量子化ノイズが、時間軸上では、はぼブロック全体に
及び、原信号の微小振幅部のパワーを上回ってしまう。
る量子化ノイズが、時間軸上では、はぼブロック全体に
及び、原信号の微小振幅部のパワーを上回ってしまう。
結果として、この量子化ノイズは、信号の立ち上がりに
付帯するノイズとして検知される。
付帯するノイズとして検知される。
(発明が解決しようとする課題)
上述のように、従来の方法では、極めて急峻なトランジ
ェントを持つ音楽信号の符号化において、非一様量子化
に伴う量子化ノイズが検知されやすいという問題点があ
った。
ェントを持つ音楽信号の符号化において、非一様量子化
に伴う量子化ノイズが検知されやすいという問題点があ
った。
(課題を解決するための手段)
本発明は上記課題を解決するため、ブロック単位の直交
変換・直交逆変換を用いた音声信号の符号化・復合化方
式において、前記ブロックよりも時間的に短いセグメン
ト単位で、前記音声信号のパワーレベルを求め、このパ
ワーレベルからゲイン制御信号を生成して、ゲイン制御
信号に応じた所定の適応ゲイン制御を行なう前処理をし
、この前処理した後に直交変換を用いて符号化して、符
号化信号とともに前記ゲイン制御信号を出力すると共に
、入力された前記符号化信号を直交逆変換した後に、前
記ゲイン制御信号に応じて逆ゲイン制御する後処理をし
て音声信号を復合するようにしたことを特徴とする直交
変換音声符号化復合化方式を提供するものである。
変換・直交逆変換を用いた音声信号の符号化・復合化方
式において、前記ブロックよりも時間的に短いセグメン
ト単位で、前記音声信号のパワーレベルを求め、このパ
ワーレベルからゲイン制御信号を生成して、ゲイン制御
信号に応じた所定の適応ゲイン制御を行なう前処理をし
、この前処理した後に直交変換を用いて符号化して、符
号化信号とともに前記ゲイン制御信号を出力すると共に
、入力された前記符号化信号を直交逆変換した後に、前
記ゲイン制御信号に応じて逆ゲイン制御する後処理をし
て音声信号を復合するようにしたことを特徴とする直交
変換音声符号化復合化方式を提供するものである。
(作用)
上記直交変換符号化復合化方式によれば、音声信号のパ
ワーレベルに応じて適応ゲイン制御され、ノイズレベル
が音声信号のパワーレベルに対して相対的に減少する。
ワーレベルに応じて適応ゲイン制御され、ノイズレベル
が音声信号のパワーレベルに対して相対的に減少する。
(実施例)
本発明になる直交変換符号化復合方式の一実施例を第1
図〜第7図を参照して詳細に説明する。
図〜第7図を参照して詳細に説明する。
く符号化復合化方式の概要〉
本発明は、符号時、直交変換前の時間軸上で、直交変換
ブロック長よりも十分短いセグメント長を設定し、その
セグメント内の信号パワーレベルを算出し、急峻なトラ
ンジェント(瞬間的な変化点)を検知することにより、
小レベル部分でゲインを大きく、大レベル部分でゲイン
を小さくするという適応ゲイン制御を行なうもので、復
合時(直交逆変換後)には、逆ゲイン制御を施すことに
より、量子化ノイズを抑圧するという、時間波形エンベ
ロープ処理を付加したものである。
ブロック長よりも十分短いセグメント長を設定し、その
セグメント内の信号パワーレベルを算出し、急峻なトラ
ンジェント(瞬間的な変化点)を検知することにより、
小レベル部分でゲインを大きく、大レベル部分でゲイン
を小さくするという適応ゲイン制御を行なうもので、復
合時(直交逆変換後)には、逆ゲイン制御を施すことに
より、量子化ノイズを抑圧するという、時間波形エンベ
ロープ処理を付加したものである。
上記時間波形エンベロープ処理を付加することにより、
原信号の小レベル部分での復合後の量子化ノイズレベル
は、第7図に示したように、信号レベルに対して相対的
に減少させられる。したがって、急峻なトランジェント
を持つ信号で問題となる、立ち上がり時の量子化ノイズ
を軽減し、検知されにくくすることができる。
原信号の小レベル部分での復合後の量子化ノイズレベル
は、第7図に示したように、信号レベルに対して相対的
に減少させられる。したがって、急峻なトランジェント
を持つ信号で問題となる、立ち上がり時の量子化ノイズ
を軽減し、検知されにくくすることができる。
なお、ゲイン制御とは、第6図(A)及び(B)に示す
ように、パワーレベルの大きいところではそのゲインを
小さくシ、パワーレベルの小さいところではそのゲイン
を大きくすることである。
ように、パワーレベルの大きいところではそのゲインを
小さくシ、パワーレベルの小さいところではそのゲイン
を大きくすることである。
また、第2図に示すように前記セグメント長は、102
4サンプルの1ブロツク長に対して、人間の聴覚の時間
分解能が約1 m5ecであるのを考慮し、64サンプ
ル(約1.31sec、 f −48kHz)と設定
されている。各セグメントにおいて、64サンプルのト
ータルパワーをそのセグメントのパワーとし、それを基
にしてトランジェントの検出を行なっている。
4サンプルの1ブロツク長に対して、人間の聴覚の時間
分解能が約1 m5ecであるのを考慮し、64サンプ
ル(約1.31sec、 f −48kHz)と設定
されている。各セグメントにおいて、64サンプルのト
ータルパワーをそのセグメントのパワーとし、それを基
にしてトランジェントの検出を行なっている。
く符号化装置・復合化装置の構成〉
第1図に示すように、符号化装置中、ウィンド回路(手
段)(フレームバッファーを含む)1、直交変換回路(
手段)2、量子化回路(手段)3、符号化回路(手段)
(コーグ)4からなる符号化部の前段には、セグメント
パワー検出回路(手段)10、トランジェント検出回路
(手段)11、適応ゲイン制御回路(手段)12からな
る前処理部が設けられている。
段)(フレームバッファーを含む)1、直交変換回路(
手段)2、量子化回路(手段)3、符号化回路(手段)
(コーグ)4からなる符号化部の前段には、セグメント
パワー検出回路(手段)10、トランジェント検出回路
(手段)11、適応ゲイン制御回路(手段)12からな
る前処理部が設けられている。
セグメントパワー検出回路]+0は、後述するように入
力された音声信号の64サンプル分のセグメントパワー
(レベル)を求めて、次段のトランジェント検出回路1
1へ出力する。トランジェント検出回路11は、所定の
スレッシニルド値と前記セグメントパワーとを比較しゲ
イン制御信号を生成して、”次段の適応ゲイン制御回路
12を制御する。人力された音声信号は、適応ゲイン制
御回路12でゲイン制御されて、次段以降の符号化部で
符号化される。符号化信号は、前記ゲイン制御信号(サ
イド情報)とともに、復合化装置に伝送される。
力された音声信号の64サンプル分のセグメントパワー
(レベル)を求めて、次段のトランジェント検出回路1
1へ出力する。トランジェント検出回路11は、所定の
スレッシニルド値と前記セグメントパワーとを比較しゲ
イン制御信号を生成して、”次段の適応ゲイン制御回路
12を制御する。人力された音声信号は、適応ゲイン制
御回路12でゲイン制御されて、次段以降の符号化部で
符号化される。符号化信号は、前記ゲイン制御信号(サ
イド情報)とともに、復合化装置に伝送される。
一方、復合化装置には、復合化回路(手段)(デコーダ
)5、逆量子化回路(手段)6、直交逆変換回路(手段
)7、ウィンド回路(手段)(合算回路を含む)8から
なる復合部が構成されている。
)5、逆量子化回路(手段)6、直交逆変換回路(手段
)7、ウィンド回路(手段)(合算回路を含む)8から
なる復合部が構成されている。
そして、復合化部の後段には、後処理用の逆ゲイン制御
回路13が設けられている。この逆ゲイン制御回路13
は、前記ゲイン制御信号(サイド情報)に応じて前記復
合化部で復合された音声信号のゲインを逆制御して、元
のレベルに戻して最終出力するものである。
回路13が設けられている。この逆ゲイン制御回路13
は、前記ゲイン制御信号(サイド情報)に応じて前記復
合化部で復合された音声信号のゲインを逆制御して、元
のレベルに戻して最終出力するものである。
くトランジェント検出回路による検出方法〉次に、トラ
ンジェント検出回路11の具体的構成と動作について説
明する。
ンジェント検出回路11の具体的構成と動作について説
明する。
トランジェント検出の方法としては、絶対スレッシュホ
ルド(threshold)方式と、前後セグメントと
の比較方式(相対比較方式)がある。
ルド(threshold)方式と、前後セグメントと
の比較方式(相対比較方式)がある。
■絶対スレッシュホルド(threshold)方式こ
の方式における、トランジェント検出及び適応ゲイン制
御の例を第3図(A)及び(B)に示す。
の方式における、トランジェント検出及び適応ゲイン制
御の例を第3図(A)及び(B)に示す。
同図(A)はセグメントパワーの時間変化、同図(B)
はそれに対応したゲイン制御を示す図である。ここでは
「1」と「8」との2のゲインを設定し、初期値を「8
」とする。
はそれに対応したゲイン制御を示す図である。ここでは
「1」と「8」との2のゲインを設定し、初期値を「8
」とする。
セグメントパワーがある一定レベル(立ち上がりレベル
)を超えた時に立ち上りを検出し、それに応じてゲイン
を1まで降下させる。次にセグメントパワーがある一定
レベル(立ち下がりレベル)を下回った時点で立ち下り
を検出し、それに応じてゲインを8まで戻す。この操作
のくり返しが適応ゲイン制御である。ゲイン設定値は、
ゲイン制御信号としてサイド情報の形で伝送される。
)を超えた時に立ち上りを検出し、それに応じてゲイン
を1まで降下させる。次にセグメントパワーがある一定
レベル(立ち下がりレベル)を下回った時点で立ち下り
を検出し、それに応じてゲインを8まで戻す。この操作
のくり返しが適応ゲイン制御である。ゲイン設定値は、
ゲイン制御信号としてサイド情報の形で伝送される。
ここで、このようにゲインを変化させることは、時間軸
上で窓関数を掛は合わせたことと等しく、その影、響は
周波数軸上へも及ぶ。ゲインの変化を急峻に行なうと、
周波数軸上での好ましくないスペクトルの広力(りを引
き起こす。このためこの影響を小さくするために、ゲイ
ンの変化は、滑らかな非一直線的、例えば正弦波形状と
し、レベル変化の起こるセグメント境界に対して前後3
2サンプルで変化を完了させるようにしている(第3図
(B)の実線と点線参照)。
上で窓関数を掛は合わせたことと等しく、その影、響は
周波数軸上へも及ぶ。ゲインの変化を急峻に行なうと、
周波数軸上での好ましくないスペクトルの広力(りを引
き起こす。このためこの影響を小さくするために、ゲイ
ンの変化は、滑らかな非一直線的、例えば正弦波形状と
し、レベル変化の起こるセグメント境界に対して前後3
2サンプルで変化を完了させるようにしている(第3図
(B)の実線と点線参照)。
立ち上りレベルと立ち下りレベルの設定値は入力信号に
応じて変更する必要がある。一般に、立ち上がりのトラ
ンジェントに対して、立ち下がりのそれは緩やかである
ことが多い。したがって、第4図(A)及び(B)に示
すように、立ち下がりレベルは立ち上がりレベルに対し
て低く設定し、ゲインが1である区間を長くする方が良
い。
応じて変更する必要がある。一般に、立ち上がりのトラ
ンジェントに対して、立ち下がりのそれは緩やかである
ことが多い。したがって、第4図(A)及び(B)に示
すように、立ち下がりレベルは立ち上がりレベルに対し
て低く設定し、ゲインが1である区間を長くする方が良
い。
0前後セグメントとの比較方式(相対比較方式)前記方
式は、トランジェントの検出を固定レベルとの比較で行
うので簡潔ではあるが、信号によってはゲイン変化の回
数が不必要に多くなる可能性がある。
式は、トランジェントの検出を固定レベルとの比較で行
うので簡潔ではあるが、信号によってはゲイン変化の回
数が不必要に多くなる可能性がある。
相対比較方式では、常に2つのセグメントパワーを監視
し、その相対値(例えば両者の比、両者の差分、両者の
差分の絶対値など)がある一定レベルを超えた時点で立
ち上りを検知し、一定レベルを下回った時に立ち下りを
検知する。トランジェント検知の部分以外は、前記■方
式と同様に行う。この方式では、信号の種類が異なる場
合でも(相対)レベル設定値を変更する必要がない。
し、その相対値(例えば両者の比、両者の差分、両者の
差分の絶対値など)がある一定レベルを超えた時点で立
ち上りを検知し、一定レベルを下回った時に立ち下りを
検知する。トランジェント検知の部分以外は、前記■方
式と同様に行う。この方式では、信号の種類が異なる場
合でも(相対)レベル設定値を変更する必要がない。
■混合型方式
さらには、前記■と■の双方の方式を組合わせてもよい
。例えば相対比較で隣接セグメント間で20dBの振幅
差があり、かつ一定レベル以上の振幅のときにトランジ
ェント検出してゲイン制御を行い(ゲインを下げ)、絶
対的な一定レベルより低いレベルになっときに元に戻す
(ゲインを上げる)ようにしてもよい。又、ブロック境
界で元に戻す方法もある。
。例えば相対比較で隣接セグメント間で20dBの振幅
差があり、かつ一定レベル以上の振幅のときにトランジ
ェント検出してゲイン制御を行い(ゲインを下げ)、絶
対的な一定レベルより低いレベルになっときに元に戻す
(ゲインを上げる)ようにしてもよい。又、ブロック境
界で元に戻す方法もある。
■複数段型方式
元に戻す(ゲインを上げる)のを2段階以上にする方法
もある。第5図(A)及び(B)はこの動作を示−して
おり、立ち下がりの早い音は1段階で元に戻り、立ち下
がりの長い音は2段階で元に戻ることにより;第4図(
A)及び(B)と比較して量子化ノイズの急激な変動を
さけている。
もある。第5図(A)及び(B)はこの動作を示−して
おり、立ち下がりの早い音は1段階で元に戻り、立ち下
がりの長い音は2段階で元に戻ることにより;第4図(
A)及び(B)と比較して量子化ノイズの急激な変動を
さけている。
(発明の効果)
以上詳述したように、本発明によれば、例えばカスタネ
ットやトライアングルのように極めて急峻なトランジェ
ントを有する信号に対して、直交変換符号化を行なう場
合に生じる、立ち上がりに伴う量子化ノイズが抑圧され
、高品位な符号化を行なうことが可能となる。
ットやトライアングルのように極めて急峻なトランジェ
ントを有する信号に対して、直交変換符号化を行なう場
合に生じる、立ち上がりに伴う量子化ノイズが抑圧され
、高品位な符号化を行なうことが可能となる。
第1図〜第7因は本発明になる直交変換信号符号化復合
化方式の一実施例を示す図で、第1図は基本ブロック図
、第2図はセグメント(単位)の説明図、第3図(A)
及び(B)はセグメントパワーによるゲイン制御を示す
図、第4図(A)及び(B)は変形例を説明する図、第
5図(A)及び(B)は他の変形例を説、明する図、第
6図(A)及び(B)は適応ゲイン制御の概念を示す図
、第7図は本発明により量子化ノイズが低減された様子
を示す図、第8図はDCT、DFT等を用いる直交変換
符号化復合化の基本的なブロック図、第9図(A)及び
(B)は急峻なトランジェントを持つ信号波形の例とし
て、カスタネットの波形とトライアングルの波形を示す
図、第10図(A)及び(B)は非線形量子化により量
子化ノイズが時間軸上でブロック全体に広がる様子を示
す図である。 1・・・ウィンド回路、 2・・・直交変換回路(DFT、DCT)、3・・・量
子化回路、4・・・符号化回路(コーグ)、5・・・復
合化回路(デコーダ)、6・・・逆量子化回路、7・・
・直交逆変換回路(IDFT、 IDCT)、8・・・
ウィンド回路、 10・・・セグメントパワー検出回路、11・・・トラ
ンジェント検出回路、 12・・・適応ゲイン制御回路、 13・・・逆ゲイン制御回路。 算 6 図 ″菫r7冒 0 閣
化方式の一実施例を示す図で、第1図は基本ブロック図
、第2図はセグメント(単位)の説明図、第3図(A)
及び(B)はセグメントパワーによるゲイン制御を示す
図、第4図(A)及び(B)は変形例を説明する図、第
5図(A)及び(B)は他の変形例を説、明する図、第
6図(A)及び(B)は適応ゲイン制御の概念を示す図
、第7図は本発明により量子化ノイズが低減された様子
を示す図、第8図はDCT、DFT等を用いる直交変換
符号化復合化の基本的なブロック図、第9図(A)及び
(B)は急峻なトランジェントを持つ信号波形の例とし
て、カスタネットの波形とトライアングルの波形を示す
図、第10図(A)及び(B)は非線形量子化により量
子化ノイズが時間軸上でブロック全体に広がる様子を示
す図である。 1・・・ウィンド回路、 2・・・直交変換回路(DFT、DCT)、3・・・量
子化回路、4・・・符号化回路(コーグ)、5・・・復
合化回路(デコーダ)、6・・・逆量子化回路、7・・
・直交逆変換回路(IDFT、 IDCT)、8・・・
ウィンド回路、 10・・・セグメントパワー検出回路、11・・・トラ
ンジェント検出回路、 12・・・適応ゲイン制御回路、 13・・・逆ゲイン制御回路。 算 6 図 ″菫r7冒 0 閣
Claims (8)
- (1)ブロック単位の直交変換を用いた信号の符号化方
式において、 前記ブロックよりも時間的に短いセグメント単位で前記
信号のパワーレベルを求めて、このパワーレベルに応じ
て所定の適応ゲイン制御を行なった後、信号を符号化す
るようにしたことを特徴とする直交変換信号符号化方式
。 - (2)請求項第1項記載の直交変換信号符号化方式にお
いて、セグメント単位のパワーレベルと比較されるスレ
ッシュホルド値を設けて適応ゲイン制御を行なうように
したことを特徴とする直交変換信号符号化方式。 - (3)請求項第2項記載の直交変換信号符号化方式にお
いて、信号の立ち上がり時のスレッシュホルド値に対し
て信号の立ち下がり時のスレッシュホルド値を低く設定
したことを特徴とする直交変換信号符号化方式。 - (4)請求項第1項記載の直交変換信号符号化方式にお
いて、前後するセグメント単位のパワーレベルの相対値
に応じて適応ゲイン制御を行なうように構成したことを
特徴とする直交変換信号符号化方式。 - (5)請求項第1項記載の直交変換符号化方式において
、セグメント境界での適応ゲイン制御を非一直線的にし
たことを特徴とする直交変換信号符号化方式。 - (6)請求項第1項記載の直交変換信号符号化方式にお
いて、セグメント単位のパワーレベルと比較されるスレ
ッシュホルド値による適応ゲイン制御と、前後するセグ
メント単位のパワーレベルの相対値に応じた適応ゲイン
制御とを併設したことを特徴とする直交変換信号符号化
方式。 - (7)請求項第2項記載の直交変換信号符号化方式にお
いて、信号の立ち下がり時のスレッシュホルド値を複数
設定したことを特徴とする直交変換信号符号化方式。 - (8)ブロック単位の直交変換・直交逆変換を用いた音
声信号の符号化・復合化方式において、前記ブロックよ
りも時間的に短いセグメント単位で、前記音声信号のパ
ワーレベルを求め、このパワーレベルからゲイン制御信
号を生成して、ゲイン制御信号に応じた所定の適応ゲイ
ン制御を行なう前処理をし、 この前処理した後に直交変換を用いて符号化して、符号
化信号とともに前記ゲイン制御信号を出力すると共に、 入力された前記符号化信号を直交逆変換した後に、前記
ゲイン制御信号に応じて逆ゲイン制御する後処理をして
音声信号を復合するようにしたことを特徴とする直交変
換音声符号化復合化方式。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1271010A JPH03132228A (ja) | 1989-10-18 | 1989-10-18 | 直交変換信号符号化復号化方式 |
| US07/597,706 US5117228A (en) | 1989-10-18 | 1990-10-17 | System for coding and decoding an orthogonally transformed audio signal |
| DE69029890T DE69029890T2 (de) | 1989-10-18 | 1990-10-18 | System zur Codierung und Decodierung eines orthogonal transformierten Audiosignals |
| EP90311471A EP0424161B1 (en) | 1989-10-18 | 1990-10-18 | System for coding and decoding an orthogonally transformed audio signal |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1271010A JPH03132228A (ja) | 1989-10-18 | 1989-10-18 | 直交変換信号符号化復号化方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03132228A true JPH03132228A (ja) | 1991-06-05 |
Family
ID=17494155
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1271010A Pending JPH03132228A (ja) | 1989-10-18 | 1989-10-18 | 直交変換信号符号化復号化方式 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US5117228A (ja) |
| EP (1) | EP0424161B1 (ja) |
| JP (1) | JPH03132228A (ja) |
| DE (1) | DE69029890T2 (ja) |
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03263925A (ja) * | 1990-03-14 | 1991-11-25 | Sony Corp | デイジタルデータの高能率符号化方法 |
| WO1995021489A1 (en) * | 1994-02-04 | 1995-08-10 | Sony Corporation | Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method |
| US5502789A (en) * | 1990-03-07 | 1996-03-26 | Sony Corporation | Apparatus for encoding digital data with reduction of perceptible noise |
| US5752224A (en) * | 1994-04-01 | 1998-05-12 | Sony Corporation | Information encoding method and apparatus, information decoding method and apparatus information transmission method and information recording medium |
| US5825320A (en) * | 1996-03-19 | 1998-10-20 | Sony Corporation | Gain control method for audio encoding device |
| US5960390A (en) * | 1995-10-05 | 1999-09-28 | Sony Corporation | Coding method for using multi channel audio signals |
| US5974379A (en) * | 1995-02-27 | 1999-10-26 | Sony Corporation | Methods and apparatus for gain controlling waveform elements ahead of an attack portion and waveform elements of a release portion |
| WO2001097498A1 (fr) * | 2000-06-12 | 2001-12-20 | Nec Corporation | Systeme de transmission de signal de service pour abonne |
| WO2002049218A1 (fr) * | 2000-12-14 | 2002-06-20 | Sony Corporation | Codeur et decodeur |
| JP2007272238A (ja) * | 2000-12-14 | 2007-10-18 | Sony Corp | 符号化装置および方法、復号装置および方法、並びに記録媒体 |
Families Citing this family (31)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2083709A1 (en) * | 1991-03-29 | 1992-09-30 | Kenzo Akagiri | Coding apparatus or method for digital audio signal |
| ES2164640T3 (es) * | 1991-08-02 | 2002-03-01 | Sony Corp | Codificador digital con asignacion dinamica de bits de cuantificacion. |
| DE69227570T2 (de) * | 1991-09-30 | 1999-04-22 | Sony Corp., Tokio/Tokyo | Verfahren und Anordnung zur Audiodatenkompression |
| JP3134455B2 (ja) * | 1992-01-29 | 2001-02-13 | ソニー株式会社 | 高能率符号化装置及び方法 |
| JP3153933B2 (ja) * | 1992-06-16 | 2001-04-09 | ソニー株式会社 | データ符号化装置及び方法並びにデータ復号化装置及び方法 |
| JP3127600B2 (ja) * | 1992-09-11 | 2001-01-29 | ソニー株式会社 | ディジタル信号復号化装置及び方法 |
| JP3508146B2 (ja) * | 1992-09-11 | 2004-03-22 | ソニー株式会社 | ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置 |
| JP3343962B2 (ja) * | 1992-11-11 | 2002-11-11 | ソニー株式会社 | 高能率符号化方法及び装置 |
| JP3185413B2 (ja) * | 1992-11-25 | 2001-07-09 | ソニー株式会社 | 直交変換演算並びに逆直交変換演算方法及びその装置、ディジタル信号符号化及び/又は復号化装置 |
| JP3123286B2 (ja) * | 1993-02-18 | 2001-01-09 | ソニー株式会社 | ディジタル信号処理装置又は方法、及び記録媒体 |
| JP3123290B2 (ja) * | 1993-03-09 | 2001-01-09 | ソニー株式会社 | 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体 |
| JP3173218B2 (ja) * | 1993-05-10 | 2001-06-04 | ソニー株式会社 | 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体 |
| US5717821A (en) * | 1993-05-31 | 1998-02-10 | Sony Corporation | Method, apparatus and recording medium for coding of separated tone and noise characteristic spectral components of an acoustic sibnal |
| KR100368854B1 (ko) * | 1993-06-30 | 2003-05-17 | 소니 가부시끼 가이샤 | 디지털신호의부호화장치,그의복호화장치및기록매체 |
| TW272341B (ja) * | 1993-07-16 | 1996-03-11 | Sony Co Ltd | |
| TW327223B (en) * | 1993-09-28 | 1998-02-21 | Sony Co Ltd | Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal |
| EP0692880B1 (en) * | 1993-11-04 | 2001-09-26 | Sony Corporation | Signal encoder, signal decoder, recording medium and signal encoding method |
| WO1995013660A1 (en) * | 1993-11-09 | 1995-05-18 | Sony Corporation | Quantization apparatus, quantization method, high efficiency encoder, high efficiency encoding method, decoder, high efficiency encoder and recording media |
| US6167093A (en) * | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
| JP3371590B2 (ja) * | 1994-12-28 | 2003-01-27 | ソニー株式会社 | 高能率符号化方法及び高能率復号化方法 |
| JPH08223049A (ja) * | 1995-02-14 | 1996-08-30 | Sony Corp | 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法 |
| US6233554B1 (en) * | 1997-12-12 | 2001-05-15 | Qualcomm Incorporated | Audio CODEC with AGC controlled by a VOCODER |
| US7072477B1 (en) * | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
| US9711153B2 (en) | 2002-09-27 | 2017-07-18 | The Nielsen Company (Us), Llc | Activating functions in processing devices using encoded audio and detecting audio signatures |
| US8959016B2 (en) | 2002-09-27 | 2015-02-17 | The Nielsen Company (Us), Llc | Activating functions in processing devices using start codes embedded in audio |
| CN101228574A (zh) * | 2005-09-08 | 2008-07-23 | 北京阜国数字技术有限公司 | 一种控制前回声的编码和解码装置及方法 |
| US8359205B2 (en) | 2008-10-24 | 2013-01-22 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
| US8121830B2 (en) * | 2008-10-24 | 2012-02-21 | The Nielsen Company (Us), Llc | Methods and apparatus to extract data encoded in media content |
| US9667365B2 (en) | 2008-10-24 | 2017-05-30 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
| US8508357B2 (en) | 2008-11-26 | 2013-08-13 | The Nielsen Company (Us), Llc | Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking |
| JP2012525655A (ja) | 2009-05-01 | 2012-10-22 | ザ ニールセン カンパニー (ユー エス) エルエルシー | 一次ブロードキャストメディアコンテンツに関連する二次コンテンツを提供するための方法、機器、及び製造品 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE3540722C2 (de) * | 1985-11-16 | 1995-06-29 | Daimler Benz Aerospace Ag | Verfahren zur automatischen Pegelregelung |
| GB2186160B (en) * | 1986-01-24 | 1989-11-01 | Racal Data Communications Inc | Method and apparatus for processing speech signals |
| JPH0748695B2 (ja) * | 1986-05-23 | 1995-05-24 | 株式会社日立製作所 | 音声符号化方式 |
| BE1000643A5 (fr) * | 1987-06-05 | 1989-02-28 | Belge Etat | Procede de codage de signaux d'image. |
-
1989
- 1989-10-18 JP JP1271010A patent/JPH03132228A/ja active Pending
-
1990
- 1990-10-17 US US07/597,706 patent/US5117228A/en not_active Expired - Lifetime
- 1990-10-18 EP EP90311471A patent/EP0424161B1/en not_active Expired - Lifetime
- 1990-10-18 DE DE69029890T patent/DE69029890T2/de not_active Expired - Lifetime
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5502789A (en) * | 1990-03-07 | 1996-03-26 | Sony Corporation | Apparatus for encoding digital data with reduction of perceptible noise |
| JPH03263925A (ja) * | 1990-03-14 | 1991-11-25 | Sony Corp | デイジタルデータの高能率符号化方法 |
| WO1995021489A1 (en) * | 1994-02-04 | 1995-08-10 | Sony Corporation | Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method |
| US5752224A (en) * | 1994-04-01 | 1998-05-12 | Sony Corporation | Information encoding method and apparatus, information decoding method and apparatus information transmission method and information recording medium |
| US5974379A (en) * | 1995-02-27 | 1999-10-26 | Sony Corporation | Methods and apparatus for gain controlling waveform elements ahead of an attack portion and waveform elements of a release portion |
| US5960390A (en) * | 1995-10-05 | 1999-09-28 | Sony Corporation | Coding method for using multi channel audio signals |
| US5825320A (en) * | 1996-03-19 | 1998-10-20 | Sony Corporation | Gain control method for audio encoding device |
| WO2001097498A1 (fr) * | 2000-06-12 | 2001-12-20 | Nec Corporation | Systeme de transmission de signal de service pour abonne |
| WO2002049218A1 (fr) * | 2000-12-14 | 2002-06-20 | Sony Corporation | Codeur et decodeur |
| US7124076B2 (en) | 2000-12-14 | 2006-10-17 | Sony Corporation | Encoding apparatus and decoding apparatus |
| JP2007272238A (ja) * | 2000-12-14 | 2007-10-18 | Sony Corp | 符号化装置および方法、復号装置および方法、並びに記録媒体 |
| KR100817424B1 (ko) * | 2000-12-14 | 2008-03-27 | 소니 가부시끼 가이샤 | 부호화 장치 및 복호 장치 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP0424161B1 (en) | 1997-02-05 |
| EP0424161A2 (en) | 1991-04-24 |
| EP0424161A3 (en) | 1992-05-06 |
| DE69029890D1 (de) | 1997-03-20 |
| DE69029890T2 (de) | 1997-05-22 |
| US5117228A (en) | 1992-05-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH03132228A (ja) | 直交変換信号符号化復号化方式 | |
| JP7383067B2 (ja) | 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法 | |
| KR100348368B1 (ko) | 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체 | |
| JP4579273B2 (ja) | ステレオ音響信号の処理方法と装置 | |
| Berouti et al. | Enhancement of speech corrupted by acoustic noise | |
| US7995775B2 (en) | Automatic volume control for audio signals | |
| US10861475B2 (en) | Signal-dependent companding system and method to reduce quantization noise | |
| KR960032911A (ko) | 오디오 신호 압축 방법 | |
| US20040138876A1 (en) | Method and apparatus for artificial bandwidth expansion in speech processing | |
| PT1334484E (pt) | Melhorar o desempenho de sistemas de codificacao que utilizam metodos de reconstrucao a altas frequencias | |
| US20070129036A1 (en) | Method and apparatus to reconstruct a high frequency component | |
| US20050147262A1 (en) | Method for decreasing the dynamic range of a signal and electronic circuit | |
| US9978383B2 (en) | Method for processing speech/audio signal and apparatus | |
| CN105324815A (zh) | 信号处理装置和信号处理方法 | |
| CN101308656A (zh) | 音频暂态信号的编解码方法 | |
| EP3841572B1 (en) | Coding dense transient events with companding | |
| JPH03263925A (ja) | デイジタルデータの高能率符号化方法 | |
| Suzuki | Speech processing by splicing of autocorrelation function | |
| JP2002268657A (ja) | 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体 | |
| EP0986047A2 (en) | Audio encoding system | |
| JP3753956B2 (ja) | 符号化装置 | |
| JP3341440B2 (ja) | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体 | |
| US20060104460A1 (en) | Adaptive time-based noise suppression | |
| JP3263881B2 (ja) | 情報符号化方法及び装置、情報復号化方法及び装置並びに情報記録媒体及び情報伝送方法 | |
| JP3089690B2 (ja) | ディジタルデータの高能率符号化方法 |