JP2017203844A

JP2017203844A - 符号化装置、復号装置、通信システム

Info

Publication number: JP2017203844A
Application number: JP2016094625A
Authority: JP
Inventors: 亮神野; Akira Jinno
Original assignee: JVCKenwood Corp
Current assignee: JVCKenwood Corp
Priority date: 2016-05-10
Filing date: 2016-05-10
Publication date: 2017-11-16
Anticipated expiration: 2036-05-10
Also published as: JP6763194B2; US10056093B2; US20170330584A1

Abstract

【課題】音声の品質や明瞭度を改善する技術を提供する。【解決手段】第１符号化部４６ａは、音声信号における第１帯域の成分を符号化することによって第１符号化信号を生成する。周波数シフト部４４は、音声信号における第２帯域の成分であって、かつ第１帯域よりも高い周波数の第２帯域の成分を第１帯域に周波数シフトする。第２符号化部４６ｂは、周波数シフト部４４において周波数シフトした成分を符号化することによって第２符号化信号を生成する。出力部４８は、第１符号化部４６ａにおいて生成した第１符号化信号と第２符号化部４６ｂにおいて生成した第２符号化信号とを出力する。【選択図】図２

Description

本発明は、帯域拡張技術に関し、特に音声の帯域を拡張する符号化装置、復号装置、通信システムに関する。

通信システムにおける音声信号の品質を改善するために、送信側において、音声信号の周波数上限および周波数下限を規定する通過帯域内に閾値周波数が規定され、閾値周波数未満の周波数の音声信号は圧縮されない。一方、閾値周波数より高い周波数の音声信号は、閾値周波数から通過帯域の周波数上限の範囲内に圧縮して送信される。受信側において、圧縮された音声信号は拡張されるとともに、圧縮されていない音声信号に基づいて高調波情報が生成され、拡張した音声信号に対して、高調波情報に基づいて適切な高調波が追加される（例えば、特許文献１参照）。

特表２００８−５３７１７４号公報

低周波数を実質的に圧縮させずに残す一方で、閾値周波数より高い周波数に対して、強度な圧縮が適用される場合、受信側で拡張せずに圧縮されたまま再生されると、音声の品質や明瞭度が低下しうる。音声の品質や明瞭度を改善するためには、話者や言語に合わせた受信側でのイコライザ処理が必要となり、都度の調整がなされるべきである。帯域外の音声を再現する場合、受信した音声を解析しなければならないので、高度な音声信号処理によって処理負荷が増加したり、遅延処理によってスピーカ出力が遅れたり、不必要な信号の生成によって違和感のある音声が再生されたりする。

本発明はこうした状況に鑑みてなされたものであり、その目的は、音声の品質や明瞭度を改善する技術を提供することである。

上記課題を解決するために、本発明のある態様の符号化装置は、音声信号を入力する入力部と、入力部において入力した音声信号における第１帯域の成分を符号化することによって第１符号化信号を生成する第１符号化部と、入力部において入力した音声信号における第２帯域の成分であって、かつ第１帯域よりも高い周波数の第２帯域の成分を第１帯域に周波数シフトする周波数シフト部と、周波数シフト部において周波数シフトした成分を符号化することによって第２符号化信号を生成する第２符号化部と、第１符号化部において生成した第１符号化信号と第２符号化部において生成した第２符号化信号とを出力する出力部と、を備える。

本発明の別の態様は、復号装置である。この装置は、音声信号における第１帯域の成分を符号化した第１符号化信号と、音声信号における第２帯域の成分であって、かつ第１帯域よりも高い周波数の第２帯域の成分を第１帯域に周波数シフトして符号化した第２符号化信号とを入力する入力部と、入力部において入力した第１符号化信号を復号することによって第１帯域の第１音声成分を生成する第１復号部と、入力部において入力した第２符号化信号を復号することによって第１帯域の第２音声成分を生成する第２復号部と、第２復号部において生成した第２音声成分を第２帯域に周波数シフトする周波数シフト部と、第１復号部において生成した第１音声成分と周波数シフト部において周波数シフトした第２音声成分とを合成して出力する合成部と、を備える。

本発明のさらに別の態様は、通信システムである。この通信システムは、符号化装置と、復号装置とを備える。符号化装置は、音声信号を入力する入力部と、入力部において入力した音声信号における第１帯域の成分を符号化することによって第１符号化信号を生成する第１符号化部と、入力部において入力した音声信号における第２帯域の成分であって、かつ第１帯域よりも高い周波数の第２帯域の成分を第１帯域に周波数シフトする周波数シフト部と、周波数シフト部において周波数シフトした成分を符号化することによって第２符号化信号を生成する第２符号化部と、第１符号化部において生成した第１符号化信号と第２符号化部において生成した第２符号化信号とを出力する出力部とを備える。復号装置は、符号化装置からの第１符号化信号と第２符号化信号とを入力する入力部と、入力部において入力した第１符号化信号を復号することによって第１帯域の第１音声成分を生成する第１復号部と、入力部において入力した第２符号化信号を復号することによって第１帯域の第２音声成分を生成する第２復号部と、第２復号部において生成した第２音声成分を第２帯域に周波数シフトする周波数シフト部と、第１復号部において生成した第１音声成分と周波数シフト部において周波数シフトした第２音声成分とを合成して出力する合成部と、を備える。

なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。

本発明によれば、音声の品質や明瞭度を改善できる。

本発明の実施例１に係る通信システムの構成を示す図である。図１の符号化装置の構成を示す図である。図１の通信システムと比較される別の通信システムにおいて使用される信号のフォーマットを示す図である。図１の通信システムにおいて使用される信号のフォーマットを示す図である。図１の通信システムにおいて使用される信号の別のフォーマットを示す図である。図１の復号装置の構成を示す図である。図２の符号化装置による出力手順を示すフローチャートである。図７の帯域内符号化処理の手順を示すフローチャートである。図７の帯域外符号化処理の手順を示すフローチャートである。図６の復号装置による合成手順を示すフローチャートである。図１０の帯域内復号処理の手順を示すフローチャートである。図１０の帯域外復号処理の手順を示すフローチャートである。図１の符号化装置の別の構成を示す図である。図１の復号装置の別の構成を示す図である。本発明の実施例２に係る符号化装置の構成を示す図である。本発明の実施例２に係る復号装置の構成を示す図である。

（実施例１）
本発明を具体的に説明する前に、まず概要を述べる。本発明の実施例１は、送信装置から受信装置に音声信号を送信する通信システムに関する。通信システムがデジタル方式の無線通信システムである場合、音声信号の送信のためにボコーダ方式を使用する場合が多い。ボコーダ方式は、通信用の音声圧縮技術である。送信装置は、音声の波形を直接送信のではなくパラメータ化して送信し、受信装置は、受信したパラメータから元の音声を合成する。

このようなボコーダ方式では、一般的に、ナイキスト周波数以上の周波数成分が除去される。例えば、デジタル業務用無線システムの標準規格であるＮＸＤＮ（登録商標）では、ボコーダ方式として「ＡＭＢＥ（登録商標）＋２」が使用されるが、ＡＭＢＥ＋２においてサンプリング周波数は８ｋＨｚに設定されるので、４ｋＨｚで帯域制限がなされる。４ｋＨｚ以上の音声が失われる場合、音質および明瞭度が低下するおそれがある。音質や明瞭度を改善するためには、受信装置で高域を強調するイコライザ処理や、高度な信号処理での帯域拡張が必要となる。また、４ｋＨｚ以上の音声を再現する場合には、受信した音声の解析が必要となるので、前述のごとく、高度な音声信号処理による処理負荷の増加や、遅延処理によるスピーカ出力の遅れ、または不必要な信号まで生成してしまうことによる違和感のある音声の再生が生じる。

このような状況下において、簡易に音質や明瞭度を改善するために、本実施例に係る送信装置は、音声信号のうちの０〜４ｋＨｚの成分をボコーダ符号化するとともに、４〜８ｋＨｚの成分を０〜４ｋＨｚに周波数シフトしてからボコーダ符号化する。一方、受信装置は、後者のボコーダ符号化信号をボコーダ復号してから４〜８ｋＨｚに周波数シフトするとともに、これと、０〜４ｋＨｚのボコーダ符号化信号のボコーダ復号結果と合成することによって、０〜８ｋＨｚの音声を再生する。

図１は、実施例１に係る通信システム１００の構成を示す。通信システム１００は、送信装置１０、受信装置１２を含む。送信装置１０は、マイクロフォン２０、ＩＦ部２２、符号化装置２４、送信部２６を含み、受信装置１２は、受信部３０、復号装置３２、ＩＦ部３４、スピーカ３６を含む。なお、送信装置１０と受信装置１２は、端末装置のような無線装置あるいは通信装置に含まれているが、ここでは、説明を明瞭にするために、端末装置の送信機能に相当する送信装置１０と、端末装置の受信機能に相当する受信装置１２のみを示す。また、端末装置は直接接続されていなくてもよく、例えば、基地局装置を介して接続されてもよい。

マイクロフォン２０は、発話者の発した音声を入力し、これを電気信号に変換する。マイクロフォン２０は、電気信号に変換した音声（以下、「音声信号」という）をＩＦ部２２に出力する。ＩＦ部２２は、マイクロフォン２０からの音声信号を入力し、音声信号を符号化装置２４に出力する。その際、ＩＦ部２２は、音声信号に対して任意の処理を実行してもよい。符号化装置２４は、ＩＦ部２２からの音声信号を入力し、音声信号をボコーダ符号化することによって、第１符号化信号と第２符号化信号とを生成する。第１符号化信号と第２符号化信号の詳細は後述する。符号化装置２４は、第１符号化信号と第２符号化信号とを送信部２６に出力する。送信部２６は、符号化装置２４からの第１符号化信号と第２符号化信号とを入力し、これらが含められた無線信号を送信する。送信部２６は、例えば、ＮＸＤＮのようなデジタル業務用無線システムに対応する。

受信部３０は、送信部２６からの無線信号を受信する。受信部３０は、無線信号から第１符号化信号と第２符号化信号とを取得し、第１符号化信号と第２符号化信号とを復号装置３２に出力する。復号装置３２は、第１符号化信号と第２符号化信号とをボコーダ復号することによって、音声信号を生成する。復号装置３２は、音声信号をＩＦ部３４に出力する。ＩＦ部３４は、復号装置３２からの音声信号を入力し、音声信号をスピーカ３６に出力する。その際、ＩＦ部３４は、音声信号に対して、ＩＦ部２２での処理に対応した処理を実行してもよい。スピーカ３６は、ＩＦ部３４からの音声信号を入力し、音声信号を音声に変換して出力する。

図２は、符号化装置２４の構成を示す。符号化装置２４は、入力部４０、デシメーション部４２と総称される第１デシメーション部４２ａ、第２デシメーション部４２ｂ、第３デシメーション部４２ｃ、周波数シフト部４４、符号化部４６と総称される第１符号化部４６ａ、第２符号化部４６ｂ、出力部４８を含む。

入力部４０は、図示しないＩＦ部２２からの音声信号を入力する。入力した音声信号のサンプリング周波数は、例えば４８ｋＨｚである。入力部４０は、音声信号を第１デシメーション部４２ａ、第２デシメーション部４２ｂに出力する。

第１デシメーション部４２ａは、入力部４０からの音声信号を入力する。第１デシメーション部４２ａは、音声信号に対して、４８ｋＨｚのサンプリング周波数を８ｋＨｚにダウンサンプリングする。ダウンサンプリングした音声信号には、０〜４ｋＨｚの帯域内の音声成分が含まれる。ここでは、０〜４ｋＨｚを第１帯域ともいうので、０〜４ｋＨｚの帯域内の音声成分は、第１帯域の成分ともいえる。第１デシメーション部４２ａは、ダウンサンプリングした音声信号（以下、これもまた「音声信号」という）、つまり第１帯域の成分を第１符号化部４６ａに出力する。

第１符号化部４６ａは、第１デシメーション部４２ａからの音声信号、つまり第１帯域の成分を入力する。第１符号化部４６ａは、第１帯域の成分をボコーダ符号化する。その際、ボコーダ処理サンプリング周波数は８ｋＨｚである。第１符号化部４６ａは、ボコーダ符号化した第１帯域の成分（以下、「第１符号化信号」という）を出力部４８に出力する。

第２デシメーション部４２ｂは、入力部４０からの音声信号を入力する。第２デシメーション部４２ｂは、音声信号に対して、４８ｋＨｚのサンプリング周波数を１６ｋＨｚにダウンサンプリングする。ここでは８ｋＨｚの帯域外の音声成分を扱うために、１６ｋＨｚまでのダウンサンプリングとしている。第２デシメーション部４２ｂは、ダウンサンプリングした音声信号（以下、これもまた「音声信号」という）を周波数シフト部４４に出力する。

周波数シフト部４４は、第２デシメーション部４２ｂからの音声信号を入力する。周波数シフト部４４は、音声信号に含まれた４〜８ｋＨｚの音声成分を０〜４ｋＨｚに周波数シフトする。これは、４〜８ｋＨｚという帯域外の音声成分を０〜４ｋＨｚの帯域内に周波数シフトすることに相当する。ここでは、４〜８ｋＨｚを第２帯域ともいうので、周波数シフト部４４は、音声信号における第２帯域の成分であって、かつ第１帯域よりも高い周波数の第２帯域の成分を第１帯域に周波数シフトするともいえる。これは、後述の第２符号化部４６ｂにおいて処理可能な帯域幅が４ｋＨｚまでとされているので、帯域外の高域を周波数シフトして第２符号化部４６ｂで処理するためである。なお、第２帯域の帯域幅は第１帯域の帯域幅と同一である。周波数シフト部４４は、周波数シフトした音声信号（以下、これもまた「音声信号」という）、つまり第１帯域に周波数シフトした第２帯域の成分（以下、これもまた「第２帯域の成分」という）を第３デシメーション部４２ｃに出力する。

第３デシメーション部４２ｃは、周波数シフト部４４からの音声信号を入力する。第３デシメーション部４２ｃは、音声信号に対して、１６ｋＨｚのサンプリング周波数を８ｋＨｚにダウンサンプリングする。第３デシメーション部４２ｃは、ダウンサンプリングした音声信号（以下、これもまた「音声信号」という）を第２符号化部４６ｂに出力する。なお、出力される音声信号にも、第２帯域の成分が含まれる。

第２符号化部４６ｂは、第３デシメーション部４２ｃからの音声信号、つまり第２帯域の成分を入力する。第２符号化部４６ｂは、第２帯域の成分をボコーダ符号化する。その際、ボコーダ処理サンプリング周波数は８ｋＨｚである。第２符号化部４６ｂは、ボコーダ符号化した第２帯域の成分（以下、「第２符号化信号」という）を出力部４８に出力する。

出力部４８は、第１符号化部４６ａからの第１符号化信号と、第２符号化部４６ｂからの第２符号化信号とを入力し、第１符号化信号と第２符号化信号とを出力する。特に、出力部４８は、図示しない送信部２６が信号を送信する際の順番、つまり無線通信チャネルのフレームで定められた順番に出力順を切り替えながら、第１符号化信号と第２符号化信号とを出力する。

ここでは、これを説明する前に比較対象として、ＮＸＤＮ９６００ｂｐｓ（ＨａｌｆＲａｔｅ）システムでの音声通信時の無線通信チャネル（ＲＴＣＨ）におけるフレームフォーマットの図３を使用ながら説明する。図３は、通信システム１００と比較される別の通信システムにおいて使用される信号のフォーマットを示す。ここで、「ＦＳ」はフレーム同期ワードを示し、「ＬＩ」はリンク情報チャネルを示し、「ＳＡ」は低速付随制御チャネルを示し、「ＶＣＨ」は音声チャネルを示し、「ＦＡ」は高速付随制御チャネル１（ＦＡＣＣＨ１）を示す。この場合、第１符号化信号がＶＣＨに格納される。一方、第２符号化信号は格納されないので送信されない。図２に戻る。

次に、第２符号化信号を格納するための２種類のフォーマットを説明するが、いずれが使用されもよい。１つ目のフォーマットに対応させるために、出力部４８は、第１符号化信号と第２符号化信号とを交互に出力する。図４は、通信システム１００において使用される信号のフォーマットを示す。ここで、「ＶＣＨ（拡張）」は、拡張された音声チャネルを示し、第２符号化信号を格納する。図４では、図３において「ＶＣＨ」と「ＦＡ」が配置されていた領域に、「ＶＣＨ」と「ＶＣＨ（拡張）」とが配置される。つまり、図４では、「ＦＡ」が含まれない。通話が開始された後、一般的に「ＦＡ」には、例えばアイドル情報や音声通信を行っていることを示すメッセージといった制御コードが含まれているだけなので、このような制御コードが送信されなくても通話は影響を受けない。そのため、「ＦＡ」を送信する代わりに、「ＶＣＨ（拡張）」が送信される。特に、ＶＣＨとＶＣＨ（拡張）とが交互に配置される。

この場合、ＶＣＨ、ＶＣＨ（拡張）、ＶＣＨ、ＶＣＨ（拡張）の順に配置されるので、連続したＶＣＨとＶＣＨ（拡張）の組合せが１つの音声信号となる。そのため、受信装置１２は、ＶＣＨのボコーダ復号を行うことによって、帯域内の音声成分を取得してから、ＶＣＨ（拡張）のボコーダ復号を行うことによって、帯域外の音声成分を連続的に取得する。さらに、受信装置１２は、ＶＣＨのボコーダ復号結果とＶＣＨ（拡張）のボコーダ復号結果とを合成して再生するので、ボコーダ復号結果の順番の調節が不要になり、処理が簡易になる。

２つ目のフォーマットに対応させるために、出力部４８は、複数の第１符号化信号を連続して出力してから、複数の第２符号化信号を連続して出力する。図５は、通信システム１００において使用される信号の別のフォーマットを示す。図５では、図３「ＦＡ」が配置されていた領域に「ＶＣＨ（拡張）」がそのまま配置される。この場合、図３のフォーマットのみに対応している受信装置が図５のフレームフォーマットの信号を受信しても、ＶＣＨ（拡張）を破棄すればよいだけであるので、ＶＣＨのボコーダ復号は実行される。つまり、通信に影響はなく互換性は保たれる。

この構成は、ハードウエア的には、任意のコンピュータのＣＰＵ、メモリ、その他のＬＳＩで実現でき、ソフトウエア的にはメモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。

図６は、復号装置３２の構成を示す。復号装置３２は、入力部６０、復号部６２と総称される第１復号部６２ａ、第２復号部６２ｂ、インタポレーション部６４と総称される第１インタポレーション部６４ａ、第２インタポレーション部６４ｂ、第３インタポレーション部６４ｃ、遅延部６６、周波数シフト部６８、合成部７０を含む。

入力部６０は、図示しない受信部３０からの第１符号化信号と第２符号化信号とを入力する。受信部３０において受信した信号のフォーマットが図４に対応する場合、入力部６０は、第１符号化信号と第２符号化信号とを交互に入力する。一方、受信部３０において受信した信号のフォーマットが図５に対応する場合、入力部６０は、複数の第１符号化信号を連続して入力してから、複数の第２符号化信号を連続して入力する。入力した第１符号化信号と第２符号化信号のサンプリング周波数は、例えば８ｋＨｚである。入力部６０は、第１符号化信号を第１復号部６２ａに出力し、第２符号化信号を第２復号部６２ｂに出力する。

第１復号部６２ａは、入力部６０からの第１符号化信号を入力する。第１復号部６２ａは、第１符号化信号をボコーダ復号する。その際、ボコーダ処理サンプリング周波数は８ｋＨｚである。第１復号部６２ａは、ボコーダ復号した第１符号化信号（以下、「第１音声成分」という）を第１インタポレーション部６４ａに出力する。第１音声成分は、０〜４ｋＨｚの帯域内の音声成分であり、第１帯域の音声成分である。また、第１音声成分は、８ｋＨｚのサンプリング周波数を有した音声信号に含まれるので、当該音声信号が第１インタポレーション部６４ａに出力されるともいえる。

第１インタポレーション部６４ａは、第１復号部６２ａからの音声信号、つまり第１音声成分を入力する。第１インタポレーション部６４ａは、音声信号に対して、８ｋＨｚのサンプリング周波数を４８ｋＨｚにアップサンプリングする。アップサンプリングした音声信号にも、第１帯域の第１音声成分が含まれる。第１インタポレーション部６４ａは、アップサンプリングした音声信号（以下、これもまた「音声信号」という）、つまり第１音声成分を遅延部６６に出力する。

遅延部６６は、第１インタポレーション部６４ａからの音声信号、つまり第１音声成分を入力する。遅延部６６は、図４あるいは図５に示されたフォーマットに応じた期間だけ、音声信号を遅延させる。遅延部６６は、遅延させた音声信号（以下、これもまた「音声信号」という）、つまり第１音声成分を合成部７０に出力する。

第２復号部６２ｂは、入力部６０からの第２符号化信号を入力する。第２復号部６２ｂは、第２符号化信号をボコーダ復号する。その際、ボコーダ処理サンプリング周波数は８ｋＨｚである。第２復号部６２ｂは、ボコーダ復号した第２符号化信号（以下、「第２音声成分」という）を第２インタポレーション部６４ｂに出力する。第２音声成分は、４〜８ｋＨｚという帯域外の音声成分であり、第２帯域の音声成分である。ここで、第２音声成分は、０〜４ｋＨｚの帯域、つまり第１帯域に周波数シフトされている。また、第２音声成分は、８ｋＨｚのサンプリング周波数を有した音声信号に含まれるので、当該音声信号が第２インタポレーション部６４ｂに出力されるともいえる。

第２インタポレーション部６４ｂは、第２復号部６２ｂからの音声信号、つまり第２音声成分を入力する。第２インタポレーション部６４ｂは、音声信号に対して、８ｋＨｚのサンプリング周波数を１６ｋＨｚにアップサンプリングする。アップサンプリングした音声信号にも、第１帯域の第２音声成分が含まれる。第２インタポレーション部６４ｂは、アップサンプリングした音声信号（以下、これもまた「音声信号」という）、つまり第２音声成分を周波数シフト部６８に出力する。

周波数シフト部６８は、第２インタポレーション部６４ｂからの音声信号、つまり第２音声成分を入力する。周波数シフト部６８は、音声信号に含まれた０〜４ｋＨｚの第２音声成分を４〜８ｋＨｚに周波数シフトする。これは、０〜４ｋＨｚの帯域内に周波数シフトされている帯域外の音声成分を４〜８ｋＨｚの帯域外に戻すことに相当する。そのため、第１帯域の第２音声成分が第２帯域に周波数シフトされることに相当する。周波数シフト部６８は、周波数シフトした音声信号（以下、これもまた「音声信号」という）、つまり第２帯域に周波数シフトした第２音声成分（以下、これもまた「第２音声成分」という）を第３インタポレーション部６４ｃに出力する。

第３インタポレーション部６４ｃは、周波数シフト部６８からの音声信号、つまり第２音声成分を入力する。第３インタポレーション部６４ｃは、音声信号に対して、１６ｋＨｚのサンプリング周波数を４８ｋＨｚにアップサンプリングする。アップサンプリングした音声信号にも、第２帯域の第２音声成分が含まれる。第３インタポレーション部６４ｃは、アップサンプリングした音声信号（以下、これもまた「音声信号」という）、つまり第２音声成分を合成部７０に出力する。

合成部７０は、遅延部６６からの音声信号、つまり第１音声成分を入力するとともに、第３インタポレーション部６４ｃからの音声信号、つまり第２音声成分を入力する。合成部７０は、第１音声成分と第２音声成分とを加算処理によって合成する。第１音声成分と第２音声成分とが合際された音声成分も音声信号に含まれる。合成部７０は、音声信号を図示しないＩＦ部３４に出力する。

以上の構成による通信システム１００の動作を説明する。図７は、符号化装置２４による出力手順を示すフローチャートである。第１デシメーション部４２ａ、第１符号化部４６ａは、帯域内符号化処理を実行する（Ｓ５００）。第２デシメーション部４２ｂ、周波数シフト部４４、第３デシメーション部４２ｃ、第２符号化部４６ｂは、帯域外符号化処理を実行する（Ｓ５１０）。出力部４８は、符号化信号の出力切替処理を実行する（Ｓ５２０）。

図８は、帯域内符号化処理の手順を示すフローチャートである。第１デシメーション部４２ａは、デシメーション処理を実行する（Ｓ５０１）。第１符号化部４６ａは、ボコーダ符号化処理を実行する（Ｓ５０２）。

図９は、帯域外符号化処理の手順を示すフローチャートである。第２デシメーション部４２ｂは、デシメーション処理を実行する（Ｓ５１１）。周波数シフト部４４は、周波数シフト処理を実行する（Ｓ５１２）。第３デシメーション部４２ｃは、デシメーション処理を実行する（Ｓ５１３）。第２符号化部４６ｂは、ボコーダ符号化処理を実行する（Ｓ５１４）。

図１０は、復号装置３２による合成手順を示すフローチャートである。入力部６０は、符号化信号の入力切替処理を実行する（Ｓ６００）。第１復号部６２ａ、第１インタポレーション部６４ａ、遅延部６６は、帯域内復号処理を実行する（Ｓ６１０）。第２復号部６２ｂ、第２インタポレーション部６４ｂ、周波数シフト部６８、第３インタポレーション部６４ｃは、帯域外復号処理を実行する（Ｓ６２０）。合成部７０は、音声成分の合成処理を実行する（Ｓ６３０）。

図１１は、帯域内復号処理の手順を示すフローチャートである。第１復号部６２ａは、ボコーダ復号処理を実行する（Ｓ６１１）。第１インタポレーション部６４ａは、インタポレーション処理を実行する（Ｓ６１２）。遅延部６６は、バッファリング処理を実行する（Ｓ６１３）。

図１２は、帯域外復号処理の手順を示すフローチャートである。第２復号部６２ｂは、ボコーダ復号処理を実行する（Ｓ６２１）。第２インタポレーション部６４ｂは、インタポレーション処理を実行する（Ｓ６２２）。周波数シフト部６８は、周波数シフト処理を実行する（Ｓ６２３）。第３インタポレーション部６４ｃは、インタポレーション処理を実行する（Ｓ６２４）。

以下では、これまで説明した符号化装置２４、復号装置３２において、音質や明瞭度をさらに向上させるための構成を説明する。これまでの符号化装置２４、復号装置３２には、処理負荷の増加を抑制するため等の理由によりイコライザが含まれていない。一方、ここでは、符号化装置２４と復号装置３２の少なくとも１つにイコライザが含まれる。

図１３は、符号化装置２４の別の構成を示す。符号化装置２４では、図２に示した符号化装置２４に対して、ＥＱ部５０と総称される第１ＥＱ部５０ａ、第２ＥＱ部５０ｂが追加される。第１ＥＱ部５０ａは、第１デシメーション部４２ａと第１符号化部４６ａとの間に配置され、第２ＥＱ部５０ｂは、第３デシメーション部４２ｃと第２符号化部４６ｂとの間に配置される。

第１ＥＱ部５０ａは、第１デシメーション部４２ａからの音声信号、つまり第１帯域の成分を入力する。第１ＥＱ部５０ａは、第１帯域の成分に対してイコライザ処理を実行する。イコライザ処理では、母音に対応したフォルマントがさらに強調されることによって、母音に対する音質が向上する。イコライザ処理には公知の技術が使用されればよいので、ここでは説明を省略する。第１ＥＱ部５０ａは、イコライザ処理した第１帯域の成分（以下、これもまた「第１帯域の成分」という）、つまり音声信号を第１符号化部４６ａに出力する。

第２ＥＱ部５０ｂは、第３デシメーション部４２ｃからの音声信号、つまり第２帯域の成分を入力する。第２ＥＱ部５０ｂは、第２帯域の成分に対してイコライザ処理を実行する。イコライザ処理では、子音に対応したフォルマントがさらに強調されることによって、子音に対する音質が向上する。イコライザ処理には公知の技術が使用されればよいので、ここでは説明を省略する。第２ＥＱ部５０ｂは、イコライザ処理した第２帯域の成分（以下、これもまた「第２帯域の成分」という）、つまり音声信号を第２符号化部４６ｂに出力する。

図１４は、復号装置３２の別の構成を示す。復号装置３２では、図６に示した復号装置３２に対して、ＥＱ部７２と総称される第１ＥＱ部７２ａ、第２ＥＱ部７２ｂが追加される。第１ＥＱ部７２ａは、第１復号部６２ａと第１インタポレーション部６４ａとの間に配置され、第２ＥＱ部７２ｂは、第２復号部６２ｂと第２インタポレーション部６４ｂとの間に配置される。第１ＥＱ部７２ａは、第１ＥＱ部５０ａと同様の処理を実行し、第２ＥＱ部７２ｂは、第２ＥＱ部５０ｂと同様の処理を実行するので、ここでは説明を省略する。

このような構成において、図２の符号化装置２４が送信装置１０に含まれ、図１４の復号装置３２が受信装置１２に含まれもよい。また、図１３の符号化装置２４が送信装置１０に含まれ、図６の復号装置３２が受信装置１２に含まれてもよい。さらに、図１３の符号化装置２４が送信装置１０に含まれ、図１４の復号装置３２が受信装置１２に含まれもよい。

本実施例によれば、第１帯域の成分から第１符号化信号を生成し、かつ第２帯域の成分から第２符号化信号を生成するので、帯域外の成分も符号化できる。また、帯域外の成分が符号化されるので、音声の品質や明瞭度を改善できる。また、第２帯域の成分を第１帯域に周波数シフトしてから符号化するので、第１帯域に対応した第２符号化部を使用できる。また、第１帯域の成分から第１符号化信号を生成し、かつ第２帯域の成分から第２符号化信号を生成するので、高度な音声信号処理を行わずに、０〜８ｋＨｚの音声を再生できる。また、４〜８ｋＨｚの成分をベースに第２符号化信号を生成しているので、受信側において再生される音声の不自然さを低減できる。また、第１符号化信号と第２符号化信号とを交互に出力するので、処理遅延を低減できる。

また、複数の第１符号化信号を連続して出力してから、複数の第２符号化信号を連続して出力するので、第１符号化信号が格納されるＶＣＨの位置の変更を不要にできる。また、第１符号化信号が格納されるＶＣＨの位置の変更が不要になるので、第２符号化信号の復号に対応していない受信装置においても第１符号化信号を復号できる。また、第２符号化信号の復号に対応していない受信装置においても第１符号化信号が復号されるので、互換性を維持できる。また、符号化装置においてイコライザ処理を実行するので、音質や明瞭度をより向上できる。また、復号装置においてイコライザ処理を実行するので、音質や明瞭度をより向上できる。

（実施例２）
次に、実施例２を説明する。実施例２は、実施例１と同様に、送信装置から受信装置に音声信号を送信する通信システムに関する。これまでは、通信システム１００としてＮＸＤＮ９６００ｂｐｓ（ＨａｌｆＲａｔｅ）システムを一例として説明している。そのため、帯域幅８ｋＨｚの音声信号を０〜４ｋＨｚの成分と４〜８ｋＨｚの成分に分割している。実施例２では、音声信号をｎ個の成分に等分割する。実施例２に係る通信システム１００は、図１と同様のタイプである。ここでは、実施例１との差異を中心に説明する。

図１５は、本発明の実施例２に係る符号化装置２４の構成を示す。符号化装置２４は、入力部４０、デシメーション部４２と総称される第１デシメーション部４２ａ、第２デシメーション部４２ｂ、第３デシメーション部４２ｃ、第４デシメーション部４２ｄ、第５デシメーション部４２ｅ、第６デシメーション部４２ｆ、第７デシメーション部４２ｇ、周波数シフト部４４と総称される第１周波数シフト部４４ａ、第２周波数シフト部４４ｂ、第３周波数シフト部４４ｃ、符号化部４６と総称される第１符号化部４６ａ、第２符号化部４６ｂ、第３符号化部４６ｃ、第４符号化部４６ｄ、出力部４８を含む。第１周波数シフト部４４ａは、これまでの周波数シフト部４４に相当する。ここで、第２周波数シフト部４４ｂ、第３周波数シフト部４４ｃは、追加周波数シフト部５２とまとめられ、第３符号化部４６ｃ、第４符号化部４６ｄは、第ｉ符号化部５４とまとめられる。

第１デシメーション部４２ａ、第１符号化部４６ａは、音声信号における第１帯域の成分をボコーダ符号化することによって、第１符号化信号を生成する。また、第２デシメーション部４２ｂ、第１周波数シフト部４４ａ、第３デシメーション部４２ｃ、第２符号化部４６ｂは、音声信号における第２帯域の成分を第１帯域に周波数シフトしてからボコーダ符号化することによって、第２符号化信号を生成する。これらは実施例１と同様の処理である。一方、第４デシメーション部４２ｄ、第２周波数シフト部４４ｂ、第５デシメーション部４２ｅ、第３符号化部４６ｃは、音声信号における第３帯域の成分を第１帯域に周波数シフトしてからボコーダ符号化することによって、第３符号化信号を生成する。第６デシメーション部４２ｆ、第３周波数シフト部４４ｃ、第７デシメーション部４２ｇ、第４符号化部４６ｄは、音声信号における第４帯域の成分を第１帯域に周波数シフトしてからボコーダ符号化することによって、第４符号化信号を生成する。

つまり、追加周波数シフト部５２は、音声信号における第ｉ（ｉ＞２）帯域の成分であって、かつ第ｉ−１帯域よりも高い周波数の第ｉ帯域の成分を第１帯域に周波数シフトする。第ｉ符号化部５４は、周波数シフト部４４において周波数シフトした成分をボコーダ符号化することによって第ｉ符号化信号を生成する。なお、第１帯域から第４帯域のそれぞれの帯域幅は同一であるが、実施例１のような４ｋＨｚ出なくてもよい。また、音声信号は「４」個の成分に等分割されているが、等分割の数は「４」に限定されない。また、デシメーション部４２等におけるサンプリング周波数は適宜設定されればよい。最終的に、出力部４８は、第ｉ符号化部５４において生成した第ｉ符号化信号も出力する。

図１６は、本発明の実施例２に係る復号装置３２の構成を示す。復号装置３２は、復号装置３２は、入力部６０、復号部６２と総称される第１復号部６２ａ、第２復号部６２ｂ、第３復号部６２ｃ、第４復号部６２ｄ、インタポレーション部６４と総称される第１インタポレーション部６４ａ、第２インタポレーション部６４ｂ、第３インタポレーション部６４ｃ、第４インタポレーション部６４ｄ、第５インタポレーション部６４ｅ、第６インタポレーション部６４ｆ、第７インタポレーション部６４ｇ、遅延部６６、周波数シフト部６８と総称される第１周波数シフト部６８ａ、第２周波数シフト部６８ｂ、第３周波数シフト部６８ｃ、合成部７０を含む。第１周波数シフト部６８ａは、これまでの周波数シフト部６８に相当する。ここで、第３復号部６２ｃ、第４復号部６２ｄは、第ｉ復号部７４とまとめられ、第２周波数シフト部６８ｂ、第３周波数シフト部６８ｃは、追加周波数シフト部７６とまとめられる。

第１復号部６２ａ、第１インタポレーション部６４ａは、第１符号化信号を復号することによって第１音声成分を生成する。また、第２復号部６２ｂ、第２インタポレーション部６４ｂ、第１周波数シフト部６８ａ、第３インタポレーション部６４ｃは、第２符号化信号を復号した第２音声成分を生成してから第２帯域に周波数シフトする。これらは実施例１と同様の処理である。一方、第３復号部６２ｃ、第４インタポレーション部６４ｄ、第２周波数シフト部６８ｂ、第５インタポレーション部６４ｅは、第３符号化信号を復号した第３音声成分を生成してから第３帯域に周波数シフトする。第４復号部６２ｄ、第６インタポレーション部６４ｆ、第３周波数シフト部６８ｃ、第７インタポレーション部６４ｇは、第４符号化信号を復号した第４音声成分を生成してから第４帯域に周波数シフトする。

つまり、第ｉ復号部７４は、第ｉ符号化信号を復号することによって第１帯域の第ｉ音声成分を生成する。追加周波数シフト部７６は、第ｉ復号部７４において生成した第ｉ音声成分を第ｉ帯域に周波数シフトする。ここでも、第１帯域から第４帯域のそれぞれの帯域幅は同一であるが、実施例１のような４ｋＨｚ出なくてもよい。また、音声信号は「４」個の成分に等分割されているが、等分割の数は「４」に限定されない。また、インタポレーション部６４等におけるサンプリング周波数は適宜設定されればよい。最終的に、合成部７０は、第ｉ復号部７４において周波数シフトした第ｉ音声成分も合成して出力する。

本実施例によれば、音声信号をｎ個の成分に等分割し、それぞれに対して符号化・復号を実行するので、音声の品質や明瞭度をさらに改善できる。また、音声信号をｎ個の成分に等分割し、それぞれに対して符号化・復号を実行するので、構成の自由度を向上できる。

以上、本発明を実施例をもとに説明した。この実施例は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

１０送信装置、１２受信装置、２０マイクロフォン、２２ＩＦ部、２４符号化装置、２６送信部、３０受信部、３２復号装置、３４ＩＦ部、３６スピーカ、４０入力部、４２デシメーション部、４４周波数シフト部、４６符号化部、４８出力部、６０入力部、６２復号部、６４インタポレーション部、６６遅延部、６８周波数シフト部、７０合成部、１００通信システム。

Claims

音声信号を入力する入力部と、
前記入力部において入力した音声信号における第１帯域の成分を符号化することによって第１符号化信号を生成する第１符号化部と、
前記入力部において入力した音声信号における第２帯域の成分であって、かつ第１帯域よりも高い周波数の第２帯域の成分を第１帯域に周波数シフトする周波数シフト部と、
前記周波数シフト部において周波数シフトした成分を符号化することによって第２符号化信号を生成する第２符号化部と、
前記第１符号化部において生成した第１符号化信号と前記第２符号化部において生成した第２符号化信号とを出力する出力部と、
を備えることを特徴とする符号化装置。
前記出力部は、第１符号化信号と第２符号化信号とを交互に出力することを特徴とする請求項１に記載の符号化装置。
前記出力部は、複数の第１符号化信号を連続して出力してから、複数の第２符号化信号を連続して出力することを特徴とする請求項１に記載の符号化装置。
前記入力部において入力した音声信号における第ｉ（ｉ＞２）帯域の成分であって、かつ第ｉ−１帯域よりも高い周波数の第ｉ帯域の成分を第１帯域に周波数シフトする追加周波数シフト部と、
前記追加周波数シフト部において周波数シフトした成分を符号化することによって第ｉ符号化信号を生成する第ｉ符号化部とをさらに備え、
前記出力部は、前記第ｉ符号化部において生成した第ｉ符号化信号も出力することを特徴とする請求項１に記載の符号化装置。
音声信号における第１帯域の成分を符号化した第１符号化信号と、音声信号における第２帯域の成分であって、かつ第１帯域よりも高い周波数の第２帯域の成分を第１帯域に周波数シフトして符号化した第２符号化信号とを入力する入力部と、
前記入力部において入力した第１符号化信号を復号することによって第１帯域の第１音声成分を生成する第１復号部と、
前記入力部において入力した第２符号化信号を復号することによって第１帯域の第２音声成分を生成する第２復号部と、
前記第２復号部において生成した第２音声成分を第２帯域に周波数シフトする周波数シフト部と、
前記第１復号部において生成した第１音声成分と前記周波数シフト部において周波数シフトした第２音声成分とを合成して出力する合成部と、
を備えることを特徴とする復号装置。
前記入力部は、第１符号化信号と第２符号化信号とを交互に入力することを特徴とする請求項５に記載の復号装置。
前記入力部は、複数の第１符号化信号を連続して入力してから、複数の第２符号化信号を連続して入力することを特徴とする請求項５に記載の復号装置。
前記入力部は、音声信号における第ｉ（ｉ＞２）帯域の成分であって、かつ第ｉ−１帯域よりも高い周波数の第ｉ帯域の成分を第１帯域に周波数シフトして符号化した第ｉ符号化信号も入力し、
本復号装置は、
前記入力部において入力した第ｉ符号化信号を復号することによって第１帯域の第ｉ音声成分を生成する第ｉ復号部と、
前記第ｉ復号部において生成した第ｉ音声成分を第ｉ帯域に周波数シフトする追加周波数シフト部とをさらに備え、
前記合成部は、前記追加周波数シフト部において周波数シフトした第ｉ音声成分も合成して出力することを特徴とする請求項５に記載の復号装置。
符号化装置と、
復号装置とを備え、
前記符号化装置は、
音声信号を入力する入力部と、
前記入力部において入力した音声信号における第１帯域の成分を符号化することによって第１符号化信号を生成する第１符号化部と、
前記入力部において入力した音声信号における第２帯域の成分であって、かつ第１帯域よりも高い周波数の第２帯域の成分を第１帯域に周波数シフトする周波数シフト部と、
前記周波数シフト部において周波数シフトした成分を符号化することによって第２符号化信号を生成する第２符号化部と、
前記第１符号化部において生成した第１符号化信号と前記第２符号化部において生成した第２符号化信号とを出力する出力部とを備え、
前記復号装置は、前記符号化装置からの第１符号化信号と第２符号化信号とを入力する入力部と、
前記入力部において入力した第１符号化信号を復号することによって第１帯域の第１音声成分を生成する第１復号部と、
前記入力部において入力した第２符号化信号を復号することによって第１帯域の第２音声成分を生成する第２復号部と、
前記第２復号部において生成した第２音声成分を第２帯域に周波数シフトする周波数シフト部と、
前記第１復号部において生成した第１音声成分と前記周波数シフト部において周波数シフトした第２音声成分とを合成して出力する合成部と、
を備えることを特徴とする通信システム。