JPH07146700A - ピッチ強調方法および装置ならびに聴力補償装置 - Google Patents
ピッチ強調方法および装置ならびに聴力補償装置Info
- Publication number
- JPH07146700A JPH07146700A JP5293436A JP29343693A JPH07146700A JP H07146700 A JPH07146700 A JP H07146700A JP 5293436 A JP5293436 A JP 5293436A JP 29343693 A JP29343693 A JP 29343693A JP H07146700 A JPH07146700 A JP H07146700A
- Authority
- JP
- Japan
- Prior art keywords
- fundamental frequency
- voice
- pitch
- emphasizing
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【目的】音声の基本周波数成分を強調することにより、
電話音声等の帯域制限によって基本周波数成分が欠落ま
たは減衰した音声の音質を改善し、ピッチ知覚に必要な
音声分析機能の低下した聴覚障害者のピッチ知覚を補助
する。 【構成】音声を入力する手段と、音声を分析して加工す
る手段と、音声を再生して出力する手段を有する音響処
理装置において、入力音声の基本周波数を抽出する基本
周波数抽出部110と、該音声の周波数スペクトルにお
ける基本周波数位置を中心とする基本周波数幅のレベル
を強調する基本周波数レベル強調部113を備える。
電話音声等の帯域制限によって基本周波数成分が欠落ま
たは減衰した音声の音質を改善し、ピッチ知覚に必要な
音声分析機能の低下した聴覚障害者のピッチ知覚を補助
する。 【構成】音声を入力する手段と、音声を分析して加工す
る手段と、音声を再生して出力する手段を有する音響処
理装置において、入力音声の基本周波数を抽出する基本
周波数抽出部110と、該音声の周波数スペクトルにお
ける基本周波数位置を中心とする基本周波数幅のレベル
を強調する基本周波数レベル強調部113を備える。
Description
【0001】
【産業上の利用分野】本発明は、音響処理装置に関し、
特に聴力障害者の聴力補償、および劣化音声の回復を目
的とする音声信号処理装置に関する。
特に聴力障害者の聴力補償、および劣化音声の回復を目
的とする音声信号処理装置に関する。
【0002】
【従来の技術】従来の補聴器などの聴覚補償装置は、ア
ナログ増幅器により入力音声を拡声して再生するものが
大部分であった。
ナログ増幅器により入力音声を拡声して再生するものが
大部分であった。
【0003】近年、ディジタル技術の進歩にしたがっ
て、複雑な処理をより短い時間で実行できるようになっ
た。これに伴い、例えば Working Group on Communicat
ion Aids for the Hearing-Impaired による"スピーチ・
パーセプション・エイズ・フォー・ヒアリング・インペアー
ド・ピープル:カレント・ステータス・アンド・ニーデッド・
リサーチ(Speech-perception aids for hearing-impair
ed people: Current status and needed research)"
(J. Acoust. Soc. Am. 90(2)、 Pt. 1、 August 1991、
pp637-685) に記載のように、聴覚障害者の可聴域の周
波数特性に合わせて周波数ごとに細かく増幅率を調整す
る方法や、音声の情報を聴力の残っている領域へ周波数
方向に移動する方法、また、音声の持つ種々の特徴を選
択的に強調する方式等が提案されている。
て、複雑な処理をより短い時間で実行できるようになっ
た。これに伴い、例えば Working Group on Communicat
ion Aids for the Hearing-Impaired による"スピーチ・
パーセプション・エイズ・フォー・ヒアリング・インペアー
ド・ピープル:カレント・ステータス・アンド・ニーデッド・
リサーチ(Speech-perception aids for hearing-impair
ed people: Current status and needed research)"
(J. Acoust. Soc. Am. 90(2)、 Pt. 1、 August 1991、
pp637-685) に記載のように、聴覚障害者の可聴域の周
波数特性に合わせて周波数ごとに細かく増幅率を調整す
る方法や、音声の情報を聴力の残っている領域へ周波数
方向に移動する方法、また、音声の持つ種々の特徴を選
択的に強調する方式等が提案されている。
【0004】一方、人間は、音声の音の高さ、すなわち
ピッチの時間変化によって同音語の話し分けや、聞き分
け、意図表現を行い、発話者の意図を推定する。一般
に、音声におけるピッチは、発話者の声帯振動の基本周
波数に基づく音響的特徴を、人間が聴覚系で分析するこ
とによって知覚されるもので、音声による意志の伝達を
行う上で重要な役割を持つ特徴である。聴覚系において
は、波形の微細構造の時間的な特徴や、基本周波数、お
よび基本周波数とその高調波成分に対する周波数的な特
徴をもとに総合的にピッチ知覚が行われていると考えら
れている。健聴者はこれらのうちの一部の情報が得られ
ればピッチ知覚を行うことができるが、聴覚障害によっ
て周波数選択性や、時間分解能が低下している場合は、
これらの音声の特徴を十分に利用することができないた
め、しばしばピッチ知覚が困難になる。例えば、ムーア
(Moore)およびピーターズ(Peters)による "(ピッ
チ・ディスクリミネーション・アンド・フェイズ・センシテ
ィビティ・イン・ヤング・アンド・エルダリー・サブジェク
ツ・アンド・イッツ・リレーションシップ・トゥー・フレケ
ンシー・セレクティビティ(Pitch discrimination and
phase sensitivity in young and elderly subjects an
d its relationship to frequency selectivity)"、
J. Acoust. Soc. Am. 91 (5)、 May 1992、 pp2881-289
3を参照されたい。
ピッチの時間変化によって同音語の話し分けや、聞き分
け、意図表現を行い、発話者の意図を推定する。一般
に、音声におけるピッチは、発話者の声帯振動の基本周
波数に基づく音響的特徴を、人間が聴覚系で分析するこ
とによって知覚されるもので、音声による意志の伝達を
行う上で重要な役割を持つ特徴である。聴覚系において
は、波形の微細構造の時間的な特徴や、基本周波数、お
よび基本周波数とその高調波成分に対する周波数的な特
徴をもとに総合的にピッチ知覚が行われていると考えら
れている。健聴者はこれらのうちの一部の情報が得られ
ればピッチ知覚を行うことができるが、聴覚障害によっ
て周波数選択性や、時間分解能が低下している場合は、
これらの音声の特徴を十分に利用することができないた
め、しばしばピッチ知覚が困難になる。例えば、ムーア
(Moore)およびピーターズ(Peters)による "(ピッ
チ・ディスクリミネーション・アンド・フェイズ・センシテ
ィビティ・イン・ヤング・アンド・エルダリー・サブジェク
ツ・アンド・イッツ・リレーションシップ・トゥー・フレケ
ンシー・セレクティビティ(Pitch discrimination and
phase sensitivity in young and elderly subjects an
d its relationship to frequency selectivity)"、
J. Acoust. Soc. Am. 91 (5)、 May 1992、 pp2881-289
3を参照されたい。
【0005】ところで、通信回線等を通して音声を伝送
する場合、通常は伝送系の情報伝送レートの制約から、
帯域制限を行って情報量を削減する。例えば、電話回線
では、300Hz〜3.4kHz程度に帯域制限されている。通
常、音声のピッチは80〜400Hzであるため、比較的低い
ピッチを持つ男性などではピッチ周波数が電話帯域から
外れることによってピッチ情報が欠落または減衰する。
このような場合は、特に音声分析機能の衰えた聴覚障害
者では、音声から得ることのできるピッチに関する情報
が不足するために、ピッチの知覚が困難になる。また、
健聴者にとっても音質の劣化が感じられる。
する場合、通常は伝送系の情報伝送レートの制約から、
帯域制限を行って情報量を削減する。例えば、電話回線
では、300Hz〜3.4kHz程度に帯域制限されている。通
常、音声のピッチは80〜400Hzであるため、比較的低い
ピッチを持つ男性などではピッチ周波数が電話帯域から
外れることによってピッチ情報が欠落または減衰する。
このような場合は、特に音声分析機能の衰えた聴覚障害
者では、音声から得ることのできるピッチに関する情報
が不足するために、ピッチの知覚が困難になる。また、
健聴者にとっても音質の劣化が感じられる。
【0006】ピッチ情報に関して聴覚障害者の補聴を行
う方式として、特に高度の聴覚障害者に対して、読唇時
の補助情報として音声の基本周波数変化に合わせて変調
した正弦波を与える方式が、例えば、グラント(Gran
t)による "エンコーディング・ボイス・ピッチ・フォ
ー・プロファウンドリィ・ヒアリングインペアード・リ
スナーズ(Encoding voice pitch for profoundly hear
ing-impaired listerners)" J. Acoust. Soc. Am. 82
(2)、 August 1987、 pp423-432に提案されている。ま
た、電話音に対する帯域制限を補償し、原音に近づける
ために、音声信号に対して電話特性の逆特性を持つフィ
ルタをかける方法も考えられる。
う方式として、特に高度の聴覚障害者に対して、読唇時
の補助情報として音声の基本周波数変化に合わせて変調
した正弦波を与える方式が、例えば、グラント(Gran
t)による "エンコーディング・ボイス・ピッチ・フォ
ー・プロファウンドリィ・ヒアリングインペアード・リ
スナーズ(Encoding voice pitch for profoundly hear
ing-impaired listerners)" J. Acoust. Soc. Am. 82
(2)、 August 1987、 pp423-432に提案されている。ま
た、電話音に対する帯域制限を補償し、原音に近づける
ために、音声信号に対して電話特性の逆特性を持つフィ
ルタをかける方法も考えられる。
【0007】
【発明が解決しようとする課題】上記従来技術のうち、
音声の基本周波数変化に合わせて変調した正弦波を与え
る補聴方式は、音声を直接加工するものではない。した
がって、音声情報のみを用いて発話内容を理解すること
を目的とする補聴装置には適用されない。
音声の基本周波数変化に合わせて変調した正弦波を与え
る補聴方式は、音声を直接加工するものではない。した
がって、音声情報のみを用いて発話内容を理解すること
を目的とする補聴装置には適用されない。
【0008】また、電話の実際の伝送系では、雑音付加
や伝送歪等により、帯域外には音声信号以外の情報が存
在するため、電話特性の逆特性を持つフィルタをかける
方法は、雑音を同時に増幅することによって明瞭度や聞
きやすさを損なう可能性がある。
や伝送歪等により、帯域外には音声信号以外の情報が存
在するため、電話特性の逆特性を持つフィルタをかける
方法は、雑音を同時に増幅することによって明瞭度や聞
きやすさを損なう可能性がある。
【0009】本発明の目的は、音声の基本周波数成分を
強調することにより、電話音声等の帯域制限によって基
本周波数成分が欠落または減衰した音声の音質を改善
し、ピッチ知覚に必要な音声分析機能の低下した聴覚障
害者のピッチ知覚を補助することができるピッチ強調方
法および装置ならびに聴力補償装置を提供することにあ
る。
強調することにより、電話音声等の帯域制限によって基
本周波数成分が欠落または減衰した音声の音質を改善
し、ピッチ知覚に必要な音声分析機能の低下した聴覚障
害者のピッチ知覚を補助することができるピッチ強調方
法および装置ならびに聴力補償装置を提供することにあ
る。
【0010】
【課題を解決するための手段】上記の問題を解決するた
めに、本発明のピッチ強調装置では、音声の基本周波数
を抽出する手段(基本周波数抽出部)と、抽出した基本
周波数に基づいて音声スペクトルの基本周波数位置のレ
ベルを強調する手段(基本周波数レベル変更部)とを設
けた。
めに、本発明のピッチ強調装置では、音声の基本周波数
を抽出する手段(基本周波数抽出部)と、抽出した基本
周波数に基づいて音声スペクトルの基本周波数位置のレ
ベルを強調する手段(基本周波数レベル変更部)とを設
けた。
【0011】基本周波数レベル変更部において音声スペ
クトルの基本周波数位置のレベルを変更する第1の手段
として、音声の周波数スペクトルに、基本周波数位置に
中心を持つ基本周波数幅の窓を掛ける方法を用いること
ができる。
クトルの基本周波数位置のレベルを変更する第1の手段
として、音声の周波数スペクトルに、基本周波数位置に
中心を持つ基本周波数幅の窓を掛ける方法を用いること
ができる。
【0012】基本周波数レベル変更部において音声スペ
クトルの基本周波数位置のレベルを変更する第2の手段
として、入力音声の周波数スペクトルに、基本周波数位
置に中心を持つ基本周波数幅の窓を加える方法を用いる
ことができる。
クトルの基本周波数位置のレベルを変更する第2の手段
として、入力音声の周波数スペクトルに、基本周波数位
置に中心を持つ基本周波数幅の窓を加える方法を用いる
ことができる。
【0013】基本周波数レベル変更部において音声スペ
クトルの基本周波数位置のレベルを変更する第3の手段
として、入力音声の周波数スペクトルの基本周波数位置
の基本周波数幅の成分を、基本周波数位置に中心を持つ
基本周波数幅の窓で置換する方法を用いることができ
る。
クトルの基本周波数位置のレベルを変更する第3の手段
として、入力音声の周波数スペクトルの基本周波数位置
の基本周波数幅の成分を、基本周波数位置に中心を持つ
基本周波数幅の窓で置換する方法を用いることができ
る。
【0014】
【作用】本発明によるピッチ強調装置は、音声スペクト
ルの基本周波数位置の成分に対し、音声スペクトルの基
本周波数位置のレベルを変更することによってピッチ強
調を行う。これにより、電話音声等の帯域制限によって
基本周波数成分が欠落または減衰した音声の音質を改善
し、あるいはピッチ知覚に必要な音声分析機能の低下し
た聴覚障害者のピッチ知覚を補助することができる。
ルの基本周波数位置の成分に対し、音声スペクトルの基
本周波数位置のレベルを変更することによってピッチ強
調を行う。これにより、電話音声等の帯域制限によって
基本周波数成分が欠落または減衰した音声の音質を改善
し、あるいはピッチ知覚に必要な音声分析機能の低下し
た聴覚障害者のピッチ知覚を補助することができる。
【0015】一般に、電話回線などを伝送された音声で
は、帯域制限のために基本周波数成分が減衰する。この
ような音声のうち、レベルは低いが基本周波数成分が残
存している場合は、伝送系を通過する前の、もとの音声
の形状を保存したまま基本周波数成分のレベルのみを増
幅することによってピッチを強調する。そのために、周
波数スペクトルの基本周波数位置に窓処理をほどこす。
このとき、基本周波数位置以外の制限された帯域には、
雑音のために本来の音声以外の成分が存在することがあ
る。そこで、基本周波数以外の成分を増幅しないため
に、基本周波数位置に中心を持つ基本周波数幅の窓を掛
けるか、または加える。これによって、音質を改善しつ
つピッチを強調することが可能となる。
は、帯域制限のために基本周波数成分が減衰する。この
ような音声のうち、レベルは低いが基本周波数成分が残
存している場合は、伝送系を通過する前の、もとの音声
の形状を保存したまま基本周波数成分のレベルのみを増
幅することによってピッチを強調する。そのために、周
波数スペクトルの基本周波数位置に窓処理をほどこす。
このとき、基本周波数位置以外の制限された帯域には、
雑音のために本来の音声以外の成分が存在することがあ
る。そこで、基本周波数以外の成分を増幅しないため
に、基本周波数位置に中心を持つ基本周波数幅の窓を掛
けるか、または加える。これによって、音質を改善しつ
つピッチを強調することが可能となる。
【0016】減衰が急峻である場合や、回線歪等の影響
のために、基本周波数成分がもとの音声の該成分に対し
て変形していたり、もとの音声の成分がほとんど残存し
ていない場合は、音声周波数スペクトルの基本周波数位
置を基本周波数成分を模擬する窓で置換することによっ
て、音質を改善しつつピッチを強調することが可能であ
る。
のために、基本周波数成分がもとの音声の該成分に対し
て変形していたり、もとの音声の成分がほとんど残存し
ていない場合は、音声周波数スペクトルの基本周波数位
置を基本周波数成分を模擬する窓で置換することによっ
て、音質を改善しつつピッチを強調することが可能であ
る。
【0017】また、窓を用いたスペクトルの変更後のレ
ベルは、聴取者の好みや聴覚特性に合わせて変更可能と
すれば、個人適合が行える。また、基準音声の基本周波
数成分のレベルに等しくなるように調整することも可能
である。その際、基準音声の基本周波数成分のレベル
は、例えば、伝送系の減衰特性をスペクトルアナライザ
等の装置を用いて測定し、基本周波数位置での減衰率か
ら推定すれば、ピッチ強調された音声は、伝送系を通過
する前の音声の音質に近づけることが可能である。
ベルは、聴取者の好みや聴覚特性に合わせて変更可能と
すれば、個人適合が行える。また、基準音声の基本周波
数成分のレベルに等しくなるように調整することも可能
である。その際、基準音声の基本周波数成分のレベル
は、例えば、伝送系の減衰特性をスペクトルアナライザ
等の装置を用いて測定し、基本周波数位置での減衰率か
ら推定すれば、ピッチ強調された音声は、伝送系を通過
する前の音声の音質に近づけることが可能である。
【0018】
【実施例】以下、本発明の実施例を図を用いて説明す
る。
る。
【0019】図1は、本発明であるピッチ強調装置の一
実施例を説明するブロック図である。図1において、入
力音声信号101はA/D変換部102においてディジ
タル波形信号103に変換され、フレーム処理部104
において適当な時間窓を用いて数十ミリ〜百ミリ秒程度
の連続的な短時間区間波形信号105となる。短時間区
間波形信号105は、フーリエ変換部106において周
波数スペクトル107、112に変換される。ケプスト
ラム分析部108は、周波数スペクトル107のパワー
スペクトルを求め、その対数の逆フーリエ変換を行うこ
とによってケプストラム109を計算する。このケプス
トラム109から、基本周波数抽出部110は、基本周
波数111を抽出する。ケプストラム分析に基づく基本
周波数抽出方法については、例えば「ディジタル音声処
理」(古井、東海大学出版会、1985)に記載されて
いる。ピッチ強調部113は、周波数スペクトル112
の基本周波数位置のレベル(振幅)を変更することによ
ってピッチを強調する。114は、ピッチ強調部113
から出力されるピッチ強調された周波数スペクトルであ
る。ピッチ強調された周波数スペクトル114は、フー
リエ逆変換部115で短時間区間波形信号116に逆変
換された後、波形再構築部117において連続波形11
8に再構築される。されに、D/A変換部119におい
てアナログ音声信号120に変換された後、ピッチ強調
された音声として出力される。
実施例を説明するブロック図である。図1において、入
力音声信号101はA/D変換部102においてディジ
タル波形信号103に変換され、フレーム処理部104
において適当な時間窓を用いて数十ミリ〜百ミリ秒程度
の連続的な短時間区間波形信号105となる。短時間区
間波形信号105は、フーリエ変換部106において周
波数スペクトル107、112に変換される。ケプスト
ラム分析部108は、周波数スペクトル107のパワー
スペクトルを求め、その対数の逆フーリエ変換を行うこ
とによってケプストラム109を計算する。このケプス
トラム109から、基本周波数抽出部110は、基本周
波数111を抽出する。ケプストラム分析に基づく基本
周波数抽出方法については、例えば「ディジタル音声処
理」(古井、東海大学出版会、1985)に記載されて
いる。ピッチ強調部113は、周波数スペクトル112
の基本周波数位置のレベル(振幅)を変更することによ
ってピッチを強調する。114は、ピッチ強調部113
から出力されるピッチ強調された周波数スペクトルであ
る。ピッチ強調された周波数スペクトル114は、フー
リエ逆変換部115で短時間区間波形信号116に逆変
換された後、波形再構築部117において連続波形11
8に再構築される。されに、D/A変換部119におい
てアナログ音声信号120に変換された後、ピッチ強調
された音声として出力される。
【0020】なお、基本周波数抽出法は、上記実施例記
載のケプストラム分析によるもの以外にも、自己相関関
数を用いるものや、波形の零交差数の計測によるもの等
があり、いずれの方法を用いても本ピッチ強調装置を実
現することができる。
載のケプストラム分析によるもの以外にも、自己相関関
数を用いるものや、波形の零交差数の計測によるもの等
があり、いずれの方法を用いても本ピッチ強調装置を実
現することができる。
【0021】図2は、ピッチ強調の概念図である。入力
音声のある短時間区間の周波数スペクトルを201とす
る。202は、ある伝送系の周波数特性を仮定したもの
であり、201はこのような特性を持った系を伝送され
た結果、制限された周波数帯域で減衰しているものとす
る。本発明のピッチ強調装置では、このような入力音声
の基本周波数F0位置のスペクトルレベルを203のよ
うに増加変更することによって、ピッチを強調する。ス
ペクトルレベルを変更する方法としては、図3に示すよ
うな周波数軸上の窓を用い、該スペクトルに該窓の関数
を掛けるか加える、あるいは該窓で置換することによ
る。以下、具体的に説明する。
音声のある短時間区間の周波数スペクトルを201とす
る。202は、ある伝送系の周波数特性を仮定したもの
であり、201はこのような特性を持った系を伝送され
た結果、制限された周波数帯域で減衰しているものとす
る。本発明のピッチ強調装置では、このような入力音声
の基本周波数F0位置のスペクトルレベルを203のよ
うに増加変更することによって、ピッチを強調する。ス
ペクトルレベルを変更する方法としては、図3に示すよ
うな周波数軸上の窓を用い、該スペクトルに該窓の関数
を掛けるか加える、あるいは該窓で置換することによ
る。以下、具体的に説明する。
【0022】図3は、基本周波数成分を強調する窓の一
例である。図3において、F0は基本周波数を表し、周
波数軸上での中心および幅がF0である。窓の形状を関
数W(f)で規定すると、強調窓は次式で表される。た
だし、W(f)は、f=F0で最大値1をとる。
例である。図3において、F0は基本周波数を表し、周
波数軸上での中心および幅がF0である。窓の形状を関
数W(f)で規定すると、強調窓は次式で表される。た
だし、W(f)は、f=F0で最大値1をとる。
【0023】
【数1】
【0024】音声周波数スペクトルにこの窓の関数を掛
けることによって基本周波数成分を変更する場合は、変
更後のスペクトルS(f)は、変更前のスペクトルS0
(f)に対して、次式で表される。
けることによって基本周波数成分を変更する場合は、変
更後のスペクトルS(f)は、変更前のスペクトルS0
(f)に対して、次式で表される。
【0025】
【数2】
【0026】ここで、aは、増幅度を規定する変数であ
る。
る。
【0027】音声周波数スペクトルに窓関数を加えるこ
とによって基本周波数成分を変更する場合は、変更後の
スペクトルS(f)は同様に、
とによって基本周波数成分を変更する場合は、変更後の
スペクトルS(f)は同様に、
【0028】
【数3】
【0029】で表される。
【0030】音声周波数スペクトルを窓関数で置換する
ことによって基本周波数成分を変更する場合は、変更後
のスペクトルS(f)は、
ことによって基本周波数成分を変更する場合は、変更後
のスペクトルS(f)は、
【0031】
【数4】
【0032】で表される。ここで、bは、レベルに対す
るオフセットを表し、a、bの両変数を適当に与えるこ
とによって、もとの音声の基本周波数成分の形状に近い
窓を実現する。
るオフセットを表し、a、bの両変数を適当に与えるこ
とによって、もとの音声の基本周波数成分の形状に近い
窓を実現する。
【0033】基本周波数成分近傍の雑音レベルが高い場
合は、図4に示すように、基本周波数位置以外の成分を
抑制するような窓関数を選択することによってピッチを
より強調することができる。図4で、fcは、抑制する
周波数幅を表す。該窓関数は、次式で規定される。
合は、図4に示すように、基本周波数位置以外の成分を
抑制するような窓関数を選択することによってピッチを
より強調することができる。図4で、fcは、抑制する
周波数幅を表す。該窓関数は、次式で規定される。
【0034】
【数5】
【0035】なお、窓の形状は左右対称である必要はな
く、例えば図5や6に示すような形状であってもよい。
ただし、境界付近での傾きが急峻な関数を用いると、変
更後のスペクトルが不連続になり、音質が劣化する場合
がある。
く、例えば図5や6に示すような形状であってもよい。
ただし、境界付近での傾きが急峻な関数を用いると、変
更後のスペクトルが不連続になり、音質が劣化する場合
がある。
【0036】次式に、図3に対応するW(f)の例を示
す。
す。
【0037】
【数6】
【0038】ただし、
【0039】
【数7】
【0040】である。なお、σp、σnは標準偏差を表
す。式6のW(f)は、ガウス分布を表す式を組合せた
もので、いわゆるメキシカンハットの形状を持つ。
す。式6のW(f)は、ガウス分布を表す式を組合せた
もので、いわゆるメキシカンハットの形状を持つ。
【0041】図7は、伝送系の周波数特性に基づいたレ
ベル補償を表す図である。今、701を伝送系の周波数
特性とする。また、伝送系を通過する前後の音声周波数
スペクトルの基本周波数成分をそれぞれ702、703
とする。伝送系の周波数特性は、スペクトルアナライザ
等を用いて測定することができる。701より、基本周
波数位置F0における減衰率Gが求められる。変更前の
音声周波数スペクトルのF0におけるレベルをL0とする
と、伝送系を通過する前の音声のF0位置におけるレベ
ルLは、
ベル補償を表す図である。今、701を伝送系の周波数
特性とする。また、伝送系を通過する前後の音声周波数
スペクトルの基本周波数成分をそれぞれ702、703
とする。伝送系の周波数特性は、スペクトルアナライザ
等を用いて測定することができる。701より、基本周
波数位置F0における減衰率Gが求められる。変更前の
音声周波数スペクトルのF0におけるレベルをL0とする
と、伝送系を通過する前の音声のF0位置におけるレベ
ルLは、
【0042】
【数8】
【0043】となる。そこで、基本周波数位置のレベル
がLになるように式2、3、4のパラメータa、bを調
節した窓を用いてピッチを強調する。
がLになるように式2、3、4のパラメータa、bを調
節した窓を用いてピッチを強調する。
【0044】図8は、本発明に基づいてピッチを強調し
た音声の周波数スペクトルの例である。図から分かるよ
うに基本周波数位置F0において、スペクトルのレベル
が増強されている。
た音声の周波数スペクトルの例である。図から分かるよ
うに基本周波数位置F0において、スペクトルのレベル
が増強されている。
【0045】以上の実施例では、基本周波数成分を強調
する窓を実現するために数式を用いたが、数式を用いる
以外に、予めテーブルにデータを格納しておき、必要部
分を取り出すいわゆるテーブルルックアップを用いるこ
とも可能である。この方法では、データを離散量として
扱うため、強調窓も離散化してテーブルに格納する。但
し、窓長は基本周波数によって変化し、また、離散量の
ポイント数も標本化周波数とFFTサイズによって異な
る。そこで、テーブルには定められた形状の窓を充分大
きなポイント数で表わした離散量を標準値として格納し
ておき、状況に応じて間引きして用いる。図9に、この
ような、基本周波数成分を強調する窓関数の標準値を格
納したテーブルの例を示す。ここで、N1,N2はそれぞ
れ窓の中心0から両端までのポイント数であり、充分大
きな整数とする。窓が左右対象の場合は、N1とN2は等
しくなる。また、X[・]は各ポイントにおける窓関数
値である。
する窓を実現するために数式を用いたが、数式を用いる
以外に、予めテーブルにデータを格納しておき、必要部
分を取り出すいわゆるテーブルルックアップを用いるこ
とも可能である。この方法では、データを離散量として
扱うため、強調窓も離散化してテーブルに格納する。但
し、窓長は基本周波数によって変化し、また、離散量の
ポイント数も標本化周波数とFFTサイズによって異な
る。そこで、テーブルには定められた形状の窓を充分大
きなポイント数で表わした離散量を標準値として格納し
ておき、状況に応じて間引きして用いる。図9に、この
ような、基本周波数成分を強調する窓関数の標準値を格
納したテーブルの例を示す。ここで、N1,N2はそれぞ
れ窓の中心0から両端までのポイント数であり、充分大
きな整数とする。窓が左右対象の場合は、N1とN2は等
しくなる。また、X[・]は各ポイントにおける窓関数
値である。
【0046】図10に、窓形状1001を用いたときの
各ポイントに対する窓関数値の設定例を示す。いま、抽
出した基本周波数をF0、標本化周波数Fs、FFTサイ
ズをNFFTとすると、実際に用いる窓の中心から両端ま
でのポイント数M1,M2は、時式で表わされる。
各ポイントに対する窓関数値の設定例を示す。いま、抽
出した基本周波数をF0、標本化周波数Fs、FFTサイ
ズをNFFTとすると、実際に用いる窓の中心から両端ま
でのポイント数M1,M2は、時式で表わされる。
【0047】
【数9】
【0048】
【数10】
【0049】但し、int(・)は、実数を整数に変換する関
数を表わすものとする。
数を表わすものとする。
【0050】中心位置のポイントを0としたとき、実際
に用いる窓のi番目のポイントが参照するテーブルの位
置jは、
に用いる窓のi番目のポイントが参照するテーブルの位
置jは、
【0051】
【数11】
【0052】となる。したがって、i番目のポイントに
おける周波数fiでの窓関数値W(fi)は、
おける周波数fiでの窓関数値W(fi)は、
【0053】
【数12】
【0054】となる。
【0055】図11に、本実施例のピッチ強調装置のハ
ードウエア構成例を示す。この装置1100は、入力音
声信号1101(図1の101に対応)を受けて増幅す
る増幅器1102と、この増幅器の出力を受けるフィル
タ1103と、このフィルタのアナログ出力をデジタル
信号に変換するアナログデジタル(A/D)変換器11
04と、ピッチ強調処理を含む処理プログラムを格納し
たプログラムメモリ1106と、このプログラムに基づ
いてデジタル信号処理を行うデジタルシグナルプロセッ
サ(DSP)1105とを備える。DSP1105によ
り、図1の要素104、106、108、110、11
3、115、および117の処理が実行される。装置1
100は、さらに、DSP1105の処理前の入力デー
タおよび処理結果のデータの格納領域、あるいは作業領
域として利用されるデータメモリ1107、DSP11
05の処理結果のデータをアナログ信号に変換するデジ
タルアナログ(D/A)変換器1108、このD/A変
換器出力を受けるフィルタ1109および増幅器111
0を備える。増幅器1110の出力1111が図1のア
ナログ音声信号120に対応する。
ードウエア構成例を示す。この装置1100は、入力音
声信号1101(図1の101に対応)を受けて増幅す
る増幅器1102と、この増幅器の出力を受けるフィル
タ1103と、このフィルタのアナログ出力をデジタル
信号に変換するアナログデジタル(A/D)変換器11
04と、ピッチ強調処理を含む処理プログラムを格納し
たプログラムメモリ1106と、このプログラムに基づ
いてデジタル信号処理を行うデジタルシグナルプロセッ
サ(DSP)1105とを備える。DSP1105によ
り、図1の要素104、106、108、110、11
3、115、および117の処理が実行される。装置1
100は、さらに、DSP1105の処理前の入力デー
タおよび処理結果のデータの格納領域、あるいは作業領
域として利用されるデータメモリ1107、DSP11
05の処理結果のデータをアナログ信号に変換するデジ
タルアナログ(D/A)変換器1108、このD/A変
換器出力を受けるフィルタ1109および増幅器111
0を備える。増幅器1110の出力1111が図1のア
ナログ音声信号120に対応する。
【0056】図12は、図11に示したピッチ強調装置
1100の実際の使用例を示す。この例では、入力側に
マイクロフォン1201、出力側にスピーカ1202が
接続されて使用される。
1100の実際の使用例を示す。この例では、入力側に
マイクロフォン1201、出力側にスピーカ1202が
接続されて使用される。
【0057】図13は、ピッチ強調装置1100の他の
使用例を示す。この例は、アナログ回線用の電話器に応
用したものである。伝送路1301を通してアナログ電
話機1302に入力した音声信号をピッチ強調装置11
00に入力し、強調処理を行った後、ハンドセット13
03のスピーカ1304からピッチ強調された音声を出
力する。ハンドセット1303のピックアップマイクロ
フォン1305の入力はそのまま電話機1303に送ら
れる。
使用例を示す。この例は、アナログ回線用の電話器に応
用したものである。伝送路1301を通してアナログ電
話機1302に入力した音声信号をピッチ強調装置11
00に入力し、強調処理を行った後、ハンドセット13
03のスピーカ1304からピッチ強調された音声を出
力する。ハンドセット1303のピックアップマイクロ
フォン1305の入力はそのまま電話機1303に送ら
れる。
【0058】図14は、ピッチ強調装置1100をデジ
タル回線用の電話機に応用した例を示す。デジタル回線
を用いた電話機1402では、入力信号が既にデジタル
化されているため、フィルタ部1103およびA/D変
換部1104(図11)を省略することができる。
タル回線用の電話機に応用した例を示す。デジタル回線
を用いた電話機1402では、入力信号が既にデジタル
化されているため、フィルタ部1103およびA/D変
換部1104(図11)を省略することができる。
【0059】図15は、ピッチ強調装置1100を送信
機の前処理部として用いた場合の応用例を示す。テレ
ビ、ラジオ等の送信機の音声信号入力の前処理部に本ピ
ッチ強調装置を用いいることによって、予めピッチ強調
した音声を送信することが可能になる。
機の前処理部として用いた場合の応用例を示す。テレ
ビ、ラジオ等の送信機の音声信号入力の前処理部に本ピ
ッチ強調装置を用いいることによって、予めピッチ強調
した音声を送信することが可能になる。
【0060】図16は、ピッチ強調装置1100を受信
機の後処理部として用いた場合の応用例を示す。テレ
ビ、ラジオ等の受信機1604の後処理部として本ピッ
チ強調装置を用いることにより、受信した音声信号を強
調することが可能になる。
機の後処理部として用いた場合の応用例を示す。テレ
ビ、ラジオ等の受信機1604の後処理部として本ピッ
チ強調装置を用いることにより、受信した音声信号を強
調することが可能になる。
【0061】図17は、強調量可変のピッチ強調装置1
100の例を示す。外部ボリューム1701を用いて強
調量コントローラ1702によりピッチ強調量を外部か
ら可変にしたものである。
100の例を示す。外部ボリューム1701を用いて強
調量コントローラ1702によりピッチ強調量を外部か
ら可変にしたものである。
【0062】
【発明の効果】音声スペクトルの基本周波数位置の成分
を、基本周波数幅の窓関数を用いて変更することによっ
て、周囲の雑音等の不必要な情報を増幅することなく、
ピッチ情報のみが強調される。これにより、特に音声分
析機能の衰えた聴覚障害者のピッチ知覚を補助すること
が可能となった。
を、基本周波数幅の窓関数を用いて変更することによっ
て、周囲の雑音等の不必要な情報を増幅することなく、
ピッチ情報のみが強調される。これにより、特に音声分
析機能の衰えた聴覚障害者のピッチ知覚を補助すること
が可能となった。
【図1】本発明であるピッチ強調装置の一実施例を説明
するブロック図である。
するブロック図である。
【図2】本発明によるピッチ強調の概念図である。
【図3】実施例において基本周波数成分を強調する窓の
一例を示す波形図である。
一例を示す波形図である。
【図4】実施例において基本周波数成分近傍を抑制する
窓の一例を示す波形図である。
窓の一例を示す波形図である。
【図5】実施例において基本周波数成分を強調する非対
称窓の一例を示す波形図である。
称窓の一例を示す波形図である。
【図6】実施例において基本周波数成分近傍を抑制する
非対称窓の一例を示す波形図である。
非対称窓の一例を示す波形図である。
【図7】実施例における伝送系の周波数特性に基づいた
レベル補償を表す説明図である。
レベル補償を表す説明図である。
【図8】本発明に基づいてピッチを強調した音声の周波
数スペクトルの例を示す波形図である。
数スペクトルの例を示す波形図である。
【図9】実施例において用いうる、窓関数の標準値を格
納するテーブルの説明図である。
納するテーブルの説明図である。
【図10】図9のテーブルを用いた窓の設定方法の説明
図である。
図である。
【図11】実施例のピッチ強調装置のハードウエア構成
例を示すブロック図である。
例を示すブロック図である。
【図12】図11のピッチ強調装置の応用例を示すブロ
ック図である。
ック図である。
【図13】図11のピッチ強調装置の他の応用例を示す
ブロック図である。
ブロック図である。
【図14】図11のピッチ強調装置のさらに他の応用例
を示すブロック図である。
を示すブロック図である。
【図15】図11のピッチ強調装置の別の応用例を示す
ブロック図である。
ブロック図である。
【図16】図11のピッチ強調装置の今一つの応用例を
示すブロック図である。
示すブロック図である。
【図17】図11のピッチ強調装置の変形例を示すブロ
ック図である。
ック図である。
101…入力音声、107、112…周波数スペクト
ル、109…ケプストラム、111…基本周波数、11
4…ピッチ強調スペクトル、801…ピッチ強調前音声
パワースペクトル、802…ピッチ強調後音声パワース
ペクトル
ル、109…ケプストラム、111…基本周波数、11
4…ピッチ強調スペクトル、801…ピッチ強調前音声
パワースペクトル、802…ピッチ強調後音声パワース
ペクトル
Claims (8)
- 【請求項1】音声信号を入力する手段と、 該音声信号から入力音声の周波数スペクトルを求める手
段と、 前記音声信号の基本周波数を抽出する手段と、 前記周波数スペクトルのうち、前記抽出された基本周波
数の周波数スペクトル成分を強調するレベル強調手段
と、 前記周波数スペクトルをこれに対応する音声信号に変換
する手段と、 該変換により得られた音声信号を音声に変換する手段
と、 を備えたことを特徴とするピッチ強調装置。 - 【請求項2】前記レベル強調手段は、前記周波数スペク
トルにおける基本周波数位置を中心とする基本周波数幅
のスペクトルレベルを増加させることを特徴とする請求
項1記載のピッチ強調装置。 - 【請求項3】前記レベル強調手段は、前記入力音声の周
波数スペクトルに、基本周波数位置に中心を持つ基本周
波数幅の窓関数を掛けることにより前記強調を行うこと
を特徴とする請求項1または2記載のピッチ強調装置。 - 【請求項4】前記レベル強調手段は、前記入力音声の周
波数スペクトルに、基本周波数位置に中心を持つ基本周
波数幅の窓関数を加えることにより前記強調を行うこと
を特徴とする1または2記載のピッチ強調装置。 - 【請求項5】前記レベル強調手段は、前記入力音声の周
波数スペクトルの基本周波数位置の基本周波数幅の成分
を、基本周波数位置に中心を持つ基本周波数幅の窓関数
で置換することを特徴とする1または2記載のピッチ強
調装置。 - 【請求項6】伝送手段により劣化した入力音声に対し
て、前記レベル強調手段は、前記入力音声の基本周波数
成分のレベルを、前記入力音声の劣化する前の基本周波
数成分のレベルに等しくなるように変更することを特徴
とする請求項1または2記載のピッチ強調装置。 - 【請求項7】音声を入力する手段と、音声を分析して加
工する手段と、音声を再生して出力する手段とを有する
音響処理装置におけるピッチ強調方法であって、 入力された音声の基本周波数を抽出し、該音声の周波数
スペクトルにおける基本周波数位置を中心とする基本周
波数幅のレベルを変更することにより、前記入力された
音声のピッチを強調することを特徴とするピッチ強調方
法。 - 【請求項8】音声を音声信号に変換する手段と、 該変換により得られた音声信号からその周波数スペクト
ルを求める手段と、 該前記音声信号の基本周波数を抽出する手段と、 前記周波数スペクトルのうち、前記抽出された基本周波
数の周波数スペクトル成分を強調する手段と、 前記周波数スペクトルをこれに対応する音声信号に変換
する手段と、 該変換により得られた音声信号を音声に変換する手段
と、 を備えたことを特徴とする聴力補償装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5293436A JPH07146700A (ja) | 1993-11-24 | 1993-11-24 | ピッチ強調方法および装置ならびに聴力補償装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5293436A JPH07146700A (ja) | 1993-11-24 | 1993-11-24 | ピッチ強調方法および装置ならびに聴力補償装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07146700A true JPH07146700A (ja) | 1995-06-06 |
Family
ID=17794742
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5293436A Pending JPH07146700A (ja) | 1993-11-24 | 1993-11-24 | ピッチ強調方法および装置ならびに聴力補償装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07146700A (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008065052A (ja) * | 2006-09-07 | 2008-03-21 | Dainippon Printing Co Ltd | 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置 |
| JP2008064952A (ja) * | 2006-09-06 | 2008-03-21 | Dainippon Printing Co Ltd | 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置 |
| JP2008065008A (ja) * | 2006-09-07 | 2008-03-21 | Dainippon Printing Co Ltd | 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置 |
| US7577563B2 (en) | 2001-01-24 | 2009-08-18 | Qualcomm Incorporated | Enhanced conversion of wideband signals to narrowband signals |
| WO2014161388A1 (zh) * | 2013-10-23 | 2014-10-09 | 中兴通讯股份有限公司 | 一种提高语音质量的方法及装置 |
| JP2015055765A (ja) * | 2013-09-12 | 2015-03-23 | 日本電信電話株式会社 | 信号処理装置、信号処理方法、プログラム、記録媒体 |
| US20210375303A1 (en) * | 2015-02-01 | 2021-12-02 | Board Of Regents, The University Of Texas System | Natural Ear |
-
1993
- 1993-11-24 JP JP5293436A patent/JPH07146700A/ja active Pending
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7577563B2 (en) | 2001-01-24 | 2009-08-18 | Qualcomm Incorporated | Enhanced conversion of wideband signals to narrowband signals |
| US8358617B2 (en) | 2001-01-24 | 2013-01-22 | Qualcomm Incorporated | Enhanced conversion of wideband signals to narrowband signals |
| JP2008064952A (ja) * | 2006-09-06 | 2008-03-21 | Dainippon Printing Co Ltd | 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置 |
| JP2008065052A (ja) * | 2006-09-07 | 2008-03-21 | Dainippon Printing Co Ltd | 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置 |
| JP2008065008A (ja) * | 2006-09-07 | 2008-03-21 | Dainippon Printing Co Ltd | 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置 |
| JP2015055765A (ja) * | 2013-09-12 | 2015-03-23 | 日本電信電話株式会社 | 信号処理装置、信号処理方法、プログラム、記録媒体 |
| WO2014161388A1 (zh) * | 2013-10-23 | 2014-10-09 | 中兴通讯股份有限公司 | 一种提高语音质量的方法及装置 |
| US20210375303A1 (en) * | 2015-02-01 | 2021-12-02 | Board Of Regents, The University Of Texas System | Natural Ear |
| US12249343B2 (en) * | 2015-02-01 | 2025-03-11 | Board Of Regents, The University Of Texas System | Natural ear |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU771444B2 (en) | Noise reduction apparatus and method | |
| JP4764995B2 (ja) | 雑音を含む音響信号の高品質化 | |
| US8891778B2 (en) | Speech enhancement | |
| US8359195B2 (en) | Method and apparatus for processing audio and speech signals | |
| EP1739657B1 (en) | Speech signal enhancement | |
| EP2283484B1 (en) | System and method for dynamic sound delivery | |
| US20070174050A1 (en) | High frequency compression integration | |
| KR100876794B1 (ko) | 이동 단말에서 음성의 명료도 향상 장치 및 방법 | |
| JPWO2004040555A1 (ja) | 音声強調装置 | |
| US9842607B2 (en) | Speech intelligibility improving apparatus and computer program therefor | |
| US20090257609A1 (en) | Method for Noise Reduction and Associated Hearing Device | |
| Kim et al. | Nonlinear enhancement of onset for robust speech recognition. | |
| Ngo et al. | Increasing speech intelligibility and naturalness in noise based on concepts of modulation spectrum and modulation transfer function | |
| JP3269669B2 (ja) | 聴覚補償装置 | |
| JPH0968997A (ja) | 音声処理方法及び装置 | |
| JPH07146700A (ja) | ピッチ強調方法および装置ならびに聴力補償装置 | |
| US20030065509A1 (en) | Method for improving noise reduction in speech transmission in communication systems | |
| JP2007243709A (ja) | 利得調整方法及び利得調整装置 | |
| RU2589298C1 (ru) | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке | |
| JP3183104B2 (ja) | ノイズ削減装置 | |
| JPH07111527A (ja) | 音声の加工方法およびそれを用いた装置 | |
| JPH08110796A (ja) | 音声強調方法および装置 | |
| JP2899533B2 (ja) | 音質改善装置 | |
| JPH06289896A (ja) | 音声の特徴強調方式および装置 | |
| JP2011141540A (ja) | 音声信号処理装置、テレビジョン受像機、音声信号処理方法、プログラム、および、記録媒体 |