JPH06348293A - 音声情報分析装置 - Google Patents

音声情報分析装置

Info

Publication number
JPH06348293A
JPH06348293A JP5138626A JP13862693A JPH06348293A JP H06348293 A JPH06348293 A JP H06348293A JP 5138626 A JP5138626 A JP 5138626A JP 13862693 A JP13862693 A JP 13862693A JP H06348293 A JPH06348293 A JP H06348293A
Authority
JP
Japan
Prior art keywords
voice
noise
frame data
represented
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5138626A
Other languages
English (en)
Inventor
Minako Oota
美奈子 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5138626A priority Critical patent/JPH06348293A/ja
Publication of JPH06348293A publication Critical patent/JPH06348293A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】音声情報分析装置において、動的に特徴が変化
するノイズの除去を効率良く行う。 【構成】有音無音部720が、無音と判定した場合、ノ
イズ処理部690は、軸変換部640の出力する入力音
声のパワ−スペクトルよりノイズの特徴をノイズテーブ
ル710に記憶し、無音用フレーム設定部700は無音
を表すデータを正規化波形系列682として出力する。
有音と判定した場合、ノイズ除去部660は、ノイズテ
−ブル710に記憶されているノイズの特徴を用いて、
軸変換部640の出力するパワ−スペクトル列よりノイ
ズを除去する。逆FFT部670は、ノイズの除去され
たパワ−スペクトルを逆FFTする。正規化部680
は、ピッチ抽出部650から受け取ったピッチ情報を用
いて逆FFT部670出力を正規化し正規化波形系列6
82として出力する。 【効果】入力信号に混入される絶えず変化する周囲のノ
イズ特徴を常に抽出し、そのノイズ特徴を取り除くこと
によって、如何なる状況下でも的確にノイズ除去を行う
ことができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声情報分析を行う音
声情報分析装置に関し、特に、音声信号から動的に変化
するノイズ成分を除去する技術に関するものである。
【0002】
【従来の技術】入力音声信号からノイズを除去する従来
の技術としては、特開平2−278298号公報記載の
技術や、特開平1−75593号公報記載の技術が知ら
れている。
【0003】前記特開平2−278298号公報記載の
技術は、フィルタを細分化して使用し、固定的に特定の
周波数の除去する技術であり、その音質は除去する周波
数によって左右される。また、前記特開平1−7559
3号公報記載の技術は、ノイズ除去用のニューラル・ネ
ットワークを用いて、あらかじめノイズの特徴を学習/
抽出し、これを用いてノイズを除去する技術であり、そ
の音質は、ノイズの特徴を学習/抽出に用いるデータ
(音声+ノイズ)に混入するノイズ選定に左右される。
【0004】
【発明が解決しようとする課題】前記、特開平2−27
8298号公報記載のノイズ除去用のフィルタを用いて
特定の周波数を除去する技術によれば、除去対象とする
周波数のが固定的であるため、話者、背景の移動、変化
に伴い動的に特徴が変化するノイズの除去には適してい
ない。
【0005】また、前記特開平1−75593号公報記
載のノイズの特徴を、あらかじめ抽出/学習させておく
技術でも、ニューラル・ネットワークの性質上、ノイズ
学習には長時間を要するので、話者、背景の移動、変化
に伴い動的に特徴が変化するノイズの除去には適してい
ない。
【0006】また、音声情報分析を行う場合に、音声情
報分析対象の音声信号から、ノイズを除去するために、
これらの技術を適用すると、いずれの場合も、音声情報
分析処理の前処理として、声分析処理とは別個にノイズ
除去の処理を行わなければならない。このため、リアル
タイムな音声情報分析処理を行う場合には、過負荷とな
る可能性があり、音声情報分析の機能を制限して実現す
るか、各処理を、異なるプロセッサで実行させることに
より実現する必要が生じる場合がある。
【0007】そこで、本発明は、音声情報分析の対象と
する音声信号から、動的に特徴が変化するノイズの除去
を効率良く行うことのできる音声情報分析装置を提供す
ることを目的とする。
【0008】
【課題を解決するための手段】前記目的達成のために、
本発明は、音声の標本化データを一定時間集積したフレ
ームデータの示す音声を分析した分析結果を出力する音
声情報分析方法であって、各フレ−ムデータの表す音声
にノイズ以外の音声が含まれているか否かを判定するス
テップと、ノイズ以外の音声が含まれていないと判定さ
れた場合に、フレームデータからフレ−ムデータの表す
音声に含まれているノイズの特徴を抽出して記憶し、前
記フレームデータの示す音声の分析結果として、あらか
じめ用意した無音の音声の分析結果を表す情報を出力す
る無音系処理を実行ステップと、ノイズ以外の音声が含
まれているとと判定した場合には、前回の無音系処理で
記憶したノイズの特徴分をフレームデータの表す音声か
ら除去し、ノイズの特徴分を除去したフレームデータの
示す音声を分析し、分析した結果を出力する有音系処理
を実行するステップとを有することを特徴とする音声情
報分析方法を提供する。
【0009】
【作用】本発明に係る音声情報分析方法によれば、各フ
レ−ムデータの表す音声にノイズ以外の音声が含まれて
いるか否かを判定し、ノイズ以外の音声が含まれていな
いと判定された場合に、フレームデータからフレ−ムデ
ータの表す音声に含まれているノイズの特徴を抽出して
記憶すると共に、前記フレームデータの示す音声の分析
結果として、あらかじめ用意した無音の音声の分析結果
を表す情報を出力する無音系処理を実行する。一方、ノ
イズ以外の音声が含まれているとと判定した場合には、
前回の無音系処理で記憶したノイズの特徴分をフレーム
データの表す音声から除去し、ノイズの特徴分を除去し
たフレームデータの示す音声を分析し、分析した結果を
出力する有音系処理を実行する。
【0010】したがって、ノイズ以外の音声が含まれて
いない期間、すなわち無音とみなして、あらかじめ求ま
る無音の分析結果を出力すれば足りる期間に、常に最新
のノイズの特徴抽出を行っておくので、ノイズ以外の音
声が含まれている期間には、この抽出した最新のノイズ
の特徴を用いて、ノイズの除去を行うことができる。ま
た、有音系処理と無音系処理は、同時に生起することは
無いので、この処理の実行負荷は小く、音声情報分析の
機能を制限せずに単一のプロセッサ上で実現できる。
【0011】
【実施例】以下、本発明の一実施例を説明する。
【0012】まず、第1の実施例について説明する。
【0013】図5に、本発明に係る音声情報分析装置を
適用した通信システムの構成を示す。
【0014】図中、2000が送信装置、1000が受
信装置である。
【0015】送信装置2000は、音声信号を音声分析
を利用した手法で圧縮符号化して得られたレベル情報と
量子化データとピッチ情報を受信装置1000に送信す
る。受信装置1000は受信した情報より音声を復号化
して出力する。
【0016】ここで、前記送信装置200は、送信部9
00、ベクトル量子化部800、音声情報分析装置10
0とを備えており、受信装置1000は、受信部110
0と、ベクトル逆量子化部1100と、合成部1200
と、D/A変換部1300と、バッファメモリ1500
と、音声出力装置1400を備えている。
【0017】送信装置2000において、音声情報分析
装置100は、入力された入力音声を分析し、得られた
レベル情報681と、ピッチ情報651を送信部900
に、正規化波形系列682をベクトル量子化部800に
送る。ベクトル量子化部800は受け取った正規化波形
系列682をベクトルコードに変換し、変換して得られ
た量子化データ801を送信部900に送る。送信部9
00は、レベル情報681と、ピッチ情報651と、量
子化データ801を受け取り、これを有線/無線を介し
て、受信装置1000に送信する。
【0018】一方、受信装置1000において、受信部
1000は、送信装置2000より送信された情報を受
信し、レベル情報681’と量子化データ801’とピ
ッチ情報651’とを出力する。ベクトル逆量子化部1
100は、出力された量子化データ801’を逆量子化
する。合成部1200は、ベクトル逆量子化部1100
が出力する波形682’を、前記ピッチ情報651’に
基づき、繰り返し周期(ピッチ情報)毎に重ね合わせる
ことにより、波形を合成し、バッファメモリ1500格
納する。D/A変換部1300は、バッファメモリ40
0の出力をデジタル/アナログ(D/A)変換する。音
声出力装置1400は、D/A変換器1300により得
られた音声を出力する。
【0019】以下、前記音声情報分析装置100の詳細
について説明する。
【0020】図5に示すように、前記音声情報分析装置
100は、音声の入力手段である音声入力部200と、
入力された入力音声をアナログ/デジタル(A/D)変
換して、音声標本化データに変換するA/D変換器30
0と、この音声標本化データを、順次記憶するバッファ
メモリ400を有している。バッファメモリ400に記
憶された一定時間(10〜30ミリ秒)毎の音声標本化
データは、一定時間音声標本化データ(フレームデー
タ)401として有音/無音判定部500に送られる。
また、音声情報分析装置100は、有音/無音を判定す
る有音/無音判定部500と、音声情報分析装置100
は、フレームデータ401から、正規化波形系列68
2、レベル情報681と、ピッチ情報651を作成する
分析部600とを有している。
【0021】まず、有音/無音判定部500は、図1に
示すように、音声パワー判定部510から構成される。
音声パワー判定部510は、フレームデータ401の各
要素の総和(パワ−)を求め、これと、閾値(固定値)
と比較した後、閾値より小さければ無音、大きければ有
音と判定し、有音/無音を表す有音/無音判定子511
を出力する。
【0022】なお、上記閾値で十分な効果が得られなけ
れば、閾値を、式1に従い可変とするようにしてもよ
い。なお、式1において、ωは、0<ω<1を満たす重
み値である。
【0023】 次フレ−ムデータ閾値=ω前フレームデータの閾値 +(1−ω)現無音パワー値..(式1) すなわち、無音と判定されたときに、無音と判定された
パワ−の値と、前フレームデータの判定用いた閾値と
に、適当な重み付けを行い、これの加算値を次フレ−ム
データの判定に用いる閾値を求めるようにする。
【0024】また、音声パワー判定部510の有音/無
音の判定は、次のように行うようにしても良い。すなわ
ち、判定対象フレ−ムデータのパワ−と前フレ−ムデー
タのパワ−とを比較し、差が所定値より大きい場合に
は、有音/無音の状態が前回と変化したと判定し、差が
所定値より小さい場合には、有音/無音の状態が変化し
ていないと判定する。そして、記憶しておいた前フレ−
ムデータの判定結果より、判定対象フレ−ムデータにつ
いての有音/無音の判定を行う。または、差が所定値よ
り大きい場合に、さらに、判定対象フレ−ムデータのパ
ワ−と前記閾値との比較を行い有音/無音の判定を行う
ようにする。
【0025】次に、分析部600は、図2に示すよう
に、フレームデータ401からFFT(Fast Fo
urier Transform:高速フーリエ変換)
によりフレ−ムデータの周波数特性を得るFFT部62
0と、FFT部620にデータの設定を行うFFTデー
タ設定部610とを有している。また、FFT部620
のFFTにより得られた複素数の絶対値の二乗値、すな
わち、パワースペクトルを出力するパワースペクトル変
換部630と、パワースペクトルの縦軸をパワースペク
トル軸から振幅軸に変換する軸変換部640とを有して
いる。なお、FFT(Fast Fourier Tr
ansform:高速フーリエ変換)は、信号のサンプ
リング値から元波形を周波数と振幅によって再生する技
法DFT(Discrete Fourier Tra
nsform:離散フーリエ変換)を更に高速に実現し
たものであり、このようなFFTによる信号処理技術
は、「信号処理入門」雨宮 好文/佐藤 幸男箸 オー
ム社 P106〜 6.3 「高速フーリエ変換」等に
詳細に説明されている。
【0026】また、分析部600は、FFT部730と
ピッチ抽出部650とノイズ除去部660と逆FFT部
670と正規化部680とより構成される有音処理系
と、ノイズ処理部690と無音データ設定部700とよ
り構成される無音処理系と、ノイズテーブル710と、
有音/無音部720とを有している。
【0027】有音/無音部720は、有音/無音判定部
500から出力された有音/無音判定子511を判定
し、有音の場合は有音処理系に処理を行わせ、無音の場
合には無音処理系に処理を行わせる。
【0028】まず、有音/無音部720が無音と判定し
た場合の無音処理系の動作を説明する。
【0029】この場合、ノイズ処理部690は、軸変換
部640の出力より、ノイズの特徴、ノイズテーブル7
10に記憶する。すなわち、たとえば、軸変換部より軸
変換された周波数特性情報、パワ−スペクトル列をノイ
ズテ−ブル710に記憶する。無音用フレーム設定部7
00は、正規化波形系列682として、無音を正規化波
形系列表すデータ682bをベクトル量子化部800に
出力する。
【0030】次に、有音/無音部720が有音と判定し
た場合の有音処理系の動作を説明する。
【0031】この場合において、FFT部730は、パ
ワースペクトルの対数値(ケプストラム)からピッチ周
期を求めるために用いられる。ピッチ抽出部650は、
FFT部730の出力より、音声の特徴(高さ)と繰り
返し周期(ピッチ情報)を抽出する。ノイズ除去部66
0は、ノイズテ−ブル710に記憶されているノイズの
特徴を用いて、軸変換部640の出力する有音時のパワ
−スペクトル列よりノイズを除去する。逆FFT部67
0は、ノイズの除去されたパワ−スペクトルを逆FFT
する。正規化部680は、ピッチ抽出部から受け取った
ピッチ情報を用いて逆FFT部670の出力を正規化
し、逆FFTされた結果の最大値を”1”にし、ピッチ
内の波形を表す正規化波形系列682aを列正規化波形
系列682として出力する。また、逆FFT部670の
出力のレベルの情報をレベル情報681として出力す
る。
【0032】さて、ノイズ除去部660によるノイズ除
去は、たとえば次のようにして行う。すなわち、ノイズ
除去部660において、ノイズテ−ブル710の記憶内
容に応じて、各周波数に対する0.0〜1.0の重み付
けを記憶したノイズ・マスクテーブルを作成し、有音時
のパワースペクトル列に対して対応する重みを乗算す
る。この重みは、ノイズテ−ブル710に記憶されてい
る無音時のパワ−スペルトル(ノイズのパワ−スペクト
ル)の絶対値の大きい周波数がより小さくなるよう、順
に0.0〜1.0の重み付けを行う。つまりノイズが顕
著に表れている周波数には、1.0以下の値が乗算され
るようにすることによって、有音時のパワースペクトル
の該当パワースペクトル値を元の値より減少の方向に移
行させ、ノイズ・スペクトルが現れない周波数には1.
0の重みを付けることによってその周波数のパワースペ
クトル値がそのまま残す。この結果として、ノイズの取
り除かれたパワースペクトル列を得ることができる。
【0033】以下、本発明の第2の実施例について説明
する。
【0034】本第2実施例は、前記第1実施例と有音/
無音判定部500と分析部600の構成のみが異なる。
【0035】本第2実施例に係る有音/無音判定部50
0は、図3に示すように、フレームデータをFFT処理
するためのデータ設定を行うFFTデータ設定部610
と、フレームデータをFFTする手段であるFFT部6
20と、得られた複素数の二乗和を求めるパワースペク
トル変換部630と、上記フレームデータよりフレーム
データの総和を取り、閾値と比較し、有音/無音判定子
721を出力する音声パワー判定部510と、前記音有
音/無音判定子の判定をする有音/無音判定部720
と、パワースペクトルをFFT処理するためのFFT部
620と、上記パワースペクトの対数、ケプストラムよ
りピッチ情報を抽出し、無音時にはピッチ周期が一定に
定まらないこと(「ディジタル信号処理」古井 貞煕箸
P57〜P59 4.9 ピッチ抽出)を利用して有
音状態を判定して、有音/無音判定子を出力するピッチ
抽出部650とを有している。
【0036】さて、音声パワー判定部510は、前記第
1実施例に係る音声パワー判定部510と同様に、各フ
レ−ムデータのパワ−より有音/無音を判定する。しか
し、前述した判定方法によれば、パワ−のみによって有
音/無音を判定しているために、無音状態を誤って有音
と判定しまう場合がある。そこで、本第2実施例では、
音声パワー判定部510が有音と判定した場合に、有音
/無音判定部720によって、FFT部730とピッチ
抽出部650を起動し、さらにピッチ周期を利用した有
音/無音判定を行う。
【0037】すなわち、音声パワー判定部510が有音
と判定した場合、FFT部730は、パワースペクトル
をFFT処理する。ピッチ抽出部650は、この出力よ
り、パワースペクトの対数、ケプストラムよりピッチ情
報を抽出し、無音時にはピッチ周期が一定に定まらない
こと(「ディジタル信号処理」古井 貞煕箸 P57〜
P59 4.9 ピッチ抽出を参照)を利用して有音/
無音状態を判定して、有音/無音判定子を出力する。な
お、ピッチ抽出部650の有音/無音の判定は、時間軸
上のピッチ情報を周波数軸上のピッチ周期に変換し、パ
ワースペクトルに対し、ピッチ周期ごとに極大値が存在
すれば有音、存在しなければ無音として判定することに
より行うようにしてもよい。
【0038】次に、本第2実施例に係る分析部600
は、図4に示すように、縦軸をパワースペクトル軸から
振幅軸に変換する軸変換部640と、ノイズを除去する
ノイズ除去部660と、逆FFTする手段である逆FF
T部670と、逆FFTされた結果の最大値を”1”に
するための正規化部680と、有音/無音部920と、
ノイズの特徴を抽出するノイズ処理部690と、無音を
出力するためのデータを設定する無音用データ設定部7
00と、ノイズ・テーブル710を有する。各部の個々
の動作は、前記第1実施例の対応部と同様である。た
だ、本第2実施例では、ノイズ除去部660と逆FFT
部670と正規化部680が有音処理系を構成してい
る。そして、有音/無音部920が、ピッチ抽出部65
0の出力する有音/無音判定子が有音を示す場合にの
み、この有音処理系に処理を行わせる。一方、ノイズ処
理部690と無音用データ設定部700とより構成され
る無音処理系の処理は、有音/無音部920と、有音/
無音判定部500の有音/無音部720との、少なくと
もいづれか一方が無音を判定した場合に行われる。
【0039】以上のように、本実施例によれば、絶えず
変化する周囲のノイズを常に抽出し、そのノイズ特徴を
取り除くことによって、如何なる状況でも的確なノイズ
除去を行うことができる。
【0040】さて、前記第1実施例および第2実施例に
係る有音/無音判定部500と分析部600の各部の行
う処理は、プロセッサ上で動作するプログラムとして実
現することができる。この場合、無音時には、無音処理
系の処理のみを行い、有音時には有音処理系の処理のみ
を行えばよく、かつ、無音処理系の前処理と有音処理系
の前処理は共通しているので、ノイズ除去を音声分析の
前処理として行う従来の技術に比べ、プロセッサの処理
の負荷は小さく、単一のプロセッサ上で動作するプログ
ラムとして実現することができる。
【0041】なお、以上の実施例では、通信システムへ
の適用を例にとり説明したが、本第1、第2実施例に係
る音声情報分析装置は、この他、分析部600の分析結
果を用いて、音声認識等の処理を行う装置等、多様な装
置に適用することができる。
【0042】
【発明の効果】以上説明してきたように、本発明によれ
ば、音声分析の対象とする音声信号から、動的に特徴が
変化するノイズの除去を効率良く行うことのできる音声
分析装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の第1実施例に係る有音/無音判定部の
構成を示すブロック図である。
【図2】本発明の第1実施例に係る分析部の構成を示す
ブロック図である。
【図3】本発明の第2実施例に係る有音/無音判定部の
構成を示すブロック図である。
【図4】本発明の第2実施例に係る分析部の構成を示す
ブロック図である。
【図5】本発明の実施例に係る通信システムの構成を示
すブロック図である。
【符号の説明】
100 音声情報分析装置 200 音声入力装置 300 A/D変換器 400 バッファメモリ 401 フレームデータ 500 有音/無音判定部 511 有音/無音判定子 600 分析部 610 FFTデータ設定部 620 FFT部 630 パワースペクトル変換部 631 パワースペクトル列 640 軸変換部 650 ピッチ抽出部 651 ピッチ情報 660 ノイズ除去部 670 逆FFT部 680 正規化部 681 正規化波形系列 682 レベル情報 690 ノイズ処理部 700 無音用フレーム設定部 710 ノイズデーブル 720 有音/無音部 800 ベクトル量子化部 801 ベクトルコード 900 送信部 1100 ベクトル逆量子化部 1200 合成部 1300 D/A変換部 1400 音声出力装置

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】音声の標本化データを一定時間集積したフ
    レームデータの示す音声を分析した分析結果を出力する
    音声情報分析方法であって、 各フレ−ムデータの表す音声にノイズ以外の音声が含ま
    れているか否かを判定するステップと、 ノイズ以外の音声が含まれていないと判定された場合
    に、フレームデータからフレ−ムデータの表す音声に含
    まれているノイズの特徴を抽出して記憶し、前記フレー
    ムデータの示す音声の分析結果として、あらかじめ用意
    した無音の音声の分析結果を表す情報を出力する無音系
    処理を実行するステップと、 ノイズ以外の音声が含まれていると判定した場合に、前
    回の無音系処理で記憶したノイズの特徴分をフレームデ
    ータの表す音声から除去し、ノイズの特徴分を除去した
    フレームデータの示す音声を分析し、分析した結果を出
    力する有音系処理を実行するステップとを有することを
    特徴とする音声情報分析方法。
  2. 【請求項2】音声の標本化データを一定時間集積したフ
    レームデータの示す音声を分析した分析結果を出力する
    音声情報分析装置であって、 ノイズテ−ブルと、 各フレ−ムデータの表す音声にノイズ以外の音声が含ま
    れているか否かを、フレ−ムデータの表す音声の振幅に
    基づいて判定する手段と、 ノイズ以外の音声が含まれていないと判定された場合
    に、フレームデータからフレ−ムデータの表す音声に含
    まれているノイズの特徴を抽出して前記ノイズテ−ブル
    に記憶し、前記フレームデータの示す音声の分析結果と
    して、あらかじめ用意した無音の音声の分析結果を表す
    情報を出力する手段と、 ノイズ以外の音声が含まれているとと判定された場合
    に、前記ノイズテ−ブルに記憶されているノイズの特徴
    分をフレームデータの表す音声から除去し、ノイズの特
    徴分を除去したフレームデータの示す音声を分析し、分
    析結果を出力する手段とを有することを特徴とする音声
    情報分析装置。
  3. 【請求項3】音声の標本化データを一定時間集積したフ
    レームデータの示す音声を分析し、各フレ−ムデータの
    表す音声のピッチを表すピッチ情報と、前記ピッチ内の
    音声波形を表す波形情報と、フレ−ムデータの表す音声
    の振幅を表す振幅情報とを出力する音声情報分析装置で
    あって、 各フレ−ムデータの表す音声のパワ−スペクトルを求め
    る手段と、 求められたパワ−スペクトルからフレームデータの示す
    音声のピッチ情報を抽出して出力する手段と、 ノイズテ−ブルと、 各フレ−ムデータの表す音声にノイズ以外の音声が含ま
    れているか否かを、フレ−ムデータの表す音声の振幅に
    基づいて判定する手段と、 ノイズ以外の音声が含まれていないと判定された場合
    に、当該フレームデータの表す音声のパワ−スペクトル
    からフレ−ムデータの表す音声に含まれているノイズの
    特徴を抽出して前記ノイズテ−ブルに記憶する手段と、
    ノイズ以外の音声が含まれていないと判定された場合
    に、前記フレームデータの示す音声の分析結果として、
    あらかじめ用意した無音の波形を表す波形情報を出力す
    る手段と、 ノイズ以外の音声が含まれていると判定された場合に、
    前記ノイズテ−ブル記憶されているノイズの特徴分をフ
    レームデータの表す音声のパワ−スペクトルから除去す
    る手段と、ノイズ以外の音声が含まれているとと判定さ
    れた場合に、ノイズの特徴分を除去したパワ−スペクト
    ルから前記波形情報と振幅情報を、対応するフレ−ムデ
    ータについて求められた前記ピッチ情報を用いて抽出し
    て出力する手段とを有することを有することを特徴とす
    る音声情報分析装置。
  4. 【請求項4】音声の標本化データを一定時間集積したフ
    レームデータの示す音声を分析し、各フレ−ムデータの
    表す音声のピッチを表すピッチ情報と、前記ピッチ内の
    音声波形を表す波形情報と、フレ−ムデータの表す音声
    の振幅を表す振幅情報とを出力する音声情報分析装置で
    あって、 各フレ−ムデータの表す音声のパワ−スペクトルを求め
    る手段と、 求められたパワ−スペクトルからフレームデータの示す
    音声のピッチ情報を抽出して出力する手段と、 ノイズテ−ブルと、 各フレ−ムデータの表す音声にノイズ以外の音声が含ま
    れているか否かを、当該フレームデータについて求めら
    れたピッチ情報、または、当該フレームデータについて
    求められたピッチ情報と当該フレームデータの表す音声
    の振幅に基づいて判定する手段と、 ノイズ以外の音声が含まれていないと判定された場合
    に、求められたパワ−スペクトルからフレ−ムデータの
    表す音声に含まれているノイズの特徴を抽出して前記ノ
    イズテ−ブルに記憶するノイズ処理手段と、ノイズ以外
    の音声が含まれていないと判定された場合に、前記フレ
    ームデータの示す音声の分析結果として、あらかじめ用
    意した無音の波形を表す波形情報を出力する手段と、 ノイズ以外の音声が含まれているとと判定された場合
    に、前記ノイズテ−ブル記憶されているノイズの特徴分
    をフレームデータの表す音声のパワ−スペクトルから除
    去する手段と、ノイズ以外の音声が含まれているとと判
    定された場合に、ノイズの特徴分を除去したパワ−スペ
    クトルから前記波形情報と振幅情報を、対応するフレ−
    ムデータについて求められた前記ピッチ情報を用いて抽
    出して出力する手段とを有することを有することを特徴
    とする音声情報分析装置。
  5. 【請求項5】請求項3または4記載の音声情報分析装置
    と、前記音声情報分析装置が出力する波形情報を量子化
    し、量子化データを出力する手段とを有することを特徴
    とする音声圧縮符号化装置。
  6. 【請求項6】音声を入力する手段と、入力された音声を
    標本化し標本化データを出力する手段と、標本化データ
    を集積し、標本化データを一定時間集積した前記フレー
    ムデータ出力するバッファ手段と、請求項5記載の前記
    音声圧縮符号化装置と、前記音声圧縮符号化装置の出力
    する前記ピッチ情報と波形情報と振幅情報を、有線もし
    くは無線の伝送路を介して送信する手段とを有すること
    を特徴とする通信端末装置。
JP5138626A 1993-06-10 1993-06-10 音声情報分析装置 Pending JPH06348293A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5138626A JPH06348293A (ja) 1993-06-10 1993-06-10 音声情報分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5138626A JPH06348293A (ja) 1993-06-10 1993-06-10 音声情報分析装置

Publications (1)

Publication Number Publication Date
JPH06348293A true JPH06348293A (ja) 1994-12-22

Family

ID=15226463

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5138626A Pending JPH06348293A (ja) 1993-06-10 1993-06-10 音声情報分析装置

Country Status (1)

Country Link
JP (1) JPH06348293A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
WO2004086362A1 (ja) * 2003-03-26 2004-10-07 Kabushiki Kaisha Kenwood 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
JP2006337415A (ja) * 2005-05-31 2006-12-14 Nec Corp 雑音抑圧の方法及び装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
US6167373A (en) * 1994-12-19 2000-12-26 Matsushita Electric Industrial Co., Ltd. Linear prediction coefficient analyzing apparatus for the auto-correlation function of a digital speech signal
US6205421B1 (en) 1994-12-19 2001-03-20 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
WO2004086362A1 (ja) * 2003-03-26 2004-10-07 Kabushiki Kaisha Kenwood 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
JP2006337415A (ja) * 2005-05-31 2006-12-14 Nec Corp 雑音抑圧の方法及び装置

Similar Documents

Publication Publication Date Title
CN108900725B (zh) 一种声纹识别方法、装置、终端设备及存储介质
JP3277398B2 (ja) 有声音判別方法
US7353167B2 (en) Translating a voice signal into an output representation of discrete tones
JP3840684B2 (ja) ピッチ抽出装置及びピッチ抽出方法
KR20060022156A (ko) 분산 음성 인식 시스템 및 그 방법
KR20060044629A (ko) 신경 회로망을 이용한 음성 신호 분리 시스템 및 방법과음성 신호 강화 시스템
KR20070015155A (ko) 부호화 모델 선택
JP2002507291A (ja) 音声通信システムにおける音声強調方法およびその装置
EP1312075B1 (en) Method for noise robust classification in speech coding
CN110472097A (zh) 乐曲自动分类方法、装置、计算机设备和存储介质
CN115223584B (zh) 音频数据处理方法、装置、设备及存储介质
CN1160450A (zh) 从连续语音中识别讲话声音的系统及其应用方法
CN118098255A (zh) 基于神经网络检测的语音增强方法及其相关装置
CN117877510A (zh) 语音自动化测试的方法、装置、电子设备及存储介质
CN117854489A (zh) 一种语音分类方法、装置、电子设备及存储介质
US4219695A (en) Noise estimation system for use in speech analysis
KR101414233B1 (ko) 음성 신호의 명료도를 향상시키는 장치 및 방법
JP3325248B2 (ja) 音声符号化パラメータの取得方法および装置
JPH06348293A (ja) 音声情報分析装置
JP3354252B2 (ja) 音声認識装置
JPH10301594A (ja) 有音検出装置
JP2003157100A (ja) 音声通信方法及び装置、並びに音声通信プログラム
JPH07334189A (ja) 音声情報分析装置
KR100766170B1 (ko) 다중 레벨 양자화를 이용한 음악 요약 장치 및 방법
JP2002049399A (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体