JPH06348293A

JPH06348293A - 音声情報分析装置

Info

Publication number: JPH06348293A
Application number: JP5138626A
Authority: JP
Inventors: Minako Oota; 美奈子太田
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1993-06-10
Filing date: 1993-06-10
Publication date: 1994-12-22

Abstract

(57)【要約】【目的】音声情報分析装置において、動的に特徴が変化
するノイズの除去を効率良く行う。【構成】有音無音部７２０が、無音と判定した場合、ノ
イズ処理部６９０は、軸変換部６４０の出力する入力音
声のパワ−スペクトルよりノイズの特徴をノイズテーブ
ル７１０に記憶し、無音用フレーム設定部７００は無音
を表すデータを正規化波形系列６８２として出力する。
有音と判定した場合、ノイズ除去部６６０は、ノイズテ
−ブル７１０に記憶されているノイズの特徴を用いて、
軸変換部６４０の出力するパワ−スペクトル列よりノイ
ズを除去する。逆ＦＦＴ部６７０は、ノイズの除去され
たパワ−スペクトルを逆ＦＦＴする。正規化部６８０
は、ピッチ抽出部６５０から受け取ったピッチ情報を用
いて逆ＦＦＴ部６７０出力を正規化し正規化波形系列６
８２として出力する。【効果】入力信号に混入される絶えず変化する周囲のノ
イズ特徴を常に抽出し、そのノイズ特徴を取り除くこと
によって、如何なる状況下でも的確にノイズ除去を行う
ことができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声情報分析を行う音
声情報分析装置に関し、特に、音声信号から動的に変化
するノイズ成分を除去する技術に関するものである。

【０００２】

【従来の技術】入力音声信号からノイズを除去する従来
の技術としては、特開平２−２７８２９８号公報記載の
技術や、特開平１−７５５９３号公報記載の技術が知ら
れている。

【０００３】前記特開平２−２７８２９８号公報記載の
技術は、フィルタを細分化して使用し、固定的に特定の
周波数の除去する技術であり、その音質は除去する周波
数によって左右される。また、前記特開平１−７５５９
３号公報記載の技術は、ノイズ除去用のニューラル・ネ
ットワークを用いて、あらかじめノイズの特徴を学習／
抽出し、これを用いてノイズを除去する技術であり、そ
の音質は、ノイズの特徴を学習／抽出に用いるデータ
（音声＋ノイズ）に混入するノイズ選定に左右される。

【０００４】

【発明が解決しようとする課題】前記、特開平２−２７
８２９８号公報記載のノイズ除去用のフィルタを用いて
特定の周波数を除去する技術によれば、除去対象とする
周波数のが固定的であるため、話者、背景の移動、変化
に伴い動的に特徴が変化するノイズの除去には適してい
ない。

【０００５】また、前記特開平１−７５５９３号公報記
載のノイズの特徴を、あらかじめ抽出／学習させておく
技術でも、ニューラル・ネットワークの性質上、ノイズ
学習には長時間を要するので、話者、背景の移動、変化
に伴い動的に特徴が変化するノイズの除去には適してい
ない。

【０００６】また、音声情報分析を行う場合に、音声情
報分析対象の音声信号から、ノイズを除去するために、
これらの技術を適用すると、いずれの場合も、音声情報
分析処理の前処理として、声分析処理とは別個にノイズ
除去の処理を行わなければならない。このため、リアル
タイムな音声情報分析処理を行う場合には、過負荷とな
る可能性があり、音声情報分析の機能を制限して実現す
るか、各処理を、異なるプロセッサで実行させることに
より実現する必要が生じる場合がある。

【０００７】そこで、本発明は、音声情報分析の対象と
する音声信号から、動的に特徴が変化するノイズの除去
を効率良く行うことのできる音声情報分析装置を提供す
ることを目的とする。

【０００８】

【課題を解決するための手段】前記目的達成のために、
本発明は、音声の標本化データを一定時間集積したフレ
ームデータの示す音声を分析した分析結果を出力する音
声情報分析方法であって、各フレ−ムデータの表す音声
にノイズ以外の音声が含まれているか否かを判定するス
テップと、ノイズ以外の音声が含まれていないと判定さ
れた場合に、フレームデータからフレ−ムデータの表す
音声に含まれているノイズの特徴を抽出して記憶し、前
記フレームデータの示す音声の分析結果として、あらか
じめ用意した無音の音声の分析結果を表す情報を出力す
る無音系処理を実行ステップと、ノイズ以外の音声が含
まれているとと判定した場合には、前回の無音系処理で
記憶したノイズの特徴分をフレームデータの表す音声か
ら除去し、ノイズの特徴分を除去したフレームデータの
示す音声を分析し、分析した結果を出力する有音系処理
を実行するステップとを有することを特徴とする音声情
報分析方法を提供する。

【０００９】

【作用】本発明に係る音声情報分析方法によれば、各フ
レ−ムデータの表す音声にノイズ以外の音声が含まれて
いるか否かを判定し、ノイズ以外の音声が含まれていな
いと判定された場合に、フレームデータからフレ−ムデ
ータの表す音声に含まれているノイズの特徴を抽出して
記憶すると共に、前記フレームデータの示す音声の分析
結果として、あらかじめ用意した無音の音声の分析結果
を表す情報を出力する無音系処理を実行する。一方、ノ
イズ以外の音声が含まれているとと判定した場合には、
前回の無音系処理で記憶したノイズの特徴分をフレーム
データの表す音声から除去し、ノイズの特徴分を除去し
たフレームデータの示す音声を分析し、分析した結果を
出力する有音系処理を実行する。

【００１０】したがって、ノイズ以外の音声が含まれて
いない期間、すなわち無音とみなして、あらかじめ求ま
る無音の分析結果を出力すれば足りる期間に、常に最新
のノイズの特徴抽出を行っておくので、ノイズ以外の音
声が含まれている期間には、この抽出した最新のノイズ
の特徴を用いて、ノイズの除去を行うことができる。ま
た、有音系処理と無音系処理は、同時に生起することは
無いので、この処理の実行負荷は小く、音声情報分析の
機能を制限せずに単一のプロセッサ上で実現できる。

【００１１】

【実施例】以下、本発明の一実施例を説明する。

【００１２】まず、第１の実施例について説明する。

【００１３】図５に、本発明に係る音声情報分析装置を
適用した通信システムの構成を示す。

【００１４】図中、２０００が送信装置、１０００が受
信装置である。

【００１５】送信装置２０００は、音声信号を音声分析
を利用した手法で圧縮符号化して得られたレベル情報と
量子化データとピッチ情報を受信装置１０００に送信す
る。受信装置１０００は受信した情報より音声を復号化
して出力する。

【００１６】ここで、前記送信装置２００は、送信部９
００、ベクトル量子化部８００、音声情報分析装置１０
０とを備えており、受信装置１０００は、受信部１１０
０と、ベクトル逆量子化部１１００と、合成部１２００
と、Ｄ／Ａ変換部１３００と、バッファメモリ１５００
と、音声出力装置１４００を備えている。

【００１７】送信装置２０００において、音声情報分析
装置１００は、入力された入力音声を分析し、得られた
レベル情報６８１と、ピッチ情報６５１を送信部９００
に、正規化波形系列６８２をベクトル量子化部８００に
送る。ベクトル量子化部８００は受け取った正規化波形
系列６８２をベクトルコードに変換し、変換して得られ
た量子化データ８０１を送信部９００に送る。送信部９
００は、レベル情報６８１と、ピッチ情報６５１と、量
子化データ８０１を受け取り、これを有線／無線を介し
て、受信装置１０００に送信する。

【００１８】一方、受信装置１０００において、受信部
１０００は、送信装置２０００より送信された情報を受
信し、レベル情報６８１’と量子化データ８０１’とピ
ッチ情報６５１’とを出力する。ベクトル逆量子化部１
１００は、出力された量子化データ８０１’を逆量子化
する。合成部１２００は、ベクトル逆量子化部１１００
が出力する波形６８２’を、前記ピッチ情報６５１’に
基づき、繰り返し周期（ピッチ情報）毎に重ね合わせる
ことにより、波形を合成し、バッファメモリ１５００格
納する。Ｄ／Ａ変換部１３００は、バッファメモリ４０
０の出力をデジタル／アナログ（Ｄ／Ａ）変換する。音
声出力装置１４００は、Ｄ／Ａ変換器１３００により得
られた音声を出力する。

【００１９】以下、前記音声情報分析装置１００の詳細
について説明する。

【００２０】図５に示すように、前記音声情報分析装置
１００は、音声の入力手段である音声入力部２００と、
入力された入力音声をアナログ／デジタル（Ａ／Ｄ）変
換して、音声標本化データに変換するＡ／Ｄ変換器３０
０と、この音声標本化データを、順次記憶するバッファ
メモリ４００を有している。バッファメモリ４００に記
憶された一定時間（１０〜３０ミリ秒）毎の音声標本化
データは、一定時間音声標本化データ（フレームデー
タ）４０１として有音／無音判定部５００に送られる。
また、音声情報分析装置１００は、有音／無音を判定す
る有音／無音判定部５００と、音声情報分析装置１００
は、フレームデータ４０１から、正規化波形系列６８
２、レベル情報６８１と、ピッチ情報６５１を作成する
分析部６００とを有している。

【００２１】まず、有音／無音判定部５００は、図１に
示すように、音声パワー判定部５１０から構成される。
音声パワー判定部５１０は、フレームデータ４０１の各
要素の総和（パワ−）を求め、これと、閾値（固定値）
と比較した後、閾値より小さければ無音、大きければ有
音と判定し、有音／無音を表す有音／無音判定子５１１
を出力する。

【００２２】なお、上記閾値で十分な効果が得られなけ
れば、閾値を、式１に従い可変とするようにしてもよ
い。なお、式１において、ωは、０＜ω＜１を満たす重
み値である。

【００２３】次フレ−ムデータ閾値＝ω前フレームデータの閾値＋（１−ω）現無音パワー値．．（式１）すなわち、無音と判定されたときに、無音と判定された
パワ−の値と、前フレームデータの判定用いた閾値と
に、適当な重み付けを行い、これの加算値を次フレ−ム
データの判定に用いる閾値を求めるようにする。

【００２４】また、音声パワー判定部５１０の有音／無
音の判定は、次のように行うようにしても良い。すなわ
ち、判定対象フレ−ムデータのパワ−と前フレ−ムデー
タのパワ−とを比較し、差が所定値より大きい場合に
は、有音／無音の状態が前回と変化したと判定し、差が
所定値より小さい場合には、有音／無音の状態が変化し
ていないと判定する。そして、記憶しておいた前フレ−
ムデータの判定結果より、判定対象フレ−ムデータにつ
いての有音／無音の判定を行う。または、差が所定値よ
り大きい場合に、さらに、判定対象フレ−ムデータのパ
ワ−と前記閾値との比較を行い有音／無音の判定を行う
ようにする。

【００２５】次に、分析部６００は、図２に示すよう
に、フレームデータ４０１からＦＦＴ（ＦａｓｔＦｏ
ｕｒｉｅｒＴｒａｎｓｆｏｒｍ：高速フーリエ変換）
によりフレ−ムデータの周波数特性を得るＦＦＴ部６２
０と、ＦＦＴ部６２０にデータの設定を行うＦＦＴデー
タ設定部６１０とを有している。また、ＦＦＴ部６２０
のＦＦＴにより得られた複素数の絶対値の二乗値、すな
わち、パワースペクトルを出力するパワースペクトル変
換部６３０と、パワースペクトルの縦軸をパワースペク
トル軸から振幅軸に変換する軸変換部６４０とを有して
いる。なお、ＦＦＴ（ＦａｓｔＦｏｕｒｉｅｒＴｒ
ａｎｓｆｏｒｍ：高速フーリエ変換）は、信号のサンプ
リング値から元波形を周波数と振幅によって再生する技
法ＤＦＴ（ＤｉｓｃｒｅｔｅＦｏｕｒｉｅｒＴｒａ
ｎｓｆｏｒｍ：離散フーリエ変換）を更に高速に実現し
たものであり、このようなＦＦＴによる信号処理技術
は、「信号処理入門」雨宮好文／佐藤幸男箸オー
ム社Ｐ１０６〜６．３「高速フーリエ変換」等に
詳細に説明されている。

【００２６】また、分析部６００は、ＦＦＴ部７３０と
ピッチ抽出部６５０とノイズ除去部６６０と逆ＦＦＴ部
６７０と正規化部６８０とより構成される有音処理系
と、ノイズ処理部６９０と無音データ設定部７００とよ
り構成される無音処理系と、ノイズテーブル７１０と、
有音／無音部７２０とを有している。

【００２７】有音／無音部７２０は、有音／無音判定部
５００から出力された有音／無音判定子５１１を判定
し、有音の場合は有音処理系に処理を行わせ、無音の場
合には無音処理系に処理を行わせる。

【００２８】まず、有音／無音部７２０が無音と判定し
た場合の無音処理系の動作を説明する。

【００２９】この場合、ノイズ処理部６９０は、軸変換
部６４０の出力より、ノイズの特徴、ノイズテーブル７
１０に記憶する。すなわち、たとえば、軸変換部より軸
変換された周波数特性情報、パワ−スペクトル列をノイ
ズテ−ブル７１０に記憶する。無音用フレーム設定部７
００は、正規化波形系列６８２として、無音を正規化波
形系列表すデータ６８２ｂをベクトル量子化部８００に
出力する。

【００３０】次に、有音／無音部７２０が有音と判定し
た場合の有音処理系の動作を説明する。

【００３１】この場合において、ＦＦＴ部７３０は、パ
ワースペクトルの対数値（ケプストラム）からピッチ周
期を求めるために用いられる。ピッチ抽出部６５０は、
ＦＦＴ部７３０の出力より、音声の特徴（高さ）と繰り
返し周期（ピッチ情報）を抽出する。ノイズ除去部６６
０は、ノイズテ−ブル７１０に記憶されているノイズの
特徴を用いて、軸変換部６４０の出力する有音時のパワ
−スペクトル列よりノイズを除去する。逆ＦＦＴ部６７
０は、ノイズの除去されたパワ−スペクトルを逆ＦＦＴ
する。正規化部６８０は、ピッチ抽出部から受け取った
ピッチ情報を用いて逆ＦＦＴ部６７０の出力を正規化
し、逆ＦＦＴされた結果の最大値を”１”にし、ピッチ
内の波形を表す正規化波形系列６８２ａを列正規化波形
系列６８２として出力する。また、逆ＦＦＴ部６７０の
出力のレベルの情報をレベル情報６８１として出力す
る。

【００３２】さて、ノイズ除去部６６０によるノイズ除
去は、たとえば次のようにして行う。すなわち、ノイズ
除去部６６０において、ノイズテ−ブル７１０の記憶内
容に応じて、各周波数に対する０．０〜１．０の重み付
けを記憶したノイズ・マスクテーブルを作成し、有音時
のパワースペクトル列に対して対応する重みを乗算す
る。この重みは、ノイズテ−ブル７１０に記憶されてい
る無音時のパワ−スペルトル（ノイズのパワ−スペクト
ル）の絶対値の大きい周波数がより小さくなるよう、順
に０．０〜１．０の重み付けを行う。つまりノイズが顕
著に表れている周波数には、１．０以下の値が乗算され
るようにすることによって、有音時のパワースペクトル
の該当パワースペクトル値を元の値より減少の方向に移
行させ、ノイズ・スペクトルが現れない周波数には１．
０の重みを付けることによってその周波数のパワースペ
クトル値がそのまま残す。この結果として、ノイズの取
り除かれたパワースペクトル列を得ることができる。

【００３３】以下、本発明の第２の実施例について説明
する。

【００３４】本第２実施例は、前記第１実施例と有音／
無音判定部５００と分析部６００の構成のみが異なる。

【００３５】本第２実施例に係る有音／無音判定部５０
０は、図３に示すように、フレームデータをＦＦＴ処理
するためのデータ設定を行うＦＦＴデータ設定部６１０
と、フレームデータをＦＦＴする手段であるＦＦＴ部６
２０と、得られた複素数の二乗和を求めるパワースペク
トル変換部６３０と、上記フレームデータよりフレーム
データの総和を取り、閾値と比較し、有音／無音判定子
７２１を出力する音声パワー判定部５１０と、前記音有
音／無音判定子の判定をする有音／無音判定部７２０
と、パワースペクトルをＦＦＴ処理するためのＦＦＴ部
６２０と、上記パワースペクトの対数、ケプストラムよ
りピッチ情報を抽出し、無音時にはピッチ周期が一定に
定まらないこと（「ディジタル信号処理」古井貞煕箸
Ｐ５７〜Ｐ５９４．９ピッチ抽出）を利用して有
音状態を判定して、有音／無音判定子を出力するピッチ
抽出部６５０とを有している。

【００３６】さて、音声パワー判定部５１０は、前記第
１実施例に係る音声パワー判定部５１０と同様に、各フ
レ−ムデータのパワ−より有音／無音を判定する。しか
し、前述した判定方法によれば、パワ−のみによって有
音／無音を判定しているために、無音状態を誤って有音
と判定しまう場合がある。そこで、本第２実施例では、
音声パワー判定部５１０が有音と判定した場合に、有音
／無音判定部７２０によって、ＦＦＴ部７３０とピッチ
抽出部６５０を起動し、さらにピッチ周期を利用した有
音／無音判定を行う。

【００３７】すなわち、音声パワー判定部５１０が有音
と判定した場合、ＦＦＴ部７３０は、パワースペクトル
をＦＦＴ処理する。ピッチ抽出部６５０は、この出力よ
り、パワースペクトの対数、ケプストラムよりピッチ情
報を抽出し、無音時にはピッチ周期が一定に定まらない
こと（「ディジタル信号処理」古井貞煕箸Ｐ５７〜
Ｐ５９４．９ピッチ抽出を参照）を利用して有音／
無音状態を判定して、有音／無音判定子を出力する。な
お、ピッチ抽出部６５０の有音／無音の判定は、時間軸
上のピッチ情報を周波数軸上のピッチ周期に変換し、パ
ワースペクトルに対し、ピッチ周期ごとに極大値が存在
すれば有音、存在しなければ無音として判定することに
より行うようにしてもよい。

【００３８】次に、本第２実施例に係る分析部６００
は、図４に示すように、縦軸をパワースペクトル軸から
振幅軸に変換する軸変換部６４０と、ノイズを除去する
ノイズ除去部６６０と、逆ＦＦＴする手段である逆ＦＦ
Ｔ部６７０と、逆ＦＦＴされた結果の最大値を”１”に
するための正規化部６８０と、有音／無音部９２０と、
ノイズの特徴を抽出するノイズ処理部６９０と、無音を
出力するためのデータを設定する無音用データ設定部７
００と、ノイズ・テーブル７１０を有する。各部の個々
の動作は、前記第１実施例の対応部と同様である。た
だ、本第２実施例では、ノイズ除去部６６０と逆ＦＦＴ
部６７０と正規化部６８０が有音処理系を構成してい
る。そして、有音／無音部９２０が、ピッチ抽出部６５
０の出力する有音／無音判定子が有音を示す場合にの
み、この有音処理系に処理を行わせる。一方、ノイズ処
理部６９０と無音用データ設定部７００とより構成され
る無音処理系の処理は、有音／無音部９２０と、有音／
無音判定部５００の有音／無音部７２０との、少なくと
もいづれか一方が無音を判定した場合に行われる。

【００３９】以上のように、本実施例によれば、絶えず
変化する周囲のノイズを常に抽出し、そのノイズ特徴を
取り除くことによって、如何なる状況でも的確なノイズ
除去を行うことができる。

【００４０】さて、前記第１実施例および第２実施例に
係る有音／無音判定部５００と分析部６００の各部の行
う処理は、プロセッサ上で動作するプログラムとして実
現することができる。この場合、無音時には、無音処理
系の処理のみを行い、有音時には有音処理系の処理のみ
を行えばよく、かつ、無音処理系の前処理と有音処理系
の前処理は共通しているので、ノイズ除去を音声分析の
前処理として行う従来の技術に比べ、プロセッサの処理
の負荷は小さく、単一のプロセッサ上で動作するプログ
ラムとして実現することができる。

【００４１】なお、以上の実施例では、通信システムへ
の適用を例にとり説明したが、本第１、第２実施例に係
る音声情報分析装置は、この他、分析部６００の分析結
果を用いて、音声認識等の処理を行う装置等、多様な装
置に適用することができる。

【００４２】

【発明の効果】以上説明してきたように、本発明によれ
ば、音声分析の対象とする音声信号から、動的に特徴が
変化するノイズの除去を効率良く行うことのできる音声
分析装置を提供することができる。

【図面の簡単な説明】

【図１】本発明の第１実施例に係る有音／無音判定部の
構成を示すブロック図である。

【図２】本発明の第１実施例に係る分析部の構成を示す
ブロック図である。

【図３】本発明の第２実施例に係る有音／無音判定部の
構成を示すブロック図である。

【図４】本発明の第２実施例に係る分析部の構成を示す
ブロック図である。

【図５】本発明の実施例に係る通信システムの構成を示
すブロック図である。

【符号の説明】

１００音声情報分析装置２００音声入力装置３００Ａ／Ｄ変換器４００バッファメモリ４０１フレームデータ５００有音／無音判定部５１１有音／無音判定子６００分析部６１０ＦＦＴデータ設定部６２０ＦＦＴ部６３０パワースペクトル変換部６３１パワースペクトル列６４０軸変換部６５０ピッチ抽出部６５１ピッチ情報６６０ノイズ除去部６７０逆ＦＦＴ部６８０正規化部６８１正規化波形系列６８２レベル情報６９０ノイズ処理部７００無音用フレーム設定部７１０ノイズデーブル７２０有音／無音部８００ベクトル量子化部８０１ベクトルコード９００送信部１１００ベクトル逆量子化部１２００合成部１３００Ｄ／Ａ変換部１４００音声出力装置

Claims

【特許請求の範囲】

【請求項１】音声の標本化データを一定時間集積したフ
レームデータの示す音声を分析した分析結果を出力する
音声情報分析方法であって、各フレ−ムデータの表す音声にノイズ以外の音声が含ま
れているか否かを判定するステップと、ノイズ以外の音声が含まれていないと判定された場合
に、フレームデータからフレ−ムデータの表す音声に含
まれているノイズの特徴を抽出して記憶し、前記フレー
ムデータの示す音声の分析結果として、あらかじめ用意
した無音の音声の分析結果を表す情報を出力する無音系
処理を実行するステップと、ノイズ以外の音声が含まれていると判定した場合に、前
回の無音系処理で記憶したノイズの特徴分をフレームデ
ータの表す音声から除去し、ノイズの特徴分を除去した
フレームデータの示す音声を分析し、分析した結果を出
力する有音系処理を実行するステップとを有することを
特徴とする音声情報分析方法。
【請求項２】音声の標本化データを一定時間集積したフ
レームデータの示す音声を分析した分析結果を出力する
音声情報分析装置であって、ノイズテ−ブルと、各フレ−ムデータの表す音声にノイズ以外の音声が含ま
れているか否かを、フレ−ムデータの表す音声の振幅に
基づいて判定する手段と、ノイズ以外の音声が含まれていないと判定された場合
に、フレームデータからフレ−ムデータの表す音声に含
まれているノイズの特徴を抽出して前記ノイズテ−ブル
に記憶し、前記フレームデータの示す音声の分析結果と
して、あらかじめ用意した無音の音声の分析結果を表す
情報を出力する手段と、ノイズ以外の音声が含まれているとと判定された場合
に、前記ノイズテ−ブルに記憶されているノイズの特徴
分をフレームデータの表す音声から除去し、ノイズの特
徴分を除去したフレームデータの示す音声を分析し、分
析結果を出力する手段とを有することを特徴とする音声
情報分析装置。
【請求項３】音声の標本化データを一定時間集積したフ
レームデータの示す音声を分析し、各フレ−ムデータの
表す音声のピッチを表すピッチ情報と、前記ピッチ内の
音声波形を表す波形情報と、フレ−ムデータの表す音声
の振幅を表す振幅情報とを出力する音声情報分析装置で
あって、各フレ−ムデータの表す音声のパワ−スペクトルを求め
る手段と、求められたパワ−スペクトルからフレームデータの示す
音声のピッチ情報を抽出して出力する手段と、ノイズテ−ブルと、各フレ−ムデータの表す音声にノイズ以外の音声が含ま
れているか否かを、フレ−ムデータの表す音声の振幅に
基づいて判定する手段と、ノイズ以外の音声が含まれていないと判定された場合
に、当該フレームデータの表す音声のパワ−スペクトル
からフレ−ムデータの表す音声に含まれているノイズの
特徴を抽出して前記ノイズテ−ブルに記憶する手段と、
ノイズ以外の音声が含まれていないと判定された場合
に、前記フレームデータの示す音声の分析結果として、
あらかじめ用意した無音の波形を表す波形情報を出力す
る手段と、ノイズ以外の音声が含まれていると判定された場合に、
前記ノイズテ−ブル記憶されているノイズの特徴分をフ
レームデータの表す音声のパワ−スペクトルから除去す
る手段と、ノイズ以外の音声が含まれているとと判定さ
れた場合に、ノイズの特徴分を除去したパワ−スペクト
ルから前記波形情報と振幅情報を、対応するフレ−ムデ
ータについて求められた前記ピッチ情報を用いて抽出し
て出力する手段とを有することを有することを特徴とす
る音声情報分析装置。
【請求項４】音声の標本化データを一定時間集積したフ
レームデータの示す音声を分析し、各フレ−ムデータの
表す音声のピッチを表すピッチ情報と、前記ピッチ内の
音声波形を表す波形情報と、フレ−ムデータの表す音声
の振幅を表す振幅情報とを出力する音声情報分析装置で
あって、各フレ−ムデータの表す音声のパワ−スペクトルを求め
る手段と、求められたパワ−スペクトルからフレームデータの示す
音声のピッチ情報を抽出して出力する手段と、ノイズテ−ブルと、各フレ−ムデータの表す音声にノイズ以外の音声が含ま
れているか否かを、当該フレームデータについて求めら
れたピッチ情報、または、当該フレームデータについて
求められたピッチ情報と当該フレームデータの表す音声
の振幅に基づいて判定する手段と、ノイズ以外の音声が含まれていないと判定された場合
に、求められたパワ−スペクトルからフレ−ムデータの
表す音声に含まれているノイズの特徴を抽出して前記ノ
イズテ−ブルに記憶するノイズ処理手段と、ノイズ以外
の音声が含まれていないと判定された場合に、前記フレ
ームデータの示す音声の分析結果として、あらかじめ用
意した無音の波形を表す波形情報を出力する手段と、ノイズ以外の音声が含まれているとと判定された場合
に、前記ノイズテ−ブル記憶されているノイズの特徴分
をフレームデータの表す音声のパワ−スペクトルから除
去する手段と、ノイズ以外の音声が含まれているとと判
定された場合に、ノイズの特徴分を除去したパワ−スペ
クトルから前記波形情報と振幅情報を、対応するフレ−
ムデータについて求められた前記ピッチ情報を用いて抽
出して出力する手段とを有することを有することを特徴
とする音声情報分析装置。
【請求項５】請求項３または４記載の音声情報分析装置
と、前記音声情報分析装置が出力する波形情報を量子化
し、量子化データを出力する手段とを有することを特徴
とする音声圧縮符号化装置。
【請求項６】音声を入力する手段と、入力された音声を
標本化し標本化データを出力する手段と、標本化データ
を集積し、標本化データを一定時間集積した前記フレー
ムデータ出力するバッファ手段と、請求項５記載の前記
音声圧縮符号化装置と、前記音声圧縮符号化装置の出力
する前記ピッチ情報と波形情報と振幅情報を、有線もし
くは無線の伝送路を介して送信する手段とを有すること
を特徴とする通信端末装置。