JPH10143193A

JPH10143193A - 音声信号処理装置

Info

Publication number: JPH10143193A
Application number: JP8296104A
Authority: JP
Inventors: Sachihiro Yamashita; 祥宏山下; Shoichi Goto; 昌一後藤; Shuhei Taniguchi; 周平谷口; Atsushi Ishizu; 厚石津
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1996-11-08
Filing date: 1996-11-08
Publication date: 1998-05-29

Abstract

(57)【要約】【課題】重要キーワードの欠落の少ない、聴き取りや
すい早送り音声再生を可能とする音声処理装置の提供を
目的とする。【解決手段】音声信号入力手段と、音声信号を分割す
る音声フレーム生成手段と、音声信号を任意の周波数帯
域幅に分割するフィルターバンクと、周波数帯域分割し
た音声信号から、任意の周波数帯域を含む音声信号を選
択する有音声判定対象帯域選択手段と、選択した周波数
帯域制限の音声信号から、有音であるか無音であるかの
判定を行なう有音声判定手段と、音声信号を一時蓄積す
る一時バッファ手段と、有音であるか無御であるかの判
定結果と一時バッファ手段に蓄積された分割音声信号の
数をもとに、一時バッファ手段に蓄積した音声信号を分
割音声信号毎に管理する一時バッファ管理手段と、音声
信号出力手段を備えたことを特徴とした音声信号処理装
置。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声信号の早送り再
生に関するものである。

【０００２】

【従来の技術】最近のビデオ機器などでは、映像の早送
り再生技術の発展とともに、音声の早送り再生技術も発
展してきている。

【０００３】映像の早送り再生は、視覚的に気にならな
い程度のコマ落としを行い、映像を間引きながら再生す
ることで早送り再生を可能としている。

【０００４】一方音声は、時間データの間引きを行い、
時間長を短くすることで早送り再生を可能としている。
この時間データの間引きは、単純に音声データの内容に
関係なくある一定長を間引く方法と、無音音声部を検知
し、これを間引く方法がある。またこれらの２つを合わ
せた方法もある。

【０００５】従来例として、単純間引きと、無音音声部
を検知しこれを間引く２つの方法を合わせた早送り音声
再生を図１１を用い説明する。

【０００６】図１１において１０１はA/D変換器であ
り、１０２は前記A/D変換器１０１で変換した音声デー
タを、ある時間単位毎に分割する音声フレーム生成手段
である。以後このようにある時間毎に分割された音声信
号を音声フレームと呼ぶ。

【０００７】１０３は前記音声フレーム生成手段１０２
で生成した音声フレームを入力とし、音声フレームの振
幅レベルの絶対値を検知する振幅レベル検知手段であ
る。１０４は前記振幅レベル検知手段１０３で検知した
振幅レベルの絶対値を入力とし、あらかじめ設定したし
きい値レベルとの比較を行い、音声フレームの選択を行
うしきい値比較手段である。１０５は前記しきい値比較
手段１０４によって選択された音声フレームを時系列に
蓄積する一時バッファ手段である。１０６は前記一時バ
ッファ手段１０５に蓄積された音声フレームを管理する
一時バッファ管理手段である。１０７は前記一時バッフ
ァ手段１０５からの音声信号を入力とするD/A変換器で
ある。

【０００８】次に具体的に１.２５倍速度の早送り音声
信号の生成方法を例にとって説明する。

【０００９】まず入力音声信号をA/D変換器１０１によ
ってデジタル変換し、音声フレーム生成手段１０２によ
って、音声ピッチ周期に近い２０ミリ秒毎に分割し、音
声フレームを生成する。

【００１０】生成された音声フレームを次の振幅レベル
検知手段１０３に入力し、音声フレームの振幅レベルの
絶対値を検知する。

【００１１】次にしきい値比較手段１０４へ音声フレー
ムの振幅レベルの絶対値を入力し、しきい値レベルと振
幅レベルの絶対値との比較を行い、音声フレームが有音
声の音声フレームであるか無音声の音声フレームである
かの判定を行う。しきい値レベルは無音状態に近い値設
定する。判定は、しきい値レベルよりも振幅レベルの絶
対値が大きい場合、有音声の音声フレームと判定し、小
さい場合には無音声の音声フレームと判定する。

【００１２】このようにして、有音声の音声フレームと
判定された音声フレームがしきい値比較手段１０４によ
って選択され、時系列に次の一時バッファ手段１０５へ
蓄積されていく。蓄積される音声フレーム数は時間の経
過とともに増加していく。

【００１３】一時バッファ管理手段１０６では、音声フ
レーム生成手段１０２で生成した音声フレームの数を受
け、一時バッファ手段１０５に蓄積された音声フレーム
数を調整する。

【００１４】ここでバッファ管理手段１０６による音声
フレーム数の調整方法を説明する。説明のため一時バッ
ファ手段１０５の容量は音声フレーム生成手段１０２で
生成される音声フレームの大きさの１０倍、つまり音声
フレーム１０フレーム分の容量を持つものとする。

【００１５】１.２５倍速度の早送り音声再生を実現す
るためには、時間軸方向に８/１０の圧縮を行う必要が
ある。このため一時バッファ管理手段１０６によって一
時バッファ手段１０５に蓄積した音声フレーム数を、音
声フレーム１０フレーム分に相当する時間毎に８フレー
ムに調整する必要がある。

【００１６】調整時、一時バッファ手段１０５に音声フ
レームが１０フレーム存在する場合は、蓄積された音声
フレームの１０フレーム中から、蓄積の順番の古い音声
フレームから遡って２フレームを破棄する。９フレーム
存在する場合には、同様に最後の１フレームを破棄す
る。このようにして音声フレームの内容に関係なく単純
に音声フレームを間引いていく。

【００１７】８フレーム存在する場合は破棄は行わず、
７フレーム以下である場合は中身が無音である音声デー
タの音声フレームを８フレームに満たす分だけ最後の音
声フレームへ付加する。このようにして調整毎で常に８
フレームになるように管理する。

【００１８】このようにして一時バッファ手段１０５の
音声フレーム数を調整毎に８フレームに管理すること
で、時間軸方向に８/１０の圧縮が達成される。

【００１９】そしてこの８つの音声フレームをD/A変換
器１０７へ順に入力し、アナログ信号へ変換し再生する
ことで、入力音声信号に対し１.２５倍速度の早送り音
声再生を達成できる。

【００２０】ところで実際の音声信号、例えばテレビ番
組などの音声信号を入力とした場合、無音声であるシー
ンは少なく、しきい値比較手段１０４で無音の音声フレ
ームと判定される音声フレームの数は少ない。

【００２１】このため音声フレーム生成手段１０２によ
って生成された音声フレームは、しきい値比較手段１０
４によって有音声の音声フレームと判定されることが多
く、ほとんどが一時バッファ手段１０５へ蓄積される。
これによりしきい値比較手段１０４での無音の音声フレ
ームの破棄は期待できず、一時バッファ管理手段１０６
による音声フレームの破棄が頻繁に起こる。そしてこの
破棄された音声フレームの中に重要なキーワードが存在
した場合は、聴取者にとって内容理解が困難な早送り音
声再生になる。

【００２２】

【発明が解決しようとする課題】テレビ音声などを入力
音声信号とした場合、従来例では無音の音声フレームの
存在が少ない場合に、一時バッファ管理手段１０６によ
って頻繁に音声フレームの破棄が生じる。このため破棄
した音声フレーム中に重要なキーワードが存在した場
合、内容理解が困難な早送り音声再生となっていた。

【００２３】本発明ではかかる点に艦み、無音の音声フ
レームが存在しない場合に生じる重要なキーワードを含
む音声フレームの破棄による内容理解困難な早送り音声
再生を改善するため、柔軟な無音、有音の音声フレーム
の判定手段を備えた音声信号処理装置を提供するもので
ある。

【００２４】

【課題を解決するための手段】前記目的を達成するため
に、本発明の音声信号処理装置は、音声信号を入力とす
る音声信号入力手段と、前記音声信号入力手段からの音
声信号を入力とし、音声信号の分割を行なう音声フレー
ム生成手段と、前記音声フレーム生成手段によって分割
した音声信号を入力とし、任意の周波数帯域幅に分割す
るフィルターバンクと、前記フィルターバンクによって
周波数帯域分割した音声信号を入力とし、周波数帯域分
割された音声信号から任意の周波数帯域を含む音声信号
を選択する有音声判定対象帯域選択手段と、前記有音声
判定対象帯域選択手段によって選択された周波数帯域制
限の音声信号を入力とし、有音であるか無音であるかの
判定を行ない、前記音声フレーム生成手段からの音声信
号の選択を行なう有音声フレーム判定手段と、前記有音
声判定手段によって選択された音声信号を入力とし、時
系列に一時蓄積する一時バッファ手段と、前記一時バッ
ファ手段に蓄積された音声信号を管理する一時バッファ
管理手段と、前記一時バッファ手段からの音声信号を出
力する音声信号出力手段を備えたことを特徴としてい
る。

【００２５】また、前記目的を達成するために、本発明
の音声信号処理装置は、前記音声フレーム手段からの有
音声信号を選択する有音声フレーム選択手段と、前記一
時バッファ管理手段の代わりに、前記一時バッファ手段
に蓄積された分割音声信号を、前記一時バッファ手段に
蓄積された分割音声信号の数をもとに、分割音声信号単
位に管理する一時バッファ管理手段を備えたことを特徴
としている。

【００２６】

【発明の実施の形態】

(実施例１)本発明の実施例１を図１、図２、図３、図
４、図５を用いて説明する。

【００２７】図1は本発明の音声信号処理装置の実施例
１を示すブロック図である。図1において１は音声信号
入力手段であり、A/D変換器を備える。２は前記音声信
号入力手段１からの入力音声信号をある時間毎に分割し
音声フレームを生成する音声フレーム生成手段であり、
３は前記音声フレーム生成手段２からの音声フレームを
入力とし、複数の周波数帯域へ分割するフィルターバン
クであり、４は前記フィルターバンク３からの周波数帯
域分割された音声フレームを入力とし、有音声判定の対
象となる周波数帯域を含む周波数帯域制限の音声信号を
選択する有音声判定対象帯域選択手段であり、５は前記
有音声判定対象帯域選択手段４で選択した周波数帯域制
限の音声信号を入力とし、有音、無音の判定を行なう有
音声フレーム判定手段である。６は前記音声フレーム生
成手段２で生成した音声フレームを時系列に蓄積する一
時バッファ手段であり、７は前記一時バッファ手段７に
蓄積された音声フレームを、前記有音声フレーム判定手
段での判定結果と前記一時バッファ手段に蓄積された音
声フレームの数をもとに、音声フレーム単位に管理する
一時バッファ管理手段であり、８は前記一時バッファ手
段６からの音声信号を入力とする音声信号出力手段であ
り、D/A変換器を備える。

【００２８】次に例として１.２５倍速度の早送り音声
再生を達成するまでの動作を説明する。

【００２９】入力音声信号は音声信号入力手段１のA/D
変換器によってデジタル信号へ変換され、次の音声フレ
ーム生成手段２へ入力される。音声フレーム生成手段２
では、図２に示すように入力された音声信号を音声ピッ
チ周期に近い２０ミリ秒毎に分割し、音声フレームを生
成する。

【００３０】次に音声フレーム生成手段２で生成した音
声フレームをフィルターバンク３へ入力する。フィルタ
ーバンク３では、図３に示すような帯域分割フィルター
を複数備えたフィルターバンクを用い入力した音声フレ
ームを複数の周波数帯域へ分割する。

【００３１】フィルターバンク３で帯域分割された音声
信号を入力とする有音声判定対象帯域選択手段４では、
図３に示すように、人の声の再現性を重視し１００Ｈｚ
から２００Ｈｚの周波数を含む周波数帯域幅の音声信号
を選択し、有音声フレーム判定手段５へ入力する。

【００３２】有音声フレーム判定手段５では、図４に示
すように、帯域制限された音声信号のスペクトル振幅レ
ベルとしきい値レベルとの比較を行う。しきい値の設定
は、スペクトル振幅レベルが０に近いレベルに設定す
る。

【００３３】比較を行い、しきい値レベル以上のスペク
トル振幅レベルのサンプルの個数を判定スコアとして算
出する。この判定スコア値の大きさを参照することによ
って無音、有音の状態を見きわめることができる。図４
に示す例では判定スコアは１２になる。

【００３４】以上のようにして有音声フレーム判定手段
５で判定スコアが算出され、一時バッファ手段６に順次
音声フレーム生成手段２からの音声フレーム出力が蓄積
されていく。

【００３５】次に一時バッファ手段６に蓄積した音声フ
レームを、一時バッファ管理手段７によって、ある時間
毎にフレーム数を調整する方法について説明する。

【００３６】一時バッファ管理手段７は、音声フレーム
生成手段２で生成された音声フレーム数を受けて調整の
タイミングを決定する。

【００３７】本実施例１では一時バッファ手段６の容量
である音声フレーム、１０フレーム分の時間毎で調整を
行う場合を例として説明する。

【００３８】図５は１０フレームの音声フレームが一時
バッファ手段６に蓄積されている様子を示している。

【００３９】各音声フレームには、有音声フレーム判定
手段５で算出された判定スコアと、一時バッファ管理手
段７によって管理されている固有のインデックスがあ
り、これらをまとめて一組とし、一時バッファ管理情報
として一時バッファ管理手段７によって管理されてい
る。

【００４０】図５の例では、音声フレームAからJに対
し、各々小文字のaからjがインデックスとして対応して
いる。各音声フレームに対応する判定スコア値は図５に
示すとおりである。

【００４１】一時バッファ管理手段７は、一時バッファ
管理情報内の各音声フレームに対する判定スコア値を参
照し、判定スコア値の大きい順に、図５のように一時バ
ッファ管理情報の並び替えを行う。ただし、判定スコア
値が同値の場合は先に一時バッファ手段６に蓄積された
音声フレームを優先し並び替えを行う。

【００４２】１.２５倍速度の早送り音声再生を達成す
るためには、一時バッファ手段６内の音声フレーム数を
１０フレームから８フレームへ調整しなくてはならな
い。このため、一時バッファ管理情報の並び替えの後、
図５に示すように判定スコア値の大きいものから順に、
８つの音声フレームを選択し、これらを一時バッファ手
段６に残し、残りの２フレームを破棄する。図５の例で
はインデックスがdとgである２つの音声フレームD、Gが
破棄されている。破棄した後に図5に示すように、一時
バッファ手段６に残った音声フレームを次の音声信号出
力手段８へ入力していく。

【００４３】このように調整された一時バッファ手段６
内の音声フレームを、順に音声出力手段８のD/A変換器
へ入力し出力音声信号を得て、これを再生することによ
り１.２５倍速度の早送り音声再生が達成できる。

【００４４】従来例では一時バッファ手段６に蓄積され
た音声フレームの破棄は、音声フレームの内容に関係な
く、蓄積順の古い、つまり時間的に新しい音声フレーム
から順に破棄していた。このため破棄した音声フレーム
に重要なキーワードが存在した場合、内容理解が困難な
早送り音声再生になっていた。

【００４５】本発明では、一時バッファ手段６に蓄積さ
れた音声フレームの判定スコア値の最も小さい、つまり
無音の音声フレームにより近いものから順に音声フレー
ムを破棄するため、従来例と比べると重要なキーワード
を含む音声フレームの破棄が少なくなる。このため内容
理解しやすい早送り音声再生が可能となる。

【００４６】尚、本実施例１では有音声判定対象帯域手
段４において、１００Ｈｚから２００Ｈｚの帯域を含む
音声信号の選択を行ったが、着目する音声信号に応じて
複数の帯域分割音声信号の選択を行い、前記有音声フレ
ーム判定手段５により判定スコア値を算出することによ
って、同様な早送り音声再生が可能である。

【００４７】また本実施例１では音声フレームの長さを
２０ミリ秒にしたが、既知な技術であるケプストラム法
などを用いて、音声ピッチの周期を計算し、この長さで
音声フレームを生成することでも同様な早送り音声再生
が可能である。

【００４８】また本実施例１では１.２５倍速度の早送
り音声再生について説明したが、一時バッファ管理手段
７での音声フレームの調整の周期、破棄する音声フレー
ムの数を調整することで、同様に任意の速度の早送り音
声再生が可能である。

【００４９】また本実施例１では有音声フレーム判定手
段での判定スコアー値の算出を、しきい値以上のスペク
トル振幅を持つサンプルの個数としたが、逆にしきい値
以下のものの個数を判定スコアとしても同様な早送り音
声再生が可能である。

【００５０】(実施例２)本発明の実施例２を図６、図
７、図８、図９、図１０を用いて説明する。

【００５１】図６において図１と同様の機能を有するも
のは同一の番号を付けて説明を省略する。

【００５２】図６における９は、有音声フレーム判定手
段５によって算出された判定スコア値を参照し、音声フ
レーム生成手段２からの音声フレームデータの選択を行
い、無音の音声フレームの場合は破棄を行い、有音の音
声フレームの場合は一時バッファ手段６へ音声フレーム
を選択する有音声フレーム選択手段である。

【００５３】図６における１０は、有音声フレーム判定
手段５からの判定スコア値、有音声フレーム選択手段９
で破棄した音声フレーム数、一時バッファ手段６から蓄
積した音声フレーム数を受け、一時バッファ手段に蓄積
された音声フレームデータを音声フレーム単位で管理す
る一時バッファ管理手段である。

【００５４】実施例１では、音声フレームの破棄を実施
例１で説明した一時バッファ管理手段のみによって行っ
ていた。本実施例２では、有音声フレーム選択手段９で
無音と判定される音声フレームをあらかじめ破棄してお
き、さらに図６の一時バッファ管理手段１０によって一
時バッファ手段６中の音声フレーム数を調整することで
早送り音声再生を達成する。実施例１と同様に１.２５
倍速度の早送り音声再生を例にとって説明を行う。

【００５５】音声信号入力手段１へ入力音声信号を入力
し、有音声フレーム判定手段５によって判定スコア値を
算出するまでは、前記の実施例１で説明したものと同様
であるので説明を省略する。

【００５６】有音声フレーム選択手段９は、有音声フレ
ーム判定手段５によって算出された判定スコア値を参照
し、図７に示すよな音声フレームの選択を行う。判定ス
コア値が正値の場合、つまり有音の音声フレームとして
判定できる場合は、音声フレームを次の一時バッファ手
段６へ入力し、判定スコア値が０の場合、つまり無音の
音声フレームとして判定できる場合は破棄を行う。この
ようにして音声フレームの選択を行う。

【００５７】また、破棄した音声フレーム数を一時バッ
ファ管理手段１０へ入力する。このようにして、選択さ
れた音声フレームは一時バッファ手段６へ時系列に蓄積
されていく。

【００５８】次に一時バッファ管理手段１０による一時
バッファ６中の音声フレームの調整方法について図８、
図９、図１０を用いて説明する。

【００５９】調整は、あらかじめ設定した音声フレーム
数が、一時バッファ手段６に蓄積された時点で始まる。

【００６０】ここでは例として、音声フレームが２０フ
レーム蓄積された時点で調整を行う場合をとりあげる。
尚、調整開始時に一時バッファ手段６の音声フレーム
数、２０フレームに対して、有音声フレーム選択手段９
による破棄した音声フレーム数が５フレームであれば、
４対１の割合となり時間軸方向に８／１０の圧縮がで
き、この２０フレームを次の音声信号出力手段に入力し
再生すれば1.２５倍速度の早送り音声再生が達成され
る。つまり、一時バッファ手段に残す音声フレーム数
と、最終的に破棄される音声フレーム数の比を４対１に
調整すれば、1.２５倍速度の早送り音声再生が達成され
ることになる。

【００６１】一時バッファ手段６に音声フレームが２０
フレーム蓄積されるまでに、有音声フレーム選択手段に
よって破棄された音声フレームの数は、音声フレームの
内容によって一定ではない。調整時での一時バッファ手
段中の音声フレーム数と、有音声フレーム選択手段によ
って破棄された音声フレーム数の状態は、図８、図９に
示す２通りが考えられる。

【００６２】図８は、一時バッファ手段に２０フレーム
の音声フレームが蓄積されており、有音声フレーム選択
手段によって７フレームの音声フレームが無音の音声フ
レームとして破棄された場合を示している。

【００６３】図９は、同様に一時バッファ手段に２０フ
レームの音声フレームが蓄積されており、声フレーム選
択手段によって３フレームの音声フレームが無音の音声
フレームとして破棄された場合を示している。

【００６４】図８、図９の最小無音声フレーム数とは、
一時バッファ手段中の２０フレームに対する４分の１の
値である定数値の５フレームを示している。

【００６５】まず図８に示す場合の一時バッファ管理手
段による調整の流れを図１０を用いて説明する。

【００６６】図１０は一時バッファ管理手段による調整
の流れを示したもので、２０フレーム分の音声フレーム
が一時バッファ手段に蓄積された時点で調整が開始され
る。図８に示す場合ではステップ２０１、ステップ２０
２、ステップ２０３、ステップ２０４が実行される。

【００６７】まずステップ２０１では、前回の調整時に
ステップ２０４でセットした無音声フレーム数の余りを
現在の無音声フレーム数へ加算する。

【００６８】ここで無音声フレーム数の余りとは、図８
の場合であれば、最小無音声フレーム数を超えた分の音
声フレーム数を示しており、図８に示している現在の無
音声フレーム数７フレームは、前回の無音声フレーム数
の余りを含めたフレーム数である。また図８では次回に
加算される無音声フレーム数の余りは２フレームとな
る。尚、無音声フレーム数の初期値は０フレームであ
る。

【００６９】ステップ２０１によって、前回の無音声フ
レーム数の余りを含めた無音声フレーム数を決定し、次
のステップ２０２では無音声フレーム数と、最小無音声
フレーム数との比較を行う。図８の場合は、比較は真値
となり、次のステップ２０３へ進む。

【００７０】ステップ２０３では、一時バッファ手段に
蓄積された２０フレームの音声フレーム全てを音声信号
出力手段へ入力する。一時バッファ手段中の音声フレー
ムの破棄は一切行わない。

【００７１】次のステップ２０４では、次回の調整時の
ステップ２０１で加算する無音声フレーム数の余りを算
出する。図８においては２フレームとなる。

【００７２】図８に示すように、有音声フレーム選択手
段によって破棄された音声フレーム数が最小無音声フレ
ーム数以上の場合は、最小無音声フレーム５フレームに
対し、一時バッファ手段中の２０フレームの音声をその
まま音声信号出力手段へ入力し再生することで１.２５
倍速度の早送り音声再生が達成される。この場合の音声
は、判定スコア値が０の音声フレームだけの廃棄を行っ
た１.25倍速度音声となる。

【００７３】次に図９の有音声フレーム選択手段によっ
て破棄された音声フレーム数が最小無音声フレーム数よ
り少ない場合を説明する。尚、ステップ２０１、ステッ
プ２０２までは同様であるため説明を省略し、ステップ
２０５からの流れを説明する。

【００７４】図９は最小無音声フレーム数が、無音声フ
レーム数より多い場合でり、無音声フレーム数は３フレ
ームとなっている。このまま一時バッファ手段の２０フ
レームの音声フレームを音声信号出力手段へ入力して
も、現在の無音声フレーム数３フレームに対し２０フレ
ームの音声フレームの再生となるため、１.２５倍速度
に満たない早送り音声再生となる。このため、ステップ
２０５では最小無音フレーム数に満たない数の音声フレ
ームを新たに処理し、有音声フレーム選択手段によっ
て、破棄または一時バッファ手段へ音声フレームを蓄積
する。図９の場合は、２フレーム中、１フレームが破棄
され無音声フレーム数が３から４になり、１フレームが
一時バッファ手段へ蓄積され２１フレームの音声フレー
ムが一時バッファ手段に蓄積された場合を示している。

【００７５】ステップ２０５で新規に音声フレームを処
理した後に、ステップ２０６では新たに一時バッファ手
段に蓄積された音声フレーム数分を、一時バッファ手段
に蓄積された音声フレームから破棄する。図９の場合
は、新たに蓄積した音声フレーム数は１フレームである
ので、１フレーム分の音声フレームを破棄する。そして
この破棄の方法は前期実施例１で図５を用いて説明した
方法を用い、判定スコア値をもとに１フレーム分を破棄
する。

【００７６】ステップ２０６で音声フレームの破棄を行
った後は２０フレームの音声フレームが一時バッファ手
段に残されることになり、この２０フレームの音声フレ
ームを音声信号出力手段へ入力する。

【００７７】最後にステップ２０７で次回に加算する無
音声フレームの余りを０にセットする。

【００７８】図９の場合、有音声フレーム選択手段にて
破棄される音声フレームが少ない場合、実施例１で図５
を用いて説明した判定スコア値をもとにした音声フレー
ムの破棄を行い、図８の場合と同様に、結果的に破棄し
た総音声フレーム数５フレームに対し、２０フレームの
音声フレームを音声信号出力手段へ入力し再生すること
で、１.２５倍速度の早送り音声再生が達成できる。

【００７９】前記の実施例１の例では、判定スコア値を
もとに、あらかじめ決められた数の音声フレームの破棄
を行い可変速度音声再生を達成していた。これは単純に
時間的に新しい音声フレームを破棄する従来の方法より
も、音声フレームの内容、つまり判定スコア値をもとに
破棄する音声フレームを決定する点で従来の例と比較す
るとキーワードの欠落の少ない早送り音声再生が達成で
きる。

【００８０】尚、本実施例２では１.２５倍速度の早送
り音声再生について説明したが、実施例１と同様に一時
バッファ管理手段７での調整する音声フレーム数を変え
ることで任意の速度の早送り音声再生が可能である。

【００８１】また、図１０で、ステップ２０３とステッ
プ２０４を入れ替えてもどうような早送り音声再生が達
成でき、またステップ２０７とステップ２０８を入れ替
えてもどうような早送り音声再生が達成できる。

【００８２】

【発明の効果】以上説明したように、柔軟な音声フレー
ムの破棄を行う一時バッファ管理手段を備えることによ
って、重要なキーワードを含んだ音声信号の欠落を極力
抑え、聞き取りやすい早送り音声再生を達成できる。

【図面の簡単な説明】

【図１】実施例１における音声処理装置の構成を示すブ
ロック図

【図２】図１における音声フレームの生成過程の示す模
式図

【図３】図１におけるフィルターバンク３、有音声対象
帯域選択手段４での動作を示す模式図

【図４】図１における判定スコア値の説明図

【図５】図１における一時バッファ管理手段７での音声
フレーム数の調整を示す模式図

【図６】実施例２における音声処理装置のブロック図

【図７】図６における有音声フレーム選択手段９での音
声フレームの選択を示す模式図

【図８】図６における一時バッファ管理手段１０での音
声フレーム数の調整を示す模式図

【図９】図６における一時バッファ管理手段１０での音
声フレーム数の調整を示す模式図

【図１０】図６における一時バッファ管理手段１０での
音声フレーム数の調整を示すフローチャート

【図１１】従来例を示すブロック図

【符号の説明】

１音声信号入力手段２音声フレーム生成手段３フィルターバンク４有音声判定対象帯域選択手段５有音声フレーム選択手段６一時バッファ手段７一時バッファ管理手段８音声信号出力手段

───────────────────────────────────────────────────── フロントページの続き (72)発明者石津厚大阪府門真市大字門真1006番地松下電器産業株式会社内

Claims

【特許請求の範囲】

【請求項１】音声信号を入力とする音声信号入力手段
と、前記音声信号入力手段からの音声信号を分割する音
声フレーム生成手段と、前記音声フレーム生成手段によ
って分割した音声信号を任意の周波数帯域幅に分割する
フィルターバンクと、前記フィルターバンクによって周
波数帯域分割した音声信号から、任意の周波数帯域を含
む音声信号を選択する有音声判定対象帯域選択手段と、
前記有音声判定対象帯域選択手段によって選択した周波
数帯域制限の音声信号に対し、有音であるか無音である
かの判定を行なう有音声フレーム判定手段と、前記音声
フレーム生成手段からの音声信号を一時蓄積する一時バ
ッファ手段と、前記一時バッファ手段に蓄積された音声
信号を、前記有音声フレーム判定手段での判定結果と前
記一時バッファ手段に蓄積された分割音声信号の数をも
とに、分割音声信号単位に管理する一時バッファ管理手
段と、前記一時バッファ手段からの音声信号を出力する
音声信号出力手段を備えたことを特徴とした音声信号処
理装置。
【請求項２】前記有音声フレーム判定手段での判定結果
から、前記音声フレーム生成手段からの有音声信号を選
択する有音声フレーム選択手段と、前記一時バッファ管
理手段の代わりに、前記一時バッファ手段に蓄積された
分割音声信号を、前記一時バッファ手段に蓄積された分
割音声信号の数をもとに、分割音声信号単位に管理する
一時バッファ管理手段を備えたことを特徴とした請求項
記載１記載の音声信号処理装置。