JPH04361299A

JPH04361299A - 音声認識装置

Info

Publication number: JPH04361299A
Application number: JP3137445A
Authority: JP
Inventors: Kazuma Kaneko; 和磨金子; Mitsuo Shitaya; 光生下谷; Yoshiharu Morihiro; 義晴森廣
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1991-06-10
Filing date: 1991-06-10
Publication date: 1992-12-14

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、音声認識装置に関し
、特に入力された音声信号を増幅する増幅手段の増幅率
の設定方法に関するものである。

【０００２】

【従来の技術】図４は例えば特開昭５８−１２５０９９
号公報に示された従来の音声認識装置を示すブロック図
である。図４において、１は入力音声を音声信号に変換
するマイクロホン、２は前記音声信号を増幅する増幅手
段、３は後述のフィルタ回路４とマルチプレクサ５を備
え増幅手段２の出力信号から入力音声の特徴を抽出する
特徴抽出手段、４は増幅手段２の出力側に接続された複
数のＢＰＦ（バンド・パス・フィルタ）から成るフィル
タ回路、５はフィルタ回路４の出力を順次時分割的にサ
ンプリングするマルチプレクサである。

【０００３】６は特徴抽出手段３のアナログ出力信号を
デジタル信号に変換するＡ／Ｄ変換器、７はプロセッサ
、クロック発生器、メモリ、入出力インタ−フェ−ス等
から成るマイクロコンピュータ、８は操作ガイダンス情
報を表示する表示器、９は音による操作ガイダンス情報
を出力する音響装置である。マイクロコンピュータ７は
、増幅手段２の増幅率を変換設定するように接続され、
Ａ／Ｄ変換器６、表示器８や音響装置９にも接続されて
いる。

【０００４】図５は従来の音声認識装置の音声登録時の
動作を示す動作フロー図である。図６は従来の音声認識
装置の音声認識時の動作を示す動作フロー図である。

【０００５】次に音声登録時の動作について図５の動作
フロー図を用いて説明する。従来の音声認識装置では、
音声登録を実行する前にキーワードを入力し、このキー
ワード入力で増幅手段２の増幅率を設定し、その後、音
声を登録する。

【０００６】マイクロコンピュータ７は、先ず、キーワ
ードの音声入力を表示器８又は音響装置９により要求す
ると共に音声が入力されるまで待機する（Ｓ３０）。前
記音声がマイクロホン１に入力されると、マイクロホン
１は入力音声を音声信号に変換し、増幅手段２はマイク
ロホン１の出力である音声信号を増幅する。この後にそ
の増幅した音声信号を特徴抽出手段３に出力すると、フ
ィルタ回路４は前記音声信号を複数のＢＰＦにより周波
数分析し、マルチプレクサ５はフィルタ回路４の出力を
順次時分割的にサンプリングし、Ａ／Ｄ変換器６はマル
チプレクサ５の出力をデジタル信号に変換し、マイクロ
コンピュータ７はＡ／Ｄ変換器６の出力であるデジタル
信号から入力パターンを作成する（Ｓ３１）。

【０００７】次に、マイクロコンピュータ７は入力パタ
ーンから増幅手段２の出力音声信号レベルを検出し、そ
の出力音声信号レベルが所定レベルになるように増幅手
段２の増幅率を計算する（Ｓ３２）。増幅率の計算法と
して、増幅手段２の出力音声信号レベルの音声区間内に
おける最大値が所定レベルになるようにする方法と、増
幅手段２の出力音声信号レベルの音声区間内における平
均値が所定レベルになるようにする方法がある。そして
、マイクロコンピュータ７は増幅手段２に対してその増
幅率に応じた制御信号を発生する（Ｓ３３）。

【０００８】その後、マイクロコンピュータ７は登録音
声の入力を表示器８または音響装置９により要求し、音
声が入力されると、入力パターンを作成するとともに、
入力パターンを標準パターンとして登録し、所定の数の
標準パターンを登録すると登録を終了する（Ｓ３４）。

【０００９】次に音声認識時の動作について図６の動作
フロー図を用いて説明する。従来の音声認識装置では、
音声登録と同様に音声認識を実行する前にキーワードを
入力し、キーワード入力で増幅手段２の増幅率を設定し
、その後、音声を認識する。

【００１０】マイクロコンピュータ７は、先ず、１回目
のキーワードの音声入力を表示器８又は音響装置９によ
り要求すると共に音声が入力されるまで待機する（Ｓ４
０）。前記音声がマイクロホン１に入力されると、マイ
クロホン１は入力音声を音声信号に変換し、増幅手段２
はマイクロホン１の出力である音声信号を増幅する。こ
の後、増幅した音声信号を特徴抽出手段３に出力すると
、フィルタ回路４は前記音声信号を複数のＢＰＦにより
周波数分析し、マルチプレクサ５はフィルタ回路４の出
力を順次時分割的にサンプリングし、Ａ／Ｄ変換器６は
マルチプレクサ５の出力をデジタル信号に変換し、マイ
クロコンピュータ７はＡ／Ｄ変換器６の出力であるデジ
タル信号から入力パターンを作成する（Ｓ４１）。

【００１１】次に、マイクロコンピュータ７は入力パタ
ーンから増幅手段２の出力音声信号レベルを検出し、そ
の出力音声信号レベルが所定レベルになるように増幅手
段２の増幅率を計算する（Ｓ４２）。そして、マイクロ
コンピュータ７は増幅手段２に対してその増幅率に応じ
た制御信号を発生する（Ｓ４３）。

【００１２】その後、マイクロコンピュータ７は認識す
べき音声の入力を表示器８または音響装置９により要求
し、音声が入力されると、入力パターンを作成し、この
入力パターンと登録された複数の標準パターンとのマッ
チングを行い、類似度を計算する。この類似度がしきい
値以上の標準パターンが存在すれば入力音声がその標準
パターンとして登録された単語音声と同一だと判断して
所定の出力ポートから認識結果に対応した識別信号を出
力する（Ｓ４４）。

【００１３】

【発明が解決しようとする課題】従来の音声認識装置は
以上のように構成されているので、音声を認識する前に
キーワードを入力することにより増幅手段２の増幅率を
話者毎に最適に設定する必要があった。

【００１４】この発明は上記のような問題点を解決する
ためになされたもので、増幅手段の増幅率を最適に設定
することを容易に行える音声認識装置を得ることを目的
とする。

【００１５】

【課題を解決するための手段】この発明における音声認
識装置は、音声登録時に話者指定手段により話者を指定
し、キーワードの発声により前記話者毎の最適な増幅率
を計算し、かつ前記増幅率を増幅率記憶手段に記憶し、
音声認識時に前記話者指定手段により話者を指定すると
前記増幅率記憶手段から話者毎の増幅率を読みだし増幅
手段の増幅率を設定するように構成したものである。

【００１６】

【作用】この発明における音声認識装置は、音声認識時
に話者指定手段により話者を指定するだけで話者毎に最
適な増幅率を自動的に設定する。

【００１７】

【実施例】以下、この発明の一実施例を図について説明
する。図１はこの発明の一実施例を示す音声認識装置の
ブロック図である。図１において、１〜９は従来例と同
一であるのでその説明を省略する。１０は登録時の増幅
手段の増幅率を記憶する増幅率記憶手段、１１は発声す
る話者を指定する話者指定手段であり、これらはマイク
ロコンピュータ７に接続されている。図２は図１の実施
例の音声登録時の動作を示す動作フロー図である。図３
は図１の実施例の音声認識時の動作を示す動作フロー図
である。

【００１８】以下、動作について説明する。まず、音声
登録時の動作について図２の動作フロー図を用いて説明
する。マイクロコンピュータ７は、まず、話者の指定を
表示器８または音響装置９により要求すると共に話者が
指定されるまで待機する（Ｓ１）。話者の指定は話者指
定手段１１により行われ、端子１１ａを端子１１ｂ側に
接続すると話者■が指定され、端子１１ａを端子１１ｃ
側に接続すると話者■が指定される。そして、話者指定
手段１１により話者が指定されると、マイクロコンピュ
ータ７は話者指定手段１１の出力から話者■が指定され
たかまたは話者■が指定されたかを判断する（Ｓ２）。

【００１９】話者■が選択された場合、マイクロコンピ
ュータ７は標準パターンと増幅率の書き込み先アドレス
を話者■用に設定する（Ｓ３）。話者■が選択された場
合、マイクロコンピュータ７は標準パターンと増幅率の
書き込み先アドレスを話者■用に設定する（Ｓ４）。

【００２０】次に、マイクロコンピュータ７が、キーワ
ードの音声入力を要求し（Ｓ５）、入力パターンを作成
し（Ｓ６）、入力パターンから増幅手段２の増幅率を計
算する（Ｓ７）までの動作は従来例と同一である。そし
て、マイクロコンピュータ７は話者指定結果に従って前
記増幅率を増幅率記憶手段１０の話者■用または話者■
用のアドレスに記憶する（Ｓ８）。

【００２１】次に、マイクロコンピュータ７は増幅手段
２に対して話者指定手段１１により指定された当該話者
用のその増幅率に応じた制御信号を発生する（Ｓ９）。その後、マイクロコンピュータ７は登録音声の入力を表
示器８または音響装置９により要求し、音声が入力され
ると、入力パターンを作成するとともに、入力パターン
を話者指定結果に従って話者■用または話者■用の標準
パターンとして登録し、所定の数の標準パターンを登録
すると登録を終了する（Ｓ１０）。

【００２２】次に、音声認識時の動作について図３の動
作フロー図を用いて説明する。マイクロコンピュータ７
は、まず、音声登録時と同一の動作により話者指定要求
を行い（Ｓ２０）、話者判断を行う（Ｓ２１）。話者■
が指定された場合、マイクロコンピュータ７は増幅率記
憶手段１０から話者■用の増幅率を読み出す（Ｓ２２）
。話者■が指定された場合、マイクロコンピュータ７は
増幅率記憶手段１０から話者■用の増幅率を読み出す（
Ｓ２３）。そして、マイクロコンピュータ７は増幅手段
２に対して話者指定手段１１により指定された当該話者
用の増幅率に応じた制御信号を発生する（Ｓ２４）。

【００２３】その後、マイクロコンピュータ７は認識す
べき音声の入力を表示器８または音響装置９により要求
し、音声が入力されると、入力パターンを作成し、この
入力パターンと話者指定結果に従って話者■用または話
者■用の登録された複数の標準パターンとのマッチング
を行い、類似度を計算する。この類似度がしきい値以上
の標準パターンが存在すれば入力音声がその標準パター
ンとして登録された単語音声と同一だと判断して所定の
出力ポートから認識結果に対応した識別信号を出力する
（Ｓ２５）。

【００２４】なお、前記実施例では、切り換えられる話
者の数が２名であるものを示したが、話者の数は３名以
上であってもよい。

【００２５】また、前記実施例では、複数の話者につい
て切り換えられるものを示したが、話者を１名に限定し
、音声登録時に記憶した増幅率を音声認識時に自動的に
読み出して増幅手段の増幅率を設定するようにしてもよ
い。

【００２６】

【発明の効果】以上のように、この発明によれば増幅率
記憶手段と共に話者指定手段を備え、音声登録時に話者
指定手段により話者を指定し、話者毎に増幅手段の増幅
率を最適に設定すると共に話者毎の前記増幅率を記憶し
ておき、音声認識時に話者指定手段により話者を指定す
ると、前記増幅率記憶手段に記憶しておいた話者毎の増
幅率を読み出し増幅手段を自動的に最適な状態に設定す
るように構成したので、操作が容易になる効果がある。

【図面の簡単な説明】

【図１】この発明の一実施例に係る音声認識装置の構成
を示すブロック図である。

【図２】この発明の上記一実施例の音声登録時の動作を
示す動作フロー図である。

【図３】この発明の上記一実施例の音声認識時の動作を
示す動作フロー図である。

【図４】従来の音声認識装置の構成を示すブロック図で
ある。

【図５】従来の音声認識装置の音声登録時の動作を示す
動作フロー図である。

【図６】従来の音声認識装置の音声認識時の動作を示す
動作フロー図である。

【符号の説明】

１　　マイクロホン２　　増幅手段３　　特徴抽出手段４　　フィルタ回路５　　マルチプレクサ６　　Ａ／Ｄ変換器７　　マイクロコンピュータ８　　表示器９　　音響装置１０　　増幅率記憶手段１１　　話者指定手段

Claims

【特許請求の範囲】

【請求項１】　　入力音声を音声信号に変換する音声入
力手段と、前記音声信号を増幅する増幅手段と、音声を
発声する話者を指定する話者指定手段と、前記話者指定
手段により指定された話者毎に最適な増幅率を計算する
増幅率計算手段と、前記増幅率計算手段により計算され
た増幅率を記憶する増幅率記憶手段と、前記増幅手段の
増幅率を設定する増幅率設定手段とを備え、音声登録時
に前記話者指定手段により話者を指定すると、所定単語
音声の入力レベルから前記指定話者毎に最適な増幅率を
計算し、前記増幅手段の増幅率を最適に設定すると共に
、前記増幅率を前記増幅率記憶手段に記憶し、音声認識
時に前記話者指定手段により話者を指定すると、前記増
幅率記憶手段から前記指定話者毎にその増幅率を読み出
して前記増幅手段の増幅率を設定することを特徴とする
音声認識装置。