JPH04361299A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH04361299A
JPH04361299A JP3137445A JP13744591A JPH04361299A JP H04361299 A JPH04361299 A JP H04361299A JP 3137445 A JP3137445 A JP 3137445A JP 13744591 A JP13744591 A JP 13744591A JP H04361299 A JPH04361299 A JP H04361299A
Authority
JP
Japan
Prior art keywords
speaker
amplification factor
voice
amplification
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3137445A
Other languages
English (en)
Inventor
Kazuma Kaneko
和磨 金子
Mitsuo Shitaya
光生 下谷
Yoshiharu Morihiro
義晴 森廣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP3137445A priority Critical patent/JPH04361299A/ja
Publication of JPH04361299A publication Critical patent/JPH04361299A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声認識装置に関し
、特に入力された音声信号を増幅する増幅手段の増幅率
の設定方法に関するものである。
【0002】
【従来の技術】図4は例えば特開昭58−125099
号公報に示された従来の音声認識装置を示すブロック図
である。図4において、1は入力音声を音声信号に変換
するマイクロホン、2は前記音声信号を増幅する増幅手
段、3は後述のフィルタ回路4とマルチプレクサ5を備
え増幅手段2の出力信号から入力音声の特徴を抽出する
特徴抽出手段、4は増幅手段2の出力側に接続された複
数のBPF(バンド・パス・フィルタ)から成るフィル
タ回路、5はフィルタ回路4の出力を順次時分割的にサ
ンプリングするマルチプレクサである。
【0003】6は特徴抽出手段3のアナログ出力信号を
デジタル信号に変換するA/D変換器、7はプロセッサ
、クロック発生器、メモリ、入出力インタ−フェ−ス等
から成るマイクロコンピュータ、8は操作ガイダンス情
報を表示する表示器、9は音による操作ガイダンス情報
を出力する音響装置である。マイクロコンピュータ7は
、増幅手段2の増幅率を変換設定するように接続され、
A/D変換器6、表示器8や音響装置9にも接続されて
いる。
【0004】図5は従来の音声認識装置の音声登録時の
動作を示す動作フロー図である。図6は従来の音声認識
装置の音声認識時の動作を示す動作フロー図である。
【0005】次に音声登録時の動作について図5の動作
フロー図を用いて説明する。従来の音声認識装置では、
音声登録を実行する前にキーワードを入力し、このキー
ワード入力で増幅手段2の増幅率を設定し、その後、音
声を登録する。
【0006】マイクロコンピュータ7は、先ず、キーワ
ードの音声入力を表示器8又は音響装置9により要求す
ると共に音声が入力されるまで待機する(S30)。前
記音声がマイクロホン1に入力されると、マイクロホン
1は入力音声を音声信号に変換し、増幅手段2はマイク
ロホン1の出力である音声信号を増幅する。この後にそ
の増幅した音声信号を特徴抽出手段3に出力すると、フ
ィルタ回路4は前記音声信号を複数のBPFにより周波
数分析し、マルチプレクサ5はフィルタ回路4の出力を
順次時分割的にサンプリングし、A/D変換器6はマル
チプレクサ5の出力をデジタル信号に変換し、マイクロ
コンピュータ7はA/D変換器6の出力であるデジタル
信号から入力パターンを作成する(S31)。
【0007】次に、マイクロコンピュータ7は入力パタ
ーンから増幅手段2の出力音声信号レベルを検出し、そ
の出力音声信号レベルが所定レベルになるように増幅手
段2の増幅率を計算する(S32)。増幅率の計算法と
して、増幅手段2の出力音声信号レベルの音声区間内に
おける最大値が所定レベルになるようにする方法と、増
幅手段2の出力音声信号レベルの音声区間内における平
均値が所定レベルになるようにする方法がある。そして
、マイクロコンピュータ7は増幅手段2に対してその増
幅率に応じた制御信号を発生する(S33)。
【0008】その後、マイクロコンピュータ7は登録音
声の入力を表示器8または音響装置9により要求し、音
声が入力されると、入力パターンを作成するとともに、
入力パターンを標準パターンとして登録し、所定の数の
標準パターンを登録すると登録を終了する(S34)。
【0009】次に音声認識時の動作について図6の動作
フロー図を用いて説明する。従来の音声認識装置では、
音声登録と同様に音声認識を実行する前にキーワードを
入力し、キーワード入力で増幅手段2の増幅率を設定し
、その後、音声を認識する。
【0010】マイクロコンピュータ7は、先ず、1回目
のキーワードの音声入力を表示器8又は音響装置9によ
り要求すると共に音声が入力されるまで待機する(S4
0)。前記音声がマイクロホン1に入力されると、マイ
クロホン1は入力音声を音声信号に変換し、増幅手段2
はマイクロホン1の出力である音声信号を増幅する。こ
の後、増幅した音声信号を特徴抽出手段3に出力すると
、フィルタ回路4は前記音声信号を複数のBPFにより
周波数分析し、マルチプレクサ5はフィルタ回路4の出
力を順次時分割的にサンプリングし、A/D変換器6は
マルチプレクサ5の出力をデジタル信号に変換し、マイ
クロコンピュータ7はA/D変換器6の出力であるデジ
タル信号から入力パターンを作成する(S41)。
【0011】次に、マイクロコンピュータ7は入力パタ
ーンから増幅手段2の出力音声信号レベルを検出し、そ
の出力音声信号レベルが所定レベルになるように増幅手
段2の増幅率を計算する(S42)。そして、マイクロ
コンピュータ7は増幅手段2に対してその増幅率に応じ
た制御信号を発生する(S43)。
【0012】その後、マイクロコンピュータ7は認識す
べき音声の入力を表示器8または音響装置9により要求
し、音声が入力されると、入力パターンを作成し、この
入力パターンと登録された複数の標準パターンとのマッ
チングを行い、類似度を計算する。この類似度がしきい
値以上の標準パターンが存在すれば入力音声がその標準
パターンとして登録された単語音声と同一だと判断して
所定の出力ポートから認識結果に対応した識別信号を出
力する(S44)。
【0013】
【発明が解決しようとする課題】従来の音声認識装置は
以上のように構成されているので、音声を認識する前に
キーワードを入力することにより増幅手段2の増幅率を
話者毎に最適に設定する必要があった。
【0014】この発明は上記のような問題点を解決する
ためになされたもので、増幅手段の増幅率を最適に設定
することを容易に行える音声認識装置を得ることを目的
とする。
【0015】
【課題を解決するための手段】この発明における音声認
識装置は、音声登録時に話者指定手段により話者を指定
し、キーワードの発声により前記話者毎の最適な増幅率
を計算し、かつ前記増幅率を増幅率記憶手段に記憶し、
音声認識時に前記話者指定手段により話者を指定すると
前記増幅率記憶手段から話者毎の増幅率を読みだし増幅
手段の増幅率を設定するように構成したものである。
【0016】
【作用】この発明における音声認識装置は、音声認識時
に話者指定手段により話者を指定するだけで話者毎に最
適な増幅率を自動的に設定する。
【0017】
【実施例】以下、この発明の一実施例を図について説明
する。図1はこの発明の一実施例を示す音声認識装置の
ブロック図である。図1において、1〜9は従来例と同
一であるのでその説明を省略する。10は登録時の増幅
手段の増幅率を記憶する増幅率記憶手段、11は発声す
る話者を指定する話者指定手段であり、これらはマイク
ロコンピュータ7に接続されている。図2は図1の実施
例の音声登録時の動作を示す動作フロー図である。図3
は図1の実施例の音声認識時の動作を示す動作フロー図
である。
【0018】以下、動作について説明する。まず、音声
登録時の動作について図2の動作フロー図を用いて説明
する。マイクロコンピュータ7は、まず、話者の指定を
表示器8または音響装置9により要求すると共に話者が
指定されるまで待機する(S1)。話者の指定は話者指
定手段11により行われ、端子11aを端子11b側に
接続すると話者■が指定され、端子11aを端子11c
側に接続すると話者■が指定される。そして、話者指定
手段11により話者が指定されると、マイクロコンピュ
ータ7は話者指定手段11の出力から話者■が指定され
たかまたは話者■が指定されたかを判断する(S2)。
【0019】話者■が選択された場合、マイクロコンピ
ュータ7は標準パターンと増幅率の書き込み先アドレス
を話者■用に設定する(S3)。話者■が選択された場
合、マイクロコンピュータ7は標準パターンと増幅率の
書き込み先アドレスを話者■用に設定する(S4)。
【0020】次に、マイクロコンピュータ7が、キーワ
ードの音声入力を要求し(S5)、入力パターンを作成
し(S6)、入力パターンから増幅手段2の増幅率を計
算する(S7)までの動作は従来例と同一である。そし
て、マイクロコンピュータ7は話者指定結果に従って前
記増幅率を増幅率記憶手段10の話者■用または話者■
用のアドレスに記憶する(S8)。
【0021】次に、マイクロコンピュータ7は増幅手段
2に対して話者指定手段11により指定された当該話者
用のその増幅率に応じた制御信号を発生する(S9)。 その後、マイクロコンピュータ7は登録音声の入力を表
示器8または音響装置9により要求し、音声が入力され
ると、入力パターンを作成するとともに、入力パターン
を話者指定結果に従って話者■用または話者■用の標準
パターンとして登録し、所定の数の標準パターンを登録
すると登録を終了する(S10)。
【0022】次に、音声認識時の動作について図3の動
作フロー図を用いて説明する。マイクロコンピュータ7
は、まず、音声登録時と同一の動作により話者指定要求
を行い(S20)、話者判断を行う(S21)。話者■
が指定された場合、マイクロコンピュータ7は増幅率記
憶手段10から話者■用の増幅率を読み出す(S22)
。話者■が指定された場合、マイクロコンピュータ7は
増幅率記憶手段10から話者■用の増幅率を読み出す(
S23)。そして、マイクロコンピュータ7は増幅手段
2に対して話者指定手段11により指定された当該話者
用の増幅率に応じた制御信号を発生する(S24)。
【0023】その後、マイクロコンピュータ7は認識す
べき音声の入力を表示器8または音響装置9により要求
し、音声が入力されると、入力パターンを作成し、この
入力パターンと話者指定結果に従って話者■用または話
者■用の登録された複数の標準パターンとのマッチング
を行い、類似度を計算する。この類似度がしきい値以上
の標準パターンが存在すれば入力音声がその標準パター
ンとして登録された単語音声と同一だと判断して所定の
出力ポートから認識結果に対応した識別信号を出力する
(S25)。
【0024】なお、前記実施例では、切り換えられる話
者の数が2名であるものを示したが、話者の数は3名以
上であってもよい。
【0025】また、前記実施例では、複数の話者につい
て切り換えられるものを示したが、話者を1名に限定し
、音声登録時に記憶した増幅率を音声認識時に自動的に
読み出して増幅手段の増幅率を設定するようにしてもよ
い。
【0026】
【発明の効果】以上のように、この発明によれば増幅率
記憶手段と共に話者指定手段を備え、音声登録時に話者
指定手段により話者を指定し、話者毎に増幅手段の増幅
率を最適に設定すると共に話者毎の前記増幅率を記憶し
ておき、音声認識時に話者指定手段により話者を指定す
ると、前記増幅率記憶手段に記憶しておいた話者毎の増
幅率を読み出し増幅手段を自動的に最適な状態に設定す
るように構成したので、操作が容易になる効果がある。
【図面の簡単な説明】
【図1】この発明の一実施例に係る音声認識装置の構成
を示すブロック図である。
【図2】この発明の上記一実施例の音声登録時の動作を
示す動作フロー図である。
【図3】この発明の上記一実施例の音声認識時の動作を
示す動作フロー図である。
【図4】従来の音声認識装置の構成を示すブロック図で
ある。
【図5】従来の音声認識装置の音声登録時の動作を示す
動作フロー図である。
【図6】従来の音声認識装置の音声認識時の動作を示す
動作フロー図である。
【符号の説明】
1  マイクロホン 2  増幅手段 3  特徴抽出手段 4  フィルタ回路 5  マルチプレクサ 6  A/D変換器 7  マイクロコンピュータ 8  表示器 9  音響装置 10  増幅率記憶手段 11  話者指定手段

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  入力音声を音声信号に変換する音声入
    力手段と、前記音声信号を増幅する増幅手段と、音声を
    発声する話者を指定する話者指定手段と、前記話者指定
    手段により指定された話者毎に最適な増幅率を計算する
    増幅率計算手段と、前記増幅率計算手段により計算され
    た増幅率を記憶する増幅率記憶手段と、前記増幅手段の
    増幅率を設定する増幅率設定手段とを備え、音声登録時
    に前記話者指定手段により話者を指定すると、所定単語
    音声の入力レベルから前記指定話者毎に最適な増幅率を
    計算し、前記増幅手段の増幅率を最適に設定すると共に
    、前記増幅率を前記増幅率記憶手段に記憶し、音声認識
    時に前記話者指定手段により話者を指定すると、前記増
    幅率記憶手段から前記指定話者毎にその増幅率を読み出
    して前記増幅手段の増幅率を設定することを特徴とする
    音声認識装置。
JP3137445A 1991-06-10 1991-06-10 音声認識装置 Pending JPH04361299A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3137445A JPH04361299A (ja) 1991-06-10 1991-06-10 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3137445A JPH04361299A (ja) 1991-06-10 1991-06-10 音声認識装置

Publications (1)

Publication Number Publication Date
JPH04361299A true JPH04361299A (ja) 1992-12-14

Family

ID=15198787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3137445A Pending JPH04361299A (ja) 1991-06-10 1991-06-10 音声認識装置

Country Status (1)

Country Link
JP (1) JPH04361299A (ja)

Similar Documents

Publication Publication Date Title
CA2019319C (en) Voice recognition dialing unit
KR20080107376A (ko) 화자 독립 음성 인식을 구비한 통신 장치
JP2009178783A (ja) コミュニケーションロボット及びその制御方法
JP2006058390A (ja) 音声認識装置
JPH04361299A (ja) 音声認識装置
JPH04295894A (ja) 神経回路網モデルによる音声認識方法
JPS5914769B2 (ja) 音声機器
JPH0730629A (ja) 音声ダイヤリング装置
JP2005326576A (ja) 音声処理装置
JPS63305396A (ja) 音声認識装置
JP2975808B2 (ja) 音声認識装置
JPH05224694A (ja) 音声認識装置
JPS63292196A (ja) 特定話者用音声認識装置
JPS6367400B2 (ja)
JPH01293397A (ja) 音声応答方式
JPS6038745B2 (ja) 音声情報入力装置
JPS59201141A (ja) 音声情報入力装置
JPS60241096A (ja) 音声情報入出力装置
JPS61105597A (ja) 連続音声認識装置
JPH07210186A (ja) 音声登録装置
JP2000010594A (ja) 音声認識装置
JPS60166997A (ja) 単語音声認識装置
JPH01260491A (ja) 音声認識装置における音声パターンメモリ方式
JPH01197795A (ja) 音声認識装置
JPH04951A (ja) 音声ダイヤル装置