JPH11242497A

JPH11242497A - 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体

Info

Publication number: JPH11242497A
Application number: JP10043897A
Authority: JP
Inventors: Makoto Kisanuki; 誠木佐貫; Mitsuaki Shibazaki; 光陽柴崎; Koichiro Fukunaga; 功一郎福永; Masami Maesaka; 正巳前坂
Original assignee: Clarion Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 1998-02-25
Filing date: 1998-02-25
Publication date: 1999-09-07

Abstract

(57)【要約】【課題】音声認識による量的制御において、表現内容
の違いによって操作量を変化させることにより、操作性
を改善する。【解決手段】認識対象語彙データベース１に、異なっ
た操作量ごとにそれぞれ対応する違った表現の語句を登
録しておく。パターンマッチング部３が、マイクから入
力された音声から、認識対象語彙データベース１とパタ
ーンマッチングによって語句を認識する。コマンド入出
力部４が、どの表現の語句が認識されたかに応じて異な
った操作量で制御を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声認識によって
各種制御対象の制御を行う技術の改良に関するもので、
より具体的には、量的制御を同じ対象に行う場合でも、
発話された語句の表現内容の違いによって操作量を変化
させることにより、操作性を改善したものである。

【０００２】

【従来の技術】音声認識は、認識しようとする語句ごと
に、語句の波形や特徴を表すパラメータなどの認識用デ
ータを予めデータベースに記録しておき、発話された言
葉をこれら認識用データとパターンマッチングすること
によって、発話された語句を推定する技術である。

【０００３】このような音声認識をオーディオシステム
など各種制御対象の制御に用いる場合、語句ごとに予め
意味を決めておく。そして、認識結果は、認識用データ
に対応した語句ＩＤなどで得られ、制御用のアプリケー
ションプログラムがこの認識結果を受け取り、どの語句
が認識されたか、すなわちユーザの発話語句に応じて予
め決められている制御を制御対象に対して行う。

【０００４】このような音声認識による制御では、１つ
の語句に対して１通りの制御内容を対応させる。このた
め、従来では、音量や温度などを量的に変化させる量的
制御を行う場合は、語句を１回発話するごとに、音量な
ら１ステップ、温度なら１度など、変化の最小単位を対
応させて制御を行うか、又は、この種の量的な制御対象
は音声認識による制御の対象から除外していた。なお、
量的制御における変化の最小単位を以下「ステップ」又
は「段階」と呼ぶ。

【０００５】

【発明が解決しようとする課題】ところで、上記のよう
に１回の発話で最小単位を変化させる従来技術では、１
ステップよりも大きな幅で量的制御を行うためには、制
御のために定められている語句を、変化させたいステッ
プ数と同じ回数だけ繰り返して何度も発話する必要があ
った。例えば、オーディオの音量を変化させる場合、
「ぼりゅーむあっぷ」といった語句を１回発話する度に
１段階ずつ音が大きくなる。このため、音量を現在より
５段階ボリュームアップさせるためには「ぼりゅーむあ
っぷ」という語句を５回繰り返して発話しなければなら
なかった。

【０００６】しかし、このように語句を繰り返して発話
する従来技術では、操作量が大きくなるほど繰り返して
発話しなければならない回数が増大し、操作性の向上と
いう音声認識の利点が著しく損なわれることになる。

【０００７】本発明は、上記のような従来技術の問題点
を解決するために提案されたものであり、その目的は、
量的制御を同じ対象に行う場合でも、表現内容の違いに
よって操作量を変化させることにより、操作性を改善す
ることである。

【０００８】

【課題を解決するための手段】上記の目的を達成するた
め、請求項１の発明は、認識しようとする語句ごとにそ
れぞれ特徴を表す認識用データを格納する手段と、入力
される音声から前記認識用データを用いて語句を認識す
る手段と、認識された語句に応じて制御対象を制御する
手段と、を有する音声認識による制御装置において、前
記格納する手段は、量的制御に関して表現の異なる複数
の語句についてそれぞれ認識用データを格納し、前記制
御する手段は、前記複数の語句のうちどれが認識された
かに応じて、異なった操作量で前記量的制御を行うよう
に構成されたことを特徴とする。請求項５の発明は、請
求項１の発明を方法の観点から把握したもので、認識し
ようとする語句ごとにそれぞれ特徴を表す認識用データ
を格納する手段を用い、入力される音声から前記認識用
データを用いて語句を認識するステップと、認識された
語句に応じて制御対象を制御するステップと、を含む音
声認識による制御方法において、前記格納する手段に、
量的制御に関して表現の異なる複数の語句についてそれ
ぞれ認識用データを格納しておき、前記制御するステッ
プは、前記複数の語句のうちどれが認識されたかに応じ
て、異なった操作量で前記量的制御を行うことを特徴と
する。請求項８の発明は、請求項１の発明をコンピュー
タプログラムを記録した記録媒体の観点から把握したも
ので、コンピュータに、認識しようとする語句ごとにそ
れぞれ特徴を表す認識用データを格納させておき、入力
される音声から前記認識用データを用いて語句を認識さ
せ、認識された語句に応じて制御対象を制御させる、音
声認識による制御用プログラムを記録した記録媒体にお
いて、当該プログラムは、前記コンピュータに、前記認
識用データとして、量的制御に関して表現の異なる複数
の語句についてそれぞれ認識用データを格納させてお
き、前記制御対象を制御させる際に、前記複数の語句の
うちどれが認識されたかに応じて、異なった操作量で前
記量的制御を行わせることを特徴とする。請求項１，
５，８の発明では、量的制御を同じ対象に対して行う場
合でも、発話された語句の表現内容の違いに応じて操作
量が変化するので、同じ語句を繰り返して発話する必要
がなくなり、操作性が改善される。

【０００９】請求項２の発明は、請求項１記載の音声認
識による制御装置において、前記制御する手段は、前記
複数の語句のうちどれが認識されたかに応じて、量的制
御を行うコマンドを、異なった操作量を指定して前記制
御対象に対して出力することによって、異なった操作量
で前記量的制御を行うように構成されたことを特徴とす
る。請求項６の発明は、請求項２の発明を方法の観点か
ら把握したもので、請求項５記載の音声認識による制御
方法において、前記制御するステップは、前記複数の語
句のうちどれが認識されたかに応じて、量的制御を行う
コマンドを、異なった操作量を指定して前記制御対象に
対して出力することによって、異なった操作量で前記量
的制御を行うことを特徴とする。請求項２，６の発明で
は、コマンドに操作量の指定を付けて制御対象に出力す
ることで操作量を変化させるので、同じコマンドを操作
量に応じて何度も出力する必要がなく、処理が少ない負
荷で短時間のうちに行われる。

【００１０】請求項３の発明は、請求項１記載の音声認
識による制御装置において、前記制御する手段は、前記
複数の語句のうちどれが認識されたかに応じて、１ステ
ップずつの操作量で前記量的制御を行うコマンドを、前
記制御対象に対して異なった回数出力することによっ
て、異なった操作量で前記量的制御を行うように構成さ
れたことを特徴とする。請求項７の発明は、請求項３の
発明を方法の観点から把握したもので、請求項５記載の
音声認識による制御方法において、前記制御するステッ
プは、前記複数の語句のうちどれが認識されたかに応じ
て、１ステップずつの操作量で前記量的制御を行うコマ
ンドを、前記制御対象に対して異なった回数出力するこ
とによって、異なった操作量で前記量的制御を行うこと
を特徴とする。請求項３，７の発明では、コマンドを制
御対象に出力する回数で操作量を変化させるので、操作
量に応じてコマンドの種類を増やしたり、そのために回
路構成を複雑化する必要がない。特に、制御対象となる
ユニットが、従来通りコマンドを１回受信するごとに１
ステップずつの操作量で量的制御を行うタイプのもので
あっても、そのようなユニットをそのまま本発明によっ
て制御できる。このため、既存のユニットを有効に活用
でき、本発明をさまざまな分野に容易に適用することが
できる。

【００１１】請求項４の発明は、請求項１から３のいず
れか１つに記載の音声認識による制御装置において、前
記量的制御の対象を、カーオーディオシステムの音量と
したことを特徴とする。自動車に搭載されるカーオーデ
ィオシステムでは、走行速度や周囲の騒音の程度、車内
の状況などに応じていろいろな操作量で音量を調整する
場面が多く、その一方、運転者は運転に集中して走行の
安全性を確保する必要が大きい。請求項４の発明では、
このようなカーオーディオシステムの音量を本発明によ
る制御対象とすることによって、運転者が音量を調整す
る場合も語句を何度も繰り返す必要がなくなるので、操
作の快適さが改善されるだけでなく、自動車走行の安全
性も向上する。

【００１２】

【発明の実施の形態】次に、本発明の実施の形態（以下
「実施形態」という）について、図面を参照して説明す
る。なお、本発明の各機能は、コンピュータをソフトウ
ェアで制御することによって実現することが一般的と考
えられる。この場合、コンピュータが備えるレジスタ、
メモリ、外部記憶装置などの記憶装置が、いろいろな形
式で、情報を一時的に保持したり永続的に保存する。そ
して、ＣＰＵが、前記ソフトウェアにしたがって、これ
らの情報に加工及び判断などの処理を加え、さらに、処
理の順序を制御する。

【００１３】また、コンピュータを制御するソフトウェ
アは、本出願の各請求項及び本明細書に記述する処理に
対応した命令を組み合わせることによって作成され、作
成されたソフトウェアは、コンパイルされた組み込みソ
フトウェアなどの形式で実行されることで、上記のよう
なハードウェア資源を活用する。

【００１４】但し、本発明を実現するための上記のよう
な態様はいろいろ変更することができ、本発明を実現す
るソフトウェアを記録したＲＯＭチップやＣＤ−ＲＯＭ
のような記録媒体は、それ単独でも、本発明の一態様で
ある。また、本発明の機能の一部をＬＳＩなどの物理的
な電子回路で実現することも可能である。

【００１５】以上のように、コンピュータを使用して本
発明を実現する態様はいろいろ変更できるので、以下で
は、本発明の各機能を実現する仮想的回路ブロックを用
いることによって、本発明の実施形態を説明する。

【００１６】〔１．第１実施形態の構成〕まず、図１
は、第１実施形態の全体構成を示す機能ブロック図であ
る。第１実施形態は、請求項１，２，４，５，６，８に
対応するもので、カーオーディオシステムに、本発明の
音声認識による制御装置を音声認識ユニットとして組み
込んだものである。このシステムは、センターユニット
１００、ナビゲーションユニット１０１、ＣＤチェンジ
ャ１０２、ＭＤチェンジャ１０３、ＤＳＰ（デジタルサ
ウンドプロセッサ）ユニット１０４、ＥＱ（イコライ
ザ）ユニット１０５及び音声認識ユニット１０６を、Ｂ
ＵＳライン１０８で接続したものである。このシステム
では、音量、フェイダー、バランス、イコライザの各周
波数におけるゲインなどについて、現在の量に対して増
減させるという量的な制御を行うことができる。

【００１７】また、図２は、音声認識ユニット１０６の
具体的な構成を示す機能ブロック図である。この図に示
すように、音声認識ユニット１０６は、認識対象語彙デ
ータベース１と、音声入力部２と、パターンマッチング
部３と、コマンド入出力部４と、を有する。このうち認
識対象語彙データベース１は、認識しようとする各語句
について、波形や各種パラメータなどの特徴を表した認
識用データを登録する手段である。また、音声入力部２
は、マイクロホン（マイク）などから入力される音声を
デジタル信号に変換する部分である。

【００１８】また、パターンマッチング部３は、変換さ
れたデジタル信号を認識対象語彙データベース１内の各
認識用データとパターンマッチングすることによって語
句を認識する部分である。また、コマンド入出力部４
は、認識された語句に対して予め定められた制御内容に
応じた制御用のコマンドをシステムの各ユニットに出力
する手段である。

【００１９】〔２．作用及び効果〕上記のような構成を
有する第１実施形態の概略的な動作手順を図３に示す。
すなわち、この図に示すように、本システムの運用に先
立って認識対象語彙データベース１を予め作成しておく
が（ステップ１）、このとき、量的制御に関する異なっ
た操作量ごとにそれぞれ対応する違った表現の語句を認
識用データとして登録しておく。そして、マイクから入
力された音声から（ステップ２）、認識対象語彙データ
ベース１とのパターンマッチングによって語句が認識さ
れる（ステップ３）。そして、どの表現の語句が認識さ
れたかに応じて異なった操作量で制御が行われる（ステ
ップ４，５）。

【００２０】〔２−１．認識対象語彙データベースの作
成〕次に、認識対象語彙データベース１に語句を登録す
る際の手順を図４に示す。すなわち、音量を操作するた
めの語句（発話内容）として「ぼりゅーむあっぷ」「ち
ょっときこえない」「ぜんぜんきこえない」という相互
に表現の異なる語句を用意する。また、これらの各語句
ごとに、操作量の異なった制御内容を定める。

【００２１】ここでは、上記の３つの語句に対してそれ
ぞれ、「ぼりゅーむあっぷ」→１ステップボリュームアップ「すこしきこえない」→２ステップボリュームアップ「ぜんぜんきこえない」→３ステップボリュームアップという制御内容とする。そして、それぞれの語句を認識
対象語彙データベース１に登録すると共に、制御内容も
それぞれ語句に対応付けてコマンド入出力部４に登録す
る。

【００２２】具体的には、語句ごとに固有の認識コード
を定め、ある語句の認識用データとその語句の認識コー
ドとをペアにして認識対象語彙データベース１に登録す
る。一方、語句に対応する制御内容は、語句に付けたの
と同じ認識コードとペアにしてコマンド入出力部４に登
録する。

【００２３】例えば、図４では、語句「ぼりゅーむあっ
ぷ」は認識コード０１で認識対象語彙データベース１に
登録し（ステップ１１）、この語句に対応する制御内容
である「１ステップボリュームアップ」は、同じ認識コ
ード０１でコマンド入出力部４に登録し、「すこしきこ
えない」「ぜんぜんきこえない」についてもそれぞれ同
様に登録を行う（ステップ１３〜１６）。

【００２４】図２では、このように語句と制御内容とが
それぞれ対応付けられて、認識対象語彙データベース１
とコマンド入出力部４に登録された状態を示している。

【００２５】〔２−２．音声入力と語句の認識〕次に、
本システムにおいて、認識された表現内容に応じた異な
った操作量で量的制御が行われる処理手順を図５に具体
的に示す。すなわち、まず、ユーザの発話した音声がマ
イクから入力されるが（ステップ２）、このときユーザ
は、ボリュームを１段階だけアップさせたいときは「ぼ
りゅーむあっぷ」と発話し、それよりもう少し大きな幅
でボリュームをアップさせたいときは「すこしきこえな
い」と発話し、さらに大きな幅でボリュームをアップさ
せたいときは「ぜんぜんきこえない」と発話すればよ
い。

【００２６】すると、音声認識ユニット１０６のパター
ンマッチング部３が、入力された音声と認識対象語彙デ
ータベース１内に格納されている各認識用データとをパ
ターンマッチングすることによって、どの語句が発話さ
れたかを判断する（ステップ３０）。このとき、発話さ
れた語句が「ぼりゅーむあっぷ」であれば、パターンマ
ッチング部３はコマンド入出力部４に対して認識コード
０１を出力する（ステップ３１）。

【００２７】同様に、パターンマッチング部３はコマン
ド入出力部４に対して、発話された語句が「すこしきこ
えない」であれば、認識コード０２を出力し（ステップ
３２）、発話された語句が「ぜんぜんきこえない」であ
れば、認識コード０３を出力する（ステップ３３）。

【００２８】〔２−３．認識結果に応じたコマンド出
力〕次に、これらの認識コードを受け取ったコマンド入
出力部４は、受け取った認識コードがどの認識コードで
あるかを判断し（ステップ４０）、認識コードに応じた
コマンドを出力する。ここで、コマンドは、音量を上げ
る／下げる、バランスを右寄りに調整する／左寄りに調
整するといった操作内容と、操作量とを指定できる形式
となっている。

【００２９】このため、受け取った認識コードが０１で
あれば、コマンド入出力部４は、例えばアンプ機能を持
つセンターユニット１００に対して、音量を上げさせる
コマンドであるボリュームアップコマンドを、操作量と
してステップ数１を指定した形式で出力する（ステップ
４１）。

【００３０】ここで、このようにコマンドで操作内容と
操作量とを指定できるようにするには、例えば、１つの
コマンドのデータの長さを、操作内容を指定する本体の
フィールド（部分）と、操作量を指定するパラメータの
フィールドに分けておき、本体のフィールドでは操作の
内容を２進数で指定し、また、パラメータフィールドで
は操作量を２進数で指定するようにすればよい。また、
これに対応して、センターユニット１００は、ボリュー
ムアップコマンドを受け取り、そこに指定されたステッ
プ数だけボリュームをアップさせるように構成されてい
るものとする。

【００３１】また、コマンド入出力部４はセンターユニ
ット１００に対して、受け取った認識コードが０２であ
れば、ボリュームアップコマンドを、操作量としてステ
ップ数２を指定した形式で出力する（ステップ４２）。
また、同様に、コマンド入出力部４はセンターユニット
１００に対して、受け取った認識コードが０３であれ
ば、ボリュームアップコマンドを、操作量としてステッ
プ数３を指定した形式で出力する（ステップ４３）。

【００３２】つまり、操作量としてステップ数１（０
１）を指定したデータを「０１ステップデータ」のよう
に表現することとすると、発話された語句が「ぼりゅー
むあっぷ」だと、ボリュームアップコマンド＋０１ステップデータという情報が１つのコマンドとしてコマンド入出力部４
から出力され、発話された語句が「すこしきこえない」
だと、ボリュームアップコマンド＋０２ステップデータという情報が１つのコマンドとして出力され、同様に、
発話された語句が「ぜんぜんきこえない」だと、ボリュームアップコマンド＋０１ステップデータという情報が１つのコマンドとして出力されることにな
る。

【００３３】〔２−４．ユニットの動作〕そして、上記
のようにコマンド入出力部４からコマンドを受け取った
ユニットは、コマンドの操作内容と指定された操作量と
に応じた動作を行うことによってユーザが命令した制御
内容を実現する。例えば、上記の例では、ユーザが「ぼ
りゅーむあっぷ」と発話していたときにはセンターユニ
ット１００ではボリュームアップコマンドと操作量１ス
テップという指定を受信する結果（ステップ５１）、ボ
リュームが１ステップアップする（ステップ５２）。

【００３４】同様に、センターユニット１００では、ユ
ーザが「すこしきこえない」と発話していたときにはボ
リュームアップコマンドと操作量２ステップという指定
を受信する結果（ステップ５３）、ボリュームが２ステ
ップアップし（ステップ５４）、ユーザが「ぜんぜんき
こえない」と発話していたときにはボリュームアップコ
マンドと操作量３ステップという指定を受信する結果
（ステップ５５）、ボリュームが３ステップアップする
（ステップ５６）。

【００３５】〔２−５．効果〕以上のように、第１実施
形態では、量的制御を同じ対象に対して行う場合でも、
発話された語句の表現内容の違いに応じて操作量が変化
するので、同じ語句を繰り返して発話する必要がなくな
り、操作性が改善される。

【００３６】また、第１実施形態では、コマンドに操作
量の指定を付けて制御対象に出力することで操作量を変
化させるので、同じコマンドを操作量に応じて何度も出
力する必要がなく、処理が少ない負荷で短時間のうちに
行われる。

【００３７】さらに、第１実施形態では、量的制御の対
象を、カーオーディオシステムの音量としている。すな
わち、自動車に搭載されるカーオーディオシステムで
は、走行速度や周囲の騒音の程度、車内の状況などに応
じていろいろな操作量で音量を調整する場面が多く、そ
の一方、運転者は運転に集中して走行の安全を確保する
必要が大きい。第１実施形態では、このようなカーオー
ディオの音量を本発明による制御対象とすることによっ
て、運転者が音量を調整する場合も語句を何度も繰り返
す必要がなくなるので、操作の快適さが改善されるだけ
でなく、自動車走行の安全性も向上する。

【００３８】〔３．第２実施形態〕また、上に述べた第
１実施形態では、コマンドを送るときに操作内容に加え
て操作量を指定したが、以下に第２実施形態として示す
ように、同じコマンドを何回送るかで操作量を変えるこ
ともできる（請求項３，７）。ここで、図６は、第２実
施形態において、音声の入力から制御対象となるユニッ
トの動作に至る処理手順を示すフローチャートである。

【００３９】〔３−１．認識結果に応じたコマンド出
力〕つまり、この手順では、認識コードを受け取ったコ
マンド入出力部４は、受け取った認識コードがどの認識
コードであるかを判断する（ステップ４０）。このと
き、受け取った認識コードが０１であれば、コマンド入
出力部４は、例えばアンプ機能を持つセンターユニット
１００に対して、音量を上げさせるコマンドであるボリ
ュームアップコマンドを１回出力する（ステップ４０
１）。この第２実施形態では、センターユニット１００
は、ボリュームアップコマンドを１回受け取るごとに１
段階ずつボリュームをアップさせるように構成されてい
るものとする。

【００４０】同様に、コマンド入出力部４はセンターユ
ニット１００に対して、受け取った認識コードが０２で
あれば、ボリュームアップコマンドを一定間隔で２回出
力する（ステップ４０２）。ここで、ボリュームアップ
コマンドを続けていくつか送信する場合の時間間隔は、
センターユニット１００がコマンドを受け取った後、コ
マンドを実行して再びコマンドの待ち受け状態に復帰す
るまでの所要時間よりも長い間隔とすればよい。また、
同様に、コマンド入出力部４はセンターユニット１００
に対して、受け取った認識コードが０３であれば、ボリ
ュームアップコマンドを一定間隔で３回出力する（ステ
ップ４０３）。

【００４１】〔３−２．ユニットの動作〕そして、上記
のようにコマンド入出力部４からコマンドを受け取った
ユニットは、コマンドの種類や回数などに応じた動作を
行うことによってユーザが命令した制御内容を実現す
る。例えば、上記の例では、ユーザが「ぼりゅーむあっ
ぷ」と発話していたときにはセンターユニット１００で
はコマンドを１つ受信する結果（ステップ５０１）、ボ
リュームが１ステップアップする（ステップ５２）。

【００４２】同様に、センターユニット１００では、ユ
ーザが「すこしきこえない」と発話していたときにはコ
マンドを２つ受信する結果（ステップ５０３）、ボリュ
ームが２ステップアップし（ステップ５４）、ユーザが
「ぜんぜんきこえない」と発話していたときにはコマン
ドを３つ受信する結果（ステップ５０５）、ボリューム
が３ステップアップする（ステップ５６）。

【００４３】〔３−３．第２実施形態の効果〕このよう
な第２実施形態では、コマンドを制御対象に出力する回
数で操作量を変化させるので、操作量に応じてコマンド
の種類を増やしたり、そのために回路構成を複雑化する
必要がない。特に、制御対象となるユニットが、従来通
りコマンドを１回受信するごとに１ステップずつの操作
量で量的制御を行うタイプのものであっても、そのよう
なユニットをそのまま本発明によって制御できる。この
ため、既存のユニットを有効に活用でき、本発明をさま
ざまな分野に容易に適用することができる。

【００４４】〔４．他の実施形態〕なお、本発明は上記
各実施形態に限定されるものではなく、次に例示するよ
うな他の実施形態も含むものである。例えば、図１や図
２に示した構成は一例に過ぎず、本発明は、カーオーデ
ィオシステム以外の他の種類のシステムを制御するのに
用いることもできる。

【００４５】例えば、本発明は、周辺機器を持つ一般的
なコンピュータ自体やテレビ受像機などを制御するため
に、それら装置の機能として実現することもできる。具
体的には、例えば、表示用モニタの輝度やコントラスト
を本発明によって制御することが考えられる。

【００４６】また、本発明をカーオーディオシステムと
組み合わせる場合も、例えば、ナビゲーションユニッ
ト、ＣＤチェンジャ、ＭＤチェンジャなど具体的なユニ
ットの種類は例示に過ぎず、他の種類の音源や他の機能
を持つユニットに自由に置き換えることができる。ま
た、上記各実施形態では音量を制御する例を示したが、
フェイダー、バランス、イコライザの各周波数における
ゲインなどについても、同様に異なった操作量で量的制
御を行うことができる。

【００４７】なお、表現の異なる語句ごとの認識用デー
タや異なった操作量を登録する手段は本システムや音声
認識ユニットの一部である必要はなく、これら認識用デ
ータや操作量は予めＲＯＭライタでＲＯＭに焼き付ける
などしておけばよい。このため、図３のステップ１は本
システムの必須の動作ではなく、同様に、図３のステッ
プ５は音声認識ユニットの必須の動作ではない。また、
上記各実施形態に示した「ぼりゅーむあっぷ」などの語
句や０１などの認識コードは例示に過ぎず、どのような
国の言語で語句を定めてもよいし、他のさまざまな量的
制御の語句を自由に用いることができる。また、量的制
御以外の各種の制御、例えば電源やノイズリダクション
のオン／オフなどの制御と量的制御とを同じ装置で実現
することはもちろん差しつかえない。

【００４８】

【発明の効果】以上のように、本発明によれば、発話さ
れた語句の表現内容の違いに応じて操作量が変化するの
で、同じ語句を繰り返して発話する必要がなくなり、操
作性が改善される。

【図面の簡単な説明】

【図１】本発明の第１実施形態におけるカーオーディオ
システムの全体構成を示すブロック図。

【図２】本発明の第１実施形態における音声認識ユニッ
トの構成を示す機能ブロック図。

【図３】本発明の第１実施形態における処理手順の概略
を示すフローチャート。

【図４】本発明の第１実施形態において、量的制御に関
する複数のそれぞれ違った表現の語句と、それぞれの語
句に対応する制御内容を登録する処理手順を示すフロー
チャート。

【図５】本発明の第１実施形態において、音声の入力か
ら制御対象となるユニットの動作に至る処理手順を示す
フローチャート。

【図６】本発明の第２実施形態において、音声の入力か
ら制御対象となるユニットの動作に至る処理手順を示す
フローチャート。

【符号の説明】

１…認識辞書２…音声入力部３…パターンマッチング部４…コマンド入出力部１００…センターユニット１０１…ナビゲーションユニット１０２…ＣＤチェンジャ１０３…ＭＤチェンジャ１０４…ＤＳＰユニット１０５…ＥＱユニット１０６…音声認識ユニット１０８…ＢＵＳライン

フロントページの続き (72)発明者前坂正巳東京都文京区白山５丁目35番２号クラリオン株式会社内

Claims

【特許請求の範囲】

【請求項１】認識しようとする語句ごとにそれぞれ特
徴を表す認識用データを格納する手段と、入力される音
声から前記認識用データを用いて語句を認識する手段
と、認識された語句に応じて制御対象を制御する手段
と、を有する音声認識による制御装置において、前記格納する手段は、量的制御に関して表現の異なる複
数の語句についてそれぞれ認識用データを格納し、前記制御する手段は、前記複数の語句のうちどれが認識
されたかに応じて、異なった操作量で前記量的制御を行
うように構成されたことを特徴とする音声認識による制
御装置。
【請求項２】前記制御する手段は、前記複数の語句の
うちどれが認識されたかに応じて、量的制御を行うコマ
ンドを、異なった操作量を指定して前記制御対象に対し
て出力することによって、異なった操作量で前記量的制
御を行うように構成されたことを特徴とする請求項１記
載の音声認識による制御装置。
【請求項３】前記制御する手段は、前記複数の語句の
うちどれが認識されたかに応じて、１ステップずつの操
作量で前記量的制御を行うコマンドを、前記制御対象に
対して異なった回数出力することによって、異なった操
作量で前記量的制御を行うように構成されたことを特徴
とする請求項１記載の音声認識による制御装置。
【請求項４】前記量的制御の対象を、カーオーディオ
システムの音量としたことを特徴とする請求項１から３
のいずれか１つに記載の音声認識による制御装置。
【請求項５】認識しようとする語句ごとにそれぞれ特
徴を表す認識用データを格納する手段を用い、入力され
る音声から前記認識用データを用いて語句を認識するス
テップと、認識された語句に応じて制御対象を制御する
ステップと、を含む音声認識による制御方法において、前記格納する手段に、量的制御に関して表現の異なる複
数の語句についてそれぞれ認識用データを格納してお
き、前記制御するステップは、前記複数の語句のうちどれが
認識されたかに応じて、異なった操作量で前記量的制御
を行うことを特徴とする音声認識による制御方法。
【請求項６】前記制御するステップは、前記複数の語
句のうちどれが認識されたかに応じて、量的制御を行う
コマンドを、異なった操作量を指定して前記制御対象に
対して出力することによって、異なった操作量で前記量
的制御を行うことを特徴とする請求項５記載の音声認識
による制御方法。
【請求項７】前記制御するステップは、前記複数の語
句のうちどれが認識されたかに応じて、１ステップずつ
の操作量で前記量的制御を行うコマンドを、前記制御対
象に対して異なった回数出力することによって、異なっ
た操作量で前記量的制御を行うことを特徴とする請求項
５記載の音声認識による制御方法。
【請求項８】コンピュータに、認識しようとする語句
ごとにそれぞれ特徴を表す認識用データを格納させてお
き、入力される音声から前記認識用データを用いて語句
を認識させ、認識された語句に応じて制御対象を制御さ
せる、音声認識による制御用プログラムを記録した記録
媒体において、当該プログラムは、前記コンピュータに、前記認識用データとして、量的制御に関して表現の異な
る複数の語句についてそれぞれ認識用データを格納させ
ておき、前記制御対象を制御させる際に、前記複数の語句のうち
どれが認識されたかに応じて、異なった操作量で前記量
的制御を行わせることを特徴とする音声認識による制御
用プログラムを記録した記録媒体。