JPH11242497A - 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体 - Google Patents
音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体Info
- Publication number
- JPH11242497A JPH11242497A JP10043897A JP4389798A JPH11242497A JP H11242497 A JPH11242497 A JP H11242497A JP 10043897 A JP10043897 A JP 10043897A JP 4389798 A JP4389798 A JP 4389798A JP H11242497 A JPH11242497 A JP H11242497A
- Authority
- JP
- Japan
- Prior art keywords
- control
- recognized
- command
- recognition
- quantitative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 21
- 230000014509 gene expression Effects 0.000 claims description 15
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000012141 concentrate Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Abstract
(57)【要約】
【課題】 音声認識による量的制御において、表現内容
の違いによって操作量を変化させることにより、操作性
を改善する。 【解決手段】 認識対象語彙データベース1に、異なっ
た操作量ごとにそれぞれ対応する違った表現の語句を登
録しておく。パターンマッチング部3が、マイクから入
力された音声から、認識対象語彙データベース1とパタ
ーンマッチングによって語句を認識する。コマンド入出
力部4が、どの表現の語句が認識されたかに応じて異な
った操作量で制御を行う。
の違いによって操作量を変化させることにより、操作性
を改善する。 【解決手段】 認識対象語彙データベース1に、異なっ
た操作量ごとにそれぞれ対応する違った表現の語句を登
録しておく。パターンマッチング部3が、マイクから入
力された音声から、認識対象語彙データベース1とパタ
ーンマッチングによって語句を認識する。コマンド入出
力部4が、どの表現の語句が認識されたかに応じて異な
った操作量で制御を行う。
Description
【0001】
【発明の属する技術分野】本発明は、音声認識によって
各種制御対象の制御を行う技術の改良に関するもので、
より具体的には、量的制御を同じ対象に行う場合でも、
発話された語句の表現内容の違いによって操作量を変化
させることにより、操作性を改善したものである。
各種制御対象の制御を行う技術の改良に関するもので、
より具体的には、量的制御を同じ対象に行う場合でも、
発話された語句の表現内容の違いによって操作量を変化
させることにより、操作性を改善したものである。
【0002】
【従来の技術】音声認識は、認識しようとする語句ごと
に、語句の波形や特徴を表すパラメータなどの認識用デ
ータを予めデータベースに記録しておき、発話された言
葉をこれら認識用データとパターンマッチングすること
によって、発話された語句を推定する技術である。
に、語句の波形や特徴を表すパラメータなどの認識用デ
ータを予めデータベースに記録しておき、発話された言
葉をこれら認識用データとパターンマッチングすること
によって、発話された語句を推定する技術である。
【0003】このような音声認識をオーディオシステム
など各種制御対象の制御に用いる場合、語句ごとに予め
意味を決めておく。そして、認識結果は、認識用データ
に対応した語句IDなどで得られ、制御用のアプリケー
ションプログラムがこの認識結果を受け取り、どの語句
が認識されたか、すなわちユーザの発話語句に応じて予
め決められている制御を制御対象に対して行う。
など各種制御対象の制御に用いる場合、語句ごとに予め
意味を決めておく。そして、認識結果は、認識用データ
に対応した語句IDなどで得られ、制御用のアプリケー
ションプログラムがこの認識結果を受け取り、どの語句
が認識されたか、すなわちユーザの発話語句に応じて予
め決められている制御を制御対象に対して行う。
【0004】このような音声認識による制御では、1つ
の語句に対して1通りの制御内容を対応させる。このた
め、従来では、音量や温度などを量的に変化させる量的
制御を行う場合は、語句を1回発話するごとに、音量な
ら1ステップ、温度なら1度など、変化の最小単位を対
応させて制御を行うか、又は、この種の量的な制御対象
は音声認識による制御の対象から除外していた。なお、
量的制御における変化の最小単位を以下「ステップ」又
は「段階」と呼ぶ。
の語句に対して1通りの制御内容を対応させる。このた
め、従来では、音量や温度などを量的に変化させる量的
制御を行う場合は、語句を1回発話するごとに、音量な
ら1ステップ、温度なら1度など、変化の最小単位を対
応させて制御を行うか、又は、この種の量的な制御対象
は音声認識による制御の対象から除外していた。なお、
量的制御における変化の最小単位を以下「ステップ」又
は「段階」と呼ぶ。
【0005】
【発明が解決しようとする課題】ところで、上記のよう
に1回の発話で最小単位を変化させる従来技術では、1
ステップよりも大きな幅で量的制御を行うためには、制
御のために定められている語句を、変化させたいステッ
プ数と同じ回数だけ繰り返して何度も発話する必要があ
った。例えば、オーディオの音量を変化させる場合、
「ぼりゅーむあっぷ」といった語句を1回発話する度に
1段階ずつ音が大きくなる。このため、音量を現在より
5段階ボリュームアップさせるためには「ぼりゅーむあ
っぷ」という語句を5回繰り返して発話しなければなら
なかった。
に1回の発話で最小単位を変化させる従来技術では、1
ステップよりも大きな幅で量的制御を行うためには、制
御のために定められている語句を、変化させたいステッ
プ数と同じ回数だけ繰り返して何度も発話する必要があ
った。例えば、オーディオの音量を変化させる場合、
「ぼりゅーむあっぷ」といった語句を1回発話する度に
1段階ずつ音が大きくなる。このため、音量を現在より
5段階ボリュームアップさせるためには「ぼりゅーむあ
っぷ」という語句を5回繰り返して発話しなければなら
なかった。
【0006】しかし、このように語句を繰り返して発話
する従来技術では、操作量が大きくなるほど繰り返して
発話しなければならない回数が増大し、操作性の向上と
いう音声認識の利点が著しく損なわれることになる。
する従来技術では、操作量が大きくなるほど繰り返して
発話しなければならない回数が増大し、操作性の向上と
いう音声認識の利点が著しく損なわれることになる。
【0007】本発明は、上記のような従来技術の問題点
を解決するために提案されたものであり、その目的は、
量的制御を同じ対象に行う場合でも、表現内容の違いに
よって操作量を変化させることにより、操作性を改善す
ることである。
を解決するために提案されたものであり、その目的は、
量的制御を同じ対象に行う場合でも、表現内容の違いに
よって操作量を変化させることにより、操作性を改善す
ることである。
【0008】
【課題を解決するための手段】上記の目的を達成するた
め、請求項1の発明は、認識しようとする語句ごとにそ
れぞれ特徴を表す認識用データを格納する手段と、入力
される音声から前記認識用データを用いて語句を認識す
る手段と、認識された語句に応じて制御対象を制御する
手段と、を有する音声認識による制御装置において、前
記格納する手段は、量的制御に関して表現の異なる複数
の語句についてそれぞれ認識用データを格納し、前記制
御する手段は、前記複数の語句のうちどれが認識された
かに応じて、異なった操作量で前記量的制御を行うよう
に構成されたことを特徴とする。請求項5の発明は、請
求項1の発明を方法の観点から把握したもので、認識し
ようとする語句ごとにそれぞれ特徴を表す認識用データ
を格納する手段を用い、入力される音声から前記認識用
データを用いて語句を認識するステップと、認識された
語句に応じて制御対象を制御するステップと、を含む音
声認識による制御方法において、前記格納する手段に、
量的制御に関して表現の異なる複数の語句についてそれ
ぞれ認識用データを格納しておき、前記制御するステッ
プは、前記複数の語句のうちどれが認識されたかに応じ
て、異なった操作量で前記量的制御を行うことを特徴と
する。請求項8の発明は、請求項1の発明をコンピュー
タプログラムを記録した記録媒体の観点から把握したも
ので、コンピュータに、認識しようとする語句ごとにそ
れぞれ特徴を表す認識用データを格納させておき、入力
される音声から前記認識用データを用いて語句を認識さ
せ、認識された語句に応じて制御対象を制御させる、音
声認識による制御用プログラムを記録した記録媒体にお
いて、当該プログラムは、前記コンピュータに、前記認
識用データとして、量的制御に関して表現の異なる複数
の語句についてそれぞれ認識用データを格納させてお
き、前記制御対象を制御させる際に、前記複数の語句の
うちどれが認識されたかに応じて、異なった操作量で前
記量的制御を行わせることを特徴とする。請求項1,
5,8の発明では、量的制御を同じ対象に対して行う場
合でも、発話された語句の表現内容の違いに応じて操作
量が変化するので、同じ語句を繰り返して発話する必要
がなくなり、操作性が改善される。
め、請求項1の発明は、認識しようとする語句ごとにそ
れぞれ特徴を表す認識用データを格納する手段と、入力
される音声から前記認識用データを用いて語句を認識す
る手段と、認識された語句に応じて制御対象を制御する
手段と、を有する音声認識による制御装置において、前
記格納する手段は、量的制御に関して表現の異なる複数
の語句についてそれぞれ認識用データを格納し、前記制
御する手段は、前記複数の語句のうちどれが認識された
かに応じて、異なった操作量で前記量的制御を行うよう
に構成されたことを特徴とする。請求項5の発明は、請
求項1の発明を方法の観点から把握したもので、認識し
ようとする語句ごとにそれぞれ特徴を表す認識用データ
を格納する手段を用い、入力される音声から前記認識用
データを用いて語句を認識するステップと、認識された
語句に応じて制御対象を制御するステップと、を含む音
声認識による制御方法において、前記格納する手段に、
量的制御に関して表現の異なる複数の語句についてそれ
ぞれ認識用データを格納しておき、前記制御するステッ
プは、前記複数の語句のうちどれが認識されたかに応じ
て、異なった操作量で前記量的制御を行うことを特徴と
する。請求項8の発明は、請求項1の発明をコンピュー
タプログラムを記録した記録媒体の観点から把握したも
ので、コンピュータに、認識しようとする語句ごとにそ
れぞれ特徴を表す認識用データを格納させておき、入力
される音声から前記認識用データを用いて語句を認識さ
せ、認識された語句に応じて制御対象を制御させる、音
声認識による制御用プログラムを記録した記録媒体にお
いて、当該プログラムは、前記コンピュータに、前記認
識用データとして、量的制御に関して表現の異なる複数
の語句についてそれぞれ認識用データを格納させてお
き、前記制御対象を制御させる際に、前記複数の語句の
うちどれが認識されたかに応じて、異なった操作量で前
記量的制御を行わせることを特徴とする。請求項1,
5,8の発明では、量的制御を同じ対象に対して行う場
合でも、発話された語句の表現内容の違いに応じて操作
量が変化するので、同じ語句を繰り返して発話する必要
がなくなり、操作性が改善される。
【0009】請求項2の発明は、請求項1記載の音声認
識による制御装置において、前記制御する手段は、前記
複数の語句のうちどれが認識されたかに応じて、量的制
御を行うコマンドを、異なった操作量を指定して前記制
御対象に対して出力することによって、異なった操作量
で前記量的制御を行うように構成されたことを特徴とす
る。請求項6の発明は、請求項2の発明を方法の観点か
ら把握したもので、請求項5記載の音声認識による制御
方法において、前記制御するステップは、前記複数の語
句のうちどれが認識されたかに応じて、量的制御を行う
コマンドを、異なった操作量を指定して前記制御対象に
対して出力することによって、異なった操作量で前記量
的制御を行うことを特徴とする。請求項2,6の発明で
は、コマンドに操作量の指定を付けて制御対象に出力す
ることで操作量を変化させるので、同じコマンドを操作
量に応じて何度も出力する必要がなく、処理が少ない負
荷で短時間のうちに行われる。
識による制御装置において、前記制御する手段は、前記
複数の語句のうちどれが認識されたかに応じて、量的制
御を行うコマンドを、異なった操作量を指定して前記制
御対象に対して出力することによって、異なった操作量
で前記量的制御を行うように構成されたことを特徴とす
る。請求項6の発明は、請求項2の発明を方法の観点か
ら把握したもので、請求項5記載の音声認識による制御
方法において、前記制御するステップは、前記複数の語
句のうちどれが認識されたかに応じて、量的制御を行う
コマンドを、異なった操作量を指定して前記制御対象に
対して出力することによって、異なった操作量で前記量
的制御を行うことを特徴とする。請求項2,6の発明で
は、コマンドに操作量の指定を付けて制御対象に出力す
ることで操作量を変化させるので、同じコマンドを操作
量に応じて何度も出力する必要がなく、処理が少ない負
荷で短時間のうちに行われる。
【0010】請求項3の発明は、請求項1記載の音声認
識による制御装置において、前記制御する手段は、前記
複数の語句のうちどれが認識されたかに応じて、1ステ
ップずつの操作量で前記量的制御を行うコマンドを、前
記制御対象に対して異なった回数出力することによっ
て、異なった操作量で前記量的制御を行うように構成さ
れたことを特徴とする。請求項7の発明は、請求項3の
発明を方法の観点から把握したもので、請求項5記載の
音声認識による制御方法において、前記制御するステッ
プは、前記複数の語句のうちどれが認識されたかに応じ
て、1ステップずつの操作量で前記量的制御を行うコマ
ンドを、前記制御対象に対して異なった回数出力するこ
とによって、異なった操作量で前記量的制御を行うこと
を特徴とする。請求項3,7の発明では、コマンドを制
御対象に出力する回数で操作量を変化させるので、操作
量に応じてコマンドの種類を増やしたり、そのために回
路構成を複雑化する必要がない。特に、制御対象となる
ユニットが、従来通りコマンドを1回受信するごとに1
ステップずつの操作量で量的制御を行うタイプのもので
あっても、そのようなユニットをそのまま本発明によっ
て制御できる。このため、既存のユニットを有効に活用
でき、本発明をさまざまな分野に容易に適用することが
できる。
識による制御装置において、前記制御する手段は、前記
複数の語句のうちどれが認識されたかに応じて、1ステ
ップずつの操作量で前記量的制御を行うコマンドを、前
記制御対象に対して異なった回数出力することによっ
て、異なった操作量で前記量的制御を行うように構成さ
れたことを特徴とする。請求項7の発明は、請求項3の
発明を方法の観点から把握したもので、請求項5記載の
音声認識による制御方法において、前記制御するステッ
プは、前記複数の語句のうちどれが認識されたかに応じ
て、1ステップずつの操作量で前記量的制御を行うコマ
ンドを、前記制御対象に対して異なった回数出力するこ
とによって、異なった操作量で前記量的制御を行うこと
を特徴とする。請求項3,7の発明では、コマンドを制
御対象に出力する回数で操作量を変化させるので、操作
量に応じてコマンドの種類を増やしたり、そのために回
路構成を複雑化する必要がない。特に、制御対象となる
ユニットが、従来通りコマンドを1回受信するごとに1
ステップずつの操作量で量的制御を行うタイプのもので
あっても、そのようなユニットをそのまま本発明によっ
て制御できる。このため、既存のユニットを有効に活用
でき、本発明をさまざまな分野に容易に適用することが
できる。
【0011】請求項4の発明は、請求項1から3のいず
れか1つに記載の音声認識による制御装置において、前
記量的制御の対象を、カーオーディオシステムの音量と
したことを特徴とする。自動車に搭載されるカーオーデ
ィオシステムでは、走行速度や周囲の騒音の程度、車内
の状況などに応じていろいろな操作量で音量を調整する
場面が多く、その一方、運転者は運転に集中して走行の
安全性を確保する必要が大きい。請求項4の発明では、
このようなカーオーディオシステムの音量を本発明によ
る制御対象とすることによって、運転者が音量を調整す
る場合も語句を何度も繰り返す必要がなくなるので、操
作の快適さが改善されるだけでなく、自動車走行の安全
性も向上する。
れか1つに記載の音声認識による制御装置において、前
記量的制御の対象を、カーオーディオシステムの音量と
したことを特徴とする。自動車に搭載されるカーオーデ
ィオシステムでは、走行速度や周囲の騒音の程度、車内
の状況などに応じていろいろな操作量で音量を調整する
場面が多く、その一方、運転者は運転に集中して走行の
安全性を確保する必要が大きい。請求項4の発明では、
このようなカーオーディオシステムの音量を本発明によ
る制御対象とすることによって、運転者が音量を調整す
る場合も語句を何度も繰り返す必要がなくなるので、操
作の快適さが改善されるだけでなく、自動車走行の安全
性も向上する。
【0012】
【発明の実施の形態】次に、本発明の実施の形態(以下
「実施形態」という)について、図面を参照して説明す
る。なお、本発明の各機能は、コンピュータをソフトウ
ェアで制御することによって実現することが一般的と考
えられる。この場合、コンピュータが備えるレジスタ、
メモリ、外部記憶装置などの記憶装置が、いろいろな形
式で、情報を一時的に保持したり永続的に保存する。そ
して、CPUが、前記ソフトウェアにしたがって、これ
らの情報に加工及び判断などの処理を加え、さらに、処
理の順序を制御する。
「実施形態」という)について、図面を参照して説明す
る。なお、本発明の各機能は、コンピュータをソフトウ
ェアで制御することによって実現することが一般的と考
えられる。この場合、コンピュータが備えるレジスタ、
メモリ、外部記憶装置などの記憶装置が、いろいろな形
式で、情報を一時的に保持したり永続的に保存する。そ
して、CPUが、前記ソフトウェアにしたがって、これ
らの情報に加工及び判断などの処理を加え、さらに、処
理の順序を制御する。
【0013】また、コンピュータを制御するソフトウェ
アは、本出願の各請求項及び本明細書に記述する処理に
対応した命令を組み合わせることによって作成され、作
成されたソフトウェアは、コンパイルされた組み込みソ
フトウェアなどの形式で実行されることで、上記のよう
なハードウェア資源を活用する。
アは、本出願の各請求項及び本明細書に記述する処理に
対応した命令を組み合わせることによって作成され、作
成されたソフトウェアは、コンパイルされた組み込みソ
フトウェアなどの形式で実行されることで、上記のよう
なハードウェア資源を活用する。
【0014】但し、本発明を実現するための上記のよう
な態様はいろいろ変更することができ、本発明を実現す
るソフトウェアを記録したROMチップやCD−ROM
のような記録媒体は、それ単独でも、本発明の一態様で
ある。また、本発明の機能の一部をLSIなどの物理的
な電子回路で実現することも可能である。
な態様はいろいろ変更することができ、本発明を実現す
るソフトウェアを記録したROMチップやCD−ROM
のような記録媒体は、それ単独でも、本発明の一態様で
ある。また、本発明の機能の一部をLSIなどの物理的
な電子回路で実現することも可能である。
【0015】以上のように、コンピュータを使用して本
発明を実現する態様はいろいろ変更できるので、以下で
は、本発明の各機能を実現する仮想的回路ブロックを用
いることによって、本発明の実施形態を説明する。
発明を実現する態様はいろいろ変更できるので、以下で
は、本発明の各機能を実現する仮想的回路ブロックを用
いることによって、本発明の実施形態を説明する。
【0016】〔1.第1実施形態の構成〕まず、図1
は、第1実施形態の全体構成を示す機能ブロック図であ
る。第1実施形態は、請求項1,2,4,5,6,8に
対応するもので、カーオーディオシステムに、本発明の
音声認識による制御装置を音声認識ユニットとして組み
込んだものである。このシステムは、センターユニット
100、ナビゲーションユニット101、CDチェンジ
ャ102、MDチェンジャ103、DSP(デジタルサ
ウンドプロセッサ)ユニット104、EQ(イコライ
ザ)ユニット105及び音声認識ユニット106を、B
USライン108で接続したものである。このシステム
では、音量、フェイダー、バランス、イコライザの各周
波数におけるゲインなどについて、現在の量に対して増
減させるという量的な制御を行うことができる。
は、第1実施形態の全体構成を示す機能ブロック図であ
る。第1実施形態は、請求項1,2,4,5,6,8に
対応するもので、カーオーディオシステムに、本発明の
音声認識による制御装置を音声認識ユニットとして組み
込んだものである。このシステムは、センターユニット
100、ナビゲーションユニット101、CDチェンジ
ャ102、MDチェンジャ103、DSP(デジタルサ
ウンドプロセッサ)ユニット104、EQ(イコライ
ザ)ユニット105及び音声認識ユニット106を、B
USライン108で接続したものである。このシステム
では、音量、フェイダー、バランス、イコライザの各周
波数におけるゲインなどについて、現在の量に対して増
減させるという量的な制御を行うことができる。
【0017】また、図2は、音声認識ユニット106の
具体的な構成を示す機能ブロック図である。この図に示
すように、音声認識ユニット106は、認識対象語彙デ
ータベース1と、音声入力部2と、パターンマッチング
部3と、コマンド入出力部4と、を有する。このうち認
識対象語彙データベース1は、認識しようとする各語句
について、波形や各種パラメータなどの特徴を表した認
識用データを登録する手段である。また、音声入力部2
は、マイクロホン(マイク)などから入力される音声を
デジタル信号に変換する部分である。
具体的な構成を示す機能ブロック図である。この図に示
すように、音声認識ユニット106は、認識対象語彙デ
ータベース1と、音声入力部2と、パターンマッチング
部3と、コマンド入出力部4と、を有する。このうち認
識対象語彙データベース1は、認識しようとする各語句
について、波形や各種パラメータなどの特徴を表した認
識用データを登録する手段である。また、音声入力部2
は、マイクロホン(マイク)などから入力される音声を
デジタル信号に変換する部分である。
【0018】また、パターンマッチング部3は、変換さ
れたデジタル信号を認識対象語彙データベース1内の各
認識用データとパターンマッチングすることによって語
句を認識する部分である。また、コマンド入出力部4
は、認識された語句に対して予め定められた制御内容に
応じた制御用のコマンドをシステムの各ユニットに出力
する手段である。
れたデジタル信号を認識対象語彙データベース1内の各
認識用データとパターンマッチングすることによって語
句を認識する部分である。また、コマンド入出力部4
は、認識された語句に対して予め定められた制御内容に
応じた制御用のコマンドをシステムの各ユニットに出力
する手段である。
【0019】〔2.作用及び効果〕上記のような構成を
有する第1実施形態の概略的な動作手順を図3に示す。
すなわち、この図に示すように、本システムの運用に先
立って認識対象語彙データベース1を予め作成しておく
が(ステップ1)、このとき、量的制御に関する異なっ
た操作量ごとにそれぞれ対応する違った表現の語句を認
識用データとして登録しておく。そして、マイクから入
力された音声から(ステップ2)、認識対象語彙データ
ベース1とのパターンマッチングによって語句が認識さ
れる(ステップ3)。そして、どの表現の語句が認識さ
れたかに応じて異なった操作量で制御が行われる(ステ
ップ4,5)。
有する第1実施形態の概略的な動作手順を図3に示す。
すなわち、この図に示すように、本システムの運用に先
立って認識対象語彙データベース1を予め作成しておく
が(ステップ1)、このとき、量的制御に関する異なっ
た操作量ごとにそれぞれ対応する違った表現の語句を認
識用データとして登録しておく。そして、マイクから入
力された音声から(ステップ2)、認識対象語彙データ
ベース1とのパターンマッチングによって語句が認識さ
れる(ステップ3)。そして、どの表現の語句が認識さ
れたかに応じて異なった操作量で制御が行われる(ステ
ップ4,5)。
【0020】〔2−1.認識対象語彙データベースの作
成〕次に、認識対象語彙データベース1に語句を登録す
る際の手順を図4に示す。すなわち、音量を操作するた
めの語句(発話内容)として「ぼりゅーむあっぷ」「ち
ょっときこえない」「ぜんぜんきこえない」という相互
に表現の異なる語句を用意する。また、これらの各語句
ごとに、操作量の異なった制御内容を定める。
成〕次に、認識対象語彙データベース1に語句を登録す
る際の手順を図4に示す。すなわち、音量を操作するた
めの語句(発話内容)として「ぼりゅーむあっぷ」「ち
ょっときこえない」「ぜんぜんきこえない」という相互
に表現の異なる語句を用意する。また、これらの各語句
ごとに、操作量の異なった制御内容を定める。
【0021】ここでは、上記の3つの語句に対してそれ
ぞれ、 「ぼりゅーむあっぷ」→1ステップボリュームアップ 「すこしきこえない」→2ステップボリュームアップ 「ぜんぜんきこえない」→3ステップボリュームアップ という制御内容とする。そして、それぞれの語句を認識
対象語彙データベース1に登録すると共に、制御内容も
それぞれ語句に対応付けてコマンド入出力部4に登録す
る。
ぞれ、 「ぼりゅーむあっぷ」→1ステップボリュームアップ 「すこしきこえない」→2ステップボリュームアップ 「ぜんぜんきこえない」→3ステップボリュームアップ という制御内容とする。そして、それぞれの語句を認識
対象語彙データベース1に登録すると共に、制御内容も
それぞれ語句に対応付けてコマンド入出力部4に登録す
る。
【0022】具体的には、語句ごとに固有の認識コード
を定め、ある語句の認識用データとその語句の認識コー
ドとをペアにして認識対象語彙データベース1に登録す
る。一方、語句に対応する制御内容は、語句に付けたの
と同じ認識コードとペアにしてコマンド入出力部4に登
録する。
を定め、ある語句の認識用データとその語句の認識コー
ドとをペアにして認識対象語彙データベース1に登録す
る。一方、語句に対応する制御内容は、語句に付けたの
と同じ認識コードとペアにしてコマンド入出力部4に登
録する。
【0023】例えば、図4では、語句「ぼりゅーむあっ
ぷ」は認識コード01で認識対象語彙データベース1に
登録し(ステップ11)、この語句に対応する制御内容
である「1ステップボリュームアップ」は、同じ認識コ
ード01でコマンド入出力部4に登録し、「すこしきこ
えない」「ぜんぜんきこえない」についてもそれぞれ同
様に登録を行う(ステップ13〜16)。
ぷ」は認識コード01で認識対象語彙データベース1に
登録し(ステップ11)、この語句に対応する制御内容
である「1ステップボリュームアップ」は、同じ認識コ
ード01でコマンド入出力部4に登録し、「すこしきこ
えない」「ぜんぜんきこえない」についてもそれぞれ同
様に登録を行う(ステップ13〜16)。
【0024】図2では、このように語句と制御内容とが
それぞれ対応付けられて、認識対象語彙データベース1
とコマンド入出力部4に登録された状態を示している。
それぞれ対応付けられて、認識対象語彙データベース1
とコマンド入出力部4に登録された状態を示している。
【0025】〔2−2.音声入力と語句の認識〕次に、
本システムにおいて、認識された表現内容に応じた異な
った操作量で量的制御が行われる処理手順を図5に具体
的に示す。すなわち、まず、ユーザの発話した音声がマ
イクから入力されるが(ステップ2)、このときユーザ
は、ボリュームを1段階だけアップさせたいときは「ぼ
りゅーむあっぷ」と発話し、それよりもう少し大きな幅
でボリュームをアップさせたいときは「すこしきこえな
い」と発話し、さらに大きな幅でボリュームをアップさ
せたいときは「ぜんぜんきこえない」と発話すればよ
い。
本システムにおいて、認識された表現内容に応じた異な
った操作量で量的制御が行われる処理手順を図5に具体
的に示す。すなわち、まず、ユーザの発話した音声がマ
イクから入力されるが(ステップ2)、このときユーザ
は、ボリュームを1段階だけアップさせたいときは「ぼ
りゅーむあっぷ」と発話し、それよりもう少し大きな幅
でボリュームをアップさせたいときは「すこしきこえな
い」と発話し、さらに大きな幅でボリュームをアップさ
せたいときは「ぜんぜんきこえない」と発話すればよ
い。
【0026】すると、音声認識ユニット106のパター
ンマッチング部3が、入力された音声と認識対象語彙デ
ータベース1内に格納されている各認識用データとをパ
ターンマッチングすることによって、どの語句が発話さ
れたかを判断する(ステップ30)。このとき、発話さ
れた語句が「ぼりゅーむあっぷ」であれば、パターンマ
ッチング部3はコマンド入出力部4に対して認識コード
01を出力する(ステップ31)。
ンマッチング部3が、入力された音声と認識対象語彙デ
ータベース1内に格納されている各認識用データとをパ
ターンマッチングすることによって、どの語句が発話さ
れたかを判断する(ステップ30)。このとき、発話さ
れた語句が「ぼりゅーむあっぷ」であれば、パターンマ
ッチング部3はコマンド入出力部4に対して認識コード
01を出力する(ステップ31)。
【0027】同様に、パターンマッチング部3はコマン
ド入出力部4に対して、発話された語句が「すこしきこ
えない」であれば、認識コード02を出力し(ステップ
32)、発話された語句が「ぜんぜんきこえない」であ
れば、認識コード03を出力する(ステップ33)。
ド入出力部4に対して、発話された語句が「すこしきこ
えない」であれば、認識コード02を出力し(ステップ
32)、発話された語句が「ぜんぜんきこえない」であ
れば、認識コード03を出力する(ステップ33)。
【0028】〔2−3.認識結果に応じたコマンド出
力〕次に、これらの認識コードを受け取ったコマンド入
出力部4は、受け取った認識コードがどの認識コードで
あるかを判断し(ステップ40)、認識コードに応じた
コマンドを出力する。ここで、コマンドは、音量を上げ
る/下げる、バランスを右寄りに調整する/左寄りに調
整するといった操作内容と、操作量とを指定できる形式
となっている。
力〕次に、これらの認識コードを受け取ったコマンド入
出力部4は、受け取った認識コードがどの認識コードで
あるかを判断し(ステップ40)、認識コードに応じた
コマンドを出力する。ここで、コマンドは、音量を上げ
る/下げる、バランスを右寄りに調整する/左寄りに調
整するといった操作内容と、操作量とを指定できる形式
となっている。
【0029】このため、受け取った認識コードが01で
あれば、コマンド入出力部4は、例えばアンプ機能を持
つセンターユニット100に対して、音量を上げさせる
コマンドであるボリュームアップコマンドを、操作量と
してステップ数1を指定した形式で出力する(ステップ
41)。
あれば、コマンド入出力部4は、例えばアンプ機能を持
つセンターユニット100に対して、音量を上げさせる
コマンドであるボリュームアップコマンドを、操作量と
してステップ数1を指定した形式で出力する(ステップ
41)。
【0030】ここで、このようにコマンドで操作内容と
操作量とを指定できるようにするには、例えば、1つの
コマンドのデータの長さを、操作内容を指定する本体の
フィールド(部分)と、操作量を指定するパラメータの
フィールドに分けておき、本体のフィールドでは操作の
内容を2進数で指定し、また、パラメータフィールドで
は操作量を2進数で指定するようにすればよい。また、
これに対応して、センターユニット100は、ボリュー
ムアップコマンドを受け取り、そこに指定されたステッ
プ数だけボリュームをアップさせるように構成されてい
るものとする。
操作量とを指定できるようにするには、例えば、1つの
コマンドのデータの長さを、操作内容を指定する本体の
フィールド(部分)と、操作量を指定するパラメータの
フィールドに分けておき、本体のフィールドでは操作の
内容を2進数で指定し、また、パラメータフィールドで
は操作量を2進数で指定するようにすればよい。また、
これに対応して、センターユニット100は、ボリュー
ムアップコマンドを受け取り、そこに指定されたステッ
プ数だけボリュームをアップさせるように構成されてい
るものとする。
【0031】また、コマンド入出力部4はセンターユニ
ット100に対して、受け取った認識コードが02であ
れば、ボリュームアップコマンドを、操作量としてステ
ップ数2を指定した形式で出力する(ステップ42)。
また、同様に、コマンド入出力部4はセンターユニット
100に対して、受け取った認識コードが03であれ
ば、ボリュームアップコマンドを、操作量としてステッ
プ数3を指定した形式で出力する(ステップ43)。
ット100に対して、受け取った認識コードが02であ
れば、ボリュームアップコマンドを、操作量としてステ
ップ数2を指定した形式で出力する(ステップ42)。
また、同様に、コマンド入出力部4はセンターユニット
100に対して、受け取った認識コードが03であれ
ば、ボリュームアップコマンドを、操作量としてステッ
プ数3を指定した形式で出力する(ステップ43)。
【0032】つまり、操作量としてステップ数1(0
1)を指定したデータを「01ステップデータ」のよう
に表現することとすると、発話された語句が「ぼりゅー
むあっぷ」だと、 ボリュームアップコマンド+01ステップデータ という情報が1つのコマンドとしてコマンド入出力部4
から出力され、発話された語句が「すこしきこえない」
だと、 ボリュームアップコマンド+02ステップデータ という情報が1つのコマンドとして出力され、同様に、
発話された語句が「ぜんぜんきこえない」だと、 ボリュームアップコマンド+01ステップデータ という情報が1つのコマンドとして出力されることにな
る。
1)を指定したデータを「01ステップデータ」のよう
に表現することとすると、発話された語句が「ぼりゅー
むあっぷ」だと、 ボリュームアップコマンド+01ステップデータ という情報が1つのコマンドとしてコマンド入出力部4
から出力され、発話された語句が「すこしきこえない」
だと、 ボリュームアップコマンド+02ステップデータ という情報が1つのコマンドとして出力され、同様に、
発話された語句が「ぜんぜんきこえない」だと、 ボリュームアップコマンド+01ステップデータ という情報が1つのコマンドとして出力されることにな
る。
【0033】〔2−4.ユニットの動作〕そして、上記
のようにコマンド入出力部4からコマンドを受け取った
ユニットは、コマンドの操作内容と指定された操作量と
に応じた動作を行うことによってユーザが命令した制御
内容を実現する。例えば、上記の例では、ユーザが「ぼ
りゅーむあっぷ」と発話していたときにはセンターユニ
ット100ではボリュームアップコマンドと操作量1ス
テップという指定を受信する結果(ステップ51)、ボ
リュームが1ステップアップする(ステップ52)。
のようにコマンド入出力部4からコマンドを受け取った
ユニットは、コマンドの操作内容と指定された操作量と
に応じた動作を行うことによってユーザが命令した制御
内容を実現する。例えば、上記の例では、ユーザが「ぼ
りゅーむあっぷ」と発話していたときにはセンターユニ
ット100ではボリュームアップコマンドと操作量1ス
テップという指定を受信する結果(ステップ51)、ボ
リュームが1ステップアップする(ステップ52)。
【0034】同様に、センターユニット100では、ユ
ーザが「すこしきこえない」と発話していたときにはボ
リュームアップコマンドと操作量2ステップという指定
を受信する結果(ステップ53)、ボリュームが2ステ
ップアップし(ステップ54)、ユーザが「ぜんぜんき
こえない」と発話していたときにはボリュームアップコ
マンドと操作量3ステップという指定を受信する結果
(ステップ55)、ボリュームが3ステップアップする
(ステップ56)。
ーザが「すこしきこえない」と発話していたときにはボ
リュームアップコマンドと操作量2ステップという指定
を受信する結果(ステップ53)、ボリュームが2ステ
ップアップし(ステップ54)、ユーザが「ぜんぜんき
こえない」と発話していたときにはボリュームアップコ
マンドと操作量3ステップという指定を受信する結果
(ステップ55)、ボリュームが3ステップアップする
(ステップ56)。
【0035】〔2−5.効果〕以上のように、第1実施
形態では、量的制御を同じ対象に対して行う場合でも、
発話された語句の表現内容の違いに応じて操作量が変化
するので、同じ語句を繰り返して発話する必要がなくな
り、操作性が改善される。
形態では、量的制御を同じ対象に対して行う場合でも、
発話された語句の表現内容の違いに応じて操作量が変化
するので、同じ語句を繰り返して発話する必要がなくな
り、操作性が改善される。
【0036】また、第1実施形態では、コマンドに操作
量の指定を付けて制御対象に出力することで操作量を変
化させるので、同じコマンドを操作量に応じて何度も出
力する必要がなく、処理が少ない負荷で短時間のうちに
行われる。
量の指定を付けて制御対象に出力することで操作量を変
化させるので、同じコマンドを操作量に応じて何度も出
力する必要がなく、処理が少ない負荷で短時間のうちに
行われる。
【0037】さらに、第1実施形態では、量的制御の対
象を、カーオーディオシステムの音量としている。すな
わち、自動車に搭載されるカーオーディオシステムで
は、走行速度や周囲の騒音の程度、車内の状況などに応
じていろいろな操作量で音量を調整する場面が多く、そ
の一方、運転者は運転に集中して走行の安全を確保する
必要が大きい。第1実施形態では、このようなカーオー
ディオの音量を本発明による制御対象とすることによっ
て、運転者が音量を調整する場合も語句を何度も繰り返
す必要がなくなるので、操作の快適さが改善されるだけ
でなく、自動車走行の安全性も向上する。
象を、カーオーディオシステムの音量としている。すな
わち、自動車に搭載されるカーオーディオシステムで
は、走行速度や周囲の騒音の程度、車内の状況などに応
じていろいろな操作量で音量を調整する場面が多く、そ
の一方、運転者は運転に集中して走行の安全を確保する
必要が大きい。第1実施形態では、このようなカーオー
ディオの音量を本発明による制御対象とすることによっ
て、運転者が音量を調整する場合も語句を何度も繰り返
す必要がなくなるので、操作の快適さが改善されるだけ
でなく、自動車走行の安全性も向上する。
【0038】〔3.第2実施形態〕また、上に述べた第
1実施形態では、コマンドを送るときに操作内容に加え
て操作量を指定したが、以下に第2実施形態として示す
ように、同じコマンドを何回送るかで操作量を変えるこ
ともできる(請求項3,7)。ここで、図6は、第2実
施形態において、音声の入力から制御対象となるユニッ
トの動作に至る処理手順を示すフローチャートである。
1実施形態では、コマンドを送るときに操作内容に加え
て操作量を指定したが、以下に第2実施形態として示す
ように、同じコマンドを何回送るかで操作量を変えるこ
ともできる(請求項3,7)。ここで、図6は、第2実
施形態において、音声の入力から制御対象となるユニッ
トの動作に至る処理手順を示すフローチャートである。
【0039】〔3−1.認識結果に応じたコマンド出
力〕つまり、この手順では、認識コードを受け取ったコ
マンド入出力部4は、受け取った認識コードがどの認識
コードであるかを判断する(ステップ40)。このと
き、受け取った認識コードが01であれば、コマンド入
出力部4は、例えばアンプ機能を持つセンターユニット
100に対して、音量を上げさせるコマンドであるボリ
ュームアップコマンドを1回出力する(ステップ40
1)。この第2実施形態では、センターユニット100
は、ボリュームアップコマンドを1回受け取るごとに1
段階ずつボリュームをアップさせるように構成されてい
るものとする。
力〕つまり、この手順では、認識コードを受け取ったコ
マンド入出力部4は、受け取った認識コードがどの認識
コードであるかを判断する(ステップ40)。このと
き、受け取った認識コードが01であれば、コマンド入
出力部4は、例えばアンプ機能を持つセンターユニット
100に対して、音量を上げさせるコマンドであるボリ
ュームアップコマンドを1回出力する(ステップ40
1)。この第2実施形態では、センターユニット100
は、ボリュームアップコマンドを1回受け取るごとに1
段階ずつボリュームをアップさせるように構成されてい
るものとする。
【0040】同様に、コマンド入出力部4はセンターユ
ニット100に対して、受け取った認識コードが02で
あれば、ボリュームアップコマンドを一定間隔で2回出
力する(ステップ402)。ここで、ボリュームアップ
コマンドを続けていくつか送信する場合の時間間隔は、
センターユニット100がコマンドを受け取った後、コ
マンドを実行して再びコマンドの待ち受け状態に復帰す
るまでの所要時間よりも長い間隔とすればよい。また、
同様に、コマンド入出力部4はセンターユニット100
に対して、受け取った認識コードが03であれば、ボリ
ュームアップコマンドを一定間隔で3回出力する(ステ
ップ403)。
ニット100に対して、受け取った認識コードが02で
あれば、ボリュームアップコマンドを一定間隔で2回出
力する(ステップ402)。ここで、ボリュームアップ
コマンドを続けていくつか送信する場合の時間間隔は、
センターユニット100がコマンドを受け取った後、コ
マンドを実行して再びコマンドの待ち受け状態に復帰す
るまでの所要時間よりも長い間隔とすればよい。また、
同様に、コマンド入出力部4はセンターユニット100
に対して、受け取った認識コードが03であれば、ボリ
ュームアップコマンドを一定間隔で3回出力する(ステ
ップ403)。
【0041】〔3−2.ユニットの動作〕そして、上記
のようにコマンド入出力部4からコマンドを受け取った
ユニットは、コマンドの種類や回数などに応じた動作を
行うことによってユーザが命令した制御内容を実現す
る。例えば、上記の例では、ユーザが「ぼりゅーむあっ
ぷ」と発話していたときにはセンターユニット100で
はコマンドを1つ受信する結果(ステップ501)、ボ
リュームが1ステップアップする(ステップ52)。
のようにコマンド入出力部4からコマンドを受け取った
ユニットは、コマンドの種類や回数などに応じた動作を
行うことによってユーザが命令した制御内容を実現す
る。例えば、上記の例では、ユーザが「ぼりゅーむあっ
ぷ」と発話していたときにはセンターユニット100で
はコマンドを1つ受信する結果(ステップ501)、ボ
リュームが1ステップアップする(ステップ52)。
【0042】同様に、センターユニット100では、ユ
ーザが「すこしきこえない」と発話していたときにはコ
マンドを2つ受信する結果(ステップ503)、ボリュ
ームが2ステップアップし(ステップ54)、ユーザが
「ぜんぜんきこえない」と発話していたときにはコマン
ドを3つ受信する結果(ステップ505)、ボリューム
が3ステップアップする(ステップ56)。
ーザが「すこしきこえない」と発話していたときにはコ
マンドを2つ受信する結果(ステップ503)、ボリュ
ームが2ステップアップし(ステップ54)、ユーザが
「ぜんぜんきこえない」と発話していたときにはコマン
ドを3つ受信する結果(ステップ505)、ボリューム
が3ステップアップする(ステップ56)。
【0043】〔3−3.第2実施形態の効果〕このよう
な第2実施形態では、コマンドを制御対象に出力する回
数で操作量を変化させるので、操作量に応じてコマンド
の種類を増やしたり、そのために回路構成を複雑化する
必要がない。特に、制御対象となるユニットが、従来通
りコマンドを1回受信するごとに1ステップずつの操作
量で量的制御を行うタイプのものであっても、そのよう
なユニットをそのまま本発明によって制御できる。この
ため、既存のユニットを有効に活用でき、本発明をさま
ざまな分野に容易に適用することができる。
な第2実施形態では、コマンドを制御対象に出力する回
数で操作量を変化させるので、操作量に応じてコマンド
の種類を増やしたり、そのために回路構成を複雑化する
必要がない。特に、制御対象となるユニットが、従来通
りコマンドを1回受信するごとに1ステップずつの操作
量で量的制御を行うタイプのものであっても、そのよう
なユニットをそのまま本発明によって制御できる。この
ため、既存のユニットを有効に活用でき、本発明をさま
ざまな分野に容易に適用することができる。
【0044】〔4.他の実施形態〕なお、本発明は上記
各実施形態に限定されるものではなく、次に例示するよ
うな他の実施形態も含むものである。例えば、図1や図
2に示した構成は一例に過ぎず、本発明は、カーオーデ
ィオシステム以外の他の種類のシステムを制御するのに
用いることもできる。
各実施形態に限定されるものではなく、次に例示するよ
うな他の実施形態も含むものである。例えば、図1や図
2に示した構成は一例に過ぎず、本発明は、カーオーデ
ィオシステム以外の他の種類のシステムを制御するのに
用いることもできる。
【0045】例えば、本発明は、周辺機器を持つ一般的
なコンピュータ自体やテレビ受像機などを制御するため
に、それら装置の機能として実現することもできる。具
体的には、例えば、表示用モニタの輝度やコントラスト
を本発明によって制御することが考えられる。
なコンピュータ自体やテレビ受像機などを制御するため
に、それら装置の機能として実現することもできる。具
体的には、例えば、表示用モニタの輝度やコントラスト
を本発明によって制御することが考えられる。
【0046】また、本発明をカーオーディオシステムと
組み合わせる場合も、例えば、ナビゲーションユニッ
ト、CDチェンジャ、MDチェンジャなど具体的なユニ
ットの種類は例示に過ぎず、他の種類の音源や他の機能
を持つユニットに自由に置き換えることができる。ま
た、上記各実施形態では音量を制御する例を示したが、
フェイダー、バランス、イコライザの各周波数における
ゲインなどについても、同様に異なった操作量で量的制
御を行うことができる。
組み合わせる場合も、例えば、ナビゲーションユニッ
ト、CDチェンジャ、MDチェンジャなど具体的なユニ
ットの種類は例示に過ぎず、他の種類の音源や他の機能
を持つユニットに自由に置き換えることができる。ま
た、上記各実施形態では音量を制御する例を示したが、
フェイダー、バランス、イコライザの各周波数における
ゲインなどについても、同様に異なった操作量で量的制
御を行うことができる。
【0047】なお、表現の異なる語句ごとの認識用デー
タや異なった操作量を登録する手段は本システムや音声
認識ユニットの一部である必要はなく、これら認識用デ
ータや操作量は予めROMライタでROMに焼き付ける
などしておけばよい。このため、図3のステップ1は本
システムの必須の動作ではなく、同様に、図3のステッ
プ5は音声認識ユニットの必須の動作ではない。また、
上記各実施形態に示した「ぼりゅーむあっぷ」などの語
句や01などの認識コードは例示に過ぎず、どのような
国の言語で語句を定めてもよいし、他のさまざまな量的
制御の語句を自由に用いることができる。また、量的制
御以外の各種の制御、例えば電源やノイズリダクション
のオン/オフなどの制御と量的制御とを同じ装置で実現
することはもちろん差しつかえない。
タや異なった操作量を登録する手段は本システムや音声
認識ユニットの一部である必要はなく、これら認識用デ
ータや操作量は予めROMライタでROMに焼き付ける
などしておけばよい。このため、図3のステップ1は本
システムの必須の動作ではなく、同様に、図3のステッ
プ5は音声認識ユニットの必須の動作ではない。また、
上記各実施形態に示した「ぼりゅーむあっぷ」などの語
句や01などの認識コードは例示に過ぎず、どのような
国の言語で語句を定めてもよいし、他のさまざまな量的
制御の語句を自由に用いることができる。また、量的制
御以外の各種の制御、例えば電源やノイズリダクション
のオン/オフなどの制御と量的制御とを同じ装置で実現
することはもちろん差しつかえない。
【0048】
【発明の効果】以上のように、本発明によれば、発話さ
れた語句の表現内容の違いに応じて操作量が変化するの
で、同じ語句を繰り返して発話する必要がなくなり、操
作性が改善される。
れた語句の表現内容の違いに応じて操作量が変化するの
で、同じ語句を繰り返して発話する必要がなくなり、操
作性が改善される。
【図1】本発明の第1実施形態におけるカーオーディオ
システムの全体構成を示すブロック図。
システムの全体構成を示すブロック図。
【図2】本発明の第1実施形態における音声認識ユニッ
トの構成を示す機能ブロック図。
トの構成を示す機能ブロック図。
【図3】本発明の第1実施形態における処理手順の概略
を示すフローチャート。
を示すフローチャート。
【図4】本発明の第1実施形態において、量的制御に関
する複数のそれぞれ違った表現の語句と、それぞれの語
句に対応する制御内容を登録する処理手順を示すフロー
チャート。
する複数のそれぞれ違った表現の語句と、それぞれの語
句に対応する制御内容を登録する処理手順を示すフロー
チャート。
【図5】本発明の第1実施形態において、音声の入力か
ら制御対象となるユニットの動作に至る処理手順を示す
フローチャート。
ら制御対象となるユニットの動作に至る処理手順を示す
フローチャート。
【図6】本発明の第2実施形態において、音声の入力か
ら制御対象となるユニットの動作に至る処理手順を示す
フローチャート。
ら制御対象となるユニットの動作に至る処理手順を示す
フローチャート。
1…認識辞書 2…音声入力部 3…パターンマッチング部 4…コマンド入出力部 100…センターユニット 101…ナビゲーションユニット 102…CDチェンジャ 103…MDチェンジャ 104…DSPユニット 105…EQユニット 106…音声認識ユニット 108…BUSライン
フロントページの続き (72)発明者 前坂 正巳 東京都文京区白山5丁目35番2号 クラリ オン株式会社内
Claims (8)
- 【請求項1】 認識しようとする語句ごとにそれぞれ特
徴を表す認識用データを格納する手段と、入力される音
声から前記認識用データを用いて語句を認識する手段
と、認識された語句に応じて制御対象を制御する手段
と、を有する音声認識による制御装置において、 前記格納する手段は、量的制御に関して表現の異なる複
数の語句についてそれぞれ認識用データを格納し、 前記制御する手段は、前記複数の語句のうちどれが認識
されたかに応じて、異なった操作量で前記量的制御を行
うように構成されたことを特徴とする音声認識による制
御装置。 - 【請求項2】 前記制御する手段は、前記複数の語句の
うちどれが認識されたかに応じて、量的制御を行うコマ
ンドを、異なった操作量を指定して前記制御対象に対し
て出力することによって、異なった操作量で前記量的制
御を行うように構成されたことを特徴とする請求項1記
載の音声認識による制御装置。 - 【請求項3】 前記制御する手段は、前記複数の語句の
うちどれが認識されたかに応じて、1ステップずつの操
作量で前記量的制御を行うコマンドを、前記制御対象に
対して異なった回数出力することによって、異なった操
作量で前記量的制御を行うように構成されたことを特徴
とする請求項1記載の音声認識による制御装置。 - 【請求項4】 前記量的制御の対象を、カーオーディオ
システムの音量としたことを特徴とする請求項1から3
のいずれか1つに記載の音声認識による制御装置。 - 【請求項5】 認識しようとする語句ごとにそれぞれ特
徴を表す認識用データを格納する手段を用い、入力され
る音声から前記認識用データを用いて語句を認識するス
テップと、認識された語句に応じて制御対象を制御する
ステップと、を含む音声認識による制御方法において、 前記格納する手段に、量的制御に関して表現の異なる複
数の語句についてそれぞれ認識用データを格納してお
き、 前記制御するステップは、前記複数の語句のうちどれが
認識されたかに応じて、異なった操作量で前記量的制御
を行うことを特徴とする音声認識による制御方法。 - 【請求項6】 前記制御するステップは、前記複数の語
句のうちどれが認識されたかに応じて、量的制御を行う
コマンドを、異なった操作量を指定して前記制御対象に
対して出力することによって、異なった操作量で前記量
的制御を行うことを特徴とする請求項5記載の音声認識
による制御方法。 - 【請求項7】 前記制御するステップは、前記複数の語
句のうちどれが認識されたかに応じて、1ステップずつ
の操作量で前記量的制御を行うコマンドを、前記制御対
象に対して異なった回数出力することによって、異なっ
た操作量で前記量的制御を行うことを特徴とする請求項
5記載の音声認識による制御方法。 - 【請求項8】 コンピュータに、認識しようとする語句
ごとにそれぞれ特徴を表す認識用データを格納させてお
き、入力される音声から前記認識用データを用いて語句
を認識させ、認識された語句に応じて制御対象を制御さ
せる、音声認識による制御用プログラムを記録した記録
媒体において、 当該プログラムは、前記コンピュータに、 前記認識用データとして、量的制御に関して表現の異な
る複数の語句についてそれぞれ認識用データを格納させ
ておき、 前記制御対象を制御させる際に、前記複数の語句のうち
どれが認識されたかに応じて、異なった操作量で前記量
的制御を行わせることを特徴とする音声認識による制御
用プログラムを記録した記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10043897A JPH11242497A (ja) | 1998-02-25 | 1998-02-25 | 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10043897A JPH11242497A (ja) | 1998-02-25 | 1998-02-25 | 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH11242497A true JPH11242497A (ja) | 1999-09-07 |
Family
ID=12676508
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10043897A Pending JPH11242497A (ja) | 1998-02-25 | 1998-02-25 | 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH11242497A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005345903A (ja) * | 2004-06-04 | 2005-12-15 | Honda Motor Co Ltd | 音声による機器制御装置 |
| JP2008003474A (ja) * | 2006-06-26 | 2008-01-10 | Funai Electric Co Ltd | 電子機器 |
| WO2019131159A1 (ja) * | 2017-12-27 | 2019-07-04 | ソニー株式会社 | 制御処理装置および制御処理方法、並びにプログラム |
-
1998
- 1998-02-25 JP JP10043897A patent/JPH11242497A/ja active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005345903A (ja) * | 2004-06-04 | 2005-12-15 | Honda Motor Co Ltd | 音声による機器制御装置 |
| JP2008003474A (ja) * | 2006-06-26 | 2008-01-10 | Funai Electric Co Ltd | 電子機器 |
| WO2019131159A1 (ja) * | 2017-12-27 | 2019-07-04 | ソニー株式会社 | 制御処理装置および制御処理方法、並びにプログラム |
| JPWO2019131159A1 (ja) * | 2017-12-27 | 2021-01-14 | ソニー株式会社 | 制御処理装置および制御処理方法、並びにプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5983186A (en) | Voice-activated interactive speech recognition device and method | |
| EP1450349B1 (en) | Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus | |
| US7991618B2 (en) | Method and device for outputting information and/or status messages, using speech | |
| JP4260788B2 (ja) | 音声認識機器制御装置 | |
| CN112185369B (zh) | 一种基于语音控制的音量调节方法、装置、设备和介质 | |
| US6138099A (en) | Automatically updating language models | |
| JP2007226642A (ja) | 音声認識機器制御装置 | |
| CN116643646A (zh) | 自然语言处理装置及自然语言处理方法 | |
| CN116910194A (zh) | 用于处理对话的方法和对话系统 | |
| JP4667085B2 (ja) | 音声対話システム、コンピュータプログラム、対話制御装置及び音声対話方法 | |
| JPH11242497A (ja) | 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体 | |
| CN111508481B (zh) | 语音唤醒模型的训练方法、装置、电子设备及存储介质 | |
| KR20220129366A (ko) | 음성 인식 시스템 및 그 제어 방법 | |
| JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
| JP4659311B2 (ja) | 転送手段を有するスピーチ認識装置 | |
| JP4979336B2 (ja) | 音声出力装置 | |
| JP2003330487A (ja) | 対話エージェント | |
| KR20220150640A (ko) | 차량 및 그의 제어방법 | |
| JP2005024869A (ja) | 音声応答装置 | |
| CN118711597B (zh) | 唤醒词音频的生成方法、装置、设备、介质及程序产品 | |
| JP2004021028A (ja) | 音声対話装置及び音声対話プログラム | |
| JPH11237892A (ja) | 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体 | |
| JPH0130167B2 (ja) | ||
| JP4765394B2 (ja) | 音声対話装置 | |
| JP2010197607A (ja) | 音声認識装置、音声認識方法およびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050222 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070403 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070410 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070807 |