JPS60247697A - 音声対話装置 - Google Patents

音声対話装置

Info

Publication number
JPS60247697A
JPS60247697A JP59103625A JP10362584A JPS60247697A JP S60247697 A JPS60247697 A JP S60247697A JP 59103625 A JP59103625 A JP 59103625A JP 10362584 A JP10362584 A JP 10362584A JP S60247697 A JPS60247697 A JP S60247697A
Authority
JP
Japan
Prior art keywords
voice
time
response
input
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59103625A
Other languages
English (en)
Other versions
JPH0518118B2 (ja
Inventor
千本 浩之
洋一 竹林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59103625A priority Critical patent/JPS60247697A/ja
Publication of JPS60247697A publication Critical patent/JPS60247697A/ja
Publication of JPH0518118B2 publication Critical patent/JPH0518118B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は音声入力による情報処理システムに用いられる
音声認識応答装置に関する。
〔発明の技術的背景とその問題点〕
近年、音声認識、合成技術の発達が目覚ましく、例えば
連続音%認識や不特定話者を対象とした音声m識が可能
となシ、また一方、精度の高い音声合成が可能となって
いる。
この様な技術を用いて電話公衆回線による各種のサービ
スを行なう電話音声応答サービス、例えは銀行における
預金残高の照会等が關発されておシ、その有用性が注目
されている。ところでこの穐のシステムのユーザは不特
定多数であシ、例えば老人、子供のようにシステムに不
慣れな人もいれば1日に細口も利用する熟練した人もい
る。これにもかかわらず、従来のシステムでは音声応答
の内容(様式)が固定的であり、又ユーザが音声を入力
した時から音声応答が出力されるまでの時間や音声応答
の速度も一定である為、全てのユーザにとって扱い易い
ものとは云えず、人間と機械との対話が円滑になされて
いなかった。例えば電話による銀行の預金残高照会サー
ビスにおいては、ユーザが口座番号「123・・・」を
電話口で音声入力する場合に「ピー」という入力要求信
号音が聞えると先ず「1」と云う。すると10秒程度経
った後に「1」というN認のための音声応答が聞える。
続いてユーザが「2」と云う。・・という様にこの種の
システムに慣れたユーザにとっては応答時間が冗長で苛
立しさが生じたシ、或いは慣れていないユーザにとって
は応答内容が分シ難いという欠点があった。
〔発明の目的〕
本発明の目的は、人間と機械との対話を円滑に行なうこ
とが可能となる音声認識応答装置を提供することにある
〔発明の概要〕
本発明は、音声信号を入力するための入力手段と、この
入力手段より入力された音声信号を音声パターンとして
分析するとともに音声応答信号を検出する音声検出手段
と、この音声検出手段によシ分相された音声パターンを
認識する音声認識手段と、この音声i!識手段より出力
された音声パターンのg識結果に基いて音声応答信号を
出力するとともに音声入力要求信号を出力する音声出力
手段と、この音声出力手段より出力された音声入力要求
信号及び前記音声検出手段よシ出力された音声区間信号
の時間データを測定する測定手段とを備え、前記音声出
力手段は前記測定手段より出力された時間データに基き
音声応答信号を制御して出力することを特徴とするもの
である。
〔発明の効果〕
本発明によれば、各ユーザに応じて適切な応答を与える
ことが可能になる為に、人間と機械の対話を円滑に行う
ことが出来、ユーザにとっては実用性が向上する。
〔発明の実施例〕
以下、図面を参照しながら本発明の実施例について説明
する。
第1図は本発明の第1の実施例の概略構成図、第2図は
音声入力要求Pと音声入力へと音声応答へのタイミング
を模式化した模式図、第3図は本゛発明の第1の実施例
の処理フロー図である。この第1の実施例は音声入力要
求が出力されてからユーザにより音声が入力されるまで
の時間を測定し、その時間に応じて音声応答を制御して
出力するものである。第1図の点線内の各ブロックは音
声認識応答装置を構成し、この入出力は図示しないサー
ビス端末に接続されている。例えはユーザがサービス端
末である電話器よシ所定の電話番号を入力すると受話器
を通して[預金残高照会サービスを行ないます。ピーと
いう信号音が関えたら口座番号を1つずつ順に答えて下
さい」という応答が音声応答出力部7よシ送られる。こ
の時点からの音声入力と応答のヤシとシに本発明が適用
される。
先ず第1図の音声入力開始要求s8より音声入力要求信
号Pが図示しない端末へ出力されるが、これは同時にタ
イミング測定部3にも送られる(第3図ステップ11)
。タイミング測定部3はこの音声入力要求信号Pを入力
した時点を測定する。ユーザ側では音声入力要求信号で
ある「ピー」という信号音を聞く゛と、「1」という音
声を受話器よシ入力する(第3図ステップ12)。この
入力音声鳥は分析器1に入力されるとA/D変換、スペ
クトル分析処理などが行なわれて、入力された音声信号
が特徴パラメータの系列(音声)くターン)に変換され
る(第3図ステップ13)。音声区間検出部2では、分
析器1よシ出力された特徴ノくラメータ系列(音声パタ
ーン)のエネルギー情報を利用して音声パターン中の始
端と終端を検出し音声区間を切シ出すものである(第3
図ステップ14)。この音声区間検出部は音声パターン
の始端、終端を検出した時点でその始端信号、終端信号
を各々タイミング測定部3へ送る。タイミング測定部3
ではこの始端信号を入力した時点を測定すると共に、先
程の音声入力要求信号Pを入力した時点から始端信号を
入力した時点までの時間T、を計算する(第2図TI+
第3図ステップ15)。一方、音声区間検出部2は切シ
出した音声パターン(特徴パラメータ系列)を音声認識
部4へ送る。音声認識部4では入力した音声パターンに
対して予め辞書メモリー5に登録された音声辞書を利用
してその認識を行なうものである(第3図ステップ16
 ’)。この認識は例えば類似度計算法によって行われ
る。この音声認識部4による音声パターンの認識結果は
タイミング測定部3により計算されたT1と共に音声応
答制御部6へ送られる。この音声応答制御部6はT、の
長さに基いて(第3図ステップ17 )音声応答鳥を制
御して出力するものであるが、この制御の方法には以下
の3通シがある。
(1)音声応答制御部6はタイミング測定部3よシT1
と共に終端信号を入力した時点データを入力する。そし
て音声応答制御部6はT1の長さに応じて終端信号の入
力時点から音声応@鳥を出力する時点までの時間Tll
 (第2図’rs)の長さを可変制御する。つまDTt
が予め定められた時間長より短い場合は、ユーザが「ビ
ー」という信号音が聞えるとただちに音声を発声したこ
とになり、ユーザがシステムに熟線しているか又は急い
でいるものと思われる。このため応答音声も早めに端末
へ出力する必要が有シ(第3図ステップ18)、T3の
時間長を既定の長さよシ短くする。又、T1が予め定め
られた時間長より長い場合は、ユーザが「ビー」という
信号音が聞こえた後、かなシ経りてから音声を発声した
ことになシ、ユーザがシステムに慣れていないか又は時
間的に余裕があるものと思われる。このため応答音声も
遅めに端末へ出力する必要が有り(第3図ステップ19
)、T3の時間長を既定の長さより長くする。
叩 音声応答制御部6はT、の長さに応じて音声応答−
を出力する時間(応答速度)を可変制御する(第2図T
4)。つまりTIが予め定められた時間長より短い場合
は上述の理由によシ応答速度を速くして音声応答鳥を出
力する。T、が予め定められた時間長より長い場合は上
述の理由により応答速度を遅くして鳥を出力する。この
際に、規則合成方式によって音声応答4が出力される場
合には、規則合成の為の種々のパラメータ(アクセント
ピッチ等)の速度を制御する。また録音編集方式によっ
てR2が出力される場合には、予め録音された発話速度
の異なる単語や音声素片を選択する様にして応答速度を
制御する。
(m) 音声応答制御部6はT1の長さに応じて音声応
答鳥の内容(表現形式)を制御する(第2図鳥)。
例えばユーザが発信音「ビー」が聞えてから「1」と発
声したものとすると、これに対する確認のための音声応
答鳥を出力する場合に、T1の長さが予め定められた時
間長よりも短い場合には上述した理由によシ「1」とい
り応答を出力する。T1が予め定められた時間よシ長い
場合には上述した理由によシ「1ですね、分シました。
」という応答を出力する。つtb音声応答制御部6は入
力された音声パターンの認識結果として「1」を音声認
識部4よシ受は取るが、「1」という確認のための音声
応答の表現形式を変えて出力するものである。
ζうして(l l (II l (iii)によってT
s I T41 R1の制御方法が決定されると(第3
図ステップ20)、音声応答出力部7は音声応答制御部
6の指示により音声応答4を出力する(第3図ステップ
21 )。
この様に構成された本実施例では、第2図の模式図に示
すように入力要求信号Pから音声入力鵬までの時間T、
に応じて、音声入力−から音声応答鳥までの時間T3を
変化させたり、音声応答への応答時間T4を変化させた
シ、音声応答への表現形式を変化させるので、システム
の使用法に慣れているユーザや、急いでいるユーザには
応答までの時間を短くしたシ応答を早口にしたシ、内容
を簡潔にしたり出来、システムの使用法に慣れていない
ユーザや時間的に余裕のあるユーザには、応答までの時
間を長くしたり、応答をゆっくりした口調にしたり、内
容を丁寧にすることが出来る。又、上述した音声応答制
御部による(i ) (if) (iii)の制御を個
々に行わずに組合せて行なうことも可能である。
こうすることによシ人間と機械との対話の円滑化を図る
ことが出来る。
次に本発明の第2の実施例について図面を参照して説明
する。第4図は本発明の第2の実施例の概略構成図、第
す図は第2の実施例の処理フロー図である。第2の実施
例は第2図に示されるように入力要求信号から音声入力
開始までの時間T1と音声人力R,の発声時間T2とを
検出して音声応答への出力を制御するようにしたもので
ある。第4図に示す構成は、第1図の構成と比較して、
分析部1、音声区間検出部2、タイミング測定部3、音
声認識部4、辞書メモリ5、音声応答制御部6、音声応
答出力部7、音声入力開始要求部8は同じものであシ、
これらに発話時間測定部9を付加したものである。つま
シ音声区間検出部2は入力された音声パターンの始端、
終端を検出した時点でこれらの始端信号、終端信号を各
々タイミング測定部3へ送ると共に発話時間測定部9へ
も送る。
発話時間測定部9では始端信号を入力した時点から終端
信号を入力した時点までの時間T、をめる(第5図ステ
ップ22)。音声応答制御部6ではタイミング測定部3
によ請求められたT1と発話時間測定部9によ請求めら
れたT2を入力する。音声応答制御部6ではとのT2を
予め定められた時間長と比較しく第5図ステップ23)
その結果、及び上述したT、の時間長の比較結果に応じ
て音声応答の出力を制御する。すなわち発声時間T2が
予め定められた時間長より短い場合は、ユーザがシステ
ムに慣れているか急いでいる為に早口で発声したものと
見なし上述した様に第2図に示す時間T3 + T4を
短くしたり音声応答鳥の内容を簡潔なものとする(第5
図ステップ24)。T、が予め定められた時間長より長
い場合は、ユーザがシステムに慣れていないか時間的に
余裕がある為にゆつ〈シと遅日で発声したものと見なし
、第2図に示す時間T、 、 T。
を長くしたり音声応答−の内容を丁寧なものとする(第
5図ステップ25)。
この様に第2の実施例によれば、第2図に示す時間TI
とT!を測定しこの結果に対応して音声応答鳥の出力を
制御するので、第1の実施例に比べて更にユーザの性格
や発声の時の情況を良く反映させた応答が可能となる為
に、ユーザと機械の対話の自然性をよシ一層高めること
が出来る。
上述した第1.第2の実施例においては、音声入力開始
要求信号Pが音声入力開始要求部8より出力されるもの
としたが、これを音声応答出力部1より出力させ、更に
応答音声と入力要求音声を連続して出力させることも出
来る。つまりユーザからの発声と機械からの応答を次々
と連続させて行なうものである(第5図フローの点線)
。第6図は入力要求を含んだ応答音声と入力音声のタイ
ミングを模式化した模式図である。この図において、R
o、R−i、R4,Reは各入力要求を含んだ応答音声
、”+ 、 ’% 、 Rsはユーザからの入力音声で
ある。例えば上述した残高照会サービスにおいて、RO
r口座番号の数字を1つずつ順に御願いします」Th+
rx」 −「1ですね。分9ました。次の番号を御願いします」
Br2J というものである。この様に応答の出力方法を変形させ
た場合にも、第2の実施例と同様に、応答音声から入力
音声までの時間T3.Tll、T0、入力音声の発話時
間T2 + T6 + T10を測定することにより、
入力音声から応答音声までの時間T8 + T7 + 
T11 、応答音声の発話時間T2 + T6 + T
lG + TI2 、応答音声の内容RO、Rt 、R
4,”6を変化させることが出来る。上述した実施例を
この様に変形することにより音声入力と応答がスピーデ
ィに行なわれ、更に回線使用のコストが削減でき、経済
的価値が絶大となる。
同、本発明は上記実施例に限定されるものではない。例
えばタイミング測定部が時間T1とT、の両方を測定し
てもよい。又、入力要求信号から入力音声までの時間の
履歴の惰報、すなわち細口かの時間測定を行なってユー
ザの性格をはつきシと検出できた後に応答出力を変化さ
せてもよい。更に発話時間測定は発話速度測定でもよい
し応答出力として音声だけではな(CRT、プリンタ等
を利用して行ってもよい。入力音声の認識処理や音声合
成の方法は従来よシ知られた種々の方式を適宜採用すれ
ばよい。要するに本発明はその要旨を逸脱しない範囲で
種々変形して実施することができる。
【図面の簡単な説明】
第1図は本発明の第1の実施例の概略構成図、第2図は
入力要求と入力音声及び応答音声のタイミングの模式図
、第3図は第1の実施例の処理フロー図、第4図は本発
明の第2の実施例の概略構成図、第5図は第2の実施例
の処理フロー図、第6図は会話型の連続入力応答形式の
タイミングの模式図である。 1 ・分析部 2・音声区間検出部 3・・タイミング測定部 4・・音声認識部5 辞書メ
モリ 6・・音声応答制御部7・・音声応答出力部 8
.音声入力開始要求部9・・発話時間測定部 代理人 弁理士 則 近 憲 佑 (ほか1名)第1図 第2図 第3図 第4図 第6図

Claims (1)

  1. 【特許請求の範囲】 (1ン 音声信号を入力するための入力手段と、この入
    力手段よシ入力された音声信号を音声バメーンとして分
    析するとともに音声区間信号を検出する音声検出手段と
    、この音声検出手段により分析された音声パターンを認
    識する音声認識手段と、この音声認識手段より出力され
    た音声パターンの認識結果に基いて音声応答装置を出力
    するとともに音声入力要求信号を出力する音声出力手段
    と、この音声出力手段よシ出力された音声入力要求信号
    を入力した時点から前記音声検出手段よシ出力された音
    声区間信号の始端信号を入力した時点までの時間、前記
    音声検出手段よシ出力された音声区間信号の始端信号を
    入力した時点から終端信号を入力した時点までの時間の
    いずれか又は両方を測定する測定手段とを備え、前記音
    声出力手段社前記測定手段より出力された測定結果に基
    いて音声応答信号の発生態様を変化させて出力すること
    を特徴とする音声認識応答装置。 (2)音声応答信号の発生態様は、音声応答の内容、音
    声応答信号の出力時間、前記測定手段が音声区間信号の
    終端信号を入力した時点から前記音声出力手段が音声応
    答信号を出力する時点までの時間のいずれか又は複数で
    ある特許請求の範囲第1項記載の音声g識応答装置。
JP59103625A 1984-05-24 1984-05-24 音声対話装置 Granted JPS60247697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59103625A JPS60247697A (ja) 1984-05-24 1984-05-24 音声対話装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59103625A JPS60247697A (ja) 1984-05-24 1984-05-24 音声対話装置

Publications (2)

Publication Number Publication Date
JPS60247697A true JPS60247697A (ja) 1985-12-07
JPH0518118B2 JPH0518118B2 (ja) 1993-03-11

Family

ID=14358948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59103625A Granted JPS60247697A (ja) 1984-05-24 1984-05-24 音声対話装置

Country Status (1)

Country Link
JP (1) JPS60247697A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219582A (ja) * 1994-01-28 1995-08-18 Fujitsu Ten Ltd 車載用音声認識装置
JPH10111697A (ja) * 1996-10-04 1998-04-28 Matsushita Electric Ind Co Ltd 音声反応装置と音声認識装置
JPH11175082A (ja) * 1997-12-10 1999-07-02 Toshiba Corp 音声対話装置及び音声対話用音声合成方法
JPH11224095A (ja) * 1998-02-06 1999-08-17 Fujitsu Ten Ltd 音声再生システム
JP2000347690A (ja) * 1999-06-04 2000-12-15 Nec Corp マルチモーダル対話装置
JP2001053835A (ja) * 1999-05-28 2001-02-23 Sanyo Electric Co Ltd 話速変換装置を備えた通話装置
WO2011036762A1 (ja) * 2009-09-25 2011-03-31 株式会社東芝 音声対話装置およびプログラム
JP2015069139A (ja) * 2013-09-30 2015-04-13 ヤマハ株式会社 音声合成装置およびプログラム
JP2017106988A (ja) * 2015-12-07 2017-06-15 ヤマハ株式会社 音声対話装置およびプログラム
WO2018034169A1 (ja) * 2016-08-17 2018-02-22 ソニー株式会社 対話制御装置および方法
US10490181B2 (en) 2013-05-31 2019-11-26 Yamaha Corporation Technology for responding to remarks using speech synthesis
JP2021060464A (ja) * 2019-10-03 2021-04-15 日産自動車株式会社 音声対話装置、音声対話用学習済みモデル、及び音声対話方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8407051B2 (en) * 2007-07-02 2013-03-26 Mitsubishi Electric Corporation Speech recognizing apparatus

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55153996A (en) * 1979-05-17 1980-12-01 Sharp Kk Voice output type electronic device
JPS58159596A (ja) * 1982-03-02 1983-09-21 富士通株式会社 音声応答装置
JPS58195950A (ja) * 1982-05-11 1983-11-15 Casio Comput Co Ltd 音声によるオペレ−タガイダンス制御方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55153996A (en) * 1979-05-17 1980-12-01 Sharp Kk Voice output type electronic device
JPS58159596A (ja) * 1982-03-02 1983-09-21 富士通株式会社 音声応答装置
JPS58195950A (ja) * 1982-05-11 1983-11-15 Casio Comput Co Ltd 音声によるオペレ−タガイダンス制御方式

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219582A (ja) * 1994-01-28 1995-08-18 Fujitsu Ten Ltd 車載用音声認識装置
JPH10111697A (ja) * 1996-10-04 1998-04-28 Matsushita Electric Ind Co Ltd 音声反応装置と音声認識装置
JPH11175082A (ja) * 1997-12-10 1999-07-02 Toshiba Corp 音声対話装置及び音声対話用音声合成方法
JPH11224095A (ja) * 1998-02-06 1999-08-17 Fujitsu Ten Ltd 音声再生システム
JP2001053835A (ja) * 1999-05-28 2001-02-23 Sanyo Electric Co Ltd 話速変換装置を備えた通話装置
JP2000347690A (ja) * 1999-06-04 2000-12-15 Nec Corp マルチモーダル対話装置
JP5380543B2 (ja) * 2009-09-25 2014-01-08 株式会社東芝 音声対話装置およびプログラム
US8571874B2 (en) 2009-09-25 2013-10-29 Kabushiki Kaisha Toshiba Speech interactive apparatus and computer program product using output prompts and user responses
WO2011036762A1 (ja) * 2009-09-25 2011-03-31 株式会社東芝 音声対話装置およびプログラム
US10490181B2 (en) 2013-05-31 2019-11-26 Yamaha Corporation Technology for responding to remarks using speech synthesis
JP2015069139A (ja) * 2013-09-30 2015-04-13 ヤマハ株式会社 音声合成装置およびプログラム
JP2017106988A (ja) * 2015-12-07 2017-06-15 ヤマハ株式会社 音声対話装置およびプログラム
WO2018034169A1 (ja) * 2016-08-17 2018-02-22 ソニー株式会社 対話制御装置および方法
JPWO2018034169A1 (ja) * 2016-08-17 2019-06-13 ソニー株式会社 対話制御装置および方法
US11183170B2 (en) 2016-08-17 2021-11-23 Sony Corporation Interaction control apparatus and method
JP2021060464A (ja) * 2019-10-03 2021-04-15 日産自動車株式会社 音声対話装置、音声対話用学習済みモデル、及び音声対話方法

Also Published As

Publication number Publication date
JPH0518118B2 (ja) 1993-03-11

Similar Documents

Publication Publication Date Title
US12300216B2 (en) End-to-end speech conversion
JP3674990B2 (ja) 音声認識対話装置および音声認識対話処理方法
US7490042B2 (en) Methods and apparatus for adapting output speech in accordance with context of communication
US6941269B1 (en) Method and system for providing automated audible backchannel responses
JPH02242298A (ja) 声門波形に基づく話者識別装置
JPS60247697A (ja) 音声対話装置
CN107077840A (zh) 语音合成装置和方法
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
US7092884B2 (en) Method of nonvisual enrollment for speech recognition
JPS6257040B2 (ja)
JP2734028B2 (ja) 音声収録装置
JP2656234B2 (ja) 会話音声理解方法
JPS6250850B2 (ja)
JPH02103599A (ja) 音声認識装置
JP2599974B2 (ja) 音声検出方式
JPH08211888A (ja) 音声認識における環境適応方法及び環境適応形音声認識装置
KR100460411B1 (ko) 목소리 신호의 억양조절에 의한 부드러운 소리의 전화기방식
JPS63259689A (ja) 音声認識応答装置
JPS60188998A (ja) 音声認識装置
JPS60241096A (ja) 音声情報入出力装置
JPH0381160B2 (ja)
JPS5842097A (ja) 音声認識方式
JPH02162399A (ja) 音声認識装置
JPS58130397A (ja) 音声認識制御方式
KR20030016199A (ko) 음성신호의 발성변환 처리에 의한 소프트사운드 기능의헤드폰