JPS59177599A - 音声登録方式 - Google Patents
音声登録方式Info
- Publication number
- JPS59177599A JPS59177599A JP58053125A JP5312583A JPS59177599A JP S59177599 A JPS59177599 A JP S59177599A JP 58053125 A JP58053125 A JP 58053125A JP 5312583 A JP5312583 A JP 5312583A JP S59177599 A JPS59177599 A JP S59177599A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- recognition unit
- speaker
- unspecified
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
発明の技術分野
本発明は、電話回線等を入力媒体とする宥声認識応答シ
ステムの音声登録方式に関し、特に話者に登録操作を意
識させることなく音声登録を実行しようとするものであ
4゜ 従来技術と問題点 音声認識装置には特定話者を対象とする登録式と不特定
話者を対象とする非登録式とがある。不特定話者を対象
と丈る音声認識装置は、使用する前に音声の登録をする
必要がないために、簡単に使用できる。しかし、人(話
者)によるばらつきを考慮して認識用の辞書を作成しな
くてはならず、そのために辞1等が複雑になって認識対
象単語を増やすことも変更することも難しい。一方、登
録式の音声認識装置では、使用する前に音声を登録する
必要があるが、それをしてしまえば話者によるばらつき
を考慮する必要がないために辞書等が簡単になり認識対
象単語秦ふやしたり変更したりすることが比較的容易に
行える。このように特定式、不特定式にはそれぞれ一長
一短があるので、これら両方の装置を組み合せることで
より柔軟で利用範囲の広いシステムの構成が期待できる
。
ステムの音声登録方式に関し、特に話者に登録操作を意
識させることなく音声登録を実行しようとするものであ
4゜ 従来技術と問題点 音声認識装置には特定話者を対象とする登録式と不特定
話者を対象とする非登録式とがある。不特定話者を対象
と丈る音声認識装置は、使用する前に音声の登録をする
必要がないために、簡単に使用できる。しかし、人(話
者)によるばらつきを考慮して認識用の辞書を作成しな
くてはならず、そのために辞1等が複雑になって認識対
象単語を増やすことも変更することも難しい。一方、登
録式の音声認識装置では、使用する前に音声を登録する
必要があるが、それをしてしまえば話者によるばらつき
を考慮する必要がないために辞書等が簡単になり認識対
象単語秦ふやしたり変更したりすることが比較的容易に
行える。このように特定式、不特定式にはそれぞれ一長
一短があるので、これら両方の装置を組み合せることで
より柔軟で利用範囲の広いシステムの構成が期待できる
。
従来、オーク・エントリ (電話による注文受付等のア
プリケーションで不特定の音声認識を行なおうとする場
合は、予め各商品名を数字等でコード化し、このコート
を話者が発声してこれを装置が811にし、人力すると
いう方法がとられてきた。
プリケーションで不特定の音声認識を行なおうとする場
合は、予め各商品名を数字等でコード化し、このコート
を話者が発声してこれを装置が811にし、人力すると
いう方法がとられてきた。
数字コードを使用したのは、商品名の数が多いことと変
更が頻繁であるために、不特定の音声認識装置では認識
のための多数の商品名に対する辞書を作成することが困
難であったためである。しかし数字コードでは暗記しに
くいので商品名と数字コードの対応表を用意しておいて
、それを見ながら所望商品に対する数字コートを発声す
るなどの処理が必要になり、操作性が悪い。登録式の音
声認識装置を使用すればコードではなく直接商品名での
入力が可能であるが、LRi&に先立って音声の登録が
必要である。また、商品名の数が多いことと変動がある
こ′とを考えると、総ての商品名を登録するこ履は大変
であり、また商品名は普通は一部を使用することが多い
ことを考えると、効率的でもない。更に認識率の点から
も登録数の少ないほうが好ましい。しかし、必要な単語
だけを登録していても、ある単語が登録されているか、
あるいはどの様な読みで登録しであるのかということを
管理するのは大変である。また、新しい単語を使用しよ
うとするたびにその単語を登録処理するのも大変である
。
更が頻繁であるために、不特定の音声認識装置では認識
のための多数の商品名に対する辞書を作成することが困
難であったためである。しかし数字コードでは暗記しに
くいので商品名と数字コードの対応表を用意しておいて
、それを見ながら所望商品に対する数字コートを発声す
るなどの処理が必要になり、操作性が悪い。登録式の音
声認識装置を使用すればコードではなく直接商品名での
入力が可能であるが、LRi&に先立って音声の登録が
必要である。また、商品名の数が多いことと変動がある
こ′とを考えると、総ての商品名を登録するこ履は大変
であり、また商品名は普通は一部を使用することが多い
ことを考えると、効率的でもない。更に認識率の点から
も登録数の少ないほうが好ましい。しかし、必要な単語
だけを登録していても、ある単語が登録されているか、
あるいはどの様な読みで登録しであるのかということを
管理するのは大変である。また、新しい単語を使用しよ
うとするたびにその単語を登録処理するのも大変である
。
発明の目的
本発明は、上述した音声登録に関する話者側の負担を軽
減し、また登録型音声認識システムの能力を必要に応し
て自然に高めてゆこうとするものである。
減し、また登録型音声認識システムの能力を必要に応し
て自然に高めてゆこうとするものである。
発明の構成
本発明は、電話回線等を入力媒体とし、不特定話者を対
象とする音声認識部および特定話者を対象とする登録式
の音声認識部と、出力用の音声合成部とを備える音声認
識応答システムの音声登録方式において、話者が発声し
た音声を蓄えておくハソファを設け、該音声に対する登
録式の音声認識部の認識結果が該話者による確認で否定
された場合には該不特定の音声認識部に切換えて該話者
から該音声が示す単語について該不特定音声認識部で予
め設定したコードの入力を求め、そして該コードによる
入力終了後に該不特定の音声認識部による認識結果と該
バッファ中の音声を該登録式の音声認識部の辞書に登録
することを特徴とするが、以・下図水の実施例を参照し
ながらこれを詳細に説明する。
象とする音声認識部および特定話者を対象とする登録式
の音声認識部と、出力用の音声合成部とを備える音声認
識応答システムの音声登録方式において、話者が発声し
た音声を蓄えておくハソファを設け、該音声に対する登
録式の音声認識部の認識結果が該話者による確認で否定
された場合には該不特定の音声認識部に切換えて該話者
から該音声が示す単語について該不特定音声認識部で予
め設定したコードの入力を求め、そして該コードによる
入力終了後に該不特定の音声認識部による認識結果と該
バッファ中の音声を該登録式の音声認識部の辞書に登録
することを特徴とするが、以・下図水の実施例を参照し
ながらこれを詳細に説明する。
発明の実施例
第1図は本発明の一実施例を示すブロック図で、1は話
者につながる回線、2は網制御側゛ユニット(NCU)
、3は入出力の切替および認識部の切替えを行う切替部
、4は不特定話者を対象とする音声認識部(以下、不特
定認識部という)、5ばその辞書、6は特定話者を対象
とする登録式の音声認識部(以下、特定認識部という)
、7はその辞書メモリ、8は本発明により追加した音声
ハソファ、9は話者に1対し確認、応答用の音声を返送
する音声合成部、10は制御部、11は特定用辞書、■
2はホスト計算機へつながる回線である。
者につながる回線、2は網制御側゛ユニット(NCU)
、3は入出力の切替および認識部の切替えを行う切替部
、4は不特定話者を対象とする音声認識部(以下、不特
定認識部という)、5ばその辞書、6は特定話者を対象
とする登録式の音声認識部(以下、特定認識部という)
、7はその辞書メモリ、8は本発明により追加した音声
ハソファ、9は話者に1対し確認、応答用の音声を返送
する音声合成部、10は制御部、11は特定用辞書、■
2はホスト計算機へつながる回線である。
第一2図はオーダエン1−リシステムの全仏を示す説明
図で、15ば話者(消費者個人、商店係員など)が使用
する電話機、16は電話交−換機、17はポストコンピ
ュータ、そして20が第1図に示した音声認識応答シス
テムである。
図で、15ば話者(消費者個人、商店係員など)が使用
する電話機、16は電話交−換機、17はポストコンピ
ュータ、そして20が第1図に示した音声認識応答シス
テムである。
このオーダ・エントリシステムでは先ず話者に電話で商
品名をその読みの通りまたは任意に略式化した読みで発
声させ、音声応答認識システムでこれを受けて音声ハソ
ファ8に格納し、特定認識部6で認識する。認識に際し
ては特定用辞書11の話者に該当する領域を読出し、こ
れを辞書メモリ7に格納して使用する(話者の識別等は
後述する)。そして、最も近い認識結果を音声合成部9
から返送して話者に確認を求める。このとき肯定されれ
ばその商品名のコードおよび同時に音声入力された数量
などをポスト計算機へ送って注文処理し、然るのち次の
入力にそなえ−るゲ、否定されたときは切替部3によっ
て不特定認識部4へ切替える。不特定認識部4は商品名
をその読みでなく、該商品名に予め割当てられた数字コ
ードの読みとして入力させる。つまり、不特定用辞書5
には予め各商品名に割当てられた数字コートの読めが登
録されているので、話者が希望とする商品名の数字コー
ドを発声することにより認識することかできる。このと
きも音声合成fl139からの音声で1.1#認をとる
が、その結果か肯定されたときは音声バッファ8内の音
声と、そのとき不特定認識部4で使用したコートを特定
用辞書11に登録する。このようにすれば、以後同一話
者が同一商品を注文するときは商品名で入力できる。し
かも、この間話者は一切音声登録ということを意識せず
に済む。
品名をその読みの通りまたは任意に略式化した読みで発
声させ、音声応答認識システムでこれを受けて音声ハソ
ファ8に格納し、特定認識部6で認識する。認識に際し
ては特定用辞書11の話者に該当する領域を読出し、こ
れを辞書メモリ7に格納して使用する(話者の識別等は
後述する)。そして、最も近い認識結果を音声合成部9
から返送して話者に確認を求める。このとき肯定されれ
ばその商品名のコードおよび同時に音声入力された数量
などをポスト計算機へ送って注文処理し、然るのち次の
入力にそなえ−るゲ、否定されたときは切替部3によっ
て不特定認識部4へ切替える。不特定認識部4は商品名
をその読みでなく、該商品名に予め割当てられた数字コ
ードの読みとして入力させる。つまり、不特定用辞書5
には予め各商品名に割当てられた数字コートの読めが登
録されているので、話者が希望とする商品名の数字コー
ドを発声することにより認識することかできる。このと
きも音声合成fl139からの音声で1.1#認をとる
が、その結果か肯定されたときは音声バッファ8内の音
声と、そのとき不特定認識部4で使用したコートを特定
用辞書11に登録する。このようにすれば、以後同一話
者が同一商品を注文するときは商品名で入力できる。し
かも、この間話者は一切音声登録ということを意識せず
に済む。
尚、既に同し単語か登録されている場合には置き換えを
行う。これは電話回線が異なるごとにより同じ発音か異
って認識される場合等に、富に辞書内容を最適化してお
く上で有効である。
行う。これは電話回線が異なるごとにより同じ発音か異
って認識される場合等に、富に辞書内容を最適化してお
く上で有効である。
以下にオレンジ・ジュースを注文する動作例を示す。但
し、装置側にはオレンジ・ジュースにり」応する言葉は
登録されておらず、それに最も近い言葉としてヒール大
瓶に対応する”オオヒール゛という言葉が登録されてい
るものとする。またビール大瓶のコートは121、オレ
ンジ・ジノー−スのコートは111であるものとする。
し、装置側にはオレンジ・ジュースにり」応する言葉は
登録されておらず、それに最も近い言葉としてヒール大
瓶に対応する”オオヒール゛という言葉が登録されてい
るものとする。またビール大瓶のコートは121、オレ
ンジ・ジノー−スのコートは111であるものとする。
以下はコーーザ(話者)と装置とのやりとりである。
ユーザ:゛オレンジ゛(この音声をバッファに蓄える。
また特定用辞書を使って音声
認識する)
装置 −゛商品番号 二、イチ、ニ し−)−1i人瓶
ですね。ピー” ユーザ:゛イイエ” 装置 :パ商品番号をどうそ。ピー”(不特定認識に切
替える) ユーザ:゛イチ゛ 装置 :゛ビー゛ ユーザ二パイチ” 装置 :゛ピー゛ ユーザ二パイチ°゛ 装置 −パ商品番号 イチ、イチ、イナオレンジ・ジュ
ースですね。゛ ユーザ:”ハイ” (このとき、自動的に先の゛オレンジ゛が登録される。
ですね。ピー” ユーザ:゛イイエ” 装置 :パ商品番号をどうそ。ピー”(不特定認識に切
替える) ユーザ:゛イチ゛ 装置 :゛ビー゛ ユーザ二パイチ” 装置 :゛ピー゛ ユーザ二パイチ°゛ 装置 −パ商品番号 イチ、イチ、イナオレンジ・ジュ
ースですね。゛ ユーザ:”ハイ” (このとき、自動的に先の゛オレンジ゛が登録される。
)
以降、登録式の認識装置を使用して、”オレンジ”と発
声すれば、商品番号111のオレンジ・ジュースが認識
されるようになる。
声すれば、商品番号111のオレンジ・ジュースが認識
されるようになる。
オーダエントリにおける注文受付処理は一般Qこ次の様
な手順で行われる。先ず話者は電話機15でダイヤルし
て音声応答認識システム20を呼び出し、自己の加入者
番号を音声によって通知し、更に本人確認用の暗証番号
を通知する。この他にオーダエントりでは注文の他に、
照会、変更等もあるのでこれらを区別するための号−ビ
スコードを通知するのが一般的である。不特定の認識方
式ではこの後商品番号と数量が求められるので、111
05(111の商品を5(固)、15603 C15
6の商品を3個)のように読み」二げ、最後に゛おわり
”と告げる。これで注文は終了したので、今度は装置側
が入力内容を読み上げ確認を求める。
な手順で行われる。先ず話者は電話機15でダイヤルし
て音声応答認識システム20を呼び出し、自己の加入者
番号を音声によって通知し、更に本人確認用の暗証番号
を通知する。この他にオーダエントりでは注文の他に、
照会、変更等もあるのでこれらを区別するための号−ビ
スコードを通知するのが一般的である。不特定の認識方
式ではこの後商品番号と数量が求められるので、111
05(111の商品を5(固)、15603 C15
6の商品を3個)のように読み」二げ、最後に゛おわり
”と告げる。これで注文は終了したので、今度は装置側
が入力内容を読み上げ確認を求める。
そして肯定されればホス1ル計算機側のファイル等に注
文内容を登録するか、次の処理に制御を渡す。
文内容を登録するか、次の処理に制御を渡す。
このようにして商品番号で注文する場合にはユーザ側に
番号と商品名とを関連づける一覧表がある。
番号と商品名とを関連づける一覧表がある。
この表に列記される商品名は1000以上になるので、
その商品老令ての読みを辞書に登録しておくのは大変で
あり、また経年的に扱う商品も変わるのでその都度辞書
内容を変更するのも大変である。従ってへ一般に不特定
用の辞書はコートで多種のしかも稀にしか利用しない商
品を扱い、特定の辞書は少種の頻繁に扱う商品を扱うと
いうことになる。ユーザにとっては勿論、直感的に判別
し易い商品名の読みで入力できる方が都合が良い。
その商品老令ての読みを辞書に登録しておくのは大変で
あり、また経年的に扱う商品も変わるのでその都度辞書
内容を変更するのも大変である。従ってへ一般に不特定
用の辞書はコートで多種のしかも稀にしか利用しない商
品を扱い、特定の辞書は少種の頻繁に扱う商品を扱うと
いうことになる。ユーザにとっては勿論、直感的に判別
し易い商品名の読みで入力できる方が都合が良い。
この点本発明によれば、ユーザにとっては登録式として
扱ってよく、そして登録されていないもの若しくは変更
を要するものは、装置に促かされてコードを入力するこ
とで自動的に登録され、より充実した、ユーザにとって
使用し易いシステムとなって行く。
扱ってよく、そして登録されていないもの若しくは変更
を要するものは、装置に促かされてコードを入力するこ
とで自動的に登録され、より充実した、ユーザにとって
使用し易いシステムとなって行く。
発明の効果
以上述べたように本発明の音声登録方式によれば、ユー
ザが意識することなく音声登録が行われ、次第に入力し
易い音声認識システムになる利点かある。
ザが意識することなく音声登録が行われ、次第に入力し
易い音声認識システムになる利点かある。
第1図および第2図は本発明の一実施例および設置状態
を示すブロック図である。 図中、1は回線、3は切替部、4は不特定認識部、5は
その辞書、6は特定認識部、8は音声ハソファ、9は音
声合成部、11は特定用辞書である。 出願人 富士通株式会社
を示すブロック図である。 図中、1は回線、3は切替部、4は不特定認識部、5は
その辞書、6は特定認識部、8は音声ハソファ、9は音
声合成部、11は特定用辞書である。 出願人 富士通株式会社
Claims (1)
- 電話回線等を入力媒体とし、不特定話者を対象とする音
声認識部および特定話者を対象とする登録式の音声認識
部と、出力用の音声合成部とを備える音声認識応答シス
テムの音声登録方式において、話者が発声した音声を醒
えておくバッファを設け、該音声に対する登録式の音声
認識部の認識結果が該話者による確認で否定された場合
には該不特定め音声認識部に切換えて該話者から該音声
か示す単語について該不特定音声認識部で予め設定した
コードの入力を求め、そして該コードによる入力終了後
に該不特定の音声認識部による認識結果と該バッファー
中の音声を該登録式の音声認識部の辞書に登録すること
を特徴とする音声登録方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58053125A JPS59177599A (ja) | 1983-03-29 | 1983-03-29 | 音声登録方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58053125A JPS59177599A (ja) | 1983-03-29 | 1983-03-29 | 音声登録方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS59177599A true JPS59177599A (ja) | 1984-10-08 |
Family
ID=12934081
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58053125A Pending JPS59177599A (ja) | 1983-03-29 | 1983-03-29 | 音声登録方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS59177599A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS59211099A (ja) * | 1983-05-16 | 1984-11-29 | 富士通株式会社 | 音声認識装置 |
| JPH03157696A (ja) * | 1989-11-16 | 1991-07-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声応答認識方式 |
| JP2000259170A (ja) * | 1999-02-10 | 2000-09-22 | Internatl Business Mach Corp <Ibm> | 音声認識システムにユーザを登録する方法および装置 |
-
1983
- 1983-03-29 JP JP58053125A patent/JPS59177599A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS59211099A (ja) * | 1983-05-16 | 1984-11-29 | 富士通株式会社 | 音声認識装置 |
| JPH03157696A (ja) * | 1989-11-16 | 1991-07-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声応答認識方式 |
| JP2000259170A (ja) * | 1999-02-10 | 2000-09-22 | Internatl Business Mach Corp <Ibm> | 音声認識システムにユーザを登録する方法および装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3561076B2 (ja) | 任意に話された単語の自動通話認識方法 | |
| EP0686297B1 (en) | Voice command control and verification system and method | |
| JP3168033B2 (ja) | 音声テレフォン・ダイヤリング | |
| US5809464A (en) | Apparatus for recording speech for subsequent text generation | |
| US4385359A (en) | Multiple-channel voice input/output system | |
| TW495737B (en) | Verbal utterance rejection using a labeller with grammatical constraints | |
| CA2058644C (en) | Voice activated telephone set | |
| JPS59177599A (ja) | 音声登録方式 | |
| KR0175251B1 (ko) | 문음변환 방식을 이용한 자동 응답 시스템 | |
| JPH04167749A (ja) | 音声応答装置 | |
| JPS59193500A (ja) | 音声認識部の不特定、特定切り換え方式 | |
| JPH0863185A (ja) | 音声認識装置 | |
| JPH09230889A (ja) | 音声認識応答装置 | |
| JP3108121B2 (ja) | 音声認識装置の辞書制御方式 | |
| JP3018759B2 (ja) | 特定話者方式音声認識装置 | |
| AU657064B2 (en) | Speech recognition system | |
| JPS59211099A (ja) | 音声認識装置 | |
| KR100258140B1 (ko) | 음성우편장치의 음성인식 장치 및 방법 | |
| JPH10190842A (ja) | 音声対話システム | |
| JPS59216199A (ja) | 音声認識の不特定/特定切換装置 | |
| JPH0535441A (ja) | 文書自動作成装置 | |
| JPH0256680B2 (ja) | ||
| JP2956631B2 (ja) | ヘルプデスクシステム | |
| JPS59211095A (ja) | 音声登録内容照会機能付音声認識応答装置 | |
| JPS6041863A (ja) | プッシュホン音声入力装置 |