JPS59177599A

JPS59177599A - 音声登録方式

Info

Publication number: JPS59177599A
Application number: JP58053125A
Authority: JP
Inventors: 竹内　亜紀彦
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1983-03-29
Filing date: 1983-03-29
Publication date: 1984-10-08

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】発明の技術分野本発明は、電話回線等を入力媒体とする宥声認識応答シ
ステムの音声登録方式に関し、特に話者に登録操作を意
識させることなく音声登録を実行しようとするものであ
４゜従来技術と問題点音声認識装置には特定話者を対象とする登録式と不特定
話者を対象とする非登録式とがある。不特定話者を対象
と丈る音声認識装置は、使用する前に音声の登録をする
必要がないために、簡単に使用できる。しかし、人（話
者）によるばらつきを考慮して認識用の辞書を作成しな
くてはならず、そのために辞１等が複雑になって認識対
象単語を増やすことも変更することも難しい。一方、登
録式の音声認識装置では、使用する前に音声を登録する
必要があるが、それをしてしまえば話者によるばらつき
を考慮する必要がないために辞書等が簡単になり認識対
象単語秦ふやしたり変更したりすることが比較的容易に
行える。このように特定式、不特定式にはそれぞれ一長
一短があるので、これら両方の装置を組み合せることで
より柔軟で利用範囲の広いシステムの構成が期待できる
。

従来、オーク・エントリ　（電話による注文受付等のア
プリケーションで不特定の音声認識を行なおうとする場
合は、予め各商品名を数字等でコード化し、このコート
を話者が発声してこれを装置が８１１にし、人力すると
いう方法がとられてきた。

数字コードを使用したのは、商品名の数が多いことと変
更が頻繁であるために、不特定の音声認識装置では認識
のための多数の商品名に対する辞書を作成することが困
難であったためである。しかし数字コードでは暗記しに
くいので商品名と数字コードの対応表を用意しておいて
、それを見ながら所望商品に対する数字コートを発声す
るなどの処理が必要になり、操作性が悪い。登録式の音
声認識装置を使用すればコードではなく直接商品名での
入力が可能であるが、ＬＲｉ＆に先立って音声の登録が
必要である。また、商品名の数が多いことと変動がある
こ′とを考えると、総ての商品名を登録するこ履は大変
であり、また商品名は普通は一部を使用することが多い
ことを考えると、効率的でもない。更に認識率の点から
も登録数の少ないほうが好ましい。しかし、必要な単語
だけを登録していても、ある単語が登録されているか、
あるいはどの様な読みで登録しであるのかということを
管理するのは大変である。また、新しい単語を使用しよ
うとするたびにその単語を登録処理するのも大変である
。

発明の目的本発明は、上述した音声登録に関する話者側の負担を軽
減し、また登録型音声認識システムの能力を必要に応し
て自然に高めてゆこうとするものである。

発明の構成本発明は、電話回線等を入力媒体とし、不特定話者を対
象とする音声認識部および特定話者を対象とする登録式
の音声認識部と、出力用の音声合成部とを備える音声認
識応答システムの音声登録方式において、話者が発声し
た音声を蓄えておくハソファを設け、該音声に対する登
録式の音声認識部の認識結果が該話者による確認で否定
された場合には該不特定の音声認識部に切換えて該話者
から該音声が示す単語について該不特定音声認識部で予
め設定したコードの入力を求め、そして該コードによる
入力終了後に該不特定の音声認識部による認識結果と該
バッファ中の音声を該登録式の音声認識部の辞書に登録
することを特徴とするが、以・下図水の実施例を参照し
ながらこれを詳細に説明する。

発明の実施例第１図は本発明の一実施例を示すブロック図で、１は話
者につながる回線、２は網制御側゛ユニット（ＮＣＵ）
、３は入出力の切替および認識部の切替えを行う切替部
、４は不特定話者を対象とする音声認識部（以下、不特
定認識部という）、５ばその辞書、６は特定話者を対象
とする登録式の音声認識部（以下、特定認識部という）
、７はその辞書メモリ、８は本発明により追加した音声
ハソファ、９は話者に１対し確認、応答用の音声を返送
する音声合成部、１０は制御部、１１は特定用辞書、■
２はホスト計算機へつながる回線である。

第一２図はオーダエン１−リシステムの全仏を示す説明
図で、１５ば話者（消費者個人、商店係員など）が使用
する電話機、１６は電話交−換機、１７はポストコンピ
ュータ、そして２０が第１図に示した音声認識応答シス
テムである。

このオーダ・エントリシステムでは先ず話者に電話で商
品名をその読みの通りまたは任意に略式化した読みで発
声させ、音声応答認識システムでこれを受けて音声ハソ
ファ８に格納し、特定認識部６で認識する。認識に際し
ては特定用辞書１１の話者に該当する領域を読出し、こ
れを辞書メモリ７に格納して使用する（話者の識別等は
後述する）。そして、最も近い認識結果を音声合成部９
から返送して話者に確認を求める。このとき肯定されれ
ばその商品名のコードおよび同時に音声入力された数量
などをポスト計算機へ送って注文処理し、然るのち次の
入力にそなえ−るゲ、否定されたときは切替部３によっ
て不特定認識部４へ切替える。不特定認識部４は商品名
をその読みでなく、該商品名に予め割当てられた数字コ
ードの読みとして入力させる。つまり、不特定用辞書５
には予め各商品名に割当てられた数字コートの読めが登
録されているので、話者が希望とする商品名の数字コー
ドを発声することにより認識することかできる。このと
きも音声合成ｆｌ１３９からの音声で１．１＃認をとる
が、その結果か肯定されたときは音声バッファ８内の音
声と、そのとき不特定認識部４で使用したコートを特定
用辞書１１に登録する。このようにすれば、以後同一話
者が同一商品を注文するときは商品名で入力できる。し
かも、この間話者は一切音声登録ということを意識せず
に済む。

尚、既に同し単語か登録されている場合には置き換えを
行う。これは電話回線が異なるごとにより同じ発音か異
って認識される場合等に、富に辞書内容を最適化してお
く上で有効である。

以下にオレンジ・ジュースを注文する動作例を示す。但
し、装置側にはオレンジ・ジュースにり」応する言葉は
登録されておらず、それに最も近い言葉としてヒール大
瓶に対応する”オオヒール゛という言葉が登録されてい
るものとする。またビール大瓶のコートは１２１、オレ
ンジ・ジノー−スのコートは１１１であるものとする。

以下はコーーザ（話者）と装置とのやりとりである。

ユーザ：゛オレンジ゛（この音声をバッファに蓄える。

また特定用辞書を使って音声認識する）装置　−゛商品番号　二、イチ、ニ　し−）−１ｉ人瓶
ですね。ピー” ユーザ：゛イイエ” 装置　：パ商品番号をどうそ。ピー”（不特定認識に切
替える）ユーザ：゛イチ゛装置　：゛ビー゛ユーザ二パイチ” 装置　：゛ピー゛ユーザ二パイチ°゛装置　−パ商品番号　イチ、イチ、イナオレンジ・ジュ
ースですね。゛ユーザ：”ハイ” （このとき、自動的に先の゛オレンジ゛が登録される。

）以降、登録式の認識装置を使用して、”オレンジ”と発
声すれば、商品番号１１１のオレンジ・ジュースが認識
されるようになる。

オーダエントリにおける注文受付処理は一般Ｑこ次の様
な手順で行われる。先ず話者は電話機１５でダイヤルし
て音声応答認識システム２０を呼び出し、自己の加入者
番号を音声によって通知し、更に本人確認用の暗証番号
を通知する。この他にオーダエントりでは注文の他に、
照会、変更等もあるのでこれらを区別するための号−ビ
スコードを通知するのが一般的である。不特定の認識方
式ではこの後商品番号と数量が求められるので、１１１
０５（１１１の商品を５（固）、１５６０３　　Ｃ１５
６の商品を３個）のように読み」二げ、最後に゛おわり
”と告げる。これで注文は終了したので、今度は装置側
が入力内容を読み上げ確認を求める。

そして肯定されればホス１ル計算機側のファイル等に注
文内容を登録するか、次の処理に制御を渡す。

このようにして商品番号で注文する場合にはユーザ側に
番号と商品名とを関連づける一覧表がある。

この表に列記される商品名は１０００以上になるので、
その商品老令ての読みを辞書に登録しておくのは大変で
あり、また経年的に扱う商品も変わるのでその都度辞書
内容を変更するのも大変である。従ってへ一般に不特定
用の辞書はコートで多種のしかも稀にしか利用しない商
品を扱い、特定の辞書は少種の頻繁に扱う商品を扱うと
いうことになる。ユーザにとっては勿論、直感的に判別
し易い商品名の読みで入力できる方が都合が良い。

この点本発明によれば、ユーザにとっては登録式として
扱ってよく、そして登録されていないもの若しくは変更
を要するものは、装置に促かされてコードを入力するこ
とで自動的に登録され、より充実した、ユーザにとって
使用し易いシステムとなって行く。

発明の効果以上述べたように本発明の音声登録方式によれば、ユー
ザが意識することなく音声登録が行われ、次第に入力し
易い音声認識システムになる利点かある。

【図面の簡単な説明】

第１図および第２図は本発明の一実施例および設置状態
を示すブロック図である。図中、１は回線、３は切替部、４は不特定認識部、５は
その辞書、６は特定認識部、８は音声ハソファ、９は音
声合成部、１１は特定用辞書である。出願人　富士通株式会社

Claims

【特許請求の範囲】

電話回線等を入力媒体とし、不特定話者を対象とする音
声認識部および特定話者を対象とする登録式の音声認識
部と、出力用の音声合成部とを備える音声認識応答シス
テムの音声登録方式において、話者が発声した音声を醒
えておくバッファを設け、該音声に対する登録式の音声
認識部の認識結果が該話者による確認で否定された場合
には該不特定め音声認識部に切換えて該話者から該音声
か示す単語について該不特定音声認識部で予め設定した
コードの入力を求め、そして該コードによる入力終了後
に該不特定の音声認識部による認識結果と該バッファー
中の音声を該登録式の音声認識部の辞書に登録すること
を特徴とする音声登録方式。