JPH08340378A

JPH08340378A - 音声ダイヤル装置および音声発信処理方法

Info

Publication number: JPH08340378A
Application number: JP7147227A
Authority: JP
Inventors: Tadamichi Tokuda; 肇道徳田
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1995-06-14
Filing date: 1995-06-14
Publication date: 1996-12-24

Abstract

(57)【要約】【目的】音声発信に際しＩＤ番号のキー入力を必要と
せず、登録話者のプライバシーが侵害されない音声ダイ
ヤル装置を提供することを目的とする。【構成】音声信号を入力してデジタル値に変換する音
声信号入力手段２１と、フレーム分割と各フレームの音
声特徴量の算出とを行なう音声特徴抽出手段２２と、発
信先データの登録と認識とを制御する登録・認識処理制
御手段２３と、各話者の登録パスワードデータを格納す
るパスワードデータ格納部４１と、各話者の登録発信先
データを話者別にラベルを付けて格納する発信先データ
格納部４２と、入力された音声の特徴量と登録されたパ
スワードデータ群又は発信先データ群との類似度を計算
し、最も類似したパスワードデータ又は発信先データを
出力する音声認識処理手段２４と、最も類似した発信先
データと登録された発信先番号とを照らし合わせてＰＢ
Ｘに発信を要求する発信処理手段２５とを備える。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、話者が登録した音声デ
ータをもとに音声発信を可能にする音声ダイヤル装置お
よび音声発信処理方法に関する。

【０００２】

【従来の技術】近年、音声発信によるダイヤル方式が広
がりつつある。この音声発信のダイヤルを行なう音声ダ
イヤル装置を複数の人間が利用する場合、全ての話者の
発信先登録データを同一に取り扱うと、不特定話者を認
識処理する負担が増加し、誤認識が増加する。これを回
避するためには、各話者が登録したデータを個別に管理
する必要がある。つまり、各話者の登録データを話者Ｉ
Ｄ番号で区分し、各話者は自分専用の発信先データファ
イルにより発信先の登録と認識処理を行なう。この場
合、話者は、発信先の登録時および音声認識による発信
時に、自分専用の発信先データファイルを指定する必要
がある。この指定方法としては、各話者それぞれにＩＤ
番号を設定しておき、話者が自分でそのＩＤ番号をキー
入力する方法が一般的である。

【０００３】

【発明が解決しようとする課題】しかしながら、上記音
声ダイヤル装置では、自分専用の発信先データファイル
を指定する時、つまり発信先の登録時および音声認識に
よる発信時に、毎回自分のパスワードであるＩＤ番号を
キー入力する必要があり、これにより操作性が低下する
という問題点があった。また、話者がキー入力に不慣れ
な場合には操作ミスする可能性が高く、この場合には操
作ミス修復のため操作に要する時間が余計にかかるとい
う問題点があった。さらに、複数の話者が使用する場
合、ＩＤ番号自体には何ら特徴がないため、外部の人間
が音声ダイヤル機能を悪用して登録されている発信先の
情報を得ることにより、登録話者のプライバシーが侵害
される可能性があるという問題点があった。

【０００４】本発明は上記従来の問題点を解決するもの
で、音声発信に際してＩＤ番号のキー入力を必要とせ
ず、また、登録話者のプライバシーが侵害される可能性
がない音声ダイヤル装置、および音声発信に際してＩＤ
番号のキー入力を必要とせず、また、登録話者のプライ
バシーが侵害される可能性がない音声発信処理方法を提
供することを目的とする。

【０００５】

【課題を解決するための手段】この目的を達成するため
に本発明の請求項１記載の音声ダイヤル装置は、音声信
号を入力してデジタル値に変換する音声信号入力手段
と、フレーム分割と各フレームの音声特徴量の算出とを
行なう音声特徴抽出手段と、発信先データの登録と認識
とを制御する登録・認識処理制御手段と、各話者が登録
したパスワードデータを格納するパスワードデータ格納
部と、各話者が登録した発信先データを話者別にラベル
を付けて格納する発信先データ格納部と、入力された音
声の特徴量と登録されたパスワードデータ群又は発信先
データ群との類似度を計算し、最も類似したパスワード
データ又は発信先データを出力する音声認識処理手段
と、最も類似した発信先データと登録された発信先番号
とを照らし合わせてＰＢＸに発信を要求する発信処理手
段とを備えた構成を有している。

【０００６】請求項２記載の音声ダイヤル装置は、請求
項１記載の音声ダイヤル装置において、登録・認識処理
制御手段が、登録されていないパスワードを発声した話
者の音声ダイヤル機能の利用を禁止すると共にその話者
の音声発信処理を中止する構成を有している。

【０００７】請求項３記載の音声発信処理方法は、話者
が発声したパスワードと登録されているパスワードとの
類似度を算出する第１の音声認識処理工程と、話者のパ
スワードが登録されているか否かを判定する登録判定工
程と、話者が発声した発信先名称と登録されている発信
先データとの類似度を算出する第２の音声認識処理工程
と、発信先名称と発信先データとの類似度の算出結果に
基づき電話番号を決定する電話番号判定工程と、決定さ
れた電話番号を発信処理する発信処理工程とを有する構
成としている。

【０００８】

【作用】上記構成によって、話者はＩＤ番号をキー入力
する必要が無くなるので、操作性が向上し、発信先の登
録時および音声認識時の操作に必要な時間が短縮され
る。また、登録されていないパスワードが発声された場
合には音声ダイヤル機能の利用を禁止するようにしたの
で、正規に登録された各話者のプライバシーを保護する
ことができる。

【０００９】

【実施例】以下、本発明の一実施例について図を用いて
説明する。

【００１０】図２は本発明の一実施例に係る音声ダイヤ
ル装置を示す装置ブロック図である。図２において、１
は音声を入力して音声信号を出力するマイク、２は装置
全体を制御するＣＰＵ、３はＲＯＭ（読出し専用メモ
リ）、４はＲＡＭ（書込み可能メモリ）、５は外線又は
内線との間で通話を行なうためのＰＢＸ装置である。な
おＰＢＸ装置は本実施例に係る音声ダイヤル装置には含
まれない。

【００１１】図１は、図２のＣＰＵ２における機能実現
手段を示す機能ブロック図である。図１において、１は
音声を入力して音声信号を出力するマイク、２１は音声
信号を入力してデジタル値に変換する音声信号入力手
段、２２はフレーム分割と各フレームの音声特徴量の算
出とを行なう音声特徴抽出手段、２３は発信先データの
登録と認識とを制御する登録・認識処理制御手段、２４
は入力された音声の特徴量と登録されたパスワードデー
タ群又は発信先データ群との類似度を計算し、最も類似
したパスワードデータ又は発信先データを出力する音声
認識処理手段、２５は最も類似した発信先データと登録
された発信先番号とを照らし合わせてＰＢＸ装置５に発
信を要求する発信処理手段、４１は各話者が登録したパ
スワードデータを格納するパスワードデータ格納部、４
２は各話者が登録した発信先データを話者別にラベルを
付けて格納する発信先データ格納部である。

【００１２】ここで、図１と図２との対応について説明
すると、手段２１〜２５はＣＰＵ２における機能実現手
段であり、ＲＯＭ２格納のプログラムに基づいて動作す
る。また格納部４１、４２はＲＡＭ４に対応する。

【００１３】以上のように構成された音声ダイヤル装置
について、図３〜図５を用いてその動作を説明する。

【００１４】図３は新しい話者のためのパスワード登録
処理の動作を示すフローチャートである。始めに話者が
パスワード登録キーを押下すると、登録・認識制御手段
２３はパスワード登録処理を開始し（Ｓ１）、パスワー
ドデータ格納部４１から全話者共通のパスワードデータ
ファイルを登録・認識制御手段２３にロードさせる（Ｓ
２）。次に、話者が登録したいパスワードを発声する
と、この音声はマイク１を介して音声信号入力手段２１
に取り込まれ、手段２１でデジタル信号に変換された
後、音声特徴抽出手段２２に入力される（Ｓ３）。音声
特徴抽出手段２２は、入力された音声信号の特徴量デー
タ（音声特徴量データ）を算出する（Ｓ４）。登録・認
識制御手段２３は上記パスワードを表示装置（図示しな
い）に表示し（Ｓ５）、あるいは図示しないスピーカか
ら音声として出力し、上記表示あるいは音声により話者
はパスワードが正しく入力されたか否かを判定する（Ｓ
６）。パスワードが正しく入力されていない場合には話
者は「やり直しキー」を押下し、これにより登録・認識
制御手段２３はパスワードが正しく入力されていないと
判定して処理をステップ３に戻す。パスワードが正しく
入力されている場合には話者は「確認キー」を押下し、
これにより登録・認識制御手段２３はパスワードが正し
く入力されていると判定してステップ７へ移行する。ス
テップ７において、登録・認識制御手段２３は、ステッ
プ４で算出された音声特徴量データをステップ２でロー
ドした全話者共通のパスワードデータファイルに登録
し、このファイルをパスワードデータ格納部４１に格納
することにより保存する。次に、登録・認識制御手段２
３は、新しい話者のパスワードにリンクした話者別の発
信先データファイルを発信先データ格納部４２に作成す
る。

【００１５】このようにして新しい話者のパスワードが
登録され、そのパスワードにリンクした話者別発信先デ
ータファイルが作成される。

【００１６】図４は発信先登録処理の動作を示すフロー
チャートである。始めに話者が発信先登録キーを押下す
ると、登録・認識制御手段２３は発信先登録処理を開始
する（Ｓ１１）。次に、話者が自分のパスワードを発声
すると、この音声はマイク１を介して音声信号入力手段
２１に取り込まれ、手段２１でデジタル信号に変換され
た後、音声特徴抽出手段２２に入力される（Ｓ１２）。
音声特徴抽出手段２２は、入力された音声信号の特徴量
データ（音声特徴量データ）を算出する（Ｓ１３）。登
録・認識制御手段２３は音声特徴抽出手段２２で算出し
た音声特徴量データを音声認識処理手段２４に送り、手
段２４は格納部４１に登録されている全話者のパスワー
ドの音声特徴量データ群（以下、「パスワードデータ
群」という）と音声特徴抽出手段２２で算出した音声特
徴量データとの類似度を算出する（Ｓ１４）。次に、登
録・認識制御手段２３は音声認識処理手段２４で算出さ
れた類似度に基づいて該当するパスワードが登録されて
いるか否かを判定する（Ｓ１５）。規定値以上の類似度
を与えるパスワードがあれば、該当するパスワードが登
録されていると判定してステップ１６へ移行するが、該
当するパスワードが登録されていないと判定したときに
はステップ１２に戻り、パスワードの発声からやり直
す。ステップ１６においては、上記該当するパスワード
に対応する発信先データファイルが格納部４２から登録
・認識制御手段２３にロードされる。次に、話者は登録
したい発信先名称を発声し、この音声はマイク１を介し
て音声信号入力手段２１に取り込まれ、手段２１でデジ
タル信号に変換された後、音声特徴抽出手段２２に入力
される（Ｓ１７）。音声特徴抽出手段２２は、入力され
た音声信号の特徴量データ（音声特徴量データ）を算出
する（Ｓ１８）。音声特徴抽出手段２２で算出した音声
特徴量データは、上記ロードされた発信先データファイ
ルに登録され、この発信先データファイルを発信先デー
タ格納部４２に格納することにより保持される（Ｓ１
９）。次に、話者が電話番号を電話端末の数字キーによ
り入力すると、登録・認識制御手段２３は電話番号であ
ると認識し（Ｓ２０）、その電話番号を格納部４２の発
信先データファイルに登録する（Ｓ２１）。なお、本処
理動作において、ステップ２０で、電話番号を電話端末
の数字キーにより入力することにより登録するとした
が、これは、話者が電話番号を発声し、この電話番号を
音声認識処理手段２４において不特定話者の数字音声認
識処理により認識することにより登録することもでき
る。

【００１７】このようにして話者の発信先データ（発信
先名称を示すデータ）が登録され、その発信先名称に対
応する電話番号が登録される。

【００１８】図６は図３の処理によって登録されるパス
ワードデータファイルの例を示すファイル図、図７は図
４の処理によって登録される発信先データファイルの例
を示すファイル図である。例えば話者ＩＤがＮｏ．１で
ある話者のパスワードは図６に示すように「おんせい」
であり、そのパスワードにリンクする発信先データファ
イルには発信先名称として「とくだ」、「たなか」、
「いとう」が登録され、また、それぞれの電話番号が登
録されている。

【００１９】図５は音声による発信処理（音声発信処
理）の動作を示すフローチャートである。始めに、話者
が発信キーを押下すると、登録・認識制御手段２３は音
声発信処理を開始する（Ｓ３１）。次に、話者が自分の
パスワードを発声すると、この音声はマイク１を介して
音声信号入力手段２１に取り込まれ、手段２１でデジタ
ル信号に変換された後、音声特徴抽出手段２２に入力さ
れ、音声特徴抽出手段２２は、入力された音声信号の特
徴量データ（音声特徴量データ）を算出する（Ｓ３
２）。登録・認識制御手段２３は音声特徴抽出手段２２
で算出した音声特徴量データを音声認識処理手段２４に
送り、手段２４は格納部４１に登録されている全話者の
パスワードデータ群と音声特徴抽出手段２２で算出した
音声特徴量データとの類似度を算出する（Ｓ３３、第１
の音声認識処理工程）。

【００２０】次に、登録・認識制御手段２３は音声認識
処理手段２４で算出された類似度に基づいて該当するパ
スワードが登録されているか否かを判定する（Ｓ３４、
登録判定工程）。規定値以上の類似度を与えるパスワー
ドがあれば、該当するパスワードが登録されていると判
定してステップ３５へ移行するが、該当するパスワード
が登録されていないと判定したときにはステップ３２に
戻り、パスワードの発声からやり直す。ステップ３５に
おいては、登録・認識制御手段２３は、上記該当するパ
スワード（すなわち話者のＩＤ番号）に対応する発信先
データファイルを発信先データ格納部４２から音声認識
処理手段２４にロードする。

【００２１】次に、話者は、発信したい発信先名称を発
声し、この音声はマイク１を介して音声信号入力手段２
１に取り込まれ、手段２１でデジタル信号に変換された
後、音声特徴抽出手段２２に入力され、音声特徴抽出手
段２２は、入力された音声信号の特徴量データ（音声特
徴量データ）を算出する（Ｓ３６）。

【００２２】次に、登録・認識制御手段２３は音声特徴
抽出手段２２で算出した音声特徴量データを音声認識処
理手段２４へ送出し、音声認識処理手段２４は上記音声
特徴量データとステップ３５でロードされた発信先デー
タファイルに登録されている発信先データ群との類似度
を算出する（Ｓ３７、第２の音声認識処理工程）。

【００２３】次に、登録・認識制御手段２３は類似度が
第１位の発信先データを話者が発信したい発信先名称の
データと判定し、その発信先名称に対応する発信先電話
番号を発信処理手段２５へ送出する（Ｓ３８、電話番号
判定工程）。次に、発信処理手段２５は受け取った発信
先電話番号をＰＢＸ装置５へ発信する（Ｓ３９、発信処
理工程）。

【００２４】上記図５の処理動作では、ステップ３４
で、該当するパスワードが登録されていないと判定した
ときにはステップ３２に戻り、パスワードの発声からや
り直すこととしたが、該当するパスワードの登録が無い
ときには、登録・認識制御手段２３が、話者に音声発信
機能を利用できない旨を通知するメッセージを表示させ
る共に音声発信機能（音声ダイヤル機能）の利用を禁止
し、また発信処理手段２５での音声発信処理を中止させ
るようにしてもよい。これにより、プライバシー侵害防
止など、音声ダイヤル装置のセキュリティを確保するこ
とができる。

【００２５】以上のように本実施例によれば、パスワー
ドの発声および発信先名称の発声により相手先に発信す
るようにしたので、話者はＩＤ番号をキー入力する必要
が無くなり、操作性が向上し、発信先の登録時および音
声認識時の操作に必要な時間が短縮される。また、登録
されていないパスワードが発声された場合には音声ダイ
ヤル機能の利用を禁止するようにすることもできるの
で、正規に登録された各話者のプライバシーを保護する
ことができる。

【００２６】

【発明の効果】以上のように本発明は、音声信号を入力
してデジタル値に変換する音声信号入力手段と、フレー
ム分割と各フレームの音声特徴量の算出とを行なう音声
特徴抽出手段と、発信先データの登録と認識とを制御す
る登録・認識処理制御手段と、各話者が登録したパスワ
ードデータを格納するパスワードデータ格納部と、各話
者が登録した発信先データを話者別にラベルを付けて格
納する発信先データ格納部と、入力された音声の特徴量
と登録されたパスワードデータ群又は発信先データ群と
の類似度を計算し、最も類似したパスワードデータ又は
発信先データを出力する音声認識処理手段と、最も類似
した発信先データと登録された発信先番号とを照らし合
わせてＰＢＸに発信を要求する発信処理手段とを設けた
ことにより、音声信号として入力されたパスワードおよ
び発信先名称と、登録された各話者のパスワードおよび
発信先名称との類似度を算出して、話者の発信したい相
手先にダイヤルすることができるので、話者はＩＤ番号
をキー入力する必要が無くなり、操作性が向上し、発信
先の登録時および音声認識時の操作に必要な時間が短縮
される音声ダイヤル装置を実現することができる。

【００２７】また、登録・認識処理制御手段は、登録さ
れていないパスワードを発声した話者の音声ダイヤル機
能の利用を禁止すると共にその話者の音声発信処理を中
止するようにしたので、正規に登録された各話者だけが
装置を利用することができ、各話者のプライバシーを保
護することができる音声ダイヤル装置を実現することが
できる。

【００２８】さらに、話者が発声したパスワードと登録
されているパスワードとの類似度を算出する第１の音声
認識処理工程と、話者のパスワードが登録されているか
否かを判定する登録判定工程と、話者が発声した発信先
名称と登録されている発信先データとの類似度を算出す
る第２の音声認識処理工程と、発信先名称と発信先デー
タとの類似度の算出結果に基づき電話番号を決定する電
話番号判定工程と、決定された電話番号を発信処理する
発信処理工程とを有することにより、パスワードの発声
および発信先名称の発声により相手先に発信するように
することができるので、話者はＩＤ番号をキー入力する
必要が無くなり、操作性が向上し、発信先の登録時およ
び音声認識時の操作に必要な時間が短縮される音声発信
処理方法を実現することができ、また、登録判定工程に
おいて、登録されていないパスワードを発声した話者の
音声ダイヤル機能の利用を禁止すると共にその話者の音
声発信処理を中止するようにして、正規に登録された各
話者だけが装置を利用するようにすることができるの
で、各話者のプライバシーを保護することができる音声
発信処理方法を実現することができる。

【図面の簡単な説明】

【図１】本発明の一実施例に係る音声ダイヤル装置を示
す装置ブロック図

【図２】図１の装置のＣＰＵにおける機能実現手段を示
す機能ブロック図

【図３】図２の装置におけるパスワード登録処理の動作
を示すフローチャート

【図４】図２の装置における発信先登録処理の動作を示
すフローチャート

【図５】図２の装置における音声発信処理の動作を示す
フローチャート

【図６】パスワードデータファイルを示すファイル図

【図７】発信先データファイルを示すファイル図

【符号の説明】

１マイク２ＣＰＵ３ＲＯＭ４ＲＡＭ５ＰＢＸ装置２１音声信号入力手段２２音声特徴抽出手段２３登録・認識制御手段２４音声認識処理手段２５発信処理手段４１パスワードデータ格納部４２発信先データ格納部

Claims

【特許請求の範囲】

【請求項１】音声信号を入力してデジタル値に変換する
音声信号入力手段と、フレーム分割と各フレームの音声
特徴量の算出とを行なう音声特徴抽出手段と、発信先デ
ータの登録と認識とを制御する登録・認識処理制御手段
と、各話者が登録したパスワードデータを格納するパス
ワードデータ格納部と、各話者が登録した発信先データ
を話者別にラベルを付けて格納する発信先データ格納部
と、入力された音声の特徴量と登録されたパスワードデ
ータ群又は発信先データ群との類似度を計算し、最も類
似したパスワードデータ又は発信先データを出力する音
声認識処理手段と、前記最も類似した発信先データと登
録された発信先番号とを照らし合わせてＰＢＸに発信を
要求する発信処理手段とを備えたことを特徴とする音声
ダイヤル装置。
【請求項２】前記登録・認識処理制御手段は、登録され
ていないパスワードを発声した話者の音声ダイヤル機能
の利用を禁止すると共に前記話者の音声発信処理を中止
することを特徴とする請求項１記載の音声ダイヤル装
置。
【請求項３】話者が発声したパスワードと登録されてい
るパスワードとの類似度を算出する第１の音声認識処理
工程と、前記話者のパスワードが登録されているか否か
を判定する登録判定工程と、前記話者が発声した発信先
名称と登録されている発信先データとの類似度を算出す
る第２の音声認識処理工程と、前記発信先名称と発信先
データとの類似度の算出結果に基づき電話番号を決定す
る電話番号判定工程と、前記決定された電話番号を発信
処理する発信処理工程とを有することを特徴とする音声
発信処理方法。