JPH08340378A - 音声ダイヤル装置および音声発信処理方法 - Google Patents
音声ダイヤル装置および音声発信処理方法Info
- Publication number
- JPH08340378A JPH08340378A JP7147227A JP14722795A JPH08340378A JP H08340378 A JPH08340378 A JP H08340378A JP 7147227 A JP7147227 A JP 7147227A JP 14722795 A JP14722795 A JP 14722795A JP H08340378 A JPH08340378 A JP H08340378A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speaker
- password
- registered
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【目的】 音声発信に際しID番号のキー入力を必要と
せず、登録話者のプライバシーが侵害されない音声ダイ
ヤル装置を提供することを目的とする。 【構成】 音声信号を入力してデジタル値に変換する音
声信号入力手段21と、フレーム分割と各フレームの音
声特徴量の算出とを行なう音声特徴抽出手段22と、発
信先データの登録と認識とを制御する登録・認識処理制
御手段23と、各話者の登録パスワードデータを格納す
るパスワードデータ格納部41と、各話者の登録発信先
データを話者別にラベルを付けて格納する発信先データ
格納部42と、入力された音声の特徴量と登録されたパ
スワードデータ群又は発信先データ群との類似度を計算
し、最も類似したパスワードデータ又は発信先データを
出力する音声認識処理手段24と、最も類似した発信先
データと登録された発信先番号とを照らし合わせてPB
Xに発信を要求する発信処理手段25とを備える。
せず、登録話者のプライバシーが侵害されない音声ダイ
ヤル装置を提供することを目的とする。 【構成】 音声信号を入力してデジタル値に変換する音
声信号入力手段21と、フレーム分割と各フレームの音
声特徴量の算出とを行なう音声特徴抽出手段22と、発
信先データの登録と認識とを制御する登録・認識処理制
御手段23と、各話者の登録パスワードデータを格納す
るパスワードデータ格納部41と、各話者の登録発信先
データを話者別にラベルを付けて格納する発信先データ
格納部42と、入力された音声の特徴量と登録されたパ
スワードデータ群又は発信先データ群との類似度を計算
し、最も類似したパスワードデータ又は発信先データを
出力する音声認識処理手段24と、最も類似した発信先
データと登録された発信先番号とを照らし合わせてPB
Xに発信を要求する発信処理手段25とを備える。
Description
【0001】
【産業上の利用分野】本発明は、話者が登録した音声デ
ータをもとに音声発信を可能にする音声ダイヤル装置お
よび音声発信処理方法に関する。
ータをもとに音声発信を可能にする音声ダイヤル装置お
よび音声発信処理方法に関する。
【0002】
【従来の技術】近年、音声発信によるダイヤル方式が広
がりつつある。この音声発信のダイヤルを行なう音声ダ
イヤル装置を複数の人間が利用する場合、全ての話者の
発信先登録データを同一に取り扱うと、不特定話者を認
識処理する負担が増加し、誤認識が増加する。これを回
避するためには、各話者が登録したデータを個別に管理
する必要がある。つまり、各話者の登録データを話者I
D番号で区分し、各話者は自分専用の発信先データファ
イルにより発信先の登録と認識処理を行なう。この場
合、話者は、発信先の登録時および音声認識による発信
時に、自分専用の発信先データファイルを指定する必要
がある。この指定方法としては、各話者それぞれにID
番号を設定しておき、話者が自分でそのID番号をキー
入力する方法が一般的である。
がりつつある。この音声発信のダイヤルを行なう音声ダ
イヤル装置を複数の人間が利用する場合、全ての話者の
発信先登録データを同一に取り扱うと、不特定話者を認
識処理する負担が増加し、誤認識が増加する。これを回
避するためには、各話者が登録したデータを個別に管理
する必要がある。つまり、各話者の登録データを話者I
D番号で区分し、各話者は自分専用の発信先データファ
イルにより発信先の登録と認識処理を行なう。この場
合、話者は、発信先の登録時および音声認識による発信
時に、自分専用の発信先データファイルを指定する必要
がある。この指定方法としては、各話者それぞれにID
番号を設定しておき、話者が自分でそのID番号をキー
入力する方法が一般的である。
【0003】
【発明が解決しようとする課題】しかしながら、上記音
声ダイヤル装置では、自分専用の発信先データファイル
を指定する時、つまり発信先の登録時および音声認識に
よる発信時に、毎回自分のパスワードであるID番号を
キー入力する必要があり、これにより操作性が低下する
という問題点があった。また、話者がキー入力に不慣れ
な場合には操作ミスする可能性が高く、この場合には操
作ミス修復のため操作に要する時間が余計にかかるとい
う問題点があった。さらに、複数の話者が使用する場
合、ID番号自体には何ら特徴がないため、外部の人間
が音声ダイヤル機能を悪用して登録されている発信先の
情報を得ることにより、登録話者のプライバシーが侵害
される可能性があるという問題点があった。
声ダイヤル装置では、自分専用の発信先データファイル
を指定する時、つまり発信先の登録時および音声認識に
よる発信時に、毎回自分のパスワードであるID番号を
キー入力する必要があり、これにより操作性が低下する
という問題点があった。また、話者がキー入力に不慣れ
な場合には操作ミスする可能性が高く、この場合には操
作ミス修復のため操作に要する時間が余計にかかるとい
う問題点があった。さらに、複数の話者が使用する場
合、ID番号自体には何ら特徴がないため、外部の人間
が音声ダイヤル機能を悪用して登録されている発信先の
情報を得ることにより、登録話者のプライバシーが侵害
される可能性があるという問題点があった。
【0004】本発明は上記従来の問題点を解決するもの
で、音声発信に際してID番号のキー入力を必要とせ
ず、また、登録話者のプライバシーが侵害される可能性
がない音声ダイヤル装置、および音声発信に際してID
番号のキー入力を必要とせず、また、登録話者のプライ
バシーが侵害される可能性がない音声発信処理方法を提
供することを目的とする。
で、音声発信に際してID番号のキー入力を必要とせ
ず、また、登録話者のプライバシーが侵害される可能性
がない音声ダイヤル装置、および音声発信に際してID
番号のキー入力を必要とせず、また、登録話者のプライ
バシーが侵害される可能性がない音声発信処理方法を提
供することを目的とする。
【0005】
【課題を解決するための手段】この目的を達成するため
に本発明の請求項1記載の音声ダイヤル装置は、音声信
号を入力してデジタル値に変換する音声信号入力手段
と、フレーム分割と各フレームの音声特徴量の算出とを
行なう音声特徴抽出手段と、発信先データの登録と認識
とを制御する登録・認識処理制御手段と、各話者が登録
したパスワードデータを格納するパスワードデータ格納
部と、各話者が登録した発信先データを話者別にラベル
を付けて格納する発信先データ格納部と、入力された音
声の特徴量と登録されたパスワードデータ群又は発信先
データ群との類似度を計算し、最も類似したパスワード
データ又は発信先データを出力する音声認識処理手段
と、最も類似した発信先データと登録された発信先番号
とを照らし合わせてPBXに発信を要求する発信処理手
段とを備えた構成を有している。
に本発明の請求項1記載の音声ダイヤル装置は、音声信
号を入力してデジタル値に変換する音声信号入力手段
と、フレーム分割と各フレームの音声特徴量の算出とを
行なう音声特徴抽出手段と、発信先データの登録と認識
とを制御する登録・認識処理制御手段と、各話者が登録
したパスワードデータを格納するパスワードデータ格納
部と、各話者が登録した発信先データを話者別にラベル
を付けて格納する発信先データ格納部と、入力された音
声の特徴量と登録されたパスワードデータ群又は発信先
データ群との類似度を計算し、最も類似したパスワード
データ又は発信先データを出力する音声認識処理手段
と、最も類似した発信先データと登録された発信先番号
とを照らし合わせてPBXに発信を要求する発信処理手
段とを備えた構成を有している。
【0006】請求項2記載の音声ダイヤル装置は、請求
項1記載の音声ダイヤル装置において、登録・認識処理
制御手段が、登録されていないパスワードを発声した話
者の音声ダイヤル機能の利用を禁止すると共にその話者
の音声発信処理を中止する構成を有している。
項1記載の音声ダイヤル装置において、登録・認識処理
制御手段が、登録されていないパスワードを発声した話
者の音声ダイヤル機能の利用を禁止すると共にその話者
の音声発信処理を中止する構成を有している。
【0007】請求項3記載の音声発信処理方法は、話者
が発声したパスワードと登録されているパスワードとの
類似度を算出する第1の音声認識処理工程と、話者のパ
スワードが登録されているか否かを判定する登録判定工
程と、話者が発声した発信先名称と登録されている発信
先データとの類似度を算出する第2の音声認識処理工程
と、発信先名称と発信先データとの類似度の算出結果に
基づき電話番号を決定する電話番号判定工程と、決定さ
れた電話番号を発信処理する発信処理工程とを有する構
成としている。
が発声したパスワードと登録されているパスワードとの
類似度を算出する第1の音声認識処理工程と、話者のパ
スワードが登録されているか否かを判定する登録判定工
程と、話者が発声した発信先名称と登録されている発信
先データとの類似度を算出する第2の音声認識処理工程
と、発信先名称と発信先データとの類似度の算出結果に
基づき電話番号を決定する電話番号判定工程と、決定さ
れた電話番号を発信処理する発信処理工程とを有する構
成としている。
【0008】
【作用】上記構成によって、話者はID番号をキー入力
する必要が無くなるので、操作性が向上し、発信先の登
録時および音声認識時の操作に必要な時間が短縮され
る。また、登録されていないパスワードが発声された場
合には音声ダイヤル機能の利用を禁止するようにしたの
で、正規に登録された各話者のプライバシーを保護する
ことができる。
する必要が無くなるので、操作性が向上し、発信先の登
録時および音声認識時の操作に必要な時間が短縮され
る。また、登録されていないパスワードが発声された場
合には音声ダイヤル機能の利用を禁止するようにしたの
で、正規に登録された各話者のプライバシーを保護する
ことができる。
【0009】
【実施例】以下、本発明の一実施例について図を用いて
説明する。
説明する。
【0010】図2は本発明の一実施例に係る音声ダイヤ
ル装置を示す装置ブロック図である。図2において、1
は音声を入力して音声信号を出力するマイク、2は装置
全体を制御するCPU、3はROM(読出し専用メモ
リ)、4はRAM(書込み可能メモリ)、5は外線又は
内線との間で通話を行なうためのPBX装置である。な
おPBX装置は本実施例に係る音声ダイヤル装置には含
まれない。
ル装置を示す装置ブロック図である。図2において、1
は音声を入力して音声信号を出力するマイク、2は装置
全体を制御するCPU、3はROM(読出し専用メモ
リ)、4はRAM(書込み可能メモリ)、5は外線又は
内線との間で通話を行なうためのPBX装置である。な
おPBX装置は本実施例に係る音声ダイヤル装置には含
まれない。
【0011】図1は、図2のCPU2における機能実現
手段を示す機能ブロック図である。図1において、1は
音声を入力して音声信号を出力するマイク、21は音声
信号を入力してデジタル値に変換する音声信号入力手
段、22はフレーム分割と各フレームの音声特徴量の算
出とを行なう音声特徴抽出手段、23は発信先データの
登録と認識とを制御する登録・認識処理制御手段、24
は入力された音声の特徴量と登録されたパスワードデー
タ群又は発信先データ群との類似度を計算し、最も類似
したパスワードデータ又は発信先データを出力する音声
認識処理手段、25は最も類似した発信先データと登録
された発信先番号とを照らし合わせてPBX装置5に発
信を要求する発信処理手段、41は各話者が登録したパ
スワードデータを格納するパスワードデータ格納部、4
2は各話者が登録した発信先データを話者別にラベルを
付けて格納する発信先データ格納部である。
手段を示す機能ブロック図である。図1において、1は
音声を入力して音声信号を出力するマイク、21は音声
信号を入力してデジタル値に変換する音声信号入力手
段、22はフレーム分割と各フレームの音声特徴量の算
出とを行なう音声特徴抽出手段、23は発信先データの
登録と認識とを制御する登録・認識処理制御手段、24
は入力された音声の特徴量と登録されたパスワードデー
タ群又は発信先データ群との類似度を計算し、最も類似
したパスワードデータ又は発信先データを出力する音声
認識処理手段、25は最も類似した発信先データと登録
された発信先番号とを照らし合わせてPBX装置5に発
信を要求する発信処理手段、41は各話者が登録したパ
スワードデータを格納するパスワードデータ格納部、4
2は各話者が登録した発信先データを話者別にラベルを
付けて格納する発信先データ格納部である。
【0012】ここで、図1と図2との対応について説明
すると、手段21〜25はCPU2における機能実現手
段であり、ROM2格納のプログラムに基づいて動作す
る。また格納部41、42はRAM4に対応する。
すると、手段21〜25はCPU2における機能実現手
段であり、ROM2格納のプログラムに基づいて動作す
る。また格納部41、42はRAM4に対応する。
【0013】以上のように構成された音声ダイヤル装置
について、図3〜図5を用いてその動作を説明する。
について、図3〜図5を用いてその動作を説明する。
【0014】図3は新しい話者のためのパスワード登録
処理の動作を示すフローチャートである。始めに話者が
パスワード登録キーを押下すると、登録・認識制御手段
23はパスワード登録処理を開始し(S1)、パスワー
ドデータ格納部41から全話者共通のパスワードデータ
ファイルを登録・認識制御手段23にロードさせる(S
2)。次に、話者が登録したいパスワードを発声する
と、この音声はマイク1を介して音声信号入力手段21
に取り込まれ、手段21でデジタル信号に変換された
後、音声特徴抽出手段22に入力される(S3)。音声
特徴抽出手段22は、入力された音声信号の特徴量デー
タ(音声特徴量データ)を算出する(S4)。登録・認
識制御手段23は上記パスワードを表示装置(図示しな
い)に表示し(S5)、あるいは図示しないスピーカか
ら音声として出力し、上記表示あるいは音声により話者
はパスワードが正しく入力されたか否かを判定する(S
6)。パスワードが正しく入力されていない場合には話
者は「やり直しキー」を押下し、これにより登録・認識
制御手段23はパスワードが正しく入力されていないと
判定して処理をステップ3に戻す。パスワードが正しく
入力されている場合には話者は「確認キー」を押下し、
これにより登録・認識制御手段23はパスワードが正し
く入力されていると判定してステップ7へ移行する。ス
テップ7において、登録・認識制御手段23は、ステッ
プ4で算出された音声特徴量データをステップ2でロー
ドした全話者共通のパスワードデータファイルに登録
し、このファイルをパスワードデータ格納部41に格納
することにより保存する。次に、登録・認識制御手段2
3は、新しい話者のパスワードにリンクした話者別の発
信先データファイルを発信先データ格納部42に作成す
る。
処理の動作を示すフローチャートである。始めに話者が
パスワード登録キーを押下すると、登録・認識制御手段
23はパスワード登録処理を開始し(S1)、パスワー
ドデータ格納部41から全話者共通のパスワードデータ
ファイルを登録・認識制御手段23にロードさせる(S
2)。次に、話者が登録したいパスワードを発声する
と、この音声はマイク1を介して音声信号入力手段21
に取り込まれ、手段21でデジタル信号に変換された
後、音声特徴抽出手段22に入力される(S3)。音声
特徴抽出手段22は、入力された音声信号の特徴量デー
タ(音声特徴量データ)を算出する(S4)。登録・認
識制御手段23は上記パスワードを表示装置(図示しな
い)に表示し(S5)、あるいは図示しないスピーカか
ら音声として出力し、上記表示あるいは音声により話者
はパスワードが正しく入力されたか否かを判定する(S
6)。パスワードが正しく入力されていない場合には話
者は「やり直しキー」を押下し、これにより登録・認識
制御手段23はパスワードが正しく入力されていないと
判定して処理をステップ3に戻す。パスワードが正しく
入力されている場合には話者は「確認キー」を押下し、
これにより登録・認識制御手段23はパスワードが正し
く入力されていると判定してステップ7へ移行する。ス
テップ7において、登録・認識制御手段23は、ステッ
プ4で算出された音声特徴量データをステップ2でロー
ドした全話者共通のパスワードデータファイルに登録
し、このファイルをパスワードデータ格納部41に格納
することにより保存する。次に、登録・認識制御手段2
3は、新しい話者のパスワードにリンクした話者別の発
信先データファイルを発信先データ格納部42に作成す
る。
【0015】このようにして新しい話者のパスワードが
登録され、そのパスワードにリンクした話者別発信先デ
ータファイルが作成される。
登録され、そのパスワードにリンクした話者別発信先デ
ータファイルが作成される。
【0016】図4は発信先登録処理の動作を示すフロー
チャートである。始めに話者が発信先登録キーを押下す
ると、登録・認識制御手段23は発信先登録処理を開始
する(S11)。次に、話者が自分のパスワードを発声
すると、この音声はマイク1を介して音声信号入力手段
21に取り込まれ、手段21でデジタル信号に変換され
た後、音声特徴抽出手段22に入力される(S12)。
音声特徴抽出手段22は、入力された音声信号の特徴量
データ(音声特徴量データ)を算出する(S13)。登
録・認識制御手段23は音声特徴抽出手段22で算出し
た音声特徴量データを音声認識処理手段24に送り、手
段24は格納部41に登録されている全話者のパスワー
ドの音声特徴量データ群(以下、「パスワードデータ
群」という)と音声特徴抽出手段22で算出した音声特
徴量データとの類似度を算出する(S14)。次に、登
録・認識制御手段23は音声認識処理手段24で算出さ
れた類似度に基づいて該当するパスワードが登録されて
いるか否かを判定する(S15)。規定値以上の類似度
を与えるパスワードがあれば、該当するパスワードが登
録されていると判定してステップ16へ移行するが、該
当するパスワードが登録されていないと判定したときに
はステップ12に戻り、パスワードの発声からやり直
す。ステップ16においては、上記該当するパスワード
に対応する発信先データファイルが格納部42から登録
・認識制御手段23にロードされる。次に、話者は登録
したい発信先名称を発声し、この音声はマイク1を介し
て音声信号入力手段21に取り込まれ、手段21でデジ
タル信号に変換された後、音声特徴抽出手段22に入力
される(S17)。音声特徴抽出手段22は、入力され
た音声信号の特徴量データ(音声特徴量データ)を算出
する(S18)。音声特徴抽出手段22で算出した音声
特徴量データは、上記ロードされた発信先データファイ
ルに登録され、この発信先データファイルを発信先デー
タ格納部42に格納することにより保持される(S1
9)。次に、話者が電話番号を電話端末の数字キーによ
り入力すると、登録・認識制御手段23は電話番号であ
ると認識し(S20)、その電話番号を格納部42の発
信先データファイルに登録する(S21)。なお、本処
理動作において、ステップ20で、電話番号を電話端末
の数字キーにより入力することにより登録するとした
が、これは、話者が電話番号を発声し、この電話番号を
音声認識処理手段24において不特定話者の数字音声認
識処理により認識することにより登録することもでき
る。
チャートである。始めに話者が発信先登録キーを押下す
ると、登録・認識制御手段23は発信先登録処理を開始
する(S11)。次に、話者が自分のパスワードを発声
すると、この音声はマイク1を介して音声信号入力手段
21に取り込まれ、手段21でデジタル信号に変換され
た後、音声特徴抽出手段22に入力される(S12)。
音声特徴抽出手段22は、入力された音声信号の特徴量
データ(音声特徴量データ)を算出する(S13)。登
録・認識制御手段23は音声特徴抽出手段22で算出し
た音声特徴量データを音声認識処理手段24に送り、手
段24は格納部41に登録されている全話者のパスワー
ドの音声特徴量データ群(以下、「パスワードデータ
群」という)と音声特徴抽出手段22で算出した音声特
徴量データとの類似度を算出する(S14)。次に、登
録・認識制御手段23は音声認識処理手段24で算出さ
れた類似度に基づいて該当するパスワードが登録されて
いるか否かを判定する(S15)。規定値以上の類似度
を与えるパスワードがあれば、該当するパスワードが登
録されていると判定してステップ16へ移行するが、該
当するパスワードが登録されていないと判定したときに
はステップ12に戻り、パスワードの発声からやり直
す。ステップ16においては、上記該当するパスワード
に対応する発信先データファイルが格納部42から登録
・認識制御手段23にロードされる。次に、話者は登録
したい発信先名称を発声し、この音声はマイク1を介し
て音声信号入力手段21に取り込まれ、手段21でデジ
タル信号に変換された後、音声特徴抽出手段22に入力
される(S17)。音声特徴抽出手段22は、入力され
た音声信号の特徴量データ(音声特徴量データ)を算出
する(S18)。音声特徴抽出手段22で算出した音声
特徴量データは、上記ロードされた発信先データファイ
ルに登録され、この発信先データファイルを発信先デー
タ格納部42に格納することにより保持される(S1
9)。次に、話者が電話番号を電話端末の数字キーによ
り入力すると、登録・認識制御手段23は電話番号であ
ると認識し(S20)、その電話番号を格納部42の発
信先データファイルに登録する(S21)。なお、本処
理動作において、ステップ20で、電話番号を電話端末
の数字キーにより入力することにより登録するとした
が、これは、話者が電話番号を発声し、この電話番号を
音声認識処理手段24において不特定話者の数字音声認
識処理により認識することにより登録することもでき
る。
【0017】このようにして話者の発信先データ(発信
先名称を示すデータ)が登録され、その発信先名称に対
応する電話番号が登録される。
先名称を示すデータ)が登録され、その発信先名称に対
応する電話番号が登録される。
【0018】図6は図3の処理によって登録されるパス
ワードデータファイルの例を示すファイル図、図7は図
4の処理によって登録される発信先データファイルの例
を示すファイル図である。例えば話者IDがNo.1で
ある話者のパスワードは図6に示すように「おんせい」
であり、そのパスワードにリンクする発信先データファ
イルには発信先名称として「とくだ」、「たなか」、
「いとう」が登録され、また、それぞれの電話番号が登
録されている。
ワードデータファイルの例を示すファイル図、図7は図
4の処理によって登録される発信先データファイルの例
を示すファイル図である。例えば話者IDがNo.1で
ある話者のパスワードは図6に示すように「おんせい」
であり、そのパスワードにリンクする発信先データファ
イルには発信先名称として「とくだ」、「たなか」、
「いとう」が登録され、また、それぞれの電話番号が登
録されている。
【0019】図5は音声による発信処理(音声発信処
理)の動作を示すフローチャートである。始めに、話者
が発信キーを押下すると、登録・認識制御手段23は音
声発信処理を開始する(S31)。次に、話者が自分の
パスワードを発声すると、この音声はマイク1を介して
音声信号入力手段21に取り込まれ、手段21でデジタ
ル信号に変換された後、音声特徴抽出手段22に入力さ
れ、音声特徴抽出手段22は、入力された音声信号の特
徴量データ(音声特徴量データ)を算出する(S3
2)。登録・認識制御手段23は音声特徴抽出手段22
で算出した音声特徴量データを音声認識処理手段24に
送り、手段24は格納部41に登録されている全話者の
パスワードデータ群と音声特徴抽出手段22で算出した
音声特徴量データとの類似度を算出する(S33、第1
の音声認識処理工程)。
理)の動作を示すフローチャートである。始めに、話者
が発信キーを押下すると、登録・認識制御手段23は音
声発信処理を開始する(S31)。次に、話者が自分の
パスワードを発声すると、この音声はマイク1を介して
音声信号入力手段21に取り込まれ、手段21でデジタ
ル信号に変換された後、音声特徴抽出手段22に入力さ
れ、音声特徴抽出手段22は、入力された音声信号の特
徴量データ(音声特徴量データ)を算出する(S3
2)。登録・認識制御手段23は音声特徴抽出手段22
で算出した音声特徴量データを音声認識処理手段24に
送り、手段24は格納部41に登録されている全話者の
パスワードデータ群と音声特徴抽出手段22で算出した
音声特徴量データとの類似度を算出する(S33、第1
の音声認識処理工程)。
【0020】次に、登録・認識制御手段23は音声認識
処理手段24で算出された類似度に基づいて該当するパ
スワードが登録されているか否かを判定する(S34、
登録判定工程)。規定値以上の類似度を与えるパスワー
ドがあれば、該当するパスワードが登録されていると判
定してステップ35へ移行するが、該当するパスワード
が登録されていないと判定したときにはステップ32に
戻り、パスワードの発声からやり直す。ステップ35に
おいては、登録・認識制御手段23は、上記該当するパ
スワード(すなわち話者のID番号)に対応する発信先
データファイルを発信先データ格納部42から音声認識
処理手段24にロードする。
処理手段24で算出された類似度に基づいて該当するパ
スワードが登録されているか否かを判定する(S34、
登録判定工程)。規定値以上の類似度を与えるパスワー
ドがあれば、該当するパスワードが登録されていると判
定してステップ35へ移行するが、該当するパスワード
が登録されていないと判定したときにはステップ32に
戻り、パスワードの発声からやり直す。ステップ35に
おいては、登録・認識制御手段23は、上記該当するパ
スワード(すなわち話者のID番号)に対応する発信先
データファイルを発信先データ格納部42から音声認識
処理手段24にロードする。
【0021】次に、話者は、発信したい発信先名称を発
声し、この音声はマイク1を介して音声信号入力手段2
1に取り込まれ、手段21でデジタル信号に変換された
後、音声特徴抽出手段22に入力され、音声特徴抽出手
段22は、入力された音声信号の特徴量データ(音声特
徴量データ)を算出する(S36)。
声し、この音声はマイク1を介して音声信号入力手段2
1に取り込まれ、手段21でデジタル信号に変換された
後、音声特徴抽出手段22に入力され、音声特徴抽出手
段22は、入力された音声信号の特徴量データ(音声特
徴量データ)を算出する(S36)。
【0022】次に、登録・認識制御手段23は音声特徴
抽出手段22で算出した音声特徴量データを音声認識処
理手段24へ送出し、音声認識処理手段24は上記音声
特徴量データとステップ35でロードされた発信先デー
タファイルに登録されている発信先データ群との類似度
を算出する(S37、第2の音声認識処理工程)。
抽出手段22で算出した音声特徴量データを音声認識処
理手段24へ送出し、音声認識処理手段24は上記音声
特徴量データとステップ35でロードされた発信先デー
タファイルに登録されている発信先データ群との類似度
を算出する(S37、第2の音声認識処理工程)。
【0023】次に、登録・認識制御手段23は類似度が
第1位の発信先データを話者が発信したい発信先名称の
データと判定し、その発信先名称に対応する発信先電話
番号を発信処理手段25へ送出する(S38、電話番号
判定工程)。次に、発信処理手段25は受け取った発信
先電話番号をPBX装置5へ発信する(S39、発信処
理工程)。
第1位の発信先データを話者が発信したい発信先名称の
データと判定し、その発信先名称に対応する発信先電話
番号を発信処理手段25へ送出する(S38、電話番号
判定工程)。次に、発信処理手段25は受け取った発信
先電話番号をPBX装置5へ発信する(S39、発信処
理工程)。
【0024】上記図5の処理動作では、ステップ34
で、該当するパスワードが登録されていないと判定した
ときにはステップ32に戻り、パスワードの発声からや
り直すこととしたが、該当するパスワードの登録が無い
ときには、登録・認識制御手段23が、話者に音声発信
機能を利用できない旨を通知するメッセージを表示させ
る共に音声発信機能(音声ダイヤル機能)の利用を禁止
し、また発信処理手段25での音声発信処理を中止させ
るようにしてもよい。これにより、プライバシー侵害防
止など、音声ダイヤル装置のセキュリティを確保するこ
とができる。
で、該当するパスワードが登録されていないと判定した
ときにはステップ32に戻り、パスワードの発声からや
り直すこととしたが、該当するパスワードの登録が無い
ときには、登録・認識制御手段23が、話者に音声発信
機能を利用できない旨を通知するメッセージを表示させ
る共に音声発信機能(音声ダイヤル機能)の利用を禁止
し、また発信処理手段25での音声発信処理を中止させ
るようにしてもよい。これにより、プライバシー侵害防
止など、音声ダイヤル装置のセキュリティを確保するこ
とができる。
【0025】以上のように本実施例によれば、パスワー
ドの発声および発信先名称の発声により相手先に発信す
るようにしたので、話者はID番号をキー入力する必要
が無くなり、操作性が向上し、発信先の登録時および音
声認識時の操作に必要な時間が短縮される。また、登録
されていないパスワードが発声された場合には音声ダイ
ヤル機能の利用を禁止するようにすることもできるの
で、正規に登録された各話者のプライバシーを保護する
ことができる。
ドの発声および発信先名称の発声により相手先に発信す
るようにしたので、話者はID番号をキー入力する必要
が無くなり、操作性が向上し、発信先の登録時および音
声認識時の操作に必要な時間が短縮される。また、登録
されていないパスワードが発声された場合には音声ダイ
ヤル機能の利用を禁止するようにすることもできるの
で、正規に登録された各話者のプライバシーを保護する
ことができる。
【0026】
【発明の効果】以上のように本発明は、音声信号を入力
してデジタル値に変換する音声信号入力手段と、フレー
ム分割と各フレームの音声特徴量の算出とを行なう音声
特徴抽出手段と、発信先データの登録と認識とを制御す
る登録・認識処理制御手段と、各話者が登録したパスワ
ードデータを格納するパスワードデータ格納部と、各話
者が登録した発信先データを話者別にラベルを付けて格
納する発信先データ格納部と、入力された音声の特徴量
と登録されたパスワードデータ群又は発信先データ群と
の類似度を計算し、最も類似したパスワードデータ又は
発信先データを出力する音声認識処理手段と、最も類似
した発信先データと登録された発信先番号とを照らし合
わせてPBXに発信を要求する発信処理手段とを設けた
ことにより、音声信号として入力されたパスワードおよ
び発信先名称と、登録された各話者のパスワードおよび
発信先名称との類似度を算出して、話者の発信したい相
手先にダイヤルすることができるので、話者はID番号
をキー入力する必要が無くなり、操作性が向上し、発信
先の登録時および音声認識時の操作に必要な時間が短縮
される音声ダイヤル装置を実現することができる。
してデジタル値に変換する音声信号入力手段と、フレー
ム分割と各フレームの音声特徴量の算出とを行なう音声
特徴抽出手段と、発信先データの登録と認識とを制御す
る登録・認識処理制御手段と、各話者が登録したパスワ
ードデータを格納するパスワードデータ格納部と、各話
者が登録した発信先データを話者別にラベルを付けて格
納する発信先データ格納部と、入力された音声の特徴量
と登録されたパスワードデータ群又は発信先データ群と
の類似度を計算し、最も類似したパスワードデータ又は
発信先データを出力する音声認識処理手段と、最も類似
した発信先データと登録された発信先番号とを照らし合
わせてPBXに発信を要求する発信処理手段とを設けた
ことにより、音声信号として入力されたパスワードおよ
び発信先名称と、登録された各話者のパスワードおよび
発信先名称との類似度を算出して、話者の発信したい相
手先にダイヤルすることができるので、話者はID番号
をキー入力する必要が無くなり、操作性が向上し、発信
先の登録時および音声認識時の操作に必要な時間が短縮
される音声ダイヤル装置を実現することができる。
【0027】また、登録・認識処理制御手段は、登録さ
れていないパスワードを発声した話者の音声ダイヤル機
能の利用を禁止すると共にその話者の音声発信処理を中
止するようにしたので、正規に登録された各話者だけが
装置を利用することができ、各話者のプライバシーを保
護することができる音声ダイヤル装置を実現することが
できる。
れていないパスワードを発声した話者の音声ダイヤル機
能の利用を禁止すると共にその話者の音声発信処理を中
止するようにしたので、正規に登録された各話者だけが
装置を利用することができ、各話者のプライバシーを保
護することができる音声ダイヤル装置を実現することが
できる。
【0028】さらに、話者が発声したパスワードと登録
されているパスワードとの類似度を算出する第1の音声
認識処理工程と、話者のパスワードが登録されているか
否かを判定する登録判定工程と、話者が発声した発信先
名称と登録されている発信先データとの類似度を算出す
る第2の音声認識処理工程と、発信先名称と発信先デー
タとの類似度の算出結果に基づき電話番号を決定する電
話番号判定工程と、決定された電話番号を発信処理する
発信処理工程とを有することにより、パスワードの発声
および発信先名称の発声により相手先に発信するように
することができるので、話者はID番号をキー入力する
必要が無くなり、操作性が向上し、発信先の登録時およ
び音声認識時の操作に必要な時間が短縮される音声発信
処理方法を実現することができ、また、登録判定工程に
おいて、登録されていないパスワードを発声した話者の
音声ダイヤル機能の利用を禁止すると共にその話者の音
声発信処理を中止するようにして、正規に登録された各
話者だけが装置を利用するようにすることができるの
で、各話者のプライバシーを保護することができる音声
発信処理方法を実現することができる。
されているパスワードとの類似度を算出する第1の音声
認識処理工程と、話者のパスワードが登録されているか
否かを判定する登録判定工程と、話者が発声した発信先
名称と登録されている発信先データとの類似度を算出す
る第2の音声認識処理工程と、発信先名称と発信先デー
タとの類似度の算出結果に基づき電話番号を決定する電
話番号判定工程と、決定された電話番号を発信処理する
発信処理工程とを有することにより、パスワードの発声
および発信先名称の発声により相手先に発信するように
することができるので、話者はID番号をキー入力する
必要が無くなり、操作性が向上し、発信先の登録時およ
び音声認識時の操作に必要な時間が短縮される音声発信
処理方法を実現することができ、また、登録判定工程に
おいて、登録されていないパスワードを発声した話者の
音声ダイヤル機能の利用を禁止すると共にその話者の音
声発信処理を中止するようにして、正規に登録された各
話者だけが装置を利用するようにすることができるの
で、各話者のプライバシーを保護することができる音声
発信処理方法を実現することができる。
【図1】本発明の一実施例に係る音声ダイヤル装置を示
す装置ブロック図
す装置ブロック図
【図2】図1の装置のCPUにおける機能実現手段を示
す機能ブロック図
す機能ブロック図
【図3】図2の装置におけるパスワード登録処理の動作
を示すフローチャート
を示すフローチャート
【図4】図2の装置における発信先登録処理の動作を示
すフローチャート
すフローチャート
【図5】図2の装置における音声発信処理の動作を示す
フローチャート
フローチャート
【図6】パスワードデータファイルを示すファイル図
【図7】発信先データファイルを示すファイル図
1 マイク 2 CPU 3 ROM 4 RAM 5 PBX装置 21 音声信号入力手段 22 音声特徴抽出手段 23 登録・認識制御手段 24 音声認識処理手段 25 発信処理手段 41 パスワードデータ格納部 42 発信先データ格納部
Claims (3)
- 【請求項1】音声信号を入力してデジタル値に変換する
音声信号入力手段と、フレーム分割と各フレームの音声
特徴量の算出とを行なう音声特徴抽出手段と、発信先デ
ータの登録と認識とを制御する登録・認識処理制御手段
と、各話者が登録したパスワードデータを格納するパス
ワードデータ格納部と、各話者が登録した発信先データ
を話者別にラベルを付けて格納する発信先データ格納部
と、入力された音声の特徴量と登録されたパスワードデ
ータ群又は発信先データ群との類似度を計算し、最も類
似したパスワードデータ又は発信先データを出力する音
声認識処理手段と、前記最も類似した発信先データと登
録された発信先番号とを照らし合わせてPBXに発信を
要求する発信処理手段とを備えたことを特徴とする音声
ダイヤル装置。 - 【請求項2】前記登録・認識処理制御手段は、登録され
ていないパスワードを発声した話者の音声ダイヤル機能
の利用を禁止すると共に前記話者の音声発信処理を中止
することを特徴とする請求項1記載の音声ダイヤル装
置。 - 【請求項3】話者が発声したパスワードと登録されてい
るパスワードとの類似度を算出する第1の音声認識処理
工程と、前記話者のパスワードが登録されているか否か
を判定する登録判定工程と、前記話者が発声した発信先
名称と登録されている発信先データとの類似度を算出す
る第2の音声認識処理工程と、前記発信先名称と発信先
データとの類似度の算出結果に基づき電話番号を決定す
る電話番号判定工程と、前記決定された電話番号を発信
処理する発信処理工程とを有することを特徴とする音声
発信処理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7147227A JPH08340378A (ja) | 1995-06-14 | 1995-06-14 | 音声ダイヤル装置および音声発信処理方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7147227A JPH08340378A (ja) | 1995-06-14 | 1995-06-14 | 音声ダイヤル装置および音声発信処理方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08340378A true JPH08340378A (ja) | 1996-12-24 |
Family
ID=15425452
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7147227A Pending JPH08340378A (ja) | 1995-06-14 | 1995-06-14 | 音声ダイヤル装置および音声発信処理方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08340378A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1107545A1 (en) * | 1999-03-12 | 2001-06-13 | Chaw Khong Technology Co., Ltd. | Voice dialing system |
| JP2002544611A (ja) * | 1999-05-10 | 2002-12-24 | ギーゼッケ ウント デフリエント ゲーエムベーハー | プロセッサスマートカードの第1使用保護用デバイス |
| US6647097B1 (en) | 1997-06-19 | 2003-11-11 | Matsushita Electric Industrial Co., Ltd. | Telephone system for voice recognition |
-
1995
- 1995-06-14 JP JP7147227A patent/JPH08340378A/ja active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6647097B1 (en) | 1997-06-19 | 2003-11-11 | Matsushita Electric Industrial Co., Ltd. | Telephone system for voice recognition |
| EP1107545A1 (en) * | 1999-03-12 | 2001-06-13 | Chaw Khong Technology Co., Ltd. | Voice dialing system |
| JP2002544611A (ja) * | 1999-05-10 | 2002-12-24 | ギーゼッケ ウント デフリエント ゲーエムベーハー | プロセッサスマートカードの第1使用保護用デバイス |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0969644B1 (en) | Electronic apparatus with fingerprint recognition | |
| US6370506B1 (en) | Communication devices, methods, and computer program products for transmitting information using voice activated signaling to perform in-call functions | |
| US8280021B2 (en) | Method for managing information in a telephone and telephone for managing information | |
| US6370235B1 (en) | Unsolicited phone call removal system | |
| JP3765924B2 (ja) | 予約登録システム及び記憶媒体 | |
| JPH08340378A (ja) | 音声ダイヤル装置および音声発信処理方法 | |
| JP4157077B2 (ja) | 電話機 | |
| US20040015353A1 (en) | Voice recognition key input wireless terminal, method, and computer readable recording medium therefor | |
| JP3792022B2 (ja) | 発信元表示システム並びにそのための交換機,電話回線管理センタおよびプログラム記憶媒体 | |
| JPH1174964A (ja) | 通信装置 | |
| JPH10164210A (ja) | 携帯電話機 | |
| JP5010131B2 (ja) | 認証方法、認証システム、認証サーバ、通話端末、及び認証プログラム | |
| JP2008271590A (ja) | 電話機およびプログラム | |
| KR100854395B1 (ko) | 지문인식 관리기능을 이용하는 공용 전화기시스템의 제어방법 | |
| JP2004328144A (ja) | 電話機及び電話装置 | |
| JP2692826B2 (ja) | 構内交換機 | |
| JPH08289005A (ja) | パスワード照合方式 | |
| JP3298533B2 (ja) | 電話端末における発信者番号表示規制装置および方法 | |
| JPH0730871A (ja) | テレビ電話装置 | |
| JPH103294A (ja) | 携帯電話機 | |
| JPH0965392A (ja) | ボタン電話装置 | |
| JPH07170507A (ja) | テレビ電話装置 | |
| JP2000270052A (ja) | Isdn通信端末装置 | |
| JPH0420055A (ja) | 電話端末装置 | |
| JP4710523B2 (ja) | ボタン電話装置 |