JPH02208700A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH02208700A
JPH02208700A JP1030753A JP3075389A JPH02208700A JP H02208700 A JPH02208700 A JP H02208700A JP 1030753 A JP1030753 A JP 1030753A JP 3075389 A JP3075389 A JP 3075389A JP H02208700 A JPH02208700 A JP H02208700A
Authority
JP
Japan
Prior art keywords
user
voice
symbol string
symbol
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1030753A
Other languages
English (en)
Inventor
Junichiro Fujimoto
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1030753A priority Critical patent/JPH02208700A/ja
Publication of JPH02208700A publication Critical patent/JPH02208700A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 1権分立 本発明は、音声認識装置、より詳細には、音声認識装置
におけるパターン登録に関わるものである。
従m 近年、人工知能の研究が活発に行なわれるに従い、コン
ピュータと人間のコミュニケーションの人間的な方法と
して、音声認識が注目されている。
人間とコンピュータの対話が実現しないまでも、すでに
単語音声の認識装置は実用化されている。
音声認識装置には誰の声でも認識できる不特定話者認識
方式と、使用者の声をあらかじめ登録する特定話者方式
があり、認識率と認識できる単語数では特定話者方式が
有利である。ところが特定話者方式では利用する語数が
多くなると登録する負担が大きくなるという欠点がある
。そこで、このような負担をへらすために話者適応と言
う方法が提案された(例えば、音響学会昭和63年春季
講演論文集2−2−13〜2−2−16)。これはあら
かじめ音声の代表的な特徴量を保持しておいて、利用者
の音声にあわせて特徴量を修正するものである。しかる
に、この方法は特徴量の修正の為に多くの計算を必要と
するという問題があった。
且−一一眞 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、多くの計算をすることなく利用者に適した精度の
良い音声認識用の標準特徴パターンを作り、−高認識率
の音声認識装置を提供することを目的としてなされたも
のである。
欅−一威 本発明は、上記目的を達成するために、音声を入力する
ための手段と、入力された音声を特徴量に変換する手段
と、特徴量を格納するメモリーと、格納されている特徴
量と入力された特徴量とを比較する比較手段と、この比
較された結果にもとづいて認識結果を決定する手段と、
決定された結果が正しいか誤りがを知る為の手段を有し
、更に、この知らされた結論に基づいてメモリーの中の
特徴量を修正または変更する手段を有する音声認識装置
において、メモリー中にあらかじめ音声の特徴量とそれ
に対応する記号列を格納するとともに、利用者が任意の
特徴量とそれに対応する記号列を格納可能であって、利
用者が音声を登録するにさきだち、音声の記号列を入力
し、この記号列と、あらかじめ格納されている記号列と
、利用者がすでに登録している記号列の間で類似性を求
め、それぞれの最大の類似度を比較した結果、あらかじ
め格納されている記号列との最大類似度の方が他方より
大きい時、あらかじめ格納されている記号列中の最大類
似度を得た記号列に対応する特徴量に入力された記号列
を対応させて利用者の音声として登録するようにしたこ
と、或いは、メモリー中にあらかじめ音声の特徴量とそ
れに対応する記号列を格納するとともに、利用者が任意
の特徴量とそれに対応する記号列を格納可能であって、
利用者が音声を登録するにさきだち、音声の記号列を入
力し、この記号列と、あらかじめ格納されている記号列
と、利用者がすでにHDしている記号列の間で類似性を
求め、それぞれの最大の類似度を比較した結果、あらか
じめ格納されている記号列との最大類似度の方が他方よ
り小さい時、その記号列に対する発声をうながすととも
に、利用者が登録している記号列中の最大類似度を得た
記号列に対応する音声の発声もうながし、この記号列と
発声によって得られた特徴量を対応させて利用者の音声
として登録するようにしたこと、更には、あらかじめ格
納されている記号列との最大類似度の方が他方より小さ
い時、その記号列に対する発声をうながすとともに、利
用者が登録している記号列中の最大類似度を得た記号列
および特徴量が利用者の音声であるかあ゛らかしめ登録
されていた物の転用であるかを調べ、転用であった場合
のみこれに対応する音声の発声もうながし、この記号列
と発声によって得られた特徴量を対応させて利用者の音
声として登録するようにしたことを特徴としたものであ
る。以下、本発明の実施例に基づいて説明する。
第1図は、請求項第1項に記載された発明の一実施例を
説明するための構成図で、図中、1はマイクロフォン、
2は特徴量抽出部、3.3′は切換えスイッチ、4.5
はメモリー 6は照合部、7は最大類似度抽出部、8は
比較部、9は閾値発生部、1oは更新部、11は結果表
示部、12は最大類似度抽出部、13は照合部、14は
キーボードである。而して、この実施例は、請求項第1
項に記載された発明に対応するもので、音声を入力する
ための手段と、入力された音声を特徴量に変換する手段
と、特徴量を格納するメモリーと、格納されている特徴
量と入力された特徴量とを比較する比較手段と、この比
較された結果にもとづいて認識結果を決定する手段と、
決定された結果が正しいか誤りがを知る為の手段を有し
、更に、この知らされた結論に基づいてメモリーの中の
特徴量を修正または変更する手段を有する音声認識装置
において、メモリー中にあらかじめ音声の特徴量とそれ
に対応する記号列を格納するとともに、利用者が任意の
特徴量とそれに対応する記号列を格納可能であって、利
用者が音声を登録するにさきだち、音声の記号列を入力
し、この記号列と、あらかじめ格納されている記号列と
、利用者がすでに登録している記号列の間で類似性を求
め、それぞれの最大の類似度を比較した結果、あらかし
め格納されている記号列との最大類似度の方が他方より
大きい時、あらかじめ格納されている記号列中の最大類
似度を得た記号列に対応する特徴量に入力された記号列
を対応させて利用者の音声としてWBするようにしたこ
とを特徴としたものである。
第1図に従って説明すると、図示のように、音声を入力
するためのマイク1と、入力された音声を特徴量に変換
する手段2としてバンドパスフィルター群を用いる。し
かし、これはバンドパスフィルター群に限るものではな
くLPGなどの良く知られているものでもよい。特徴量
を格納するメモリーは、利用者が任意の特徴量とそれに
対応する記号列を格納可能なメモリー4と、あらかじめ
音声の特徴量とそれに対応する記号列が格納されている
メモリー5で構成されている。メモリー4に登録されて
いる特徴量(標準パターン)と入力された特徴量とを照
合部13で比較照合し、この照合され計算された類似度
の一番大きなものを最大類似度抽出部12にて認識結果
と決定し、結果表示部11にて表示する。その結果が正
しいか誤っているかをキーボード14から入力し正しい
場合は、入力されたパターンによってメモリー4の中の
該当特徴量を更新する。正解であるが類似度が低い場合
も更新しても良い。誤っていた場合は入力されたパター
ンによってメモリー4の中の該当特徴量を置き換える。
この認識の照合方法はよく知られたものがいくつかあり
、ここではとくにその方法を限定するものではない。ま
ず、利用に先立ち利用者は音声を登録するためにスイッ
チ3.3′をa側へ倒す。この時、2つのスイッチ3.
3′は連動される。キーボード14から登録すべき言葉
の綴りを入力する。仮にメモリー5の中にはあらかじめ
音声の特徴量とそれに対応する記号列として「0」から
「9」が格納されているとし、利用者がすでに「千」、
「万」、と登録して、いま「億」と登録しようとしたと
する。okUと入力し、この記号列と、あらかじめ格納
されている記号列と、利用者がすでに登録している記号
列の間で類似性を求める。メモリー4の中の「千」、「
万」と類似性を求め、次にメモリー5の中の「o」から
「9」と類似性を比較した結果、「6」との類似度が最
大となり、「6」の特徴パターンを「億」の標準パター
ンとして登録する。
記号列の類似性はローマ字でつづった2つのことばを比
較して、両者の母音の類似性とその位置によって決めれ
ば良い、最終的にメモリー4のなかに登録される言葉間
に大した類似がない場合、これで正しい認識が為される
上、認識の類似度が低かったり、誤認識した時にはパタ
ーンが更新される為、利用者は登録したという負担を感
じずに、認識率の良い標準パターンが形成できる。また
、メモリー4の中の言葉の啜りの方が類似性が高い時に
は登録しようとする言葉を発声する。
第2図は、請求項第2項及び第3項に記載された発明の
一実施例を説明するための構成図で、登録された標準パ
ターンの中に類似した綴りの言葉がある時の為に、この
実施例では次の様にした。
メモリー中にあらかじめ音声の特徴量とそれに対応する
記号列を格納するとともに、利用者が任意の特徴量とそ
れに対応する記号列を格納可能であって、利用者が音声
を登録するにさきだち、音声の記号列を入力し、この記
号列と、あらかじめ格納されている記号列と、利用者が
すでに登録している記号列の間で類似性を求め、それぞ
れの最大の類似度を比較した結果、あらかじめ格納され
ている記号列との最大類似度の方が他方より小さい時、
その記号列に対する発声をうながすとともに、利用者が
登録している記号列中の最大類似度を得た記号列に対応
する音声の発声もうながし、この記号列と発声によって
得られた特徴量を対応させて利用者の音声として登録す
るようにしたものである。第2図を用い、第1図と違う
点を説明すると、メモリー4と5の中の両方に類似の言
葉が有った場合、両者を表示して発声し直して正しい音
声で登録し直す。しかし、メモリー4の中の音声はすで
に発声して登録した場合もあり、このような時は同じ言
葉を2回発声することになってしまう。
そこで、請求項第3項の発明のように、あらかじめ格納
されている記号列との最大類似度の方が他方より小さい
時、その記号列に対する発声をうながすとともに、利用
者が登録している記号列中の最大類似度を得た記号列お
よび特徴量が利用者の音声であるかあらかじめSt8さ
れていたものの転用であるかを調べ、転用であった場合
のみこれに対応する音声の発声もうながし、この記号列
と発声によって得られた特徴量を対応させて利用者の音
声として登録するようにした。そのために、第3図に示
すように、メモリー4の中に登録された標準パターンが
メモリー5からの転用なのか実際に発声したものなのか
を表すビット(第3図において、例えば、転用を110
11 、 u Iを“1″として表わす)を設けておき
、メモリー4と5の両方に類似の綴りが有った場合、こ
のビットをチエツクし、先に登録されているパターンが
実際に発声されているものなら、今、登録しようとして
いる言葉だけを発声し、先に登録されているものが転用
であったなら、両方とも発声するようにする。
羞−一来 以上の説明から明らかなように、本発明によると、話者
の負担を少なくして、精度の良い標準パターンを提供で
き、このため、誤りの少ない音声認識装置を実現するこ
とができる。
【図面の簡単な説明】 第1図及び第2図は、それぞれ本発明の詳細な説明する
ための構成図、第3図は、標準パターンのメモリーの一
例を示す図である。 l・・・マイクロフォン、2・・・特微量抽出部。 3.3′・・・スイッチ、4,5・・・メモリー、6・
・・照合部、7・・・最大類似度抽出部、8・・・比較
部、9・・・閾値発生部、10・・・更新部、11・・
・結果表示部。 12・・・最大類似度抽出部、13・・・照合部、14
・・・キーボード、15・・・検索部。 特許出願人  株式会社 リコー

Claims (1)

  1. 【特許請求の範囲】 1、音声を入力するための手段と、入力された音声を特
    徴量に変換する手段と、特徴量を格納するメモリーと、
    格納されている特徴量と入力された特徴量とを比較する
    比較手段と、この比較された結果にもとづいて認識結果
    を決定する手段と、決定された結果が正しいか誤りがを
    知る為の手段を有し、更に、この知らされた結論に基づ
    いてメモリーの中の特徴量を修正または変更する手段を
    有する音声認識装置において、メモリー中にあらかじめ
    音声の特徴量とそれに対応する記号列を格納するととも
    に、利用者が任意の特徴量とそれに対応する記号列を格
    納可能であって、利用者が音声を登録するにさきだち、
    音声の記号列を入力し、この記号列と、あらかじめ格納
    されている記号列と、利用者がすでに登録している記号
    列の間で類似性を求め、それぞれの最大の類似度を比較
    した結果、あらかじめ格納されている記号列との最大類
    似度の方が他方より大きい時、あらかじめ格納されてい
    る記号列中の最大類似度を得た記号列に対応する特徴量
    に入力された記号列を対応させて利用者の音声として登
    録するようにしたことを特徴とする音声認識装置。 2、音声を入力するための手段と、入力された音声を特
    徴量に変換する手段と、特徴量を格納するメモリーと、
    格納されている特徴量と入力された特徴量とを比較する
    比較手段と、この比較された結果にもとづいて認識結果
    を決定する手段と、決定された結果が正しいか誤りがを
    知る為の手段を有し、更に、この知らされた結論に基づ
    いてメモリーの中の特徴量を修正または変更する手段を
    有する音声認識装置において、メモリー中にあらかじめ
    音声の特徴量とそれに対応する記号列を格納するととも
    に、利用者が任意の特徴量とそれに対応する記号列を格
    納可能であって、利用者が音声を登録するにさきだち、
    音声の記号列を入力し、この記号列と、あらかじめ格納
    されている記号列と、利用者がすでに登録している記号
    列の間で類似性を求め、それぞれの最大の類似度を比較
    した結果、あらかじめ格納されている記号列との最大類
    似度の方が他方より小さい時、その記号列に対する発声
    をうながすとともに、利用者が登録している記号列中の
    最大類似度を得た記号列に対応する音声の発声をうなが
    し、この記号列と発声によって得られた特徴量を対応さ
    せて利用者の音声として登録するようにしたことを特徴
    とする音声認識装置。 3、音声を入力するための手段と、入力された音声を特
    徴量に変換する手段と、特徴量を格納するメモリーと、
    格納されている特徴量と入力された特徴量とを比較する
    比較手段と、この比較された結果にもとづいて認識結果
    を決定する手段と、決定された結果が正しいか誤りがを
    知る為の手段を有し、更に、この知らされた結論に基づ
    いてメモリーの中の特徴量を修正または変更する手段を
    有する音声認識装置において、メモリー中にあらかじめ
    音声の特徴量とそれに対応する記号列を格納するととも
    に、利用者が任意の特徴量とそれに対応する記号列を格
    納可能であって、利用者が音声を登録するにさきだち、
    音声の記号列を入力し、この記号列と、あらかじめ格納
    されている記号列と、利用者がすでに登録している記号
    列の間で類似性を求め、それぞれの最大の類似度を比較
    した結果、あらかじめ格納されている記号列との最大類
    似度の方が他方より小さい時、その記号列に対する発声
    をうながすとともに、利用者が登録している記号列中の
    最大類似度を得た記号列および特徴量が利用者の音声で
    あるかあらかじめ登録されていた物の転用であるかを調
    べ、転用であった場合のみこれに対応する音声の発声を
    うながし、この記号列と発声によって得られた特徴量を
    対応させて利用者の音声として登録するようにしたこと
    を特徴とする音声認識装置。
JP1030753A 1989-02-08 1989-02-08 音声認識装置 Pending JPH02208700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1030753A JPH02208700A (ja) 1989-02-08 1989-02-08 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1030753A JPH02208700A (ja) 1989-02-08 1989-02-08 音声認識装置

Publications (1)

Publication Number Publication Date
JPH02208700A true JPH02208700A (ja) 1990-08-20

Family

ID=12312443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1030753A Pending JPH02208700A (ja) 1989-02-08 1989-02-08 音声認識装置

Country Status (1)

Country Link
JP (1) JPH02208700A (ja)

Similar Documents

Publication Publication Date Title
US7574356B2 (en) System and method for spelling recognition using speech and non-speech input
Zue et al. The MIT SUMMIT speech recognition system: A progress report
ES2278763T3 (es) Sistema y procedimiento de reconocimiento de voz con una pluralidad de motores de reconocimiento.
KR100283736B1 (ko) 음성 인식 시스템 어휘 목록으로의 혼동되는 유사 어구 입력 방지 방법 및 시스템
JP6394709B2 (ja) 話者識別装置および話者識別用の登録音声の特徴量登録方法
US7143037B1 (en) Spelling words using an arbitrary phonetic alphabet
US6925154B2 (en) Methods and apparatus for conversational name dialing systems
EP1739546A2 (en) Automobile interface
KR20100083572A (ko) 신호처리장치 및 신호처리장치에서의 음성 인식 방법
US20010056345A1 (en) Method and system for speech recognition of the alphabet
JP2002215184A (ja) 音声認識装置、及びプログラム
KR20210150833A (ko) 음성 인식 기능을 활성화시키는 호출 명령어 설정에 관한 사용자 인터페이싱 장치 및 방법
JPH02208700A (ja) 音声認識装置
JP2000099090A (ja) 記号列を用いた話者認識方法
CN114038462B (zh) 一种语音业务处理方法、电子设备和计算机可读存储介质
JP3663012B2 (ja) 音声による入力装置
JPS60107192A (ja) パタ−ン認識装置
JPH02103597A (ja) 音声認識装置
JPS61175696A (ja) 情報処理方法
JPS63229496A (ja) 音声認識用パタ−ン更新方式
JPS59117632A (ja) 音声入力方式
JP2002196789A (ja) 音声対話装置
TW449734B (en) Keyword spotting method for mandarin speech without using filler models
KR20240112028A (ko) 발음열 유사도를 이용한 음성 자동 학습 시스템 및 방법과 이를 위한 컴퓨터 프로그램
JPH04301695A (ja) 音声認識装置の辞書制御方式