JPS61215595A - 音声認識装置の音素学習方式 - Google Patents

音声認識装置の音素学習方式

Info

Publication number
JPS61215595A
JPS61215595A JP60057496A JP5749685A JPS61215595A JP S61215595 A JPS61215595 A JP S61215595A JP 60057496 A JP60057496 A JP 60057496A JP 5749685 A JP5749685 A JP 5749685A JP S61215595 A JPS61215595 A JP S61215595A
Authority
JP
Japan
Prior art keywords
words
word
phoneme
phonemes
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60057496A
Other languages
English (en)
Inventor
増村 利行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60057496A priority Critical patent/JPS61215595A/ja
Publication of JPS61215595A publication Critical patent/JPS61215595A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 1亙皇1 本発明は音声認識装置における音素学習方式に関し、特
に特定話者の発声音素を学習するために必要な学習用単
語の選択方式に関するものである。
1米且I 特定話者の発声する音声を夫々パターン認識してこれを
識別するようにした音声認識装置があり、例えば宅配用
の小荷物等を配送先地区別に仕訳する際に、特定作業者
の1発声する音声にてこの仕訳作業を自動的に行うシス
テムにおいて使用されている。
かかる装置では、配送の仕訳に必要な地区夫々の固有名
詞が1つの単語として、第3図に示す如く単語辞書に格
納されている。図において、Wl 。
W2 、・・・・・・Wi、・・・・・・Wnは音素系
列の型式で表現された例えば上記のごとき地域名であり
、この順に単語辞書内に登録されており、この単語辞書
内に登録されている各単語を構成する全音素については
夫々標準の音素パターンが別の記憶部に登録されている
作業者である特定話者がこのシステムを使用する場合に
は、予め音声認識装置に対して特定話者の発声する各音
素のパターンを学習認識させておく必要がある。かかる
学習のための従来方式では、単語辞書に登録されている
単語類W1 、 W2 、・・・・・・Wi、・・・・
・・wnに特定話者に対して発声を要求してこのときの
各発声音素のパターンをm!して学習するようになって
いる。
いま、仮にi番目の単語Wiを発声した時点で全音素の
学習が終了したとすれば、それまでに特定話者が発声し
た単語数はiとなる。しかしながら、かかる従来の学習
方式で学習す・るに必要な選択単語数1は、単語辞書に
含まれる全音素を学習するために必要な最小の単語数と
はならないので、話者に対する負担が増大するという欠
点を有している。
及IJとl仰 本発明は上記従来の欠点を除去すべくなされたものであ
り、その目的とするところは、単語辞書に含まれる全音
素を学習する際に学習のために選択する単語数を最小と
するようにした音声認識装置における音素学習方式を提
供することにある。
発明の構成 本発明による音素学習方式は、音素系列の形で表現され
る複数の単語からなる単語辞書から単語を選択して単語
辞書に含まれる全音素を学習するようにした音声認識装
置における音素学習方式であって、他のいずれの単語に
も含まれない音素を含む単語を予め選択する選択手段と
、この選択手段により選択された単語以外の残余の単語
から抽出すべき抽出単語数を1から順に1づつ増加する
ように設定する抽出数設定手段と、この設定された個数
の単語を前記残余の単語から任意に組合わせて抽出しこ
の抽出された組合わせ単語の中に、選択手段において選
択判断対象となった前記他のいずれの単語にも含まれな
い音素を除いた全音素が含まれているか否かを判定する
判定手段とを設け、この判定結果が否である場合には単
語抽出の組合わ−せを変化させ、またこの組合わせの変
化の過程でも判定結果が否である場合には単語抽出数を
順次1つづ増加して当該判定を行い、判定結果が肯定で
あれば、そのときのm個の抽出単語と選択手段による選
択単語とを音素学習用の選択単語としてなることを特徴
とする。
友皇旦 以下、図面を用いて本発明の詳細な説明する。
第1図は本発明の実施例の概略ブロック図であり、1は
マイクロホン、2は音声入力部、3は音声認識部、4は
単語辞書部、5は音素標準パターン部、6は制御部、7
はメモリ部、8は表示部。
9は学習に必要な単語を選択抽出する単語選択抽出部、
10は単語抽出数を設定する抽出数設定部。
11は音素判定部である。
単語選択抽出部9は単語辞書部4から後述する所定の基
準で各単語を選択し抽出する機能を有する。単語抽出数
設定部10は単語抽出部9の抽出時の単語抽出数mを設
定するものであり、制御部6からの指示にもとすいてそ
の数mを1づつ増加するようになっている。音素判定部
11は選択抽出された単語の音素を後述する基準に従っ
て夫々判定するものであり、この判定結果により制御部
6が各部へ指示を発生するようになっている。
学習に必要な単語として選択された単語はメモリ部7に
格納され、制御部6の指示により順次このメモリ部7か
ら選択された単語が導出されて表示部8に表示され、話
者に対してその発声を促す。
、話者により発声された各単語は音声入力部2において
特徴パラメータが夫々抽出され、認識部3ではこの表示
ili語に含まれているどの音素と抽出したパラメータ
とが対応するかが照合される。かかる処理がすべての選
択された単語に対して行われ、選択単語についてすべて
処理されると、制御部6は各音素に対応する特徴パター
ンを用いて各音素の標準パターンを算出し、その結果を
音素標準パターン部5へ登録格納するのである。
第2図は第1図の装置の動作手順を示すフロー図であり
、まず単語辞書中に含まれる全音素を求め  −他のい
ずれの単語にも含まれ ない音素を含む単語が存在する場合にはその単語(1個
に限られず複数ある場合もある)を求めて単語辞書部の
全単語からその単語を選択する(ステップ12.13)
。かかる選択動作は単語選択部9によりなされる。この
選択された単語が全単語から除かれ、またこの該当音素
も全音素から除かれる(ステップ14)。
しかる後に当該選択された単語が除かれた全単語から任
意に抽出すべき単語数mが抽出数設定部10にて設定さ
れるが最初はこの数mは1に設定され(ステップ15)
、以後は順次1つづ増加する様に設定される。この最初
の11mの抽出単語が全音素(但し、ステップ12で判
断対象となった音素は除くものとし、以下同様である)
を含んでいるかどうかが判定部11にて判定されるが、
判定結果が否であれば、他の単語を1個抽出することに
なる。この1個についても同様に全音素を含むか否か判
定され(ステップ19.16.17)他の全ての各単語
が全音素を含まなければ、抽出数mが2に変更される(
ステップ20)。
同様に任意の2個の単語が抽出されこの2個の抽出単語
の組合わせが、全音素を含んでいるかどうかの判定がな
される。判定結果が否であれば、2個の単語の抽出態様
を変え他の2個の単語を抽出して同様に判定するのであ
る。すべての2個の抽出単語についての判定結果が否で
あれば、抽出数mが3となり、3個の抽出単語の組合わ
せについてこれまた同様に判定される。抽出単語の組合
わせにつきすべて判定結果が否であれば、m−=4とな
り順次抽出数を増大して単語の組合わせを増やして音素
の判定を行なうのである。
ある抽出数m−jにおけるある抽出単語の組合わせにて
この組合わせが全音素を含んでいることが判定されれば
(ステップ17)、そのときのm−j@の単語の各々を
求め(ステップ21)、ステップ13及びステップ21
にて求められた単語を学習に必要な単語として決定し、
メモリ部7へ格納しておく。
こうして選択された単語群に含まれる音素は、単語辞書
に含まれる全単語の全音素を必ず含んでいることとなり
、この選択単語群のみを特定話者に発声してもらうよう
にすれば、全音素の学習が可能となる。
尚、ステップ12.13にて単語を予め選択しているの
は、その単語に含まれる音素はこの単語以外に含まれて
おらず、よってその音素を学習するには必要不可欠のも
のであるので予め選択しており、またこうすることによ
り後の処理を軽減するためにも役立つものであるからで
ある。
また、本システムは宅配物の配送仕分けのみならず種々
のシステムの音声認識装置の学習方式に適用可能である
発明の効果 本発明によれば、最小の単語数での学習が可能となり、
学習が極めて簡素化されるので、話者への負担が軽減す
るという効果がある。
【図面の簡単な説明】
第1図は本発明の実施例のブロック図、第2図は第1図
のブロックの動作フロー図、第3図は単語辞書の内容を
説明する図である。 主要部分の符号の説明 4・・・・・・単語辞書部 6・・・・・・制御 9・・・・・・単語選択抽出部 10・・・・・・単語抽出数設定部 11・・・・・・音素判定部

Claims (1)

    【特許請求の範囲】
  1. 音素系列の形で表現される複数の単語からなる単語辞書
    から単語を選択して単語辞書に含まれる全音素を学習す
    るようにした音声認識装置における音素学習方式であっ
    て、他のいずれの単語にも含まれない音素を含む単語を
    予め選択する選択手段と、この選択手段により選択され
    た単語以外の残余の単語から抽出すべき抽出単語数を1
    から順に1づつ増加するように設定する抽出数設定手段
    と、この設定された個数の単語を前記残余の単語から任
    意に組合わせて抽出しこの抽出された組合わせ単語の中
    に、前記選択手段において選択判断対象となつた前記他
    のいずれの単語にも含まれない音素を除いた全音素が含
    まれているか否かを判定する判定手段とを設け、この判
    定結果が否である場合には単語抽出の組合わせを変化さ
    せ、またこの組合わせの変化の過程でも判定結果が否で
    ある場合には前記抽出数を順次1つづ増加して当該判定
    を行い、判定結果が肯定であれば、そのときのm個の抽
    出単語と前記選択手段による選択単語とを音素学習用の
    選択単語としてなることを特徴とする音素学習方式。
JP60057496A 1985-03-20 1985-03-20 音声認識装置の音素学習方式 Pending JPS61215595A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60057496A JPS61215595A (ja) 1985-03-20 1985-03-20 音声認識装置の音素学習方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60057496A JPS61215595A (ja) 1985-03-20 1985-03-20 音声認識装置の音素学習方式

Publications (1)

Publication Number Publication Date
JPS61215595A true JPS61215595A (ja) 1986-09-25

Family

ID=13057331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60057496A Pending JPS61215595A (ja) 1985-03-20 1985-03-20 音声認識装置の音素学習方式

Country Status (1)

Country Link
JP (1) JPS61215595A (ja)

Similar Documents

Publication Publication Date Title
CN112995419B (zh) 一种语音对话的处理方法和系统
JP4446312B2 (ja) 音声認識中に可変数の代替ワードを表示する方法及びシステム
US5797116A (en) Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word
EP1162602B1 (en) Two pass speech recognition with active vocabulary restriction
DE60207742T2 (de) Korrektur eines von einer spracherkennung erkannten textes mittels vergleich der phonemfolgen des erkannten textes mit einer phonetischen transkription eines manuell eingegebenen korrekturwortes
JPS62239231A (ja) 口唇画像入力による音声認識方法
JP2001509285A (ja) 話者依存及び話者非依存音声認識を用いた多局ネットワークの音声制御された機能を作動する方法及び装置
JPH08171375A (ja) 画面制御装置とその方法
JPH11194793A (ja) 音声ワープロ
CN110602334A (zh) 一种基于人机协同的智能外呼方法及系统
CA1239478A (en) Method and apparatus for use in interactive dialogue
JPS61215595A (ja) 音声認識装置の音素学習方式
JPS60159899A (ja) 学習機能付音声認識装置
JPH06175698A (ja) 音声検索装置
JP3100208B2 (ja) 音声認識装置
JPH0217038B2 (ja)
JPS62233830A (ja) 音声処理装置
JPS6191700A (ja) 音声入力装置
JP2635575B2 (ja) 音韻パターン登録方法
JPH05210763A (ja) 自動学習型文字認識装置
JPS58166398A (ja) 音声認識装置における音声辞書登録方式
JPH0792987A (ja) 質問文内容構成方式
JPH0314359B2 (ja)
JPH06208390A (ja) 音声認識装置および音声認識方法
JPS59176792A (ja) 話者識別方式