JPS61215595A

JPS61215595A - 音声認識装置の音素学習方式

Info

Publication number: JPS61215595A
Application number: JP60057496A
Authority: JP
Inventors: 増村　利行
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1985-03-20
Filing date: 1985-03-20
Publication date: 1986-09-25

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】１亙皇１本発明は音声認識装置における音素学習方式に関し、特
に特定話者の発声音素を学習するために必要な学習用単
語の選択方式に関するものである。

１米且Ｉ特定話者の発声する音声を夫々パターン認識してこれを
識別するようにした音声認識装置があり、例えば宅配用
の小荷物等を配送先地区別に仕訳する際に、特定作業者
の１発声する音声にてこの仕訳作業を自動的に行うシス
テムにおいて使用されている。

かかる装置では、配送の仕訳に必要な地区夫々の固有名
詞が１つの単語として、第３図に示す如く単語辞書に格
納されている。図において、Ｗｌ　。

Ｗ２　、・・・・・・Ｗｉ、・・・・・・Ｗｎは音素系
列の型式で表現された例えば上記のごとき地域名であり
、この順に単語辞書内に登録されており、この単語辞書
内に登録されている各単語を構成する全音素については
夫々標準の音素パターンが別の記憶部に登録されている
。

作業者である特定話者がこのシステムを使用する場合に
は、予め音声認識装置に対して特定話者の発声する各音
素のパターンを学習認識させておく必要がある。かかる
学習のための従来方式では、単語辞書に登録されている
単語類Ｗ１　、　Ｗ２　、・・・・・・Ｗｉ、・・・・
・・ｗｎに特定話者に対して発声を要求してこのときの
各発声音素のパターンをｍ！して学習するようになって
いる。

いま、仮にｉ番目の単語Ｗｉを発声した時点で全音素の
学習が終了したとすれば、それまでに特定話者が発声し
た単語数はｉとなる。しかしながら、かかる従来の学習
方式で学習す・るに必要な選択単語数１は、単語辞書に
含まれる全音素を学習するために必要な最小の単語数と
はならないので、話者に対する負担が増大するという欠
点を有している。

及ＩＪとｌ仰本発明は上記従来の欠点を除去すべくなされたものであ
り、その目的とするところは、単語辞書に含まれる全音
素を学習する際に学習のために選択する単語数を最小と
するようにした音声認識装置における音素学習方式を提
供することにある。

発明の構成本発明による音素学習方式は、音素系列の形で表現され
る複数の単語からなる単語辞書から単語を選択して単語
辞書に含まれる全音素を学習するようにした音声認識装
置における音素学習方式であって、他のいずれの単語に
も含まれない音素を含む単語を予め選択する選択手段と
、この選択手段により選択された単語以外の残余の単語
から抽出すべき抽出単語数を１から順に１づつ増加する
ように設定する抽出数設定手段と、この設定された個数
の単語を前記残余の単語から任意に組合わせて抽出しこ
の抽出された組合わせ単語の中に、選択手段において選
択判断対象となった前記他のいずれの単語にも含まれな
い音素を除いた全音素が含まれているか否かを判定する
判定手段とを設け、この判定結果が否である場合には単
語抽出の組合わ−せを変化させ、またこの組合わせの変
化の過程でも判定結果が否である場合には単語抽出数を
順次１つづ増加して当該判定を行い、判定結果が肯定で
あれば、そのときのｍ個の抽出単語と選択手段による選
択単語とを音素学習用の選択単語としてなることを特徴
とする。

友皇旦以下、図面を用いて本発明の詳細な説明する。

第１図は本発明の実施例の概略ブロック図であり、１は
マイクロホン、２は音声入力部、３は音声認識部、４は
単語辞書部、５は音素標準パターン部、６は制御部、７
はメモリ部、８は表示部。

９は学習に必要な単語を選択抽出する単語選択抽出部、
１０は単語抽出数を設定する抽出数設定部。

１１は音素判定部である。

単語選択抽出部９は単語辞書部４から後述する所定の基
準で各単語を選択し抽出する機能を有する。単語抽出数
設定部１０は単語抽出部９の抽出時の単語抽出数ｍを設
定するものであり、制御部６からの指示にもとすいてそ
の数ｍを１づつ増加するようになっている。音素判定部
１１は選択抽出された単語の音素を後述する基準に従っ
て夫々判定するものであり、この判定結果により制御部
６が各部へ指示を発生するようになっている。

学習に必要な単語として選択された単語はメモリ部７に
格納され、制御部６の指示により順次このメモリ部７か
ら選択された単語が導出されて表示部８に表示され、話
者に対してその発声を促す。

、話者により発声された各単語は音声入力部２において
特徴パラメータが夫々抽出され、認識部３ではこの表示
ｉｌｉ語に含まれているどの音素と抽出したパラメータ
とが対応するかが照合される。かかる処理がすべての選
択された単語に対して行われ、選択単語についてすべて
処理されると、制御部６は各音素に対応する特徴パター
ンを用いて各音素の標準パターンを算出し、その結果を
音素標準パターン部５へ登録格納するのである。

第２図は第１図の装置の動作手順を示すフロー図であり
、まず単語辞書中に含まれる全音素を求め　　−他のい
ずれの単語にも含まれない音素を含む単語が存在する場合にはその単語（１個
に限られず複数ある場合もある）を求めて単語辞書部の
全単語からその単語を選択する（ステップ１２．１３）
。かかる選択動作は単語選択部９によりなされる。この
選択された単語が全単語から除かれ、またこの該当音素
も全音素から除かれる（ステップ１４）。

しかる後に当該選択された単語が除かれた全単語から任
意に抽出すべき単語数ｍが抽出数設定部１０にて設定さ
れるが最初はこの数ｍは１に設定され（ステップ１５）
、以後は順次１つづ増加する様に設定される。この最初
の１１ｍの抽出単語が全音素（但し、ステップ１２で判
断対象となった音素は除くものとし、以下同様である）
を含んでいるかどうかが判定部１１にて判定されるが、
判定結果が否であれば、他の単語を１個抽出することに
なる。この１個についても同様に全音素を含むか否か判
定され（ステップ１９．１６．１７）他の全ての各単語
が全音素を含まなければ、抽出数ｍが２に変更される（
ステップ２０）。

同様に任意の２個の単語が抽出されこの２個の抽出単語
の組合わせが、全音素を含んでいるかどうかの判定がな
される。判定結果が否であれば、２個の単語の抽出態様
を変え他の２個の単語を抽出して同様に判定するのであ
る。すべての２個の抽出単語についての判定結果が否で
あれば、抽出数ｍが３となり、３個の抽出単語の組合わ
せについてこれまた同様に判定される。抽出単語の組合
わせにつきすべて判定結果が否であれば、ｍ−＝４とな
り順次抽出数を増大して単語の組合わせを増やして音素
の判定を行なうのである。

ある抽出数ｍ−ｊにおけるある抽出単語の組合わせにて
この組合わせが全音素を含んでいることが判定されれば
（ステップ１７）、そのときのｍ−ｊ＠の単語の各々を
求め（ステップ２１）、ステップ１３及びステップ２１
にて求められた単語を学習に必要な単語として決定し、
メモリ部７へ格納しておく。

こうして選択された単語群に含まれる音素は、単語辞書
に含まれる全単語の全音素を必ず含んでいることとなり
、この選択単語群のみを特定話者に発声してもらうよう
にすれば、全音素の学習が可能となる。

尚、ステップ１２．１３にて単語を予め選択しているの
は、その単語に含まれる音素はこの単語以外に含まれて
おらず、よってその音素を学習するには必要不可欠のも
のであるので予め選択しており、またこうすることによ
り後の処理を軽減するためにも役立つものであるからで
ある。

また、本システムは宅配物の配送仕分けのみならず種々
のシステムの音声認識装置の学習方式に適用可能である
。

発明の効果本発明によれば、最小の単語数での学習が可能となり、
学習が極めて簡素化されるので、話者への負担が軽減す
るという効果がある。

【図面の簡単な説明】

第１図は本発明の実施例のブロック図、第２図は第１図
のブロックの動作フロー図、第３図は単語辞書の内容を
説明する図である。主要部分の符号の説明４・・・・・・単語辞書部６・・・・・・制御９・・・・・・単語選択抽出部１０・・・・・・単語抽出数設定部１１・・・・・・音素判定部

Claims

【特許請求の範囲】

音素系列の形で表現される複数の単語からなる単語辞書
から単語を選択して単語辞書に含まれる全音素を学習す
るようにした音声認識装置における音素学習方式であっ
て、他のいずれの単語にも含まれない音素を含む単語を
予め選択する選択手段と、この選択手段により選択され
た単語以外の残余の単語から抽出すべき抽出単語数を１
から順に１づつ増加するように設定する抽出数設定手段
と、この設定された個数の単語を前記残余の単語から任
意に組合わせて抽出しこの抽出された組合わせ単語の中
に、前記選択手段において選択判断対象となつた前記他
のいずれの単語にも含まれない音素を除いた全音素が含
まれているか否かを判定する判定手段とを設け、この判
定結果が否である場合には単語抽出の組合わせを変化さ
せ、またこの組合わせの変化の過程でも判定結果が否で
ある場合には前記抽出数を順次１つづ増加して当該判定
を行い、判定結果が肯定であれば、そのときのｍ個の抽
出単語と前記選択手段による選択単語とを音素学習用の
選択単語としてなることを特徴とする音素学習方式。