JPS636599A - 単語予備選択方式 - Google Patents

単語予備選択方式

Info

Publication number
JPS636599A
JPS636599A JP61150191A JP15019186A JPS636599A JP S636599 A JPS636599 A JP S636599A JP 61150191 A JP61150191 A JP 61150191A JP 15019186 A JP15019186 A JP 15019186A JP S636599 A JPS636599 A JP S636599A
Authority
JP
Japan
Prior art keywords
word
key
phoneme
words
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61150191A
Other languages
English (en)
Other versions
JPH0575120B2 (ja
Inventor
畑崎 香一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61150191A priority Critical patent/JPS636599A/ja
Publication of JPS636599A publication Critical patent/JPS636599A/ja
Publication of JPH0575120B2 publication Critical patent/JPH0575120B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声認識装置、音声入力装置等において用い
られ、入力音声に出現している可能性の高い単語の認識
用単語辞書等から効率よく選択する音声認mKおける単
語予備選択方式に関する。
(従来技術とその問題点) 音声認識装置、音声入力装置では、通常、認識対象の語
粟をあらかじめ定めておき、入力音声をその語粟中のひ
とつの単語あるいは単語の並びとみなして認識処理を行
なう。認識処理とは例えば、入力音声と語粟中の各単語
の標準パターンとのマツチング、あるいは入力音声の音
素候補系列と語粟中の各単語の音素系列とのマツチング
を行ない、入力音声にもつとも似ている単語または単語
の並びを求めることである。通常、この認識処理には多
大の計算量が必要である。しかも現在、認識対象の語粟
の大きさはますます増加しておυ、それに従って認識処
理に必要々計算量もますます増加している。
そこで、音声が入力されたとき、その入力音声に出現し
ている可能性の高い単語のみを認識対象の語全から容易
に予備的に選択することができるならば、選択された単
語に対してのみ認識処理を行なえばよく、認識処理に必
要な計算量を減少させることが可能となる。
通常、予備選択は入力音声中で安定に検出できる音素ク
ラスによって行なわれる。すなわち、入力音声中にいく
つかのそのような安定な音素クラスが検出されれば、認
識対象の語粟中の単語のうち、少なくともそれらの検出
された音素クラスをまったく含まない単語がその入力音
声中に含まれている確率は非常に小さいという原理を用
いる。
安定に検出できる音素クラスとしては、5母音、摩擦音
および撥音を各クラスとしたシ、あるいは摩擦音、破裂
音等の子音のおおまかな分類を各クラスとすることなど
、あるいは各音素を精度良く検出できるならば各音素を
そのまま音素クラスとすることなどが考えられる。
予備選択では、入力音声から得た1個以上の予備選択の
キーの少なくとも1個を含む単語が選択結果として出力
される。予備選択では、入力音声に含まれる単語が正し
く選択されている限りにおいては、それ以外に選択され
る単語の数が少ないほど有効である。選択される単語の
数を少なくするためには、予備選択のキーの種類を多く
シ、キーの種類の総数に対する、入力音声から得る相異
なるキーの数の割合を小さくすればよい。このために、
従来から、入力音声中に検出された音素クラスのn I
talの組み合わせを長さnのキーとして予備選択を行
なっている。
一方、音声の発声時の調音変化や音素クラス検出部の検
出性能などのために、入力音声中の音素クラスの検出時
には、含まれているはずの音素クラスが脱落したシ、チ
るいは逆に本来存在しない音素クラスが挿入されたりと
いう検出誤りの生ずることがある。従って、検出された
音素クラスの並びのなかの連続する一部の並びだけを予
備選択のキーとして用いるのでは、入力された単語が正
しく選択されない場合が生ずることになる。
以上の理由から、従来は、たとえば文献1「仮橋、損出
“語中部分音素系列の指定による語愛の減少について”
昭和58年日本音響学会講演論文集1−1−3、昭和5
8年10月」、あるいは文献2「特願昭60−1734
22号、音声認識における単語予備選択方式」に示され
ているように、入力音声中に検出された音素クラスの並
びのなかの必ずしも連続しないn個の音素クラスの並び
を予備選択のキーとして用い、このキーを同じ音素クラ
スを必ずしも連続せずに含む単語を選択することにより
、音素クラスの検出具シに対処して、単語の予備選択を
行なっていた。
この場合でも、nを大きくすると、入力音声から得られ
る長さnの相異なるキーの数は増加するが、キーの種類
の総数はそれ以上に増加し、従って、入力音声から得た
キーを含む単語の数はほとんどの場合少なくなシ、有効
な予備選択が行なえる。
(発明が解決しようとしている問題点)しかしながら、
前記の従来技術では、予備選択のキーの長さを一定とし
ていたことに起因する問題点があった。
第1の問題点は、キーの長さに比較して、入力音声に含
まれる単語の長さが十分長くないときに、その単語を選
択するためのキーが正しく得られないことがあるという
点である。
例えば、キー〈使用する音素クラスを、a、  i。
u、e、oの5母音と撥音Xの計6種類とした場合、入
力音声「エイゴデワ」中のこれらの音素クラス列は正し
くは/eioea/であるが、このうちの1の検出に失
敗したとすると予備選択のキーは/eoea/から得る
ことになる。
入力音声中で最大1個の飛び越しを許して並ぶ音素クラ
スをキーとし、キーの長さをn = 3とすると、予備
選択のキーはe−0−ele−0−a%e−e−a、 
o−e−aの4個となる。このキーを用いて予備選択を
行なっても、選択されねばならない単語reigoJは
、これらのキーのいずれもを含まないため、選択されな
い。
また、入力音声中に単語長が2音節以下の単語が含まれ
ている場合は、その単語中のすべての音素クラスを正し
く検出できても、その単語を選択するための長さ3のキ
ーを得ることはできない。
第2の問題点は、反対に、キーの長さく比較して長すぎ
る単語に対しては、その単語に含まれる相異なるキーの
数が多くなることKよシ、その単語が入力音声に含まれ
ないときKも誤って選択されてしまうことが多くなると
いう点である。
例えば、4音節の単語roXseiJ  に含まれる上
述の長さ3のキーはo −X−eXo −X−i。
o−e−t、 X−e  iの4m類であるのに対し、
6音節の単語rmoXdaLteX Jでは0−X−a
、 o −X−1,o−−a−1、o−a−e、 X−
a−t。
X−a−−e、 X−1−eSX−i−XXa−i −
e、 a−1−−Xz a−e −X、 l−e −X
 Ol 2種類となシ、6音節の単語が選択される機会
は4音節の単語の3倍になる。
(問題点を解決するための手段) 前述の問題点を解決するために本願の発明が提供する手
段は、入力音声中の必ずしも連続しないn個の音素クラ
スの並びを長さnのキーとし、前記入力音声から少なく
とも1個のキーを取り出しこれらのキーのいずれかと同
じ音素クラスの並びを必ずしも連続せずに含む単語を予
備選択結果として出力する音声認識における単語予備選
択方式であって、前記入力音声からは複数種類の長さの
キーを取り出し、単語の選択はそれぞれの単語の長さく
応じてあらかじめ定めた長さのキーを用いて行なうこと
を特徴とする。
(作用) 前述の問題点は、予備選択のキーの長さを、認識対象の
語粟中の単語の長さに関わらず一定としていたことに起
因する。
これに対して本発明では、認識対象の語當中のそれぞれ
の単語の長さに応じて最適な長さの予備選択のキーを用
いて、予備選択を行なう。具体的には、短い単語を調べ
るときKは短いキーを用い、長い単語を調べるときには
長いキーを用いる。
これによって、短い単語に対しては、キー長も短いため
に、入力音声中のある音素クラスの検出に失敗しても、
それ以外の音素クラスから予備選択に十分な数のキーを
得ることができる。単語が短すぎてキーがまったく得ら
れなくなるということもない。また、長す単語に対して
は、キーの長さが長くなるために1キーの種類の総数が
多くなる。従って、その総数に対してその単語に含まれ
るキーの数の割合は少なくなシ、すなわち、その単語は
誤って選択されてしまう機会が少なくなる。
複数種類の長さのキーを使用するためKは、入力音声か
ら複数種類の長さのキーを取り出す必要があ夛、従来の
方法よシも仁のための処理量が増加する。しかしながら
、この処理は1つの入力音声に対して1回だけでよく、
その処理量は予備選択全体の処理量に比較すれば模めて
少ない。
(実施例) 以下では、図面を参照しつつ、実施例に従って本発明の
詳細な説明する。
第1図は、本願の発明の一実施例を示すブロック図であ
る。本実施例では、予備選択のキーに使用する音素クラ
スとして、a、  i、  u、  e、  ’の5母
音および撥音Xの6種類を用いる。これらの音素クラス
は入力音声の中では比較的定常状態はあシ、現在の技術
レベルで比較的安定に検出できる。キーの長さとしては
、単語の音節数に応じて例えばn=1. 2. 3. 
4の4徨類を用いる。
入力音声はいったん、音声メモ!7101に記憶される
。音素クラス検出部102は、音声メモリ101の入力
音声から、予備選択のキーの構成要素となる音素クラス
を複数個検出し、音素クラスメモリ103に各音素クラ
スとそれらの入力音声中での位置とを記憶する。音素ク
ラス検出部102において入力音声からこれらの音素ク
ラスを検出するためには、例えば、あらかじめ各音素ク
ラスの1音声フレームあたりの標準パターンを用意して
おき、入力音声の各フレームとそれらの標準パターンと
の類似度を叫べ、ある音素クラスの標準パターンが数フ
レームにわたって連続して高い類似度を示す区間があれ
ば、その音素クラスをその音声区間の音素クラスとして
検出する、という方法が知られている。
例えば、「エイゴデワ」という入力音声から、/eoa
a/  の4個の音素クラスが検出され、それぞれ入力
音声中の位置情報とともに音素クラスメモリ103に記
憶される。
キー検出部104は、音素クラスノそり103から最大
1個の飛び越しを許して取υ出したn個の音素クラスの
列を、長さnのキーとする。第1〜第4のキーメモリに
はそれぞれ長さが1〜4のキーを記憶する。この結果、
第1のキーメモリ105には、e、  o、  aの3
個の相異なる長さ1のキーが記憶される。第2のキーメ
モリ106には、e  O,e−e、o  e)o−a
、e−aの5個の長さ2のキーが記憶される。第3のキ
ーメモリ107には、e−o−eXe−o−a、 e 
−e−a、o−e−aの4個の長さ3のキーが記憶され
る。また、第4のキーメモリtosには、e−o −e
 −aの1個の長さ4のキーが記憶される。
続いて、単語肩択部109が、認識対象の語粟の単語を
記憶する単語辞書110の中のそれぞれの単語について
予備選択を行なう。単語辞書110中のそれぞれの単語
には、予備選択のキーに使用する音素クラスの単語中で
の並びが付与されている。それぞれの単語に対して、ま
ずキー選択部111によって予備選択に用いるキーの長
さが決定され、該当する長さのキーを記憶するキーメモ
リの内容が単語選択部に送られる。本実施例では、単語
の音節数3を用いて、次式によりキー長nを決定する。
n=m1n (max (s−1,l) 、 4 )予
備選択は、単語に付与されている音素クラスの並びと、
キー選択部から送られたキーのそれぞれとを比較するこ
とによって行なわれる。すなわち、キーメモリのいずれ
かのキーの音素クラスの並びを含む単語を予備選択候補
として出力する。このとき例えば、音素クラス検出部1
02における音素クラスの検出誤シが生じても、それに
より2個以上の音素クラスが連続して脱落する確率が非
常に小さいとすると、キーの音素クラスの並びの中に他
の音素クラスが続けて1個までなら挿入されていてもよ
いとする。また同じ理由から、キーの音素クラスのうち
始端あるいは終端の印が与えられているものは、単語の
それぞれ始端あるいは終端から2個目以内の音素クラス
でなけルばならないとする。
例えば、単語辞書110の中の単語reig。
(エイゾ)」に対しては、音節数s = 3よシ上式か
らキー長n=2となる。そこで、長さ2のキーを記憶し
ている第2のキーメモリ106中の5個のキーと、単語
reigo  (エイゾ)」 中の音素クラス列/ei
o/  とが比較される。この結果、キーの1つである
e−oが含まれることがわかるため、この単語は予備選
択結果の1つとして出力される。−方、例えば同じく3
音節の単語r taXgo (夕/ゴ)」は、その中の
音素クラス列は/a  X  o /であるため、前記
05個の長さ2のキーのいずれも含まれないために、選
択されない。
また、例えば5音節以上の長さの単語に対しては、上式
よりキーの長さはn = 4となるが、前記第4のキー
メモリ108にはただ1個のキーしかない。従って、5
音節以上の長さの単語が誤って選択される機会はきわめ
て少なくなる。
以下、単語辞書110の他のすべての単語をζりいても
同様にキーとの比較が行われ、いくつかの単語が予備選
択結果として出力される。
以上、本願の発明の実施例を示したが、予備選択のキー
に使用する音素クラスとしては、実施例で示したものに
限らず、例えば摩擦音、破裂音等の子音のおおまかなり
ラスなど、安定に検出できるものであればよい。また、
各音素を精度よく検出できるならば、それらをそのまま
音素クラスとしてもよい。
また、予備選択に使用するキーの長さは、実施例の組み
合わせに限らず、例えばり、  3. 5のような非連
続の数の組でもよい。
また、単語の長さは、実施例のような音節数に限らず、
疑似音素の数などとしてもよい。
(発明の効果) 以上説明したように、上述の単語retgo(エイゾ)
」の例のごとく、従来の方式ではうまく選択されなかっ
た単語が本発明の方式では正しく選択される。また、長
い単語に対しても、それらが誤って選択されてしまう機
会は少なくなる。
また、前述のように、キーが長くなると、中−の樵類の
総数が増加し、その結果選択される単語の数は少なくな
り、予備選択はよシ有効になる。
本発明の方式を用いると、それぞれの単語に最適な、よ
シ長いキーを用することができるため、よシ有効な予備
選択ができる。
とのように、本発明の方式を用いれば、よシ有効な、か
つ誤シの少ない、音声認識のための単語の予備選択方式
を提供することができる。
【図面の簡単な説明】
第1図は、本発明の一実施例を示すブロック図である。 101・・・音声メモリ、102・・・音素クラス検出
部、103・・・音素クラスメモリ、IO4・・・キー
検出部、lO5〜108・・・キーメモリ、109・・
・単語選択部、110・・・単語辞書、111・・・キ
ー選択部。 代理人 弁理士 本 庄 伸 介 単語 第1図

Claims (1)

    【特許請求の範囲】
  1. 入力音声中の必ずしも連続しないn個の音素クラスの並
    びを長さnのキーとし、前記入力音声から少なくとも1
    個のキーを取り出し、これらのキーのいずれかと同じ音
    素クラスの並びを必ずしも連続せずに含む単語を予備選
    択結果として出力する音声認識における単語予備選択方
    式において、前記入力音声からは複数種類の長さのキー
    を取り出し、単語の選択はそれぞれの単語の長さに応じ
    てあらかじめ定めた長さのキーを用いて行なうことを特
    徴とする単語予備選択方式。
JP61150191A 1986-06-26 1986-06-26 単語予備選択方式 Granted JPS636599A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61150191A JPS636599A (ja) 1986-06-26 1986-06-26 単語予備選択方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61150191A JPS636599A (ja) 1986-06-26 1986-06-26 単語予備選択方式

Publications (2)

Publication Number Publication Date
JPS636599A true JPS636599A (ja) 1988-01-12
JPH0575120B2 JPH0575120B2 (ja) 1993-10-19

Family

ID=15491505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61150191A Granted JPS636599A (ja) 1986-06-26 1986-06-26 単語予備選択方式

Country Status (1)

Country Link
JP (1) JPS636599A (ja)

Also Published As

Publication number Publication date
JPH0575120B2 (ja) 1993-10-19

Similar Documents

Publication Publication Date Title
JP2739945B2 (ja) 音声認識方法
US5440663A (en) Computer system for speech recognition
JP2002278579A (ja) 音声データ検索装置
JPS636599A (ja) 単語予備選択方式
JPS62206598A (ja) 音声認識における単語予備選択方式
US20020052903A1 (en) Text input method
JPS62206597A (ja) 音声認識用単語予備選択方式
JPH04148384A (ja) 辞書照合方式
JPS646514B2 (ja)
JP2918380B2 (ja) 文字認識結果の後処理方法
JPS6344698A (ja) 単語検出方式
JP3094473B2 (ja) 動的計画法照合装置
WO2000031727A1 (en) Optimization device for optimizing a vocabulary of a speech recognition device
JP2839515B2 (ja) 文字読取システム
JPS6232499A (ja) 音声認識における単語予備選択方式
JPH03214198A (ja) ワードスポッティング音声認識方法
JPH067351B2 (ja) 候補列作成装置
JPH0944604A (ja) 文字認識処理方法
JPS599080B2 (ja) 音声認識方法
JPS6344700A (ja) 単語検出方式
JPS6344696A (ja) 単語検出方式
JPS5961899A (ja) 日本語音声入力装置
JPH0546806A (ja) 文字認識方法
JPH07160730A (ja) 全文検索装置
JPS60217490A (ja) 文字認識装置