JPS6346499A - 大語▲い▼単語音声認識方式 - Google Patents

大語▲い▼単語音声認識方式

Info

Publication number
JPS6346499A
JPS6346499A JP61191398A JP19139886A JPS6346499A JP S6346499 A JPS6346499 A JP S6346499A JP 61191398 A JP61191398 A JP 61191398A JP 19139886 A JP19139886 A JP 19139886A JP S6346499 A JPS6346499 A JP S6346499A
Authority
JP
Japan
Prior art keywords
word
speech
recognition
preliminary selection
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61191398A
Other languages
English (en)
Inventor
沢井 秀文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JPS6346499A publication Critical patent/JPS6346499A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、大詰3単語音声認識方式、より詳細には、大
詰9単語音声認識装置における単語の予備選択方式並び
に大語朶単語音声の分類方式に関する。
従来技術 従来、大語受単語音声を認識する方法として、入力音声
中の子音や母音の系列を認識した後に。
子音と母音のラベル系列と大語朶単語のラベル系列との
マツチングを行い、入力音声のラベル系列に最も近いも
のを単語辞書から選択して認識結果とすることがよく行
われているが、この方法は。
入力音声中の音韻のセグメンテーション(切り出し)や
認識が非常に雉しく、認識誤りも生じ易い。
したがって、音韻認識結果を複数候補用意して所謂「音
韻ラティス」と呼ばれる系列と単語辞GF、とのラベル
マツチングを行うために、認識結果を単一に同定するこ
とが難しいといった欠点があった。
目     的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、大語費単語音声の認識を高速に行うために、予め
入力音声中の音韻の特徴に基づいて大分類を行い認識対
象語を限定する方式、及び、認識対象数の多い犬語朶の
単語音声を認識する際に、認識処理時間の短縮および認
識精度の向上のために、認識対象から候補単語を限定す
る単語の予6iff選択方式に関連して、予め大語檗単
語を分類して効率的な辞書検索を行なう方式を提供する
ことを目的としてなされたものである。
眉−一一戊 本発明は、上記目的を達成するために、音声を入力する
ためのマイクロフォン、音声中の特徴的な時系列を求め
るための特徴分析部、大語位単語音声の認識に先立って
単語の候補を選択する予備選択部7予備選択を行う際に
照合する予備選択用辞書、予備選択部で絞られた候補単
語を認識する認識処理部、認識処理の際に参照するため
の単語標準パターン格納部、認識結果を出力する認識結
果出力端子とから成り、入力音声中の先頭の子音。
母音2語中の子音、母音等の分類又は認識結果に基づい
て順次候補単語を絞り込んで予備選択をすること、及び
、音声を入力するためのマイクロフォン、音声中の特徴
的な時系列を求めるための特徴分析部、大語朶単語音声
の認識に先立って単語の候補を選択する予備選択部、予
備選択を行う際に照合する予備選択用辞書、予備選択部
で絞られた候補2丁−語を認識する認識処理部、認識処
理の際に参照するための単語槽べ0パタ一ン格納部、認
識結果を出力する認識結果出力端子とから成り、単語標
準パターンの分類をグループ化したカテゴリー名と固定
したカテゴリー名との階層的なネットワーク構造に基づ
いて行ない、入力された未知音声を前記2種のカテゴリ
ー名に沿って分類して候補単語名を限定することを特徴
としたものである。
以下2本発明の実施例に基づいて説明する。
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図で1図中、1は音声入力用マイクロフォン、
2は音声の特徴抽出部、3は単語の予備選択部、4は予
備選択用辞書格納部、5は認識処理部、6は標準パター
ン(辞書)格納部。
7は認識結果出力部で、マイクロフォン1より入力され
た音声は特徴抽出部2で音声に特有な特徴パラメータの
時系列に変換される。予備選択部3では、この特徴パラ
メータの系列を用いて予め大語党単語辞書から予備選択
用辞書4を作成しておいたものとのマツチングを行って
候補単語を校り込んでおく。認識処理部5では予備選択
部3で絞られた単語について辞書格納部6の単語標傳パ
ターンとのマツチングが行われ、入カバターンに最も近
いパターン名を認識結果として認識結果出力部7に出力
する。
第2図は、単語標準パターンの予備選択処理について説
明するための電気的ブロック線図で、図中、31は処理
開始端子、32は入力音声パターン中の無音区間検出部
、33は継続時間長検出部。
34は語頭Cv分類部(ただし、Cは子音、■は母音を
表わす)、35は語中vCv分類部である。
無音区間検出部32では入力音声中の無音区間を検出し
、主に無音の数や位置に基づいて予め分析しておいた標
準パターンとの差異が大きいパターンについては認識対
象から除外する。同様に、継続時間長検出部33では入
力音声を標準パターンとの長さが大きく異なるもの(通
常は±30%以上)のものを除外する。なお、無音区間
検出部32と継続時間長検出部33の処理と並行して語
頭CV分類部34で入力音声中の先頭のCV(又はV)
の分類及び語中vCv分類部35で語中のVCVの分類
を順次行い、標準パターンの候補を絞り込んでいく。語
頭Cv分類部34での07分類及び語中vC■分順部3
5での767分mにおける母音認識は子音認識に先立っ
て行い、子音の認識率は母音に比べて極めて低いために
大まかな分類を行うのに留める。
第3図は、語頭のCVの分類を示した図であり。
母音Vが/1/の場合である。他の母音についても同様
な分類となる。先頭子音Cの分類は帯域通過フィルタ群
出力のうち低域と高域に特徴が現われることに着目し、
子音の継続フレーム長Fcが、低域ではある閾値FLよ
り大きい場合には、7m。
rl+ br d2g+ Zt yT Wr r/と見
做し、高域において別のある閾値FHより小さければ、
/ S + P r ’j + k+ h/ r大きけ
れば/S/であると分類を行う。このようにして先頭子
音の分類により、認識対象単語の限定を行う。
次に、第4図に語中子音による分類例を示す。
ここで語中子音とは入力音声中の先頭のCV音節の次に
来るvCv音節中の子音を指す。この分類は1図中に示
すように、子音の前に無音区間を生ずるもの/ p r
 tHk + 8 + )1 /、子音部においてパワ
ーのデイツプを生ずるもの/b+drg+z、r/、そ
の他の子音のグループになる。vCV音節の両側の母音
は間の子音に先立って認識しておき、先頭の07分類に
より絞られた単語候補に対してvCv音節による分類を
行ってさらに単語候補を絞っていくことができる。
第5図は、入力音声が[千葉」と発声された場合の音韻
分類の様子を示したものであり、図中、先頭のCv音節
中の母音候補は/ i /と/ u /が得られている
が、予め語中から切り出しておいた母音槽重パターンと
のマツチングにより/ i /と決定される。また、先
頭子音は高域パワーの継続時間から/S+ P+ t+
 k+ h/のいずれかが決定され、同様にして、語中
vCv音簡の母音や子音も決定される。このようにして
、音韻分類に基づく単語の予備選択法では、音声の入力
と並行して順次候補単語を絞り込んでいけるので、高速
な予備選択処理が可能である。最終段の認識処理部5で
は、絞られた候補単語について標1専パターン6を参照
して単語単位のパターンマツチングを行って最小距離を
持つ単語名を認識結果として出力する。
第6図は、第3図及び第4図の子音分類と母音分類に基
づいて大語金単語セットを木構造に分類しておく様子を
表わす図で、図中、Gla、 G、b。
Glcは第3図の子音分類グループを、また、G、a。
G2b、 G2cは第4図の子音分類グループを、a、
i。
u、e、Oは5母音を表わす。入力音声が第5図で述べ
た「千葉」の場合には第6図のGib−)i→a2b、
→aの経路を辿りrTIBAJ を含む単語グループ4
0を大語党単語中から検索してくることを示している。
このように単語セントを木構造に分類しておくことによ
り、単語の検索が高速に行なえる。
第7図は、第1図に示した標7(Qパターン格納部6に
おける単語辞書の分類について説明するための図で、図
中、61a〜61cは第1階層におけるあるカテゴリー
の3グループを示し、63a〜63eは第2階層におけ
る固定されたカテゴリー名、62a〜62cは第3階層
における、前記力テゴリーとは異なるグループ、64a
〜64eは第4階層における固定されたカテゴリー名を
示す。
なお、以下の階層についてもグループ化された階層1り
と固定されたカテゴリーの階層が交互に構成されている
。65□〜65nは、前記階層構造化されたカテゴリー
のルートを辿って決定される標準パターン名である。従
って、W1〜Wnの標準パターン名(単語名)に付随し
てカテゴリーの連鎖の情報が記録されている。例えば、
第8図に示すように、未知入力音声が入力された場合、
音声の先頭部分から適当なセグメンテーションを行ない
、G工。
Fl、 G2. F、と4つのカテゴリーを決定する。
グループG、は、第9U′Aの語頭子音分類でGlbに
 。
1′1ハし、固定カテゴリーF1は母音の/1/と判定
さ九たものとする。同様に、G2は第10図の語中子音
分類のG2bに、属し、F2は母音の/ a /と同定
されたものとする。従って、第7図の651の単語名に
は、例えば、rtiba (千葉)」という地名が入っ
ているわけである。この例では、G、、G2は各々語頭
および語中の子音グループを、また、F□I F2は5
母音を表わしている。また、他の分類方法としては、第
8図の未知入力音声中のカテゴリー分けを各セグメント
毎に認識の信頼度(例えば、音素標準パターンとの照合
距離)を基準にして行なってもよい。即ち、信頼度が高
い場合の音素は固定カテゴリーとし、信頼度が低い場合
の音素はグループカテゴリーとする。そのために、第7
図に示した辞書分類もこの信頼度に暴づいてr皆層構造
化しておく必要のあることは勿論である。
このようにして、入力音声の先頭部分から順にカテゴリ
ーの分類を行なっていくことにより、大語党単語辞書か
ら高速に候補単語を限定していくことが可能となる。ま
た、入力音声中の比較的認識が確実に出来ろ部分と、逆
に不確実な部分とを別の階層として分類しているので、
候補を限定していく際のりジェクト(正解候補が排除さ
れてしまうこと)が生起しにくくなる効果がある。
勲果 以上の説明から明らかなように、本発明によると、入力
音声中の語頭の子音、母音、語中の子音、母音というよ
うに先頭部分から音韻の分類結果や認識結果にJl(づ
いて順次大語堂単語中から候補単語を絞り込んでゆくの
で、音声の入力と並行して予a1u S択処理を行うこ
とができ、高速な認識処理が可能となる。また、入力音
声の先頭部分から順にカテゴリーの分類を行なっていく
ことにより。
犬語堂単語辞−11から高速に候補単語を限定していく
ことが可能となる。更に、入力音声中の比較的L2 o
aが確実に出来る部分と、逆に不確実な部分とを別の階
層として分類しているので、候補を限定していく際のり
ジェクト(正解候補が排除されてしまうこと)が生起し
にくくなる効果がある。
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図、第2図は、標準パターンの予(′1u選択
処理を説明するための電気的ブロック線j4、第3図は
、語頭Cvの分類を示す図、第4図は1.+11中子音
による分類を示す図、第5図は、音シ(1分バ1の一例
を示す図、第6図は、人語堂単語セットの木構造を示す
図、第7図は、標準パターン格納部における単語辞書の
分類を説明するための図、第8図は、カテゴリーの決定
の仕方を説明するための図、第9図及び第10図は、グ
ループ分けの例を示す図である。 1・・・音声入力用マイクロフォン、2・・・音声の特
徴抽出部、3・・・単語の予備選択部、4・・・予備選
択用辞書格納部、5・・・認識処理部、6・・・標準パ
ターン(辞書)格納部、7・・・認識結果出力部、31
・・・処理開始端子、32・・・入力音声パターン中の
無音区間検出部、33・・・継続時間長検出部、34・
・・語頭Cv分分布部35・・・語中VC■分類部、4
0・・単語グループ。 特許出願人   株式会社 リコー 代理人  高 牙 明透ミ゛゛: )′  l〆 ′?・ 第  I  図 M 2 区 第3図 第 4 図 第 5 図 #9.itJ         /iん’ul    
   t’ai、、’olマ=、+ンプx+  −nu
t   −caAAa−L+六友  □  HI   
     、ζlセ青冷彌1s/IF!/1llk/l
h/ −7bHdl/q/1xllri−第6図 第7図

Claims (5)

    【特許請求の範囲】
  1. (1)、音声を入力するためのマイクロフォン、音声中
    の特徴的な時系列を求めるための特徴分析部、大語彙単
    語音声の認識に先立って単語の候補を選択する予備選択
    部、予備選択を行う際に照合する予備選択用辞書、予備
    選択部で絞られた候補単語を認識する認識処理部、認識
    処理の際に参照するための単語標準パターン格納部、認
    識結果を出力する認識結果出力端子とから成り、入力音
    声中の先頭の子音、母音、語中の子音、母音等の分類又
    は認識結果に基づいて順次候補単語を絞り込んでゆく予
    備選択部を有することを特徴とする大語彙単語音声認識
    方式。
  2. (2)、入力音声中の無音区間の検出および入力音声パ
    ターンと標準パターンとの継続時間長の比較を行って標
    準パターン中から候補単語を絞る処理を供用して予備選
    択を行うことを特徴とする特許請求の範囲第(1)項に
    記載の大語彙単語音声認識方式。
  3. (3)、先頭子音分類、先頭部の母音名、語中の子音分
    類、母音名等の分類に基づいて大語彙単語を木構造にグ
    ループ分けした辞書を持つことを特徴とする特許請求の
    範囲第(1)項に記載の大語彙単語音声認識方式。
  4. (4)、音声を入力するためのマイクロフォン、音声中
    の特徴的な時系列を求めるための特徴分析部、大語彙単
    語音声の認識に先立って単語の候補を選択する予備選択
    部、予備選択を行う際に照合する予備選択用辞書、予備
    選択部で絞られた候補単語を認識する認識処理部、認識
    処理の際に参照するための単語標準パターン格納部、認
    識結果を出力する認識結果出力端子とから成り、単語標
    準パターンの分類をグループ化したカテゴリー名と固定
    したカテゴリー名との階層的なネットワーク構造に基づ
    いて行ない、入力された未知音声を前記2種のカテゴリ
    ー名に沿つて分類して候補単語名を限定することを特徴
    とする大語彙単語音声認識方式。
  5. (5)、未知入力音声のセグメント毎に音素等のカテゴ
    リー分類を行ない、各セグメントの音韻分類の信頼性の
    高低に従つて、各セグメントを信頼性の高い場合には固
    定したカテゴリー名に対応させ、信頼性の低い場合には
    グループ化したカテゴリー名に対応させて単語標準パタ
    ーンの分類を階層的なネットワーク構造に基づいて行な
    うことを特徴とする請求範囲(4)項に記載の大語彙単
    語音声認識方式。
JP61191398A 1986-04-18 1986-08-15 大語▲い▼単語音声認識方式 Pending JPS6346499A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP8935686 1986-04-18
JP61-89356 1986-04-18

Publications (1)

Publication Number Publication Date
JPS6346499A true JPS6346499A (ja) 1988-02-27

Family

ID=13968431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61191398A Pending JPS6346499A (ja) 1986-04-18 1986-08-15 大語▲い▼単語音声認識方式

Country Status (1)

Country Link
JP (1) JPS6346499A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004341033A (ja) * 2003-05-13 2004-12-02 Matsushita Electric Ind Co Ltd 音声媒介起動装置およびその方法
JP2007017630A (ja) * 2005-07-06 2007-01-25 Asahi Kasei Corp 音声認識候補文字列選択装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004341033A (ja) * 2003-05-13 2004-12-02 Matsushita Electric Ind Co Ltd 音声媒介起動装置およびその方法
JP2007017630A (ja) * 2005-07-06 2007-01-25 Asahi Kasei Corp 音声認識候補文字列選択装置

Similar Documents

Publication Publication Date Title
CN108305634B (zh) 解码方法、解码器及存储介质
US6243680B1 (en) Method and apparatus for obtaining a transcription of phrases through text and spoken utterances
EP0109190A1 (en) Monosyllable recognition apparatus
NZ263223A (en) Path link passing speech recognition
JPS59121100A (ja) 連続音声認識装置
JPS6383799A (ja) 連続音声認識方式
JPS61219099A (ja) 音声認識装置
JP2002278579A (ja) 音声データ検索装置
JPS6346499A (ja) 大語▲い▼単語音声認識方式
JP2001312293A (ja) 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体
JPS63165900A (ja) 会話音声認識方式
RU2101782C1 (ru) Способ распознавания слов в слитной речи и система для его реализации
Dass The Comparative Analysis of Speech Processing Techniques at Different Stages
JPS6147999A (ja) 音声認識装置
Seman et al. Hybrid methods of Brandt’s generalised likelihood ratio and short-term energy for Malay word speech segmentation
Levinson Some experiments with a linguistic processor for continuous speech recognition
JP2721341B2 (ja) 音声認識方法
JP2862306B2 (ja) 音声認識装置
JPH05303391A (ja) 音声認識装置
JPS58195895A (ja) 単語音声認識装置
JPS6155680B2 (ja)
Rabiner et al. Some preliminary experiments in the recognition of connected digits
JPS63147198A (ja) 単語音声検出方式
JPS61149997A (ja) 音声認識装置
JPH0632021B2 (ja) 日本語音声認識装置