JPS597399A

JPS597399A - 単音節音声認識装置

Info

Publication number: JPS597399A
Application number: JP57115764A
Authority: JP
Inventors: 樺澤　哲; 三船　義照; 英一坪香
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1982-07-02
Filing date: 1982-07-02
Publication date: 1984-01-14

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は単音節の音声を認識する単音節音声認識装置に
関するものである。

従来より提案されている単音節音声認識方法は、入力音
声を子音部分−と母音一部分に区分し、各部分の時間的
に中央部の平均的な特徴パターンを用いて入力音声を認
識する方法である。しかし、子音部分のパターンは時間
的に非定常な場合が多いことは一般的によく知られてお
り、子音部の識別に前記平均的特徴パターンを用いると
、子１等の非定常な特徴が不明瞭になる。そこで、特に
子音部分の識別には、子音区間内の複数フレームの特徴
パターン用いることが望ましい。なおフレーノ、とは、
特徴パターンを発生ずるために、入力音声テークを一定
時間ｊσにザンブリングする際の各ザ／ブリング時点の
ことである。

一方、音声区間内の全フレームのもつ特徴パターンを用
いて入力音声の認識を行う方法も、従来から単音節音声
認識方法として提案されている。

この方法は、前記の方法の欠点を補うことはできるが、
ｔ″Ｊ音部外に関しては比較的長時間（例えば山数１−
　ｍ　ｓ　ｅ　ｃ　：Ｊ“、度）に渡−）て′１漬徴パ
ターンが安定し５ており、前記音声区間の全フレーｊ、
の！￥ｉ微パターンを用いて人力音声の認識を行うとと
（ｒｆ、、必要以１−の時間を費１−結宋となり、ＲＪ
識に要する時間を短縮する／こめ１ても、前述の如く、
前記下均的特ｒ改パターンを）１」いてａ２　ｒｄを行
うことか望外し、い。

従来考案されている乍音節音声、１．ｚ識装Ｆｊ　Ｉｉ
Ｊ：、以１−の様な欠点をｆ］する。

本発明は、以１−の様な欠点を商うと共に、従来提案さ
れているｊｌ’を計部音声認識装置の長所をも持ちあわ
せた、すなわち認識に要する時間を短縮し、／・−１・
゛ウェアに要求される処Ｊｊｉｉの高速ｒヒを１経滅す
ることを目的とする。

１−語用的を達するため、本発明に弔ド１節音声に関し
て、先ず１；ノ音一部分と確信できる部分、即０、音声
区間のＩＭＦ尾の数フレー７、手前の１フレームに関し
て特徴パターンを求め、次に、語頭がら順次！１キ徴パ
ターンを求めて、前記！トｌ！′徴・ζターンとの距離
をＨ１婢し、その距離が予め定められたＩ閾値よりも小
さくなった時点、或いはその距離か［）１扁１：　、！
　＆ｌ　（ｉ１′＋よりも小さくなるフレーノ、が数ツ
レ−７、続いた時点で、１時微パターンを求めるだめの
分析を終Ｊ′Ｌ、既に求められだ慣１トζターンを用い
て人）月等１１ｊの認識を行うように構成ｊｚ　７’（
−（＋以ト、本発明の実Ｍａ列について説明する１、一
本発明の−・実症例のプロ７ノク図を第１図に；ｊ、す
、第１図において、３は音声ｌ区間検出部で、中音部音
声人力１の音声区間を検出し、語（７Ｊ′」と（７！ｊ
　Ｊビに対応した時点を出力する。２は人力音声保持部
で、音声区間検出部３の出力である語頭に対応、した１
［１３点から、語尾に対応した時点捷での音声ｊ−−タ
を保持する。４は特徴パターン発生部で、一定時間７１
ｊＫ　人力Ｍ声保持部２の出力をザンゾリフクＬ　−’
Ｃ特徴パターンを発生するが、捷ず、音声］区間検出部
３の出力であるｉ４４を尾に対１．Ｗ　Ｌだ時点よりも
数フレーノ、手前の時点における特徴パターン（パラメ
ータ）を発生し、特徴パターン保持部５に出力し、次に
、音声区間検出部３の出力である語頭に対応した時点か
ら順次各フレームに対応した特徴・ぐターン（パラメー
タ）を出力する１、そして特徴バターノ保１１゛部６は
、ｘＶ〒Ｃ敗パターン発生部４の出力をｆ！Ｌ’＋する
１、６ば！１−１ｌ′敞バクーン間距ス［１ｉ口つ部で
、ｌ庁徴パターン保１−１部５に保持されるＱ４■敞パ
ターンの・）ら、前記語尾のれフレーノ、手前の時点に
おける１ｌ１１′徴パラメータと、特徴パターン１６　
”ＩＥ　ｙｓｌ（４の出力との！［１徴パタ一ン間距離
を言１のし、該距ガ１を出力Ｊ−る。７にｊ、ＩＡ釘１
〆１’、　ｌｊ　’ｉｌ１部で、？ｉ３敵バクーン間距
、ｆｊｔｌ　Ｍ＋の部６の出力と、予め定められた１閾
値とを比較して入車′ｐＨ定を行い、ｌ咳出力か該）刈
１１ヒ１よりも小さくな−）だ［（１点で、ｌ侍徴パタ
ーン発生部４に！１８徴・ζターンの発生庖・終了さぜ
るだめの信藁を出力すると同時に、！１．！ｌ徴パター
ン保持部らに保持し２ている特徴パラメータを・８で示
される音声識別部に出力さ（Ｌるだめの１゜１−弓を出
ＪＪする。−そして音声識別部８（・１２、！１−１Ｊ
′徴パターン１呆Ｊ寺）τ（（５の出力を用いて入力音
〕！ｊの識別を行い、認識結果を出力する。なお９で示
されるｊｒｊ　’ｒｓ節八声へ１，３識結果は、音声識
別部８の出力である。

第２図に本発明の他の実施例を示す。同図において、入
カンλ声１呆ｊ、＋ｒ部２．富−声１メ間険出部３は、
第１図と全く同様の作用を果すが、特徴パターン発生部
４　に、’Ｉ−、前述の如く一定［１贋；１１１υに人
）Ｊ音７−ｉ−＋保１寺部２の出力をザンブリングして
特徴パターンタ二発生ずるが、捷ず、音声区間検出部３
の出力である語尾に対応しだ１１．’ｊ点よりも数ソレ
ーノ・手前の１１．１点における特徴パラメータを発生
し、特徴パター／保持部５に出力し、次に、８声［ネ間
検出）η１３３の出力である語ｙｔｆｉに対応した１ｌ
ｊｊ点から順次各−ル−ムに対応した特徴パターンを、
特徴・２タ一ン間距丙１ｔ＃？　ＭＱ’一部６とｉ４声
識別部８に出力さｌＬる。そして特徴パターン間距噸記
゛算部６では、特徴パター／保持部５で保１’ｉ’＋さ
れている特徴パターント特徴パターン発生部４の出力と
の４．！１′微パターン間距１４１１を削りし該泪′ｔ
つ結果を１列値判定部γに出力する。　ｊｒ刈１直゛ｒ
１１定部７は、その出力と予め定められたＪｌ　＋直と
を比較し、その出力が閾値よりも小さい時、特徴パター
ン発生部４に特徴パターン発生を終」′させる信号を出
力する。音声識別部８ば、特徴パターン発生部４の出力
を用いて入力音声の識別を行い、：Ｅ２１Ｒ１＃ｉ’ｉ
　、”ｊＬ　ｅを出力するように構成されている。

第１図および第２図に示しだ中看４″節音声認識装首に
おいでその動作を説明すると、遮断周波数５ＫＨ２の低
賊濾彼器を１１Ｂ過しだ人力音声を標本化周波数１０Ｋ
Ｈ２でＡ／Ｄ変換し、離散的信号についてと９声区間検
出部３で例えは、エネルキーレベルを用いて語頭を検出
し、入力ｉイ声１呆省部２で語頭に灯心したｉｖ；点か
ら離数信号の保持を開始する。

そして音声区間検出部３ば、例えはエネルキーレヘルを
用いてｉｆ！ｊ尾を検出した時点で、前記離ｊｉＪｉ、
的伯弓′の保持を終了する。次に！時機パターン発生部
４では、例えば時間幅１２．８　ｍ５ｅｃのノ・ミンク
窓を６．４ｍ５ｅｃずつずらしながら入力音声保持部２
の離散的信号に伺加して、１４次寸でのＰＡＲＣＯＲ係
数を求めるが、寸ず、語尾から１２８ｍ５ｅＣ手＋’ｔ
ｉＪの時点の離ｊ７４的信号について、Ａ’ｌ記ハミン
グ窓をかけて前言己ＰＡＲＣＯＲ係数を求め、特徴パタ
ーン保４−Ｎｉ部５において保持する、３次に、語頭か
ら前記・・ミンク窓を離散的信号に伺加して順次前記Ｐ
ＡＲ−ＣＯＲ係数を求める。そのＰＡＲＣＯＲ係数は、
第１図の構成においてｄｌ、特徴パターン保持部５に全
て保持されるが、第２図の構成例においてに士、音声識
別部８に出力される。次に特徴パターン間距ガ１言ｊ算
部６では、例えば、ｔ１ｎ尾から１２８ｍ５ｅＣ手前の
時点のガ１散的信号について得られだｉ１Ｓ記ＰＡＲ−
ＣＯＲ係数と、語頭より順次イ（Ｉられる前記ＰＡＲＣ
ＯＲ係数とのユークリッド距離を旧すし、該旧の結果を
１閾値判定部７に出力する、閾値’ｌ’ｌｊ定部Ｔては
、例えば、閾（的を０．２とし、１閾値よりも前記ユー
クリッド距離が小さくなった時点で特徴パターン発生を
終了させる信号を出力する。音声識別部８では、この様
にしてイ４＋られだ前記７１．！１′微パターンを用い
て人力音声の識別を行い、言１だ識結果を得ることがで
きる。

なお第１表・第２表・第３表及び第４表ｄ１、それぞれ
、［−ブー１，１−力」、　１ザ−冒　（夕］なるしや
音節音声に関して、音声区間の前半部分のユークリッド
距離の計算結果であり、ｉｆＪ記閾値（０２）よりも小
さくなるフレームに下線を施しである。これらの表にお
いて、”　ＦＲＡＭＥ”は各音節に関するフレーム計り
を４旨し、　”ＤＩＳＴ“′は前古己ニークリット距緋
１を指す。寸／こ、第３図・第４図・第５図及Ｏ・第６
区は、それぞれＩアｌ、　　Ｉ：／ノー１＋　　１−リ
−１゜］り−１なるｔ１′１−￥１節音声に１莫ｊして
、ｇｊｊＨ乃′Ｊから、［）有１；己ユークリッド距Ｆ
ｊｌｔが前記閾）直よりも小さくなるフレーノ・壕での
間の線形；−１１１１によるスペクトル包絡の］１１Ｊ
間変叱を表したものであり、名音節のｒ−音部鋒・／、
）スペクトル的特徴及び母音部分のスベクトノシ的！１
．．！、敞が１．１（ｊ潔に把握できる（第３１〕１〜
第６］゛ン１（′ζ（ｄ、１．７に？識結果もイ・］言
己しである）。

（以Ｆ余１′−■ 第１表。

人力音゛声：／ａ／第２表入力音声：／ｋａ／第３表入力音声：／ｓａ／な上・、本実施例では特徴バター／としてＰＡＲＣＯｆ
（係数を用い、市″漱バター／間距ガ］の尺度と１７で
ユークリッド距（（１１を用い／こが、訪゛ｆ：”（パ
ターンｉ、ＰＡＲ−ＣＯＲ係数に限ることなく、例えば
ノイルタノ・ンクの出力など、人力音声の！特徴を表現
しつるパラメータであれ（・」、良く、−また１１１１
離尺度に関しても、コーークリット距離に限ることなく
、例えし’、−、’　、　１ｌｊＣ１’ｊ距離−やｃｏ
ｓｈ尺度など他の距１４１１尺１１しを用いた場合でも
イ］効である。

Ｌ′Ｊ、Ｊ−のように本発明はｒ−７４部分のイ子に１
１〜間的に非定常なｌ特徴パターンを持つ部分では、該
非定常部分のｌ特徴パターンを得る必要があるか、ｆＵ
、　ｊＫ部分のトηに子盲部分に比べて定′帛でしかも
継続時間の長い部分については、特徴パターンをすべて
のフレーノ、について得る必要は必ずしもなく、！Ｖ１
１″漱パターンを発生ずるだめの分析時間を短縮てき、
ざ再識別部での認識時間も短縮できるとともに、音声識
別部において識別に必２ｙな標（ｑｏパターンのＭも減
少させることもできる。捷だ構成が簡ｉｐ、であり、装
置化が容易であり、その二１−業的価値は友なるものが
ある、１４．１゛ス１而の筒中な説明第１図Ｃ」、」Ｘ発明の−・実施例における中音部音声
１都ｊ織囚ｉｉ’ｊの一ノｒ−１ツク図、第２図（ｒ、
１、本発明の他の実施例におけるｌｌ’ｊ　、ｊＩ＜節
音声認識装涜゛のブａツク図、？Ｊ”、’　３図〜第６
図（・；１スベクトラノ、包絡線の躬−・ビ１図である
。。

２　・・・・人力音声１呆持部、３・・・・高１−！＋
　ｌネ間検出部、４・・・・・・牛胃孜・ぐターン発／
１部、５　・・・・４．、、ｌｒ散・Ｚクーン保１１１
部、６・・・・・！ｉ’４ｊ敗・ζターノ間距ガ目１（
ｑ部、了・・・、１．Ｘ丸］　ｆ１１＋　　土１１云冒
゛年。

代理人の氏名　力゛理士　中　尾　敏　男　ほか１名第
１図７　　　　２４　　　　　に　　　　７第２図第３図第４図／？ＥＳＵＬＴでｋＡ第５図ＲＥＳＵＬＴ＝ＳＡ第６図

Claims

【特許請求の範囲】

単音節音声区間を検出する音声区間検出手段と、検出さ
れた単音節音声を保持する音声保持手段と、音声特徴パ
ターン時系列、Ｘ、Ｘ２．・・・・・ｒ　ＸＮ＋・・・
を発生する特徴パターン発生手段と、前記音声特徴パタ
ーンを保持する特徴パターン保持手段と、！庁徴パター
ン間の距離を泪處ｆ）する計算手段と、前記距蛸１を予
め定められた閾値と比較して大小判定するＩ閾値ｆｌ定
手段とを有し、前記音声区間検出手段で検出された単音
節音声区間の語頭から、順次各フレートの特徴パターン
と前記音−節音声区間の語尾から数フレーム手ＭｉＪの
１フレームの特徴パターンとの距〃１を前記削算手段に
おいて記浮し、前記閾値判定手段において前記距肉［１
が予め定められた閾値よりも小さくなった時点捷での特
徴パターン系列を用いて単音節音声の認識を行うことを
特徴とする単音節音声認識装置。