JPS597399A - 単音節音声認識装置 - Google Patents

単音節音声認識装置

Info

Publication number
JPS597399A
JPS597399A JP57115764A JP11576482A JPS597399A JP S597399 A JPS597399 A JP S597399A JP 57115764 A JP57115764 A JP 57115764A JP 11576482 A JP11576482 A JP 11576482A JP S597399 A JPS597399 A JP S597399A
Authority
JP
Japan
Prior art keywords
feature pattern
speech
distance
voice
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57115764A
Other languages
English (en)
Inventor
樺澤 哲
三船 義照
英一 坪香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP57115764A priority Critical patent/JPS597399A/ja
Publication of JPS597399A publication Critical patent/JPS597399A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は単音節の音声を認識する単音節音声認識装置に
関するものである。
従来より提案されている単音節音声認識方法は、入力音
声を子音部分−と母音一部分に区分し、各部分の時間的
に中央部の平均的な特徴パターンを用いて入力音声を認
識する方法である。しかし、子音部分のパターンは時間
的に非定常な場合が多いことは一般的によく知られてお
り、子音部の識別に前記平均的特徴パターンを用いると
、子1等の非定常な特徴が不明瞭になる。そこで、特に
子音部分の識別には、子音区間内の複数フレームの特徴
パターン用いることが望ましい。なおフレーノ、とは、
特徴パターンを発生ずるために、入力音声テークを一定
時間jσにザンブリングする際の各ザ/ブリング時点の
ことである。
一方、音声区間内の全フレームのもつ特徴パターンを用
いて入力音声の認識を行う方法も、従来から単音節音声
認識方法として提案されている。
この方法は、前記の方法の欠点を補うことはできるが、
t″J音部外に関しては比較的長時間(例えば山数1−
 m s e c :J“、度)に渡−)て′1漬徴パ
ターンが安定し5ており、前記音声区間の全フレーj、
の!¥i微パターンを用いて人力音声の認識を行うとと
(rf、、必要以1−の時間を費1−結宋となり、RJ
識に要する時間を短縮する/こめ1ても、前述の如く、
前記下均的特r改パターンを)1」いてa2 rdを行
うことか望外し、い。
従来考案されている乍音節音声、1.z識装Fj Ii
J:、以1−の様な欠点をf]する。
本発明は、以1−の様な欠点を商うと共に、従来提案さ
れているjl’を計部音声認識装置の長所をも持ちあわ
せた、すなわち認識に要する時間を短縮し、/・−1・
゛ウェアに要求される処Jjiiの高速rヒを1経滅す
ることを目的とする。
1−語用的を達するため、本発明に弔ド1節音声に関し
て、先ず1;ノ音一部分と確信できる部分、即0、音声
区間のIMF尾の数フレー7、手前の1フレームに関し
て特徴パターンを求め、次に、語頭がら順次!1キ徴パ
ターンを求めて、前記!トl!′徴・ζターンとの距離
をH1婢し、その距離が予め定められたI閾値よりも小
さくなった時点、或いはその距離か[)1扁1: 、!
 &l (i1′+よりも小さくなるフレーノ、が数ツ
レ−7、続いた時点で、1時微パターンを求めるだめの
分析を終J′L、既に求められだ慣1トζターンを用い
て人)月等11jの認識を行うように構成jz 7’(
−(+以ト、本発明の実Ma列について説明する1、一
本発明の−・実症例のプロ7ノク図を第1図に;j、す
、第1図において、3は音声l区間検出部で、中音部音
声人力1の音声区間を検出し、語(7J′」と(7!j
 Jビに対応した時点を出力する。2は人力音声保持部
で、音声区間検出部3の出力である語頭に対応、した1
[13点から、語尾に対応した時点捷での音声j−−タ
を保持する。4は特徴パターン発生部で、一定時間71
jK 人力M声保持部2の出力をザンゾリフクL −’
C特徴パターンを発生するが、捷ず、音声]区間検出部
3の出力であるi44を尾に対1.W Lだ時点よりも
数フレーノ、手前の時点における特徴パターン(パラメ
ータ)を発生し、特徴パターン保持部5に出力し、次に
、音声区間検出部3の出力である語頭に対応した時点か
ら順次各フレームに対応した特徴・ぐターン(パラメー
タ)を出力する1、そして特徴バターノ保11゛部6は
、xV〒C敗パターン発生部4の出力をf!L’+する
1、6ば!1−1l′敞バクーン間距ス[1i口つ部で
、l庁徴パターン保1−1部5に保持されるQ4■敞パ
ターンの・)ら、前記語尾のれフレーノ、手前の時点に
おける1l11′徴パラメータと、特徴パターン16 
”IE ysl(4の出力との![1徴パタ一ン間距離
を言1のし、該距ガ1を出力J−る。7にj、IA釘1
〆1’、 lj ’il1部で、?i3敵バクーン間距
、fjtl M+の部6の出力と、予め定められた1閾
値とを比較して入車′pH定を行い、l咳出力か該)刈
11ヒ1よりも小さくな−)だ[(1点で、l侍徴パタ
ーン発生部4に!18徴・ζターンの発生庖・終了さぜ
るだめの信藁を出力すると同時に、!1.!l徴パター
ン保持部らに保持し2ている特徴パラメータを・8で示
される音声識別部に出力さ(Lるだめの1゜1−弓を出
JJする。−そして音声識別部8(・12、!1−1J
′徴パターン1呆J寺)τ((5の出力を用いて入力音
〕!jの識別を行い、認識結果を出力する。なお9で示
されるjrj ’rs節八声へ1,3識結果は、音声識
別部8の出力である。
第2図に本発明の他の実施例を示す。同図において、入
カンλ声1呆j、+r部2.富−声1メ間険出部3は、
第1図と全く同様の作用を果すが、特徴パターン発生部
4 に、’I−、前述の如く一定[1贋;111υに人
)J音7−i−+保1寺部2の出力をザンブリングして
特徴パターンタ二発生ずるが、捷ず、音声区間検出部3
の出力である語尾に対応しだ11.’j点よりも数ソレ
ーノ・手前の11.1点における特徴パラメータを発生
し、特徴パター/保持部5に出力し、次に、8声[ネ間
検出)η133の出力である語ytfiに対応した1l
jj点から順次各−ル−ムに対応した特徴パターンを、
特徴・2タ一ン間距丙1t#? MQ’一部6とi4声
識別部8に出力さlLる。そして特徴パターン間距噸記
゛算部6では、特徴パター/保持部5で保1’i’+さ
れている特徴パターント特徴パターン発生部4の出力と
の4.!1′微パターン間距1411を削りし該泪′t
つ結果を1列値判定部γに出力する。 jr刈1直゛r
11定部7は、その出力と予め定められたJl +直と
を比較し、その出力が閾値よりも小さい時、特徴パター
ン発生部4に特徴パターン発生を終」′させる信号を出
力する。音声識別部8ば、特徴パターン発生部4の出力
を用いて入力音声の識別を行い、:E21R1#i’i
 、”jL eを出力するように構成されている。
第1図および第2図に示しだ中看4″節音声認識装首に
おいでその動作を説明すると、遮断周波数5KH2の低
賊濾彼器を11B過しだ人力音声を標本化周波数10K
H2でA/D変換し、離散的信号についてと9声区間検
出部3で例えは、エネルキーレベルを用いて語頭を検出
し、入力iイ声1呆省部2で語頭に灯心したiv;点か
ら離数信号の保持を開始する。
そして音声区間検出部3ば、例えはエネルキーレヘルを
用いてif!j尾を検出した時点で、前記離jiJi、
的伯弓′の保持を終了する。次に!時機パターン発生部
4では、例えば時間幅12.8 m5ecのノ・ミンク
窓を6.4m5ecずつずらしながら入力音声保持部2
の離散的信号に伺加して、14次寸でのPARCOR係
数を求めるが、寸ず、語尾から128m5eC手+’t
iJの時点の離j74的信号について、A’l記ハミン
グ窓をかけて前言己PARCOR係数を求め、特徴パタ
ーン保4−Ni部5において保持する、3次に、語頭か
ら前記・・ミンク窓を離散的信号に伺加して順次前記P
AR−COR係数を求める。そのPARCOR係数は、
第1図の構成においてdl、特徴パターン保持部5に全
て保持されるが、第2図の構成例においてに士、音声識
別部8に出力される。次に特徴パターン間距ガ1言j算
部6では、例えば、t1n尾から128m5eC手前の
時点のガ1散的信号について得られだi1S記PAR−
COR係数と、語頭より順次イ(Iられる前記PARC
OR係数とのユークリッド距離を旧すし、該旧の結果を
1閾値判定部7に出力する、閾値’l’lj定部Tては
、例えば、閾(的を0.2とし、1閾値よりも前記ユー
クリッド距離が小さくなった時点で特徴パターン発生を
終了させる信号を出力する。音声識別部8では、この様
にしてイ4+られだ前記71.!1′微パターンを用い
て人力音声の識別を行い、言1だ識結果を得ることがで
きる。
なお第1表・第2表・第3表及び第4表d1、それぞれ
、[−ブー1,1−力」、 1ザ−冒 (夕]なるしや
音節音声に関して、音声区間の前半部分のユークリッド
距離の計算結果であり、ifJ記閾値(02)よりも小
さくなるフレームに下線を施しである。これらの表にお
いて、” FRAME”は各音節に関するフレーム計り
を4旨し、 ”DIST“′は前古己ニークリット距緋
1を指す。寸/こ、第3図・第4図・第5図及O・第6
区は、それぞれIアl、  I:/ノー1+  1−リ
−1゜]り−1なるt1′1−¥1節音声に1莫jして
、gjjH乃′Jから、[)有1;己ユークリッド距F
jltが前記閾)直よりも小さくなるフレーノ・壕での
間の線形;−1111によるスペクトル包絡の]11J
間変叱を表したものであり、名音節のr−音部鋒・/、
)スペクトル的特徴及び母音部分のスベクトノシ的!1
..!、敞が1.1(j潔に把握できる(第31〕1〜
第6]゛ン1(′ζ(d、1.7に?識結果もイ・]言
己しである)。
(以F余1′−■ 第1表。
人力音゛声:/a/ 第2表 入力音声:/ka/ 第3表 入力音声:/sa/ な上・、本実施例では特徴バター/としてPARCOf
(係数を用い、市″漱バター/間距ガ]の尺度と17で
ユークリッド距((11を用い/こが、訪゛f:”(パ
ターンi、PAR−COR係数に限ることなく、例えば
ノイルタノ・ンクの出力など、人力音声の!特徴を表現
しつるパラメータであれ(・」、良く、−また1111
離尺度に関しても、コーークリット距離に限ることなく
、例えし’、−、’ 、 1ljC1’j距離−やco
sh尺度など他の距1411尺11しを用いた場合でも
イ]効である。
L′J、J−のように本発明はr−74部分のイ子に1
1〜間的に非定常なl特徴パターンを持つ部分では、該
非定常部分のl特徴パターンを得る必要があるか、fU
、 jK部分のトηに子盲部分に比べて定′帛でしかも
継続時間の長い部分については、特徴パターンをすべて
のフレーノ、について得る必要は必ずしもなく、!V1
1″漱パターンを発生ずるだめの分析時間を短縮てき、
ざ再識別部での認識時間も短縮できるとともに、音声識
別部において識別に必2yな標(qoパターンのMも減
少させることもできる。捷だ構成が簡ip、であり、装
置化が容易であり、その二1−業的価値は友なるものが
ある、1 4.1゛ス1而の筒中な説明 第1図C」、」X発明の−・実施例における中音部音声
1都j織囚ii’jの一ノr−1ツク図、第2図(r、
1、本発明の他の実施例におけるll’j 、jI<節
音声認識装涜゛のブaツク図、?J”、’ 3図〜第6
図(・;1スベクトラノ、包絡線の躬−・ビ1図である
。。
2 ・・・・人力音声1呆持部、3・・・・高1−!+
 lネ間検出部、4・・・・・・牛胃孜・ぐターン発/
1部、5 ・・・・4.、、lr散・Zクーン保111
部、6・・・・・!i’4j敗・ζターノ間距ガ目1(
q部、了・・・、1.X丸] f11+  土11云冒
゛年。
代理人の氏名 力゛理士 中 尾 敏 男 ほか1名第
1図 7    24     に    7第2図 第3図 第4図 /?ESULTでkA 第5図 RESULT=SA 第6図

Claims (1)

    【特許請求の範囲】
  1. 単音節音声区間を検出する音声区間検出手段と、検出さ
    れた単音節音声を保持する音声保持手段と、音声特徴パ
    ターン時系列、X、X2.・・・・・r XN+・・・
    を発生する特徴パターン発生手段と、前記音声特徴パタ
    ーンを保持する特徴パターン保持手段と、!庁徴パター
    ン間の距離を泪處f)する計算手段と、前記距蛸1を予
    め定められた閾値と比較して大小判定するI閾値fl定
    手段とを有し、前記音声区間検出手段で検出された単音
    節音声区間の語頭から、順次各フレートの特徴パターン
    と前記音−節音声区間の語尾から数フレーム手MiJの
    1フレームの特徴パターンとの距〃1を前記削算手段に
    おいて記浮し、前記閾値判定手段において前記距肉[1
    が予め定められた閾値よりも小さくなった時点捷での特
    徴パターン系列を用いて単音節音声の認識を行うことを
    特徴とする単音節音声認識装置。
JP57115764A 1982-07-02 1982-07-02 単音節音声認識装置 Pending JPS597399A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57115764A JPS597399A (ja) 1982-07-02 1982-07-02 単音節音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57115764A JPS597399A (ja) 1982-07-02 1982-07-02 単音節音声認識装置

Publications (1)

Publication Number Publication Date
JPS597399A true JPS597399A (ja) 1984-01-14

Family

ID=14670463

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57115764A Pending JPS597399A (ja) 1982-07-02 1982-07-02 単音節音声認識装置

Country Status (1)

Country Link
JP (1) JPS597399A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62212971A (ja) * 1986-03-12 1987-09-18 Clarion Co Ltd オ−デイオ信号の記録/再生方式
JPS62502572A (ja) * 1985-03-18 1987-10-01 マサチユ−セツツ インステイテユ−ト オブ テクノロジ− 音響波形の処理

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62502572A (ja) * 1985-03-18 1987-10-01 マサチユ−セツツ インステイテユ−ト オブ テクノロジ− 音響波形の処理
JPS62212971A (ja) * 1986-03-12 1987-09-18 Clarion Co Ltd オ−デイオ信号の記録/再生方式

Similar Documents

Publication Publication Date Title
Sambur Speaker recognition using orthogonal linear prediction
JPS58130393A (ja) 音声認識装置
JPS6247320B2 (ja)
JPS597399A (ja) 単音節音声認識装置
Sudhakar et al. Automatic speech segmentation to improve speech synthesis performance
Kasi Yet another algorithm for pitch tracking (yaapt)
Kuberski et al. A landmark-based approach to automatic voice onset time estimation in stop-vowel sequences
JPH045198B2 (ja)
JPS6147999A (ja) 音声認識装置
JPS63213899A (ja) 話者照合方式
JPS61128300A (ja) ピツチ抽出装置
JP2891259B2 (ja) 音声区間検出装置
JPS5923398A (ja) 単音節音声認識装置
JPS59149400A (ja) 音声入力装置
Nellore et al. Excitation source and vocal tract system based acoustic features for detection of nasals in continuous speech
JPS5817497A (ja) 音声ピッチ検出装置
JPS63217399A (ja) 音声区間検出装置
Ambikairajah et al. Efficient digital techniques for speech processing.
JPS5925240B2 (ja) 音声区間の語頭検出方式
JPS6126099A (ja) 音声基本周波数抽出方法
JPS6155700A (ja) ピッチ抽出処理方式
JPH026078B2 (ja)
JPH03145167A (ja) 音声認識方式
JPS6069695A (ja) 語頭子音のセグメンテ−ション法
JPS6310437B2 (ja)