JPS6127599A - 音声スペクトルの2値化装置 - Google Patents
音声スペクトルの2値化装置Info
- Publication number
- JPS6127599A JPS6127599A JP14903384A JP14903384A JPS6127599A JP S6127599 A JPS6127599 A JP S6127599A JP 14903384 A JP14903384 A JP 14903384A JP 14903384 A JP14903384 A JP 14903384A JP S6127599 A JPS6127599 A JP S6127599A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- spectrum
- peak
- broad
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
肢止分!
本発明は、音声スペクトルの2値化処理装置に関する。
従来肢血
音声スペクトルの2値化処理において、従来は、音声信
号の音声スペクトル例えばフィルタバンクによるスペク
トル分析の結果得られたスペクトルから時間−周波数パ
タンを求め、そのローカルピーク等を2値化処理により
求めるようにしているが、その場合、計算機の内部でソ
フトウェアにより求めたり、ハードウェアで求めている
が、ハードウェアによると並列処理となり大規模になっ
ていた。
号の音声スペクトル例えばフィルタバンクによるスペク
トル分析の結果得られたスペクトルから時間−周波数パ
タンを求め、そのローカルピーク等を2値化処理により
求めるようにしているが、その場合、計算機の内部でソ
フトウェアにより求めたり、ハードウェアで求めている
が、ハードウェアによると並列処理となり大規模になっ
ていた。
旦直
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声認識装置において、音声スペクトルからその
スペクトルの大きさに閾値を設け、その閾値により2値
化するようにし、もって、ある閾値以上の位置検出を簡
易なハードで容易に実現し得るようにしたものである。
特に、音声認識装置において、音声スペクトルからその
スペクトルの大きさに閾値を設け、その閾値により2値
化するようにし、もって、ある閾値以上の位置検出を簡
易なハードで容易に実現し得るようにしたものである。
1威
本発明は、上記目的を達成するため、音声スペクトルの
大きさを閾値を用いて2値化して認識する音声認識装置
において、スペクトルの並列信号を時間軸信号に変換す
る手段と、その時間軸信号から該信号のピーク値を検出
する手段と、その検出されたピーク値ともとの信号とを
比較する手段と、その比較された信号をシフトレジスタ
を用いて時間軸信号のままで2値化演算し、ラッチして
再び並列2値化信号として出力する手段とを有すること
を特徴としたものである。以下、本発明の実施例に基づ
いて説明する。
大きさを閾値を用いて2値化して認識する音声認識装置
において、スペクトルの並列信号を時間軸信号に変換す
る手段と、その時間軸信号から該信号のピーク値を検出
する手段と、その検出されたピーク値ともとの信号とを
比較する手段と、その比較された信号をシフトレジスタ
を用いて時間軸信号のままで2値化演算し、ラッチして
再び並列2値化信号として出力する手段とを有すること
を特徴としたものである。以下、本発明の実施例に基づ
いて説明する。
以下、本発明を例えば、フィルタバーンクによるスペク
トルの分析結果からそのローカルピーク。
トルの分析結果からそのローカルピーク。
ブロード信号を2値化する場合の例について説明する。
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図、第2図は、本発明の動作原理を説明するた
めの図で、図中、1はマルチプレクサ、2は分析処理(
H,P、F)回路、3はピークホールド回路、4は比較
器、5はゼロ検出回路、6はゲート回路、7はピークデ
ータ検出回路。
ロック線図、第2図は、本発明の動作原理を説明するた
めの図で、図中、1はマルチプレクサ、2は分析処理(
H,P、F)回路、3はピークホールド回路、4は比較
器、5はゼロ検出回路、6はゲート回路、7はピークデ
ータ検出回路。
8はブロードデータ検出回路、9は制御ロジック。
10はククミング生成回路、Sはピーク・ブロード切換
えスイッチで、第2図の(A)〜(D)の各信号は、第
1図の(A)〜(D)各部の信号を示しており、例えば
、第2図(A)の信号は、15chの分析出力のある一
定時間間隔で時系列に並べかえた信号、(D)は結果と
して得られる波形のピークデータ(D−b)と、ピーク
の50%のレベルで比較した場合のブロードデータ(D
−c)である。
えスイッチで、第2図の(A)〜(D)の各信号は、第
1図の(A)〜(D)各部の信号を示しており、例えば
、第2図(A)の信号は、15chの分析出力のある一
定時間間隔で時系列に並べかえた信号、(D)は結果と
して得られる波形のピークデータ(D−b)と、ピーク
の50%のレベルで比較した場合のブロードデータ(D
−c)である。
第1図において、入力された15ch並列音声スペクト
ル入力は、マルチプレクサで時間軸に並べかえられ、分
析処理(例えばLOG圧縮H,P、Fフィルター)され
たあと(第2図(A)) 、その零交波が求められ(第
2図(B)) 、ピークホールド出力がリセツトされ、
第2図(C)に示す様な信号を得る。このピークホール
ド出力信号ともとのフィルタ出力とを比較して第2図(
D−a)の比較データを得る。この比較データを第1図
のピークデータ検出回路7及びブロードデータ検出回路
8を用いて第2図(D−b)のピークデータと第2図(
D−c)のブロードデータを得る。
ル入力は、マルチプレクサで時間軸に並べかえられ、分
析処理(例えばLOG圧縮H,P、Fフィルター)され
たあと(第2図(A)) 、その零交波が求められ(第
2図(B)) 、ピークホールド出力がリセツトされ、
第2図(C)に示す様な信号を得る。このピークホール
ド出力信号ともとのフィルタ出力とを比較して第2図(
D−a)の比較データを得る。この比較データを第1図
のピークデータ検出回路7及びブロードデータ検出回路
8を用いて第2図(D−b)のピークデータと第2図(
D−c)のブロードデータを得る。
第3図は、前記信号の流れとその制御を説明するための
タイムチャートで、この2値化回路は、音声認識装置の
特徴抽出部において用いられ、例えば5〜30IIIS
毎に得られる15chフイルタバンクのスペクトル出力
を例えば最小2乗フィルタなどを用いてホルマントのロ
ーカルピークとそのブロード信号を求めるためのもので
あり、第3図(a)はその周期内においてchl 〜c
hl 5. chi 5〜chiと時系列信号に変換さ
れたものである。前述の第2図の動作は各chi〜ch
15の間になされ、ローカルピークデータを求めるため
に得られた比較データ(第2図(D−a))と、制御ロ
ジックにおいて第3図(b)、 (C)のピークアク
ティブ、ピーククロックを生成する。又、ブロードデー
タを用いるために第3図(d)、 (e)、 (f
)、(g)のブロード1アクテイブ、ブロード1クロツ
ク、ブロード2アクテイブ、ブロード2クロツクを生成
する。これらの信号はピーク及びブロードデータを得る
ため後述のピーク、ブロード検出回路の制御信号として
用いる。
タイムチャートで、この2値化回路は、音声認識装置の
特徴抽出部において用いられ、例えば5〜30IIIS
毎に得られる15chフイルタバンクのスペクトル出力
を例えば最小2乗フィルタなどを用いてホルマントのロ
ーカルピークとそのブロード信号を求めるためのもので
あり、第3図(a)はその周期内においてchl 〜c
hl 5. chi 5〜chiと時系列信号に変換さ
れたものである。前述の第2図の動作は各chi〜ch
15の間になされ、ローカルピークデータを求めるため
に得られた比較データ(第2図(D−a))と、制御ロ
ジックにおいて第3図(b)、 (C)のピークアク
ティブ、ピーククロックを生成する。又、ブロードデー
タを用いるために第3図(d)、 (e)、 (f
)、(g)のブロード1アクテイブ、ブロード1クロツ
ク、ブロード2アクテイブ、ブロード2クロツクを生成
する。これらの信号はピーク及びブロードデータを得る
ため後述のピーク、ブロード検出回路の制御信号として
用いる。
第4図は、ピークデータ検出回路7の構成を示す図で、
図中、11.12は15ビツトシフトレジスタ、13は
15ビツト出力ランチで、ピークデータの検出は前述の
比較データの内容をピーククロックに従ってまずchl
から順にシフトレジスタ11に通し、第2図(D)に示
す様にそのl−0の変化点を見い出すとその前のチャン
ネルがピークとなる。その為、比較データが最初の1’
5 chを通過する時点でその処理を行い、次の15
chのシフトレジスタ12に転送する。その変化点を見
いだす手段として前段のシフトレジスタ11のR14と
R15の排他的論理和をとり、その出力とR14の論理
積を求めれば実現する事ができ、その信号列を次のシフ
トレジスタ12に転送すれば、合計30個のピーククロ
ックにおいて、比較データのchi〜ch15のをピー
クデータに変換できる。
図中、11.12は15ビツトシフトレジスタ、13は
15ビツト出力ランチで、ピークデータの検出は前述の
比較データの内容をピーククロックに従ってまずchl
から順にシフトレジスタ11に通し、第2図(D)に示
す様にそのl−0の変化点を見い出すとその前のチャン
ネルがピークとなる。その為、比較データが最初の1’
5 chを通過する時点でその処理を行い、次の15
chのシフトレジスタ12に転送する。その変化点を見
いだす手段として前段のシフトレジスタ11のR14と
R15の排他的論理和をとり、その出力とR14の論理
積を求めれば実現する事ができ、その信号列を次のシフ
トレジスタ12に転送すれば、合計30個のピーククロ
ックにおいて、比較データのchi〜ch15のをピー
クデータに変換できる。
このピークデータをピークアクティブ信号の立ち下がり
エツジで出力データにランチすれば所望のピークデータ
が得られる。
エツジで出力データにランチすれば所望のピークデータ
が得られる。
第5図は、ブロード検出回路8の構成を示す図で、図中
、14は順方向ブロードデータレジスフ。
、14は順方向ブロードデータレジスフ。
15は逆方向ブロードデータレジスタ、16は15ビツ
ト出力ラソチで、第1図のブロードブ〜り検出回路8に
おいてはch 1〜ch 15.ch 15〜ch 1
といった順方向と逆方向の両方向を利用し、第6図の分
析出力(E)とchl〜ch’15の順方向のピークホ
ールド信号の50%のものとを比較し、その順方向50
%比較データ(G)をゼロディテクト信号(F)でゲー
トし、それをブロード1クロツク(e)に従って順方向
シフトレジスタ14に転送する。同様に、逆方向50%
比較データ(H)もゼロディテクト信号(F)でゲート
し、ブロード2クーロンク(g)に従って逆方向シフト
レジスタ15に転送する。ここにこれらの各々のチャン
ネルビットの論理積をとれば該当するブロードデータと
なり、これをブロード2アクテイブ信号(f)の立ち下
がりエツジで出力データラッチ16にランチすれば所望
のブロードデータが得られる事になり、この様にすれば
ある周期内でローカルピークとブロードの2値化データ
が得られる。
ト出力ラソチで、第1図のブロードブ〜り検出回路8に
おいてはch 1〜ch 15.ch 15〜ch 1
といった順方向と逆方向の両方向を利用し、第6図の分
析出力(E)とchl〜ch’15の順方向のピークホ
ールド信号の50%のものとを比較し、その順方向50
%比較データ(G)をゼロディテクト信号(F)でゲー
トし、それをブロード1クロツク(e)に従って順方向
シフトレジスタ14に転送する。同様に、逆方向50%
比較データ(H)もゼロディテクト信号(F)でゲート
し、ブロード2クーロンク(g)に従って逆方向シフト
レジスタ15に転送する。ここにこれらの各々のチャン
ネルビットの論理積をとれば該当するブロードデータと
なり、これをブロード2アクテイブ信号(f)の立ち下
がりエツジで出力データラッチ16にランチすれば所望
のブロードデータが得られる事になり、この様にすれば
ある周期内でローカルピークとブロードの2値化データ
が得られる。
上記装置において、クロックを50 K fizに設定
して上記演算処理を行えばデータ変換時間は1.2ms
で、高速に2値化を行うことができる。また、以上には
ブロードデータをピークの50%に設定した場合につい
て述べたが、この閾値の設定は0〜100%まで第1図
に示した抵抗Rの設定により可能である。
して上記演算処理を行えばデータ変換時間は1.2ms
で、高速に2値化を行うことができる。また、以上には
ブロードデータをピークの50%に設定した場合につい
て述べたが、この閾値の設定は0〜100%まで第1図
に示した抵抗Rの設定により可能である。
訣果
以上の説明から明らかなように、本発明によれば、並列
に出力される音声スペクトルの様な同一時間信号の大き
さを比較しである閾値以上の位置検出を容易に実現する
事がハードで可能となる。
に出力される音声スペクトルの様な同一時間信号の大き
さを比較しである閾値以上の位置検出を容易に実現する
事がハードで可能となる。
また、同一時間に検出されたいくつかの信号を時間軸信
号に変換して時間軸処理するため、信号の大小判別を範
囲を規定して簡便に求めることができる。
号に変換して時間軸処理するため、信号の大小判別を範
囲を規定して簡便に求めることができる。
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図、第2図は、第1図の各部の信号波形図、第
3図は信号の流れとその制御を説明するためのタイムチ
ャート、第4図は、ピークデータ検出回路の構成図、第
5図は、ブロード検出回路の構成図、第6図は、第5図
の回路の動作説明をするための信号波形図である。 1・・・マルチプレクサ、2・・・分析処理(H,P、
F )回路、3・・・ピークホールド回路、4・・・比
較器、5・・・ゼロ検出回路、6・・・ゲート回路、7
・・・ピークデータ検出回路、8・・・ブロードデータ
検出回路、9・・・制御ロジック、10・・・タクミン
グ生成回路。 第 l 図 1fl
フ゛ロード2 ア7グイ7゛(9)
・、プロー)27[
]ノフ第4図 第6図 手続補正書(鵠) 昭和59年9月27日 2、発明の名称 音声スペクトルの2値化装置 3、補正をする者 事件との関係 特許出願人 オオタ り ナカマゴメ 住所 東京都大田区中馬込1丁目3番6号氏名(名称
) (674)株式会 社 リ コ −代表者
浜 1) 広 4、代 理 人 住 所 〒231 横浜市中区不老町1−2−
7シヤトレーイン横浜807号 6、補正の対象 (1)、明細書の発明の詳細な説明の欄7、補正の内容 (1)、明細書第2頁第14行から17行目に記載の「
そのローカルビーク等・・求めているが、」を「そのロ
ーカルピーク等を計算機の内部でソフトウェアにより求
めたり、演算ハードウェアを構成して求めているが、」
に補正する。 (2)、同第3頁第17行から18行目に記載の[以下
、本発明の実施例に基づいて説明する。」を削除する。 (3)、同第4頁第6行目及び第9頁第15行目に記載
のrH−P−FJを「ディジタルうイルター」に補正す
る。 (4)、第5頁第2行から3行目に記載の「零交波」を
「零交叉波」に補正する。 (5)、同第5頁第18行目に記載の「その周期内にお
いてchi〜ch15.Jを「その周期内において15
ch音声スペクトル入力をchi〜ch15、」に補正
する。 (6)、第5図を別紙の通り補正する。 第5図 一゛ フO−[゛テータ出力
ロック線図、第2図は、第1図の各部の信号波形図、第
3図は信号の流れとその制御を説明するためのタイムチ
ャート、第4図は、ピークデータ検出回路の構成図、第
5図は、ブロード検出回路の構成図、第6図は、第5図
の回路の動作説明をするための信号波形図である。 1・・・マルチプレクサ、2・・・分析処理(H,P、
F )回路、3・・・ピークホールド回路、4・・・比
較器、5・・・ゼロ検出回路、6・・・ゲート回路、7
・・・ピークデータ検出回路、8・・・ブロードデータ
検出回路、9・・・制御ロジック、10・・・タクミン
グ生成回路。 第 l 図 1fl
フ゛ロード2 ア7グイ7゛(9)
・、プロー)27[
]ノフ第4図 第6図 手続補正書(鵠) 昭和59年9月27日 2、発明の名称 音声スペクトルの2値化装置 3、補正をする者 事件との関係 特許出願人 オオタ り ナカマゴメ 住所 東京都大田区中馬込1丁目3番6号氏名(名称
) (674)株式会 社 リ コ −代表者
浜 1) 広 4、代 理 人 住 所 〒231 横浜市中区不老町1−2−
7シヤトレーイン横浜807号 6、補正の対象 (1)、明細書の発明の詳細な説明の欄7、補正の内容 (1)、明細書第2頁第14行から17行目に記載の「
そのローカルビーク等・・求めているが、」を「そのロ
ーカルピーク等を計算機の内部でソフトウェアにより求
めたり、演算ハードウェアを構成して求めているが、」
に補正する。 (2)、同第3頁第17行から18行目に記載の[以下
、本発明の実施例に基づいて説明する。」を削除する。 (3)、同第4頁第6行目及び第9頁第15行目に記載
のrH−P−FJを「ディジタルうイルター」に補正す
る。 (4)、第5頁第2行から3行目に記載の「零交波」を
「零交叉波」に補正する。 (5)、同第5頁第18行目に記載の「その周期内にお
いてchi〜ch15.Jを「その周期内において15
ch音声スペクトル入力をchi〜ch15、」に補正
する。 (6)、第5図を別紙の通り補正する。 第5図 一゛ フO−[゛テータ出力
Claims (3)
- (1)、音声スペクトルの大きさを閾値を用いて2値化
して認識する音声認識装置において、スペクトルの並列
信号を時間軸信号に変換する手段と、その時間軸信号か
ら該信号のピーク値を検出する手段と、その検出された
ピーク値ともとの信号とを比較する手段と、その比較さ
れた信号をシフトレジスタを用いて時間軸信号のままで
2値化演算し、ラッチして再び並列2値化信号として出
力する手段とを有することを特徴とする音声スペクトル
の2値化装置。 - (2)、前記比較された直列信号からスペクトルのロー
カルピークをシフトレジスタを用いて検出するローカル
ピーク検出部を有することを特徴とする特許請求の範囲
第(1)項に記載の音声スペクトルの2値化装置。 - (3)、前記比較された直列信号からスペクトルのロー
カルピークからレベルダウンした点のブロード2値化信
号をシフトレジスタを用いて検出するブロード検出部を
有することを特徴とする特許請求の範囲第(1)項記載
の音声スペクトルの2値化装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59149033A JPH0679236B2 (ja) | 1984-07-18 | 1984-07-18 | 音声スペクトルの2値化装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59149033A JPH0679236B2 (ja) | 1984-07-18 | 1984-07-18 | 音声スペクトルの2値化装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6127599A true JPS6127599A (ja) | 1986-02-07 |
| JPH0679236B2 JPH0679236B2 (ja) | 1994-10-05 |
Family
ID=15466194
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59149033A Expired - Lifetime JPH0679236B2 (ja) | 1984-07-18 | 1984-07-18 | 音声スペクトルの2値化装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0679236B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1988001090A1 (fr) * | 1986-07-30 | 1988-02-11 | Ricoh Company, Ltd. | Reconnaissance de la parole |
| JPS6415800U (ja) * | 1987-07-21 | 1989-01-26 | ||
| JP3002200B2 (ja) * | 1986-07-30 | 2000-01-24 | 株式会社リコー | 音声認識 |
-
1984
- 1984-07-18 JP JP59149033A patent/JPH0679236B2/ja not_active Expired - Lifetime
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1988001090A1 (fr) * | 1986-07-30 | 1988-02-11 | Ricoh Company, Ltd. | Reconnaissance de la parole |
| GB2202667A (en) * | 1986-07-30 | 1988-09-28 | Ricoh Kk | Voice recognition |
| GB2202667B (en) * | 1986-07-30 | 1991-03-27 | Ricoh Kk | Voice recognition |
| JP3002200B2 (ja) * | 1986-07-30 | 2000-01-24 | 株式会社リコー | 音声認識 |
| JPS6415800U (ja) * | 1987-07-21 | 1989-01-26 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0679236B2 (ja) | 1994-10-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2014419B3 (es) | Deteccion de señales. | |
| KR980013159A (ko) | 자기 저장 채널을 위한 뉴럴 네트워크 신호 처리기 | |
| CA1124404A (en) | Autocorrelation function factor generating method and circuitry therefor | |
| JPS6127599A (ja) | 音声スペクトルの2値化装置 | |
| Tucker et al. | A pitch estimation algorithm for speech and music | |
| JP2000077990A (ja) | デジタル位相比較器 | |
| JPH02138877A (ja) | 波形記憶装置 | |
| JPS5853257A (ja) | デイジタルデ−タ受信回路 | |
| JPS60201400A (ja) | 音声スペクトルの2値化装置 | |
| JP2556369B2 (ja) | アナログ波形のオーバーシュート位置検出方式 | |
| JPH0320792B2 (ja) | ||
| JPH0234110B2 (ja) | ||
| JPH11273247A (ja) | 記録媒体ドライバのシミュレータ装置 | |
| JP2845007B2 (ja) | トーン検出回路 | |
| JP3472668B2 (ja) | トーン信号検出回路 | |
| JPS58217995A (ja) | 単語音声認識装置 | |
| JPS60167000A (ja) | ピツチ抽出器 | |
| JPH07234908A (ja) | 磁性コード信号の分離処理回路 | |
| JPS5813053A (ja) | 符号一致検出回路 | |
| KR960011844A (ko) | 디지탈 브이씨알(dvcr)의 신호복원장치 | |
| JPS6172435A (ja) | フレ−ム同期検出装置 | |
| JPH0972956A (ja) | 二次レーダにおけるビデオ処理方法および装置 | |
| JPS59102296A (ja) | ピツチ抽出方法 | |
| JPS5659358A (en) | Error detection system of magnetic disk write information | |
| JPH0479513B2 (ja) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| EXPY | Cancellation because of completion of term |