JPH01293429A - 文章作成システム - Google Patents
文章作成システムInfo
- Publication number
- JPH01293429A JPH01293429A JP63124523A JP12452388A JPH01293429A JP H01293429 A JPH01293429 A JP H01293429A JP 63124523 A JP63124523 A JP 63124523A JP 12452388 A JP12452388 A JP 12452388A JP H01293429 A JPH01293429 A JP H01293429A
- Authority
- JP
- Japan
- Prior art keywords
- recording
- recognition
- word
- recorded
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 claims description 11
- 238000012937 correction Methods 0.000 abstract description 33
- 238000012790 confirmation Methods 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 59
- 238000010586 diagram Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 23
- 238000000605 extraction Methods 0.000 description 16
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 235000016496 Panda oleosa Nutrition 0.000 description 6
- 240000000220 Panda oleosa Species 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 210000000078 claw Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- YFZOUMNUDGGHIW-UHFFFAOYSA-M p-chloromercuribenzoic acid Chemical compound OC(=O)C1=CC=C([Hg]Cl)C=C1 YFZOUMNUDGGHIW-UHFFFAOYSA-M 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(イ)産業上の利用分野
本発明は音声認識により文章を作成する装置に関するも
のである。
のである。
〈口) 従来の技術
従来、テープレコーダなどに文章を録音しておき、音声
認識装置に録音文章を再生入力し、文章作成を行なう装
置(特開昭58−158736号)では、作成した文章
の確認中に誤りを発見し、録音再生装置より、画面上に
表示されている誤り部分に相当する部分を聞き返したい
場合、録音再生装置に録音されている文章を始めから聞
き返し、該当する部分を見つけなければならなかった。
認識装置に録音文章を再生入力し、文章作成を行なう装
置(特開昭58−158736号)では、作成した文章
の確認中に誤りを発見し、録音再生装置より、画面上に
表示されている誤り部分に相当する部分を聞き返したい
場合、録音再生装置に録音されている文章を始めから聞
き返し、該当する部分を見つけなければならなかった。
特にシーケンシャルなアクセスしかできないテープレコ
ーダに録音されている文章から、画面上に表示されてい
る誤り個所に対応する部分を捜し出す場合、無音されて
いる文章を聞きながら捜さなくてはならず、非常に手間
がかかった。
ーダに録音されている文章から、画面上に表示されてい
る誤り個所に対応する部分を捜し出す場合、無音されて
いる文章を聞きながら捜さなくてはならず、非常に手間
がかかった。
(ハ)発明が解決しようとする課題
上述の如き従来システムでは、音声認識機能で誤認識し
た部分を録音文章より捜し出す場合、録音文章を再生し
、聞くことによって捜し出さなければならなかった。
た部分を録音文章より捜し出す場合、録音文章を再生し
、聞くことによって捜し出さなければならなかった。
本発明は、かかる点に鑑み、極めて簡単な操作で、所望
する部分を録音再生装置より捜し出し、再生することを
可能にする文章作成システムを提供するものである。
する部分を録音再生装置より捜し出し、再生することを
可能にする文章作成システムを提供するものである。
(ニ)課題を解決するための手段
本発明の文章作成システムは、無音区間検出信号と、区
切り記号を計数するカウンターを設け、かかるカウンタ
ーの値により、録音再生装置を制御するものである。
切り記号を計数するカウンターを設け、かかるカウンタ
ーの値により、録音再生装置を制御するものである。
(ホ〉 作用
本発明システムによれば、区切り記号を計数するカウン
ターは、記憶装置より読み出し、表示装置に表示する部
分に区切り記号があれば、その数を計数していく6次に
、修正の為に表示されている部分に対応する録音文章を
頭出しするときは、録音再生装置より?まわし再生され
る文章中に録音されている無音区間検出信号を計数して
いき、計数値が区切り記号の計数値より1つ小さくなっ
たとき再生を止める。即ち、録音再生装置に録音された
文章は、表示装置に表示きれた文章の誤り部分より一つ
曲の文節(単語)にセットされる事となる。
ターは、記憶装置より読み出し、表示装置に表示する部
分に区切り記号があれば、その数を計数していく6次に
、修正の為に表示されている部分に対応する録音文章を
頭出しするときは、録音再生装置より?まわし再生され
る文章中に録音されている無音区間検出信号を計数して
いき、計数値が区切り記号の計数値より1つ小さくなっ
たとき再生を止める。即ち、録音再生装置に録音された
文章は、表示装置に表示きれた文章の誤り部分より一つ
曲の文節(単語)にセットされる事となる。
くべ)実施例
第1図に本発明を採用して音声入力により文章作成する
デイクチ−ティングマシンの外観図を示し、第2図に該
マシンの機能ブロック図を示す。
デイクチ−ティングマシンの外観図を示し、第2図に該
マシンの機能ブロック図を示す。
第2図に於て、(1)は第1図の本体(100)内に回
路装備された音声認識部であり、その詳細は第3図のブ
ロック図に示す如く、入力音声信号の音圧H1411を
行う前処理部(11)[第4図]、該処理部〈11)か
らの音圧mvi済みの音声信号からその音響特徴を示す
パラメータを抽出する特徴抽出部(12)[第5図]、
該抽出部(12)から得られる特徴パラメータに基づき
入力音声の単語認識を行う単8!認識部(13)[第6
図]と文節I!!識部(14)[第7図]、及びこれら
いずれかの認識部(13)、(14)からの認識結果に
基づき認識単語文字列、或いは認識音節文字の候補を作
成する候補作成部(15)からなる。
路装備された音声認識部であり、その詳細は第3図のブ
ロック図に示す如く、入力音声信号の音圧H1411を
行う前処理部(11)[第4図]、該処理部〈11)か
らの音圧mvi済みの音声信号からその音響特徴を示す
パラメータを抽出する特徴抽出部(12)[第5図]、
該抽出部(12)から得られる特徴パラメータに基づき
入力音声の単語認識を行う単8!認識部(13)[第6
図]と文節I!!識部(14)[第7図]、及びこれら
いずれかの認識部(13)、(14)からの認識結果に
基づき認識単語文字列、或いは認識音節文字の候補を作
成する候補作成部(15)からなる。
更に第2図に於て、(2)は第1図に示す如く本体(1
00)に機械的並びに電気的に着脱可能なテープレコー
ダ等の録音再生装置、(3)は例えば第1図図示の如き
ヘッドホンタイプのマイクロホン、(4)は録音再生装
置(2)とマイクロホン(3)と音声認識部(1)との
あいだの接続切り換えを行う入力切り換え部[第8図]
である。(6)は認識結果に基づき生成した文字列等を
表示するための表示装置、く7)は該デイクチ−ティン
グマシンの各種制御信号を入力するためのキーボード、
く8)は該デイクチ−ティングマシンで生成された文字
列を記憶する磁気ディスク装置等の記憶装置、(9)は
該記憶装置の文字列を規則合成によりスピーカ(10)
から読み上げるための音声合成部゛である。
00)に機械的並びに電気的に着脱可能なテープレコー
ダ等の録音再生装置、(3)は例えば第1図図示の如き
ヘッドホンタイプのマイクロホン、(4)は録音再生装
置(2)とマイクロホン(3)と音声認識部(1)との
あいだの接続切り換えを行う入力切り換え部[第8図]
である。(6)は認識結果に基づき生成した文字列等を
表示するための表示装置、く7)は該デイクチ−ティン
グマシンの各種制御信号を入力するためのキーボード、
く8)は該デイクチ−ティングマシンで生成された文字
列を記憶する磁気ディスク装置等の記憶装置、(9)は
該記憶装置の文字列を規則合成によりスピーカ(10)
から読み上げるための音声合成部゛である。
尚、〈5)はマイクロプロセッサからなる制御部であり
、E記名部の動作の制御を司っている。
、E記名部の動作の制御を司っている。
上述の構成のデイクチ−ティングマシンに依る文章作成
方法としては二通りあり、それぞ゛れに就いて以下に詳
述する。
方法としては二通りあり、それぞ゛れに就いて以下に詳
述する。
第一の方法は、マイク(3)より生音声を音声認識部(
1)に入力し、音声認識を行ない、入力音声を文字列に
変換し、表示装置(6)に表示し、同時に記憶装置(8
)に結果を記憶する。
1)に入力し、音声認識を行ない、入力音声を文字列に
変換し、表示装置(6)に表示し、同時に記憶装置(8
)に結果を記憶する。
第二の方法は、入力したい文章を予め録音再生装置く2
〉に録音しておき、この録音再生装置(2)を本装置に
接続し、録音文章を音声認識部(1)に入力することに
より、音声認識を行ない、入力音声を文字列に変換し、
表示装置(6)に表示し、同時に記憶装置(8)に結果
を記憶する。
〉に録音しておき、この録音再生装置(2)を本装置に
接続し、録音文章を音声認識部(1)に入力することに
より、音声認識を行ない、入力音声を文字列に変換し、
表示装置(6)に表示し、同時に記憶装置(8)に結果
を記憶する。
上述の様に、音声を入力する方法は、二通りあるので、
入力切り換え部(4)において、入力の切り換えを行な
う、また入力切り換え部(4)は、入力の切り換えの他
に、録音再生装置(2)に録音信号〈イ)を録音するの
か、マイク(3)より入力きれた音声を録音するのかの
切り換えも行なう。
入力切り換え部(4)において、入力の切り換えを行な
う、また入力切り換え部(4)は、入力の切り換えの他
に、録音再生装置(2)に録音信号〈イ)を録音するの
か、マイク(3)より入力きれた音声を録音するのかの
切り換えも行なう。
以下に音声録音から文章作成までの動作を順次詳述する
。
。
(i) 音声登録処理
音声認識を行なうに先たち、音声認識に必要な音声の標
準パターンを作成するため、音声登録を行なう。
準パターンを作成するため、音声登録を行なう。
まず、音節登録モードについて述べる。
ここで述べている標準パターンとは、音声認識部(1)
の文節認識部(14)でのパターンマッチィング時の基
準パターンとなるものであり、具体的には第7図の如き
文節認識部(14)の音節標準パターンメモリ(14d
)に格納される。
の文節認識部(14)でのパターンマッチィング時の基
準パターンとなるものであり、具体的には第7図の如き
文節認識部(14)の音節標準パターンメモリ(14d
)に格納される。
本デイクチ−ティングマシンに音声登録する方法は、ま
ず第7図のスイッチ(14sl)を操作しパラメータバ
ッファ(14a)と音節標準パターンメモリ(14d)
とを接続し、次に述べる三方法がある。
ず第7図のスイッチ(14sl)を操作しパラメータバ
ッファ(14a)と音節標準パターンメモリ(14d)
とを接続し、次に述べる三方法がある。
第一の方法は該マシンの本体(100)にマイク(3)
より直接登録音声を入力し、この登録音声を音声認識部
(1)で分析し、標準パターンを作成し、作成した標準
パターンを音節標準パターンメモリ<14d)および記
憶装置(8)に記憶させる方法である。
より直接登録音声を入力し、この登録音声を音声認識部
(1)で分析し、標準パターンを作成し、作成した標準
パターンを音節標準パターンメモリ<14d)および記
憶装置(8)に記憶させる方法である。
第二の方法は萌もって登録音声を録音しておいた録音再
生装置く2)を本体(100)に接続し、この録音登録
音声を再生することにより登録音声の入力をなし、この
入力した登録音声を音声認識部(1)で分析し、標準パ
ターンを作成し、作成した標準パターンを音節標準パタ
ーンメモリ(14d)および記憶装置(8)に記憶させ
る方法である。
生装置く2)を本体(100)に接続し、この録音登録
音声を再生することにより登録音声の入力をなし、この
入力した登録音声を音声認識部(1)で分析し、標準パ
ターンを作成し、作成した標準パターンを音節標準パタ
ーンメモリ(14d)および記憶装置(8)に記憶させ
る方法である。
第三の方法は本マリンの本体(100)にマイク(3)
から直接登録音声を入力するが、このとき同時に録音再
生装置く2)を本体(Zoo)に接続しておきこの入力
された音声を録音再生装置(2)に録音しながら、本体
(100)側ではマイク(3)からの登録音声の分析を
行ない標準パターンを作成し、作成した標準パターンを
記憶装置く8)に記憶させておく、そして、次にこのマ
イク(3)への音声入力が終了すると、これに引き続き
、録音再生装置(2)に録音された音声を再生し、この
録音された登録音声を音声認識部(1)で分析し、標準
パターンを作成し、作成した標準パターンを音節標準パ
ターンメモリ(14d)に記憶しておくと同時に、記憶
装置(8)にも上述のマイク(3)からの直接の登録庁
声の片部標準パターンと共に記憶させる方法である。
から直接登録音声を入力するが、このとき同時に録音再
生装置く2)を本体(Zoo)に接続しておきこの入力
された音声を録音再生装置(2)に録音しながら、本体
(100)側ではマイク(3)からの登録音声の分析を
行ない標準パターンを作成し、作成した標準パターンを
記憶装置く8)に記憶させておく、そして、次にこのマ
イク(3)への音声入力が終了すると、これに引き続き
、録音再生装置(2)に録音された音声を再生し、この
録音された登録音声を音声認識部(1)で分析し、標準
パターンを作成し、作成した標準パターンを音節標準パ
ターンメモリ(14d)に記憶しておくと同時に、記憶
装置(8)にも上述のマイク(3)からの直接の登録庁
声の片部標準パターンと共に記憶させる方法である。
この第3の方法に於ては、録音再生装置(2)に録音し
た音声は録音再生装置(2)の周波数特性を受け℃いる
ため、録音した音声から作成した標準パターンと、マイ
ク(3)から直接入力した音声より作成した標準パター
ンとを比べた場合、内標準パターンの間に違いが現れる
。故に録音音声を認識させるときは、録音音声より作成
した標準パターンを使用する必要があり、マイクく3)
から直接入力した音声を認識させるときは、マイク(3
)から直接入力した音声より作成した標準パターンを使
用する必要があるので、上述の如きの方法をとることに
よって、マイク(3)から直接登録した標準パターンと
録音音声より作成した標準パターンの両パターンを一回
の音声登録操作によって作成し記憶できる。また、−度
録音再生装置(2)に登録音声を録音しておけば標準パ
ターンを作成していないデイクチ−ティングマシン上に
も登録者の発声入力を必要とせず、この録音音声を再生
入力するだけで、標準パターンが作成できる。また、録
音再生装置く2)に登録音声を録音し、さらにこの登録
音声のあとに文章を録音しておけば、後にこの録音再生
装置(2)を本体(100)に接続し、録音された音声
を再生するだけで音声登録から、文章作成まで、すべて
自動的に行なえる。
た音声は録音再生装置(2)の周波数特性を受け℃いる
ため、録音した音声から作成した標準パターンと、マイ
ク(3)から直接入力した音声より作成した標準パター
ンとを比べた場合、内標準パターンの間に違いが現れる
。故に録音音声を認識させるときは、録音音声より作成
した標準パターンを使用する必要があり、マイクく3)
から直接入力した音声を認識させるときは、マイク(3
)から直接入力した音声より作成した標準パターンを使
用する必要があるので、上述の如きの方法をとることに
よって、マイク(3)から直接登録した標準パターンと
録音音声より作成した標準パターンの両パターンを一回
の音声登録操作によって作成し記憶できる。また、−度
録音再生装置(2)に登録音声を録音しておけば標準パ
ターンを作成していないデイクチ−ティングマシン上に
も登録者の発声入力を必要とせず、この録音音声を再生
入力するだけで、標準パターンが作成できる。また、録
音再生装置く2)に登録音声を録音し、さらにこの登録
音声のあとに文章を録音しておけば、後にこの録音再生
装置(2)を本体(100)に接続し、録音された音声
を再生するだけで音声登録から、文章作成まで、すべて
自動的に行なえる。
尚、音声の標準パターンを作成する為の登録者の発声入
力は、本装置が一定の順序で表示装置(6)に表示する
文字を登録者が読み上げることにより行なわれ−る。
力は、本装置が一定の順序で表示装置(6)に表示する
文字を登録者が読み上げることにより行なわれ−る。
また、本マシン専用の表示機能をもつ録音再生装[(2
)を使用する場合はこの録音再生装置(2)嘔独で携帯
する時でもその表示画面に表示された見出し語に対応す
る音声を発声し録音再生装置(2)に録音する事で、標
準パターンの作成が可能となる。
)を使用する場合はこの録音再生装置(2)嘔独で携帯
する時でもその表示画面に表示された見出し語に対応す
る音声を発声し録音再生装置(2)に録音する事で、標
準パターンの作成が可能となる。
上述の如く、標準パターンを作成するための登録音声を
録音再生装置(2)に録音する場合は、この録音された
登録音声より標準パターンを作成するときにノイズなど
の影響を受は録音音声とこれに対応するべき見出し語と
がずれる可能性があり、以下、第9図に基づき、説明の
ため録音再生装置としてテープレコーダを使用した場合
について述べる。第9図(i)はテープレコーダに標準
パターン作成のための登録音声を録音した状態のうち、
見出し語′あ」〜「か」に対応した登録音声“あ”〜4
か”の間のテープの状態を表わしており、ここでは“え
”と“お”の間に[ノイズコが録音された場合を示す、
第9図(a)の様に登録音声と登録音声との間に[ノイ
ズ]が録音されたテープにより音声登録を行なった場合
、1番目に録音された音が“あ”で2番目に録音された
音が1い”という様に、ただ単にテープに録音された音
の順序により、入力された登録音声がどの音節に対応し
ているのかを決定していると、[ノイズ]まで登録音声
とみなして見出し語を対応させるので入力された実際の
登録音声と見出し語とがずれてしまう。
録音再生装置(2)に録音する場合は、この録音された
登録音声より標準パターンを作成するときにノイズなど
の影響を受は録音音声とこれに対応するべき見出し語と
がずれる可能性があり、以下、第9図に基づき、説明の
ため録音再生装置としてテープレコーダを使用した場合
について述べる。第9図(i)はテープレコーダに標準
パターン作成のための登録音声を録音した状態のうち、
見出し語′あ」〜「か」に対応した登録音声“あ”〜4
か”の間のテープの状態を表わしており、ここでは“え
”と“お”の間に[ノイズコが録音された場合を示す、
第9図(a)の様に登録音声と登録音声との間に[ノイ
ズ]が録音されたテープにより音声登録を行なった場合
、1番目に録音された音が“あ”で2番目に録音された
音が1い”という様に、ただ単にテープに録音された音
の順序により、入力された登録音声がどの音節に対応し
ているのかを決定していると、[ノイズ]まで登録音声
とみなして見出し語を対応させるので入力された実際の
登録音声と見出し語とがずれてしまう。
ここで、第9図(b)は[ノイズ]を音声と誤認識し、
見出しg!!1え」のところに[ノイズコが入力され、
見出し語1お」のところに音節°え”が入力された図で
ある。
見出しg!!1え」のところに[ノイズコが入力され、
見出し語1お」のところに音節°え”が入力された図で
ある。
この様に登録音声より標準パターンを作成するときにノ
イズなどの影響を受は録音音声と見出し語とがずれる場
合があるため、第9図(C)に示すように、登録音声の
種類を示したキャラクタ−コード音を、登録音声に対応
させて録音再生装置(2)に録音する。この方法により
、“う” と“え”の間に[ノイズ]が録音されていて
も、上述のように、入力された音と見出し語とのずれを
防止する。
イズなどの影響を受は録音音声と見出し語とがずれる場
合があるため、第9図(C)に示すように、登録音声の
種類を示したキャラクタ−コード音を、登録音声に対応
させて録音再生装置(2)に録音する。この方法により
、“う” と“え”の間に[ノイズ]が録音されていて
も、上述のように、入力された音と見出し語とのずれを
防止する。
このずれを防止する特定濁波数のキャラクタ−コード音
の録音方法を、録音再生装置(2)のテープレコーダが
シングルトラックである場合と、マルチトラックである
場合とにわけて説明する。
の録音方法を、録音再生装置(2)のテープレコーダが
シングルトラックである場合と、マルチトラックである
場合とにわけて説明する。
*f第10図において、録音方式としてマルチトランク
をもつ録音再生装置を使用する場合について述べる。
をもつ録音再生装置を使用する場合について述べる。
録音方式としてマルチトラックをもつ録音再生装置を使
用する場合は同図(&)に示すように音声を録音してい
ないトラックに見出し語に対応するキャラクタ−コード
を録音する。音声認識部(1)では、このキャラクタ−
コード音より、入力きれる音声の見出し語を知るととも
に、音声トラックに録音された音のうち、このキャラク
タ−コード音が録音された区間t1に録音された音のう
ち、音圧しきい値以上の条件をみたすもののみを音声と
みなし、分析を行なう。
用する場合は同図(&)に示すように音声を録音してい
ないトラックに見出し語に対応するキャラクタ−コード
を録音する。音声認識部(1)では、このキャラクタ−
コード音より、入力きれる音声の見出し語を知るととも
に、音声トラックに録音された音のうち、このキャラク
タ−コード音が録音された区間t1に録音された音のう
ち、音圧しきい値以上の条件をみたすもののみを音声と
みなし、分析を行なう。
または、同図(b)に示すように、音声の始めと終わり
に見出し語に対応するキャラクタ−フードを録肝し、音
声トラックに録音された音のうち、この音声の始めを示
すキャラクタ−コード音と、音声の終わりを示すキャラ
クタ−コード音の間の区間t2に録音された音のうち、
音圧しきい値以上の条件をみたすもののみを音声とみな
し、分析を行なう。
に見出し語に対応するキャラクタ−フードを録肝し、音
声トラックに録音された音のうち、この音声の始めを示
すキャラクタ−コード音と、音声の終わりを示すキャラ
クタ−コード音の間の区間t2に録音された音のうち、
音圧しきい値以上の条件をみたすもののみを音声とみな
し、分析を行なう。
または、同130(c )に示すように、音声の始めに
見出し語に対応するキャラクタ−フードを録音する。音
声トラックに録音された音のうち、この音声の種類を示
すキャラクタ−コード音から、次の見出し語に対応する
キャラクタ−コード音までの区間t3に録音された音の
うち、音圧しきい値以上の条件をみたすもののみを音声
とみなし、分析を行なう。
見出し語に対応するキャラクタ−フードを録音する。音
声トラックに録音された音のうち、この音声の種類を示
すキャラクタ−コード音から、次の見出し語に対応する
キャラクタ−コード音までの区間t3に録音された音の
うち、音圧しきい値以上の条件をみたすもののみを音声
とみなし、分析を行なう。
また第二の方法としてシングルトラックの録音再生装置
(2)の場合は、見出し語に対応するキャラクタ−フー
ドを音声の分析周波数帯域外の音で表わし、音声の録音
されているトラックに音声と共に録音する。この場合の
キャラクタ−コード音を録音する方法は、上述のマルチ
トラックの場合と同様である。つまり、上述のtl、t
2、t3の区間に録音された音うち、上述と同様の条件
をみたすもののみを音声とみなし、分析を行なう。
(2)の場合は、見出し語に対応するキャラクタ−フー
ドを音声の分析周波数帯域外の音で表わし、音声の録音
されているトラックに音声と共に録音する。この場合の
キャラクタ−コード音を録音する方法は、上述のマルチ
トラックの場合と同様である。つまり、上述のtl、t
2、t3の区間に録音された音うち、上述と同様の条件
をみたすもののみを音声とみなし、分析を行なう。
ただし、音声と、キャラクタ−コード音が重なっている
同図(a)に示した実施例の場合以外は、キャラクタ−
コード音に、音声の分析周波数帯域外の音を使用しなく
てもよい。
同図(a)に示した実施例の場合以外は、キャラクタ−
コード音に、音声の分析周波数帯域外の音を使用しなく
てもよい。
次ぎにアルファベット、数字およびカッコや句読点など
予め第6図の如き単語認識部(13)の単語辞書(13
d)にキャラクタ−登録されている単語に対応する単語
標準パターンを、同図の単語標準パターンメモリ(13
c)に登録する。
予め第6図の如き単語認識部(13)の単語辞書(13
d)にキャラクタ−登録されている単語に対応する単語
標準パターンを、同図の単語標準パターンメモリ(13
c)に登録する。
まず、所定の操作により、第6図のパラメータバッファ
(13a)と単語標準パターンメモリ(13c)とがス
イッチ(13sl)により接続され、単語登録モードに
する。
(13a)と単語標準パターンメモリ(13c)とがス
イッチ(13sl)により接続され、単語登録モードに
する。
つぎに、本装置本体(100)の表示装置(6)にアル
ファベット、数字およびカッコや句読点などが表示され
、操作者はこれに対応する読みを音声入力する。
ファベット、数字およびカッコや句読点などが表示され
、操作者はこれに対応する読みを音声入力する。
音声認識部(1)では、この音声を分析し、単語標準パ
ターンメモリ(L3c)に単語標準パターンの登録を行
なう。
ターンメモリ(L3c)に単語標準パターンの登録を行
なう。
上述までの操作により音声認識は可能となる。
しかし、自立語・付属語辞書(14e)および単語辞m
1(13d)にない単語を0!識させたいときは、自立
語・付属語辞書(14e)に認識許せたい単語を登録す
るか、単語辞書(13d)に認識させたい単語を、また
単語標準パターンメモリ(13c)に単語標準パターン
を登録する必要がある。ただし、自立語・付属語辞!(
14e)に単語を登録するか、単語辞書(13d )お
よび単語標準パターンメモリ(13c>に、単語および
単語標準パターンを登録するかは、使用者がその@語を
文節発声として認識さけたいか、単語発声として認識さ
けたいかによって決定する。
1(13d)にない単語を0!識させたいときは、自立
語・付属語辞書(14e)に認識許せたい単語を登録す
るか、単語辞書(13d)に認識させたい単語を、また
単語標準パターンメモリ(13c)に単語標準パターン
を登録する必要がある。ただし、自立語・付属語辞!(
14e)に単語を登録するか、単語辞書(13d )お
よび単語標準パターンメモリ(13c>に、単語および
単語標準パターンを登録するかは、使用者がその@語を
文節発声として認識さけたいか、単語発声として認識さ
けたいかによって決定する。
また、自立語・付属語辞書(14e)にはあるが、単語
辞書(13d)になく、それでも単語認識で認識させた
い場合、かかる単語を単語辞書(13d)および単語標
準パターンメモリ(13c)に、単語および単語標準パ
ターンを登録する必要がある。
辞書(13d)になく、それでも単語認識で認識させた
い場合、かかる単語を単語辞書(13d)および単語標
準パターンメモリ(13c)に、単語および単語標準パ
ターンを登録する必要がある。
以下に任意単語の登録方法について述べる。
単語の登録には、単語を自立語・付属語辞書(14e)
に文字列を登録する登録と、単語を、It語標準パター
ンメモリ<13c)に単語標準パターンを登録、および
単語辞書(13d)に文字列を登録する2方法がある。
に文字列を登録する登録と、単語を、It語標準パター
ンメモリ<13c)に単語標準パターンを登録、および
単語辞書(13d)に文字列を登録する2方法がある。
単語を自立語・付flk語辞書(14e)に登録する場
合は、登録したい単語を発声し本装置に入力する。
合は、登録したい単語を発声し本装置に入力する。
このとき本装置はこの音声を音声認識部(1)で認識し
、認識結果を表示装置(6)に表示する。使用者はこの
結果が正しければキーボード(7)の所定のキーを押し
1発声音声を表示装置(6)に表示されている文字列と
して自立語・付属語辞書(14e)に登録する。もし、
表示装置(6)に表示きれた認識結果が正しくなければ
、本装置の音節修正機能により表示装置!(6)に表示
された認識結果を修正するか、登録したい単語を再発声
する。また再発声した結果が誤っているときは、再び本
装置の音節修正機能により修正する。上述の操作を表示
装置(6)に表示される文字列が登録したい単語と一致
するまで繰り返す。
、認識結果を表示装置(6)に表示する。使用者はこの
結果が正しければキーボード(7)の所定のキーを押し
1発声音声を表示装置(6)に表示されている文字列と
して自立語・付属語辞書(14e)に登録する。もし、
表示装置(6)に表示きれた認識結果が正しくなければ
、本装置の音節修正機能により表示装置!(6)に表示
された認識結果を修正するか、登録したい単語を再発声
する。また再発声した結果が誤っているときは、再び本
装置の音節修正機能により修正する。上述の操作を表示
装置(6)に表示される文字列が登録したい単語と一致
するまで繰り返す。
単語を単語標準パターンメモリ(13c)および単語辞
書(13d)に登録する場合は、単語を自立諸寺付属語
辞書(14e)に登録する場合と同様にまず表示装置!
(6)に登録したい文字列を正しく表示させる0次に正
しく認識された文字列と単語標準パターンを、単語辞書
(13d)および単語標準パターンメモリ(13c)に
それぞれ登録する。
書(13d)に登録する場合は、単語を自立諸寺付属語
辞書(14e)に登録する場合と同様にまず表示装置!
(6)に登録したい文字列を正しく表示させる0次に正
しく認識された文字列と単語標準パターンを、単語辞書
(13d)および単語標準パターンメモリ(13c)に
それぞれ登録する。
また、自然な発声で入力された音声を認識することは、
現在の音声認識技術のレベルを考えた場合、無理がある
。現在の音声認識技術のレベルでは、連続「節発声入力
が限度であるため、以下に連続音節発声入力の一実施例
について記す。
現在の音声認識技術のレベルを考えた場合、無理がある
。現在の音声認識技術のレベルでは、連続「節発声入力
が限度であるため、以下に連続音節発声入力の一実施例
について記す。
連続音節発声入力の場合も、上記の手順と同一であるが
、連続音節発声入力の場合は、単8!l標準パターンも
連MP、音節発声のパターンとなっているため、登録し
たい単語を自然発声で再発声し、単語標準パターンを自
然発声より作成し、単1標準パターンと文字列を単語標
準パターンメモリ(13C)およびiW1辞書(13d
)にそれぞれ登録する。
、連続音節発声入力の場合は、単8!l標準パターンも
連MP、音節発声のパターンとなっているため、登録し
たい単語を自然発声で再発声し、単語標準パターンを自
然発声より作成し、単1標準パターンと文字列を単語標
準パターンメモリ(13C)およびiW1辞書(13d
)にそれぞれ登録する。
以上の操作により、音声認識による文章作成のために必
要なデータを登録できた事となる。
要なデータを登録できた事となる。
(i) 文章作成
以下に文章作成の実施例について述べる。
まず、認識動作を行なう場合は、単語認識部(13)の
スイッチ(13sl)は、パラメータバッファ<138
)と単語判定部(13b)を接続する様に、文節認置部
(14)のスイッチ(14sL)は、パラメータバッフ
ァ(14m)と音節認識部(14b)を接続する様に設
定する。
スイッチ(13sl)は、パラメータバッファ<138
)と単語判定部(13b)を接続する様に、文節認置部
(14)のスイッチ(14sL)は、パラメータバッフ
ァ(14m)と音節認識部(14b)を接続する様に設
定する。
文章作成には二方法がある。
第一の方法は本装置の本体に作成したい文章を音声によ
りマイク〈3)から直接入力するオンライン認識方法で
ある。
りマイク〈3)から直接入力するオンライン認識方法で
ある。
第二の方法は文章をatしておいた録音再生装置(2)
を本装置に接続し、録音文章を再生し、認識させるオフ
ライン認識である。
を本装置に接続し、録音文章を再生し、認識させるオフ
ライン認識である。
まず、オンライン認識の実施例について述べる。
オンライン認識の場合は、本装置にマイク(3)より直
接文節単位または単語単位に発声した文章を音声入力す
るので、所定の操作により、入力切り換え部(4)でマ
イク(3)と音声認識部(1〉を接続する。
接文節単位または単語単位に発声した文章を音声入力す
るので、所定の操作により、入力切り換え部(4)でマ
イク(3)と音声認識部(1〉を接続する。
また、マイク(3)より入力している音声を録音再生装
e(2)に記録しておきたいときは、録音再生装置(2
〉を本体に接続し、入力切り換え部(4)をマイクく3
)の出力と録音再生装Wt、(2)の録音端子とを接続
する。
e(2)に記録しておきたいときは、録音再生装置(2
〉を本体に接続し、入力切り換え部(4)をマイクく3
)の出力と録音再生装Wt、(2)の録音端子とを接続
する。
また同時に、入力切り換え部(4)は、後述の様に無音
検出信号・が特徴抽出部(12)より入力された場合、
文節、または単語区切りを示すビーブ音を録音するよう
機能する。
検出信号・が特徴抽出部(12)より入力された場合、
文節、または単語区切りを示すビーブ音を録音するよう
機能する。
音声認識時は、単語認識部(13)と文節認識部(14
)が起動している。
)が起動している。
マイク(3)より入力された音声は、前処理部(11)
で入力音声を音声分析に適した特性になるよう処理を施
され(例えば入力音声の音圧が小さい時は、増幅器によ
り音圧を増幅したりする処理を行なう)、特徴抽出部(
12)に送られる。
で入力音声を音声分析に適した特性になるよう処理を施
され(例えば入力音声の音圧が小さい時は、増幅器によ
り音圧を増幅したりする処理を行なう)、特徴抽出部(
12)に送られる。
特徴抽出部(12)では、第5図に示す如く、前処理部
(11)より入力されてきた音声を分析部<12a)で
分析し特徴抽出を行ない、パラメータバッファ(12c
)に記憶する。
(11)より入力されてきた音声を分析部<12a)で
分析し特徴抽出を行ない、パラメータバッファ(12c
)に記憶する。
同時に、特徴抽出部(12)の分析単位判定部Cl2b
)では、分析部(12a)の分析結果より、音節または
文節単位に発声きれたあとの無音区間、および文節また
は単語単位に発声されたあとに録音されたビーブ音(詳
細は後述のオフライン認識の実施例に示す、)の検出を
行なっており、無音区間を検出した場合、無音区間検出
信号(ロ)を発生する。
)では、分析部(12a)の分析結果より、音節または
文節単位に発声きれたあとの無音区間、および文節また
は単語単位に発声されたあとに録音されたビーブ音(詳
細は後述のオフライン認識の実施例に示す、)の検出を
行なっており、無音区間を検出した場合、無音区間検出
信号(ロ)を発生する。
かかる無音区間検出信号(ロ)を受は取ったパラメータ
バッフγ(12c )は、記憶している特徴パラメー〃
を単語認識部(13)と文節認識部(14)に送り、記
憶内容を消去する。
バッフγ(12c )は、記憶している特徴パラメー〃
を単語認識部(13)と文節認識部(14)に送り、記
憶内容を消去する。
単語認識部(13)に入力きれた特徴パラメータは、第
8図に示されたパラメータバッファ(13m)に記憶さ
れる。!L語判定部(13b)では、パラメータバッフ
ァ(13a)に記憶された特徴パラメータと単語標準パ
ターンメモリ(13c)とを比較し、バラ)I −1)
バッファ(13a:+に記憶された特徴パラメータと
、尤度の大きい単a18ill準パターンをもつ単語を
、jI1語辞書(13d)より複数語選び、選ばれた単
語の文字列とその尤度値を候補作成部(15)に送る。
8図に示されたパラメータバッファ(13m)に記憶さ
れる。!L語判定部(13b)では、パラメータバッフ
ァ(13a)に記憶された特徴パラメータと単語標準パ
ターンメモリ(13c)とを比較し、バラ)I −1)
バッファ(13a:+に記憶された特徴パラメータと
、尤度の大きい単a18ill準パターンをもつ単語を
、jI1語辞書(13d)より複数語選び、選ばれた単
語の文字列とその尤度値を候補作成部(15)に送る。
一方、文節認識部〈14〉に入力された特徴パラメータ
は、パラメータバッファ(14a)に記憶きれる。音節
認識部(14b)では、パラメータバッファ(14m>
に記憶された特徴パラメータと音節標準パターンメモリ
(14d)とを比較し、バラメー)?バッファ(14m
)に記憶された特徴パラメータを音節列に変換し、かか
る音節列を文節判定部(14c)へ送る0文節判定部(
14c)では入力きれた音節列と自立語・付属語辞書(
14e)に登録されている単語を比較し、自立語と付属
語を組み合わせて尤度の大きい文節を複数組作成し、作
成した文節の文字列とその尤度値を候補作成部(15)
に送る。
は、パラメータバッファ(14a)に記憶きれる。音節
認識部(14b)では、パラメータバッファ(14m>
に記憶された特徴パラメータと音節標準パターンメモリ
(14d)とを比較し、バラメー)?バッファ(14m
)に記憶された特徴パラメータを音節列に変換し、かか
る音節列を文節判定部(14c)へ送る0文節判定部(
14c)では入力きれた音節列と自立語・付属語辞書(
14e)に登録されている単語を比較し、自立語と付属
語を組み合わせて尤度の大きい文節を複数組作成し、作
成した文節の文字列とその尤度値を候補作成部(15)
に送る。
候補作成部(15)は入力された文字列から尤度の大き
いものを複数個選び、尤度値と単語認識部(13)から
送られてきたデータか文節認識部(14)から送られて
きたデータかを示すコードを付加し記憶する。同時に、
尤度の最も大きいものの文字列を5表示装置に表示させ
る信号を制御部(5)に送る。制御部(5)は、この信
号を受は光度の最も大きいものの文字列の後に区切り記
号マークr′yJをつけ、例えば第14図<a)の入力
文章に対して第14図(c)に示すような形式で表示装
置に表示許せる、同時に候補作成部(15)は制御部(
5)に、候補作成部(15)に記憶された内容を記憶装
置(8)に記憶させる信号を送る。制御部(5)はこの
信号を受け、候補作成部(15〉に記憶された文字列の
後に区切り記号を表わすコードを1引加した形で記憶装
置(8)に記憶きせる。この外部記憶装置に記憶された
文字列は、ワープロの一次原稿とする。一般的にはフロ
ッピーディスクを用いるが、このとき記憶装置(8)の
ファ、fルのフォーマットはワープロのファイルフォー
マットに合わせておく必要がある。
いものを複数個選び、尤度値と単語認識部(13)から
送られてきたデータか文節認識部(14)から送られて
きたデータかを示すコードを付加し記憶する。同時に、
尤度の最も大きいものの文字列を5表示装置に表示させ
る信号を制御部(5)に送る。制御部(5)は、この信
号を受は光度の最も大きいものの文字列の後に区切り記
号マークr′yJをつけ、例えば第14図<a)の入力
文章に対して第14図(c)に示すような形式で表示装
置に表示許せる、同時に候補作成部(15)は制御部(
5)に、候補作成部(15)に記憶された内容を記憶装
置(8)に記憶させる信号を送る。制御部(5)はこの
信号を受け、候補作成部(15〉に記憶された文字列の
後に区切り記号を表わすコードを1引加した形で記憶装
置(8)に記憶きせる。この外部記憶装置に記憶された
文字列は、ワープロの一次原稿とする。一般的にはフロ
ッピーディスクを用いるが、このとき記憶装置(8)の
ファ、fルのフォーマットはワープロのファイルフォー
マットに合わせておく必要がある。
また、この無音区間検出信号をうけとった第8図に示す
入力切り換え部く4)の信号発生部(42)は、文章の
文節または単語の区切りを表わすビーブ音を発生し、か
かるビーブ音をスイッチ(41)に入力する。スイッチ
(41)は、マイク(3)から入力される音声と、信号
発生部(42)より入力されるビーブ音を、録音再生装
置(2)に録音するよう、回路を接続し、録音再生装置
(2)に録音されている文章の文節または単語の区切り
と見なされた無音区間にビーブ音を録音する。
入力切り換え部く4)の信号発生部(42)は、文章の
文節または単語の区切りを表わすビーブ音を発生し、か
かるビーブ音をスイッチ(41)に入力する。スイッチ
(41)は、マイク(3)から入力される音声と、信号
発生部(42)より入力されるビーブ音を、録音再生装
置(2)に録音するよう、回路を接続し、録音再生装置
(2)に録音されている文章の文節または単語の区切り
と見なされた無音区間にビーブ音を録音する。
次ぎに、オフライン0識の実施例について述べる。
オフライン認識の場合は、本装置に録音再生装f(2)
の録音音声を再生入力することにより文章作成を行なう
ものであるため、まず録音再生装置(2)に文章を録音
する。
の録音音声を再生入力することにより文章作成を行なう
ものであるため、まず録音再生装置(2)に文章を録音
する。
また、録音再生装置(2)より音声入力を行なうため、
入力切り換λ部(4)により、録音再生装置(2)と督
声認置部(1)を接続する。
入力切り換λ部(4)により、録音再生装置(2)と督
声認置部(1)を接続する。
文章録音時は、文節単位または単語単位に発声し、文節
および囃語間に無音区間を作る。また、第1図に示す如
き本装置専用の録音再生装置(2)を使用する場合は、
文節および単語の区切りを明確に憚るため、区切りを示
すビーブ音を、録音再生装置(2)または本デイクチ−
ティングマシン本体に設定されている区切りキー(71
)を押し録音する。
および囃語間に無音区間を作る。また、第1図に示す如
き本装置専用の録音再生装置(2)を使用する場合は、
文節および単語の区切りを明確に憚るため、区切りを示
すビーブ音を、録音再生装置(2)または本デイクチ−
ティングマシン本体に設定されている区切りキー(71
)を押し録音する。
また、単語登録をした単語は、jlL語単位に発声をお
こなうが、録音再生装置(2)がキャラクタ−音発生機
能を持ち、かつ入力したい単語に相当するキャラクタ−
をもっていれば、音声の替わりにそのキャラクタ−音を
録音してもよい。
こなうが、録音再生装置(2)がキャラクタ−音発生機
能を持ち、かつ入力したい単語に相当するキャラクタ−
をもっていれば、音声の替わりにそのキャラクタ−音を
録音してもよい。
また、文章単位の頭だしゃ文章と文章の間に録音された
ノイズを音声と誤り認識してしまうことを避けるために
文章の始まりと終わりを示す信号を音声と共に録音して
おく。
ノイズを音声と誤り認識してしまうことを避けるために
文章の始まりと終わりを示す信号を音声と共に録音して
おく。
ただし、この信号の録音方法は、録音再生装置(2)が
マルチトラック方式か否かにより音声登録のところで述
べたように変わる。第111!Iは、マルチトラック方
式および、第12図はシングルトラック方式の図である
。第1<図(a)、第12図(a)は、DTMF信号等
の音が、録音されている区間を音声領域として、検出す
る方法である。
マルチトラック方式か否かにより音声登録のところで述
べたように変わる。第111!Iは、マルチトラック方
式および、第12図はシングルトラック方式の図である
。第1<図(a)、第12図(a)は、DTMF信号等
の音が、録音されている区間を音声領域として、検出す
る方法である。
第11図(b)、第12図(b)は、DTMF信号等の
音を、文章の始まる前に録音し、文章が終了したときに
、再度録音し、かかる両信号に挾まれた区間を音声領域
として、検出する方法である。
音を、文章の始まる前に録音し、文章が終了したときに
、再度録音し、かかる両信号に挾まれた区間を音声領域
として、検出する方法である。
また、第12図のシングルトラック方式の場合は、行声
区間とDTMF信号停の音が、重なることを考え、音声
帯域外のDTMF信号等を用いる。
区間とDTMF信号停の音が、重なることを考え、音声
帯域外のDTMF信号等を用いる。
また文章を認識するときは、信号の録音きれている油後
t4およびt5の区間をサンプリングし、音声か否かを
判定するため必ずしも文章の始まりと信号の始まり、お
よび文章の終わりと信号の終わりが一致している必要は
ない、このため、文章を発声φ゛るタイミングとキーを
押すタイミングが少々ずれても認識可能である。
t4およびt5の区間をサンプリングし、音声か否かを
判定するため必ずしも文章の始まりと信号の始まり、お
よび文章の終わりと信号の終わりが一致している必要は
ない、このため、文章を発声φ゛るタイミングとキーを
押すタイミングが少々ずれても認識可能である。
次に、録音再生装置(2)を本装置の本体と接続し録音
音声を再生し認識処理を行なうが、この録庁計声を認識
させる前に認識速度のモードを、録音音声の再生速度を
速くして、認識時間短縮を行なう早聞き認識のモードか
、通常の再生速度で認識させるモードか、時間的に余裕
があり、高認識率を必要とするときは、二度再生認識モ
ードのいずれかのモードに設定しておく。
音声を再生し認識処理を行なうが、この録庁計声を認識
させる前に認識速度のモードを、録音音声の再生速度を
速くして、認識時間短縮を行なう早聞き認識のモードか
、通常の再生速度で認識させるモードか、時間的に余裕
があり、高認識率を必要とするときは、二度再生認識モ
ードのいずれかのモードに設定しておく。
まず早聞き認識モードの実施例を記す。
早聞き認識モードでは、録音音声の再生速度を速くして
いるため、入力音声の特性が、通常の再生速度で再生き
れた登録音声より作成した、標準パターンとは特性が違
っており、単に再生速度を速くした音声を入力しても、
正確に音声認識を行なえない。
いるため、入力音声の特性が、通常の再生速度で再生き
れた登録音声より作成した、標準パターンとは特性が違
っており、単に再生速度を速くした音声を入力しても、
正確に音声認識を行なえない。
そこで、再生速度を速くした音声を正確に認識するため
、サンプリング周波数を変更する。以下に、かかる方法
の、実施例を記す。
、サンプリング周波数を変更する。以下に、かかる方法
の、実施例を記す。
第5図の特徴抽出部(12)のサンプリング周波数制御
部<12d)は、特徴抽出部(12)の入力音声のサン
プリング周波数を音声の標準パターンを作成したときの
サンプリング周波数のく再生速度/fi音速変速度に設
定し、音声をサンプリングし分析する。特徴抽出部(1
2)以降の処理はオンライン認識時の実施例と同様、た
だし、録音再生装置(2)の録片文章に、文節および単
語の区切りを明確にするための区切りを示すビーブ音を
録音済みの文章を入力し、特徴抽出部(12)がかかる
ビーブ音を検出したとき、特徴抽出部(12)は無音区
間検出信号り口)の代わりに、ビーブ音検出信号(口つ
を発生する。受侶IB号が、無音区間検出信号(ロ)で
なく、ビーブ音検出信号(口゛)の場合、入力切り換え
部(4)の信号発生部(42)は、文章の文節または単
語の区切りを表わすビーブ音の発生は行なわない。
部<12d)は、特徴抽出部(12)の入力音声のサン
プリング周波数を音声の標準パターンを作成したときの
サンプリング周波数のく再生速度/fi音速変速度に設
定し、音声をサンプリングし分析する。特徴抽出部(1
2)以降の処理はオンライン認識時の実施例と同様、た
だし、録音再生装置(2)の録片文章に、文節および単
語の区切りを明確にするための区切りを示すビーブ音を
録音済みの文章を入力し、特徴抽出部(12)がかかる
ビーブ音を検出したとき、特徴抽出部(12)は無音区
間検出信号り口)の代わりに、ビーブ音検出信号(口つ
を発生する。受侶IB号が、無音区間検出信号(ロ)で
なく、ビーブ音検出信号(口゛)の場合、入力切り換え
部(4)の信号発生部(42)は、文章の文節または単
語の区切りを表わすビーブ音の発生は行なわない。
また、音声認識部(1)が、単語を示すキャラクタ−音
を認識した場合は、かかるキャラクタ−音に対応した@
語を認識結果として出力する。
を認識した場合は、かかるキャラクタ−音に対応した@
語を認識結果として出力する。
次に二度再生認識モードの実施例を記す。
本モードは、まず録音音声を再生し本装置に入力する。
このとき音声認識部(1)の前処理部(11)で録f
a声の音圧変動を全て読みとり、このデータを第4図に
示す音圧変動メモリ(Ilb>に記憶する1次ぎに、再
び録音音声を再生し本装置に入力する。このとき前処理
部(11)では、音圧変動メモリ(llb>に記憶され
たデータを使用し、特徴抽出部(12)への入力音圧を
第18図に示す如く、音声認識に最も適したレベルにあ
わせるよう、AGC回路(lla)の増幅率を調整する
。即ち、利得Gを固定利得Aに制御部EE V o (
可変調整される)を乗じたものとする。
a声の音圧変動を全て読みとり、このデータを第4図に
示す音圧変動メモリ(Ilb>に記憶する1次ぎに、再
び録音音声を再生し本装置に入力する。このとき前処理
部(11)では、音圧変動メモリ(llb>に記憶され
たデータを使用し、特徴抽出部(12)への入力音圧を
第18図に示す如く、音声認識に最も適したレベルにあ
わせるよう、AGC回路(lla)の増幅率を調整する
。即ち、利得Gを固定利得Aに制御部EE V o (
可変調整される)を乗じたものとする。
また、二度再生認識モードの別の実施例として、多数回
再生認識モードも考えられる。これは、録音文章を多数
回再生入力し、入力のつど、音声認識部(1)における
認識方法を変更することによって認識された結果を比較
し、最も確からしさの尤度の大きいものを、選択する方
法である。
再生認識モードも考えられる。これは、録音文章を多数
回再生入力し、入力のつど、音声認識部(1)における
認識方法を変更することによって認識された結果を比較
し、最も確からしさの尤度の大きいものを、選択する方
法である。
また、録音再生装置(2)に登録用音声を録音しておら
ず、かつ録音再生装置(2)によっては再生速度を速イ
;シた場合の周波数特性と通常の再生速度の場合の周波
数特性が違うものを使用するとき、または音声の標準パ
ターン作成に使用した録音再生装置(2)と違う周波数
特性をもつ録音再生装置f(2)に録音した文章を認識
させるとき、またほぼ声の標準パターン作成に使用した
録音再生装置(2)と規格上は同じ周波数特性を有する
が使用部品等の誤差の影響をうけ実際の周波数特性が音
声の標準パターン作成に使用した録音再生装置(2)と
違・)でいる録音再生装置t(2)に録音した文章を認
識させるときは、以下に述べる周波数特性の影響を補正
するamを使用する。
ず、かつ録音再生装置(2)によっては再生速度を速イ
;シた場合の周波数特性と通常の再生速度の場合の周波
数特性が違うものを使用するとき、または音声の標準パ
ターン作成に使用した録音再生装置(2)と違う周波数
特性をもつ録音再生装置f(2)に録音した文章を認識
させるとき、またほぼ声の標準パターン作成に使用した
録音再生装置(2)と規格上は同じ周波数特性を有する
が使用部品等の誤差の影響をうけ実際の周波数特性が音
声の標準パターン作成に使用した録音再生装置(2)と
違・)でいる録音再生装置t(2)に録音した文章を認
識させるときは、以下に述べる周波数特性の影響を補正
するamを使用する。
まず、録音再生装置(2)の周波数特性を測定する場合
の基準となる基準正弦波信号を基準信号発生部(42)
で発生させ、録音再生装置(2)に録音する。しかる後
に録音されたかかる基準正弦波信号を本装置に再生入力
する。入力された基準正弦波信号を音声認識部(1)は
分析し、録音された基準正弦波信号と、基準信号発生部
り42)で発生さ廿た基準正弦波信号との周波数特性の
差を求め、録1−された基準正弦波信号と、基準信号発
生部(42)で発生させた基準正弦波信号との周波数特
性の差を小さくするように、補正をかける。補正をかけ
る手段は、音声認識部(1)の特徴抽出部(12)の特
徴抽出方法により、多数考えられる0例えば第13図に
示したように、直列接続されたバンドパスフィルタ(B
PF)と増巾器(AMP)との並列接続体からなるアナ
ログフィルターバンク方式とするものCあれは、増幅器
(AMP)の増幅率を調整することにより、基準オ号発
生部(42)で発生させた基準正弦波信号との周波数特
性の差を小さくするようにフィルタからの出力をu4v
、する、また、特徴抽山部(12)の特徴抽出方法とし
て、ディジタルフィルターをもちいていれば、ディジタ
ルフィルターの特性を決めているパラメータを変更すれ
ばよい、その他、音声認識部(1)の特徴抽出部(12
)の特徴抽出方法に対応して、あらゆる方法が考えられ
る。
の基準となる基準正弦波信号を基準信号発生部(42)
で発生させ、録音再生装置(2)に録音する。しかる後
に録音されたかかる基準正弦波信号を本装置に再生入力
する。入力された基準正弦波信号を音声認識部(1)は
分析し、録音された基準正弦波信号と、基準信号発生部
り42)で発生さ廿た基準正弦波信号との周波数特性の
差を求め、録1−された基準正弦波信号と、基準信号発
生部(42)で発生させた基準正弦波信号との周波数特
性の差を小さくするように、補正をかける。補正をかけ
る手段は、音声認識部(1)の特徴抽出部(12)の特
徴抽出方法により、多数考えられる0例えば第13図に
示したように、直列接続されたバンドパスフィルタ(B
PF)と増巾器(AMP)との並列接続体からなるアナ
ログフィルターバンク方式とするものCあれは、増幅器
(AMP)の増幅率を調整することにより、基準オ号発
生部(42)で発生させた基準正弦波信号との周波数特
性の差を小さくするようにフィルタからの出力をu4v
、する、また、特徴抽山部(12)の特徴抽出方法とし
て、ディジタルフィルターをもちいていれば、ディジタ
ルフィルターの特性を決めているパラメータを変更すれ
ばよい、その他、音声認識部(1)の特徴抽出部(12
)の特徴抽出方法に対応して、あらゆる方法が考えられ
る。
前記までの操作により、音声入力した文章はかな列に変
換された事となる。このかな列変換された文章が入力し
た文章と違っている場合の修正方法を第14図を使用し
それぞれの誤りかたに場合分けして以下に述べる。以下
の手順により修正を行なう。
換された事となる。このかな列変換された文章が入力し
た文章と違っている場合の修正方法を第14図を使用し
それぞれの誤りかたに場合分けして以下に述べる。以下
の手順により修正を行なう。
第14図(a)は入力文章、同図(b)は入力背戸、同
図(c)は認識結果、同図(d)〜(h)は修正過程、
同図(i)は修正結果を表わしている。
図(c)は認識結果、同図(d)〜(h)は修正過程、
同図(i)は修正結果を表わしている。
まず、単語とし工発声したものが文節として誤認識され
た場合の修正法について述べる。同図(C)に示したよ
うに単語°C”として発声したものが、文節“し−”と
して認識された場合、先ずカーソル(X)を誤った単語
の部分へ移動する[同図(d)i]、 次ぎに単語次
候補キー(72)を押し単語の次候補を表示させる[同
図(d)i]、 この結果が正しければ次の修正部分
へ進む、もしこの結果が誤っていれば、再び単語次候補
キー(72)を押し単語の次候補を表示させる。この操
作を正解が表示されるまで繰り返す。
た場合の修正法について述べる。同図(C)に示したよ
うに単語°C”として発声したものが、文節“し−”と
して認識された場合、先ずカーソル(X)を誤った単語
の部分へ移動する[同図(d)i]、 次ぎに単語次
候補キー(72)を押し単語の次候補を表示させる[同
図(d)i]、 この結果が正しければ次の修正部分
へ進む、もしこの結果が誤っていれば、再び単語次候補
キー(72)を押し単語の次候補を表示させる。この操
作を正解が表示されるまで繰り返す。
次ぎに、文節として発声したものが単語として誤認識さ
れた場合の修正法について述べる0文節“い”として発
声したものが、単語“E”として認識された場合、先ず
カーソル(X)を誤った文節の部分へ移動する0次ぎに
文節次候補キー(73)を押し文節の次候補を表示させ
る。この結果が正しければ次の修正部分へ進む。
れた場合の修正法について述べる0文節“い”として発
声したものが、単語“E”として認識された場合、先ず
カーソル(X)を誤った文節の部分へ移動する0次ぎに
文節次候補キー(73)を押し文節の次候補を表示させ
る。この結果が正しければ次の修正部分へ進む。
もしこの結果が誤っていれば、文節次候補キー(73)
を押し文節の次候補を表示させる。この操作を正解が表
示されるまで繰り返す。
を押し文節の次候補を表示させる。この操作を正解が表
示されるまで繰り返す。
単語前候補キー〈74)を押すことにより単語、文節前
候補キー(75)を押すことにより文節、それぞれの一
つ前の候補を表示させることも出来る。
候補キー(75)を押すことにより文節、それぞれの一
つ前の候補を表示させることも出来る。
上述の2通りの修正法で正解が得られないときはa節単
位の修正や、単語または文節または音節を再発声入力す
る。
位の修正や、単語または文節または音節を再発声入力す
る。
また、再発声入力時に再び、文節を単語認識したり、単
語を文節認識したりすることを避けるため、候補作成部
(15)を、単語認識部(13)より送られできた0!
識結果のみを認識結果としてみなし、文節認識部(14
)より送られてきた認識結果は、無視するよう外部より
制御できる。
語を文節認識したりすることを避けるため、候補作成部
(15)を、単語認識部(13)より送られできた0!
識結果のみを認識結果としてみなし、文節認識部(14
)より送られてきた認識結果は、無視するよう外部より
制御できる。
また、候補作成部(15)を、文節認識部(14)より
送られてきた認識結果のみを認識結果としてみなし、屯
3g認識部(13)より送られてきた認識結果は、無視
するよう外部より制御できる。
送られてきた認識結果のみを認識結果としてみなし、屯
3g認識部(13)より送られてきた認識結果は、無視
するよう外部より制御できる。
上述の次候補キーとは、以下に述べる機能を有するキー
の事であり、第15図を使用し説明する。
の事であり、第15図を使用し説明する。
本装置の音声認識部(1)では、単語認識と文節認識が
並走しており、単語および文節の両認識結果を求めてい
ることは先に述べたが、この両認識結果より、文節認識
処理の結果を尤度の大きいものから順番に認識結果を表
示装置t(6)に表示させるためのキーが文節次候補キ
ー(73)であり、単語認識処理の結果を尤度の大きい
ものから順番に認識結果を表示装置に表示させるための
キーが単語次候補キー(72)であり、現在表示装置に
表示妨れている認識結果より、一つ尤度の大きい認識結
果を表示装置(6)に表示するキーが、単語前候補キー
および文節前候補キーである。
並走しており、単語および文節の両認識結果を求めてい
ることは先に述べたが、この両認識結果より、文節認識
処理の結果を尤度の大きいものから順番に認識結果を表
示装置t(6)に表示させるためのキーが文節次候補キ
ー(73)であり、単語認識処理の結果を尤度の大きい
ものから順番に認識結果を表示装置に表示させるための
キーが単語次候補キー(72)であり、現在表示装置に
表示妨れている認識結果より、一つ尤度の大きい認識結
果を表示装置(6)に表示するキーが、単語前候補キー
および文節前候補キーである。
第15図は候補作成部(15)の候補バッファ〈15耐
である。この図は、−位のvg識結果が、「たんご、で
あり、これは単語認識部(13)から送られてきた認識
結果であることを(単語)で表わしている。同様に三位
の認識結果が、′たんごを」であり、これは文節認識部
(14)から送られてきた認識結果であることを(文節
)で表わし、三位の認識結果が、「たんごに」であり、
これは文節認識部(14)から送られてきた認識結果で
あることを(文節)で表わし、四位の認識結果が、′た
んこう」であり、これは単語認識部(13)から送られ
てきた認識結果であることを(単語)で表わしている。
である。この図は、−位のvg識結果が、「たんご、で
あり、これは単語認識部(13)から送られてきた認識
結果であることを(単語)で表わしている。同様に三位
の認識結果が、′たんごを」であり、これは文節認識部
(14)から送られてきた認識結果であることを(文節
)で表わし、三位の認識結果が、「たんごに」であり、
これは文節認識部(14)から送られてきた認識結果で
あることを(文節)で表わし、四位の認識結果が、′た
んこう」であり、これは単語認識部(13)から送られ
てきた認識結果であることを(単語)で表わしている。
いま、表示装置く6〉には、「たんご」が表示されてい
るとする。かかる状態で文節次候補キ−(73)を押す
と表示装置(6)には「たんごを」が表示される。また
、単語次候補キー(72)を押すと表示装置(6)には
rたんこう−が表示される。
るとする。かかる状態で文節次候補キ−(73)を押す
と表示装置(6)には「たんごを」が表示される。また
、単語次候補キー(72)を押すと表示装置(6)には
rたんこう−が表示される。
また、表示装置(6)には、「たんこうJが表示されて
いる場合に、単語前候補キー(74)を押すと表示装置
(6)にはまたんご」が表示され、文節前候補キー〈7
3)を押すと表示装置(6)にはまたんごに、が表示さ
れる。
いる場合に、単語前候補キー(74)を押すと表示装置
(6)にはまたんご」が表示され、文節前候補キー〈7
3)を押すと表示装置(6)にはまたんごに、が表示さ
れる。
次ぎに一文節全体の一括修正方法について述べる。
第14図(e)の例は単語r7.を「A」と誤認識した
例である。先ずカーソルを修正したい単語へ移動する[
同図(e)il− 次に単語次候補キー(72)を押し単語の次候補を表示
させる[同図(e)il、この結果が正しければ次の修
正部分へ進む、もしこの結果が誤っていれば、単語次候
補キー(72)を押し単語の次候補を表示させる。この
操作を正解が表示されるまで繰り返す、正解が表示され
無ければ、再発声を行ない、再入力をおこなう、前単語
候補キー(74)を押すことにより一つ前に表示した単
語の候補を表示させることも出来る。
例である。先ずカーソルを修正したい単語へ移動する[
同図(e)il− 次に単語次候補キー(72)を押し単語の次候補を表示
させる[同図(e)il、この結果が正しければ次の修
正部分へ進む、もしこの結果が誤っていれば、単語次候
補キー(72)を押し単語の次候補を表示させる。この
操作を正解が表示されるまで繰り返す、正解が表示され
無ければ、再発声を行ない、再入力をおこなう、前単語
候補キー(74)を押すことにより一つ前に表示した単
語の候補を表示させることも出来る。
次ぎに一単語全体の一括修正方法について述べる。
第14図<r>の例は文節′がめんの、ヲ「がいねんの
」と誤認識した例である。先ずカーソルを修正したい文
節へ移動する[同図(f)il。
」と誤認識した例である。先ずカーソルを修正したい文
節へ移動する[同図(f)il。
次ぎに文節次候補キー(73)を押し文節の次候補を表
示させる[同図(f’)il、この結果が正しければ次
の修正部分へ進む、もしこの結果が誤っていれば、文節
次候補キー(73)を押し文節の次候補を表示させる。
示させる[同図(f’)il、この結果が正しければ次
の修正部分へ進む、もしこの結果が誤っていれば、文節
次候補キー(73)を押し文節の次候補を表示させる。
この操作を正解が表示されるまで繰り返す、正解が表示
され無ければ、再発声を行ない、再入力をおこなう、前
文節候補キー(75)を押すことにより一つ前に表示し
た文節の候補を表示させることも出来る。
され無ければ、再発声を行ない、再入力をおこなう、前
文節候補キー(75)を押すことにより一つ前に表示し
た文節の候補を表示させることも出来る。
次ぎに音節単位の修正方法について述べる。
第14図<h>の例は文節rおんせいで、をrおんけい
で4と誤認識した例である。この例は音節「け、を「せ
、に修正する場合であるが、先ずカーソル(X)を修正
したい音節「け」へ移動し[同図(h)il、音節次候
補キー(76)を押す、音節次候補キー(76)を押す
ことにより修正したい部分の音節と最も距離が近い音節
が表示される[同図(h)il、正解が表示されれば、
次の修正部分へ移動する。もしこの結果が誤っていれば
、再度音節次候補キーを押し音節の次候補を表示させる
。
で4と誤認識した例である。この例は音節「け、を「せ
、に修正する場合であるが、先ずカーソル(X)を修正
したい音節「け」へ移動し[同図(h)il、音節次候
補キー(76)を押す、音節次候補キー(76)を押す
ことにより修正したい部分の音節と最も距離が近い音節
が表示される[同図(h)il、正解が表示されれば、
次の修正部分へ移動する。もしこの結果が誤っていれば
、再度音節次候補キーを押し音節の次候補を表示させる
。
この操作を正解が表示されるまで繰り返す、正解が表示
され無ければ、再発声により再入力を行なう、再入力の
結果が間違っている時は上記の手順により再び修正する
。この操作を正解が表示されるまで繰り返す。
され無ければ、再発声により再入力を行なう、再入力の
結果が間違っている時は上記の手順により再び修正する
。この操作を正解が表示されるまで繰り返す。
また前3節候補キー(77)を押すことにより音節の一
つ前の候補を表示させることも出来る。
つ前の候補を表示させることも出来る。
音節を削除したい時は、カーソルを修正したいw[5へ
移動し削除キー(78)を押し削除する。
移動し削除キー(78)を押し削除する。
音節を挿入したい時は、カーソルを修正したい音節へ移
動し挿入キー(79)を押し挿入する。
動し挿入キー(79)を押し挿入する。
次に第16図を使用し、数音節修正法について記す。
この例は、lliI図(a)の入力文s″かいしよう”
を同図(b)「がんじょう」と誤認識した例である。こ
の場合、まずカーソル(X)を修正したい音節にもって
いき[同図(C)]、“かい”と再再発大入する。かか
る再発声入力音声は音声認識部(1)で認識され、認識
結果は表示装置(6)に表示きれる。認識結果が正しけ
れば、次の修正部へすすむ。もし、同図(d)に示すよ
うに、「かい、を1かえ」と誤認識した場合、単語の場
合は、単語次候補キー(72)を押す0文節の場合は、
文節次候補キー(73)を押す、第16図は単語の場合
の例であ、るので、以下単語の修正方法について記す。
を同図(b)「がんじょう」と誤認識した例である。こ
の場合、まずカーソル(X)を修正したい音節にもって
いき[同図(C)]、“かい”と再再発大入する。かか
る再発声入力音声は音声認識部(1)で認識され、認識
結果は表示装置(6)に表示きれる。認識結果が正しけ
れば、次の修正部へすすむ。もし、同図(d)に示すよ
うに、「かい、を1かえ」と誤認識した場合、単語の場
合は、単語次候補キー(72)を押す0文節の場合は、
文節次候補キー(73)を押す、第16図は単語の場合
の例であ、るので、以下単語の修正方法について記す。
同図(d)の状態で、単語次候補キー(72)を押した
場合、まず、制御部(5)は、単語辞!(13d)より
、修正部の同図(b)の認識結果「がんじょう、と再発
声後の同図(d)の認識結果1かえじよう」とを比較し
、同一部分「じょう」をみつける0次に、制御部(5)
は、単語辞書(13d)より、かかる同一部分1じよう
」をもつ単語を選ぶ、同図(f’)は単語辞書(13d
)の記憶内容を示しており、同図(g)は記憶内容より
選んだ1じよう、をもつtX語を示している0次に制御
部(5)は、同図(g)に記した単語と、再発声後の0
識結果「かえしよう」との尤度を計算し、最も尤度値の
大きい単語を表示する[同rI!J(e)]。
場合、まず、制御部(5)は、単語辞!(13d)より
、修正部の同図(b)の認識結果「がんじょう、と再発
声後の同図(d)の認識結果1かえじよう」とを比較し
、同一部分「じょう」をみつける0次に、制御部(5)
は、単語辞書(13d)より、かかる同一部分1じよう
」をもつ単語を選ぶ、同図(f’)は単語辞書(13d
)の記憶内容を示しており、同図(g)は記憶内容より
選んだ1じよう、をもつtX語を示している0次に制御
部(5)は、同図(g)に記した単語と、再発声後の0
識結果「かえしよう」との尤度を計算し、最も尤度値の
大きい単語を表示する[同rI!J(e)]。
次に文節またはi語の認識境界誤りを修正する場合につ
いて述べる。
いて述べる。
第14図(g)の例は文節「ぶんしようを」を「ん、と
「シ、の間に[ν]印で示す無音区間があると誤認識し
、a語「ぶん」と文節「しようを。
「シ、の間に[ν]印で示す無音区間があると誤認識し
、a語「ぶん」と文節「しようを。
というように二つに分けて誤認識した例である。
この場合認識境界誤りを修正しなければならないが、認
識境界区切り記号を削除したい場合は、削除したい認識
境界区切り記号にカーソル(X)を移動し[同図(g)
il、削除キー(78)を押す[同図(g)il、認識
境界区切り記号を挿入したい場合は挿入したい位置にあ
る音節にカーソル(X)を移動し挿入キー(79)を押
す。
識境界区切り記号を削除したい場合は、削除したい認識
境界区切り記号にカーソル(X)を移動し[同図(g)
il、削除キー(78)を押す[同図(g)il、認識
境界区切り記号を挿入したい場合は挿入したい位置にあ
る音節にカーソル(X)を移動し挿入キー(79)を押
す。
ただし、後に述べるように録音再生装置(2)の区切り
ビーブ音と、記憶装置(8)に記憶された認識結果に付
加された区切り記号は、録音再生装置(2)と記憶装f
t(8)の同期をとるための目印となるので、対応はと
っておかなければならない、ゆえに、この時記憶装!f
(8)に区切り記号が挿入削除されたことを記憶装置(
8)に記憶しておく。
ビーブ音と、記憶装置(8)に記憶された認識結果に付
加された区切り記号は、録音再生装置(2)と記憶装f
t(8)の同期をとるための目印となるので、対応はと
っておかなければならない、ゆえに、この時記憶装!f
(8)に区切り記号が挿入削除されたことを記憶装置(
8)に記憶しておく。
例えば、第14図(g)+に示した文章が、第14図(
g)iに示すように、記憶装置(8)に記憶されている
ものとする。(g)+の文章を、(g)iに示すように
修正した場合、記憶装置(8)に記憶されていた区切り
記号17」は、記号1マ」に改められる。記号「9ノは
、区切り記号raJが削除されたことを示す記号であり
、認識単位を示す記号には用いられず、録音再生装置(
2)等との制御のみに用いられる記号である。
g)iに示すように、記憶装置(8)に記憶されている
ものとする。(g)+の文章を、(g)iに示すように
修正した場合、記憶装置(8)に記憶されていた区切り
記号17」は、記号1マ」に改められる。記号「9ノは
、区切り記号raJが削除されたことを示す記号であり
、認識単位を示す記号には用いられず、録音再生装置(
2)等との制御のみに用いられる記号である。
このような構成にすれば、区切り記号17」を削除した
後も、録音再生装ff(2)に録音されたビーブ音と、
記憶装置(8)に記憶された記号「9」ゝ9」を用いる
ことにより、同期をとりながら再装置を制御できる。
後も、録音再生装ff(2)に録音されたビーブ音と、
記憶装置(8)に記憶された記号「9」ゝ9」を用いる
ことにより、同期をとりながら再装置を制御できる。
以、ヒは、区切り記号「マ」を削除した場合の例である
ス秋挿入された場合も同様の考え方ができる。つまり、
制御信号としては用いられず、区切りのみを表わす特定
の記号を、区切り記号「マ。
ス秋挿入された場合も同様の考え方ができる。つまり、
制御信号としては用いられず、区切りのみを表わす特定
の記号を、区切り記号「マ。
の替わりに挿入すればよい。
以上の修正手順により、第14図(1)に示すように、
文章を修正する。
文章を修正する。
認識境界誤り修正を行なった後認識境界誤り修正を行な
った認識単位について、修正手順に従って修正を加える
。再発声による修正の場合、標準パターンを登録した人
なら誰の音声でも認識できるので文章の録音者でなくと
も修正操作を行なえる。
った認識単位について、修正手順に従って修正を加える
。再発声による修正の場合、標準パターンを登録した人
なら誰の音声でも認識できるので文章の録音者でなくと
も修正操作を行なえる。
以上、かな列文章の修正方法を述べたが、修正有補助す
る機能として以下に述べる機能を有する。
る機能として以下に述べる機能を有する。
表示装置(6)に表示された文字列上のカーソル移動と
表ぶ画面のスクロール機能により、記憶装X(8)より
順次記憶文章を表示画面上に表示できるが、この時画面
上に表示されている部分に対応する音声が録音再生装置
(2)から再生される。
表ぶ画面のスクロール機能により、記憶装X(8)より
順次記憶文章を表示画面上に表示できるが、この時画面
上に表示されている部分に対応する音声が録音再生装置
(2)から再生される。
また、上述の機能とは逆の機能も宥し、録音再生装置(
2)から再生されている部分に対応した文字列が表示装
Tit<6 )に表示される。
2)から再生されている部分に対応した文字列が表示装
Tit<6 )に表示される。
また、と述のどちらの方法の場合も録音文章;こ録音さ
れている区切り記号前と、表示側に記録されている区切
り記号を、同期を取るタイミング信号として使用し、録
音再生装置(2)の再生と表示とがお互いに同期をとり
ながら動作するよう制御している。また、キーボード(
7)、または録音再生装置(2)より再生を止める信号
が入力されたとき、再生を止めるとともに、表示のスク
ロールまたはカーソルの移動を止める。
れている区切り記号前と、表示側に記録されている区切
り記号を、同期を取るタイミング信号として使用し、録
音再生装置(2)の再生と表示とがお互いに同期をとり
ながら動作するよう制御している。また、キーボード(
7)、または録音再生装置(2)より再生を止める信号
が入力されたとき、再生を止めるとともに、表示のスク
ロールまたはカーソルの移動を止める。
以との録音再生装f#(2)の再生と表示との同期機能
により、再生音を聞きながら文字列の確認を行なうこと
ができ、修正個所の発見を存易にする。
により、再生音を聞きながら文字列の確認を行なうこと
ができ、修正個所の発見を存易にする。
ここで述べている同期のとり方として、再生されている
部分に対応する記憶装置(8)の文字列を表示装置(6
)に表示する方法と、再生されている部分に対応する部
分より区切り記号−つ遅れた部分のかな列を表示装置(
6〉に表示する方法とがある。
部分に対応する記憶装置(8)の文字列を表示装置(6
)に表示する方法と、再生されている部分に対応する部
分より区切り記号−つ遅れた部分のかな列を表示装置(
6〉に表示する方法とがある。
この場合、修正のため表示を停止したときには既に録音
音声の修正部分は再生されているため再度修正部分を再
生するためには、再生された文章より修正したい部分の
頭だしを行なう必要がある。そこで、この方法を採用す
る場合は、表示を停止したとき、自動的に録音再生装置
(2)を一つ前の区切り記号までバックトラックする機
能をもたせる。
音声の修正部分は再生されているため再度修正部分を再
生するためには、再生された文章より修正したい部分の
頭だしを行なう必要がある。そこで、この方法を採用す
る場合は、表示を停止したとき、自動的に録音再生装置
(2)を一つ前の区切り記号までバックトラックする機
能をもたせる。
また、録音再生装置(2)に、テープレコーダを使用し
た場合、再生部分をモータの回転により制御することと
、テープのたるみなどにより、修正部分に対応した部分
の頭出しが正確に行なえない場合がある。
た場合、再生部分をモータの回転により制御することと
、テープのたるみなどにより、修正部分に対応した部分
の頭出しが正確に行なえない場合がある。
このような場合は、入力されてくる音声を、−定時間長
だけPCM録音やADPCM録音で記憶しておき、入力
された音声を聞き返したい場合は、PCMB音やADP
CM録音音声を聞き返す機能を付加する。
だけPCM録音やADPCM録音で記憶しておき、入力
された音声を聞き返したい場合は、PCMB音やADP
CM録音音声を聞き返す機能を付加する。
第17図は上記の、機能の一実施例であり、PCM録音
のデータを記憶しておくPCMデータメモリの図である
。図中の数字01〜05はアドレスを示している。入力
音声は、第14図に記した“わたしわ1てん1し−1あ
−る1て−1かめんの1ふんしようを1てん1おんせい
で1しφうせいした1まる”という、文章である。
のデータを記憶しておくPCMデータメモリの図である
。図中の数字01〜05はアドレスを示している。入力
音声は、第14図に記した“わたしわ1てん1し−1あ
−る1て−1かめんの1ふんしようを1てん1おんせい
で1しφうせいした1まる”という、文章である。
上記の、音声が入力されたとき、PCMデータメモリ(
DM)には、01番地に最初の無音区間までの音声“わ
たしわ”が記憶される。02番地に2番目の無音区間ま
での音声“てん”が記憶される。05番地に5番目の無
音区間までの音声“て−°2が記憶きれる。このとき、
PCMアドレスポインタ(AP)は、PCMデータメモ
リに記憶されているデータのうち、1番先に記憶された
データのアドレスを記憶しておく0本例では、01が記
憶される。
DM)には、01番地に最初の無音区間までの音声“わ
たしわ”が記憶される。02番地に2番目の無音区間ま
での音声“てん”が記憶される。05番地に5番目の無
音区間までの音声“て−°2が記憶きれる。このとき、
PCMアドレスポインタ(AP)は、PCMデータメモ
リに記憶されているデータのうち、1番先に記憶された
データのアドレスを記憶しておく0本例では、01が記
憶される。
この段階でPCMデータメモリは一杯になる。
次に、音声が入力されたときは、PCMデータメモリ(
DM)に記憶されているデータのうち、1番先に記憶さ
れたデータのアドレスに、入力された音声を記憶する1
本例では“わたしわ”が記憶されていたアドレス01に
“かめんの”を記憶する。このと!、PCMアドレスポ
インタ(AP)は、PCMデータメモリ(DM)に記憶
されているデータのうち、1番先に記憶されたデータの
アドレスを記憶しておく、′本例では、02が記憶され
る。
DM)に記憶されているデータのうち、1番先に記憶さ
れたデータのアドレスに、入力された音声を記憶する1
本例では“わたしわ”が記憶されていたアドレス01に
“かめんの”を記憶する。このと!、PCMアドレスポ
インタ(AP)は、PCMデータメモリ(DM)に記憶
されているデータのうち、1番先に記憶されたデータの
アドレスを記憶しておく、′本例では、02が記憶され
る。
この状態で、PCMデータメモリ(DM)の内容を再生
する場合、PCMアドレスポインタ(AP)の指してい
る、アドレスから、再生する0本例では、02.03,
04.05,01の順番に再生していく。
する場合、PCMアドレスポインタ(AP)の指してい
る、アドレスから、再生する0本例では、02.03,
04.05,01の順番に再生していく。
かかる方法により、何度でも、正確に素早く、音声を聞
き返すことが可能となる。
き返すことが可能となる。
また、画面上の認識単位の区切り記号上へカーソル(X
)を移動し録音音声の頭出しキー(70)を押すことに
より、カーソルが示している認識単位に対応した録音再
生装fl(2)側の区切り記号背部分を録音文章より捜
し出し、これに続く文章を再生する41能を有する。以
下に、かかる機能の実施例を示す。
)を移動し録音音声の頭出しキー(70)を押すことに
より、カーソルが示している認識単位に対応した録音再
生装fl(2)側の区切り記号背部分を録音文章より捜
し出し、これに続く文章を再生する41能を有する。以
下に、かかる機能の実施例を示す。
認識した文章の確認のため、0!識結果を記憶装置く8
)より読み出し、表示装置(6)に冒頭より表示きせる
。この時、第19図、制御部(5)の区切り記号カウン
ター(5a)は、記憶装置(8)より読み出された区切
り記号の数を計数していく、読み出した認識結果が誤っ
ている場合は、誤っている部分にカーソルをあて、頭出
しキーを押す、制御部〈5)は、録音再生装置(2)に
録音されている文章を、早送り再生モードで再生させる
。特徴抽出部<12)のビーブ音カウンター(12e)
は、録音再生装置(2)より入力される文章中の区切り
をしめずビーブ音を計数する。
)より読み出し、表示装置(6)に冒頭より表示きせる
。この時、第19図、制御部(5)の区切り記号カウン
ター(5a)は、記憶装置(8)より読み出された区切
り記号の数を計数していく、読み出した認識結果が誤っ
ている場合は、誤っている部分にカーソルをあて、頭出
しキーを押す、制御部〈5)は、録音再生装置(2)に
録音されている文章を、早送り再生モードで再生させる
。特徴抽出部<12)のビーブ音カウンター(12e)
は、録音再生装置(2)より入力される文章中の区切り
をしめずビーブ音を計数する。
比較回路(5b)は、ビープ音カウンター(12a)の
値が、先に述べた区切り記号カウンター(5a)の値よ
り、1つ小さくなったとき、信号(ハ)を録音再生装!
(2)に送り、再生を止める。
値が、先に述べた区切り記号カウンター(5a)の値よ
り、1つ小さくなったとき、信号(ハ)を録音再生装!
(2)に送り、再生を止める。
また、認識結果、および修正を終了した文章の確認のた
めには、記憶装置く8)の記憶データを表爪装置(6)
に文字列で表示させ、表示画面上に表示された文字列を
目で追い、読まなければならないため、非常に目が疲れ
る。
めには、記憶装置く8)の記憶データを表爪装置(6)
に文字列で表示させ、表示画面上に表示された文字列を
目で追い、読まなければならないため、非常に目が疲れ
る。
かかる点に鑑み、本装置は認識結果を記憶させた記憶装
置(8)上の文字列を、音声合成機能により読み上げる
機能をもたせることにより、認識結果、および修正を終
了した文章の確認を音声合成音を聞くことにより行なえ
るようにできる。
置(8)上の文字列を、音声合成機能により読み上げる
機能をもたせることにより、認識結果、および修正を終
了した文章の確認を音声合成音を聞くことにより行なえ
るようにできる。
この場合も音声合成部(9)と記憶装置(8)と録音再
生装置(2)と表示装置f(6)との同期を取るタイミ
ング信号として、区切り記号を使用する。
生装置(2)と表示装置f(6)との同期を取るタイミ
ング信号として、区切り記号を使用する。
つまり、音声合成部(9)が記憶装置!(8)より読み
上げている部分に相当する文字列が表示装置(6)に表
示され、同時に録音再生装置(2)より録音部分を頭出
しし℃いる。この方法により、音声合成音の読み合わせ
機能により誤りを発見し修正のためにa声合成の読み合
わせ機能を停止させたとき、表示装置(6)の表示も録
音再生装置(2)の録音部分も誤り部分を示しており、
即座に修正を行なうことができる。
上げている部分に相当する文字列が表示装置(6)に表
示され、同時に録音再生装置(2)より録音部分を頭出
しし℃いる。この方法により、音声合成音の読み合わせ
機能により誤りを発見し修正のためにa声合成の読み合
わせ機能を停止させたとき、表示装置(6)の表示も録
音再生装置(2)の録音部分も誤り部分を示しており、
即座に修正を行なうことができる。
ここで述べている同期のとり方として、音声合成機能に
より読み上げられている部分に対応針る2+11装置の
かな列を表示装置(6)に表示すると同時に、録音再生
装置(2)に録音されている文章より該当する音節部分
を再生する方法と、音声合成機能により読み上げられで
いる部分に対応する部分より、区切り記号−つ遅れた録
音再生装置(2)に録音されている文章部分再生する方
法とがある。後者の場合、修正のため音声合成を停止し
たとき、録音再生装置(2)は修正したい部分より手前
で停止しているため、この状態で再生すれば直ぐに修正
部分の音声を再生できる。前者の場合は修正のため音声
合成を停止したときには既に録音音声の修正部分は再生
きれているため再度修正部分を再生するためにはバック
トラックする必要がある。そこで、前者の方法を採用す
る場合は表示を停止したとさ、自動的に録音再生装置く
2)が一つ前の区切り記号までバックトラックする機能
をもたせるのが好ましい。
より読み上げられている部分に対応針る2+11装置の
かな列を表示装置(6)に表示すると同時に、録音再生
装置(2)に録音されている文章より該当する音節部分
を再生する方法と、音声合成機能により読み上げられで
いる部分に対応する部分より、区切り記号−つ遅れた録
音再生装置(2)に録音されている文章部分再生する方
法とがある。後者の場合、修正のため音声合成を停止し
たとき、録音再生装置(2)は修正したい部分より手前
で停止しているため、この状態で再生すれば直ぐに修正
部分の音声を再生できる。前者の場合は修正のため音声
合成を停止したときには既に録音音声の修正部分は再生
きれているため再度修正部分を再生するためにはバック
トラックする必要がある。そこで、前者の方法を採用す
る場合は表示を停止したとさ、自動的に録音再生装置く
2)が一つ前の区切り記号までバックトラックする機能
をもたせるのが好ましい。
以上、認識結果を記憶装置t(8)に記憶してお〈実施
例を記してきたが、別の実施例として、録音再生装R(
2)に認識結果を記憶きせる構成としてもよい。
例を記してきたが、別の実施例として、録音再生装R(
2)に認識結果を記憶きせる構成としてもよい。
このように、憶装#(8)に記憶された、認識結果を、
原文の録音された録音再生装f(2)に記録−孝れば、
原文と認識結果が、同一記録媒体に記録できるため、原
文と認識結果の管理が賽易になる。
原文の録音された録音再生装f(2)に記録−孝れば、
原文と認識結果が、同一記録媒体に記録できるため、原
文と認識結果の管理が賽易になる。
また、録音文章を、再生入力しながら、認識した結果を
録音再生装置!E(2>に録音していくことにより、外
部記憶装置が不要となる。
録音再生装置!E(2>に録音していくことにより、外
部記憶装置が不要となる。
いずれの場合も、マルチトラック方式の録音再生装置(
2〉を用いることにより、録音音声を再生しながら、音
声の録音されていないトラックに認識結果を記憶させる
ことができる。
2〉を用いることにより、録音音声を再生しながら、音
声の録音されていないトラックに認識結果を記憶させる
ことができる。
(ト)発明の効果
本発明の文章作成システムによれば、認識機能部で誤認
識した部分を録音文章より捜し出す場合、録音文章を再
生し、聞くことにより、捜し出さなければならなかった
従来の操伶に対して、極めて簡単な操仲で所望する部分
を、録音再生装置より見付けだすことが可能になり、修
正動作に移る前の原文(録音文章)の確認が容易に行な
え、この種作業効率の向上が望める。
識した部分を録音文章より捜し出す場合、録音文章を再
生し、聞くことにより、捜し出さなければならなかった
従来の操伶に対して、極めて簡単な操仲で所望する部分
を、録音再生装置より見付けだすことが可能になり、修
正動作に移る前の原文(録音文章)の確認が容易に行な
え、この種作業効率の向上が望める。
第1図は本発明の音声認識システムを採用したデイクチ
−ティングマシンの外観図、第2図はデイクチ−ティン
グマシンの構成図、第3図は音声認識部(1)の構成図
、第4図は前処理部(11)の構成図、第5図は特徴抽
出部(12)の構成図、第6図は単語認識部(13)の
構成図、第7図は文節認識部(14)の構l1ilI、
図、第8図は入力切り換え部(4)の構成図、第9図は
見出し語と録a方式とキャラクタ−音の関係図、第10
図はキャラクタ−音の録音方法と音声区間の関係図、第
11図は録音再生装置がマルチトラック方式の場合の録
音方法を示す図、第12図は録音再生装置がシングル)
・ラック方式の場合の録音方法を示す図、第13図は周
波数補正回路例を示す図、第14図は誤認識時の修正図
、第15図は候補作成部(15)内の候補バッファ(1
5a)を示す図、第16図は誤認識時の数音節修正例を
示す図、第17図はPCi録音方法説明図、第18図は
AGC動作の説明図、$19図は、区切り記号のカウン
ターの説明図である。 (1)・・・音声認識部、(2)・・・録音再生装置、
く3)・・・マイク、(6)・・・表示装置、(7)・
・・キーボード、(8)・・・記憶装置、(11)・・
・前処理部、(12)・・・特徴抽出部、(13)・・
・単語認識部、(14)・・・文節認識部、(lla)
・・・可変利得増巾器、(llb)・・・音圧変動メモ
リ。
−ティングマシンの外観図、第2図はデイクチ−ティン
グマシンの構成図、第3図は音声認識部(1)の構成図
、第4図は前処理部(11)の構成図、第5図は特徴抽
出部(12)の構成図、第6図は単語認識部(13)の
構成図、第7図は文節認識部(14)の構l1ilI、
図、第8図は入力切り換え部(4)の構成図、第9図は
見出し語と録a方式とキャラクタ−音の関係図、第10
図はキャラクタ−音の録音方法と音声区間の関係図、第
11図は録音再生装置がマルチトラック方式の場合の録
音方法を示す図、第12図は録音再生装置がシングル)
・ラック方式の場合の録音方法を示す図、第13図は周
波数補正回路例を示す図、第14図は誤認識時の修正図
、第15図は候補作成部(15)内の候補バッファ(1
5a)を示す図、第16図は誤認識時の数音節修正例を
示す図、第17図はPCi録音方法説明図、第18図は
AGC動作の説明図、$19図は、区切り記号のカウン
ターの説明図である。 (1)・・・音声認識部、(2)・・・録音再生装置、
く3)・・・マイク、(6)・・・表示装置、(7)・
・・キーボード、(8)・・・記憶装置、(11)・・
・前処理部、(12)・・・特徴抽出部、(13)・・
・単語認識部、(14)・・・文節認識部、(lla)
・・・可変利得増巾器、(llb)・・・音圧変動メモ
リ。
Claims (1)
- (1)録音再生装置に録音した無音区間を認識単位の区
切りとすることにより録音再生装置より再生された入力
音声を文節、音節、単語単位毎に認識する音声認識機能
と、無音区間を検出した場合、無音区間を検出したこと
をしめす無音区間検出信号を該録音再生装置の無音区間
に録音するとともに音声認識した結果を認識単位毎に区
切り記号をつけて記憶装置に記憶する機能と、無音区間
検出信号または無音区間の数を計数する第一のカウンタ
ーと、記憶装置より認識結果を表示装置に表示する場合
に、記憶装置より読み出した区切り記号の数を計数する
第二のカウンターとを有する音声認識装置において、 第一のカウンターと第二のカウンターを使用することに
より、記憶装置と表示装置と録音再生装置を制御し、記
憶装置より読み出し、表示装置に表示している文字列部
分の特定個所に対応した録音文章の部分を、録音再生装
置より捜し出す機能を有した文章作成システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63124523A JP2547611B2 (ja) | 1988-05-20 | 1988-05-20 | 文章作成システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63124523A JP2547611B2 (ja) | 1988-05-20 | 1988-05-20 | 文章作成システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH01293429A true JPH01293429A (ja) | 1989-11-27 |
| JP2547611B2 JP2547611B2 (ja) | 1996-10-23 |
Family
ID=14887594
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63124523A Expired - Lifetime JP2547611B2 (ja) | 1988-05-20 | 1988-05-20 | 文章作成システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2547611B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003052370A1 (en) * | 2001-12-14 | 2003-06-26 | Canon Kabushiki Kaisha | Information processing apparatus and method, and program |
-
1988
- 1988-05-20 JP JP63124523A patent/JP2547611B2/ja not_active Expired - Lifetime
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003052370A1 (en) * | 2001-12-14 | 2003-06-26 | Canon Kabushiki Kaisha | Information processing apparatus and method, and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2547611B2 (ja) | 1996-10-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5220639A (en) | Mandarin speech input method for Chinese computers and a mandarin speech recognition machine | |
| JP5313466B2 (ja) | 音声の再生に同期して音声の内容を表示させる技術 | |
| WO2007055233A1 (ja) | 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム | |
| JP2005517216A (ja) | 話されたおよび書かれたことばの高速かつパターン認識に支援された書き起こし方法および装置 | |
| JP2686085B2 (ja) | 音声認識システム | |
| JPH01293429A (ja) | 文章作成システム | |
| JP2609874B2 (ja) | 音声認識システム | |
| JP2889573B2 (ja) | 音声認識システム | |
| JP2547612B2 (ja) | 文章作成システム | |
| JP3958908B2 (ja) | 書き起こしテキスト自動生成装置、音声認識装置および記録媒体 | |
| JP2647873B2 (ja) | 文章作成システム | |
| JPS63316899A (ja) | 音声認識システム | |
| JP2777366B2 (ja) | 音声認識システム | |
| JP2647872B2 (ja) | 文章作成システム | |
| JPH01106096A (ja) | 音声認識システム | |
| JPH01161296A (ja) | 音声認識システム | |
| CN116434780A (zh) | 具备多读音纠错功能的语言学习系统 | |
| JPH0554960B2 (ja) | ||
| JPH01106100A (ja) | 音声認識システム | |
| JPH01106095A (ja) | 音声認識システム | |
| JPH01106097A (ja) | 音声認識システム | |
| JPH01293428A (ja) | 文章作成システム | |
| JPH0774960B2 (ja) | テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム | |
| JPS63317874A (ja) | デイクテ−テイングマシン | |
| JPS6315294A (ja) | 音声分析装置 |