JPH02230199A - 音声変換装置 - Google Patents
音声変換装置Info
- Publication number
- JPH02230199A JPH02230199A JP1051120A JP5112089A JPH02230199A JP H02230199 A JPH02230199 A JP H02230199A JP 1051120 A JP1051120 A JP 1051120A JP 5112089 A JP5112089 A JP 5112089A JP H02230199 A JPH02230199 A JP H02230199A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- information
- text
- audio
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 40
- 238000010586 diagram Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
従来、この種の音声変換装置は、音声情報を一回でテキ
スト情報に100%変換することは難しく、誤認識や認
識不可能な場合がある。そこで、利用者が音声変換装置
を用いる場合、音声情報をテキスト情報に変換した後に
テキスト情報と変換前の音声情報とを比較して確認をお
こない、必要ならば修正等を加えてから変換後の確定し
たテキスト情報とする塙合が多い。
スト情報に100%変換することは難しく、誤認識や認
識不可能な場合がある。そこで、利用者が音声変換装置
を用いる場合、音声情報をテキスト情報に変換した後に
テキスト情報と変換前の音声情報とを比較して確認をお
こない、必要ならば修正等を加えてから変換後の確定し
たテキスト情報とする塙合が多い。
第4図は従来の音声変換装置の代表例のブロック図であ
る.音声入出力装置1とテキスト入出力装置2とは音声
変換装置3に接続され、音声変換装置3は音声入出力装
置1との間で音声情報の入出力をおこなう音声入出力部
10と、テキスト入出力装t2との間でテキスト情報の
入出力をおこなうテキスト入出力部11と、音声・入出
力部10から音声情報を受信し、テキスト情報に変換を
おこなう音声変換部12と、音声情報とテキスト情報と
を蓄積する蓄積部13と、音声入出力装置1またはテキ
スト入出力装置2から操作要求等を受信し、前記音声変
換装置3の動作制御をおこなう制御部14とから構成さ
れる。
る.音声入出力装置1とテキスト入出力装置2とは音声
変換装置3に接続され、音声変換装置3は音声入出力装
置1との間で音声情報の入出力をおこなう音声入出力部
10と、テキスト入出力装t2との間でテキスト情報の
入出力をおこなうテキスト入出力部11と、音声・入出
力部10から音声情報を受信し、テキスト情報に変換を
おこなう音声変換部12と、音声情報とテキスト情報と
を蓄積する蓄積部13と、音声入出力装置1またはテキ
スト入出力装置2から操作要求等を受信し、前記音声変
換装置3の動作制御をおこなう制御部14とから構成さ
れる。
次に第4図の動作について説明する。利用者が音声変換
装置3を利用して音声情報をテキスト情報に変換する場
合、音声の変換要求であることを指定して音声入出力装
置1から音声情報を入力する。音声変、換装置3の制御
部14は音声入出力部10から音声の変換要求を受信し
、続いて音声入出力部10を用いて音声情報を受信させ
る。そして、この音声情報を蓄積部l3に蓄積させ、さ
らにこの音声情報を音声変換部12を使ってテキスト情
報に変換させ、このテキスト情報も蓄積部l3に蓄積さ
せる。音声の変換の終了後に、利用者がテキスト入出力
装置2から変換されたテキスト情報の読出しを要求する
と、音声変換装置3の制御部14は、テキスト入出力部
11からテキスト情報の読出しの要求を受け、蓄積部1
3から前記テキスト情報を読出させ、テキスト入出力部
11を使ってこのテキスト情報をテキスト入出力装置2
に送出させる。利用者はテキスト入出力装置2に表示さ
れたテキスト情報を見ながら、変換の確認・をおこなう
。この時、変換されたテキスト情報の中で、正確に行わ
れていない等の理由により、対応する音声情報の内容の
確認をおこなう場合に、利用者はテキスト入出力装置2
から音声情報の読出しの要求をおこなう。音声変換装置
3の制御部14は、この音声情報の読出し要求をテキス
ト入出力部11から受信し、蓄積部13から蓄積された
音声情報をすべて読出させ、音声入出力部10を介して
音声入出力装置1に音声情報を送出させる.これにより
利用者は音声情報を聴きながら、テキスト情報に対応す
る部分の音声情報の内容の確認をおこなっている。
装置3を利用して音声情報をテキスト情報に変換する場
合、音声の変換要求であることを指定して音声入出力装
置1から音声情報を入力する。音声変、換装置3の制御
部14は音声入出力部10から音声の変換要求を受信し
、続いて音声入出力部10を用いて音声情報を受信させ
る。そして、この音声情報を蓄積部l3に蓄積させ、さ
らにこの音声情報を音声変換部12を使ってテキスト情
報に変換させ、このテキスト情報も蓄積部l3に蓄積さ
せる。音声の変換の終了後に、利用者がテキスト入出力
装置2から変換されたテキスト情報の読出しを要求する
と、音声変換装置3の制御部14は、テキスト入出力部
11からテキスト情報の読出しの要求を受け、蓄積部1
3から前記テキスト情報を読出させ、テキスト入出力部
11を使ってこのテキスト情報をテキスト入出力装置2
に送出させる。利用者はテキスト入出力装置2に表示さ
れたテキスト情報を見ながら、変換の確認・をおこなう
。この時、変換されたテキスト情報の中で、正確に行わ
れていない等の理由により、対応する音声情報の内容の
確認をおこなう場合に、利用者はテキスト入出力装置2
から音声情報の読出しの要求をおこなう。音声変換装置
3の制御部14は、この音声情報の読出し要求をテキス
ト入出力部11から受信し、蓄積部13から蓄積された
音声情報をすべて読出させ、音声入出力部10を介して
音声入出力装置1に音声情報を送出させる.これにより
利用者は音声情報を聴きながら、テキスト情報に対応す
る部分の音声情報の内容の確認をおこなっている。
上述した従来の音声変換装置は、受信した音声情報と音
声情報を変換したテキスト情報とを個別に蓄積するだけ
であったため、利用者が変換後のテキスト情報の任意の
位置に対応する音声情報の内容を確認するような場合に
も、入力した音声情報を最初から聴き直さなければなら
ず煩わしいという欠点を有している. 〔課題を解決するための手段〕 本発明の音声変換装置は、受信した音声情報をテキスト
情報に変換し、この音声情報とテキスト情報とを蓄積す
る音声変換装置において、受信した音声情報を複数の音
声ブロックに分割する音声分割手段と、この音声分割手
段により得られた音声ブロックと音声ブロックに対応す
るテキスト情報との蓄積位置とそれらの識別符号とを設
定して記憶させ、テキスト情報の読出しにこの識別符号
も付加させる音声/テキスト管理手段と、この音声/テ
キスト管理手段が設定した識別符号をキーとして萌記音
声ブロックとテキスト情報との蓄積位置を記憶する音声
/テキスト対応記憶手段とを有することにより構成され
る。
声情報を変換したテキスト情報とを個別に蓄積するだけ
であったため、利用者が変換後のテキスト情報の任意の
位置に対応する音声情報の内容を確認するような場合に
も、入力した音声情報を最初から聴き直さなければなら
ず煩わしいという欠点を有している. 〔課題を解決するための手段〕 本発明の音声変換装置は、受信した音声情報をテキスト
情報に変換し、この音声情報とテキスト情報とを蓄積す
る音声変換装置において、受信した音声情報を複数の音
声ブロックに分割する音声分割手段と、この音声分割手
段により得られた音声ブロックと音声ブロックに対応す
るテキスト情報との蓄積位置とそれらの識別符号とを設
定して記憶させ、テキスト情報の読出しにこの識別符号
も付加させる音声/テキスト管理手段と、この音声/テ
キスト管理手段が設定した識別符号をキーとして萌記音
声ブロックとテキスト情報との蓄積位置を記憶する音声
/テキスト対応記憶手段とを有することにより構成され
る。
以上の構成では、音声変換装置において受信した音声情
報を複数の音声ブロックに分割し、音声ブロック単位に
音声情報をテキスト情報に変換し、音声ブロックとテキ
スト情報を1組にして識別符号をキーとして蓄積してい
るので、音声ブロック単位に音声情報を出力することが
できる.〔実施例〕 次に、本発明の実施例について図面を参照して説明する
。
報を複数の音声ブロックに分割し、音声ブロック単位に
音声情報をテキスト情報に変換し、音声ブロックとテキ
スト情報を1組にして識別符号をキーとして蓄積してい
るので、音声ブロック単位に音声情報を出力することが
できる.〔実施例〕 次に、本発明の実施例について図面を参照して説明する
。
第1図は本発明の一実施例を示すブロック図である。図
において、音声入出力装置1とテキスト入出力装置2と
は音声変換装置3に接続されている。また、音声変換装
置3は、従来例と同様に音声入出力部10、テキスト入
出力部11、および音声変換部12、蓄積部13および
制御部14を有し、さらに音声情報を複数の音声ブロッ
クに分割する音声分割部l5と、音声ブロックとこの音
声ブロックを音声変換部l2によって変換しなテキスト
情報とを受信し、蓄積部13に蓄積させて蓄積部13内
の蓄積位置を識別符号をキーとして記憶させる音声/テ
キスト管理部16と、音声ブロックごとの音声ブロック
とテキスト情報の蓄積位置との対応を前記識別符号をキ
ーとして記憶する音声/テキスト対応表部17とを有し
ている。
において、音声入出力装置1とテキスト入出力装置2と
は音声変換装置3に接続されている。また、音声変換装
置3は、従来例と同様に音声入出力部10、テキスト入
出力部11、および音声変換部12、蓄積部13および
制御部14を有し、さらに音声情報を複数の音声ブロッ
クに分割する音声分割部l5と、音声ブロックとこの音
声ブロックを音声変換部l2によって変換しなテキスト
情報とを受信し、蓄積部13に蓄積させて蓄積部13内
の蓄積位置を識別符号をキーとして記憶させる音声/テ
キスト管理部16と、音声ブロックごとの音声ブロック
とテキスト情報の蓄積位置との対応を前記識別符号をキ
ーとして記憶する音声/テキスト対応表部17とを有し
ている。
次に第1図の動作について説明する。利用者が音声入出
力装置1とテキスト入出力装置2とを利用して音声情報
をテキスト情報に変換するとき、まず利用者は音声の変
換要求であることを指定し、音声情報を音声入出力装置
1から入力する。
力装置1とテキスト入出力装置2とを利用して音声情報
をテキスト情報に変換するとき、まず利用者は音声の変
換要求であることを指定し、音声情報を音声入出力装置
1から入力する。
音声変換装置3の制御部14は、音声入出力装置1から
の音声の変換要求を音声入出力部10から受信すると、
音声入出力部10に続く音声情報を受信させ、音声分割
部l5にこの音声情報を複数の音声ブロックに分割させ
、音声ブロックを音声変換部l2によってテキストブロ
ックに変換させる。さらに制御部]−4は音声/テキス
ト管理部16に音声ブロックと音声ブロックに対して変
換が行われたテキストブロックとを蓄積部13に蓄積さ
せ、音声ブロックとテキストブロックとの蓄積部13に
おける蓄積位置を識別符号をキーにして音声/テキスト
対応表部17に記憶させる。
の音声の変換要求を音声入出力部10から受信すると、
音声入出力部10に続く音声情報を受信させ、音声分割
部l5にこの音声情報を複数の音声ブロックに分割させ
、音声ブロックを音声変換部l2によってテキストブロ
ックに変換させる。さらに制御部]−4は音声/テキス
ト管理部16に音声ブロックと音声ブロックに対して変
換が行われたテキストブロックとを蓄積部13に蓄積さ
せ、音声ブロックとテキストブロックとの蓄積部13に
おける蓄積位置を識別符号をキーにして音声/テキスト
対応表部17に記憶させる。
音声の変換゛の終了後に利用者が、テキスト入出力装置
2からテキスト情報の読出しを要求すると、音声変換装
置3の制御部14はテキスト入出力部11からテキスト
情報の読出し要求を受け、蓄積部13からテキスト情報
とその識別符号とを読出し、テキスト入出力部11を介
してこのテキスト情報と識別府該とをテキスト入出力装
置2に送出させる。利用者はテキスト入出力装置2に表
示されたテキスト情報を見ながら、変換の確認をおこな
う。このとき利用者は、変換されたテキスト情報のうち
変換が正確に行われていない等の理由によって確認をお
こないたい部分について、識別符号を指定し音声情報の
確認要求をおこなう。制御部14はテキスト入出力装置
2から確認要求を受け、音声/テキスト管理部16に指
定された識別符号が含まれる音声ブロックの蓄積位置を
音声/テキスト対応表部17から調べさせ、音声ブロッ
クを蓄積部13から読出させて音声入出力部10を介し
て音声入出力装置1に送出させる。これにより、利用者
は確認を行いたい部分の音声ブロック情報のみを聴いて
内容の確認が行える。また、音声情報の一部の入力をや
り直して再変換を行う場合、利用者が再変換を行ないた
い音声ブロックの識別符号を指定して、音声入出力装置
2から音声情報を入力すると、音声変換装置3の制御部
14は音声の再入力であることを受けて、音声入出力部
10を介して音声情報を受信させ、音声変換時と同様に
音声ブロックと音声ブロックに対応するテキストブロッ
クとを、指定された音声ブロックの代わりに蓄積部13
に蓄積させる.第2図は音声分割部15および音声変換
部12における動作を示した図である。音声分割部15
は入力された音声情報を複数の音声ブロックに分割する
。音声情報を音声ブロックに分割する手段として、ここ
では音声の有音/無音の検出をおこない、無音部分の間
の一つの有音区間を音声ブロックとして割り当てる例を
示している。音声ブロックに分割された音声情報は、音
声変換部l2によって音声ブロックを単位にテキスト情
報に変換し、テキストブロックとして蓄積する。
2からテキスト情報の読出しを要求すると、音声変換装
置3の制御部14はテキスト入出力部11からテキスト
情報の読出し要求を受け、蓄積部13からテキスト情報
とその識別符号とを読出し、テキスト入出力部11を介
してこのテキスト情報と識別府該とをテキスト入出力装
置2に送出させる。利用者はテキスト入出力装置2に表
示されたテキスト情報を見ながら、変換の確認をおこな
う。このとき利用者は、変換されたテキスト情報のうち
変換が正確に行われていない等の理由によって確認をお
こないたい部分について、識別符号を指定し音声情報の
確認要求をおこなう。制御部14はテキスト入出力装置
2から確認要求を受け、音声/テキスト管理部16に指
定された識別符号が含まれる音声ブロックの蓄積位置を
音声/テキスト対応表部17から調べさせ、音声ブロッ
クを蓄積部13から読出させて音声入出力部10を介し
て音声入出力装置1に送出させる。これにより、利用者
は確認を行いたい部分の音声ブロック情報のみを聴いて
内容の確認が行える。また、音声情報の一部の入力をや
り直して再変換を行う場合、利用者が再変換を行ないた
い音声ブロックの識別符号を指定して、音声入出力装置
2から音声情報を入力すると、音声変換装置3の制御部
14は音声の再入力であることを受けて、音声入出力部
10を介して音声情報を受信させ、音声変換時と同様に
音声ブロックと音声ブロックに対応するテキストブロッ
クとを、指定された音声ブロックの代わりに蓄積部13
に蓄積させる.第2図は音声分割部15および音声変換
部12における動作を示した図である。音声分割部15
は入力された音声情報を複数の音声ブロックに分割する
。音声情報を音声ブロックに分割する手段として、ここ
では音声の有音/無音の検出をおこない、無音部分の間
の一つの有音区間を音声ブロックとして割り当てる例を
示している。音声ブロックに分割された音声情報は、音
声変換部l2によって音声ブロックを単位にテキスト情
報に変換し、テキストブロックとして蓄積する。
第3図は音声/テキスト対応表部17のメモリ構成図で
ある.この図では識別符号としてのブロック番号1が付
与された音声ブロックは、蓄積部13の蓄積位置100
0に蓄積され、この音声ブロックの変換結果であるテキ
ストブロックは、蓄積部13の蓄積位置2000に蓄積
されていることを示している。蓄積位置の数値は例えば
蓄積部13がディスク装置であればセクタおよびトラッ
ク番号にあたる。
ある.この図では識別符号としてのブロック番号1が付
与された音声ブロックは、蓄積部13の蓄積位置100
0に蓄積され、この音声ブロックの変換結果であるテキ
ストブロックは、蓄積部13の蓄積位置2000に蓄積
されていることを示している。蓄積位置の数値は例えば
蓄積部13がディスク装置であればセクタおよびトラッ
ク番号にあたる。
本実施例では、音声入出力装置とテキスト入出力装置と
を音声変換装置に接続する例について示したが、通信網
を介して音声を扱う電話機およびテキストを扱うデータ
端末をそれぞれ音声入出力装置およびテキスト入出力装
置として接続してもよい。さらには、通信網を介し“て
音声情報とテキスト情報とを扱える複合端末装置を音声
変換装置に接続してもよい. 〔発明の効果〕 以上述べたように本発明の音声変換装置は、音声情報を
複数の音声ブロックに分割し、音声ブロック単位にテキ
スト情報に変換をおこない、音声ブロックと音声ブロッ
クに対するテキスト情報を組にし識別符号をキーとして
蓄積しておくため、変換されたテキスト情報の任意の部
分に対応する音声情報を確認したい場合に、テキスト情
報に対応する音声ブロックのみを再生でき、全音声を聴
き直して確認する煩わしさはなくなる効果がある。また
、音声入力のやり直しを行いたい場合には、再入力する
音声ブロックに対応する識別符号を指定してから入力す
ることにより、やり直しをおこなう部分のみを再入力で
き、利用者の操作性が大きく向上する効果がある。
を音声変換装置に接続する例について示したが、通信網
を介して音声を扱う電話機およびテキストを扱うデータ
端末をそれぞれ音声入出力装置およびテキスト入出力装
置として接続してもよい。さらには、通信網を介し“て
音声情報とテキスト情報とを扱える複合端末装置を音声
変換装置に接続してもよい. 〔発明の効果〕 以上述べたように本発明の音声変換装置は、音声情報を
複数の音声ブロックに分割し、音声ブロック単位にテキ
スト情報に変換をおこない、音声ブロックと音声ブロッ
クに対するテキスト情報を組にし識別符号をキーとして
蓄積しておくため、変換されたテキスト情報の任意の部
分に対応する音声情報を確認したい場合に、テキスト情
報に対応する音声ブロックのみを再生でき、全音声を聴
き直して確認する煩わしさはなくなる効果がある。また
、音声入力のやり直しを行いたい場合には、再入力する
音声ブロックに対応する識別符号を指定してから入力す
ることにより、やり直しをおこなう部分のみを再入力で
き、利用者の操作性が大きく向上する効果がある。
13・・・蓄積部、14・・・制御部、15・・・音声
分割部、16・・・音声/テキスト管理部、17・・・
音声/テキスト対応表部.
分割部、16・・・音声/テキスト管理部、17・・・
音声/テキスト対応表部.
Claims (1)
- 受信した音声情報をテキスト情報に変換し、この音声情
報とテキスト情報とを蓄積する音声変換装置において、
受信した音声情報を複数の音声ブロックに分割する音声
分割手段と、この音声分割手段により得られた音声ブロ
ックと音声ブロックに対応するテキスト情報との蓄積位
置とそれらの識別符号とを設定して記憶させ、テキスト
情報の読出しにこの識別符号も付加させる音声/テキス
ト管理手段と、この音声/テキスト管理手段が設定した
識別符号をキーとして前記音声ブロックとテキスト情報
との蓄積位置を記憶する音声/テキスト対応記憶手段と
を有することを特徴とする音声変換装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1051120A JPH02230199A (ja) | 1989-03-02 | 1989-03-02 | 音声変換装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1051120A JPH02230199A (ja) | 1989-03-02 | 1989-03-02 | 音声変換装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02230199A true JPH02230199A (ja) | 1990-09-12 |
Family
ID=12877946
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1051120A Pending JPH02230199A (ja) | 1989-03-02 | 1989-03-02 | 音声変換装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02230199A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003518266A (ja) * | 1999-12-20 | 2003-06-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声認識システムのテキスト編集用音声再生 |
| JP2007025075A (ja) * | 2005-07-13 | 2007-02-01 | Xanavi Informatics Corp | ナビゲーション装置 |
-
1989
- 1989-03-02 JP JP1051120A patent/JPH02230199A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003518266A (ja) * | 1999-12-20 | 2003-06-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声認識システムのテキスト編集用音声再生 |
| JP2007025075A (ja) * | 2005-07-13 | 2007-02-01 | Xanavi Informatics Corp | ナビゲーション装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5255310A (en) | Method of approximately matching an input character string with a key word and vocally outputting data | |
| EP0633682B1 (en) | Audio data processing | |
| DE60033122T2 (de) | Benutzeroberfläche zur Text-zu-Sprache-Umsetzung | |
| US5884256A (en) | Networked stenographic system with real-time speech to text conversion for down-line display and annotation | |
| US4276444A (en) | Synthetic-speech calculators | |
| US7631343B1 (en) | Down-line transcription system using automatic tracking and revenue collection | |
| CA2241763C (en) | Method and apparatus for specifying alphanumeric information with a telephone keypad | |
| US4831653A (en) | System for registering speech information to make a voice dictionary | |
| JPH02230199A (ja) | 音声変換装置 | |
| JPH01114898A (ja) | データ検索装置 | |
| US20010016784A1 (en) | Audio data storage device | |
| JPH042254A (ja) | 文字入力用電話機システムおよび入力文字列とキーワードとの近似的一致方法 | |
| JPS5857877A (ja) | 多重情報テレビジヨンの方法及び装置 | |
| JPH05323988A (ja) | 音声出力機能を有するキーボード | |
| JPS59870B2 (ja) | 電子メモ装置 | |
| KR100509951B1 (ko) | 전화번호 데이터베이스 정정장치 | |
| KR960011283B1 (ko) | 디지탈 음향 기기에서의 선곡번호 입력 방법 및 장치 | |
| JPS6126982Y2 (ja) | ||
| KR200186153Y1 (ko) | 음성 데이터 수집을 위한 에이디피씨엠 트랜스코더 | |
| US5684477A (en) | Electronic systems interfacing | |
| JPS60186947A (ja) | 情報フアイル装置 | |
| JPS62229326A (ja) | コマンド格納用メモリ付端末装置 | |
| JPS61240297A (ja) | 音声入出力装置 | |
| JPH06139045A (ja) | 遠隔監視装置および自動取引装置 | |
| JPS59193500A (ja) | 音声認識部の不特定、特定切り換え方式 |