JPH02230199A

JPH02230199A - 音声変換装置

Info

Publication number: JPH02230199A
Application number: JP1051120A
Authority: JP
Inventors: Toshiyuki Ogura; 小倉　敏行
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1989-03-02
Filing date: 1989-03-02
Publication date: 1990-09-12

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕従来、この種の音声変換装置は、音声情報を一回でテキ
スト情報に１００％変換することは難しく、誤認識や認
識不可能な場合がある。そこで、利用者が音声変換装置
を用いる場合、音声情報をテキスト情報に変換した後に
テキスト情報と変換前の音声情報とを比較して確認をお
こない、必要ならば修正等を加えてから変換後の確定し
たテキスト情報とする塙合が多い。

第４図は従来の音声変換装置の代表例のブロック図であ
る．音声入出力装置１とテキスト入出力装置２とは音声
変換装置３に接続され、音声変換装置３は音声入出力装
置１との間で音声情報の入出力をおこなう音声入出力部
１０と、テキスト入出力装ｔ２との間でテキスト情報の
入出力をおこなうテキスト入出力部１１と、音声・入出
力部１０から音声情報を受信し、テキスト情報に変換を
おこなう音声変換部１２と、音声情報とテキスト情報と
を蓄積する蓄積部１３と、音声入出力装置１またはテキ
スト入出力装置２から操作要求等を受信し、前記音声変
換装置３の動作制御をおこなう制御部１４とから構成さ
れる。

次に第４図の動作について説明する。利用者が音声変換
装置３を利用して音声情報をテキスト情報に変換する場
合、音声の変換要求であることを指定して音声入出力装
置１から音声情報を入力する。音声変、換装置３の制御
部１４は音声入出力部１０から音声の変換要求を受信し
、続いて音声入出力部１０を用いて音声情報を受信させ
る。そして、この音声情報を蓄積部ｌ３に蓄積させ、さ
らにこの音声情報を音声変換部１２を使ってテキスト情
報に変換させ、このテキスト情報も蓄積部ｌ３に蓄積さ
せる。音声の変換の終了後に、利用者がテキスト入出力
装置２から変換されたテキスト情報の読出しを要求する
と、音声変換装置３の制御部１４は、テキスト入出力部
１１からテキスト情報の読出しの要求を受け、蓄積部１
３から前記テキスト情報を読出させ、テキスト入出力部
１１を使ってこのテキスト情報をテキスト入出力装置２
に送出させる。利用者はテキスト入出力装置２に表示さ
れたテキスト情報を見ながら、変換の確認・をおこなう
。この時、変換されたテキスト情報の中で、正確に行わ
れていない等の理由により、対応する音声情報の内容の
確認をおこなう場合に、利用者はテキスト入出力装置２
から音声情報の読出しの要求をおこなう。音声変換装置
３の制御部１４は、この音声情報の読出し要求をテキス
ト入出力部１１から受信し、蓄積部１３から蓄積された
音声情報をすべて読出させ、音声入出力部１０を介して
音声入出力装置１に音声情報を送出させる．これにより
利用者は音声情報を聴きながら、テキスト情報に対応す
る部分の音声情報の内容の確認をおこなっている。

〔発明が解決しようとする課題〕

上述した従来の音声変換装置は、受信した音声情報と音
声情報を変換したテキスト情報とを個別に蓄積するだけ
であったため、利用者が変換後のテキスト情報の任意の
位置に対応する音声情報の内容を確認するような場合に
も、入力した音声情報を最初から聴き直さなければなら
ず煩わしいという欠点を有している．〔課題を解決するための手段〕本発明の音声変換装置は、受信した音声情報をテキスト
情報に変換し、この音声情報とテキスト情報とを蓄積す
る音声変換装置において、受信した音声情報を複数の音
声ブロックに分割する音声分割手段と、この音声分割手
段により得られた音声ブロックと音声ブロックに対応す
るテキスト情報との蓄積位置とそれらの識別符号とを設
定して記憶させ、テキスト情報の読出しにこの識別符号
も付加させる音声／テキスト管理手段と、この音声／テ
キスト管理手段が設定した識別符号をキーとして萌記音
声ブロックとテキスト情報との蓄積位置を記憶する音声
／テキスト対応記憶手段とを有することにより構成され
る。

〔作用〕

以上の構成では、音声変換装置において受信した音声情
報を複数の音声ブロックに分割し、音声ブロック単位に
音声情報をテキスト情報に変換し、音声ブロックとテキ
スト情報を１組にして識別符号をキーとして蓄積してい
るので、音声ブロック単位に音声情報を出力することが
できる．〔実施例〕次に、本発明の実施例について図面を参照して説明する
。

第１図は本発明の一実施例を示すブロック図である。図
において、音声入出力装置１とテキスト入出力装置２と
は音声変換装置３に接続されている。また、音声変換装
置３は、従来例と同様に音声入出力部１０、テキスト入
出力部１１、および音声変換部１２、蓄積部１３および
制御部１４を有し、さらに音声情報を複数の音声ブロッ
クに分割する音声分割部ｌ５と、音声ブロックとこの音
声ブロックを音声変換部ｌ２によって変換しなテキスト
情報とを受信し、蓄積部１３に蓄積させて蓄積部１３内
の蓄積位置を識別符号をキーとして記憶させる音声／テ
キスト管理部１６と、音声ブロックごとの音声ブロック
とテキスト情報の蓄積位置との対応を前記識別符号をキ
ーとして記憶する音声／テキスト対応表部１７とを有し
ている。

次に第１図の動作について説明する。利用者が音声入出
力装置１とテキスト入出力装置２とを利用して音声情報
をテキスト情報に変換するとき、まず利用者は音声の変
換要求であることを指定し、音声情報を音声入出力装置
１から入力する。

音声変換装置３の制御部１４は、音声入出力装置１から
の音声の変換要求を音声入出力部１０から受信すると、
音声入出力部１０に続く音声情報を受信させ、音声分割
部ｌ５にこの音声情報を複数の音声ブロックに分割させ
、音声ブロックを音声変換部ｌ２によってテキストブロ
ックに変換させる。さらに制御部］−４は音声／テキス
ト管理部１６に音声ブロックと音声ブロックに対して変
換が行われたテキストブロックとを蓄積部１３に蓄積さ
せ、音声ブロックとテキストブロックとの蓄積部１３に
おける蓄積位置を識別符号をキーにして音声／テキスト
対応表部１７に記憶させる。

音声の変換゛の終了後に利用者が、テキスト入出力装置
２からテキスト情報の読出しを要求すると、音声変換装
置３の制御部１４はテキスト入出力部１１からテキスト
情報の読出し要求を受け、蓄積部１３からテキスト情報
とその識別符号とを読出し、テキスト入出力部１１を介
してこのテキスト情報と識別府該とをテキスト入出力装
置２に送出させる。利用者はテキスト入出力装置２に表
示されたテキスト情報を見ながら、変換の確認をおこな
う。このとき利用者は、変換されたテキスト情報のうち
変換が正確に行われていない等の理由によって確認をお
こないたい部分について、識別符号を指定し音声情報の
確認要求をおこなう。制御部１４はテキスト入出力装置
２から確認要求を受け、音声／テキスト管理部１６に指
定された識別符号が含まれる音声ブロックの蓄積位置を
音声／テキスト対応表部１７から調べさせ、音声ブロッ
クを蓄積部１３から読出させて音声入出力部１０を介し
て音声入出力装置１に送出させる。これにより、利用者
は確認を行いたい部分の音声ブロック情報のみを聴いて
内容の確認が行える。また、音声情報の一部の入力をや
り直して再変換を行う場合、利用者が再変換を行ないた
い音声ブロックの識別符号を指定して、音声入出力装置
２から音声情報を入力すると、音声変換装置３の制御部
１４は音声の再入力であることを受けて、音声入出力部
１０を介して音声情報を受信させ、音声変換時と同様に
音声ブロックと音声ブロックに対応するテキストブロッ
クとを、指定された音声ブロックの代わりに蓄積部１３
に蓄積させる．第２図は音声分割部１５および音声変換
部１２における動作を示した図である。音声分割部１５
は入力された音声情報を複数の音声ブロックに分割する
。音声情報を音声ブロックに分割する手段として、ここ
では音声の有音／無音の検出をおこない、無音部分の間
の一つの有音区間を音声ブロックとして割り当てる例を
示している。音声ブロックに分割された音声情報は、音
声変換部ｌ２によって音声ブロックを単位にテキスト情
報に変換し、テキストブロックとして蓄積する。

第３図は音声／テキスト対応表部１７のメモリ構成図で
ある．この図では識別符号としてのブロック番号１が付
与された音声ブロックは、蓄積部１３の蓄積位置１００
０に蓄積され、この音声ブロックの変換結果であるテキ
ストブロックは、蓄積部１３の蓄積位置２０００に蓄積
されていることを示している。蓄積位置の数値は例えば
蓄積部１３がディスク装置であればセクタおよびトラッ
ク番号にあたる。

本実施例では、音声入出力装置とテキスト入出力装置と
を音声変換装置に接続する例について示したが、通信網
を介して音声を扱う電話機およびテキストを扱うデータ
端末をそれぞれ音声入出力装置およびテキスト入出力装
置として接続してもよい。さらには、通信網を介し“て
音声情報とテキスト情報とを扱える複合端末装置を音声
変換装置に接続してもよい．〔発明の効果〕以上述べたように本発明の音声変換装置は、音声情報を
複数の音声ブロックに分割し、音声ブロック単位にテキ
スト情報に変換をおこない、音声ブロックと音声ブロッ
クに対するテキスト情報を組にし識別符号をキーとして
蓄積しておくため、変換されたテキスト情報の任意の部
分に対応する音声情報を確認したい場合に、テキスト情
報に対応する音声ブロックのみを再生でき、全音声を聴
き直して確認する煩わしさはなくなる効果がある。また
、音声入力のやり直しを行いたい場合には、再入力する
音声ブロックに対応する識別符号を指定してから入力す
ることにより、やり直しをおこなう部分のみを再入力で
き、利用者の操作性が大きく向上する効果がある。

１３・・・蓄積部、１４・・・制御部、１５・・・音声
分割部、１６・・・音声／テキスト管理部、１７・・・
音声／テキスト対応表部．

Claims

【特許請求の範囲】

受信した音声情報をテキスト情報に変換し、この音声情
報とテキスト情報とを蓄積する音声変換装置において、
受信した音声情報を複数の音声ブロックに分割する音声
分割手段と、この音声分割手段により得られた音声ブロ
ックと音声ブロックに対応するテキスト情報との蓄積位
置とそれらの識別符号とを設定して記憶させ、テキスト
情報の読出しにこの識別符号も付加させる音声／テキス
ト管理手段と、この音声／テキスト管理手段が設定した
識別符号をキーとして前記音声ブロックとテキスト情報
との蓄積位置を記憶する音声／テキスト対応記憶手段と
を有することを特徴とする音声変換装置。