JP2003263200A - 話速変換装置、話速変換方法、音声ガイダンス装置、メディア装置、記憶媒体および話速変換プログラム - Google Patents
話速変換装置、話速変換方法、音声ガイダンス装置、メディア装置、記憶媒体および話速変換プログラムInfo
- Publication number
- JP2003263200A JP2003263200A JP2002065600A JP2002065600A JP2003263200A JP 2003263200 A JP2003263200 A JP 2003263200A JP 2002065600 A JP2002065600 A JP 2002065600A JP 2002065600 A JP2002065600 A JP 2002065600A JP 2003263200 A JP2003263200 A JP 2003263200A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speed
- input
- voice data
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Control Or Security For Electrophotography (AREA)
Abstract
(57)【要約】
【課題】 本発明は、再生速度全体を高速化しつつ、キ
ーワードを聞き取りやすくするような再生を行なうこと
ができる話速変換装置、話速変換方法、音声ガイダンス
装置、メディア装置、記憶媒体および話速変換プログラ
ムを提供する。 【解決手段】 メディア装置に搭載された音声ガイダン
ス装置1が、複数の音声部分に分割された音声データが
入力される音声入力手段201と、音声入力手段201
に入力される音声データの任意の音声部分の速度を設定
するオペレーション入力手段103および速度入力手段
202と、音声入力手段201に入力された音声データ
の任意の音声部分の速度を速度入力手段202で設定さ
れた速度に従って変換する速度制御手段203とを有し
ている。
ーワードを聞き取りやすくするような再生を行なうこと
ができる話速変換装置、話速変換方法、音声ガイダンス
装置、メディア装置、記憶媒体および話速変換プログラ
ムを提供する。 【解決手段】 メディア装置に搭載された音声ガイダン
ス装置1が、複数の音声部分に分割された音声データが
入力される音声入力手段201と、音声入力手段201
に入力される音声データの任意の音声部分の速度を設定
するオペレーション入力手段103および速度入力手段
202と、音声入力手段201に入力された音声データ
の任意の音声部分の速度を速度入力手段202で設定さ
れた速度に従って変換する速度制御手段203とを有し
ている。
Description
【0001】
【発明の属する技術分野】本発明は、音声ガイダンスを
構成する任意の音声部分の速度を変更することができる
話速変換装置、話速変換方法、音声ガイダンス装置、メ
ディア装置、記憶媒体および話速変換プログラム音声認
識装置、音声認識方法および音声認識プログラムが記憶
された記憶媒体に関する。
構成する任意の音声部分の速度を変更することができる
話速変換装置、話速変換方法、音声ガイダンス装置、メ
ディア装置、記憶媒体および話速変換プログラム音声認
識装置、音声認識方法および音声認識プログラムが記憶
された記憶媒体に関する。
【0002】
【従来の技術】従来より、音の出る信号機や、曲がる方
向を音で知らせるトラック等にあっては、視覚障害者等
のために音声メッセージを用いた機械が存在するが、近
時では、PC(パーソナルコンピュータ)、コピー装
置、ファクシミリ装置等のOA機器についても音声によ
るガイダンスメッセージを出すことによって操作性を高
めるものが注目されてきている。
向を音で知らせるトラック等にあっては、視覚障害者等
のために音声メッセージを用いた機械が存在するが、近
時では、PC(パーソナルコンピュータ)、コピー装
置、ファクシミリ装置等のOA機器についても音声によ
るガイダンスメッセージを出すことによって操作性を高
めるものが注目されてきている。
【0003】音声メッセージは、常に通常の速度で再生
するのではなく、速度を変換して再生することにより、
確実に聞き取りを行なったり、作業を効率化することが
できる。
するのではなく、速度を変換して再生することにより、
確実に聞き取りを行なったり、作業を効率化することが
できる。
【0004】例えば、音声データをゆっくり再生するこ
とにより、ガイダンス音声を確実に聞き取ることができ
るようになり、また、高速に再生することにより、早く
次の作業に移ることができるようになる。
とにより、ガイダンス音声を確実に聞き取ることができ
るようになり、また、高速に再生することにより、早く
次の作業に移ることができるようになる。
【0005】このような音声再生速度を変化させるため
に、例えば速度を速める場合は、磁気テープに録音され
た音声を早回しで再生したり、DA変換時にサンプリン
グを速めたりして再生速度を速くすることが考えられ
る。
に、例えば速度を速める場合は、磁気テープに録音され
た音声を早回しで再生したり、DA変換時にサンプリン
グを速めたりして再生速度を速くすることが考えられ
る。
【0006】ところが、この手法では、再生速度を速め
れば速めるほど、音声のピッチ(高さ)が高くなってし
まうなど、元の音声の持っている特徴が失われてしま
う。
れば速めるほど、音声のピッチ(高さ)が高くなってし
まうなど、元の音声の持っている特徴が失われてしま
う。
【0007】このため、音声のピッチを変えないように
速度だけ変換する話速変換手法がこれまでに開発されて
おり、「森田、板倉:ポインター移動量制御による重複
加算法(PICOLA)を用いた音声の時間軸での伸長
圧縮とその評価−日本音響学会講演論文集1−4−14
(昭和63年3月)」記載の、時間領域調波構造伸縮(Tim
e-Domain Harmonic Scaling:TDHS)アルゴリズムを用い
たPICOLA方式がそのような話速変換手法の一つと
してあげられる。
速度だけ変換する話速変換手法がこれまでに開発されて
おり、「森田、板倉:ポインター移動量制御による重複
加算法(PICOLA)を用いた音声の時間軸での伸長
圧縮とその評価−日本音響学会講演論文集1−4−14
(昭和63年3月)」記載の、時間領域調波構造伸縮(Tim
e-Domain Harmonic Scaling:TDHS)アルゴリズムを用い
たPICOLA方式がそのような話速変換手法の一つと
してあげられる。
【0008】また、特開平5−257490号公報に記
載される話速変換手法があり、この技術では、ニュース
番組のように発話時間が比較的限られている場合に、ゆ
っくりした音声で聞き取りやすく再生したい場合に、話
速を文章で一様に変換するのではなく、無音区間を検出
し、無音区間は詰め、有音区間のみをゆっくりと再生す
ることにより、全体の発話時間を大きく増加させないよ
うな手法である。
載される話速変換手法があり、この技術では、ニュース
番組のように発話時間が比較的限られている場合に、ゆ
っくりした音声で聞き取りやすく再生したい場合に、話
速を文章で一様に変換するのではなく、無音区間を検出
し、無音区間は詰め、有音区間のみをゆっくりと再生す
ることにより、全体の発話時間を大きく増加させないよ
うな手法である。
【0009】さらに、特許番号2612868号に記載
される話速変換手法があり、この技術は、有音区間を有
声音部分と無声音区間等に分類し、それぞれ異なる比率
で変換することにより、聴感上自然な話速変換音声を得
ようとする手法である。
される話速変換手法があり、この技術は、有音区間を有
声音部分と無声音区間等に分類し、それぞれ異なる比率
で変換することにより、聴感上自然な話速変換音声を得
ようとする手法である。
【0010】しかし、以上の手法を含め、従来の話速変
換手法は、有音区間あるいは有声音区間については、発
話されている言葉の意味内容等には依らず、一様に速度
を変換しようとするものであった。
換手法は、有音区間あるいは有声音区間については、発
話されている言葉の意味内容等には依らず、一様に速度
を変換しようとするものであった。
【0011】一方、機械操作のためのガイダンス音声に
ついては、ガイダンス音声自体は文章の形で与えられる
ものが多いが、その文章の中では、重要なキーワードの
みがはっきりと聞き取ることができれば十分なものが多
い。
ついては、ガイダンス音声自体は文章の形で与えられる
ものが多いが、その文章の中では、重要なキーワードの
みがはっきりと聞き取ることができれば十分なものが多
い。
【0012】ファクシミリ装置の音声ガイダンスについ
て考察した場合、「電話の方はそのままお待ちくださ
い」を例に取ると、「電話」「お待ちください」が重要
なキーワードであり、これらの言葉がはっきり聞こえれ
ば、操作上大きな問題は起きない。
て考察した場合、「電話の方はそのままお待ちくださ
い」を例に取ると、「電話」「お待ちください」が重要
なキーワードであり、これらの言葉がはっきり聞こえれ
ば、操作上大きな問題は起きない。
【0013】
【発明が解決しようとする課題】しかしながら、このよ
うな話速変換方法にあっては、文章全体の速度が調整さ
れるため、上述した特定のキーワードのみをゆっくり再
生することができず、全体的にゆっくりした再生音声し
か得られずに作業が非効率的になったり、作業を急ぐ場
合に高速に再生したときにキーワードが聞き取りづらく
なって作業が非効率的になったりする可能性がある。
うな話速変換方法にあっては、文章全体の速度が調整さ
れるため、上述した特定のキーワードのみをゆっくり再
生することができず、全体的にゆっくりした再生音声し
か得られずに作業が非効率的になったり、作業を急ぐ場
合に高速に再生したときにキーワードが聞き取りづらく
なって作業が非効率的になったりする可能性がある。
【0014】そこで本発明は、文章の任意の個所の再生
速度を任意の速度に変換することにより、再生速度全体
を高速化しつつ、キーワードを聞き取りやすくするよう
な再生を行なうことができる話速変換装置、話速変換方
法、音声ガイダンス装置、メディア装置、記憶媒体およ
び話速変換プログラムを提供することを目的としてい
る。
速度を任意の速度に変換することにより、再生速度全体
を高速化しつつ、キーワードを聞き取りやすくするよう
な再生を行なうことができる話速変換装置、話速変換方
法、音声ガイダンス装置、メディア装置、記憶媒体およ
び話速変換プログラムを提供することを目的としてい
る。
【0015】
【課題を解決するための手段】本発明の話速変換装置
は、上記課題を解決するために、入力された音声データ
の再生速度を変換して出力する話速変換装置であって、
複数の音声部分に分割された音声データが入力される音
声入力手段と、前記音声入力手段に入力される前記音声
データの任意の音声部分の速度を設定する速度設定手段
と、前記音声入力手段に入力された音声データの任意の
音声部分の速度を前記速度設定手段で設定された速度に
従って変換する速度制御手段とを備えることを特徴とし
ている。
は、上記課題を解決するために、入力された音声データ
の再生速度を変換して出力する話速変換装置であって、
複数の音声部分に分割された音声データが入力される音
声入力手段と、前記音声入力手段に入力される前記音声
データの任意の音声部分の速度を設定する速度設定手段
と、前記音声入力手段に入力された音声データの任意の
音声部分の速度を前記速度設定手段で設定された速度に
従って変換する速度制御手段とを備えることを特徴とし
ている。
【0016】このような構成により、全体的に話速を速
める場合に重要なキーワード(音声部分)を比較的低速
に再生して聞き取りやすくすることができるため、ユー
ザがより理解しやすい再生音声を得ることができる。
める場合に重要なキーワード(音声部分)を比較的低速
に再生して聞き取りやすくすることができるため、ユー
ザがより理解しやすい再生音声を得ることができる。
【0017】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
【0018】また、本発明の話速変換方法は、上記課題
を解決するために、入力された音声データの再生速度を
変換して出力する話速変換方法であって、複数の音声部
分に分割された音声データが入力される音声入力工程
と、前記音声入力工程で入力される前記音声データの任
意の音声部分の速度を設定する速度設定工程と、前記音
声入力工程で入力された音声データの任意の音声部分の
速度を前記速度設定工程で設定された速度に従って変換
する速度制御工程手段とを含んでなることを特徴として
いる。
を解決するために、入力された音声データの再生速度を
変換して出力する話速変換方法であって、複数の音声部
分に分割された音声データが入力される音声入力工程
と、前記音声入力工程で入力される前記音声データの任
意の音声部分の速度を設定する速度設定工程と、前記音
声入力工程で入力された音声データの任意の音声部分の
速度を前記速度設定工程で設定された速度に従って変換
する速度制御工程手段とを含んでなることを特徴として
いる。
【0019】このような方法により、全体的に話速を速
める場合に重要なキーワード(音声部分)を比較的低速
に再生して聞き取りやすくすることができるため、ユー
ザがより理解しやすい再生音声を得ることができる。
める場合に重要なキーワード(音声部分)を比較的低速
に再生して聞き取りやすくすることができるため、ユー
ザがより理解しやすい再生音声を得ることができる。
【0020】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
【0021】また、本発明の音声ガイダンス装置は、上
記課題を解決するために、各種操作を行なう操作手段
と、少なくとも最小単位の音声部分が蓄積されたメッセ
ージ蓄積手段と、前記操作手段の操作状況に応じて前記
メッセージ蓄積手段に蓄積された音声部分を組合わせて
一連のメッセージを生成するメッセージ生成手段と、前
記メッセージ生成手段によって生成されたメッセージを
合成して音声データを生成する音声合成手段と、前記音
声合成手段によって合成された音声データが入力される
音声入力手段と、前記メッセージ生成手段によって生成
されたメッセージに対し、音声部分毎に速度を設定する
速度設定手段と、前記音声入力手段に入力された音声デ
ータの任意の音声部分の速度を前記速度設定手段で設定
された速度に従って変換する速度制御手段とを備えるこ
とを特徴としている。
記課題を解決するために、各種操作を行なう操作手段
と、少なくとも最小単位の音声部分が蓄積されたメッセ
ージ蓄積手段と、前記操作手段の操作状況に応じて前記
メッセージ蓄積手段に蓄積された音声部分を組合わせて
一連のメッセージを生成するメッセージ生成手段と、前
記メッセージ生成手段によって生成されたメッセージを
合成して音声データを生成する音声合成手段と、前記音
声合成手段によって合成された音声データが入力される
音声入力手段と、前記メッセージ生成手段によって生成
されたメッセージに対し、音声部分毎に速度を設定する
速度設定手段と、前記音声入力手段に入力された音声デ
ータの任意の音声部分の速度を前記速度設定手段で設定
された速度に従って変換する速度制御手段とを備えるこ
とを特徴としている。
【0022】このような構成により、全体的に話速を速
める場合に重要なキーワード(音声部分)を比較的低速
に再生して聞き取りやすくすることができるため、ユー
ザがより理解しやすい再生音声を得ることができる。
める場合に重要なキーワード(音声部分)を比較的低速
に再生して聞き取りやすくすることができるため、ユー
ザがより理解しやすい再生音声を得ることができる。
【0023】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
【0024】また、本発明のメディア装置は、上記課題
を解決するために、ガイダンス装置を備えたメディアで
あって、前記メッセージ蓄積手段に前記メディア装置の
操作状況に応じた音声部分が蓄積されることを特徴とし
ている。
を解決するために、ガイダンス装置を備えたメディアで
あって、前記メッセージ蓄積手段に前記メディア装置の
操作状況に応じた音声部分が蓄積されることを特徴とし
ている。
【0025】このような構成により、ファクシミリ装
置、コピー装置、プリンタ装置、複合機等のメディア装
置に操作に関連する音声ガイダンスの速度を簡単に調整
することができ、理解しやすい再生音声を得ることがで
きる。
置、コピー装置、プリンタ装置、複合機等のメディア装
置に操作に関連する音声ガイダンスの速度を簡単に調整
することができ、理解しやすい再生音声を得ることがで
きる。
【0026】また、本発明の記憶媒体は、上記課題を解
決するために、コンピュータに、複数の音声部分に分割
された音声データを入力する機能と、前記入力される音
声データの任意の音声部分の速度を設定する機能と、前
記入力された音声データの任意の音声部分の速度を前記
設定された速度に従って変換する機能とを実行させるた
めの話速変換プログラムが記憶されたことを特徴として
いる。
決するために、コンピュータに、複数の音声部分に分割
された音声データを入力する機能と、前記入力される音
声データの任意の音声部分の速度を設定する機能と、前
記入力された音声データの任意の音声部分の速度を前記
設定された速度に従って変換する機能とを実行させるた
めの話速変換プログラムが記憶されたことを特徴として
いる。
【0027】このような記憶媒体を用いることにより、
全体的に話速を速める場合に重要なキーワード(音声部
分)を比較的低速に再生して聞き取りやすくすることが
できるため、ユーザがより理解しやすい再生音声を得る
ことができる。
全体的に話速を速める場合に重要なキーワード(音声部
分)を比較的低速に再生して聞き取りやすくすることが
できるため、ユーザがより理解しやすい再生音声を得る
ことができる。
【0028】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
【0029】また、本発明の話速変換プログラムは、上
記課題を解決するために、コンピュータに、複数の音声
部分に分割された音声データを入力する機能と、前記入
力される音声データの任意の音声部分の速度を設定する
機能と、前記入力された音声データの任意の音声部分の
速度を前記設定された速度に従って変換する機能とを実
行させることを特徴としている。
記課題を解決するために、コンピュータに、複数の音声
部分に分割された音声データを入力する機能と、前記入
力される音声データの任意の音声部分の速度を設定する
機能と、前記入力された音声データの任意の音声部分の
速度を前記設定された速度に従って変換する機能とを実
行させることを特徴としている。
【0030】このようなプログラムを用いることによ
り、全体的に話速を速める場合に重要なキーワード(音
声部分)を比較的低速に再生して聞き取りやすくするこ
とができるため、ユーザがより理解しやすい再生音声を
得ることができる。
り、全体的に話速を速める場合に重要なキーワード(音
声部分)を比較的低速に再生して聞き取りやすくするこ
とができるため、ユーザがより理解しやすい再生音声を
得ることができる。
【0031】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
【0032】
【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図1、2は本発明に係る話速変換装
置、話速変換方法、音声ガイダンス装置、記憶媒体およ
び話速変換プログラムの一実施形態を示す図である。
基づいて説明する。図1、2は本発明に係る話速変換装
置、話速変換方法、音声ガイダンス装置、記憶媒体およ
び話速変換プログラムの一実施形態を示す図である。
【0033】まず、構成を説明する。図1は話速変換装
置を備えた音声ガイダンス装置であり、この音声ガイダ
ンスは図示しないファクシミリ装置、コピー装置、プリ
ンタ装置、複合機、PC等のメディア装置に搭載されて
いる。
置を備えた音声ガイダンス装置であり、この音声ガイダ
ンスは図示しないファクシミリ装置、コピー装置、プリ
ンタ装置、複合機、PC等のメディア装置に搭載されて
いる。
【0034】音声ガイダンス装置1は、話速変換装置1
01と、メッセージ蓄積手段102と、オペレーション
入力手段103と、メッセージ生成手段と104、音声
合成手段105と、ガイダンス音声出力手段106とを
備えている。
01と、メッセージ蓄積手段102と、オペレーション
入力手段103と、メッセージ生成手段と104、音声
合成手段105と、ガイダンス音声出力手段106とを
備えている。
【0035】話速変換装置101は、音声入力手段20
1と、速度入力手段202と、速度制御手段203と、
音声出力手段204、CPU205およびメモリ206
とを備えている。
1と、速度入力手段202と、速度制御手段203と、
音声出力手段204、CPU205およびメモリ206
とを備えている。
【0036】音声ガイダンス装置1において、オペレー
ション入力手段103は音声入力装置、キーボード入力
装置、ボタン入力装置、タッチパネル入力装置等から構
成されており、このオペレーション入力手段103には
メディア装置の各種操作に対応した操作命令が入力され
るようになっている。
ション入力手段103は音声入力装置、キーボード入力
装置、ボタン入力装置、タッチパネル入力装置等から構
成されており、このオペレーション入力手段103には
メディア装置の各種操作に対応した操作命令が入力され
るようになっている。
【0037】メッセージ蓄積手段102には音声部分に
分割された少なくとも最小単位の音声部分である「語」
「節」が蓄積されており、本実施形態では、例えば、コ
ピー装置のメッセージとして、「用紙をA4にセットし
てください」という文章があるが、「用紙」「を」「A
4」「に」「セット」「してください」というような音
声ガイダンスを出力可能なように複数の音声部分が蓄積
されている。
分割された少なくとも最小単位の音声部分である「語」
「節」が蓄積されており、本実施形態では、例えば、コ
ピー装置のメッセージとして、「用紙をA4にセットし
てください」という文章があるが、「用紙」「を」「A
4」「に」「セット」「してください」というような音
声ガイダンスを出力可能なように複数の音声部分が蓄積
されている。
【0038】メッセージ生成手段104はオペレーショ
ン入力手段103の入力内容に応じてメッセージ蓄積手
段102に蓄積された音声部分から必要な文章を選択し
てこの音声部分を組合わせて一連のメッセージを生成す
るようになっている。
ン入力手段103の入力内容に応じてメッセージ蓄積手
段102に蓄積された音声部分から必要な文章を選択し
てこの音声部分を組合わせて一連のメッセージを生成す
るようになっている。
【0039】例えば、オペレーション入力手段103に
よってA4の用紙に印字を行なうように操作を行なう場
合等に、メッセージ生成手段104はメッセージ蓄積手
段102から「用紙」「を」「A4」「に」「セット」
「してください」という音声部分を読み出してガイダン
スメッセージを作成するようになっている。
よってA4の用紙に印字を行なうように操作を行なう場
合等に、メッセージ生成手段104はメッセージ蓄積手
段102から「用紙」「を」「A4」「に」「セット」
「してください」という音声部分を読み出してガイダン
スメッセージを作成するようになっている。
【0040】なお、メッセージ蓄積手段102には「A
4」の他に「B4」「A3」等の音声部分が蓄積され、
メッセージ生成手段104は「A4」の部分に「B4」
「A3」等の音声部分を入れ替えることができるのは言
うまでもない。
4」の他に「B4」「A3」等の音声部分が蓄積され、
メッセージ生成手段104は「A4」の部分に「B4」
「A3」等の音声部分を入れ替えることができるのは言
うまでもない。
【0041】音声合成手段105はメッセージ生成手段
104によって生成された音声部分を合成し、このガイ
ダンスメッセージに従ってガイダンス音声を生成するよ
うになっている。
104によって生成された音声部分を合成し、このガイ
ダンスメッセージに従ってガイダンス音声を生成するよ
うになっている。
【0042】ガイダンス音声生成の手法としては、メッ
セージ蓄積手段102に蓄積された入力ガイダンス音声
に相当する音声をディジタルデータとして蓄積してお
き、再生する手法、あるいは、メッセージ蓄積手段10
2に蓄積された入力ガイダンス音声に相当する音声を各
種音声符号化方式を用いてディジタルデータとして蓄積
しておき、適用した符号化方式に対応する復号化方式を
用いて再生する手法、あるいはテキスト音声合成技術を
用いてガイダンスメッセージ相当する音声合成を行う手
法等が挙げられる。
セージ蓄積手段102に蓄積された入力ガイダンス音声
に相当する音声をディジタルデータとして蓄積してお
き、再生する手法、あるいは、メッセージ蓄積手段10
2に蓄積された入力ガイダンス音声に相当する音声を各
種音声符号化方式を用いてディジタルデータとして蓄積
しておき、適用した符号化方式に対応する復号化方式を
用いて再生する手法、あるいはテキスト音声合成技術を
用いてガイダンスメッセージ相当する音声合成を行う手
法等が挙げられる。
【0043】話速変換装置101は音声合成手段105
によって生成された音声ガイダンスの話速処理を行なう
ものである。
によって生成された音声ガイダンスの話速処理を行なう
ものである。
【0044】話速変換装置101において、音声入力手
段201には音声合成手段105によって生成された音
声ガイダンスが入力されるようになっている。
段201には音声合成手段105によって生成された音
声ガイダンスが入力されるようになっている。
【0045】この入力音声は、ディジタル音声データで
も良いし、音声入力手段201にAD変換機を設け、ア
ナログ音声を入力しても良いが、音声ガイダンス装置1
に適用する場合は、音声ガイダンス装置1の音声合成手
段105の出力であるディジタル音声データをそのまま
入力した方が効率的であり、その方が望ましい。また、
音声ガイダンス装置1の出力音声は、「語」や「節」に
分けられた音声データ(音声部分)である。
も良いし、音声入力手段201にAD変換機を設け、ア
ナログ音声を入力しても良いが、音声ガイダンス装置1
に適用する場合は、音声ガイダンス装置1の音声合成手
段105の出力であるディジタル音声データをそのまま
入力した方が効率的であり、その方が望ましい。また、
音声ガイダンス装置1の出力音声は、「語」や「節」に
分けられた音声データ(音声部分)である。
【0046】速度入力手段202にはオペレーション入
力手段103によって音声の再生速度に関する情報が入
力されるようになっている。これは、音声全体の速度を
定義するものであり、ここでは、全体の速度として通常
の1.2倍に高速再生するものとする。なお、速度入力
手段202はメモリ機能を有し、オペレーション入力手
段103によって入力されたキーワードと話速変換速度
を関連付けて記憶している。
力手段103によって音声の再生速度に関する情報が入
力されるようになっている。これは、音声全体の速度を
定義するものであり、ここでは、全体の速度として通常
の1.2倍に高速再生するものとする。なお、速度入力
手段202はメモリ機能を有し、オペレーション入力手
段103によって入力されたキーワードと話速変換速度
を関連付けて記憶している。
【0047】速度制御手段203は文章の速度を変換す
るようになっており、入力音声は「語」や「節」の音声
部分に分けられたものである。この音声部分は予め、そ
れぞれについて、文章全体の速度に対する比を与えてお
く。例えば、「用紙をA4にセットしてください」とい
うメッセージの場合には、オペレーション装置103に
よって「用紙」および「A4」をキーワードとするよう
に指定されるようになっているため、速度制御手段20
3は「用紙」および「A4」をキーワードとし、それぞ
れ高速再生の場合は他の音声部分(「を」「に」「セッ
ト」「してください」)と比較して速度を遅く(例えば
文章全体の速度の0.8倍)再生するようになってい
る。
るようになっており、入力音声は「語」や「節」の音声
部分に分けられたものである。この音声部分は予め、そ
れぞれについて、文章全体の速度に対する比を与えてお
く。例えば、「用紙をA4にセットしてください」とい
うメッセージの場合には、オペレーション装置103に
よって「用紙」および「A4」をキーワードとするよう
に指定されるようになっているため、速度制御手段20
3は「用紙」および「A4」をキーワードとし、それぞ
れ高速再生の場合は他の音声部分(「を」「に」「セッ
ト」「してください」)と比較して速度を遅く(例えば
文章全体の速度の0.8倍)再生するようになってい
る。
【0048】これにより、「用紙」および「A4」の二
語については、通常の速度の0.96倍、その他の
「語」および「節」については1.2倍の高速変換を行
うことになる。節ごとの話速変換の手法としては、前述
のPICOLA方式等、様々な既存の話速変換手法を用
いることができる。
語については、通常の速度の0.96倍、その他の
「語」および「節」については1.2倍の高速変換を行
うことになる。節ごとの話速変換の手法としては、前述
のPICOLA方式等、様々な既存の話速変換手法を用
いることができる。
【0049】また、音声出力手段204はDA変換器、
増幅器、スピーカによって構成されており、音声制御手
段203によって「語」や「節」ごとに話速を変換され
た音声データを出力するようになっている。
増幅器、スピーカによって構成されており、音声制御手
段203によって「語」や「節」ごとに話速を変換され
た音声データを出力するようになっている。
【0050】音声出力手段204による出力音声はディ
ジタル音声データをそのまま出力しても良いし、音声出
力手段204にDA変換機を設け、アナログ音声に変換
して出力しても良いが、音声ガイダンス装置1に適用す
る場合は、音声ガイダンス装置1のガイダンス音声出力
手段105にディジタル音声データとして入力するため
にディジタル音声データとしてそのまま出力した方が効
率的であり、その方が望ましい。また、音声出力の際
に、「語」や「節」のつながりが滑らかになるように、
つながりの部分に窓関数を適用したり、フィルタリング
を行っても良い。
ジタル音声データをそのまま出力しても良いし、音声出
力手段204にDA変換機を設け、アナログ音声に変換
して出力しても良いが、音声ガイダンス装置1に適用す
る場合は、音声ガイダンス装置1のガイダンス音声出力
手段105にディジタル音声データとして入力するため
にディジタル音声データとしてそのまま出力した方が効
率的であり、その方が望ましい。また、音声出力の際
に、「語」や「節」のつながりが滑らかになるように、
つながりの部分に窓関数を適用したり、フィルタリング
を行っても良い。
【0051】なお、本実施形態では、オペレーション入
力手段103および速度入力手段202が速度設定手段
を構成している。但し、話速変換装置101単体の場合
には、オペレーション入力手段103を話速変換装置1
01に直接設けることにより、オペレータによって速度
を設定するようにする。
力手段103および速度入力手段202が速度設定手段
を構成している。但し、話速変換装置101単体の場合
には、オペレーション入力手段103を話速変換装置1
01に直接設けることにより、オペレータによって速度
を設定するようにする。
【0052】一方、CPU205はメモリ206に記憶
された話速変換プログラムに基づいて速度入力手段20
2および速度制御手段203を制御するようになってお
り、この話速制御プログラムは、複数の音声部分に分割
された音声データを入力する機能と、前記入力される音
声データの任意の音声部分の速度を設定する機能と、前
記入力された音声データの任意の音声部分の速度を前記
設定された速度に従って変換する機能とをコンピュータ
に実行させるものである。
された話速変換プログラムに基づいて速度入力手段20
2および速度制御手段203を制御するようになってお
り、この話速制御プログラムは、複数の音声部分に分割
された音声データを入力する機能と、前記入力される音
声データの任意の音声部分の速度を設定する機能と、前
記入力された音声データの任意の音声部分の速度を前記
設定された速度に従って変換する機能とをコンピュータ
に実行させるものである。
【0053】次に、図2に示すフローチャートに基づい
て話速変換方法を説明する。なお、図2はCPU205
に実行される話速変換プログラムであり、この話速変換
プログラムは記憶媒体に記憶されてメモリ206にイン
ストールされたものである。この話速変換プログラムを
記憶する媒体としては、CD−ROM、DVD−RO
M、フロッピィーディスク、リムーバルディスク等を用
いて良く、話速変換プログラムは記憶媒体に記憶するの
ではなく、話速変換装置101を所定のサーバとネット
ワークで接続できるようにしておき、サーバからメモリ
206にインストールしても良い。
て話速変換方法を説明する。なお、図2はCPU205
に実行される話速変換プログラムであり、この話速変換
プログラムは記憶媒体に記憶されてメモリ206にイン
ストールされたものである。この話速変換プログラムを
記憶する媒体としては、CD−ROM、DVD−RO
M、フロッピィーディスク、リムーバルディスク等を用
いて良く、話速変換プログラムは記憶媒体に記憶するの
ではなく、話速変換装置101を所定のサーバとネット
ワークで接続できるようにしておき、サーバからメモリ
206にインストールしても良い。
【0054】まず、オペレーション入力手段103から
音声部分である所定のキーワードの話速を変更する指定
がなされたか否かを判別し(ステップS1)、変更をす
る指定がなされた場合に、速度入力手段202にこのキ
ーワードと変換速度の対応を記憶する(ステップS
2)。例えば、「用紙」および「A4」の二語について
指定すると、通常の速度の0.96倍の速度で話速を変
換するように記憶する。
音声部分である所定のキーワードの話速を変更する指定
がなされたか否かを判別し(ステップS1)、変更をす
る指定がなされた場合に、速度入力手段202にこのキ
ーワードと変換速度の対応を記憶する(ステップS
2)。例えば、「用紙」および「A4」の二語について
指定すると、通常の速度の0.96倍の速度で話速を変
換するように記憶する。
【0055】次に、オペレーション入力手段103から
コピー装置の操作が行なわれたか否かを判別し(ステッ
プS3)、行なわれた場合には、オペレーション入力手
段103の操作状況に応じたガイダンスの音声メッセー
ジを作成する(ステップS4)。
コピー装置の操作が行なわれたか否かを判別し(ステッ
プS3)、行なわれた場合には、オペレーション入力手
段103の操作状況に応じたガイダンスの音声メッセー
ジを作成する(ステップS4)。
【0056】この作成にあっては、メッセージ生成手段
104によってメッセージ蓄積手段102に蓄積された
音声部分から必要な文章を選択してこの音声部分を組合
わて一連のメッセージを生成した後、音声合成手段10
5によりメッセージ生成手段104によって生成された
音声部分を合成し、このガイダンスメッセージに従って
ガイダンス音声を生成する。
104によってメッセージ蓄積手段102に蓄積された
音声部分から必要な文章を選択してこの音声部分を組合
わて一連のメッセージを生成した後、音声合成手段10
5によりメッセージ生成手段104によって生成された
音声部分を合成し、このガイダンスメッセージに従って
ガイダンス音声を生成する。
【0057】次いで、音声入力手段201には音声合成
手段105によって生成された音声ガイダンスが入力さ
れるとともに、速度入力手段202にメッセージ生成手
段104によって生成された音声部分に分割されたキー
ワードが入力される。
手段105によって生成された音声ガイダンスが入力さ
れるとともに、速度入力手段202にメッセージ生成手
段104によって生成された音声部分に分割されたキー
ワードが入力される。
【0058】速度入力手段202ではオペレーション入
力手段103によって予め指定されたキーワードである
か判別し(ステップS5)、指定されたキーワードであ
れば、再生速度を遅くなるようにして設定し(ステップ
S6)、指定されたキーワードでなければ再生速度が速
くなるように指定する(ステップS7)。
力手段103によって予め指定されたキーワードである
か判別し(ステップS5)、指定されたキーワードであ
れば、再生速度を遅くなるようにして設定し(ステップ
S6)、指定されたキーワードでなければ再生速度が速
くなるように指定する(ステップS7)。
【0059】次いで、速度制御手段203によって音声
データの再生速度を制御する(ステップS8)。速度制
御手段203は、例えば、「用紙をA4にセットしてく
ださい」というメッセージの場合には、「用紙」および
「A4」を通常の速度の0.96倍の速度で再生し、
「を」「に」「セット」「してください」を音声データ
の再生速度を通常の1.2倍の速度で変換し、文章全体
の速度の0.8倍で再生するようになっている。
データの再生速度を制御する(ステップS8)。速度制
御手段203は、例えば、「用紙をA4にセットしてく
ださい」というメッセージの場合には、「用紙」および
「A4」を通常の速度の0.96倍の速度で再生し、
「を」「に」「セット」「してください」を音声データ
の再生速度を通常の1.2倍の速度で変換し、文章全体
の速度の0.8倍で再生するようになっている。
【0060】次いで、音声出力手段204によって音声
ガイダンスの出力が終了したか否かを判別し(ステップ
S9)、出力が終了した場合には今回の処理を終了す
る。
ガイダンスの出力が終了したか否かを判別し(ステップ
S9)、出力が終了した場合には今回の処理を終了す
る。
【0061】このように本実施形態では、音声ガイダン
ス装置1が、複数の音声部分に分割された音声データが
入力される音声入力手段201と、音声入力手段201
に入力される音声データの任意の音声部分の速度を設定
するオペレーション入力手段103および速度入力手段
202と、音声入力手段201に入力された音声データ
の任意の音声部分の速度を速度入力手段202で設定さ
れた速度に従って変換する速度制御手段203とを備え
ているので、全体的に話速を速める場合に重要なキーワ
ード(音声部分)を比較的低速に再生して聞き取りやす
くすることができるため、ユーザがより理解しやすい再
生音声を得ることができる。
ス装置1が、複数の音声部分に分割された音声データが
入力される音声入力手段201と、音声入力手段201
に入力される音声データの任意の音声部分の速度を設定
するオペレーション入力手段103および速度入力手段
202と、音声入力手段201に入力された音声データ
の任意の音声部分の速度を速度入力手段202で設定さ
れた速度に従って変換する速度制御手段203とを備え
ているので、全体的に話速を速める場合に重要なキーワ
ード(音声部分)を比較的低速に再生して聞き取りやす
くすることができるため、ユーザがより理解しやすい再
生音声を得ることができる。
【0062】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
【0063】また、本実施形態では、音声ガイダンス1
をメディア装置に搭載し、メッセージ蓄積手段201に
メディア装置の操作状況に応じた音声部分を蓄積したた
め、ファクシミリ装置、コピー装置、プリンタ装置、複
合機、PC等のメディア装置に操作に関連する音声ガイ
ダンスの速度を簡単に調整することができ、理解しやす
い再生音声を得ることができる。
をメディア装置に搭載し、メッセージ蓄積手段201に
メディア装置の操作状況に応じた音声部分を蓄積したた
め、ファクシミリ装置、コピー装置、プリンタ装置、複
合機、PC等のメディア装置に操作に関連する音声ガイ
ダンスの速度を簡単に調整することができ、理解しやす
い再生音声を得ることができる。
【0064】
【発明の効果】本発明の話速変換装置によれば、複数の
音声部分に分割された音声データが入力される音声入力
手段と、音声入力手段に入力される音声データの任意の
音声部分の速度を設定する速度設定手段と、音声入力手
段に入力された音声データの任意の音声部分の速度を速
度設定手段で設定された速度に従って変換する速度制御
手段とを設けたため、全体的に話速を速める場合に重要
なキーワード(音声部分)を比較的低速に再生して聞き
取りやすくすることができるため、ユーザがより理解し
やすい再生音声を得ることができる。
音声部分に分割された音声データが入力される音声入力
手段と、音声入力手段に入力される音声データの任意の
音声部分の速度を設定する速度設定手段と、音声入力手
段に入力された音声データの任意の音声部分の速度を速
度設定手段で設定された速度に従って変換する速度制御
手段とを設けたため、全体的に話速を速める場合に重要
なキーワード(音声部分)を比較的低速に再生して聞き
取りやすくすることができるため、ユーザがより理解し
やすい再生音声を得ることができる。
【0065】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
【0066】また、本発明の話速変換方法によれば、入
力された音声データの再生速度を変換して出力する話速
変換方法であって、複数の音声部分に分割された音声デ
ータが入力される音声入力工程と、音声入力工程で入力
される音声データの任意の音声部分の速度を設定する速
度設定工程と、音声入力工程で入力された音声データの
任意の音声部分の速度を速度設定工程で設定された速度
に従って変換する速度制御工程手段とを含んでなるた
め、全体的に話速を速める場合に重要なキーワード(音
声部分)を比較的低速に再生して聞き取りやすくするこ
とができるため、ユーザがより理解しやすい再生音声を
得ることができる。
力された音声データの再生速度を変換して出力する話速
変換方法であって、複数の音声部分に分割された音声デ
ータが入力される音声入力工程と、音声入力工程で入力
される音声データの任意の音声部分の速度を設定する速
度設定工程と、音声入力工程で入力された音声データの
任意の音声部分の速度を速度設定工程で設定された速度
に従って変換する速度制御工程手段とを含んでなるた
め、全体的に話速を速める場合に重要なキーワード(音
声部分)を比較的低速に再生して聞き取りやすくするこ
とができるため、ユーザがより理解しやすい再生音声を
得ることができる。
【0067】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
【0068】また、本発明の音声ガイダンス装置によれ
ば、各種操作を行なう操作手段と、少なくとも最小単位
の音声部分が蓄積されたメッセージ蓄積手段と、操作手
段の操作状況に応じてメッセージ蓄積手段に蓄積された
音声部分を組合わせて一連のメッセージを生成するメッ
セージ生成手段と、メッセージ生成手段によって生成さ
れたメッセージを合成して音声データを生成する音声合
成手段と、音声合成手段によって合成された音声データ
が入力される音声入力手段と、メッセージ生成手段によ
って生成されたメッセージに対し、音声部分毎に速度を
設定する速度設定手段と、音声入力手段に入力された音
声データの任意の音声部分の速度を速度設定手段で設定
された速度に従って変換する速度制御手段とを設けたた
め、このような構成により、全体的に話速を速める場合
に重要なキーワード(音声部分)を比較的低速に再生し
て聞き取りやすくすることができるため、ユーザがより
理解しやすい再生音声を得ることができる。
ば、各種操作を行なう操作手段と、少なくとも最小単位
の音声部分が蓄積されたメッセージ蓄積手段と、操作手
段の操作状況に応じてメッセージ蓄積手段に蓄積された
音声部分を組合わせて一連のメッセージを生成するメッ
セージ生成手段と、メッセージ生成手段によって生成さ
れたメッセージを合成して音声データを生成する音声合
成手段と、音声合成手段によって合成された音声データ
が入力される音声入力手段と、メッセージ生成手段によ
って生成されたメッセージに対し、音声部分毎に速度を
設定する速度設定手段と、音声入力手段に入力された音
声データの任意の音声部分の速度を速度設定手段で設定
された速度に従って変換する速度制御手段とを設けたた
め、このような構成により、全体的に話速を速める場合
に重要なキーワード(音声部分)を比較的低速に再生し
て聞き取りやすくすることができるため、ユーザがより
理解しやすい再生音声を得ることができる。
【0069】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
【0070】また、本発明のメディア装置によれば、ガ
イダンス装置を備えたメディア装置であって、メッセー
ジ蓄積手段にメディア装置の操作状況に応じた音声部分
が蓄積されるので、ファクシミリ装置、コピー装置、プ
リンタ装置、複合機、PC等のメディア装置に操作に関
連する音声ガイダンスの速度を簡単に調整することがで
き、理解しやすい再生音声を得ることができる。
イダンス装置を備えたメディア装置であって、メッセー
ジ蓄積手段にメディア装置の操作状況に応じた音声部分
が蓄積されるので、ファクシミリ装置、コピー装置、プ
リンタ装置、複合機、PC等のメディア装置に操作に関
連する音声ガイダンスの速度を簡単に調整することがで
き、理解しやすい再生音声を得ることができる。
【0071】また、本発明の記憶媒体によれば、コンピ
ュータに、複数の音声部分に分割された音声データを入
力する機能と、前記入力される音声データの任意の音声
部分の速度を設定する機能と、前記入力された音声デー
タの任意の音声部分の速度を前記設定された速度に従っ
て変換する機能とを実行させるための話速変換プログラ
ムが記憶媒体に記憶されたので、全体的に話速を速める
場合に重要なキーワード(音声部分)を比較的低速に再
生して聞き取りやすくすることができるため、ユーザが
より理解しやすい再生音声を得ることができる。
ュータに、複数の音声部分に分割された音声データを入
力する機能と、前記入力される音声データの任意の音声
部分の速度を設定する機能と、前記入力された音声デー
タの任意の音声部分の速度を前記設定された速度に従っ
て変換する機能とを実行させるための話速変換プログラ
ムが記憶媒体に記憶されたので、全体的に話速を速める
場合に重要なキーワード(音声部分)を比較的低速に再
生して聞き取りやすくすることができるため、ユーザが
より理解しやすい再生音声を得ることができる。
【0072】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
【0073】また、本発明の話速変換プログラムによれ
ば、コンピュータに、複数の音声部分に分割された音声
データを入力する機能と、前記入力される音声データの
任意の音声部分の速度を設定する機能と、前記入力され
た音声データの任意の音声部分の速度を前記設定された
速度に従って変換する機能とを実行させるので、このよ
うなプログラムを用いることにより、全体的に話速を速
める場合に重要なキーワード(音声部分)を比較的低速
に再生して聞き取りやすくすることができるため、ユー
ザがより理解しやすい再生音声を得ることができる。
ば、コンピュータに、複数の音声部分に分割された音声
データを入力する機能と、前記入力される音声データの
任意の音声部分の速度を設定する機能と、前記入力され
た音声データの任意の音声部分の速度を前記設定された
速度に従って変換する機能とを実行させるので、このよ
うなプログラムを用いることにより、全体的に話速を速
める場合に重要なキーワード(音声部分)を比較的低速
に再生して聞き取りやすくすることができるため、ユー
ザがより理解しやすい再生音声を得ることができる。
【0074】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。
【図1】本発明に係る話速変換装置、話速変換方法、音
声ガイダンス装置、メディア装置、記憶媒体および話速
変換プログラムの一実施形態を示す図であり、その話速
変換装置を備えた音声ガイダンス装置のブロック図であ
る。
声ガイダンス装置、メディア装置、記憶媒体および話速
変換プログラムの一実施形態を示す図であり、その話速
変換装置を備えた音声ガイダンス装置のブロック図であ
る。
【図2】一実施形態の話速変換手順を示すフローチャー
トである。
トである。
1 音声ガイダンス装置
101 話速変換装置
102 メッセージ蓄積手段
103 オペレーション入力手段(速度設定手段)
104 メッセージ生成手段
105 音声合成手段
106 ガイダンス音声出力手段
201 音声入力手段
202 速度入力手段(速度設定手段)
203 速度制御手段
204 音声出力手段
Claims (6)
- 【請求項1】入力された音声データの再生速度を変換し
て出力する話速変換装置であって、 複数の音声部分に分割された音声データが入力される音
声入力手段と、前記音声入力手段に入力される前記音声
データの任意の音声部分の速度を設定する速度設定手段
と、前記音声入力手段に入力された音声データの任意の
音声部分の速度を前記速度設定手段で設定された速度に
従って変換する速度制御手段とを備えることを特徴とす
る話速変換装置。 - 【請求項2】入力された音声データの再生速度を変換し
て出力する話速変換方法であって、 複数の音声部分に分割された音声データが入力される音
声入力工程と、前記音声入力工程で入力される前記音声
データの任意の音声部分の速度を設定する速度設定工程
と、前記音声入力工程で入力された音声データの任意の
音声部分の速度を前記速度設定工程で設定された速度に
従って変換する速度制御工程手段とを含んでなることを
特徴とする話速変換方法。 - 【請求項3】各種操作を行なう操作手段と、 少なくとも最小単位の音声部分が蓄積されたメッセージ
蓄積手段と、 前記操作手段の操作状況に応じて前記メッセージ蓄積手
段に蓄積された音声部分を組合わせて一連のメッセージ
を生成するメッセージ生成手段と、 前記メッセージ生成手段によって生成されたメッセージ
を合成して音声データを生成する音声合成手段と、 前記音声合成手段によって合成された音声データが入力
される音声入力手段と、 前記メッセージ生成手段によって生成されたメッセージ
に対し、音声部分毎に速度を設定する速度設定手段と、 前記音声入力手段に入力された音声データの任意の音声
部分の速度を前記速度設定手段で設定された速度に従っ
て変換する速度制御手段とを備えることを特徴とする音
声ガイダンス装置。 - 【請求項4】請求項3記載のガイダンス装置を備えたメ
ディア装置であって、 前記メッセージ蓄積手段に前記メディア装置の操作状況
に応じた音声部分が蓄積されることを特徴とするメディ
ア装置。 - 【請求項5】コンピュータに、複数の音声部分に分割さ
れた音声データを入力する機能と、前記入力される音声
データの任意の音声部分の速度を設定する機能と、前記
入力された音声データの任意の音声部分の速度を前記設
定された速度に従って変換する機能とを実行させるため
の話速変換プログラムが記憶されたコンピュータ読み取
り可能な記憶媒体。 - 【請求項6】コンピュータに、複数の音声部分に分割さ
れた音声データを入力する機能と、前記入力される音声
データの任意の音声部分の速度を設定する機能と、前記
入力された音声データの任意の音声部分の速度を前記設
定された速度に従って変換する機能とを実行させるため
の話速変換プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002065600A JP2003263200A (ja) | 2002-03-11 | 2002-03-11 | 話速変換装置、話速変換方法、音声ガイダンス装置、メディア装置、記憶媒体および話速変換プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002065600A JP2003263200A (ja) | 2002-03-11 | 2002-03-11 | 話速変換装置、話速変換方法、音声ガイダンス装置、メディア装置、記憶媒体および話速変換プログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2003263200A true JP2003263200A (ja) | 2003-09-19 |
Family
ID=29197828
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002065600A Pending JP2003263200A (ja) | 2002-03-11 | 2002-03-11 | 話速変換装置、話速変換方法、音声ガイダンス装置、メディア装置、記憶媒体および話速変換プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2003263200A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8538758B2 (en) | 2011-01-31 | 2013-09-17 | Kabushiki Kaisha Toshiba | Electronic apparatus |
| US11094313B2 (en) | 2019-03-19 | 2021-08-17 | Samsung Electronics Co., Ltd. | Electronic device and method of controlling speech recognition by electronic device |
-
2002
- 2002-03-11 JP JP2002065600A patent/JP2003263200A/ja active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8538758B2 (en) | 2011-01-31 | 2013-09-17 | Kabushiki Kaisha Toshiba | Electronic apparatus |
| US9047858B2 (en) | 2011-01-31 | 2015-06-02 | Kabushiki Kaisha Toshiba | Electronic apparatus |
| US11094313B2 (en) | 2019-03-19 | 2021-08-17 | Samsung Electronics Co., Ltd. | Electronic device and method of controlling speech recognition by electronic device |
| US11854527B2 (en) | 2019-03-19 | 2023-12-26 | Samsung Electronics Co., Ltd. | Electronic device and method of controlling speech recognition by electronic device |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20090012793A1 (en) | Text-to-speech assist for portable communication devices | |
| JPH08212228A (ja) | 要約文作成装置および要約音声作成装置 | |
| JP2009265279A (ja) | 音声合成装置、音声合成方法、音声合成プログラム、携帯情報端末、および音声合成システム | |
| CN110599998B (zh) | 一种语音数据生成方法及装置 | |
| JP2002140085A (ja) | 文書読み上げ装置及び方法、コンピュータプログラム並びに記憶媒体 | |
| JP3279684B2 (ja) | 音声インタフェース・ビルダ・システム | |
| JP2005070430A (ja) | 音声出力装置および方法 | |
| JP4783608B2 (ja) | 対話方法、対話装置、対話プログラムおよび記録媒体 | |
| JP2003263200A (ja) | 話速変換装置、話速変換方法、音声ガイダンス装置、メディア装置、記憶媒体および話速変換プログラム | |
| JPH06337876A (ja) | 文章読み上げ装置 | |
| JP2009157220A (ja) | 音声編集合成システム、音声編集合成プログラム及び音声編集合成方法 | |
| JPH10274999A (ja) | 文書読み上げ装置 | |
| JPH07200554A (ja) | 文章読み上げ装置 | |
| JP3838193B2 (ja) | 文章読み上げ装置、同装置のためのプログラム及び記録媒体 | |
| JP4520375B2 (ja) | 音声操作支援装置、電子機器、画像形成装置およびプログラム | |
| JP3884970B2 (ja) | 情報処理装置および情報処理方法 | |
| JP2004294577A (ja) | 文字情報音声変換方法 | |
| JP2000293187A (ja) | データ音声合成装置及びデータ音声合成方法 | |
| JP3862300B2 (ja) | 音声合成に用いる情報の処理方法および装置 | |
| JP2000206964A (ja) | 楽音発生装置 | |
| JPH05173587A (ja) | 音声合成装置 | |
| JP2001222290A (ja) | 音声合成装置及びその制御方法並びに記憶媒体 | |
| KR20030058708A (ko) | 텍스트/음성 변환을 이용한 음성 녹음 시스템 | |
| JP2007256815A (ja) | 音声再生装置、音声再生方法、音声再生プログラム | |
| JPH0561498A (ja) | 音声出力装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041117 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061018 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061031 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070306 |