JP2003263200A

JP2003263200A - 話速変換装置、話速変換方法、音声ガイダンス装置、メディア装置、記憶媒体および話速変換プログラム

Info

Publication number: JP2003263200A
Application number: JP2002065600A
Authority: JP
Inventors: Atsushi Yamane; 淳山根
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2002-03-11
Filing date: 2002-03-11
Publication date: 2003-09-19

Abstract

(57)【要約】【課題】本発明は、再生速度全体を高速化しつつ、キ
ーワードを聞き取りやすくするような再生を行なうこと
ができる話速変換装置、話速変換方法、音声ガイダンス
装置、メディア装置、記憶媒体および話速変換プログラ
ムを提供する。【解決手段】メディア装置に搭載された音声ガイダン
ス装置１が、複数の音声部分に分割された音声データが
入力される音声入力手段２０１と、音声入力手段２０１
に入力される音声データの任意の音声部分の速度を設定
するオペレーション入力手段１０３および速度入力手段
２０２と、音声入力手段２０１に入力された音声データ
の任意の音声部分の速度を速度入力手段２０２で設定さ
れた速度に従って変換する速度制御手段２０３とを有し
ている。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声ガイダンスを
構成する任意の音声部分の速度を変更することができる
話速変換装置、話速変換方法、音声ガイダンス装置、メ
ディア装置、記憶媒体および話速変換プログラム音声認
識装置、音声認識方法および音声認識プログラムが記憶
された記憶媒体に関する。

【０００２】

【従来の技術】従来より、音の出る信号機や、曲がる方
向を音で知らせるトラック等にあっては、視覚障害者等
のために音声メッセージを用いた機械が存在するが、近
時では、ＰＣ（パーソナルコンピュータ）、コピー装
置、ファクシミリ装置等のＯＡ機器についても音声によ
るガイダンスメッセージを出すことによって操作性を高
めるものが注目されてきている。

【０００３】音声メッセージは、常に通常の速度で再生
するのではなく、速度を変換して再生することにより、
確実に聞き取りを行なったり、作業を効率化することが
できる。

【０００４】例えば、音声データをゆっくり再生するこ
とにより、ガイダンス音声を確実に聞き取ることができ
るようになり、また、高速に再生することにより、早く
次の作業に移ることができるようになる。

【０００５】このような音声再生速度を変化させるため
に、例えば速度を速める場合は、磁気テープに録音され
た音声を早回しで再生したり、ＤＡ変換時にサンプリン
グを速めたりして再生速度を速くすることが考えられ
る。

【０００６】ところが、この手法では、再生速度を速め
れば速めるほど、音声のピッチ（高さ）が高くなってし
まうなど、元の音声の持っている特徴が失われてしま
う。

【０００７】このため、音声のピッチを変えないように
速度だけ変換する話速変換手法がこれまでに開発されて
おり、「森田、板倉：ポインター移動量制御による重複
加算法（ＰＩＣＯＬＡ）を用いた音声の時間軸での伸長
圧縮とその評価−日本音響学会講演論文集１−４−１４
（昭和63年3月）」記載の、時間領域調波構造伸縮（Tim
e-Domain Harmonic Scaling:TDHS）アルゴリズムを用い
たＰＩＣＯＬＡ方式がそのような話速変換手法の一つと
してあげられる。

【０００８】また、特開平５−２５７４９０号公報に記
載される話速変換手法があり、この技術では、ニュース
番組のように発話時間が比較的限られている場合に、ゆ
っくりした音声で聞き取りやすく再生したい場合に、話
速を文章で一様に変換するのではなく、無音区間を検出
し、無音区間は詰め、有音区間のみをゆっくりと再生す
ることにより、全体の発話時間を大きく増加させないよ
うな手法である。

【０００９】さらに、特許番号２６１２８６８号に記載
される話速変換手法があり、この技術は、有音区間を有
声音部分と無声音区間等に分類し、それぞれ異なる比率
で変換することにより、聴感上自然な話速変換音声を得
ようとする手法である。

【００１０】しかし、以上の手法を含め、従来の話速変
換手法は、有音区間あるいは有声音区間については、発
話されている言葉の意味内容等には依らず、一様に速度
を変換しようとするものであった。

【００１１】一方、機械操作のためのガイダンス音声に
ついては、ガイダンス音声自体は文章の形で与えられる
ものが多いが、その文章の中では、重要なキーワードの
みがはっきりと聞き取ることができれば十分なものが多
い。

【００１２】ファクシミリ装置の音声ガイダンスについ
て考察した場合、「電話の方はそのままお待ちくださ
い」を例に取ると、「電話」「お待ちください」が重要
なキーワードであり、これらの言葉がはっきり聞こえれ
ば、操作上大きな問題は起きない。

【００１３】

【発明が解決しようとする課題】しかしながら、このよ
うな話速変換方法にあっては、文章全体の速度が調整さ
れるため、上述した特定のキーワードのみをゆっくり再
生することができず、全体的にゆっくりした再生音声し
か得られずに作業が非効率的になったり、作業を急ぐ場
合に高速に再生したときにキーワードが聞き取りづらく
なって作業が非効率的になったりする可能性がある。

【００１４】そこで本発明は、文章の任意の個所の再生
速度を任意の速度に変換することにより、再生速度全体
を高速化しつつ、キーワードを聞き取りやすくするよう
な再生を行なうことができる話速変換装置、話速変換方
法、音声ガイダンス装置、メディア装置、記憶媒体およ
び話速変換プログラムを提供することを目的としてい
る。

【００１５】

【課題を解決するための手段】本発明の話速変換装置
は、上記課題を解決するために、入力された音声データ
の再生速度を変換して出力する話速変換装置であって、
複数の音声部分に分割された音声データが入力される音
声入力手段と、前記音声入力手段に入力される前記音声
データの任意の音声部分の速度を設定する速度設定手段
と、前記音声入力手段に入力された音声データの任意の
音声部分の速度を前記速度設定手段で設定された速度に
従って変換する速度制御手段とを備えることを特徴とし
ている。

【００１６】このような構成により、全体的に話速を速
める場合に重要なキーワード（音声部分）を比較的低速
に再生して聞き取りやすくすることができるため、ユー
ザがより理解しやすい再生音声を得ることができる。

【００１７】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。

【００１８】また、本発明の話速変換方法は、上記課題
を解決するために、入力された音声データの再生速度を
変換して出力する話速変換方法であって、複数の音声部
分に分割された音声データが入力される音声入力工程
と、前記音声入力工程で入力される前記音声データの任
意の音声部分の速度を設定する速度設定工程と、前記音
声入力工程で入力された音声データの任意の音声部分の
速度を前記速度設定工程で設定された速度に従って変換
する速度制御工程手段とを含んでなることを特徴として
いる。

【００１９】このような方法により、全体的に話速を速
める場合に重要なキーワード（音声部分）を比較的低速
に再生して聞き取りやすくすることができるため、ユー
ザがより理解しやすい再生音声を得ることができる。

【００２０】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。

【００２１】また、本発明の音声ガイダンス装置は、上
記課題を解決するために、各種操作を行なう操作手段
と、少なくとも最小単位の音声部分が蓄積されたメッセ
ージ蓄積手段と、前記操作手段の操作状況に応じて前記
メッセージ蓄積手段に蓄積された音声部分を組合わせて
一連のメッセージを生成するメッセージ生成手段と、前
記メッセージ生成手段によって生成されたメッセージを
合成して音声データを生成する音声合成手段と、前記音
声合成手段によって合成された音声データが入力される
音声入力手段と、前記メッセージ生成手段によって生成
されたメッセージに対し、音声部分毎に速度を設定する
速度設定手段と、前記音声入力手段に入力された音声デ
ータの任意の音声部分の速度を前記速度設定手段で設定
された速度に従って変換する速度制御手段とを備えるこ
とを特徴としている。

【００２２】このような構成により、全体的に話速を速
める場合に重要なキーワード（音声部分）を比較的低速
に再生して聞き取りやすくすることができるため、ユー
ザがより理解しやすい再生音声を得ることができる。

【００２３】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。

【００２４】また、本発明のメディア装置は、上記課題
を解決するために、ガイダンス装置を備えたメディアで
あって、前記メッセージ蓄積手段に前記メディア装置の
操作状況に応じた音声部分が蓄積されることを特徴とし
ている。

【００２５】このような構成により、ファクシミリ装
置、コピー装置、プリンタ装置、複合機等のメディア装
置に操作に関連する音声ガイダンスの速度を簡単に調整
することができ、理解しやすい再生音声を得ることがで
きる。

【００２６】また、本発明の記憶媒体は、上記課題を解
決するために、コンピュータに、複数の音声部分に分割
された音声データを入力する機能と、前記入力される音
声データの任意の音声部分の速度を設定する機能と、前
記入力された音声データの任意の音声部分の速度を前記
設定された速度に従って変換する機能とを実行させるた
めの話速変換プログラムが記憶されたことを特徴として
いる。

【００２７】このような記憶媒体を用いることにより、
全体的に話速を速める場合に重要なキーワード（音声部
分）を比較的低速に再生して聞き取りやすくすることが
できるため、ユーザがより理解しやすい再生音声を得る
ことができる。

【００２８】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。

【００２９】また、本発明の話速変換プログラムは、上
記課題を解決するために、コンピュータに、複数の音声
部分に分割された音声データを入力する機能と、前記入
力される音声データの任意の音声部分の速度を設定する
機能と、前記入力された音声データの任意の音声部分の
速度を前記設定された速度に従って変換する機能とを実
行させることを特徴としている。

【００３０】このようなプログラムを用いることによ
り、全体的に話速を速める場合に重要なキーワード（音
声部分）を比較的低速に再生して聞き取りやすくするこ
とができるため、ユーザがより理解しやすい再生音声を
得ることができる。

【００３１】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。

【００３２】

【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図１、２は本発明に係る話速変換装
置、話速変換方法、音声ガイダンス装置、記憶媒体およ
び話速変換プログラムの一実施形態を示す図である。

【００３３】まず、構成を説明する。図１は話速変換装
置を備えた音声ガイダンス装置であり、この音声ガイダ
ンスは図示しないファクシミリ装置、コピー装置、プリ
ンタ装置、複合機、ＰＣ等のメディア装置に搭載されて
いる。

【００３４】音声ガイダンス装置１は、話速変換装置１
０１と、メッセージ蓄積手段１０２と、オペレーション
入力手段１０３と、メッセージ生成手段と１０４、音声
合成手段１０５と、ガイダンス音声出力手段１０６とを
備えている。

【００３５】話速変換装置１０１は、音声入力手段２０
１と、速度入力手段２０２と、速度制御手段２０３と、
音声出力手段２０４、ＣＰＵ２０５およびメモリ２０６
とを備えている。

【００３６】音声ガイダンス装置１において、オペレー
ション入力手段１０３は音声入力装置、キーボード入力
装置、ボタン入力装置、タッチパネル入力装置等から構
成されており、このオペレーション入力手段１０３には
メディア装置の各種操作に対応した操作命令が入力され
るようになっている。

【００３７】メッセージ蓄積手段１０２には音声部分に
分割された少なくとも最小単位の音声部分である「語」
「節」が蓄積されており、本実施形態では、例えば、コ
ピー装置のメッセージとして、「用紙をＡ４にセットし
てください」という文章があるが、「用紙」「を」「Ａ
４」「に」「セット」「してください」というような音
声ガイダンスを出力可能なように複数の音声部分が蓄積
されている。

【００３８】メッセージ生成手段１０４はオペレーショ
ン入力手段１０３の入力内容に応じてメッセージ蓄積手
段１０２に蓄積された音声部分から必要な文章を選択し
てこの音声部分を組合わせて一連のメッセージを生成す
るようになっている。

【００３９】例えば、オペレーション入力手段１０３に
よってＡ４の用紙に印字を行なうように操作を行なう場
合等に、メッセージ生成手段１０４はメッセージ蓄積手
段１０２から「用紙」「を」「Ａ４」「に」「セット」
「してください」という音声部分を読み出してガイダン
スメッセージを作成するようになっている。

【００４０】なお、メッセージ蓄積手段１０２には「Ａ
４」の他に「Ｂ４」「Ａ３」等の音声部分が蓄積され、
メッセージ生成手段１０４は「Ａ４」の部分に「Ｂ４」
「Ａ３」等の音声部分を入れ替えることができるのは言
うまでもない。

【００４１】音声合成手段１０５はメッセージ生成手段
１０４によって生成された音声部分を合成し、このガイ
ダンスメッセージに従ってガイダンス音声を生成するよ
うになっている。

【００４２】ガイダンス音声生成の手法としては、メッ
セージ蓄積手段１０２に蓄積された入力ガイダンス音声
に相当する音声をディジタルデータとして蓄積してお
き、再生する手法、あるいは、メッセージ蓄積手段１０
２に蓄積された入力ガイダンス音声に相当する音声を各
種音声符号化方式を用いてディジタルデータとして蓄積
しておき、適用した符号化方式に対応する復号化方式を
用いて再生する手法、あるいはテキスト音声合成技術を
用いてガイダンスメッセージ相当する音声合成を行う手
法等が挙げられる。

【００４３】話速変換装置１０１は音声合成手段１０５
によって生成された音声ガイダンスの話速処理を行なう
ものである。

【００４４】話速変換装置１０１において、音声入力手
段２０１には音声合成手段１０５によって生成された音
声ガイダンスが入力されるようになっている。

【００４５】この入力音声は、ディジタル音声データで
も良いし、音声入力手段２０１にＡＤ変換機を設け、ア
ナログ音声を入力しても良いが、音声ガイダンス装置１
に適用する場合は、音声ガイダンス装置１の音声合成手
段１０５の出力であるディジタル音声データをそのまま
入力した方が効率的であり、その方が望ましい。また、
音声ガイダンス装置１の出力音声は、「語」や「節」に
分けられた音声データ（音声部分）である。

【００４６】速度入力手段２０２にはオペレーション入
力手段１０３によって音声の再生速度に関する情報が入
力されるようになっている。これは、音声全体の速度を
定義するものであり、ここでは、全体の速度として通常
の１．２倍に高速再生するものとする。なお、速度入力
手段２０２はメモリ機能を有し、オペレーション入力手
段１０３によって入力されたキーワードと話速変換速度
を関連付けて記憶している。

【００４７】速度制御手段２０３は文章の速度を変換す
るようになっており、入力音声は「語」や「節」の音声
部分に分けられたものである。この音声部分は予め、そ
れぞれについて、文章全体の速度に対する比を与えてお
く。例えば、「用紙をＡ４にセットしてください」とい
うメッセージの場合には、オペレーション装置１０３に
よって「用紙」および「Ａ４」をキーワードとするよう
に指定されるようになっているため、速度制御手段２０
３は「用紙」および「Ａ４」をキーワードとし、それぞ
れ高速再生の場合は他の音声部分（「を」「に」「セッ
ト」「してください」）と比較して速度を遅く（例えば
文章全体の速度の０．８倍）再生するようになってい
る。

【００４８】これにより、「用紙」および「Ａ４」の二
語については、通常の速度の０．９６倍、その他の
「語」および「節」については１．２倍の高速変換を行
うことになる。節ごとの話速変換の手法としては、前述
のＰＩＣＯＬＡ方式等、様々な既存の話速変換手法を用
いることができる。

【００４９】また、音声出力手段２０４はＤＡ変換器、
増幅器、スピーカによって構成されており、音声制御手
段２０３によって「語」や「節」ごとに話速を変換され
た音声データを出力するようになっている。

【００５０】音声出力手段２０４による出力音声はディ
ジタル音声データをそのまま出力しても良いし、音声出
力手段２０４にＤＡ変換機を設け、アナログ音声に変換
して出力しても良いが、音声ガイダンス装置１に適用す
る場合は、音声ガイダンス装置１のガイダンス音声出力
手段１０５にディジタル音声データとして入力するため
にディジタル音声データとしてそのまま出力した方が効
率的であり、その方が望ましい。また、音声出力の際
に、「語」や「節」のつながりが滑らかになるように、
つながりの部分に窓関数を適用したり、フィルタリング
を行っても良い。

【００５１】なお、本実施形態では、オペレーション入
力手段１０３および速度入力手段２０２が速度設定手段
を構成している。但し、話速変換装置１０１単体の場合
には、オペレーション入力手段１０３を話速変換装置１
０１に直接設けることにより、オペレータによって速度
を設定するようにする。

【００５２】一方、ＣＰＵ２０５はメモリ２０６に記憶
された話速変換プログラムに基づいて速度入力手段２０
２および速度制御手段２０３を制御するようになってお
り、この話速制御プログラムは、複数の音声部分に分割
された音声データを入力する機能と、前記入力される音
声データの任意の音声部分の速度を設定する機能と、前
記入力された音声データの任意の音声部分の速度を前記
設定された速度に従って変換する機能とをコンピュータ
に実行させるものである。

【００５３】次に、図２に示すフローチャートに基づい
て話速変換方法を説明する。なお、図２はＣＰＵ２０５
に実行される話速変換プログラムであり、この話速変換
プログラムは記憶媒体に記憶されてメモリ２０６にイン
ストールされたものである。この話速変換プログラムを
記憶する媒体としては、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯ
Ｍ、フロッピィーディスク、リムーバルディスク等を用
いて良く、話速変換プログラムは記憶媒体に記憶するの
ではなく、話速変換装置１０１を所定のサーバとネット
ワークで接続できるようにしておき、サーバからメモリ
２０６にインストールしても良い。

【００５４】まず、オペレーション入力手段１０３から
音声部分である所定のキーワードの話速を変更する指定
がなされたか否かを判別し（ステップＳ1）、変更をす
る指定がなされた場合に、速度入力手段２０２にこのキ
ーワードと変換速度の対応を記憶する（ステップＳ
2）。例えば、「用紙」および「Ａ４」の二語について
指定すると、通常の速度の０．９６倍の速度で話速を変
換するように記憶する。

【００５５】次に、オペレーション入力手段１０３から
コピー装置の操作が行なわれたか否かを判別し（ステッ
プＳ3）、行なわれた場合には、オペレーション入力手
段１０３の操作状況に応じたガイダンスの音声メッセー
ジを作成する（ステップＳ4）。

【００５６】この作成にあっては、メッセージ生成手段
１０４によってメッセージ蓄積手段１０２に蓄積された
音声部分から必要な文章を選択してこの音声部分を組合
わて一連のメッセージを生成した後、音声合成手段１０
５によりメッセージ生成手段１０４によって生成された
音声部分を合成し、このガイダンスメッセージに従って
ガイダンス音声を生成する。

【００５７】次いで、音声入力手段２０１には音声合成
手段１０５によって生成された音声ガイダンスが入力さ
れるとともに、速度入力手段２０２にメッセージ生成手
段１０４によって生成された音声部分に分割されたキー
ワードが入力される。

【００５８】速度入力手段２０２ではオペレーション入
力手段１０３によって予め指定されたキーワードである
か判別し（ステップＳ5）、指定されたキーワードであ
れば、再生速度を遅くなるようにして設定し（ステップ
Ｓ6）、指定されたキーワードでなければ再生速度が速
くなるように指定する（ステップＳ7）。

【００５９】次いで、速度制御手段２０３によって音声
データの再生速度を制御する（ステップＳ8）。速度制
御手段２０３は、例えば、「用紙をＡ４にセットしてく
ださい」というメッセージの場合には、「用紙」および
「Ａ４」を通常の速度の０．９６倍の速度で再生し、
「を」「に」「セット」「してください」を音声データ
の再生速度を通常の１．２倍の速度で変換し、文章全体
の速度の０．８倍で再生するようになっている。

【００６０】次いで、音声出力手段２０４によって音声
ガイダンスの出力が終了したか否かを判別し（ステップ
Ｓ9）、出力が終了した場合には今回の処理を終了す
る。

【００６１】このように本実施形態では、音声ガイダン
ス装置１が、複数の音声部分に分割された音声データが
入力される音声入力手段２０１と、音声入力手段２０１
に入力される音声データの任意の音声部分の速度を設定
するオペレーション入力手段１０３および速度入力手段
２０２と、音声入力手段２０１に入力された音声データ
の任意の音声部分の速度を速度入力手段２０２で設定さ
れた速度に従って変換する速度制御手段２０３とを備え
ているので、全体的に話速を速める場合に重要なキーワ
ード（音声部分）を比較的低速に再生して聞き取りやす
くすることができるため、ユーザがより理解しやすい再
生音声を得ることができる。

【００６２】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。

【００６３】また、本実施形態では、音声ガイダンス１
をメディア装置に搭載し、メッセージ蓄積手段２０１に
メディア装置の操作状況に応じた音声部分を蓄積したた
め、ファクシミリ装置、コピー装置、プリンタ装置、複
合機、ＰＣ等のメディア装置に操作に関連する音声ガイ
ダンスの速度を簡単に調整することができ、理解しやす
い再生音声を得ることができる。

【００６４】

【発明の効果】本発明の話速変換装置によれば、複数の
音声部分に分割された音声データが入力される音声入力
手段と、音声入力手段に入力される音声データの任意の
音声部分の速度を設定する速度設定手段と、音声入力手
段に入力された音声データの任意の音声部分の速度を速
度設定手段で設定された速度に従って変換する速度制御
手段とを設けたため、全体的に話速を速める場合に重要
なキーワード（音声部分）を比較的低速に再生して聞き
取りやすくすることができるため、ユーザがより理解し
やすい再生音声を得ることができる。

【００６５】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。

【００６６】また、本発明の話速変換方法によれば、入
力された音声データの再生速度を変換して出力する話速
変換方法であって、複数の音声部分に分割された音声デ
ータが入力される音声入力工程と、音声入力工程で入力
される音声データの任意の音声部分の速度を設定する速
度設定工程と、音声入力工程で入力された音声データの
任意の音声部分の速度を速度設定工程で設定された速度
に従って変換する速度制御工程手段とを含んでなるた
め、全体的に話速を速める場合に重要なキーワード（音
声部分）を比較的低速に再生して聞き取りやすくするこ
とができるため、ユーザがより理解しやすい再生音声を
得ることができる。

【００６７】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。

【００６８】また、本発明の音声ガイダンス装置によれ
ば、各種操作を行なう操作手段と、少なくとも最小単位
の音声部分が蓄積されたメッセージ蓄積手段と、操作手
段の操作状況に応じてメッセージ蓄積手段に蓄積された
音声部分を組合わせて一連のメッセージを生成するメッ
セージ生成手段と、メッセージ生成手段によって生成さ
れたメッセージを合成して音声データを生成する音声合
成手段と、音声合成手段によって合成された音声データ
が入力される音声入力手段と、メッセージ生成手段によ
って生成されたメッセージに対し、音声部分毎に速度を
設定する速度設定手段と、音声入力手段に入力された音
声データの任意の音声部分の速度を速度設定手段で設定
された速度に従って変換する速度制御手段とを設けたた
め、このような構成により、全体的に話速を速める場合
に重要なキーワード（音声部分）を比較的低速に再生し
て聞き取りやすくすることができるため、ユーザがより
理解しやすい再生音声を得ることができる。

【００６９】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。

【００７０】また、本発明のメディア装置によれば、ガ
イダンス装置を備えたメディア装置であって、メッセー
ジ蓄積手段にメディア装置の操作状況に応じた音声部分
が蓄積されるので、ファクシミリ装置、コピー装置、プ
リンタ装置、複合機、ＰＣ等のメディア装置に操作に関
連する音声ガイダンスの速度を簡単に調整することがで
き、理解しやすい再生音声を得ることができる。

【００７１】また、本発明の記憶媒体によれば、コンピ
ュータに、複数の音声部分に分割された音声データを入
力する機能と、前記入力される音声データの任意の音声
部分の速度を設定する機能と、前記入力された音声デー
タの任意の音声部分の速度を前記設定された速度に従っ
て変換する機能とを実行させるための話速変換プログラ
ムが記憶媒体に記憶されたので、全体的に話速を速める
場合に重要なキーワード（音声部分）を比較的低速に再
生して聞き取りやすくすることができるため、ユーザが
より理解しやすい再生音声を得ることができる。

【００７２】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。

【００７３】また、本発明の話速変換プログラムによれ
ば、コンピュータに、複数の音声部分に分割された音声
データを入力する機能と、前記入力される音声データの
任意の音声部分の速度を設定する機能と、前記入力され
た音声データの任意の音声部分の速度を前記設定された
速度に従って変換する機能とを実行させるので、このよ
うなプログラムを用いることにより、全体的に話速を速
める場合に重要なキーワード（音声部分）を比較的低速
に再生して聞き取りやすくすることができるため、ユー
ザがより理解しやすい再生音声を得ることができる。

【００７４】また、ユーザがキーワードの速度を予め設
定してそのキーワードの速度を調整することがでるた
め、再生音声データを簡便な方法で聞き取りやすくする
ことができる。

【図面の簡単な説明】

【図１】本発明に係る話速変換装置、話速変換方法、音
声ガイダンス装置、メディア装置、記憶媒体および話速
変換プログラムの一実施形態を示す図であり、その話速
変換装置を備えた音声ガイダンス装置のブロック図であ
る。

【図２】一実施形態の話速変換手順を示すフローチャー
トである。

【符号の説明】

１音声ガイダンス装置１０１話速変換装置１０２メッセージ蓄積手段１０３オペレーション入力手段（速度設定手段）１０４メッセージ生成手段１０５音声合成手段１０６ガイダンス音声出力手段２０１音声入力手段２０２速度入力手段（速度設定手段）２０３速度制御手段２０４音声出力手段

Claims

【特許請求の範囲】

【請求項１】入力された音声データの再生速度を変換し
て出力する話速変換装置であって、複数の音声部分に分割された音声データが入力される音
声入力手段と、前記音声入力手段に入力される前記音声
データの任意の音声部分の速度を設定する速度設定手段
と、前記音声入力手段に入力された音声データの任意の
音声部分の速度を前記速度設定手段で設定された速度に
従って変換する速度制御手段とを備えることを特徴とす
る話速変換装置。
【請求項２】入力された音声データの再生速度を変換し
て出力する話速変換方法であって、複数の音声部分に分割された音声データが入力される音
声入力工程と、前記音声入力工程で入力される前記音声
データの任意の音声部分の速度を設定する速度設定工程
と、前記音声入力工程で入力された音声データの任意の
音声部分の速度を前記速度設定工程で設定された速度に
従って変換する速度制御工程手段とを含んでなることを
特徴とする話速変換方法。
【請求項３】各種操作を行なう操作手段と、少なくとも最小単位の音声部分が蓄積されたメッセージ
蓄積手段と、前記操作手段の操作状況に応じて前記メッセージ蓄積手
段に蓄積された音声部分を組合わせて一連のメッセージ
を生成するメッセージ生成手段と、前記メッセージ生成手段によって生成されたメッセージ
を合成して音声データを生成する音声合成手段と、前記音声合成手段によって合成された音声データが入力
される音声入力手段と、前記メッセージ生成手段によって生成されたメッセージ
に対し、音声部分毎に速度を設定する速度設定手段と、前記音声入力手段に入力された音声データの任意の音声
部分の速度を前記速度設定手段で設定された速度に従っ
て変換する速度制御手段とを備えることを特徴とする音
声ガイダンス装置。
【請求項４】請求項３記載のガイダンス装置を備えたメ
ディア装置であって、前記メッセージ蓄積手段に前記メディア装置の操作状況
に応じた音声部分が蓄積されることを特徴とするメディ
ア装置。
【請求項５】コンピュータに、複数の音声部分に分割さ
れた音声データを入力する機能と、前記入力される音声
データの任意の音声部分の速度を設定する機能と、前記
入力された音声データの任意の音声部分の速度を前記設
定された速度に従って変換する機能とを実行させるため
の話速変換プログラムが記憶されたコンピュータ読み取
り可能な記憶媒体。
【請求項６】コンピュータに、複数の音声部分に分割さ
れた音声データを入力する機能と、前記入力される音声
データの任意の音声部分の速度を設定する機能と、前記
入力された音声データの任意の音声部分の速度を前記設
定された速度に従って変換する機能とを実行させるため
の話速変換プログラム。