JPH1083193A5

JPH1083193A5 -

Info

Publication number: JPH1083193A5
Application number: JP1996237465A
Authority: JP
Filing date: 1996-09-09
Publication date: 2004-08-19

Description

【００１２】
【課題を解決するための手段】
本発明の第1の手段では上記の従来の問題を解決しようとするもので、テキストに従って音声を合成する音声合成部と、その音声合成部で合成された音声を単一あるいは複数の帯域に分割しその帯域ごとに振幅を増幅あるいは減衰することにより合成音声の振幅のダイナミックレンジを圧縮する圧縮処理を行う圧縮処理部とを備えた音声合成装置である。

【００１３】
【発明の実施の形態】
本発明の実施形態は、使用者の聴覚特性に合わせて合成した音声に強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施す、あるいは使用場面の騒音環境に合わせて合成した音声に強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施す。また、使用者の聴覚特性に合わせてデータベースに記憶された合成単位に強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施した後に音声を合成する、あるいは使用場面の騒音環境に合わせてデータベースに記憶された合成単位に強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施した後に音声を合成する。また、あらかじめ強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施した合成単位を用いて音声を合成する。また、音声の合成を中断した際に言語処理結果に基づき停止位置以前で内容理解のしやすいテキスト上の点まで戻って音声の合成を再開する。また、言語処理に基づき強調処理を行う部分を設定することにより、聴覚障害のある使用者や、騒音下での使用でも情報を確実に伝達することができる。
（実施例１）
以下本発明の第１の実施例について、図面を参照しながら説明する。

【００９０】
なお、実施例１、実施例４、実施例７において環境音を１ｋＨｚ以下、１ｋＨｚから２ｋＨｚ、２ｋＨｚ〜４ｋＨｚ、４ｋＨｚ以上の帯域に分割したが、これ以外の分割の方法でも良い。

【００９１】
なお、実施例１において１ｋＨｚ以下、１ｋＨｚから２ｋＨｚ、２ｋＨｚ〜４ｋＨｚ、４ｋＨｚ以上の各帯域において、それぞれ２０ｄＢＳＰＬ／Ｈｚ、２０ｄＢＳＰＬ／Ｈｚ、１５ｄＢＳＰＬ／Ｈｚ、１０ｄＢＳＰＬ／Ｈｚ以上の環境があるときは圧縮パラメータを設定し、圧縮処理を行うとしたが、これ以外の値でも良い。

【００９３】
なお、実施例４において１ｋＨｚから２ｋＨｚの環境音平均レベルが２０ｄＢＳＰＬ／Ｈｚ以上かつ、２ｋＨｚから４ｋＨｚの環境音平均レベルが１５ｄＢＳＰＬ／Ｈｚかつ、１ｋＨｚ以下の環境音平均レベルが２０ｄＢＳＰＬ／Ｈｚ以下あるいは４ｋＨＺ以上の環境音平均レベルが１５ＤＢＳＰＬ／Ｈｚ以下の場合に子音強調情報を真としたが、これ以外の値としても良い。

【０１０１】
【発明の効果】
以上説明したように、本発明によれば、聴覚障害のある使用者や、騒音下での使用でも情報を確実に伝達することができ、その実用的効果は大きい。

Claims

テキストに従って音声を合成する音声合成部と、その音声合成部で合成された音声を単一あるいは複数の帯域に分割しその帯域ごとに振幅を増幅あるいは減衰することにより合成音声の振幅のダイナミックレンジを圧縮する圧縮処理を行う圧縮処理部とを備えた音声合成装置。
マイクロフォンより入力された環境音を分析しその環境音の物理特性に基づいて圧縮処理部を制御する制御部とを備えた請求項１記載の音声合成装置。
使用者が圧縮の程度を調節するための操作手段と、その操作手段より入力された信号に基づいて圧縮処理部を制御する制御部とを備えた請求項１記載の音声合成装置。
使用者の聴覚特性を測定する測定部と、前記使用者の聴覚特性に基づいて圧縮処理部を制御する制御部とを備えた請求項１記載の音声合成装置。
使用者の聴覚特性を記憶する記憶手段と、前記使用者の聴覚特性に基づいて圧縮処理部を制御する制御部とを備えた請求項１記載の音声合成装置。
聴覚特性読み取り手段と、制御部とを備え、前記聴覚特性読み取り手段によって記録媒体に格納された使用者の聴覚特性を参照して前記制御部で圧縮処理部を制御する請求項１記載の音声合成装置。
テキストに従って音声を合成する音声合成部で合成された音声を単一あるいは複数の帯域に分割し、その分割した帯域ごとに振幅を増幅あるいは減衰することにより合成音声の振幅のダイナミックレンジを圧縮する圧縮処理を行う音声合成方法。
音声を母音／子音／母音の連鎖などの所望の合成単位で記憶しておく音声素片データベースと、前記合成単位を単一あるいは複数の帯域に分割しその帯域ごとに振幅を増幅あるいは減衰することにより合成単位の振幅のダイナミックレンジを圧縮する圧縮処理を施す素片圧縮処理部と、その素片圧縮処理部により圧縮処理を施された合成単位を目的のテキストによって接続して音声を合成する音声合成部とを備えた音声合成装置。
マイクロフォンより入力された環境音を分析しその環境音の物理特性に基づいて素片圧縮処理部を制御する制御部とを備えた請求項８記載の音声合成装置。
使用者が圧縮の程度を調節するための操作手段と、その操作手段より入力された信号に基づいて素片圧縮処理部を制御する制御部とを備えた請求項８記載の音声合成装置。
使用者の聴覚特性を測定する測定部と、前記使用者の聴覚特性に基づいて素片圧縮処理部を制御する制御部とを備えた請求項８記載の音声合成装置。
使用者の聴覚特性を記憶する記憶手段と、前記使用者の聴覚特性に基づいて素片圧縮処理部を制御する制御部とを備えた請求項８記載の音声合成装置。
聴覚特性読み取り手段と、制御部とを備え、前記聴覚特性読み取り手段によって記録媒体に格納された使用者の聴覚特性を参照して前記制御部で素片圧縮処理部を制御する請求項８記載の音声合成装置。
音声を母音／子音／母音の連鎖などの所望の合成単位で記憶しておく音声素片データベースから、前記合成単位を単一あるいは複数の帯域に分割し、その分割した帯域ごとに振幅を増幅あるいは減衰することにより合成単位の振幅のダイナミックレンジを圧縮する圧縮処理を施し、前記圧縮処理が施された合成単位を目的のテキストによって接続して音声を合成する音声合成方法。
あらかじめ単一あるいは複数の帯域に分割しその帯域ごとに振幅を増幅あるいは減衰することにより合成単位の振幅のダイナミックレンジを圧縮する圧縮処理を施した音声を母音／子音／母音の連鎖などの所望の合成単位で記憶しておく音声素片データベースと、前記合成単位を目的のテキストによって接続して音声を合成する音声合成部とを備えた音声合成装置。
圧縮の程度の異なる複数の音声素片データベースと、マイクロフォンより入力された環境音を分析しその環境音の物理特性に基づいて音声合成部が音声合成に使用する前記音声素片データベースを選択する制御部とを備えた請求項１５記載の音声合成装置。
圧縮の程度の異なる複数の音声素片データベースと、使用者が圧縮の状態を調節するための操作手段と、その操作手段より入力された信号に基づいて音声合成部が音声合成に使用する前記音声素片データベースを選択する制御部とを備えた請求項１５記載の音声合成装置。
圧縮の程度の異なる複数の音声素片データベースと、使用者の聴覚特性を測定する測定部と、前記使用者の聴覚特性に基づいて音声合成部が音声合成に使用する前記音声素片データベースを選択する制御部とを備えた請求項１５記載の音声合成装置。
圧縮の程度の異なる複数の音声素片データベースと、使用者の聴覚特性を記憶する記憶手段と、前記使用者の聴覚特性に基づいて音声合成部が音声合成に使用する前記音声素片データベースを選択する制御部とを備えた請求項１５記載の音声合成装置。
圧縮の程度の異なる複数の音声素片データベースを格納した記憶媒体と、音声素片データベース読み取り手段とを備えた請求項１５記載の音声合成装置。
あらかじめ単一あるいは複数の帯域に分割し、その帯域ごとに振幅を増幅あるいは減衰することにより合成単位の振幅のダイナミックレンジを圧縮する圧縮処理を施した音声を母音／子音／母音の連鎖などの所望の合成単位で記憶しておく音声素片データベースから、前記合成単位を目的のテキストによって接続して音声を合成する音声合成方法。