JPH1083193A5 - - Google Patents
Info
- Publication number
- JPH1083193A5 JPH1083193A5 JP1996237465A JP23746596A JPH1083193A5 JP H1083193 A5 JPH1083193 A5 JP H1083193A5 JP 1996237465 A JP1996237465 A JP 1996237465A JP 23746596 A JP23746596 A JP 23746596A JP H1083193 A5 JPH1083193 A5 JP H1083193A5
- Authority
- JP
- Japan
- Prior art keywords
- speech
- synthesis
- unit
- user
- compression processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Description
【0012】
【課題を解決するための手段】
本発明の第1の手段では上記の従来の問題を解決しようとするもので、テキストに従って音声を合成する音声合成部と、その音声合成部で合成された音声を単一あるいは複数の帯域に分割しその帯域ごとに振幅を増幅あるいは減衰することにより合成音声の振幅のダイナミックレンジを圧縮する圧縮処理を行う圧縮処理部とを備えた音声合成装置である。
【課題を解決するための手段】
本発明の第1の手段では上記の従来の問題を解決しようとするもので、テキストに従って音声を合成する音声合成部と、その音声合成部で合成された音声を単一あるいは複数の帯域に分割しその帯域ごとに振幅を増幅あるいは減衰することにより合成音声の振幅のダイナミックレンジを圧縮する圧縮処理を行う圧縮処理部とを備えた音声合成装置である。
【0013】
【発明の実施の形態】
本発明の実施形態は、使用者の聴覚特性に合わせて合成した音声に強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施す、あるいは使用場面の騒音環境に合わせて合成した音声に強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施す。また、使用者の聴覚特性に合わせてデータベースに記憶された合成単位に強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施した後に音声を合成する、あるいは使用場面の騒音環境に合わせてデータベースに記憶された合成単位に強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施した後に音声を合成する。また、あらかじめ強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施した合成単位を用いて音声を合成する。また、音声の合成を中断した際に言語処理結果に基づき停止位置以前で内容理解のしやすいテキスト上の点まで戻って音声の合成を再開する。また、言語処理に基づき強調処理を行う部分を設定することにより、聴覚障害のある使用者や、騒音下での使用でも情報を確実に伝達することができる。
(実施例1)
以下本発明の第1の実施例について、図面を参照しながら説明する。
【発明の実施の形態】
本発明の実施形態は、使用者の聴覚特性に合わせて合成した音声に強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施す、あるいは使用場面の騒音環境に合わせて合成した音声に強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施す。また、使用者の聴覚特性に合わせてデータベースに記憶された合成単位に強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施した後に音声を合成する、あるいは使用場面の騒音環境に合わせてデータベースに記憶された合成単位に強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施した後に音声を合成する。また、あらかじめ強調処理あるいは振幅のダイナミックレンジを圧縮する処理を施した合成単位を用いて音声を合成する。また、音声の合成を中断した際に言語処理結果に基づき停止位置以前で内容理解のしやすいテキスト上の点まで戻って音声の合成を再開する。また、言語処理に基づき強調処理を行う部分を設定することにより、聴覚障害のある使用者や、騒音下での使用でも情報を確実に伝達することができる。
(実施例1)
以下本発明の第1の実施例について、図面を参照しながら説明する。
【0090】
なお、実施例1、実施例4、実施例7において環境音を1kHz以下、1kHzから2kHz、2kHz〜4kHz、4kHz以上の帯域に分割したが、これ以外の分割の方法でも良い。
なお、実施例1、実施例4、実施例7において環境音を1kHz以下、1kHzから2kHz、2kHz〜4kHz、4kHz以上の帯域に分割したが、これ以外の分割の方法でも良い。
【0091】
なお、実施例1において1kHz以下、1kHzから2kHz、2kHz〜4kHz、4kHz以上の各帯域において、それぞれ20dBSPL/Hz、20dBSPL/Hz、15dBSPL/Hz、10dBSPL/Hz以上の環境があるときは圧縮パラメータを設定し、圧縮処理を行うとしたが、これ以外の値でも良い。
なお、実施例1において1kHz以下、1kHzから2kHz、2kHz〜4kHz、4kHz以上の各帯域において、それぞれ20dBSPL/Hz、20dBSPL/Hz、15dBSPL/Hz、10dBSPL/Hz以上の環境があるときは圧縮パラメータを設定し、圧縮処理を行うとしたが、これ以外の値でも良い。
【0093】
なお、実施例4において1kHzから2kHzの環境音平均レベルが20dBSPL/Hz以上かつ、2kHzから4kHzの環境音平均レベルが15dBSPL/Hzかつ、1kHz以下の環境音平均レベルが20dBSPL/Hz以下あるいは4kHZ以上の環境音平均レベルが15DBSPL/Hz以下の場合に子音強調情報を真としたが、これ以外の値としても良い。
なお、実施例4において1kHzから2kHzの環境音平均レベルが20dBSPL/Hz以上かつ、2kHzから4kHzの環境音平均レベルが15dBSPL/Hzかつ、1kHz以下の環境音平均レベルが20dBSPL/Hz以下あるいは4kHZ以上の環境音平均レベルが15DBSPL/Hz以下の場合に子音強調情報を真としたが、これ以外の値としても良い。
【0101】
【発明の効果】
以上説明したように、本発明によれば、聴覚障害のある使用者や、騒音下での使用でも情報を確実に伝達することができ、その実用的効果は大きい。
【発明の効果】
以上説明したように、本発明によれば、聴覚障害のある使用者や、騒音下での使用でも情報を確実に伝達することができ、その実用的効果は大きい。
Claims (21)
- テキストに従って音声を合成する音声合成部と、その音声合成部で合成された音声を単一あるいは複数の帯域に分割しその帯域ごとに振幅を増幅あるいは減衰することにより合成音声の振幅のダイナミックレンジを圧縮する圧縮処理を行う圧縮処理部とを備えた音声合成装置。
- マイクロフォンより入力された環境音を分析しその環境音の物理特性に基づいて圧縮処理部を制御する制御部とを備えた請求項1記載の音声合成装置。
- 使用者が圧縮の程度を調節するための操作手段と、その操作手段より入力された信号に基づいて圧縮処理部を制御する制御部とを備えた請求項1記載の音声合成装置。
- 使用者の聴覚特性を測定する測定部と、前記使用者の聴覚特性に基づいて圧縮処理部を制御する制御部とを備えた請求項1記載の音声合成装置。
- 使用者の聴覚特性を記憶する記憶手段と、前記使用者の聴覚特性に基づいて圧縮処理部を制御する制御部とを備えた請求項1記載の音声合成装置。
- 聴覚特性読み取り手段と、制御部とを備え、前記聴覚特性読み取り手段によって記録媒体に格納された使用者の聴覚特性を参照して前記制御部で圧縮処理部を制御する請求項1記載の音声合成装置。
- テキストに従って音声を合成する音声合成部で合成された音声を単一あるいは複数の帯域に分割し、その分割した帯域ごとに振幅を増幅あるいは減衰することにより合成音声の振幅のダイナミックレンジを圧縮する圧縮処理を行う音声合成方法。
- 音声を母音/子音/母音の連鎖などの所望の合成単位で記憶しておく音声素片データベースと、前記合成単位を単一あるいは複数の帯域に分割しその帯域ごとに振幅を増幅あるいは減衰することにより合成単位の振幅のダイナミックレンジを圧縮する圧縮処理を施す素片圧縮処理部と、その素片圧縮処理部により圧縮処理を施された合成単位を目的のテキストによって接続して音声を合成する音声合成部とを備えた音声合成装置。
- マイクロフォンより入力された環境音を分析しその環境音の物理特性に基づいて素片圧縮処理部を制御する制御部とを備えた請求項8記載の音声合成装置。
- 使用者が圧縮の程度を調節するための操作手段と、その操作手段より入力された信号に基づいて素片圧縮処理部を制御する制御部とを備えた請求項8記載の音声合成装置。
- 使用者の聴覚特性を測定する測定部と、前記使用者の聴覚特性に基づいて素片圧縮処理部を制御する制御部とを備えた請求項8記載の音声合成装置。
- 使用者の聴覚特性を記憶する記憶手段と、前記使用者の聴覚特性に基づいて素片圧縮処理部を制御する制御部とを備えた請求項8記載の音声合成装置。
- 聴覚特性読み取り手段と、制御部とを備え、前記聴覚特性読み取り手段によって記録媒体に格納された使用者の聴覚特性を参照して前記制御部で素片圧縮処理部を制御する請求項8記載の音声合成装置。
- 音声を母音/子音/母音の連鎖などの所望の合成単位で記憶しておく音声素片データベースから、前記合成単位を単一あるいは複数の帯域に分割し、その分割した帯域ごとに振幅を増幅あるいは減衰することにより合成単位の振幅のダイナミックレンジを圧縮する圧縮処理を施し、前記圧縮処理が施された合成単位を目的のテキストによって接続して音声を合成する音声合成方法。
- あらかじめ単一あるいは複数の帯域に分割しその帯域ごとに振幅を増幅あるいは減衰することにより合成単位の振幅のダイナミックレンジを圧縮する圧縮処理を施した音声を母音/子音/母音の連鎖などの所望の合成単位で記憶しておく音声素片データベースと、前記合成単位を目的のテキストによって接続して音声を合成する音声合成部とを備えた音声合成装置。
- 圧縮の程度の異なる複数の音声素片データベースと、マイクロフォンより入力された環境音を分析しその環境音の物理特性に基づいて音声合成部が音声合成に 使用する前記音声素片データベースを選択する制御部とを備えた請求項15記載の音声合成装置。
- 圧縮の程度の異なる複数の音声素片データベースと、使用者が圧縮の状態を調節するための操作手段と、その操作手段より入力された信号に基づいて音声合成部が音声合成に使用する前記音声素片データベースを選択する制御部とを備えた請求項15記載の音声合成装置。
- 圧縮の程度の異なる複数の音声素片データベースと、使用者の聴覚特性を測定する測定部と、前記使用者の聴覚特性に基づいて音声合成部が音声合成に使用する前記音声素片データベースを選択する制御部とを備えた請求項15記載の音声合成装置。
- 圧縮の程度の異なる複数の音声素片データベースと、使用者の聴覚特性を記憶する記憶手段と、前記使用者の聴覚特性に基づいて音声合成部が音声合成に使用する前記音声素片データベースを選択する制御部とを備えた請求項15記載の音声合成装置。
- 圧縮の程度の異なる複数の音声素片データベースを格納した記憶媒体と、音声素片データベース読み取り手段とを備えた請求項15記載の音声合成装置。
- あらかじめ単一あるいは複数の帯域に分割し、その帯域ごとに振幅を増幅あるいは減衰することにより合成単位の振幅のダイナミックレンジを圧縮する圧縮処理を施した音声を母音/子音/母音の連鎖などの所望の合成単位で記憶しておく音声素片データベースから、前記合成単位を目的のテキストによって接続して音声を合成する音声合成方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8237465A JPH1083193A (ja) | 1996-09-09 | 1996-09-09 | 音声合成装置および音声素片作成方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8237465A JPH1083193A (ja) | 1996-09-09 | 1996-09-09 | 音声合成装置および音声素片作成方法 |
Related Child Applications (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003282641A Division JP2004004952A (ja) | 2003-07-30 | 2003-07-30 | 音声合成装置および音声合成方法 |
| JP2003282643A Division JP2004004954A (ja) | 2003-07-30 | 2003-07-30 | 音声合成装置および音声合成方法 |
| JP2003282642A Division JP3750676B2 (ja) | 2003-07-30 | 2003-07-30 | 音声合成装置および音声合成方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH1083193A JPH1083193A (ja) | 1998-03-31 |
| JPH1083193A5 true JPH1083193A5 (ja) | 2004-08-19 |
Family
ID=17015744
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8237465A Pending JPH1083193A (ja) | 1996-09-09 | 1996-09-09 | 音声合成装置および音声素片作成方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1083193A (ja) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3578598B2 (ja) * | 1997-06-23 | 2004-10-20 | 株式会社リコー | 音声合成装置 |
| JP2006208600A (ja) * | 2005-01-26 | 2006-08-10 | Brother Ind Ltd | 音声合成装置及び音声合成方法 |
| JP4644876B2 (ja) * | 2005-01-28 | 2011-03-09 | 株式会社国際電気通信基礎技術研究所 | 音声処理装置 |
| JP4738213B2 (ja) * | 2006-03-09 | 2011-08-03 | 富士通株式会社 | 利得調整方法及び利得調整装置 |
| JP4528365B1 (ja) * | 2010-03-26 | 2010-08-18 | 株式会社フィールドシステム | 発信装置 |
| JP6599828B2 (ja) * | 2016-08-29 | 2019-10-30 | 株式会社テクノリンク | 音処理方法、音処理装置、及びプログラム |
| JP7655065B2 (ja) * | 2021-04-22 | 2025-04-02 | 株式会社Jvcケンウッド | 音声処理装置 |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| NL7901477A (nl) * | 1979-02-26 | 1980-08-28 | Philips Nv | Geluidsweergave in een ruimte met een onafhankelijke geluidsbron. |
| US4901353A (en) * | 1988-05-10 | 1990-02-13 | Minnesota Mining And Manufacturing Company | Auditory prosthesis fitting using vectors |
| JP2568134B2 (ja) * | 1990-09-04 | 1996-12-25 | リオン株式会社 | 補聴器 |
| JPH05244696A (ja) * | 1992-02-28 | 1993-09-21 | Hitachi Ltd | ディジタル補聴器 |
| JPH07152787A (ja) * | 1994-01-13 | 1995-06-16 | Sony Corp | 情報アクセスシステムおよび記録媒体 |
| JPH07261797A (ja) * | 1994-03-18 | 1995-10-13 | Mitsubishi Electric Corp | 信号符号化装置及び信号復号化装置 |
-
1996
- 1996-09-09 JP JP8237465A patent/JPH1083193A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1709734B1 (en) | System for audio signal processing | |
| US6577739B1 (en) | Apparatus and methods for proportional audio compression and frequency shifting | |
| TWI797341B (zh) | 用於產生觸覺輸出以增強使用者體驗的系統及方法 | |
| US8812308B2 (en) | Apparatus and method for modifying an input audio signal | |
| CA2722883C (en) | System and method for dynamic sound delivery | |
| US6988068B2 (en) | Compensating for ambient noise levels in text-to-speech applications | |
| US8867764B1 (en) | Calibrated hearing aid tuning appliance | |
| JP4282659B2 (ja) | 音声信号処理装置の音声区間検出装置及び方法 | |
| NO342157B1 (no) | Audioforsterkningsregulering ved bruk av spesifikk lydstyrkebasert hørehendelsesdeteksjon | |
| AU2011244268A1 (en) | Apparatus and method for modifying an input audio signal | |
| JP7582291B2 (ja) | 復号装置、復号方法、プログラム、符号化装置、符号化方法 | |
| JPH05508760A (ja) | ダイナミックレンジ圧縮 | |
| KR20050121698A (ko) | 오디오 지각 음조 경보들을 증가시키는 방법 및 시스템 | |
| JPH1083193A5 (ja) | ||
| CN106572818B (zh) | 一种具有用户特定编程的听觉系统 | |
| Venema et al. | The many faces of compression | |
| US7016814B2 (en) | Method and device for determining the quality of a signal | |
| MY133401A (en) | Automatically adjusting acoustic output of the speaker of a telephone handset | |
| CN109889170A (zh) | 音频信号的控制方法和装置 | |
| KR102765676B1 (ko) | 복호 장치, 복호 방법 및 프로그램 | |
| JP2009265422A (ja) | 情報処理装置及び情報処理方法 | |
| JPH07170194A (ja) | データ符号化装置 | |
| CN119418716B (zh) | 音频处理方法、电子设备、芯片系统、存储介质及程序产品 | |
| WO2023189973A1 (ja) | 変換装置、変換方法および変換プログラム | |
| WO2023189193A1 (ja) | 復号装置、復号方法および復号プログラム |