JP5123347B2 - 音声合成装置 - Google Patents
音声合成装置 Download PDFInfo
- Publication number
- JP5123347B2 JP5123347B2 JP2010084319A JP2010084319A JP5123347B2 JP 5123347 B2 JP5123347 B2 JP 5123347B2 JP 2010084319 A JP2010084319 A JP 2010084319A JP 2010084319 A JP2010084319 A JP 2010084319A JP 5123347 B2 JP5123347 B2 JP 5123347B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- speech
- sequence
- synthesis
- prohibition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Machine Translation (AREA)
- Telephone Function (AREA)
Description
図1は、本発明の第1の実施形態に係る音声合成装置の構成を示すブロック図である。音声合成装置10は、取得部11と、言語処理部12と、韻律処理部13と、音声合成部14と、を備える。取得部11は、音声合成装置10の内部又は外部から音声合成の対象となるテキストデータを取得する。言語処理部12は、取得したテキストデータに対し形態素解析・構文解析を行う。韻律処理部13は、テキストデータのアクセントなどの韻律や品詞などの言語に関する属性に基づいて、複数の合成単位で構成された音声素片系列を音声合成部14に出力する。音声合成部14は、音声素片系列を用いて合成音声を生成する。
ステップS601では、禁止部146は、変更素片履歴記憶部145に音声素片が記録されているかを確認して、処理を分岐させる。記録されていない場合には(ステップS601で「No」)、ステップS603に進む。記録されている場合には(ステップS601で「Yes」)、ステップS602に進む。
本発明の第2の実施形態について説明する。なお、第1の実施形態と異なる処理を中心に説明し、同様の処理は適宜省略する。
本発明の第3の実施形態について説明する。なお、第1の実施形態と異なる処理を中心に説明し、同様の処理は適宜省略する。
10 音声合成装置
141 生成部
142 音声接続部
146 禁止部
Claims (6)
- 合成単位毎に音声素片を選択し、前記音声素片の系列である音声素片系列を生成する生成部と、
前記生成部で生成された音声素片系列を接続することによって音声を合成する音声接続部と、
前記音声接続部で前回までに合成された第1の音声素片系列の音声素片と、前記音声接続部で今回合成され且つ前記第1の音声素片系列と同一の合成単位を有する第2の音声素片系列の音声素片とを比較し、前記第1の音声素片系列と前記第2の音声素片系列が異なる場合、前記第2の音声素片系列と音声素片が異なる前記第1の音声素片系列の音声素片の使用を禁止する禁止部と、
前記音声接続部で合成された第1の音声素片系列の音声素片を指定する指定部とを備え、
前記禁止部は、前記指定部で指定された第1の音声素片系列の音声素片の使用を禁止することを特徴とする音声合成装置。 - 前記禁止部は、使用を禁止した音声素片系列の音声素片の付随情報を記憶部に記憶し、 前記禁止部は、前記記憶部に記憶された前記付属情報に基づいて、使用を禁止する前記第1の音声素片系列の音声素片を選択することを特徴とする請求項1に記載の音声合成装置。
- 前記付随情報は、前記禁止部により前記第1の音声素片系列の音声素片を使用禁止とした回数を含むことを特徴とする請求項2に記載の音声合成装置。
- 前記禁止部は、前記生成部で選択された複数の音声素片のうち、前記回数が最大の音声素片を選択することを特徴とする請求項3に記載の音声合成装置。
- 前記付随情報は、前記生成部で選択された音声素片の合成単位と、前記合成単位の周辺の合成単位の音韻を含むことを特徴とする請求項2に記載の音声合成装置。
- 前記指定部は、前記合成単位毎に前記第1の音声素片系列の音声素片を指定し、
前記禁止部は、前記合成単位毎に前記第1の音声素片系列の音声素片の使用を禁止することを特徴とする請求項1乃至請求項5のいずれか1項に記載の音声合成装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010084319A JP5123347B2 (ja) | 2010-03-31 | 2010-03-31 | 音声合成装置 |
| US12/881,397 US8554565B2 (en) | 2010-03-31 | 2010-09-14 | Speech segment processor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010084319A JP5123347B2 (ja) | 2010-03-31 | 2010-03-31 | 音声合成装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2011215419A JP2011215419A (ja) | 2011-10-27 |
| JP5123347B2 true JP5123347B2 (ja) | 2013-01-23 |
Family
ID=44710679
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010084319A Expired - Fee Related JP5123347B2 (ja) | 2010-03-31 | 2010-03-31 | 音声合成装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US8554565B2 (ja) |
| JP (1) | JP5123347B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11118466B2 (en) * | 2018-10-19 | 2021-09-14 | Pratt & Whiiney Canada Corp. | Compressor stator with leading edge fillet |
| US12406655B2 (en) * | 2022-05-20 | 2025-09-02 | International Business Machines Corporation | Increased accessibility of synthesized speech by replacement of difficulty to understand words |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3423276B2 (ja) * | 2000-08-10 | 2003-07-07 | 三洋電機株式会社 | 音声合成方法 |
| GB2391143A (en) * | 2002-04-17 | 2004-01-28 | Rhetorical Systems Ltd | Method and apparatus for scultping synthesized speech |
| JP4430960B2 (ja) * | 2004-03-01 | 2010-03-10 | 日本電信電話株式会社 | 音声素片探索用データベース構成方法およびこれを実施する装置、音声素片探索方法、音声素片探索プログラムおよびこれを記憶する記憶媒体 |
| JP4639932B2 (ja) * | 2005-05-06 | 2011-02-23 | 株式会社日立製作所 | 音声合成装置 |
| US7630898B1 (en) * | 2005-09-27 | 2009-12-08 | At&T Intellectual Property Ii, L.P. | System and method for preparing a pronunciation dictionary for a text-to-speech voice |
| JP4664194B2 (ja) * | 2005-11-29 | 2011-04-06 | パナソニック株式会社 | 声質制御装置および方法およびプログラム記憶媒体 |
| ATE414975T1 (de) * | 2006-03-17 | 2008-12-15 | Svox Ag | Text-zu-sprache-synthese |
| US8438032B2 (en) * | 2007-01-09 | 2013-05-07 | Nuance Communications, Inc. | System for tuning synthesized speech |
| JP2008191334A (ja) * | 2007-02-02 | 2008-08-21 | Oki Electric Ind Co Ltd | 音声合成方法、音声合成プログラム、音声合成装置、音声合成システム |
| JP5434587B2 (ja) * | 2007-02-20 | 2014-03-05 | 日本電気株式会社 | 音声合成装置及び方法とプログラム |
| JP5158567B2 (ja) * | 2008-03-31 | 2013-03-06 | 日本電気株式会社 | 音声合成装置、音声合成方法及び音声合成プログラム |
| US8352270B2 (en) * | 2009-06-09 | 2013-01-08 | Microsoft Corporation | Interactive TTS optimization tool |
-
2010
- 2010-03-31 JP JP2010084319A patent/JP5123347B2/ja not_active Expired - Fee Related
- 2010-09-14 US US12/881,397 patent/US8554565B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| US20110246199A1 (en) | 2011-10-06 |
| JP2011215419A (ja) | 2011-10-27 |
| US8554565B2 (en) | 2013-10-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4130190B2 (ja) | 音声合成システム | |
| US8019605B2 (en) | Reducing recording time when constructing a concatenative TTS voice using a reduced script and pre-recorded speech assets | |
| US20080120093A1 (en) | System for creating dictionary for speech synthesis, semiconductor integrated circuit device, and method for manufacturing semiconductor integrated circuit device | |
| JPWO2005109399A1 (ja) | 音声合成装置および方法 | |
| US20100250254A1 (en) | Speech synthesizing device, computer program product, and method | |
| US20100312564A1 (en) | Local and remote feedback loop for speech synthesis | |
| Conkie et al. | Preselection of candidate units in a unit selection-based text-to-speech synthesis system. | |
| US9020821B2 (en) | Apparatus and method for editing speech synthesis, and computer readable medium | |
| JPWO2016103652A1 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
| JP5123347B2 (ja) | 音声合成装置 | |
| JP5343293B2 (ja) | 音声編集合成装置及び音声編集合成方法 | |
| JP4639932B2 (ja) | 音声合成装置 | |
| JP2008139631A (ja) | 音声合成方法、装置、プログラム | |
| US8249874B2 (en) | Synthesizing speech from text | |
| JP5870686B2 (ja) | 合成音声修正装置,方法,及びプログラム | |
| US20090216537A1 (en) | Speech synthesis apparatus and method thereof | |
| Breen et al. | A phonologically motivated method of selecting non-uniform units. | |
| JP4829605B2 (ja) | 音声合成装置および音声合成プログラム | |
| JP5198200B2 (ja) | 音声合成装置及び方法 | |
| KR101495410B1 (ko) | 음성 합성 장치, 음성 합성 방법 및 컴퓨터 판독가능 기억 매체 | |
| JP5275470B2 (ja) | 音声合成装置およびプログラム | |
| JPH06318094A (ja) | 音声規則合成装置 | |
| Dong et al. | A Unit Selection-based Speech Synthesis Approach for Mandarin Chinese. | |
| JP2006084854A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
| JP5366919B2 (ja) | 音声合成方法、装置、及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110916 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111125 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20111205 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120113 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120326 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120601 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120731 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120928 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121025 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151102 Year of fee payment: 3 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 5123347 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151102 Year of fee payment: 3 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| LAPS | Cancellation because of no payment of annual fees |