JPH08248971A - テキスト朗読読み上げ装置 - Google Patents

テキスト朗読読み上げ装置

Info

Publication number
JPH08248971A
JPH08248971A JP7049436A JP4943695A JPH08248971A JP H08248971 A JPH08248971 A JP H08248971A JP 7049436 A JP7049436 A JP 7049436A JP 4943695 A JP4943695 A JP 4943695A JP H08248971 A JPH08248971 A JP H08248971A
Authority
JP
Japan
Prior art keywords
speaker
dialogue
text
sentence
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7049436A
Other languages
English (en)
Inventor
Takashi Endo
隆 遠藤
Shunichi Yajima
俊一 矢島
Nobuo Nukaga
信尾 額賀
Toshiyuki Aritsuka
俊之 在塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7049436A priority Critical patent/JPH08248971A/ja
Publication of JPH08248971A publication Critical patent/JPH08248971A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 付加情報がないテキスト中に現われる台詞部
分の話者を推定し、話者毎に異なる声質で読み上げるテ
キスト読み上げ装置。 【構成】 テキストデータ入力装置206からテキスト
が入力され、プログラム格納用ROM205に格納された
構文解析プログラム101、話者分析プログラム10
2、話者データ割当プログラム103が制御プログラム
120の制御の下、CPU201で実行され、不揮発メモ
リ203の記憶データベースを参照し、メモリ202中
の台詞テーブル211、話者テーブル212に各台詞が
どの話者に対応し、各話者に対し話者データ格納装置2
04の格納話者データ113のどの話者を用いるべきか
が設定され、音声規則合成プログラム104は台詞テー
ブル211と話者テーブル212を参照し、テキストに
対し、適切な話者データを選択肢ながら合成音声を生成
し、D/A装置144から合成音声が出力される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、テキスト情報を読み上
げるテキスト読み上げ装置に係り、特に小説などの台詞
を含むテキストや、レイアウトを持つテキスト構造を、
音質を変えて読み上げるテキスト読み上げ装置に関す
る。
【0002】
【従来の技術】近年、ワードプロセッサや電子出版の普
及により、電子化されたテキストが普及している。これ
らのテキストへのアクセス手段の一つとして、テキスト
から音声波形を生成して出力する読み上げ装置が提案さ
れている。
【0003】従来提案されている読み上げ装置では、引
用文部分をテキスト中の記号より識別し、引用文部分に
対してはその他の部分とは性質を変化させて引用文を識
別可能にする例(特開平5−289687号)や、テキ
スト中に発声制御コードを埋め込んでおき、その制御コ
ードに従って規則音声合成を行う例(特開平5−307
396)がある。
【0004】
【発明が解決しようとする課題】従来の文章読み上げ装
置を用いた場合、小説などの台詞を含むテキストの台詞
の部分の声質を台詞の話者毎に変えて適切に読み上げる
ことは、まったく不可能であるか、テキスト中に付加情
報を予め埋め込んでおく必要があった。
【0005】本発明の目的は、テキスト中に現われる台
詞部分の話者を推定し、話者毎に異なる声質で読み上げ
るテキスト読み上げ装置を提供することにある。
【0006】
【課題を解決するための手段】本発明は、テキストデー
タを読み込むテキストデータ入力装置と、テキスト中に
現われる記号によりテキストを台詞と地の文に分離し、
テキスト中の文の主語及び動詞を検出する構文解析手段
と、構文解析結果からテキスト中の台詞の話者を推定す
る話者分析手段と、テキストから推定された話者を実際
にどの話者データで読み上げるかを決定する話者データ
割り当て手段と、テキストデータと話者データから規則
合成音声波形を生成する音声規則合成手段と、音声波形
を音として出力するD/A変換装置と、全体の制御を行う
制御手段とを有し、テキストの中の話者の異なる内容は
異なる合成音声で読み上げるテキスト読み上げ装置を提
供するものである。
【0007】また、テキスト中の改行、および括弧記号
からテキストの地の文をタイトル、注釈、通常の文に分
類する分類手段と、分類毎に声質、話速、声の高さ、抑
揚パタンを変えて合成音声が合成可能な音声規則合成手
段とを有し、タイトル、注釈、通常の文の分類毎に声
質、話速、声の高さ、抑揚パタンのいずれかもしくは全
てを変えてテキストから合成音声をテキストを読み上げ
る、テキストの構造を発声様式の違いによってわかりや
すく呈示するテキスト読み上げ装置を提供するものであ
る。
【0008】
【作用】テキストデータ入力手段によりテキストデータ
を取り込み、構文解析手段によりテキストを台詞と地の
文にわけ、さらにそれぞれの文の主語と動詞を抽出し、
話者推定手段により、台詞に現われる特定の単語や、台
詞の前後の地の文の主語と動詞情報から、各々の台詞の
話者を識別し、話者データ割り当て手段にでテキストに
現われる話者に対してどのような音声で読み上げるべき
か決定し、音声規則合成手段によりテキストを音声合成
波形に変換し、D/A 変換装置により合成音声を出力す
ることで、テキスト中の話者の異なるテキストを異なる
声質の合成音声で読み上げられ、テキスト中に含まれる
会話構造を理解しやすく呈示できる。
【0009】テキストの地の文をタイトル、注釈、通常
の文に分類する分類手段により、テキストをタイトル、
注釈、通常の文に分類し、声質、話速、声の高さ、抑揚
パタンを変えて合成音声が合成可能な音声規則合成手段
により、文の分類毎に声質、話速、声の高さ、抑揚パタ
ンのいずれかもしくは全てを変えてテキストから合成音
声をテキストを読み上げ、テキストの構造を発声様式の
違いによってわかりやすく呈示できる。
【0010】
【実施例】図1に本発明のハードウエア構成図の一実施
例を示す。本実施例は、各種のプログラムが格納され
た、プログラム格納用ROM(205)、プログラム格納
用ROM(205)に格納されたプログラムを実行するCPU
(201)、各種のデータを格納するメモリ(20
2)、話者の分析に必要なデータベースを格納した不揮
発メモリ(203)、規則合成で用いる話者データを格
納した話者データ格納装置(204)、外部からテキス
トデータを入力するテキストデータ入力装置(20
6)、ユーザからの操作を入力するためのユーザ操作入
力装置(207)、テキストデータから生成した読み上
げ音声を出力するためのD/A変換装置(114)から
構成されている。
【0011】実際の読み上げ処理の全体的な処理フロー
を図2に示す。テキストデータ入力装置(206)から
入力されたテキストデータ(100)は、構文解析処理
(101)によって、改行記号と鍵括弧と括弧を参照し
て、テキストを地の文(181)、台詞(182)、章
題(180)、注釈文(183)に分類し、言語解析を
行い、テキストを単語に分解し品詞情報と文中での主
語、述語といった構文情報が付加される。話者分析処理
(102)では、台詞(182)と地の文(181)の
主語の関係や、台詞(182)の並びなどから台詞の話
者の推定と、話者の属性を推定する。図3に本発明で扱
うテキストの一例を示す。図4に図3のテキストを処理
した結果の一実施例を示す。図2における話者データ割
当処理(103)は話者の属性に合った話者データを選
択し、話者データインデックス(1008)を設定す
る。音声規則合成処理部(104)は図4の話者情報付
きテキスト(191)と話者属性情報(192)を参照
して、話者データ(113)を切り替えながら、テキス
トの各部分を適切な話者で読み上げる。
【0012】つぎに、図二の処理フローの詳細について
説明する。構文解析(101)は、例えば、文節数最小
法による形態素解析を行い、テキストを単語に分割し、
品詞を解析し、格助詞をキーとして格解析を行い、主語
の解析を行う。
【0013】話者分析処理(102)は、台詞の前後の
地の文に現われる発話に関する動詞の主語、台詞中に現
われる一人称代名詞、台詞の文末表現の違い、台詞中に
現われる方言の違いにより台詞の話者を区別し、話者の
特性を発話者の人名や、発話中に現われる特定の単語か
ら年令や性別を推定し、各台詞毎の話者の区別を示す台
詞テーブル(211)と、それぞれの話者の性別、年令
などの特徴を示す話者テーブル(212)が生成され
る。図5は発話に関する動詞を検索する処理で用いられ
る発話動詞動詞データベース(106)の一実施例であ
る。本実施例では発話に関する動詞の終止型や、発話に
関する慣用表現を格納している。図6は人称代名詞デー
タベース(107)の一実施例である。本実施例では、
人称代名詞の表記を納めた単語欄(401)と、人称代
名詞性別が推定される場合の性別を格納する性別属性欄
(402)、人称代名詞が何人称であるかを示す人称属
性欄(403)、人称代名詞から年令層が推定可能な場
合の年令層を格納するための年令属性欄(404)、人
称代名詞から方言属性が推定可能な場合の方言属性を格
納するための方言属性格納欄(107)から成る。図7
は人名属性データベース(108)の一実施例である。
多くの人名において、人名から性別が判断できる。そこ
で、人名属性データベース(108)は、名前を格納す
る単語欄(401)と、人名から推定される性別属性を
格納する性別属性欄(402)から成る。図8は文末表
現属性データベース(109)の一実施例である。文末
表現属性データベース(109)は、特定の方言にのみ
現われる文末表現や、特定の性別の発話者のみが用いる
文末表現、特定の職業や経歴の発話者のみが用いる文末
表現といったような、発話者の識別に有効と考えられる
文末表現が格納される。また、本実施例では、文末表現
によって予測される話者の性別を格納する性別属性欄
(402)と、文末表現によって話者の方言が特定でき
る話者の方言属性を格納する方言属性欄(405)を有
する。図9は方言データベース(110)の一実施例で
ある。方言データベース(110)は特定の方言に現わ
れる単語を格納する単語欄(401)と、単語が有する
方言属性を格納する方言属性欄(405)から成る。図
10は年令属性データベース(111)の一実施例であ
る。本実施例では、特定の年令や年代の話者が使用する
単語を格納する単語欄(401)と、単語から推定され
る年令を格納する年令属性欄(406)から成る。話者
テーブル(212)の一実施例を図11に示す。また、
台詞テーブル(211)の一実施例を図12に示す。ま
た、話者分析処理(102)の詳細を図13に示す。話
者分析処理(102)は、まずテキストの台詞を台詞テ
ーブル(212)に全て登録し(1201)、つぎに登
録された台詞から話者を抽出し話者テーブルに登録する
(1203)。つぎに台詞テーブルに登録された台詞が
話者テーブルに登録されたどの話者の発声によるものか
を、台詞に現われる属性により推定する処理を行い(1
203)、台詞の属性だけでは話者が決定できない台詞
について、隣接した台詞は異なる話者を持つことが多い
ことを利用して、台詞の並びを基にした話者推定を行な
う(1204)。最後に自動的に話者が推定できなかっ
た台詞の話者を手動で設定する(1205)。
【0014】つぎに、話者分析処理の実施例の処理フロ
ーの詳細について説明する。まず台詞テーブル登録処理
(1201)について説明する。台詞テーブル登録処理
(1201)では、図12に示す台詞テーブル(21
1)にテキストに現われる台詞を全て登録する。台詞テ
ーブル登録処理(1201)では、台詞の前後の地の文
(181)に発話者が明示されている場合、話者名(1
002)を台詞テーブルに登録する。本発明では、地の
文の発話動詞の主語を発話者として扱う。発話動詞の判
定は、図5の発話動詞データベースに登録された動詞お
よび慣用表現を発話動詞と判定する。話者を決定可能な
台詞と地の文のパタンとを図15に示す。台詞の前後に
発話動詞を含む地の文が現われるパタンは3種類あり、
台詞の前に地の文が現われるパタン1(1351)、台
詞の後に地の文が現われるパタン2(1352)、地の
文の目的語として台詞が現われるパタン3(1353)
がある。また、図16のように、発話動詞(1362)
を含む台詞が2つの台詞に挟まれている場合、地の文の
前に位置する台詞1(1371)の発話者が台詞テーブ
ル(211)に登録されていない場合は、地の文の主語
(1361)は台詞1(1371)の話者として扱い、
すでに台詞1(1371)の話者が登録されている場合
は、地の文の主語(1361)は台詞2(1372)の
話者として登録される。また、発話動詞を含む地の文に
主語が無い場合、発話動詞を含む地の文よりも前に存在
する地の文の主語を発話動詞の主語とし、話者として扱
う。発話動詞を含む地の文に主語が無い場合の例を図1
7に示す。図17の例では、地の文2(1382)には
発話動詞(1362)に主語がないが、地の文2の前の
地の文1に「美和子」という主語(1361)がある。
したがって、地の文2(1382)の主語は、「美和
子」になる。この台詞テーブル登録処理の処理手順を図
14を用いて説明する。まず、内部変数の「話者変数」
および「主語変数」をクリアする(1301)。1文づ
つ読み込み、その文が台詞か否かを判定する(130
2)台詞の場合、台詞属性登録処理(1308)を呼び
出し、台詞の属性をテーブルに登録する。つぎに「話者
変数」に値が設定されているか否かをチェックし、この
値が設定されている場合は、台詞テーブル(211)の
話者欄(1002)に「話者変数」の値を設定し、「話
者変数」をクリアする(1312)。この処理は、図1
5のパタン1(1351)の登録に相当する。また、1
302で読み込んだ文が台詞でなく、地の文であった場
合、文の主語を取り出し(1303)、主語が存在した
場合は「主語変数」に値を代入する。つぎに発話動詞が
文に含まれているかチェックし(1306)、含まれて
いた場合は、まず図15のパタン3(1353)である
か検査する処理として、文中に台詞を含むか検査する
(1307)。含む場合、台詞属性登録処理(130
8)を呼び出し、台詞の属性を登録し、「主語変数」の
値を処理中の台詞の話者(1002)として設定する。
文中に台詞を含まない場合は、図15のパタン2(13
52)であるかを検査する処理として、文の直前に話者
が未定の台詞があるかを検査し(1310)、直前の台
詞の話者(1002)として、「主語変数」を設定す
る。文の直前に話者が未定の台詞が無い場合は、図15
のパタン1(1351)である可能性があるので、「話
者変数」に「主語変数」の値を設定する。最後に文を全
て処理したかをチェックし(1314)、まだ処理すべ
き文が残っている場合は、1302に戻る。
【0015】ところで、全ての台詞について、図15に
示したように明示的に書かれているわけではない。そこ
で、台詞に現われる特徴を抽出し、明示的に台詞の話者
が書かれていない台詞と明示的に話者が書かれている台
詞と特徴のマッチングを計算し、特徴が一致した台詞は
同一の話者が発声したとみなすことで、明示的に話者が
書かれていない台詞の話者を推定する。本発明の一実施
例では、台詞の特徴として、台詞中に現われる特定の単
語や、特定の単語から推定される属性情報を特徴として
用いる。具体的には、一人称表現(1003)、方言属
性(1004)、性別属性(1005)、文末表現(1
006)、年令属性(1007)を用いている。実際の
話者属性登録処理の一実施例を図18に示す。まず、一
人称欄(1003)を設定する(1401)。一人称表
現(1003)は、人称代名詞データベース(107)
を用いて台詞中から検索する。人称代名詞データベース
(107)の一実施例を図8に示す。人称代名詞データ
ベースの人称(403)が1である単語(401)を台
詞テキスト中から検索し、見つかった場合に登録する。
つぎに文末表現属性欄(1006)の設定を行う(14
02)。文末表現(1006)は、図8の文末表現デー
タベースに登録された単語(401)が台詞テキスト中
に現われるかを検索し、見つかった場合に登録する。つ
ぎに方言欄(1004)の設定を行う(1403)。方
言属性は、人称代名詞データベース(107)、図8の
文末表現データベース(109)、図9の方言データベ
ース(110)に登録されている単語(401)を台詞
中から検索し、単語が見つかった場合は、単語に対応し
た方言属性(109)を取り出し、台詞テーブル(21
1)の方言属性の欄(1004)に登録する。図19に
示すように、台詞と台詞の間に地の文が入らずに、台詞
が連続する場合がある。ほとんどの場合、地の文を鋏ま
ずに台詞が連続する場合、連続して現われる2つの台詞
の話者は異なる。本発明では、この特徴を話者の推定に
利用する。そこで、台詞を台詞テーブルに登録する際
に、直前の文が台詞であるか地の文であるかの情報を台
詞接続フラグ(1102)として記録する。まず、現在
の台詞の直前の文が台詞か否かを判定し(1404)、
台詞だった場合、台詞接続フラグ(1102)に1を設
定し(1406)、直前の文が台詞でなかった場合に、
台詞接続フラグ(1102)に0を設定する(140
5)。つぎに性別欄(1005)の設定を行う(140
7)。性別属性は、話者名欄(1002)に話者名が登
録されている場合は、図7の人名属性データベース(1
09)、図6の人称代名詞データベース(107)を話
者名により検索し、性別属性(402)を取り出して登
録する。つぎに年令欄(1007)の設定を行う(14
08)。年令属性(1007)は、図6の人称代名詞デ
ータベース(107)、図10の年令識別語データベー
ス(111)に登録された単語(401)が台詞テキス
ト中に現われるかを検索し、これらのデータベース中に
台詞に現われる単語が存在し、かつ年令属性(406)
が存在する場合に年令属性をデータベースより取り出し
て登録する。
【0016】つぎに、話者テーブルの登録処理(120
2)の実施例の詳細について、図20を用いて説明す
る。話者テーブルの登録処理の概要は、台詞テーブル中
で話者名(1002)が同一の人名、もしくは一人称の
人称代名詞の話者は同一の話者と見做し、話者のリスト
を話者テーブル(212)に生成する。まず、台詞テー
ブルの話者名欄(1002)に人名もしくは一人称代名
詞が設定されているか検査し(1501)、人名もしく
は一人称代名詞が登録されている場合は、該当する話者
が話者テーブルに登録されているか検査し(150
2)、すでに当該話者が登録されている場合は、台詞テ
ーブルの話者属性には値が設定されているが、話者テー
ブルの話者属性には値が設定されていない属性があるか
検査し、台詞テーブルの話者属性には値が設定されてい
るが、話者テーブルの話者属性には値が設定されていな
い属性がある場合は台詞テーブルの属性値を話者テーブ
ルの属性値に代入する。1502の検査で該当する話者
が話者テーブルに登録されていなかった場合は、話者テ
ーブルに話者を登録する。そして、処理の最後に台詞テ
ーブルを全て処理したかを検査し(1505)まだ処理
していない台詞が残っていた場合は、1501から処理
を繰り返す。
【0017】つぎに、台詞の属性を基にした話者推定処
理(1203)の詳細について図21を用いて説明す
る。台詞の属性を基にした話者推定処理(1203)で
は、図12に示される台詞テーブル(211)の台詞イ
ンデックス(1101)順に台詞の話者を推定し、推定
された話者は話者テーブル(212)の話者インデクス
(1001)の値で表わし、台詞テーブル(211)の
話者インデックス欄(1103)に設定される。具体的
な処理の実施例を以下に説明する。まず、台詞テーブル
(212)の話者名欄(1002)に話者名が設定され
ており、かつ話者テーブルにその話者名が登録されてい
るか検査し(1601)、登録されていた場合は話者テ
ーブル(212)の該当する話者の話者インデックス番
号(1001)を台詞テーブル(211)の話者インデ
ックス欄(1103)に設定する。台詞テーブルの話者
名欄(1002)に話者名が設定されていない場合は、
一人称(1103)、方言(1004)、性別(100
5)の属性が一致する話者を話者テーブル(212)か
ら検索する(1602)。ここで、属性の一致の検査
は、一人称(1103)、方言(1004)、性別(1
005)属性のうち、話者テーブル(212)、台詞テ
ーブル(212)の両方に値が設定されている属性のみ
を対象とする。台詞の属性と一致した属性をもつ話者候
補の数が1名であるか検査し(1604)1名のみで合
った場合は、当該話者候補の話者インデックス(100
1)を、台詞の話者インデックス欄(1103)に設定
する。つぎに全ての台詞について処理が完了したかを検
査し(1606)、処理すべき台詞が台詞テーブル(2
12)に残っている場合は、1601からの処理を繰り
返す。
【0018】つぎに、台詞の並びを基にした話者推定処
理(1204)の概要と処理フローの詳細について説明
する。まず、図23を用いて処理の概要を説明する。台
詞が他の台詞と隣接する場合、2つの台詞の話者は異な
る。従って、図23に示すように、現在処理中の台詞
(1754)に隣接する台詞が存在する場合、隣接する
台詞の話者が設定されている場合は現在処理中の台詞の
話者候補から隣接する台詞の話者を除いて、話者候補を
絞り込むことができる。図23の例では、前に隣接する
台詞(1753)および後に隣接する台詞(1755)
の話者を処理中の台詞(1754)の話者候補から取り
除く。話者候補が1人に絞り込めたばあい、その一名の
話者候補を処理中の台詞の話者として登録する。ここ
で、台詞の前の地の文(1752)を、処理中の台詞
(1755)よりも前に存在する最も近い地の文から、
連続して続く一連の地の文と定義する(図23参照)。
また、台詞の後の地の文(1756)を、処理中の台詞
(1755)よりも後に存在する最も近い地の文から連
続して続く一連の地の文(1756)と定義する(図2
3参照)。話者候補が1人に絞り込めない場合、台詞の
前の地の文(1752)と台詞の後の地の文(175
6)に台詞の話者が主語として登場することを利用し
て、話者候補の絞り込みを行う。台詞の台詞の前の地の
文(1752)と台詞の後の地の文(1756)の主語
以外の話者候補を取り除く。話者候補が1人まで絞り込
めたばあい、絞りこんで残った1名の話者を処理中の台
詞の話者として登録する。つぎに、図22を用いて台詞
の並びを基にした話者推定処理(1204)の処理フロ
ーの詳細について説明する。まず最初に処理する台詞の
インデックス番号を格納するための変数iを1に初期化
する(1701)。そしてインデックス番号iの台詞の
一人称表現、方言属性、性別属性の一致する話者候補を
話者テーブル(211)より検索する。台詞テーブルの
接続フラグ(1102)を参照し、1つ前の台詞と隣接
しているか検査し(1703)、隣接している場合は前
の台詞に話者が設定されていた場合は話者候補から前に
隣接台詞の話者を取り除く(1704)。同様に台詞テ
ーブルの接続フラグ(1102)を参照し、1つ後の台
詞と隣接しているか検査し(1705)、隣接している
場合は前の台詞に話者が設定されていた場合は話者候補
から前に隣接台詞の話者を取り除く(1706)。話者
候補数が1名であるか検査し(1707)、話者候補数
が1名の場合は話者候補に対応した話者インデックスを
台詞テーブル(212)の話者インデックス欄(110
3)に登録する(1710)。話者候補数が1名でない
場合は、さらに台詞の前後の地の文(1752、175
6)の主語に含まれていない話者候補を除き(170
8)、話者候補者数が1名であるか検査する(170
9)。話者候補者数が話者候補に対応した話者インデッ
クスを台詞テーブル(212)の話者インデックス欄
(1103)に登録する(1710)。そして処理中の
話者インデックス番号を1増やし(1711)、全ての
台詞を処理したかチェックし(1712)、全ての台詞
を処理し終わっていない場合は1702からの処理を繰
り返す。全ての台詞を処理した後に、新たに話者インデ
ックスが設定された台詞があるか検査する(171
3)。新たに話者が設定された台詞がある場合、新たに
話者が設定された台詞に隣接する台詞の話者候補が1人
減らすことが出きるので、台詞に話者を設定できる可能
性が出てくる。そこで、新たに話者インデックスが設定
された台詞があるばあいは、1701からの処理を繰り
返す。
【0019】次にマニュアルによる台詞の話者指定処理
(1205)の処理フローの詳細を図24を用いて説明
する。まず最初に処理する台詞のインデックス番号を格
納するための変数iを1に初期化する(1801)。つ
ぎにi番目の台詞の話者インデックス欄(1103)に
話者が設定されているか検査し(1802)、設定され
ていない場合は台詞付近のテキストと話者の一覧を表示
し(1803)、ユーザに台詞に対応した話者を選択さ
せ、台詞の話者を決定し台詞テーブル(212)の話者
インデックス欄(1103)に登録する(1803)。
そして処理中の話者インデックス番号を1増やし(17
11)、全ての台詞を処理したかチェックし(171
2)、全ての台詞を処理し終わっていない場合は170
2からの処理を繰り返す。
【0020】つぎに、話者データ割当処理(103)に
ついて、図25を用いて説明する。話者データ割り当て
処理では、テキストから抽出された各々の話者の合成音
を生成する際に、どの話者データを用いて合成音を生成
するかを決定する。図25は、話者データ属性(11
2)の内容の一実施例である。話者データ属性(11
2)には、音声規則合成(104)用に用意された話者
データ(113)中のそれぞれの話者の方言属性(10
04)、性別属性(1105)、年令属性(1107)
が格納されている。話者テーブルの各話者の属性と話者
データ属性(112)とのマッチングをとり、最も属性
が近く、かつ既に他の話者に割り当てられていない話者
データの話者データインデックス(1008)を話者テ
ーブル(211)の話者データインデックス欄(100
8)に設定する。
【0021】音声規則合成処理(104)では、台詞テ
ーブルと(211)、話者テーブル(212)、話者デ
ータ(113)、テキストを入力とし、音声波形を生成
する。台詞のテキストの読み上げを行う際は、台詞テー
ブル(211)の読み上げる台詞に対応した話者インデ
ックス(1103)を取得する。つぎに、得られた話者
インデックス番号を用いて話者テーブル(212)を参
照し、話者インデックス(1001)に対応した話者デ
ータインデックス番号(1008)を取りだす。台詞を
読み上げる際に用いるべき話者データを決定する。決定
した話者データを話者データ格納手段(113)から取
りだし、音声波形を生成する。生成された音声波形は、
D/A装置(114)によって音声に変換される。
【0022】
【発明の効果】本発明によれば、付加情報が付与されて
いないテキストに対して、テキスト中に現われる台詞部
分の話者を推定し、話者毎に異なる声質で読み上げるテ
キスト読み上げ装置を提供でき、テキストの理解を助け
る。また本発明によれば、テキストの文字属性ごとに異
なる音質の音声で読み上げることによって、文字属性の
音声による理解を助ける。
【図面の簡単な説明】
【図1】本発明のハードウエア構成の一実施例である。
【図2】本発明の処理フローの一実施例である。
【図3】本発明の入力テキストの一例である。
【図4】本発明の話者分析処理の分析結果の一例であ
る。
【図5】本発明の発話動詞データベースの一実施例であ
る。
【図6】本発明の人称代名詞データベースの一実施例で
ある。
【図7】本発明の人名属性データベースの一実施例であ
る。
【図8】本発明の文末表現属性データベースの一実施例
である。
【図9】本発明の方言データベースの一実施例である。
【図10】本発明の年令識別語データベースの一実施例
である。
【図11】本発明の話者テーブルの一実施例である。
【図12】本発明の台詞テーブルの一実施例である。
【図13】本発明の話者分析処理の処理フローの一実施
例である。
【図14】本発明の台詞テーブル設定処理の処理フロー
の一実施例である。
【図15】本発明の話者推定方式の説明図である。
【図16】本発明の話者の推定方式の説明図である。
【図17】本発明の主語の推定方式の説明図である。
【図18】本発明の台詞属性登録処理の処理フローの一
実施例である。
【図19】本発明の話者推定方式の説明図である。
【図20】本発明の話者テーブル登録処理の処理フロー
の一実施例である。
【図21】本発明の台詞の属性を基にした話者推定処理
の処理フローの一実施例である。
【図22】本発明の台詞の並びを基にした話者推定処理
の処理フローの一実施例である。
【図23】本発明の台詞の並びを基にした話者推定処理
の処理フローの一実施例である。
【図24】本発明のマニュアルによる台詞の話者指定処
理の処理フローの一実施例である。
【図25】本発明の話者データ属性の一実施例である。
【符号の説明】
100…テキストデータ、101…形態素解析処理、1
02…話者分析処理、103…話者データ割当処理、1
04…音声規則合成処理、106…発話動詞DB、107
…人称代名詞DB、108…人名属性DB、109…文末表
現属性DB、110…方言DB、年令識別語DB、112…話
者データ属性、113…話者データ、114…D/A装
置、120…制御プログラム、180…章題、181…
地の文、182…台詞、183…注釈文、191…話者
情報付きテキスト、192…話者属性情報、193…話
者属性、201…CPU、202…メモリ、203…不揮
発メモリ、204…話者データ格納装置、205…プロ
グラム格納用ROM、206…テキストデータ入力装置、
207…ユーザ操作入力装置、211…台詞テーブル、
212…話者テーブル、213…ワークエリア、401
…単語見だし、402…性別属性、403…人称、40
4…年令属性、405…方言属性、406…年令属性、
1001…話者インデックス番号、1002…話者名
欄、1003…一人称表現欄、1004…方言欄、10
05…性別欄、1006…文末表現欄、1007…年令
欄、1008…話者データインデックス、1101…台
詞インデックス番号、1102…台詞接続フラグ、11
03…話者インデックス番号、1201…台詞テーブル
登録処理、1202…話者テーブル登録処理、1203
…台詞の属性を基にした話者推定処理、1204…台詞
の並びを基にした話者推定処理、1205…マニュアル
による台詞の話者指定処理、1301…変数初期化処
理、1302…台詞部分検出処理、1303…主語抽出
処理、1304…主語抽出結果判定処理、1305…検
出主語保存処理、1306…発話動詞チェック処理、1
307…文中台詞検出処理、1308…台詞属性登録処
理、1309…台詞テーブル話者欄設定処理、1310
…台詞検出処理、1311…話者変数設定処理、131
2…話者変数設定チェック、1313…台詞テーブル話
者欄設定処理、1314…処理終了チェック、1351
…パターン1の例、1352…パターン2の例、135
3…パターン3の例、1454…パターン4の例、13
71…台詞1、1372…台詞2、1401…台詞テー
ブル一人称欄設定処理、1402…台詞テーブル文末表
現欄設定処理、1403…台詞テーブル方言欄設定処
理、1404…台詞連続出現チェック処理、1405…
台詞テーブル台詞接続フラグ欄設定処理1、1406…
台詞テーブル台詞接続フラグ欄設定処理2、1407…
台詞テーブル台詞性別欄設定処理、1408…台詞テー
ブル年令欄設定処理、1501…有効話者名設定チェッ
ク処理、1502…話者テーブル既登録チェック処理、
1503…話者テーブル空欄設定処理、1504…話者
テーブルへの話者設定処理、1505…話者登録処理完
了チェック処理、1601…台詞に対応付けられた話者
名により話者テーブルを検索する処理、1602…台詞
に対応付けられた特性のマッチングによる話者テーブル
の検索処理、1603…台詞に対する話者インデックス
番号の設定処理、1604…話者候補の絞り込みチェッ
ク処理、1605…台詞に対する話者インデックス番号
の設定処理、1606…全ての台詞が処理されたかをチ
ェックする処理、1701…処理対象の台詞インデック
ス番号の初期化処理、1702…話者候補の検索処理、
1703…話者インデックスが設定された台詞が現在の
台詞の前に隣接しているかをチェックする処理、170
4…隣接する台詞の話者を現在の台詞の話者候補から除
く処理、1705…話者インデックスが設定された台詞
が現在の台詞の後に隣接しているかをチェックする処
理、1706…隣接する台詞の話者を現在の台詞の話者
候補から除く処理、1707…話者候補数のチェック処
理、1708…台詞の前後の地の文の主語以外の話者候
補を除く処理、1709…話者項補数のチェック処理、
1710…話者インデックスを台詞テーブルに登録する
処理、1711…処理対象となる台詞のインデックス番
号の更新処理、1712…処理終了チェック処理、17
13…話者インデックスの設定が変化したかをチェック
する処理、1751…台詞1、1752…台詞の前の地
の文、1753…前に隣接する台詞、1754…処理中
の台詞、1755…後に隣接する台詞、1756…台詞
の後の地の文、1757…台詞2、1801…処理対象
の台詞インデックス番号の初期化処理、1802…処理
対処の台詞に話者インデックスが設定されているかチェ
ックする処理、1803…マニュアルで話者を選択する
為の台詞付近のテキスト表示および話者候補の表示処
理、1804…ユーザからの話者指定の入力を受け付け
る処理、1805…処理終了チェック処理。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 在塚 俊之 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】テキスト読み上げ装置に於いて、複数の話
    者データ格納手段と、テキスト中の話者を推定する話者
    推定手段と、推定された話者情報に従って話者を切り替
    えながら規則合成音声を生成出力する規則音声合成手段
    とを有し、テキストを複数の話者合成音で読み分けるこ
    とにより、会話などのテキストが有する構造を理解しや
    すく呈示することを特徴としたテキスト読み上げ装置。
  2. 【請求項2】テキスト中の台詞記号により、テキストの
    台詞と地の文を分離し、さらに台詞中に現われる人称代
    名詞、台詞の語尾表現、台詞に現われる方言、台詞の前
    後の文の主語と発話に関する動詞情報のうちの1つ以上
    の情報から、テキストの各部分の話者を推定する話者推
    定方法。
  3. 【請求項3】請求項1のテキスト読み上げ装置におい
    て、テキスト中に現われる改行や記号により、テキスト
    をタイトル、注釈、通常の文に分類する分類手段と、分
    類毎に異なる者を用いるか、発声速度、声の高さ、抑揚
    パタンなどの発声様式を変える、もしくは話者と発声様
    式の両方を変えることにより、異なる声質でテキストを
    読み上げられる音声規則合成手段とを有し、タイトル、
    テキストの有する構造を理解しやすく呈示することを特
    徴としたテキスト読み上げ装置。
JP7049436A 1995-03-09 1995-03-09 テキスト朗読読み上げ装置 Pending JPH08248971A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7049436A JPH08248971A (ja) 1995-03-09 1995-03-09 テキスト朗読読み上げ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7049436A JPH08248971A (ja) 1995-03-09 1995-03-09 テキスト朗読読み上げ装置

Publications (1)

Publication Number Publication Date
JPH08248971A true JPH08248971A (ja) 1996-09-27

Family

ID=12831064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7049436A Pending JPH08248971A (ja) 1995-03-09 1995-03-09 テキスト朗読読み上げ装置

Country Status (1)

Country Link
JP (1) JPH08248971A (ja)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001343991A (ja) * 2000-05-31 2001-12-14 Sharp Corp 音声合成処理装置
JP2006011036A (ja) * 2004-06-25 2006-01-12 Brother Ind Ltd 音声出力装置及び音声出力プログラム
JP2006243156A (ja) * 2005-03-01 2006-09-14 Fuji Xerox Co Ltd 情報処理装置および方法並びにプログラム
JP2006293026A (ja) * 2005-04-11 2006-10-26 Oki Electric Ind Co Ltd 音声合成装置,音声合成方法およびコンピュータプログラム
JP2008091972A (ja) * 2006-09-29 2008-04-17 Daiichikosho Co Ltd 静止画像対応録音ナレーション自動出力システム
WO2009050809A1 (ja) * 2007-10-18 2009-04-23 Pioneer Corporation 音声出力装置、音声出力方法、音声出力プログラム及び記憶媒体
JP2013025112A (ja) * 2011-07-21 2013-02-04 Sharp Corp 電子機器、再生方法、プログラム、及び、記録媒体
JP2013239004A (ja) * 2012-05-15 2013-11-28 Sony Corp 情報処理装置、情報処理方法、コンピュータプログラムおよび画像表示装置
JP2015215626A (ja) * 2015-07-03 2015-12-03 株式会社東芝 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム
JP2016027415A (ja) * 2015-09-15 2016-02-18 株式会社東芝 文書読み上げ支援装置、方法及びプログラム
US9280967B2 (en) 2011-03-18 2016-03-08 Kabushiki Kaisha Toshiba Apparatus and method for estimating utterance style of each sentence in documents, and non-transitory computer readable medium thereof
CN106384586A (zh) * 2016-09-07 2017-02-08 北京小米移动软件有限公司 朗读文本信息的方法及装置
WO2017149866A1 (ja) * 2016-02-29 2017-09-08 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP2020027132A (ja) * 2018-08-09 2020-02-20 富士ゼロックス株式会社 情報処理装置およびプログラム
CN111158630A (zh) * 2019-12-25 2020-05-15 网易(杭州)网络有限公司 一种播放控制方法及装置
JP2020201435A (ja) * 2019-06-12 2020-12-17 株式会社ポニーキャニオン 情報処理端末及び情報処理方法
JP2021006896A (ja) * 2019-06-27 2021-01-21 ネイバー コーポレーションNAVER Corporation スマートリーディング機器およびその制御方法
JP2021144221A (ja) * 2020-08-05 2021-09-24 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 音声を処理するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
JP2021152957A (ja) * 2020-10-14 2021-09-30 北京百度網訊科技有限公司 対話感情スタイル予測方法、装置、電子機器、記憶媒体及びプログラム
JP2021170394A (ja) * 2020-10-14 2021-10-28 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 役割のラベル付け方法、役割のラベル付け装置、電子機器及び記憶媒体
WO2024122284A1 (ja) * 2022-12-05 2024-06-13 ソニーグループ株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001343991A (ja) * 2000-05-31 2001-12-14 Sharp Corp 音声合成処理装置
JP2006011036A (ja) * 2004-06-25 2006-01-12 Brother Ind Ltd 音声出力装置及び音声出力プログラム
JP2006243156A (ja) * 2005-03-01 2006-09-14 Fuji Xerox Co Ltd 情報処理装置および方法並びにプログラム
JP2006293026A (ja) * 2005-04-11 2006-10-26 Oki Electric Ind Co Ltd 音声合成装置,音声合成方法およびコンピュータプログラム
JP2008091972A (ja) * 2006-09-29 2008-04-17 Daiichikosho Co Ltd 静止画像対応録音ナレーション自動出力システム
WO2009050809A1 (ja) * 2007-10-18 2009-04-23 Pioneer Corporation 音声出力装置、音声出力方法、音声出力プログラム及び記憶媒体
JPWO2009050809A1 (ja) * 2007-10-18 2011-02-24 パイオニア株式会社 音声出力装置、音声出力方法、音声出力プログラム及び記憶媒体
US9280967B2 (en) 2011-03-18 2016-03-08 Kabushiki Kaisha Toshiba Apparatus and method for estimating utterance style of each sentence in documents, and non-transitory computer readable medium thereof
JP2013025112A (ja) * 2011-07-21 2013-02-04 Sharp Corp 電子機器、再生方法、プログラム、及び、記録媒体
JP2013239004A (ja) * 2012-05-15 2013-11-28 Sony Corp 情報処理装置、情報処理方法、コンピュータプログラムおよび画像表示装置
CN103425724A (zh) * 2012-05-15 2013-12-04 索尼公司 信息处理设备和方法、计算机程序以及图像显示设备
CN103425724B (zh) * 2012-05-15 2017-09-05 索尼公司 信息处理设备和方法以及图像显示设备
JP2015215626A (ja) * 2015-07-03 2015-12-03 株式会社東芝 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム
JP2016027415A (ja) * 2015-09-15 2016-02-18 株式会社東芝 文書読み上げ支援装置、方法及びプログラム
WO2017149866A1 (ja) * 2016-02-29 2017-09-08 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
CN106384586A (zh) * 2016-09-07 2017-02-08 北京小米移动软件有限公司 朗读文本信息的方法及装置
JP2020027132A (ja) * 2018-08-09 2020-02-20 富士ゼロックス株式会社 情報処理装置およびプログラム
JP2020201435A (ja) * 2019-06-12 2020-12-17 株式会社ポニーキャニオン 情報処理端末及び情報処理方法
JP2021006896A (ja) * 2019-06-27 2021-01-21 ネイバー コーポレーションNAVER Corporation スマートリーディング機器およびその制御方法
CN111158630A (zh) * 2019-12-25 2020-05-15 网易(杭州)网络有限公司 一种播放控制方法及装置
CN111158630B (zh) * 2019-12-25 2023-06-23 网易(杭州)网络有限公司 一种播放控制方法及装置
JP2021144221A (ja) * 2020-08-05 2021-09-24 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 音声を処理するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
JP2021152957A (ja) * 2020-10-14 2021-09-30 北京百度網訊科技有限公司 対話感情スタイル予測方法、装置、電子機器、記憶媒体及びプログラム
JP2021170394A (ja) * 2020-10-14 2021-10-28 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 役割のラベル付け方法、役割のラベル付け装置、電子機器及び記憶媒体
US11907671B2 (en) 2020-10-14 2024-02-20 Beijing Baidu Netcom Science Technology Co., Ltd. Role labeling method, electronic device and storage medium
WO2024122284A1 (ja) * 2022-12-05 2024-06-13 ソニーグループ株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Similar Documents

Publication Publication Date Title
JPH08248971A (ja) テキスト朗読読み上げ装置
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US6999932B1 (en) Language independent voice-based search system
JP4485694B2 (ja) 並列する認識エンジン
US8954333B2 (en) Apparatus, method, and computer program product for processing input speech
US20050165602A1 (en) System and method for accented modification of a language model
JP2001188777A (ja) 音声をテキストに関連付ける方法、音声をテキストに関連付けるコンピュータ、コンピュータで文書を生成し読み上げる方法、文書を生成し読み上げるコンピュータ、コンピュータでテキスト文書の音声再生を行う方法、テキスト文書の音声再生を行うコンピュータ、及び、文書内のテキストを編集し評価する方法
WO2007010680A1 (ja) 声質変化箇所特定装置
JP2007512608A (ja) テキストフォーマッティング及びスピーチ認識のためのトピック特有のモデル
CN117976001A (zh) 一种有声书质检方法、系统、电子设备及存储介质
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JP5611270B2 (ja) 単語分割装置、及び単語分割方法
JPH10274996A (ja) 音声認識装置
Tjalve et al. Pronunciation variation modelling using accent features
JP4220151B2 (ja) 音声対話装置
JPH0962286A (ja) 音声合成装置および音声合成方法
JP3378547B2 (ja) 音声認識方法及び装置
JP3029403B2 (ja) 文章データ音声変換システム
JP2022144261A (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JPH11338863A (ja) 未知名詞および表記ゆれカタカナ語自動収集・認定装置、ならびにそのための処理手順を記録した記録媒体
CN120996038B (zh) 适用于呼叫中心人工坐席的智能辅助方法及系统
JP3939264B2 (ja) 形態素解析装置
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JPH0773200A (ja) キーワード抽出方法
KR100959494B1 (ko) 미등록어 합성 기능을 이용한 음성합성기 및 그 방법