JPH08248971A

JPH08248971A - テキスト朗読読み上げ装置

Info

Publication number: JPH08248971A
Application number: JP7049436A
Authority: JP
Inventors: Takashi Endo; 隆遠藤; Shunichi Yajima; 俊一矢島; Nobuo Nukaga; 信尾額賀; Toshiyuki Aritsuka; 俊之在塚
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1995-03-09
Filing date: 1995-03-09
Publication date: 1996-09-27

Abstract

(57)【要約】（修正有）【目的】付加情報がないテキスト中に現われる台詞部
分の話者を推定し、話者毎に異なる声質で読み上げるテ
キスト読み上げ装置。【構成】テキストデータ入力装置２０６からテキスト
が入力され、プログラム格納用ROM２０５に格納された
構文解析プログラム１０１、話者分析プログラム１０
２、話者データ割当プログラム１０３が制御プログラム
１２０の制御の下、CPU２０１で実行され、不揮発メモ
リ２０３の記憶データベースを参照し、メモリ２０２中
の台詞テーブル２１１、話者テーブル２１２に各台詞が
どの話者に対応し、各話者に対し話者データ格納装置２
０４の格納話者データ１１３のどの話者を用いるべきか
が設定され、音声規則合成プログラム１０４は台詞テー
ブル２１１と話者テーブル２１２を参照し、テキストに
対し、適切な話者データを選択肢ながら合成音声を生成
し、Ｄ／Ａ装置１４４から合成音声が出力される。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、テキスト情報を読み上
げるテキスト読み上げ装置に係り、特に小説などの台詞
を含むテキストや、レイアウトを持つテキスト構造を、
音質を変えて読み上げるテキスト読み上げ装置に関す
る。

【０００２】

【従来の技術】近年、ワードプロセッサや電子出版の普
及により、電子化されたテキストが普及している。これ
らのテキストへのアクセス手段の一つとして、テキスト
から音声波形を生成して出力する読み上げ装置が提案さ
れている。

【０００３】従来提案されている読み上げ装置では、引
用文部分をテキスト中の記号より識別し、引用文部分に
対してはその他の部分とは性質を変化させて引用文を識
別可能にする例（特開平５−２８９６８７号）や、テキ
スト中に発声制御コードを埋め込んでおき、その制御コ
ードに従って規則音声合成を行う例（特開平５−３０７
３９６）がある。

【０００４】

【発明が解決しようとする課題】従来の文章読み上げ装
置を用いた場合、小説などの台詞を含むテキストの台詞
の部分の声質を台詞の話者毎に変えて適切に読み上げる
ことは、まったく不可能であるか、テキスト中に付加情
報を予め埋め込んでおく必要があった。

【０００５】本発明の目的は、テキスト中に現われる台
詞部分の話者を推定し、話者毎に異なる声質で読み上げ
るテキスト読み上げ装置を提供することにある。

【０００６】

【課題を解決するための手段】本発明は、テキストデー
タを読み込むテキストデータ入力装置と、テキスト中に
現われる記号によりテキストを台詞と地の文に分離し、
テキスト中の文の主語及び動詞を検出する構文解析手段
と、構文解析結果からテキスト中の台詞の話者を推定す
る話者分析手段と、テキストから推定された話者を実際
にどの話者データで読み上げるかを決定する話者データ
割り当て手段と、テキストデータと話者データから規則
合成音声波形を生成する音声規則合成手段と、音声波形
を音として出力するD／A変換装置と、全体の制御を行う
制御手段とを有し、テキストの中の話者の異なる内容は
異なる合成音声で読み上げるテキスト読み上げ装置を提
供するものである。

【０００７】また、テキスト中の改行、および括弧記号
からテキストの地の文をタイトル、注釈、通常の文に分
類する分類手段と、分類毎に声質、話速、声の高さ、抑
揚パタンを変えて合成音声が合成可能な音声規則合成手
段とを有し、タイトル、注釈、通常の文の分類毎に声
質、話速、声の高さ、抑揚パタンのいずれかもしくは全
てを変えてテキストから合成音声をテキストを読み上げ
る、テキストの構造を発声様式の違いによってわかりや
すく呈示するテキスト読み上げ装置を提供するものであ
る。

【０００８】

【作用】テキストデータ入力手段によりテキストデータ
を取り込み、構文解析手段によりテキストを台詞と地の
文にわけ、さらにそれぞれの文の主語と動詞を抽出し、
話者推定手段により、台詞に現われる特定の単語や、台
詞の前後の地の文の主語と動詞情報から、各々の台詞の
話者を識別し、話者データ割り当て手段にでテキストに
現われる話者に対してどのような音声で読み上げるべき
か決定し、音声規則合成手段によりテキストを音声合成
波形に変換し、D／A 変換装置により合成音声を出力す
ることで、テキスト中の話者の異なるテキストを異なる
声質の合成音声で読み上げられ、テキスト中に含まれる
会話構造を理解しやすく呈示できる。

【０００９】テキストの地の文をタイトル、注釈、通常
の文に分類する分類手段により、テキストをタイトル、
注釈、通常の文に分類し、声質、話速、声の高さ、抑揚
パタンを変えて合成音声が合成可能な音声規則合成手段
により、文の分類毎に声質、話速、声の高さ、抑揚パタ
ンのいずれかもしくは全てを変えてテキストから合成音
声をテキストを読み上げ、テキストの構造を発声様式の
違いによってわかりやすく呈示できる。

【００１０】

【実施例】図１に本発明のハードウエア構成図の一実施
例を示す。本実施例は、各種のプログラムが格納され
た、プログラム格納用ROM（２０５）、プログラム格納
用ROM（２０５）に格納されたプログラムを実行するCPU
（２０１）、各種のデータを格納するメモリ（２０
２）、話者の分析に必要なデータベースを格納した不揮
発メモリ（２０３）、規則合成で用いる話者データを格
納した話者データ格納装置（２０４）、外部からテキス
トデータを入力するテキストデータ入力装置（２０
６）、ユーザからの操作を入力するためのユーザ操作入
力装置（２０７）、テキストデータから生成した読み上
げ音声を出力するためのＤ／Ａ変換装置（１１４）から
構成されている。

【００１１】実際の読み上げ処理の全体的な処理フロー
を図２に示す。テキストデータ入力装置（２０６）から
入力されたテキストデータ（１００）は、構文解析処理
（１０１）によって、改行記号と鍵括弧と括弧を参照し
て、テキストを地の文（１８１）、台詞（１８２）、章
題（１８０）、注釈文（１８３）に分類し、言語解析を
行い、テキストを単語に分解し品詞情報と文中での主
語、述語といった構文情報が付加される。話者分析処理
（１０２）では、台詞（１８２）と地の文（１８１）の
主語の関係や、台詞（１８２）の並びなどから台詞の話
者の推定と、話者の属性を推定する。図３に本発明で扱
うテキストの一例を示す。図４に図３のテキストを処理
した結果の一実施例を示す。図２における話者データ割
当処理（１０３）は話者の属性に合った話者データを選
択し、話者データインデックス（１００８）を設定す
る。音声規則合成処理部（１０４）は図４の話者情報付
きテキスト（１９１）と話者属性情報（１９２）を参照
して、話者データ（１１３）を切り替えながら、テキス
トの各部分を適切な話者で読み上げる。

【００１２】つぎに、図二の処理フローの詳細について
説明する。構文解析（１０１）は、例えば、文節数最小
法による形態素解析を行い、テキストを単語に分割し、
品詞を解析し、格助詞をキーとして格解析を行い、主語
の解析を行う。

【００１３】話者分析処理（１０２）は、台詞の前後の
地の文に現われる発話に関する動詞の主語、台詞中に現
われる一人称代名詞、台詞の文末表現の違い、台詞中に
現われる方言の違いにより台詞の話者を区別し、話者の
特性を発話者の人名や、発話中に現われる特定の単語か
ら年令や性別を推定し、各台詞毎の話者の区別を示す台
詞テーブル（２１１）と、それぞれの話者の性別、年令
などの特徴を示す話者テーブル（２１２）が生成され
る。図５は発話に関する動詞を検索する処理で用いられ
る発話動詞動詞データベース（１０６）の一実施例であ
る。本実施例では発話に関する動詞の終止型や、発話に
関する慣用表現を格納している。図６は人称代名詞デー
タベース（１０７）の一実施例である。本実施例では、
人称代名詞の表記を納めた単語欄（４０１）と、人称代
名詞性別が推定される場合の性別を格納する性別属性欄
（４０２）、人称代名詞が何人称であるかを示す人称属
性欄（４０３）、人称代名詞から年令層が推定可能な場
合の年令層を格納するための年令属性欄（４０４）、人
称代名詞から方言属性が推定可能な場合の方言属性を格
納するための方言属性格納欄（１０７）から成る。図７
は人名属性データベース（１０８）の一実施例である。
多くの人名において、人名から性別が判断できる。そこ
で、人名属性データベース（１０８）は、名前を格納す
る単語欄（４０１）と、人名から推定される性別属性を
格納する性別属性欄（４０２）から成る。図８は文末表
現属性データベース（１０９）の一実施例である。文末
表現属性データベース（１０９）は、特定の方言にのみ
現われる文末表現や、特定の性別の発話者のみが用いる
文末表現、特定の職業や経歴の発話者のみが用いる文末
表現といったような、発話者の識別に有効と考えられる
文末表現が格納される。また、本実施例では、文末表現
によって予測される話者の性別を格納する性別属性欄
（４０２）と、文末表現によって話者の方言が特定でき
る話者の方言属性を格納する方言属性欄（４０５）を有
する。図９は方言データベース（１１０）の一実施例で
ある。方言データベース（１１０）は特定の方言に現わ
れる単語を格納する単語欄（４０１）と、単語が有する
方言属性を格納する方言属性欄（４０５）から成る。図
１０は年令属性データベース（１１１）の一実施例であ
る。本実施例では、特定の年令や年代の話者が使用する
単語を格納する単語欄（４０１）と、単語から推定され
る年令を格納する年令属性欄（４０６）から成る。話者
テーブル（２１２）の一実施例を図１１に示す。また、
台詞テーブル（２１１）の一実施例を図１２に示す。ま
た、話者分析処理（１０２）の詳細を図１３に示す。話
者分析処理（１０２）は、まずテキストの台詞を台詞テ
ーブル（２１２）に全て登録し（１２０１）、つぎに登
録された台詞から話者を抽出し話者テーブルに登録する
（１２０３）。つぎに台詞テーブルに登録された台詞が
話者テーブルに登録されたどの話者の発声によるものか
を、台詞に現われる属性により推定する処理を行い（１
２０３）、台詞の属性だけでは話者が決定できない台詞
について、隣接した台詞は異なる話者を持つことが多い
ことを利用して、台詞の並びを基にした話者推定を行な
う（１２０４）。最後に自動的に話者が推定できなかっ
た台詞の話者を手動で設定する（１２０５）。

【００１４】つぎに、話者分析処理の実施例の処理フロ
ーの詳細について説明する。まず台詞テーブル登録処理
（１２０１）について説明する。台詞テーブル登録処理
（１２０１）では、図１２に示す台詞テーブル（２１
１）にテキストに現われる台詞を全て登録する。台詞テ
ーブル登録処理（１２０１）では、台詞の前後の地の文
（１８１）に発話者が明示されている場合、話者名（１
００２）を台詞テーブルに登録する。本発明では、地の
文の発話動詞の主語を発話者として扱う。発話動詞の判
定は、図５の発話動詞データベースに登録された動詞お
よび慣用表現を発話動詞と判定する。話者を決定可能な
台詞と地の文のパタンとを図１５に示す。台詞の前後に
発話動詞を含む地の文が現われるパタンは３種類あり、
台詞の前に地の文が現われるパタン１（１３５１）、台
詞の後に地の文が現われるパタン２（１３５２）、地の
文の目的語として台詞が現われるパタン３（１３５３）
がある。また、図１６のように、発話動詞（１３６２）
を含む台詞が２つの台詞に挟まれている場合、地の文の
前に位置する台詞１（１３７１）の発話者が台詞テーブ
ル（２１１）に登録されていない場合は、地の文の主語
（１３６１）は台詞１（１３７１）の話者として扱い、
すでに台詞１（１３７１）の話者が登録されている場合
は、地の文の主語（１３６１）は台詞２（１３７２）の
話者として登録される。また、発話動詞を含む地の文に
主語が無い場合、発話動詞を含む地の文よりも前に存在
する地の文の主語を発話動詞の主語とし、話者として扱
う。発話動詞を含む地の文に主語が無い場合の例を図１
７に示す。図１７の例では、地の文２（１３８２）には
発話動詞（１３６２）に主語がないが、地の文２の前の
地の文１に「美和子」という主語（１３６１）がある。
したがって、地の文２（１３８２）の主語は、「美和
子」になる。この台詞テーブル登録処理の処理手順を図
１４を用いて説明する。まず、内部変数の「話者変数」
および「主語変数」をクリアする（１３０１）。１文づ
つ読み込み、その文が台詞か否かを判定する（１３０
２）台詞の場合、台詞属性登録処理（１３０８）を呼び
出し、台詞の属性をテーブルに登録する。つぎに「話者
変数」に値が設定されているか否かをチェックし、この
値が設定されている場合は、台詞テーブル（２１１）の
話者欄（１００２）に「話者変数」の値を設定し、「話
者変数」をクリアする（１３１２）。この処理は、図１
５のパタン１（１３５１）の登録に相当する。また、１
３０２で読み込んだ文が台詞でなく、地の文であった場
合、文の主語を取り出し（１３０３）、主語が存在した
場合は「主語変数」に値を代入する。つぎに発話動詞が
文に含まれているかチェックし（１３０６）、含まれて
いた場合は、まず図１５のパタン３（１３５３）である
か検査する処理として、文中に台詞を含むか検査する
（１３０７）。含む場合、台詞属性登録処理（１３０
８）を呼び出し、台詞の属性を登録し、「主語変数」の
値を処理中の台詞の話者（１００２）として設定する。
文中に台詞を含まない場合は、図１５のパタン２（１３
５２）であるかを検査する処理として、文の直前に話者
が未定の台詞があるかを検査し（１３１０）、直前の台
詞の話者（１００２）として、「主語変数」を設定す
る。文の直前に話者が未定の台詞が無い場合は、図１５
のパタン１（１３５１）である可能性があるので、「話
者変数」に「主語変数」の値を設定する。最後に文を全
て処理したかをチェックし（１３１４）、まだ処理すべ
き文が残っている場合は、１３０２に戻る。

【００１５】ところで、全ての台詞について、図１５に
示したように明示的に書かれているわけではない。そこ
で、台詞に現われる特徴を抽出し、明示的に台詞の話者
が書かれていない台詞と明示的に話者が書かれている台
詞と特徴のマッチングを計算し、特徴が一致した台詞は
同一の話者が発声したとみなすことで、明示的に話者が
書かれていない台詞の話者を推定する。本発明の一実施
例では、台詞の特徴として、台詞中に現われる特定の単
語や、特定の単語から推定される属性情報を特徴として
用いる。具体的には、一人称表現（１００３）、方言属
性（１００４）、性別属性（１００５）、文末表現（１
００６）、年令属性（１００７）を用いている。実際の
話者属性登録処理の一実施例を図１８に示す。まず、一
人称欄（１００３）を設定する（１４０１）。一人称表
現（１００３）は、人称代名詞データベース（１０７）
を用いて台詞中から検索する。人称代名詞データベース
（１０７）の一実施例を図８に示す。人称代名詞データ
ベースの人称（４０３）が１である単語（４０１）を台
詞テキスト中から検索し、見つかった場合に登録する。
つぎに文末表現属性欄（１００６）の設定を行う（１４
０２）。文末表現（１００６）は、図８の文末表現デー
タベースに登録された単語（４０１）が台詞テキスト中
に現われるかを検索し、見つかった場合に登録する。つ
ぎに方言欄（１００４）の設定を行う（１４０３）。方
言属性は、人称代名詞データベース（１０７）、図８の
文末表現データベース（１０９）、図９の方言データベ
ース（１１０）に登録されている単語（４０１）を台詞
中から検索し、単語が見つかった場合は、単語に対応し
た方言属性（１０９）を取り出し、台詞テーブル（２１
１）の方言属性の欄（１００４）に登録する。図１９に
示すように、台詞と台詞の間に地の文が入らずに、台詞
が連続する場合がある。ほとんどの場合、地の文を鋏ま
ずに台詞が連続する場合、連続して現われる２つの台詞
の話者は異なる。本発明では、この特徴を話者の推定に
利用する。そこで、台詞を台詞テーブルに登録する際
に、直前の文が台詞であるか地の文であるかの情報を台
詞接続フラグ（１１０２）として記録する。まず、現在
の台詞の直前の文が台詞か否かを判定し（１４０４）、
台詞だった場合、台詞接続フラグ（１１０２）に１を設
定し（１４０６）、直前の文が台詞でなかった場合に、
台詞接続フラグ（１１０２）に０を設定する（１４０
５）。つぎに性別欄（１００５）の設定を行う（１４０
７）。性別属性は、話者名欄（１００２）に話者名が登
録されている場合は、図７の人名属性データベース（１
０９）、図６の人称代名詞データベース（１０７）を話
者名により検索し、性別属性（４０２）を取り出して登
録する。つぎに年令欄（１００７）の設定を行う（１４
０８）。年令属性（１００７）は、図６の人称代名詞デ
ータベース（１０７）、図１０の年令識別語データベー
ス（１１１）に登録された単語（４０１）が台詞テキス
ト中に現われるかを検索し、これらのデータベース中に
台詞に現われる単語が存在し、かつ年令属性（４０６）
が存在する場合に年令属性をデータベースより取り出し
て登録する。

【００１６】つぎに、話者テーブルの登録処理（１２０
２）の実施例の詳細について、図２０を用いて説明す
る。話者テーブルの登録処理の概要は、台詞テーブル中
で話者名（１００２）が同一の人名、もしくは一人称の
人称代名詞の話者は同一の話者と見做し、話者のリスト
を話者テーブル（２１２）に生成する。まず、台詞テー
ブルの話者名欄（１００２）に人名もしくは一人称代名
詞が設定されているか検査し（１５０１）、人名もしく
は一人称代名詞が登録されている場合は、該当する話者
が話者テーブルに登録されているか検査し（１５０
２）、すでに当該話者が登録されている場合は、台詞テ
ーブルの話者属性には値が設定されているが、話者テー
ブルの話者属性には値が設定されていない属性があるか
検査し、台詞テーブルの話者属性には値が設定されてい
るが、話者テーブルの話者属性には値が設定されていな
い属性がある場合は台詞テーブルの属性値を話者テーブ
ルの属性値に代入する。１５０２の検査で該当する話者
が話者テーブルに登録されていなかった場合は、話者テ
ーブルに話者を登録する。そして、処理の最後に台詞テ
ーブルを全て処理したかを検査し（１５０５）まだ処理
していない台詞が残っていた場合は、１５０１から処理
を繰り返す。

【００１７】つぎに、台詞の属性を基にした話者推定処
理（１２０３）の詳細について図２１を用いて説明す
る。台詞の属性を基にした話者推定処理（１２０３）で
は、図１２に示される台詞テーブル（２１１）の台詞イ
ンデックス（１１０１）順に台詞の話者を推定し、推定
された話者は話者テーブル（２１２）の話者インデクス
（１００１）の値で表わし、台詞テーブル（２１１）の
話者インデックス欄（１１０３）に設定される。具体的
な処理の実施例を以下に説明する。まず、台詞テーブル
（２１２）の話者名欄（１００２）に話者名が設定され
ており、かつ話者テーブルにその話者名が登録されてい
るか検査し（１６０１）、登録されていた場合は話者テ
ーブル（２１２）の該当する話者の話者インデックス番
号（１００１）を台詞テーブル（２１１）の話者インデ
ックス欄（１１０３）に設定する。台詞テーブルの話者
名欄（１００２）に話者名が設定されていない場合は、
一人称（１１０３）、方言（１００４）、性別（１００
５）の属性が一致する話者を話者テーブル（２１２）か
ら検索する（１６０２）。ここで、属性の一致の検査
は、一人称（１１０３）、方言（１００４）、性別（１
００５）属性のうち、話者テーブル（２１２）、台詞テ
ーブル（２１２）の両方に値が設定されている属性のみ
を対象とする。台詞の属性と一致した属性をもつ話者候
補の数が１名であるか検査し（１６０４）１名のみで合
った場合は、当該話者候補の話者インデックス（１００
１）を、台詞の話者インデックス欄（１１０３）に設定
する。つぎに全ての台詞について処理が完了したかを検
査し（１６０６）、処理すべき台詞が台詞テーブル（２
１２）に残っている場合は、１６０１からの処理を繰り
返す。

【００１８】つぎに、台詞の並びを基にした話者推定処
理（１２０４）の概要と処理フローの詳細について説明
する。まず、図２３を用いて処理の概要を説明する。台
詞が他の台詞と隣接する場合、２つの台詞の話者は異な
る。従って、図２３に示すように、現在処理中の台詞
（１７５４）に隣接する台詞が存在する場合、隣接する
台詞の話者が設定されている場合は現在処理中の台詞の
話者候補から隣接する台詞の話者を除いて、話者候補を
絞り込むことができる。図２３の例では、前に隣接する
台詞（１７５３）および後に隣接する台詞（１７５５）
の話者を処理中の台詞（１７５４）の話者候補から取り
除く。話者候補が１人に絞り込めたばあい、その一名の
話者候補を処理中の台詞の話者として登録する。ここ
で、台詞の前の地の文（１７５２）を、処理中の台詞
（１７５５）よりも前に存在する最も近い地の文から、
連続して続く一連の地の文と定義する（図２３参照）。
また、台詞の後の地の文（１７５６）を、処理中の台詞
（１７５５）よりも後に存在する最も近い地の文から連
続して続く一連の地の文（１７５６）と定義する（図２
３参照）。話者候補が１人に絞り込めない場合、台詞の
前の地の文（１７５２）と台詞の後の地の文（１７５
６）に台詞の話者が主語として登場することを利用し
て、話者候補の絞り込みを行う。台詞の台詞の前の地の
文（１７５２）と台詞の後の地の文（１７５６）の主語
以外の話者候補を取り除く。話者候補が１人まで絞り込
めたばあい、絞りこんで残った１名の話者を処理中の台
詞の話者として登録する。つぎに、図２２を用いて台詞
の並びを基にした話者推定処理（１２０４）の処理フロ
ーの詳細について説明する。まず最初に処理する台詞の
インデックス番号を格納するための変数iを１に初期化
する（１７０１）。そしてインデックス番号iの台詞の
一人称表現、方言属性、性別属性の一致する話者候補を
話者テーブル（２１１）より検索する。台詞テーブルの
接続フラグ（１１０２）を参照し、１つ前の台詞と隣接
しているか検査し（１７０３）、隣接している場合は前
の台詞に話者が設定されていた場合は話者候補から前に
隣接台詞の話者を取り除く（１７０４）。同様に台詞テ
ーブルの接続フラグ（１１０２）を参照し、１つ後の台
詞と隣接しているか検査し（１７０５）、隣接している
場合は前の台詞に話者が設定されていた場合は話者候補
から前に隣接台詞の話者を取り除く（１７０６）。話者
候補数が１名であるか検査し（１７０７）、話者候補数
が１名の場合は話者候補に対応した話者インデックスを
台詞テーブル（２１２）の話者インデックス欄（１１０
３）に登録する（１７１０）。話者候補数が１名でない
場合は、さらに台詞の前後の地の文（１７５２、１７５
６）の主語に含まれていない話者候補を除き（１７０
８）、話者候補者数が１名であるか検査する（１７０
９）。話者候補者数が話者候補に対応した話者インデッ
クスを台詞テーブル（２１２）の話者インデックス欄
（１１０３）に登録する（１７１０）。そして処理中の
話者インデックス番号を１増やし（１７１１）、全ての
台詞を処理したかチェックし（１７１２）、全ての台詞
を処理し終わっていない場合は１７０２からの処理を繰
り返す。全ての台詞を処理した後に、新たに話者インデ
ックスが設定された台詞があるか検査する（１７１
３）。新たに話者が設定された台詞がある場合、新たに
話者が設定された台詞に隣接する台詞の話者候補が１人
減らすことが出きるので、台詞に話者を設定できる可能
性が出てくる。そこで、新たに話者インデックスが設定
された台詞があるばあいは、１７０１からの処理を繰り
返す。

【００１９】次にマニュアルによる台詞の話者指定処理
（１２０５）の処理フローの詳細を図２４を用いて説明
する。まず最初に処理する台詞のインデックス番号を格
納するための変数iを１に初期化する（１８０１）。つ
ぎにi番目の台詞の話者インデックス欄（１１０３）に
話者が設定されているか検査し（１８０２）、設定され
ていない場合は台詞付近のテキストと話者の一覧を表示
し（１８０３）、ユーザに台詞に対応した話者を選択さ
せ、台詞の話者を決定し台詞テーブル（２１２）の話者
インデックス欄（１１０３）に登録する（１８０３）。
そして処理中の話者インデックス番号を１増やし（１７
１１）、全ての台詞を処理したかチェックし（１７１
２）、全ての台詞を処理し終わっていない場合は１７０
２からの処理を繰り返す。

【００２０】つぎに、話者データ割当処理（１０３）に
ついて、図２５を用いて説明する。話者データ割り当て
処理では、テキストから抽出された各々の話者の合成音
を生成する際に、どの話者データを用いて合成音を生成
するかを決定する。図２５は、話者データ属性（１１
２）の内容の一実施例である。話者データ属性（１１
２）には、音声規則合成（１０４）用に用意された話者
データ（１１３）中のそれぞれの話者の方言属性（１０
０４）、性別属性（１１０５）、年令属性（１１０７）
が格納されている。話者テーブルの各話者の属性と話者
データ属性（１１２）とのマッチングをとり、最も属性
が近く、かつ既に他の話者に割り当てられていない話者
データの話者データインデックス（１００８）を話者テ
ーブル（２１１）の話者データインデックス欄（１００
８）に設定する。

【００２１】音声規則合成処理（１０４）では、台詞テ
ーブルと（２１１）、話者テーブル（２１２）、話者デ
ータ（１１３）、テキストを入力とし、音声波形を生成
する。台詞のテキストの読み上げを行う際は、台詞テー
ブル（２１１）の読み上げる台詞に対応した話者インデ
ックス（１１０３）を取得する。つぎに、得られた話者
インデックス番号を用いて話者テーブル（２１２）を参
照し、話者インデックス（１００１）に対応した話者デ
ータインデックス番号（１００８）を取りだす。台詞を
読み上げる際に用いるべき話者データを決定する。決定
した話者データを話者データ格納手段（１１３）から取
りだし、音声波形を生成する。生成された音声波形は、
Ｄ／Ａ装置（１１４）によって音声に変換される。

【００２２】

【発明の効果】本発明によれば、付加情報が付与されて
いないテキストに対して、テキスト中に現われる台詞部
分の話者を推定し、話者毎に異なる声質で読み上げるテ
キスト読み上げ装置を提供でき、テキストの理解を助け
る。また本発明によれば、テキストの文字属性ごとに異
なる音質の音声で読み上げることによって、文字属性の
音声による理解を助ける。

【図面の簡単な説明】

【図１】本発明のハードウエア構成の一実施例である。

【図２】本発明の処理フローの一実施例である。

【図３】本発明の入力テキストの一例である。

【図４】本発明の話者分析処理の分析結果の一例であ
る。

【図５】本発明の発話動詞データベースの一実施例であ
る。

【図６】本発明の人称代名詞データベースの一実施例で
ある。

【図７】本発明の人名属性データベースの一実施例であ
る。

【図８】本発明の文末表現属性データベースの一実施例
である。

【図９】本発明の方言データベースの一実施例である。

【図１０】本発明の年令識別語データベースの一実施例
である。

【図１１】本発明の話者テーブルの一実施例である。

【図１２】本発明の台詞テーブルの一実施例である。

【図１３】本発明の話者分析処理の処理フローの一実施
例である。

【図１４】本発明の台詞テーブル設定処理の処理フロー
の一実施例である。

【図１５】本発明の話者推定方式の説明図である。

【図１６】本発明の話者の推定方式の説明図である。

【図１７】本発明の主語の推定方式の説明図である。

【図１８】本発明の台詞属性登録処理の処理フローの一
実施例である。

【図１９】本発明の話者推定方式の説明図である。

【図２０】本発明の話者テーブル登録処理の処理フロー
の一実施例である。

【図２１】本発明の台詞の属性を基にした話者推定処理
の処理フローの一実施例である。

【図２２】本発明の台詞の並びを基にした話者推定処理
の処理フローの一実施例である。

【図２３】本発明の台詞の並びを基にした話者推定処理
の処理フローの一実施例である。

【図２４】本発明のマニュアルによる台詞の話者指定処
理の処理フローの一実施例である。

【図２５】本発明の話者データ属性の一実施例である。

【符号の説明】

１００…テキストデータ、１０１…形態素解析処理、１
０２…話者分析処理、１０３…話者データ割当処理、１
０４…音声規則合成処理、１０６…発話動詞DB、１０７
…人称代名詞DB、１０８…人名属性DB、１０９…文末表
現属性DB、１１０…方言DB、年令識別語DB、１１２…話
者データ属性、１１３…話者データ、１１４…D/A装
置、１２０…制御プログラム、１８０…章題、１８１…
地の文、１８２…台詞、１８３…注釈文、１９１…話者
情報付きテキスト、１９２…話者属性情報、１９３…話
者属性、２０１…CPU、２０２…メモリ、２０３…不揮
発メモリ、２０４…話者データ格納装置、２０５…プロ
グラム格納用ROM、２０６…テキストデータ入力装置、
２０７…ユーザ操作入力装置、２１１…台詞テーブル、
２１２…話者テーブル、２１３…ワークエリア、４０１
…単語見だし、４０２…性別属性、４０３…人称、４０
４…年令属性、４０５…方言属性、４０６…年令属性、
１００１…話者インデックス番号、１００２…話者名
欄、１００３…一人称表現欄、１００４…方言欄、１０
０５…性別欄、１００６…文末表現欄、１００７…年令
欄、１００８…話者データインデックス、１１０１…台
詞インデックス番号、１１０２…台詞接続フラグ、１１
０３…話者インデックス番号、１２０１…台詞テーブル
登録処理、１２０２…話者テーブル登録処理、１２０３
…台詞の属性を基にした話者推定処理、１２０４…台詞
の並びを基にした話者推定処理、１２０５…マニュアル
による台詞の話者指定処理、１３０１…変数初期化処
理、１３０２…台詞部分検出処理、１３０３…主語抽出
処理、１３０４…主語抽出結果判定処理、１３０５…検
出主語保存処理、１３０６…発話動詞チェック処理、１
３０７…文中台詞検出処理、１３０８…台詞属性登録処
理、１３０９…台詞テーブル話者欄設定処理、１３１０
…台詞検出処理、１３１１…話者変数設定処理、１３１
２…話者変数設定チェック、１３１３…台詞テーブル話
者欄設定処理、１３１４…処理終了チェック、１３５１
…パターン１の例、１３５２…パターン２の例、１３５
３…パターン３の例、１４５４…パターン４の例、１３
７１…台詞１、１３７２…台詞２、１４０１…台詞テー
ブル一人称欄設定処理、１４０２…台詞テーブル文末表
現欄設定処理、１４０３…台詞テーブル方言欄設定処
理、１４０４…台詞連続出現チェック処理、１４０５…
台詞テーブル台詞接続フラグ欄設定処理１、１４０６…
台詞テーブル台詞接続フラグ欄設定処理２、１４０７…
台詞テーブル台詞性別欄設定処理、１４０８…台詞テー
ブル年令欄設定処理、１５０１…有効話者名設定チェッ
ク処理、１５０２…話者テーブル既登録チェック処理、
１５０３…話者テーブル空欄設定処理、１５０４…話者
テーブルへの話者設定処理、１５０５…話者登録処理完
了チェック処理、１６０１…台詞に対応付けられた話者
名により話者テーブルを検索する処理、１６０２…台詞
に対応付けられた特性のマッチングによる話者テーブル
の検索処理、１６０３…台詞に対する話者インデックス
番号の設定処理、１６０４…話者候補の絞り込みチェッ
ク処理、１６０５…台詞に対する話者インデックス番号
の設定処理、１６０６…全ての台詞が処理されたかをチ
ェックする処理、１７０１…処理対象の台詞インデック
ス番号の初期化処理、１７０２…話者候補の検索処理、
１７０３…話者インデックスが設定された台詞が現在の
台詞の前に隣接しているかをチェックする処理、１７０
４…隣接する台詞の話者を現在の台詞の話者候補から除
く処理、１７０５…話者インデックスが設定された台詞
が現在の台詞の後に隣接しているかをチェックする処
理、１７０６…隣接する台詞の話者を現在の台詞の話者
候補から除く処理、１７０７…話者候補数のチェック処
理、１７０８…台詞の前後の地の文の主語以外の話者候
補を除く処理、１７０９…話者項補数のチェック処理、
１７１０…話者インデックスを台詞テーブルに登録する
処理、１７１１…処理対象となる台詞のインデックス番
号の更新処理、１７１２…処理終了チェック処理、１７
１３…話者インデックスの設定が変化したかをチェック
する処理、１７５１…台詞１、１７５２…台詞の前の地
の文、１７５３…前に隣接する台詞、１７５４…処理中
の台詞、１７５５…後に隣接する台詞、１７５６…台詞
の後の地の文、１７５７…台詞２、１８０１…処理対象
の台詞インデックス番号の初期化処理、１８０２…処理
対処の台詞に話者インデックスが設定されているかチェ
ックする処理、１８０３…マニュアルで話者を選択する
為の台詞付近のテキスト表示および話者候補の表示処
理、１８０４…ユーザからの話者指定の入力を受け付け
る処理、１８０５…処理終了チェック処理。

───────────────────────────────────────────────────── フロントページの続き (72)発明者在塚俊之東京都国分寺市東恋ケ窪１丁目280番地株式会社日立製作所中央研究所内

Claims

【特許請求の範囲】

【請求項１】テキスト読み上げ装置に於いて、複数の話
者データ格納手段と、テキスト中の話者を推定する話者
推定手段と、推定された話者情報に従って話者を切り替
えながら規則合成音声を生成出力する規則音声合成手段
とを有し、テキストを複数の話者合成音で読み分けるこ
とにより、会話などのテキストが有する構造を理解しや
すく呈示することを特徴としたテキスト読み上げ装置。
【請求項２】テキスト中の台詞記号により、テキストの
台詞と地の文を分離し、さらに台詞中に現われる人称代
名詞、台詞の語尾表現、台詞に現われる方言、台詞の前
後の文の主語と発話に関する動詞情報のうちの１つ以上
の情報から、テキストの各部分の話者を推定する話者推
定方法。
【請求項３】請求項１のテキスト読み上げ装置におい
て、テキスト中に現われる改行や記号により、テキスト
をタイトル、注釈、通常の文に分類する分類手段と、分
類毎に異なる者を用いるか、発声速度、声の高さ、抑揚
パタンなどの発声様式を変える、もしくは話者と発声様
式の両方を変えることにより、異なる声質でテキストを
読み上げられる音声規則合成手段とを有し、タイトル、
テキストの有する構造を理解しやすく呈示することを特
徴としたテキスト読み上げ装置。