JPH1152973A - 文書読み上げ方式 - Google Patents
文書読み上げ方式Info
- Publication number
- JPH1152973A JPH1152973A JP9213566A JP21356697A JPH1152973A JP H1152973 A JPH1152973 A JP H1152973A JP 9213566 A JP9213566 A JP 9213566A JP 21356697 A JP21356697 A JP 21356697A JP H1152973 A JPH1152973 A JP H1152973A
- Authority
- JP
- Japan
- Prior art keywords
- document
- tag
- reading
- speech
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【課題】 電子化文書を読み上げる際の文書の聴解性を
向上させるとともに、文書読み上げ位置へのランダムア
クセスを可能にする。 【解決手段】 電子化文書の表題,段落などの論理的特
徴及び/又は文字の大きなどの視覚的特徴が分かるよう
に、前記文書の特定の情報及び/又は論理的構造によっ
て前記文書の内容を階層化して内部データに変換し、そ
の内部データに基づき読み上げ処理する。また、前記文
書の内容を階層化した内部データを利用してユーザの指
示に応じて文書の読み上げブロックに自由にアクセスで
きる文書読み上げシステムを提供する。
向上させるとともに、文書読み上げ位置へのランダムア
クセスを可能にする。 【解決手段】 電子化文書の表題,段落などの論理的特
徴及び/又は文字の大きなどの視覚的特徴が分かるよう
に、前記文書の特定の情報及び/又は論理的構造によっ
て前記文書の内容を階層化して内部データに変換し、そ
の内部データに基づき読み上げ処理する。また、前記文
書の内容を階層化した内部データを利用してユーザの指
示に応じて文書の読み上げブロックに自由にアクセスで
きる文書読み上げシステムを提供する。
Description
【0001】
【発明の属する技術分野】本発明は、SGML,HTM
L,などの電子構造化文書を、音声合成技術等により音
声化するシステムに関し、例えば、電話でデータべース
にアクセスしたり、視覚障害者がWWW(World wide W
eb)にアクセスする際などに利用される。
L,などの電子構造化文書を、音声合成技術等により音
声化するシステムに関し、例えば、電話でデータべース
にアクセスしたり、視覚障害者がWWW(World wide W
eb)にアクセスする際などに利用される。
【0002】
【従来の技術】従来、視覚表示を前提としたテキスト
(文書)の読み取り方式として次のようなものがある。 (1)テキストを音声化する際に文字装飾を音で表現し
たり、文書中の読み上げ位置を音像定位で表現するもの
(従来技術1という,例えば、特開平8−263260
号公報「テキスト読み上げ方法」)。 (2)読み上げ位置を戻す際に文節単位毎に逆方向に、
かつ、文節単位内では順方向に高速に読み上げ、利用者
はこれを聞いていて聞き返したい位置を探すもの(従来
技術2という,例えば、特開平6−308998号公報
「音声読み上げ装置」)。 (3)階層構造に分類された文書情報を読み上げる際、
スイッチ押下時間や回数によって読み上げ位置を指定す
るもの(従来技術3という,例えば、特開平5−281
987,281988,281992号公報「可搬性文
書読み上げ装置」)。 (4)HTML文書を合成音声で読み上げるもの(従来
技術4という,ソフトウェア製品化されている。例え
ば、(株)リコー製「おしゃべりさーふあー」)。
(文書)の読み取り方式として次のようなものがある。 (1)テキストを音声化する際に文字装飾を音で表現し
たり、文書中の読み上げ位置を音像定位で表現するもの
(従来技術1という,例えば、特開平8−263260
号公報「テキスト読み上げ方法」)。 (2)読み上げ位置を戻す際に文節単位毎に逆方向に、
かつ、文節単位内では順方向に高速に読み上げ、利用者
はこれを聞いていて聞き返したい位置を探すもの(従来
技術2という,例えば、特開平6−308998号公報
「音声読み上げ装置」)。 (3)階層構造に分類された文書情報を読み上げる際、
スイッチ押下時間や回数によって読み上げ位置を指定す
るもの(従来技術3という,例えば、特開平5−281
987,281988,281992号公報「可搬性文
書読み上げ装置」)。 (4)HTML文書を合成音声で読み上げるもの(従来
技術4という,ソフトウェア製品化されている。例え
ば、(株)リコー製「おしゃべりさーふあー」)。
【0003】
【発明が解決しようとする課題】しかしなから、これら
従来の文書読み上げ技術は以下で述べるようにそれぞれ
聴解性及び読み上げ文書へのランダムアクセスの点で未
だ十分とはいえない。この点を図面を参考にして説明す
ると、例えば、図1に示すHTML文書は、通常ブラウ
ザと呼ばれるソフトによって図2に示すように視覚的に
表示される。図2から明らかなように、タグ情報は視覚
的書式情報に変換されて文書における階層構造を明らか
にしているからその視認性は向上している。ところがこ
れを前記従来技術4によって音声化すると、前記従来技
術4では図3に示すようにタグを無視して日本語部分を
読み上げてしまうので、ユーザにとってはだらだらと分
かり難いものになってしまう。これに対し、前記従来技
術1では音声化する際に文字修飾,文書中の読み上げ位
置を表現するものであるため、ある程度視覚的特徴を音
で表現できるが、文書の論理構造まで把握することは難
しく、全体像の把握も音像定位という曖昧な形にとどま
っている。
従来の文書読み上げ技術は以下で述べるようにそれぞれ
聴解性及び読み上げ文書へのランダムアクセスの点で未
だ十分とはいえない。この点を図面を参考にして説明す
ると、例えば、図1に示すHTML文書は、通常ブラウ
ザと呼ばれるソフトによって図2に示すように視覚的に
表示される。図2から明らかなように、タグ情報は視覚
的書式情報に変換されて文書における階層構造を明らか
にしているからその視認性は向上している。ところがこ
れを前記従来技術4によって音声化すると、前記従来技
術4では図3に示すようにタグを無視して日本語部分を
読み上げてしまうので、ユーザにとってはだらだらと分
かり難いものになってしまう。これに対し、前記従来技
術1では音声化する際に文字修飾,文書中の読み上げ位
置を表現するものであるため、ある程度視覚的特徴を音
で表現できるが、文書の論理構造まで把握することは難
しく、全体像の把握も音像定位という曖昧な形にとどま
っている。
【0004】また、文書読み上げ方式において、音声メ
ディアは一覧性に欠けるためランダムアクセスが難しい
という問題があり、従来技術3では階層的ファイル構造
を採用することでボタン操作によるランダムアクセスを
実現している。しかしながら、従来技術3では専用の構
造でデータを記述するため既存のテキストを対象とする
ことはできない。他方、従来技術2ではテキスト中を高
速に移動することによりアクセス速度を得ているが、文
書を聞き返す場合に前記文書の各文節の並びを逆の順番
で聞き取りながら、文書の読み上げ位置を判断すること
はユーザにとって負荷が軽いとは言い難い。
ディアは一覧性に欠けるためランダムアクセスが難しい
という問題があり、従来技術3では階層的ファイル構造
を採用することでボタン操作によるランダムアクセスを
実現している。しかしながら、従来技術3では専用の構
造でデータを記述するため既存のテキストを対象とする
ことはできない。他方、従来技術2ではテキスト中を高
速に移動することによりアクセス速度を得ているが、文
書を聞き返す場合に前記文書の各文節の並びを逆の順番
で聞き取りながら、文書の読み上げ位置を判断すること
はユーザにとって負荷が軽いとは言い難い。
【0005】したがって、請求項1の発明の課題は、主
に視覚用に作成された文書の階層構造をそのまま保存し
て音声化することにより、聴解性を向上させることであ
る。請求項2の発明の課題は、請求項1の発明の課題に
加え、既存の構造化された電子テキストにもそのまま適
用できるようにすることである。請求項3の発明の課題
は、請求項1の発明の課題に加え、構造化タグのない電
子テキストにも適用できることである。請求項4の発明
の課題は、請求項1の発明の聴解性を更に向上させるこ
とである。請求項5の発明の課題は、請求項1の発明の
課題に加え、聴いている箇所の全体の中での位置付けを
把握し易くすることである。
に視覚用に作成された文書の階層構造をそのまま保存し
て音声化することにより、聴解性を向上させることであ
る。請求項2の発明の課題は、請求項1の発明の課題に
加え、既存の構造化された電子テキストにもそのまま適
用できるようにすることである。請求項3の発明の課題
は、請求項1の発明の課題に加え、構造化タグのない電
子テキストにも適用できることである。請求項4の発明
の課題は、請求項1の発明の聴解性を更に向上させるこ
とである。請求項5の発明の課題は、請求項1の発明の
課題に加え、聴いている箇所の全体の中での位置付けを
把握し易くすることである。
【0006】請求項6の発明の課題は、請求項1の発明
の課題に加え、読み取り文書へのランダムアクセスを迅
速に行うようにすることである。
の課題に加え、読み取り文書へのランダムアクセスを迅
速に行うようにすることである。
【0007】
【課題を解決するための手段】本発明は、主に視覚提示
用に書かれた既存の構造化された電子テキスト(文書)
を、作者の意図した文章の構造情報を含めて音声化する
ことで、視覚表示に近い分かり易さ及びアクセスビリテ
ィの向上を目指すものである。
用に書かれた既存の構造化された電子テキスト(文書)
を、作者の意図した文章の構造情報を含めて音声化する
ことで、視覚表示に近い分かり易さ及びアクセスビリテ
ィの向上を目指すものである。
【0008】請求項1の発明は、電子化文書の文字情報
を音声合成技術によって音声化して出力する文書読み上
げ方式において、前記文書の書式情報及び/又は論理的
構造から当該文書の内容を階層的に捉え、これに従って
出力順序及び/又は音声属性などを変更して音声化する
文書読み上げ方式である。
を音声合成技術によって音声化して出力する文書読み上
げ方式において、前記文書の書式情報及び/又は論理的
構造から当該文書の内容を階層的に捉え、これに従って
出力順序及び/又は音声属性などを変更して音声化する
文書読み上げ方式である。
【0009】請求項2の発明は、請求項1の発明におい
て、前記書式情報をその種類毎に異なる強さを持つ文書
中の区切りとして扱い、これによって文書を階層的にブ
ロック化する文書読み上げ方式である。
て、前記書式情報をその種類毎に異なる強さを持つ文書
中の区切りとして扱い、これによって文書を階層的にブ
ロック化する文書読み上げ方式である。
【0010】請求項3の発明は、請求項1の発明におい
て、文書中の第1段落及び段落中の第1文のような、前
記ブロックの最初の文章単位をそれ以降の文章単位の上
位の階層に位置付けることによって、前記文書の内容を
階層的にブロック化する文書読み上げ方式である。
て、文書中の第1段落及び段落中の第1文のような、前
記ブロックの最初の文章単位をそれ以降の文章単位の上
位の階層に位置付けることによって、前記文書の内容を
階層的にブロック化する文書読み上げ方式である。
【0011】請求項4の発明は、請求項1の発明におい
て、前記文書の内容を上位の階層から下位の階層へ順に
読み上げる文書読み上げ方式である。
て、前記文書の内容を上位の階層から下位の階層へ順に
読み上げる文書読み上げ方式である。
【0012】請求項5の発明は、請求項1の発明におい
て、タイトルと内容及び階層間の識別を音声属性,付加
音などを用いて行う文書読み上げ方式である。
て、タイトルと内容及び階層間の識別を音声属性,付加
音などを用いて行う文書読み上げ方式である。
【0013】請求項6の発明は、請求項1の発明におい
て、読みだし手段がユーザの要求に応じて前記文書の上
下階層間及び同一階層間で移動自在である文書読み上げ
方式である。
て、読みだし手段がユーザの要求に応じて前記文書の上
下階層間及び同一階層間で移動自在である文書読み上げ
方式である。
【0014】
【発明の実施の形態】本発明の実施態様を、図1に示す
HTML文書を例に取って説明する。図4は、このHT
ML文書から文書の構造情報を抽出して、それを階層的
内部データに変換した場合の該内部データを示したもの
である。図5は、その変換の際の処理フローを示したも
のである。以下では、まず、ソーステキストから内部デ
ータへの変換処理について述べ、続いて内部データの読
み上げ処理について述べることとする。
HTML文書を例に取って説明する。図4は、このHT
ML文書から文書の構造情報を抽出して、それを階層的
内部データに変換した場合の該内部データを示したもの
である。図5は、その変換の際の処理フローを示したも
のである。以下では、まず、ソーステキストから内部デ
ータへの変換処理について述べ、続いて内部データの読
み上げ処理について述べることとする。
【0015】ソーステキストの階層化は主にタグに基づ
いて行われる。このためにタグは例えば予め図6のよう
に、最上層の仮想的最上層タグから最下層の強制改行の
〈BR〉まで階層が順位付けられている。この順位はタ
グが表わす階層の高さであり、これは論理的意味と視覚
的特徴から文書の区切りとしての強さを判断して決めら
れる。論理的意味とは表題,段落など、主に論理タグが
表わす文章の意味的な構造である。視覚的特徴とは文字
の大きさや罫線など視覚的に感じる構造情報である。以
下のブロック化では、これらの特徴をタグの持つ区切り
の強さと考えて文書を階層的に分割する。なお、この実
施態様及び以下の説明では主に開始タグをブロック区切
りとして用い、終了タグはブロック区切りとしては使用
していないが、本発明はこれに限定されるものではな
く、当然開始タグと終了タグで囲まれる範囲をブロック
として扱うことも考えられる。
いて行われる。このためにタグは例えば予め図6のよう
に、最上層の仮想的最上層タグから最下層の強制改行の
〈BR〉まで階層が順位付けられている。この順位はタ
グが表わす階層の高さであり、これは論理的意味と視覚
的特徴から文書の区切りとしての強さを判断して決めら
れる。論理的意味とは表題,段落など、主に論理タグが
表わす文章の意味的な構造である。視覚的特徴とは文字
の大きさや罫線など視覚的に感じる構造情報である。以
下のブロック化では、これらの特徴をタグの持つ区切り
の強さと考えて文書を階層的に分割する。なお、この実
施態様及び以下の説明では主に開始タグをブロック区切
りとして用い、終了タグはブロック区切りとしては使用
していないが、本発明はこれに限定されるものではな
く、当然開始タグと終了タグで囲まれる範囲をブロック
として扱うことも考えられる。
【0016】以下では、図5を参考に、図1に示すソー
ステキストを図4に示す階層的データに変換する場合を
例にとり、図5のブロック分割処理を再帰的に行うこと
について説明する。まず、図1のソーステキスト全体を
処理対象テキストとして、仮想的な最上層タグを現階層
タグとするルートブロックのブロック化(S101〜S
111)を行う。タイトルと内容の抽出処理(S10
2)は現階層タグの種類によって異なるが、仮想的最上
層タグについては行わない。次に子ブロックCHILD
のブロック化の準備として、処理対象テキストに含まれ
る現階層よりも下層で最も近いタグを探す(S103〜
S105)。ここでは第1表題タグ〈H1〉が発見され
る。そこで、タグ〈H1〉を対象に子ブロックをブロッ
ク化する。すなわち図1のソーステキスト全体を処理対
象テキストとして、タグ〈H1〉を現階層タグとしてブ
ロック化処理の再帰呼び出しを行う(S101)。
ステキストを図4に示す階層的データに変換する場合を
例にとり、図5のブロック分割処理を再帰的に行うこと
について説明する。まず、図1のソーステキスト全体を
処理対象テキストとして、仮想的な最上層タグを現階層
タグとするルートブロックのブロック化(S101〜S
111)を行う。タイトルと内容の抽出処理(S10
2)は現階層タグの種類によって異なるが、仮想的最上
層タグについては行わない。次に子ブロックCHILD
のブロック化の準備として、処理対象テキストに含まれ
る現階層よりも下層で最も近いタグを探す(S103〜
S105)。ここでは第1表題タグ〈H1〉が発見され
る。そこで、タグ〈H1〉を対象に子ブロックをブロッ
ク化する。すなわち図1のソーステキスト全体を処理対
象テキストとして、タグ〈H1〉を現階層タグとしてブ
ロック化処理の再帰呼び出しを行う(S101)。
【0017】タグ〈H1〉についてはタグ〈H1〉とタ
グ〈/H1〉に挾まれる部分をタイトルとして、それに
続く第1段落を内容として抽出する(S102)。その
結果「音声WebブラウザTelMePage」がタイトルとして抽
出され、内容は抽出されない。次に子ブロックCHIL
Dのタグを〈H1〉より下層の候補タグから探し、第2
表題タグ〈H2〉が2つ発見される(S103〜S10
5)。そこでまず最初のタグ〈H2〉と次のタグ〈H
2〉の間の部分を処理対象テキストとして、タグ〈H
2〉を現階層タグとしてブロック化処理の再帰呼び出し
を行い(S101〜S107)、これを子ブロックとす
る。さらに次のタグ〈H2〉から最後までも同様に処理
する(S101〜S107)。
グ〈/H1〉に挾まれる部分をタイトルとして、それに
続く第1段落を内容として抽出する(S102)。その
結果「音声WebブラウザTelMePage」がタイトルとして抽
出され、内容は抽出されない。次に子ブロックCHIL
Dのタグを〈H1〉より下層の候補タグから探し、第2
表題タグ〈H2〉が2つ発見される(S103〜S10
5)。そこでまず最初のタグ〈H2〉と次のタグ〈H
2〉の間の部分を処理対象テキストとして、タグ〈H
2〉を現階層タグとしてブロック化処理の再帰呼び出し
を行い(S101〜S107)、これを子ブロックとす
る。さらに次のタグ〈H2〉から最後までも同様に処理
する(S101〜S107)。
【0018】このようにして再帰的に階層ブロック化を
行う(S101〜S111)が、タイトルと内容を抽出
する部分以外はこの処理の繰り返しとなるので、タイト
ル・内容抽出処理のみ以下に説明する。タグ〈H2〉で
はタグ〈H1〉と同様にタイトル・内容抽出処理を行
い、それに続くタグ〈P〉はタイトル無しの子ブロック
とする。これは通常第1段落でそれ以降の概要などを述
べることが多いことによるものである。タグ〈UL〉は
ここでは無視し、タグ〈L1〉部分をタイトル無しのブ
ロックとみなして処理する。このようにソーステキスト
から内部データへの変換が行われる。
行う(S101〜S111)が、タイトルと内容を抽出
する部分以外はこの処理の繰り返しとなるので、タイト
ル・内容抽出処理のみ以下に説明する。タグ〈H2〉で
はタグ〈H1〉と同様にタイトル・内容抽出処理を行
い、それに続くタグ〈P〉はタイトル無しの子ブロック
とする。これは通常第1段落でそれ以降の概要などを述
べることが多いことによるものである。タグ〈UL〉は
ここでは無視し、タグ〈L1〉部分をタイトル無しのブ
ロックとみなして処理する。このようにソーステキスト
から内部データへの変換が行われる。
【0019】次に、変換された内部データの読み上げ処
理の一実施態様を図7を参考にして説明する。ユーザか
ら何ら操作のない場合は、タイトル,内容,子ブロック
のタイトルの順に読み上げ(S201〜S210)、そ
の子ブロックに移って同様に(タイトル,内容,子ブロ
ックのタイトルの順に)読み上げる(S212〜S21
4)。この時タイトル,内容,子ブロックのタイトルそ
れぞれの前に異なる効果音を付加するか、及び/又は声
種を変えることにより識別を助けるようになっている。
これを繰り返し最下層ブロックまで読み上げ(S201
〜S215)、その後未読ブロックに戻って読み上げを
続ける(S202〜S215)。これによってこのテキ
ストが全体としては背景と特徴からなることが読み上げ
の冒頭で分かり聴解性が向上する。
理の一実施態様を図7を参考にして説明する。ユーザか
ら何ら操作のない場合は、タイトル,内容,子ブロック
のタイトルの順に読み上げ(S201〜S210)、そ
の子ブロックに移って同様に(タイトル,内容,子ブロ
ックのタイトルの順に)読み上げる(S212〜S21
4)。この時タイトル,内容,子ブロックのタイトルそ
れぞれの前に異なる効果音を付加するか、及び/又は声
種を変えることにより識別を助けるようになっている。
これを繰り返し最下層ブロックまで読み上げ(S201
〜S215)、その後未読ブロックに戻って読み上げを
続ける(S202〜S215)。これによってこのテキ
ストが全体としては背景と特徴からなることが読み上げ
の冒頭で分かり聴解性が向上する。
【0020】さらに読み上げ途中でユーザからの割り込
みによるロケーション指定を受け付けることができ、こ
れによりランダムアクセスが可能となる。即ち、「もう
一度」を指示することで(S301)現在読み上げてい
るブロックの先頭へ返って聴き返すことができる(S2
03〜S214)。また、例えばタグ〈H1〉ブロック
の子ブロックタイトル「特徴」を読み上げている時に、
「下層へ」を指示すると(S302)、読み上げロケー
ションを直接「特徴」の中身へ飛ばす(S212)こと
が出来る。タグ〈H2〉「特徴」の内容の読み上げ中に
「次へ」を指示すると(S303)、親ブロックの次の
子ブロック、すなわちタグ〈H2〉ブロック「背景」へ
飛ぶことが出来る。箇条書き部分の(U)ブロックにつ
いても同様に読み上げ中に次の項目に飛ぶことができ
る。「上層へ」を指示すると(S304)親ブロックの
先頭へ戻って読み上げることができる。
みによるロケーション指定を受け付けることができ、こ
れによりランダムアクセスが可能となる。即ち、「もう
一度」を指示することで(S301)現在読み上げてい
るブロックの先頭へ返って聴き返すことができる(S2
03〜S214)。また、例えばタグ〈H1〉ブロック
の子ブロックタイトル「特徴」を読み上げている時に、
「下層へ」を指示すると(S302)、読み上げロケー
ションを直接「特徴」の中身へ飛ばす(S212)こと
が出来る。タグ〈H2〉「特徴」の内容の読み上げ中に
「次へ」を指示すると(S303)、親ブロックの次の
子ブロック、すなわちタグ〈H2〉ブロック「背景」へ
飛ぶことが出来る。箇条書き部分の(U)ブロックにつ
いても同様に読み上げ中に次の項目に飛ぶことができ
る。「上層へ」を指示すると(S304)親ブロックの
先頭へ戻って読み上げることができる。
【0021】以上の読み上げ動作は図7の流れ図で示さ
れる処理(S201〜215)を再帰的に用いて実現す
ることができる。図中、blockTITLEはブロッ
クblockのタイトル、blockCONTENTは
ブロックblockの内容、blockNCHILDは
ブロックblockの子ブロックの数、blockCH
ILD[i]はブロックblockのi番目の子ブロック
をそれぞれ表している。なお、テキストの音声化処理に
ついては既存のテキスト音声合成技術が使えるのでここ
では説明を省略する。
れる処理(S201〜215)を再帰的に用いて実現す
ることができる。図中、blockTITLEはブロッ
クblockのタイトル、blockCONTENTは
ブロックblockの内容、blockNCHILDは
ブロックblockの子ブロックの数、blockCH
ILD[i]はブロックblockのi番目の子ブロック
をそれぞれ表している。なお、テキストの音声化処理に
ついては既存のテキスト音声合成技術が使えるのでここ
では説明を省略する。
【0022】
【発明の効果】 請求項1に対応する効果:文書の情報を、その階層構造
を保存したまま話し言葉としての表現に写像して出力す
ることができるため、聴解性を向上することができる。 請求項2に対応する効果:請求項1に対応する効果に加
えて、既存の構造化された電子テキストにもそのまま適
用することができる。 請求項3に対応する効果:請求項1に対応する効果に加
えて、既存の構造化タグのない電子テキストにも適用す
ることができる。 請求項4に対応する効果:請求項1に対応する効果に加
えて、下位概念を聴解するための前提知識である上位概
念を常に事前に取得することになるため全体的に聴解性
が向上する。 請求項5に対応する効果:請求項1に対応する効果に加
えて、現在聞いている個所の文書全体の中での位置づけ
が把握しやすく、聴解性が向上する。 請求項6に対応する効果:請求項1に対応する効果に加
えて、音声メディアの欠点であるランダムアクセスの難
しさを補い、ユーザ要求に対する反応速度を向上するこ
とができる。
を保存したまま話し言葉としての表現に写像して出力す
ることができるため、聴解性を向上することができる。 請求項2に対応する効果:請求項1に対応する効果に加
えて、既存の構造化された電子テキストにもそのまま適
用することができる。 請求項3に対応する効果:請求項1に対応する効果に加
えて、既存の構造化タグのない電子テキストにも適用す
ることができる。 請求項4に対応する効果:請求項1に対応する効果に加
えて、下位概念を聴解するための前提知識である上位概
念を常に事前に取得することになるため全体的に聴解性
が向上する。 請求項5に対応する効果:請求項1に対応する効果に加
えて、現在聞いている個所の文書全体の中での位置づけ
が把握しやすく、聴解性が向上する。 請求項6に対応する効果:請求項1に対応する効果に加
えて、音声メディアの欠点であるランダムアクセスの難
しさを補い、ユーザ要求に対する反応速度を向上するこ
とができる。
【図1】 読み上げ文書の例を示す図である。
【図2】 前記文書のブラウザによる表示例を示す図で
ある。
ある。
【図3】 前記文書を従来の方式で音声化した場合の読
み上げ表示例を示す図である。
み上げ表示例を示す図である。
【図4】 前記文書の階層的内部データを示す図であ
る。
る。
【図5】 前記文書の構造を階層的内部データに変換す
る処理フローを示す図である。
る処理フローを示す図である。
【図6】 前記文書に付与されるタブの一例を示す図で
ある。
ある。
【図7】 階層的内部データによる文書読み上げ処理フ
ローを示す図である。
ローを示す図である。
Claims (6)
- 【請求項1】 電子化文書の文字情報を音声合成技術に
よって音声化して出力する文書読み上げ方式において、
前記文書の書式情報及び/又は論理的構造から当該文書
の内容を階層的に捉え、これにしたがって出力文の順序
及び/又は音声属性などを変更して音声化することを特
徴とする文書読み上げ方式。 - 【請求項2】 前記書式情報をその種類毎に異なる強さ
を持つ文書中の区切りとして扱い、これによって文書を
階層的にブロック化することを特徴とする請求項1に記
載された文書読み上げ方式。 - 【請求項3】 文書中の第1段落及び段落中の第1文の
ような、前記ブロックの最初の文章単位をそれ以降の文
章単位の上位の階層に位置付けることによって、前記文
書の内容を階層的にブロック化することを特徴とする請
求項1に記載された文書読み上げ方式。 - 【請求項4】 前記文書の内容を上位の階層から下位の
階層へ順に読み上げることを特徴とする請求項1に記載
された文書読み上げ方式。 - 【請求項5】 タイトルと内容及び階層間の識別を音声
属性,付加音などを用いて行うことを特徴とする請求項
1に記載された文書読み上げ方式。 - 【請求項6】 読み出し手段がユーザの要求に応じて前
記文書の上下階層間及び同一階層間で移動自在であるこ
とを特徴とする請求項1記載の文書読み上げ方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9213566A JPH1152973A (ja) | 1997-08-07 | 1997-08-07 | 文書読み上げ方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9213566A JPH1152973A (ja) | 1997-08-07 | 1997-08-07 | 文書読み上げ方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1152973A true JPH1152973A (ja) | 1999-02-26 |
Family
ID=16641340
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9213566A Pending JPH1152973A (ja) | 1997-08-07 | 1997-08-07 | 文書読み上げ方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1152973A (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2001001390A1 (fr) * | 1999-06-30 | 2001-01-04 | Sony Corporation | Trieuse-liseuse electronique |
| JP2003099314A (ja) * | 2001-09-21 | 2003-04-04 | Ricoh Co Ltd | 文書のデータ構造、記憶媒体及び情報処理装置 |
| WO2004097656A1 (ja) * | 2003-04-30 | 2004-11-11 | International Business Machines Corporation | コンテンツ作成システム、コンテンツ作成方法、該コンテンツ作成方法を実行させるためのコンピュータ実行可能なプログラム、該プログラムが記録されたコンピュータ可読な記憶媒体、グラフィカル・ユーザ・インタフェース・システム、および表示制御方法 |
| CN108334805A (zh) * | 2017-03-08 | 2018-07-27 | 腾讯科技(深圳)有限公司 | 检测文档阅读顺序的方法和装置 |
| US10255904B2 (en) | 2016-03-14 | 2019-04-09 | Kabushiki Kaisha Toshiba | Reading-aloud information editing device, reading-aloud information editing method, and computer program product |
-
1997
- 1997-08-07 JP JP9213566A patent/JPH1152973A/ja active Pending
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2001001390A1 (fr) * | 1999-06-30 | 2001-01-04 | Sony Corporation | Trieuse-liseuse electronique |
| US6985864B2 (en) | 1999-06-30 | 2006-01-10 | Sony Corporation | Electronic document processing apparatus and method for forming summary text and speech read-out |
| JP2003099314A (ja) * | 2001-09-21 | 2003-04-04 | Ricoh Co Ltd | 文書のデータ構造、記憶媒体及び情報処理装置 |
| WO2004097656A1 (ja) * | 2003-04-30 | 2004-11-11 | International Business Machines Corporation | コンテンツ作成システム、コンテンツ作成方法、該コンテンツ作成方法を実行させるためのコンピュータ実行可能なプログラム、該プログラムが記録されたコンピュータ可読な記憶媒体、グラフィカル・ユーザ・インタフェース・システム、および表示制御方法 |
| CN100422966C (zh) * | 2003-04-30 | 2008-10-01 | 国际商业机器公司 | 内容创建系统和方法 |
| US10255904B2 (en) | 2016-03-14 | 2019-04-09 | Kabushiki Kaisha Toshiba | Reading-aloud information editing device, reading-aloud information editing method, and computer program product |
| CN108334805A (zh) * | 2017-03-08 | 2018-07-27 | 腾讯科技(深圳)有限公司 | 检测文档阅读顺序的方法和装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5572625A (en) | Method for generating audio renderings of digitized works having highly technical content | |
| JP4225703B2 (ja) | 情報アクセス方法、情報アクセスシステムおよびプログラム | |
| US6181351B1 (en) | Synchronizing the moveable mouths of animated characters with recorded speech | |
| AU767280B2 (en) | Text processor | |
| US6282512B1 (en) | Enhancement of markup language pages to support spoken queries | |
| US6289304B1 (en) | Text summarization using part-of-speech | |
| CA2280331C (en) | Web-based platform for interactive voice response (ivr) | |
| JP5257330B2 (ja) | 発言記録装置、発言記録方法、プログラム及び記録媒体 | |
| JP2000081892A (ja) | 効果音付加装置および効果音付加方法 | |
| JP2000352988A (ja) | 自動ヘッダ抽出機能付き選択読み上げ処理方法ならびにそのためのプログラムを記録した記録媒体 | |
| JP2001014306A (ja) | 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体 | |
| JP2001014319A (ja) | ハイパーテキストアクセス装置 | |
| CN1279804A (zh) | 通过听觉表示sgml数据页的系统和方法 | |
| JP3789614B2 (ja) | ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体 | |
| US6985147B2 (en) | Information access method, system and storage medium | |
| JPH1152973A (ja) | 文書読み上げ方式 | |
| JPH0981590A (ja) | マルチメディア情報検索装置 | |
| JP2004334369A (ja) | 音声対話シナリオ変換方法、音声対話シナリオ変換装置、音声対話シナリオ変換プログラム | |
| JPH03167666A (ja) | 情報案内・提供方法 | |
| Raman et al. | Documents mean more than just paper! | |
| Lecarpentier et al. | Tag thunder: Web page skimming in non visual environment using concurrent speech | |
| JP3823151B2 (ja) | 辞書評価支援装置、辞書評価支援プログラム | |
| AU2007203103B2 (en) | Reading Product Fabrication Methodology | |
| Raggett et al. | Voice Browsers | |
| JP2003150182A (ja) | 音声合成装置、音声合成装置の制御方法、音声合成制御プログラム及び記録媒体 |