JPH09281993A - 発音記号生成装置 - Google Patents

発音記号生成装置

Info

Publication number
JPH09281993A
JPH09281993A JP8089225A JP8922596A JPH09281993A JP H09281993 A JPH09281993 A JP H09281993A JP 8089225 A JP8089225 A JP 8089225A JP 8922596 A JP8922596 A JP 8922596A JP H09281993 A JPH09281993 A JP H09281993A
Authority
JP
Japan
Prior art keywords
language
character string
phonetic symbol
phonetic
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8089225A
Other languages
English (en)
Inventor
Katsuyoshi Yamagami
勝義 山上
Kiyo Hara
紀代 原
Kenji Matsui
謙二 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8089225A priority Critical patent/JPH09281993A/ja
Publication of JPH09281993A publication Critical patent/JPH09281993A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 文章を入力して音声に変換する文−音声変換
装置において、入力文字列中の外国語文字列に対して正
しい発音記号を付与することにより、違和感のない音声
出力を得ることを目的とする。 【解決手段】 入力された言語1入力文字列に含まれる
言語2の文字列の部分を、言語2文字列判定部103で
特定し、その言語2の文字列部分を言語2形態素解析部
102で形態素解析し、その結果を言語2構文解析部1
06により構文解析して構文的な発音の変形を施し、言
語2発音記号生成部108で言語2の発音記号列を生成
した後、言語2−言語1発音記号変換部109により言
語1の発音記号列に変換することにより、言語1入力文
字列に含まれる言語2文字列部分に対して正しい、か
つ、言語1の発音記号を生成することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力した文章を音
声に変換して出力する文−音声変換装置に応用可能であ
り、入力された文章中に含まれる外国語文字列に対して
正しい読みを与えるために必要な発音記号生成方式に関
するものである。
【0002】
【従来の技術】日本語文−音声変換装置においては、大
きく分けて、入力文章に対して言語的な解析を行い、文
章中の各単語の読みを決定し、音声出力するために必要
な発音記号を生成する言語処理部と、言語処理部から受
け取った発音記号の情報を基にして実際の音声信号を合
成する音響処理部の2つから構成されるのが一般的であ
る。言語処理部においては、入力文章に対して辞書索き
を行い入力文章を単語列に分解する形態素解析部、形態
素解析の結果である単語列を文節の単位にまとめ上げ、
発音上の変形処理などを行う構文解析部、単語の読みか
ら発音記号を生成する発音記号生成部、単語単位あるい
は文節単位において読みのアクセントを決定するアクセ
ント付与部から構成するのが一般的である。言語処理部
の中で、特に、単語の読みを決定し読みに対する発音記
号を生成するのに関わる部分は、形態素解析部、構文解
析部、発音記号生成部である。本発明は、これら形態素
解析部、構文解析部、発音記号生成部の処理方式に関す
るものであり、特に、入力文章中に含まれる外国語文字
列の取り扱いに関するものである。
【0003】従来の発音記号生成方式では、外国語文字
列の取り扱いに関して、辞書に登録されている外国語文
字列に関しては、付与されている発音記号を生成し、辞
書に登録されていない関しては、外国語文字列から外国
語の発音記号に変換するための規則を用意し、検出され
た外国語文字列に対してそれらの規則を適用することに
よって、外国語の発音記号を得た後、その外国語発音記
号を日本語の発音記号に変換し生成するという方式が用
いられていた(例えば、特開平5−298364号公報
参照、以後方式1と呼ぶ)。
【0004】
【発明が解決しようとする課題】しかしながら、方式1
では用意された変換規則に適合しない、つまり、例外的
な発音となる外国語文字列に対しては正しい発音記号を
付与することができないといった課題があった。また、
変換規則に適合しない外国語文字列に正しい発音記号を
付与するためには、その外国語文字列を単語辞書に登録
することでしか対応できず、単語辞書に外国語の単語が
混在することになり、辞書管理上混乱をきたすという課
題があった。さらに、単語辞書の容量が不必要に大きく
なり形態素処理における辞書索き処理時間の増大を招く
という課題があった。また、方式1では、外国語文字列
に対して単語ごとに変換規則を適用し、発音記号を割り
当てることになるため、例えば、"I have to go."と"I
have a car."という2つの英文に対して、"have"の発音
を使い分けることができないという課題があった。一
方、欧文−音声変換装置における発音記号生成方式に関
して、外国語文字列、とりわけ、日本語文字列の取り扱
いを方式1で行おうとすると、発音記号への変換規則で
対応することは事実上不可能であるという課題があっ
た。本発明はこのような課題を考慮し、入力文章中の外
国語文字列に対して正しい発音記号を付与する方式を提
供することを目的とするものである。
【0005】
【課題を解決するための手段】文章を入力して音声を出
力する文−音声変換装置において、第1の言語の形態素
解析を行う言語1形態素解析手段と、前記言語1形態素
解析手段が解析できなかった第2の言語の文字列を特定
する言語2文字列判定手段と、前記言語2文字列判定手
段が特定した第2の言語の文字列の形態素解析を行う言
語2形態素解析手段と、前記言語2形態素解析手段が出
力する形態素列が含む単語の発音情報に対して必要な変
形を行う言語2構文解析手段と、前記言語2構文解析手
段が出力する読みから第2の言語の発音記号を出力する
言語2発音記号生成手段と、前記言語2発音記号生成手
段を言語1の発音記号に変換する言語2−言語1発音記
号変換手段を有することを特徴とする発音記号生成装置
である。
【0006】また、n種類の各言語iに対して、言語i
形態素解析手段と、言語i文字列判定手段と、言語i構
文解析手段と、各言語間の発音記号変換手段を有する発
音記号生成装置である。
【0007】図1に、本発明の原理を示す。図1では、
言語の種類が2つの場合を示す。図において、言語1形
態素解析部101、言語2形態素処理部102は、それ
ぞれの言語の入力文字列に対して、辞書索きを行い形態
素列に分割する。言語2文字列判定部103は、言語1
形態素解析部101が解析に失敗した第2の言語文字列
を特定する。言語1文字列判定部104は、言語2形態
素解析部102が解析に失敗した第1の言語文字列を特
定する。言語1構文解析部105、言語2構文解析部1
06は、それぞれの言語の形態素列に含まれる発音情報
に対して必要な変形を行う。言語1発音記号生成部10
7、言語2発音記号生成部108は、それぞれの言語の
発音情報から発音記号を生成する。言語2−言語1発音
記号変換部109は、第2の言語の発音記号列を第1の
言語の発音記号列へ変換する。言語1−言語2発音記号
変換部110は、第1の言語の発音記号列を第2の言語
の発音記号列へ変換する。
【0008】図1において、第1の言語の入力文字列
は、言語1形態素解析処理部101、言語1構文解析部
105、言語1発音記号生成部を経て、第1の言語の発
音記号列へと変換される。
【0009】第1の言語の入力文字列に第2の言語文字
列が含まれている場合は、言語1形態素解析部101の
処理が第2の言語文字列の箇所まで及んだ時点で、解析
に失敗するので、言語2文字列判定部103により第2
の言語文字列部分を特定する。言語2文字列判定部が特
定した第2の言語文字列は、言語2形態素解析部102
へ渡し、言語2構文解析部106、言語2発音記号生成
部108、言語2−言語1発音記号変換部を経て、第1
の言語の発音記号列に変換される。
【0010】このように、第1の言語に対する外国語文
字列、すなわち、第2の言語文字列に対して、言語2形
態素解析部が辞書索きを含む形態素解析処理を行うの
で、例外的な発音の単語も含めて正しく発音記号を付与
することができる。
【0011】また、第1の言語の単語情報は、言語1形
態素解析部101の辞書へ登録し、第2の言語の単語情
報は、言語2形態素解析部102の辞書へ登録すること
が可能な構成なので、単一の辞書に各言語の単語情報が
混在するのを避けることができる。
【0012】さらに、各言語の辞書の容量は各言語にと
って必要な量に抑えることができる。
【0013】言語2構文解析部106において、構文上
必要な発音の変化に対応するので、例えば、2つの英
文"I have to go."と"I have a car."における"have"の
発音の使い分けを行うことが可能である。
【0014】また、表記から発音を導き出せない表意文
字で表記する日本語が欧文文章に含まれる場合でも、日
本語文字列に対して形態素解析、構文解析を行うので、
正しく発音記号列に変換することが可能である。
【0015】
【発明の実施の形態】図2に本発明の一実施例の発音記
号生成装置の構成図を示す。日本語形態素解析部201
は、日本語の入力文字列を、日本語単語辞書202を辞
書索きしながら、日本語形態素の列に分割する。日本語
構文解析部207は、日本語形態素解析部201が出力
する日本語形態素列の発音情報に対して構文上必要な変
形を施す。日本語発音記号生成部209は、日本語構文
解析部207から受け取った日本語形態素列の発音情報
に基づいて、日本語の発音記号列を生成する。
【0016】一方、英語形態素解析部203は、英語の
入力文字列を、英語単語辞書204を辞書索きしなが
ら、英語の形態素の列に分割する。英語構文解析部20
8は、英語形態素解析部203が出力する英語形態素列
の発音情報に対して構文上必要な変形を施す。英語発音
記号生成部210は、英語構文解析部208から受け取
った英語形態素列の発音情報に基づいて、英語の発音記
号列を生成する。
【0017】日本語入力文字列中に英語文字列が含まれ
ていた場合は、日本語形態素解析部201において解析
に失敗した時点で、英語文字列判定部205が英語文字
列部分を特定し、その英語文字列部分を英語形態素解析
部203、英語構文解析部208、英語発音記号生成部
210を経て英語の発音記号列に変換した後、英語−日
本語発音記号変換部211において、日本語の発音記号
列に変換し、英語文字列部分に対する日本語の発音記号
列を得る。
【0018】英語入力文字列中に日本語文字列が含まれ
ていた場合は、英語形態素解析部203において解析に
失敗した時点で、日本語文字列判定部206が日本語文
字列部分を特定し、その日本語文字列部分を日本語形態
素解析部201、日本語構文解析部207、日本語発音
記号生成部209を経て日本語の発音記号列に変換した
後、日本語−英語発音記号変換部213において、英語
の発音記号列に変換し、日本語文字列部分に対する英語
の発音記号列を得る。
【0019】英語−日本語発音記号変換部211、日本
語−英語発音記号変換部213は、それぞれ、発音記号
の変換の際には、英語−日本語発音記号変換テーブル2
12、日本語−英語発音記号変換テーブル214を参照
することにより、発音記号の変換を行う。図3に、英語
−日本語発音記号変換テーブルの一例を示す。日本語の
発音記号は、ローマ字表記としている。図3において、
左側は母音の変換テーブル、右側は子音の変換テーブル
である。母音の変換テーブルにおいて、'-' は、その前
の母音を長母音として発音することを示す。子音の変換
テーブルにおいて、括弧で囲んである部分は、その子音
が発音記号列の最後である場合に、その発音記号へ変換
することを示す。図4に、日本語−英語発音記号変換テ
ーブルの一例を示す。図4において、左側の上から5つ
の 'a','i','u','e','o'は、母音の変換テーブル、それ
以外は子音の変換テーブルである。
【0020】なお、上記実施例では、対象言語の種類を
日本語と英語の2種類としたが、対象言語を2種類以上
としてもよい。その場合、入力文字列に含まれる複数の
言語の文字列に対して、上記実施例と同様に正しい発音
記号を付与することが可能である。
【0021】
【発明の効果】以上述べたところから明らかなように、
本発明は、ある言語の文章を音声変換する際に、文章中
に含まれる外国語文字列に対して、それが例外的な発音
をもつ場合であっても正しい発音記号を付与し、当該言
語の発音記号列に変換することができ、聴取者が違和感
のなく変換された音声を聞き取ることができるという長
所を有する。
【図面の簡単な説明】
【図1】本発明の動作を示す図
【図2】本発明の一実施例の構成を示す図
【図3】英語−日本語発音変換テーブルの一例を示す図
【図4】日本語−英語発音変換テーブルの一例を示す図

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】文章を入力して音声を出力する文−音声変
    換装置において、第1の言語の形態素解析を行う言語1
    形態素解析手段と、前記言語1形態素解析手段が解析で
    きなかった第2の言語の文字列を特定する言語2文字列
    判定手段と、前記言語2文字列判定手段が特定した第2
    の言語の文字列の形態素解析を行う言語2形態素解析手
    段と、前記言語2形態素解析手段が出力する形態素列が
    含む単語の発音情報に対して必要な変形を行う言語2構
    文解析手段と、前記言語2構文解析手段が出力する読み
    から第2の言語の発音記号を出力する言語2発音記号生
    成手段と、前記言語2発音記号生成手段を言語1の発音
    記号に変換する言語2−言語1発音記号変換手段を有す
    ることを特徴とする発音記号生成装置。
  2. 【請求項2】n種類の各言語iに対して、言語i形態素
    解析手段と、言語i文字列判定手段と、言語i構文解析
    手段と、各言語間の発音記号変換手段を有する請求項1
    記載発音記号生成装置。
JP8089225A 1996-04-11 1996-04-11 発音記号生成装置 Pending JPH09281993A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8089225A JPH09281993A (ja) 1996-04-11 1996-04-11 発音記号生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8089225A JPH09281993A (ja) 1996-04-11 1996-04-11 発音記号生成装置

Publications (1)

Publication Number Publication Date
JPH09281993A true JPH09281993A (ja) 1997-10-31

Family

ID=13964804

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8089225A Pending JPH09281993A (ja) 1996-04-11 1996-04-11 発音記号生成装置

Country Status (1)

Country Link
JP (1) JPH09281993A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7603278B2 (en) 2004-09-15 2009-10-13 Canon Kabushiki Kaisha Segment set creating method and apparatus
JP2012118720A (ja) * 2010-11-30 2012-06-21 Fujitsu Ltd 言語処理装置、音声合成装置、言語処理方法及び言語処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7603278B2 (en) 2004-09-15 2009-10-13 Canon Kabushiki Kaisha Segment set creating method and apparatus
JP2012118720A (ja) * 2010-11-30 2012-06-21 Fujitsu Ltd 言語処理装置、音声合成装置、言語処理方法及び言語処理プログラム

Similar Documents

Publication Publication Date Title
WO2003056450A1 (en) Syntax analysis method and apparatus
EP0398513B1 (en) Method and apparatus for translating a sentence including a compound word formed by hyphenation
JPH09281993A (ja) 発音記号生成装置
KR100304654B1 (ko) 한국어문서해석방법및장치
JP2632806B2 (ja) 言語解析装置
KR0180650B1 (ko) 음성합성기의 한국어 문장분석방법
JP2658476B2 (ja) 文書点字化装置
JP4103311B2 (ja) 自然言語処理装置及び方法
JP2954592B2 (ja) 言語解析装置
JP2801601B2 (ja) テキスト音声合成装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPH07121537A (ja) 文書処理装置及びその方法
KR19990079824A (ko) 하이픈으로 연결된 복합어 처리에 적합한 형태소 해석장치와 방법 및 그 장치를 구비한 언어 번역장치
JP2947554B2 (ja) 機械翻訳装置
JPH02257363A (ja) 自動翻訳装置
JP2000214881A (ja) 音声認識言語モデル生成装置及び音声認識言語モデル生成方法
JPH11224250A (ja) 辞書装置
JPH1166069A (ja) 機械翻訳装置
JPH09185623A (ja) 言語処理装置及び方法
KR940018737A (ko) 음성합성시스템의 운율제어용 구문분석장치의 방법
JPH10105552A (ja) 機械翻訳システム
JPH02140869A (ja) 文章の構造解析方法
JPH06223066A (ja) 文章検査方式
JPH0550777B2 (ja)
JPH05290084A (ja) 未登録語翻訳方式