JPH10222516A - 多言語対応通信システム - Google Patents
多言語対応通信システムInfo
- Publication number
- JPH10222516A JPH10222516A JP9026343A JP2634397A JPH10222516A JP H10222516 A JPH10222516 A JP H10222516A JP 9026343 A JP9026343 A JP 9026343A JP 2634397 A JP2634397 A JP 2634397A JP H10222516 A JPH10222516 A JP H10222516A
- Authority
- JP
- Japan
- Prior art keywords
- document data
- document
- language
- intermediate format
- client device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 65
- 238000004458 analytical method Methods 0.000 claims abstract description 69
- 238000000034 method Methods 0.000 description 37
- 238000012545 processing Methods 0.000 description 28
- 238000010586 diagram Methods 0.000 description 14
- 238000013500 data storage Methods 0.000 description 10
- 230000001419 dependent effect Effects 0.000 description 9
- 230000000877 morphologic effect Effects 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 2
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】
【課題】 クライアント装置に特別な言語翻訳プログラ
ムを必要とせず、かつ多数の言語で記述される文書デー
タをより簡易に提供することができる多言語対応通信シ
ステムを提供することである。 【解決手段】 サーバー装置102は、自然言語で記述
された文書データを、文法的、意味的に解析し中間形式
文書データ104を作成し、記憶装置に記憶する。ま
た、文書データに曖昧さがあった場合でも、複数の解析
結果を表示選択し、望ましい中間形式文書データ104
を作成する。そして、クライアント装置103から文書
データの要求があると、その文書データに対応した中間
形式文書データ104を記憶装置から読み出し、読み出
した中間形式文書データ104からクライアント装置1
03が要求する自然言語で記述された文書データを生成
し、生成された文書データをクライアント装置103に
送信する。
ムを必要とせず、かつ多数の言語で記述される文書デー
タをより簡易に提供することができる多言語対応通信シ
ステムを提供することである。 【解決手段】 サーバー装置102は、自然言語で記述
された文書データを、文法的、意味的に解析し中間形式
文書データ104を作成し、記憶装置に記憶する。ま
た、文書データに曖昧さがあった場合でも、複数の解析
結果を表示選択し、望ましい中間形式文書データ104
を作成する。そして、クライアント装置103から文書
データの要求があると、その文書データに対応した中間
形式文書データ104を記憶装置から読み出し、読み出
した中間形式文書データ104からクライアント装置1
03が要求する自然言語で記述された文書データを生成
し、生成された文書データをクライアント装置103に
送信する。
Description
【0001】
【発明の属する技術分野】本発明は、翻訳機能を持つこ
とによって所望の言語に翻訳した文書データを提供可能
なサーバー装置と、文書データの表示が可能なクライア
ント装置とを通信ネットワークを介して接続した多言語
対応通信システムに関するものである。
とによって所望の言語に翻訳した文書データを提供可能
なサーバー装置と、文書データの表示が可能なクライア
ント装置とを通信ネットワークを介して接続した多言語
対応通信システムに関するものである。
【0002】
【従来の技術】従来、インターネットに代表されるよう
に、通信ネットワークを介して、文書データを検索、閲
覧するシステムが普及している。この様なシステムは、
各種の文書データを記憶する少なくとも1つのサーバー
装置と、文書データの表示が可能な少なくとも1つのク
ライアント装置と、それらを接続する通信ネットワーク
とで構成される。通信ネットワークは、公衆回線網や、
専用回線網あるいはその組み合わせから構成される。サ
ーバー装置は、各種の文書データが記憶できる記憶装置
と、通信ネットワークへの接続装置とを備え、クライア
ント装置は文書データを表示可能な表示装置と、閲覧し
たい文書の指示情報を入力できる入力装置と、通信ネッ
トワークへの接続装置とを備える。
に、通信ネットワークを介して、文書データを検索、閲
覧するシステムが普及している。この様なシステムは、
各種の文書データを記憶する少なくとも1つのサーバー
装置と、文書データの表示が可能な少なくとも1つのク
ライアント装置と、それらを接続する通信ネットワーク
とで構成される。通信ネットワークは、公衆回線網や、
専用回線網あるいはその組み合わせから構成される。サ
ーバー装置は、各種の文書データが記憶できる記憶装置
と、通信ネットワークへの接続装置とを備え、クライア
ント装置は文書データを表示可能な表示装置と、閲覧し
たい文書の指示情報を入力できる入力装置と、通信ネッ
トワークへの接続装置とを備える。
【0003】例えば、インターネットでは、サーバー装
置、クライアント装置共に非常に多くの装置が接続され
ており、その所在地も全世界に広がっている。そして、
それらを接続する通信ネットワークを介して世界各地の
様々な情報を、検索、閲覧することが可能なシステムと
なっている。
置、クライアント装置共に非常に多くの装置が接続され
ており、その所在地も全世界に広がっている。そして、
それらを接続する通信ネットワークを介して世界各地の
様々な情報を、検索、閲覧することが可能なシステムと
なっている。
【0004】このようなインターネットでは、図15に
示すように、各サーバー装置1502には、英語とか、日本
語、中国語等の様々な言語で記述された文書データが記
憶されている。通信ネットワーク1501を介してサーバー
装置に接続されているクライアント装置1503では、これ
らの様々な言語で記述された文書データをそれぞれの言
語で表示することが可能である。また、言語翻訳プログ
ラムを内蔵するクライアント装置もあり、必要に応じて
所望の言語に翻訳して文書データを表示することも可能
である。
示すように、各サーバー装置1502には、英語とか、日本
語、中国語等の様々な言語で記述された文書データが記
憶されている。通信ネットワーク1501を介してサーバー
装置に接続されているクライアント装置1503では、これ
らの様々な言語で記述された文書データをそれぞれの言
語で表示することが可能である。また、言語翻訳プログ
ラムを内蔵するクライアント装置もあり、必要に応じて
所望の言語に翻訳して文書データを表示することも可能
である。
【0005】
【発明が解決しようとする課題】上述したシステム、特
にインターネットのように全世界に広がったネットワー
クを介して様々な文書データを閲覧する場合、文書デー
タの提供者と、その文書データの閲覧者とは異なる言語
を母国語としていることが多い。しかし、母国語以外の
言語での記述や、その理解には困難を伴うことが多い。
これを解決するため、次の2つの方法が知られている。
1つは、同一内容の文書を複数の言語で記述された複数
の文書データとしてサーバー装置に記憶させ、所望の言
語の文書データをクライアント装置から選択すること
で、所望の言語で記述された文書データを閲覧可能とす
る方法である。他の方法は、言語翻訳プログラムをクラ
イアント装置に搭載し、その言語翻訳プログラムを用い
てサーバーから送信されてきた文書データを所望する言
語の文書データに翻訳する方法である。これらの方法に
より、母国語以外の言語で記述された文書データも母国
語で閲覧可能となる。しかし、その場合でも以下のよう
な問題が残されている。
にインターネットのように全世界に広がったネットワー
クを介して様々な文書データを閲覧する場合、文書デー
タの提供者と、その文書データの閲覧者とは異なる言語
を母国語としていることが多い。しかし、母国語以外の
言語での記述や、その理解には困難を伴うことが多い。
これを解決するため、次の2つの方法が知られている。
1つは、同一内容の文書を複数の言語で記述された複数
の文書データとしてサーバー装置に記憶させ、所望の言
語の文書データをクライアント装置から選択すること
で、所望の言語で記述された文書データを閲覧可能とす
る方法である。他の方法は、言語翻訳プログラムをクラ
イアント装置に搭載し、その言語翻訳プログラムを用い
てサーバーから送信されてきた文書データを所望する言
語の文書データに翻訳する方法である。これらの方法に
より、母国語以外の言語で記述された文書データも母国
語で閲覧可能となる。しかし、その場合でも以下のよう
な問題が残されている。
【0006】先ず、同一内容の文書を複数の言語で記述
された複数の文書データとしてサーバー装置に記憶させ
る方法では、1つの内容の文書でも、その内容を様々な
言語で記述された複数の文書データとして作成する必要
があり、多くの費用と労力を必要とする問題がある。
された複数の文書データとしてサーバー装置に記憶させ
る方法では、1つの内容の文書でも、その内容を様々な
言語で記述された複数の文書データとして作成する必要
があり、多くの費用と労力を必要とする問題がある。
【0007】また、言語翻訳プログラムをクライアント
装置に搭載する方法では、各サーバーにより提供される
様々な言語の文章を全て翻訳して表示するためには、ク
ライアント装置にそれぞれの言語から所望の言語へ翻訳
可能な多数の言語翻訳プログラムを搭載する必要があ
る。これはクライアント装置のコストを上昇させる。ま
た、現在実用化されている言語翻訳プログラムでは、翻
訳する原文書に元来含まれている曖昧さにより、望まし
い翻訳結果が得られないと言う問題もある。
装置に搭載する方法では、各サーバーにより提供される
様々な言語の文章を全て翻訳して表示するためには、ク
ライアント装置にそれぞれの言語から所望の言語へ翻訳
可能な多数の言語翻訳プログラムを搭載する必要があ
る。これはクライアント装置のコストを上昇させる。ま
た、現在実用化されている言語翻訳プログラムでは、翻
訳する原文書に元来含まれている曖昧さにより、望まし
い翻訳結果が得られないと言う問題もある。
【0008】これを解決するために、本出願人が既に出
願した特願平8−322842号には、サーバー装置に
記憶される文書データを、自然言語で記述された文書デ
ータではなく、自然言語で記述された文書データを文法
的、意味的に解析した結果として得られる中間形式文書
データとして記憶する。そして、クライアント装置から
文書データの要求があると、その文書データに対応した
中間形式文書データを記憶装置から読み出し、読み出し
た中間形式文書データからクライアント装置が要求する
自然言語で記述された文書データを生成し、生成された
文書データをクライアント装置に送信する。このよう
に、クライアント装置に特別な言語翻訳プログラムを必
要とせず、かつ多数の言語で記述される文書データをよ
り簡易に提供可能な多言語対応通信システムが記述され
ている。
願した特願平8−322842号には、サーバー装置に
記憶される文書データを、自然言語で記述された文書デ
ータではなく、自然言語で記述された文書データを文法
的、意味的に解析した結果として得られる中間形式文書
データとして記憶する。そして、クライアント装置から
文書データの要求があると、その文書データに対応した
中間形式文書データを記憶装置から読み出し、読み出し
た中間形式文書データからクライアント装置が要求する
自然言語で記述された文書データを生成し、生成された
文書データをクライアント装置に送信する。このよう
に、クライアント装置に特別な言語翻訳プログラムを必
要とせず、かつ多数の言語で記述される文書データをよ
り簡易に提供可能な多言語対応通信システムが記述され
ている。
【0009】しかし、このような既提案の多言語対応通
信システムにおいても、次のような問題点が残されてい
る。
信システムにおいても、次のような問題点が残されてい
る。
【0010】中間形式文書データを作成するのに元とし
た自然言語で記述された文書データは、曖昧さを多く含
み、それを文法的、意味的に解析したとしても、望まし
い中間形式文書データが生成されないことがある。その
結果、サーバー装置が生成する自然言語で記述された文
書データの意味するところが中間形式文書データを作成
するのに元とした自然言語で記述された文書データと異
なる。さらに、望ましい中間形式文書データを生成する
ためには、中間形式文書データを作成するのに元とする
自然言語で記述された文書データの曖昧さを取り除くた
めに、その文書データを修正しなくてはならないという
問題があった。
た自然言語で記述された文書データは、曖昧さを多く含
み、それを文法的、意味的に解析したとしても、望まし
い中間形式文書データが生成されないことがある。その
結果、サーバー装置が生成する自然言語で記述された文
書データの意味するところが中間形式文書データを作成
するのに元とした自然言語で記述された文書データと異
なる。さらに、望ましい中間形式文書データを生成する
ためには、中間形式文書データを作成するのに元とする
自然言語で記述された文書データの曖昧さを取り除くた
めに、その文書データを修正しなくてはならないという
問題があった。
【0011】本発明は、上述した問題点を解決するため
になされたものであり、望ましい中間形式文書データを
容易に生成可能な多言語対応通信システムを提供するこ
とを目的とする。
になされたものであり、望ましい中間形式文書データを
容易に生成可能な多言語対応通信システムを提供するこ
とを目的とする。
【0012】
【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に記載の多言語対応通信システム
は、前記クライアント装置と、前記クライアント装置か
らの要求に応じた前記文書データを前記クライアント装
置に送信するためのサーバー装置とから構成される。前
記クライアント装置では、要求情報送信手段が、所望の
文書データを特定可能な文書識別情報と、その文書デー
タの記述言語を指定する要求言語情報とを前記サーバー
装置に送信し、前記受信出力手段が、前記サーバー装置
から文書データを受信し、表示出力、印字出力、音声出
力等の出力処理を行う。
に、本発明の請求項1に記載の多言語対応通信システム
は、前記クライアント装置と、前記クライアント装置か
らの要求に応じた前記文書データを前記クライアント装
置に送信するためのサーバー装置とから構成される。前
記クライアント装置では、要求情報送信手段が、所望の
文書データを特定可能な文書識別情報と、その文書デー
タの記述言語を指定する要求言語情報とを前記サーバー
装置に送信し、前記受信出力手段が、前記サーバー装置
から文書データを受信し、表示出力、印字出力、音声出
力等の出力処理を行う。
【0013】前記サーバー装置では、要求情報受信手段
が前記クライアント装置から前記文書識別情報と、前記
要求言語情報とを受信し、中間形式文書記憶手段が、自
然言語で記述された文書を文法的、意味的に解析した結
果として得られる中間形式表現で記述した中間形式文書
データを少なくとも1つ記憶し、文書読み出し手段が、
前記文書識別情報に対応した中間形式文書データを、前
記中間形式記憶手段から読み出し、目標言語文書生成手
段が、前記読み出し手段で読み出した中間形式文書デー
タから、前記要求言語情報に対応した言語で記述した文
書データを生成し、文書送信手段が、前記目標言語文書
生成手段で生成された文書データを、前記クライアント
装置に送信する。
が前記クライアント装置から前記文書識別情報と、前記
要求言語情報とを受信し、中間形式文書記憶手段が、自
然言語で記述された文書を文法的、意味的に解析した結
果として得られる中間形式表現で記述した中間形式文書
データを少なくとも1つ記憶し、文書読み出し手段が、
前記文書識別情報に対応した中間形式文書データを、前
記中間形式記憶手段から読み出し、目標言語文書生成手
段が、前記読み出し手段で読み出した中間形式文書デー
タから、前記要求言語情報に対応した言語で記述した文
書データを生成し、文書送信手段が、前記目標言語文書
生成手段で生成された文書データを、前記クライアント
装置に送信する。
【0014】また、前記サーバー装置において、原文書
入力手段により所定の言語で記述された文書データを入
力し、前記原文書解析手段により入力した文書データを
解析して、その文書データの解析結果から中間形式文書
データを生成し、前記中間形式記憶手段により、生成さ
れた中間形式文書データを記憶する。さらに、前記原文
書解析手段の解析において、解析する文書データの曖昧
さにより、解析結果が複数生じた場合は、それを解析結
果表示手段が表示する。
入力手段により所定の言語で記述された文書データを入
力し、前記原文書解析手段により入力した文書データを
解析して、その文書データの解析結果から中間形式文書
データを生成し、前記中間形式記憶手段により、生成さ
れた中間形式文書データを記憶する。さらに、前記原文
書解析手段の解析において、解析する文書データの曖昧
さにより、解析結果が複数生じた場合は、それを解析結
果表示手段が表示する。
【0015】このように、クライアントから所望の記述
言語を指定でき、それに従って中間形式文書データの形
式で記憶された文書データから自然言語で記述された文
書データを生成し、クライアント装置で出力できるの
で、サーバー装置に多数の言語で記述した文書データを
保存したり、クライアント装置に言語翻訳プログラムを
搭載することなく、所望の言語で表記された文書データ
の閲覧が可能である。また、自然言語で記述された文書
データから中間形式文書データを生成するため、中間形
式文書データを容易に作成できる。さらに、自然言語で
記述された文書データが曖昧である場合は、その解析結
果が表示されるため、中間形式文書データが望ましいか
そうでないかが判断できる。
言語を指定でき、それに従って中間形式文書データの形
式で記憶された文書データから自然言語で記述された文
書データを生成し、クライアント装置で出力できるの
で、サーバー装置に多数の言語で記述した文書データを
保存したり、クライアント装置に言語翻訳プログラムを
搭載することなく、所望の言語で表記された文書データ
の閲覧が可能である。また、自然言語で記述された文書
データから中間形式文書データを生成するため、中間形
式文書データを容易に作成できる。さらに、自然言語で
記述された文書データが曖昧である場合は、その解析結
果が表示されるため、中間形式文書データが望ましいか
そうでないかが判断できる。
【0016】また、請求項2に記載の多言語対応通信シ
ステムでは、前記サーバー装置において、前期解析結果
表示手段が表示した複数の解析結果から解析結果確定手
段が特定の解析結果を選択し、解析結果として確定させ
る。
ステムでは、前記サーバー装置において、前期解析結果
表示手段が表示した複数の解析結果から解析結果確定手
段が特定の解析結果を選択し、解析結果として確定させ
る。
【0017】このように、自然言語で記述された文書デ
ータが曖昧である場合は、その解析結果を選択できるた
め、望ましい中間形式文書データが作成できる。
ータが曖昧である場合は、その解析結果を選択できるた
め、望ましい中間形式文書データが作成できる。
【0018】また、請求項3に記載の多言語対応通信シ
ステムでは、前記解析結果表示手段は、構文解析木表示
手段であり、前記原文書入力手段で入力した文書データ
を解析結果として構文解析木を表示する。
ステムでは、前記解析結果表示手段は、構文解析木表示
手段であり、前記原文書入力手段で入力した文書データ
を解析結果として構文解析木を表示する。
【0019】このように、自然言語で記述された文書デ
ータが曖昧である場合には、その解析結果が構文解析木
で表示されるため、この表示を目視することによって容
易に解析結果を認識することができる。
ータが曖昧である場合には、その解析結果が構文解析木
で表示されるため、この表示を目視することによって容
易に解析結果を認識することができる。
【0020】
【発明の実施の形態】以下に、本発明多言語対応通信シ
ステムを具体化した実施の形態について図面を参照して
説明する。
ステムを具体化した実施の形態について図面を参照して
説明する。
【0021】図1に本実施の形態の多言語対応通信シス
テムの概念図を示す。サーバー装置102は、文書データ
を、特定の自然言語によらない中間形式文書データ(詳
細は後述)として記憶している。また、中間形式文書デ
ータから、目標となる自然言語(以下、目標言語と呼
ぶ)で記述された文書データを生成するための目標言語
文書生成プログラムも記憶している。クライアント装置
103は通信ネットワーク101を介して、文書データの指示
情報と、その文書データの記述言語の指示情報とからな
る要求情報を所望のサーバー装置102に送信する。サー
バー装置102は、クライアント装置103から送信された要
求情報に基づいて、指定された中間形式文書データから
指定された自然言語による文書データを生成し、生成し
た文書データを通信ネットワーク101を介してクライア
ント装置103に送信する。そして、クライアント装置
は、その文書データを受信し、表示出力、印字出力、音
声出力等の出力を行う。
テムの概念図を示す。サーバー装置102は、文書データ
を、特定の自然言語によらない中間形式文書データ(詳
細は後述)として記憶している。また、中間形式文書デ
ータから、目標となる自然言語(以下、目標言語と呼
ぶ)で記述された文書データを生成するための目標言語
文書生成プログラムも記憶している。クライアント装置
103は通信ネットワーク101を介して、文書データの指示
情報と、その文書データの記述言語の指示情報とからな
る要求情報を所望のサーバー装置102に送信する。サー
バー装置102は、クライアント装置103から送信された要
求情報に基づいて、指定された中間形式文書データから
指定された自然言語による文書データを生成し、生成し
た文書データを通信ネットワーク101を介してクライア
ント装置103に送信する。そして、クライアント装置
は、その文書データを受信し、表示出力、印字出力、音
声出力等の出力を行う。
【0022】図2には本発明を好適に適用した実施の形
態のサーバー装置のブロック図を示す。
態のサーバー装置のブロック図を示す。
【0023】サーバー装置102は、ROM202と、RAM203、C
PU204、表示制御部205、入力部206、通信制御部207及び
それらを接続するバス209より構成される。CPU204は記
憶されている各種のプログラムに基づいて様々な制御を
実行し、本サーバー装置102の動作の主体をなしてい
る。表示制御部205は、表示データの蓄積とディスプレ
イモニターの制御とを行い、モニター208に表示出力を
行う。モニター208は、CRTディスプレイや、LCDディス
プレイ等様々な表示装置を利用できる。入力部206は、
記憶される文書データの入力や、サーバー装置102への
指示を入力するためのものであり、キーボード装置であ
る。通信制御部207は、通信網210と接続される。通信網
210は、公衆回線や、専用回線の回線網であって、通信
ネットワーク101の構成要素である。通信制御部207は、
通信網210とサーバー装置102とのデータ通信を制御し、
データの送受信を行う。通信制御部207は、公衆回線や
専用回線と接続するためのモデム装置である。
PU204、表示制御部205、入力部206、通信制御部207及び
それらを接続するバス209より構成される。CPU204は記
憶されている各種のプログラムに基づいて様々な制御を
実行し、本サーバー装置102の動作の主体をなしてい
る。表示制御部205は、表示データの蓄積とディスプレ
イモニターの制御とを行い、モニター208に表示出力を
行う。モニター208は、CRTディスプレイや、LCDディス
プレイ等様々な表示装置を利用できる。入力部206は、
記憶される文書データの入力や、サーバー装置102への
指示を入力するためのものであり、キーボード装置であ
る。通信制御部207は、通信網210と接続される。通信網
210は、公衆回線や、専用回線の回線網であって、通信
ネットワーク101の構成要素である。通信制御部207は、
通信網210とサーバー装置102とのデータ通信を制御し、
データの送受信を行う。通信制御部207は、公衆回線や
専用回線と接続するためのモデム装置である。
【0024】なお、入力部206は、前記の構成以外に、
マウス装置等の指示装置や、音声入力装置、タッチパネ
ル装置等の様々な入力装置や、その組み合わせで構成し
てもよい。また、通信制御部207は、無線の公衆回線や
専用回線と接続するための送受信装置とか、LAN(Local
Area Network)に接続するためのイーサーネット接続装
置、トークンリング接続装置とか、ATM(Asynchronous T
ransfer Mode)回線網への接続装置等、様々な接続装置
でもよい。
マウス装置等の指示装置や、音声入力装置、タッチパネ
ル装置等の様々な入力装置や、その組み合わせで構成し
てもよい。また、通信制御部207は、無線の公衆回線や
専用回線と接続するための送受信装置とか、LAN(Local
Area Network)に接続するためのイーサーネット接続装
置、トークンリング接続装置とか、ATM(Asynchronous T
ransfer Mode)回線網への接続装置等、様々な接続装置
でもよい。
【0025】ROM202は各種プログラムや、翻訳辞書のデ
ータ等を記憶している。
ータ等を記憶している。
【0026】ROM202内にはさらに各種の記憶部が形成さ
れている。通信制御プログラム記憶部202aは、通信制御
部207を介した各種通信の制御や、クライアント装置か
らの文書データ要求の受信や、生成された文書データの
クライアント装置への送信処理等を行う通信制御プログ
ラムを記憶している。通信制御プログラムと、通信制御
部207とが本発明の要求情報受信手段と、文書送信手段
との主体をなす。
れている。通信制御プログラム記憶部202aは、通信制御
部207を介した各種通信の制御や、クライアント装置か
らの文書データ要求の受信や、生成された文書データの
クライアント装置への送信処理等を行う通信制御プログ
ラムを記憶している。通信制御プログラムと、通信制御
部207とが本発明の要求情報受信手段と、文書送信手段
との主体をなす。
【0027】目標言語文書生成プログラム記憶部202b
は、中間形式文書データに基づいて、各種の目標言語文
書データを生成するための目標言語文書生成プログラム
を記憶する。なお、目標言語文書生成プログラムが本発
明の目標言語文書生成手段の主体をなす。本実施の形態
では、生成する文書の目標言語の種類に応じて目標言語
文書生成プログラムが別になっているものとし、目標言
語文書生成プログラム記憶部202bは、生成する文書の目
標言語に応じた少なくとも1つの目標言語文書生成プロ
グラムを記憶する。なお、前記以外に、各目標言語に対
応した別々の目標言語文書生成プログラムを用いるので
はなく、全ての目標言語に対応できる単一の目標言語文
書生成プログラムを用い、目標言語文書生成プログラム
記憶部202bはその単一の目標言語文書生成プログラムを
記憶してもよい。あるいは、言語構造として類似した複
数の目標言語に対応可能な目標言語文書生成プログラム
を用い、それを記憶してもよい。
は、中間形式文書データに基づいて、各種の目標言語文
書データを生成するための目標言語文書生成プログラム
を記憶する。なお、目標言語文書生成プログラムが本発
明の目標言語文書生成手段の主体をなす。本実施の形態
では、生成する文書の目標言語の種類に応じて目標言語
文書生成プログラムが別になっているものとし、目標言
語文書生成プログラム記憶部202bは、生成する文書の目
標言語に応じた少なくとも1つの目標言語文書生成プロ
グラムを記憶する。なお、前記以外に、各目標言語に対
応した別々の目標言語文書生成プログラムを用いるので
はなく、全ての目標言語に対応できる単一の目標言語文
書生成プログラムを用い、目標言語文書生成プログラム
記憶部202bはその単一の目標言語文書生成プログラムを
記憶してもよい。あるいは、言語構造として類似した複
数の目標言語に対応可能な目標言語文書生成プログラム
を用い、それを記憶してもよい。
【0028】中間形式文書データ作成プログラム記憶部
202cは、所定の自然言語で記述された文書データに基づ
いて、中間形式文書データを作成する中間形式文書デー
タ作成プログラムを記憶する。なお、中間形式文書デー
タ作成プログラムが本発明の原文書解析手段と、解析結
果表示手段と、解析結果確定手段の主体をなす。
202cは、所定の自然言語で記述された文書データに基づ
いて、中間形式文書データを作成する中間形式文書デー
タ作成プログラムを記憶する。なお、中間形式文書デー
タ作成プログラムが本発明の原文書解析手段と、解析結
果表示手段と、解析結果確定手段の主体をなす。
【0029】文書管理プログラム記憶部202dは、中間形
式文書データ記憶部203dに対して中間形式文書データを
保存、読み出し、あるいは、検索を行うときの主体とな
る文書管理プログラムを記憶する。
式文書データ記憶部203dに対して中間形式文書データを
保存、読み出し、あるいは、検索を行うときの主体とな
る文書管理プログラムを記憶する。
【0030】翻訳辞書記憶部202eは、目標言語文書生成
プログラムが処理を行う場合に必要とされる、目標言語
に対応した生成規則データ、形態素生成辞書等の各種デ
ータを記憶している。さらに、翻訳辞書記憶部202eは、
中間形式文書データ作成プログラムが処理を行う場合に
必要とされる形態素解析辞書、構文規則データ、構文解
析辞書、依存規則データ等の各種データも記憶してい
る。
プログラムが処理を行う場合に必要とされる、目標言語
に対応した生成規則データ、形態素生成辞書等の各種デ
ータを記憶している。さらに、翻訳辞書記憶部202eは、
中間形式文書データ作成プログラムが処理を行う場合に
必要とされる形態素解析辞書、構文規則データ、構文解
析辞書、依存規則データ等の各種データも記憶してい
る。
【0031】なお、ROM202は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
【0032】RAM203は、中間形式文書データ等のデータ
の保存や、様々な一時データを記憶するために使用さ
れ、次のような各記憶部が内部に形成されている。
の保存や、様々な一時データを記憶するために使用さ
れ、次のような各記憶部が内部に形成されている。
【0033】ワークメモリ203aは各プログラムが動作時
に必要とする一時的な記憶領域を提供する。生成文書メ
モリ203bは、中間形式文書データ記憶部203dに記憶され
た中間形式文書データに基づいて、目標言語文書生成プ
ログラム記憶部202bに記憶された目標言語文書生成プロ
グラムが生成した目標言語文書データを一時的に記憶す
る。原文書メモリ203cは、中間言語作成プログラムの入
力データとなる、所定の自然言語で記述された文書デー
タ(以下、原文書データと呼ぶ)を記憶する。原文書デー
タは入力部206や、通信制御部207を介して入力される。
に必要とする一時的な記憶領域を提供する。生成文書メ
モリ203bは、中間形式文書データ記憶部203dに記憶され
た中間形式文書データに基づいて、目標言語文書生成プ
ログラム記憶部202bに記憶された目標言語文書生成プロ
グラムが生成した目標言語文書データを一時的に記憶す
る。原文書メモリ203cは、中間言語作成プログラムの入
力データとなる、所定の自然言語で記述された文書デー
タ(以下、原文書データと呼ぶ)を記憶する。原文書デー
タは入力部206や、通信制御部207を介して入力される。
【0034】中間形式文書データ記憶部203dは、中間形
式文書データを少なくとも1つ記憶している。中間形式
文書データ記憶部が、本発明の中間形式文書記憶手段の
主体をなす。
式文書データを少なくとも1つ記憶している。中間形式
文書データ記憶部が、本発明の中間形式文書記憶手段の
主体をなす。
【0035】なお、RAM203は、RAMに限らず、磁気ディ
スク装置や、光磁気ディスク装置等の記憶装置であって
もよい。さらに、中間形式文書データの作成を行わない
場合においては、中間形式文書データ記憶部203dはROM2
02上に形成してもよい。
スク装置や、光磁気ディスク装置等の記憶装置であって
もよい。さらに、中間形式文書データの作成を行わない
場合においては、中間形式文書データ記憶部203dはROM2
02上に形成してもよい。
【0036】次に、図3に本発明を好適に適用した実施
の形態のクライアント装置のブロック図を示す。
の形態のクライアント装置のブロック図を示す。
【0037】クライアント装置103は、ROM302と、RAM30
3、CPU304、表示制御部305、入力部306、通信制御部307
及びそれらを接続するバス309により構成される。CPU30
4は、記憶されている各種のプログラムに基づいて様々
な制御を実行し、本クライアント装置103の動作の主体
をなしている。表示制御部305は表示データの蓄積とデ
ィスプレイモニターの制御を行い、モニター308に表示
出力を行う。モニター308はCRTディスプレイや、LCDデ
ィスプレイ等様々な表示装置を利用できる。入力部306
は、文書データの文書識別情報や、要求言語情報等を入
力したり、クライアント装置103への各種指示を入力す
るためのものであり、キーボード装置である。通信制御
部307は、通信網210と接続され、通信網210とクライア
ント装置103とのデータ通信を制御し、データの送受信
を行う。通信制御部307は公衆回線や、専用回線と接続
するためのモデム装置である。
3、CPU304、表示制御部305、入力部306、通信制御部307
及びそれらを接続するバス309により構成される。CPU30
4は、記憶されている各種のプログラムに基づいて様々
な制御を実行し、本クライアント装置103の動作の主体
をなしている。表示制御部305は表示データの蓄積とデ
ィスプレイモニターの制御を行い、モニター308に表示
出力を行う。モニター308はCRTディスプレイや、LCDデ
ィスプレイ等様々な表示装置を利用できる。入力部306
は、文書データの文書識別情報や、要求言語情報等を入
力したり、クライアント装置103への各種指示を入力す
るためのものであり、キーボード装置である。通信制御
部307は、通信網210と接続され、通信網210とクライア
ント装置103とのデータ通信を制御し、データの送受信
を行う。通信制御部307は公衆回線や、専用回線と接続
するためのモデム装置である。
【0038】なお、入力部306は、上記の構成以外に、
マウス装置等の指示装置や、音声入力装置、タッチパネ
ル装置等の様々な入力装置や、その組み合わせで構成し
てもよい。また、通信制御部307は、無線の公衆回線や
専用回線と接続するための送受信装置とか、LAN(Local
Area Network)に接続するためのイーサーネット接続装
置、トークンリング接続装置とか、ATM(Asynchronous T
ransfer Mode)回線網への接続装置等、様々な接続装置
でもよい。また、表示制御部305とモニター308とを用い
る以外に、印字出力装置や、音声出力装置を用いる構成
とし、文書データを印字出力や音声出力する構成として
もよい。
マウス装置等の指示装置や、音声入力装置、タッチパネ
ル装置等の様々な入力装置や、その組み合わせで構成し
てもよい。また、通信制御部307は、無線の公衆回線や
専用回線と接続するための送受信装置とか、LAN(Local
Area Network)に接続するためのイーサーネット接続装
置、トークンリング接続装置とか、ATM(Asynchronous T
ransfer Mode)回線網への接続装置等、様々な接続装置
でもよい。また、表示制御部305とモニター308とを用い
る以外に、印字出力装置や、音声出力装置を用いる構成
とし、文書データを印字出力や音声出力する構成として
もよい。
【0039】ROM302は各種プログラムを記憶している。
【0040】ROM302内にはさらに各種の記憶部が形成さ
れている。通信制御プログラム記憶部302aは、通信制御
部307を介した各種通信の制御や、サーバー装置へのデ
ータ送受信処理等を行う通信制御プログラムを記憶して
いる。この通信制御プログラムと、通信制御部307とが
本発明の要求情報送信手段の主体をなす。表示プログラ
ム記憶部302bは、サーバーから受信した文書データを表
示制御部305を用いて表示するための表示プログラムを
記憶している。その表示プログラムと、表示制御部305
と、通信制御プログラムと、通信制御部307とが本発明
の受信表示手段の主体をなす。要求情報入力プログラム
記憶部302cは、ユーザーが入力部306を用いて、所望す
る文書データの文書識別情報と、要求言語情報とを入力
する処理を制御するための要求情報入力プログラムを記
憶する。
れている。通信制御プログラム記憶部302aは、通信制御
部307を介した各種通信の制御や、サーバー装置へのデ
ータ送受信処理等を行う通信制御プログラムを記憶して
いる。この通信制御プログラムと、通信制御部307とが
本発明の要求情報送信手段の主体をなす。表示プログラ
ム記憶部302bは、サーバーから受信した文書データを表
示制御部305を用いて表示するための表示プログラムを
記憶している。その表示プログラムと、表示制御部305
と、通信制御プログラムと、通信制御部307とが本発明
の受信表示手段の主体をなす。要求情報入力プログラム
記憶部302cは、ユーザーが入力部306を用いて、所望す
る文書データの文書識別情報と、要求言語情報とを入力
する処理を制御するための要求情報入力プログラムを記
憶する。
【0041】なお、ROM302は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
【0042】RAM303は、様々な一時データを保存するた
めに使用され、次のような各記憶部が内部に形成されて
いる。ワークメモリ303aは各プログラムが動作時に必要
とする一時的な記憶領域を提供する。受信文書メモリ30
3bは、サーバー装置から受信した文書データを一時保存
する。なお、RAM303は、RAMに限らず、磁気ディスク装
置や、光磁気ディスク装置等の記憶装置であってもよ
い。
めに使用され、次のような各記憶部が内部に形成されて
いる。ワークメモリ303aは各プログラムが動作時に必要
とする一時的な記憶領域を提供する。受信文書メモリ30
3bは、サーバー装置から受信した文書データを一時保存
する。なお、RAM303は、RAMに限らず、磁気ディスク装
置や、光磁気ディスク装置等の記憶装置であってもよ
い。
【0043】次に、サーバー装置102と、クライアント
装置103との基本的な処理の流れを図4を用いて説明す
る。先ず、クライアント装置103では、所望する文書デ
ータの指示情報の入力処理を行う(S401、Sはステップ
を示す。以下同様)。次に、入力した指示情報からその
文書データが所在するサーバー装置を通信ネットワーク
上で一意に決定する情報である、サーバー装置のアドレ
スを取得する(S402)。本実施の形態では、サーバー装置
のアドレスとしてTCP/IP(Transmission Control Protoc
ol/Internet Protocol)で規定されるホスト名あるいはI
Pアドレスを用いるものとするが、他に通信ネットワー
ク上のアドレスを決定できる情報であれば何でもよい。
次に、所望する文書データ指示情報から、その文書デー
タのサーバー装置内での指示情報である文書識別情報を
決定する(S403)。次に、所望する文書データがどの自然
言語によって記述されるかを指定する要求言語の情報を
決定する(S404)。
装置103との基本的な処理の流れを図4を用いて説明す
る。先ず、クライアント装置103では、所望する文書デ
ータの指示情報の入力処理を行う(S401、Sはステップ
を示す。以下同様)。次に、入力した指示情報からその
文書データが所在するサーバー装置を通信ネットワーク
上で一意に決定する情報である、サーバー装置のアドレ
スを取得する(S402)。本実施の形態では、サーバー装置
のアドレスとしてTCP/IP(Transmission Control Protoc
ol/Internet Protocol)で規定されるホスト名あるいはI
Pアドレスを用いるものとするが、他に通信ネットワー
ク上のアドレスを決定できる情報であれば何でもよい。
次に、所望する文書データ指示情報から、その文書デー
タのサーバー装置内での指示情報である文書識別情報を
決定する(S403)。次に、所望する文書データがどの自然
言語によって記述されるかを指定する要求言語の情報を
決定する(S404)。
【0044】次に、決定された文書識別情報と、要求言
語情報とをS402で決定されたアドレスのサーバー装置に
送信する(S405)。本実施の形態では、サーバー装置への
送信方法として、TCP/IP上のHTTP(Hyper Text Transfer
Protocol)を用いることとする。具体的にはクライアン
ト装置は、図5(a)に示す形式のデータをサーバー装置
に送信する。"GET"はデータ要求を意味し、<文書識別情
報>にはS402で決定された文書識別情報を指定する。<バ
ージョン情報>はHTTPのバージョン情報を指定し、<CRLF
>は復帰改行文字を示す。<各種ヘッダー情報>にはHTTP
で規定されたヘッダー情報を必要に応じて指定する。"A
ccept-Language:"は次に要求言語情報が続くことを示す
文字列であり、<要求言語>には要求言語を識別する予め
定められた文字列を指定する。図5(b)は文書識別情報
として"/pub/sample.html"、HTTPバージョンが1.0、日
本語を要求言語とした場合の例である。なお、上述した
TCP/IP及びHTTPは、既に広く実用化された公知の技術で
あるため、その説明を省略する。
語情報とをS402で決定されたアドレスのサーバー装置に
送信する(S405)。本実施の形態では、サーバー装置への
送信方法として、TCP/IP上のHTTP(Hyper Text Transfer
Protocol)を用いることとする。具体的にはクライアン
ト装置は、図5(a)に示す形式のデータをサーバー装置
に送信する。"GET"はデータ要求を意味し、<文書識別情
報>にはS402で決定された文書識別情報を指定する。<バ
ージョン情報>はHTTPのバージョン情報を指定し、<CRLF
>は復帰改行文字を示す。<各種ヘッダー情報>にはHTTP
で規定されたヘッダー情報を必要に応じて指定する。"A
ccept-Language:"は次に要求言語情報が続くことを示す
文字列であり、<要求言語>には要求言語を識別する予め
定められた文字列を指定する。図5(b)は文書識別情報
として"/pub/sample.html"、HTTPバージョンが1.0、日
本語を要求言語とした場合の例である。なお、上述した
TCP/IP及びHTTPは、既に広く実用化された公知の技術で
あるため、その説明を省略する。
【0045】サーバー装置では、S405でクライアント装
置から送信された要求文書の文書識別情報と、要求言語
情報を受信し(S408)、受信した情報に基づいて所望の自
然言語による所望の文書データを生成するために、文書
データ生成処理を実行する(S409)。S409の詳細は後述す
る。S409にて所望の自然言語による所望の文書データを
生成できない場合は、それをエラーと判定する(S410)。
本実施の形態では、このエラーの判定は後述するエラー
フラグを参照することで判定する。エラーでなければ生
成した文書データをクライアントに送信し(S411)、エラ
ーならばエラー情報を送信する(S412)。クライアントで
はサーバーから文書データもしくはエラー情報を受信し
(S406)、表示装置に表示する(S407)。
置から送信された要求文書の文書識別情報と、要求言語
情報を受信し(S408)、受信した情報に基づいて所望の自
然言語による所望の文書データを生成するために、文書
データ生成処理を実行する(S409)。S409の詳細は後述す
る。S409にて所望の自然言語による所望の文書データを
生成できない場合は、それをエラーと判定する(S410)。
本実施の形態では、このエラーの判定は後述するエラー
フラグを参照することで判定する。エラーでなければ生
成した文書データをクライアントに送信し(S411)、エラ
ーならばエラー情報を送信する(S412)。クライアントで
はサーバーから文書データもしくはエラー情報を受信し
(S406)、表示装置に表示する(S407)。
【0046】次に、文書データ生成処理(S409)の詳細に
ついて、図6を用いて説明する。先ず、エラー状態を記
憶するために、ワークメモリ203a内に形成されたエラー
フラグ(図示せず)をクリアーして、エラーなしの状態と
する(S601)。次に、文書識別情報で指定された文書デー
タの有無を判定し(S602)、もし、該当する文書データが
サーバー装置内に存在しない場合は(S602:No)、エラー
とするためにS607に処理を進め、存在した場合は(S602:
Yes)、S603に処理を進める。S603では、文書管理プログ
ラムが、クライアントから送信された文書識別情報で指
示された中間形式文書データを、中間形式文書データ記
憶部203dから検索して、ワークメモリ203aに読み込む。
ついて、図6を用いて説明する。先ず、エラー状態を記
憶するために、ワークメモリ203a内に形成されたエラー
フラグ(図示せず)をクリアーして、エラーなしの状態と
する(S601)。次に、文書識別情報で指定された文書デー
タの有無を判定し(S602)、もし、該当する文書データが
サーバー装置内に存在しない場合は(S602:No)、エラー
とするためにS607に処理を進め、存在した場合は(S602:
Yes)、S603に処理を進める。S603では、文書管理プログ
ラムが、クライアントから送信された文書識別情報で指
示された中間形式文書データを、中間形式文書データ記
憶部203dから検索して、ワークメモリ203aに読み込む。
【0047】本実施の形態においては、中間形式文書デ
ータ記憶部203dで記憶される中間形式文書データは、そ
れぞれの中間形式文書データが1つのファイルに対応す
るものとし、文書データを指定する文書識別情報として
は、中間形式文書データを収納しているファイル名を用
いるものとする。この場合は、文書識別情報で示された
ファイル名のファイルが存在するか否かでS602の判定を
行い、S603では文書管理プログラムがそのファイルのデ
ータをワークメモリ203aに読み込むこととなる。なお、
文書識別情報としてファイル名を用いる方法以外に、文
書管理プログラムとしてデータベース管理プログラムを
用い、中間形式文書データ記憶部203dとしてデータベー
スの記憶領域を対応させ、文書識別情報としてデータベ
ース内の文書データを特定可能な指示情報を用いてもよ
い。
ータ記憶部203dで記憶される中間形式文書データは、そ
れぞれの中間形式文書データが1つのファイルに対応す
るものとし、文書データを指定する文書識別情報として
は、中間形式文書データを収納しているファイル名を用
いるものとする。この場合は、文書識別情報で示された
ファイル名のファイルが存在するか否かでS602の判定を
行い、S603では文書管理プログラムがそのファイルのデ
ータをワークメモリ203aに読み込むこととなる。なお、
文書識別情報としてファイル名を用いる方法以外に、文
書管理プログラムとしてデータベース管理プログラムを
用い、中間形式文書データ記憶部203dとしてデータベー
スの記憶領域を対応させ、文書識別情報としてデータベ
ース内の文書データを特定可能な指示情報を用いてもよ
い。
【0048】次に、読み出した中間言語形式文書データ
をS408にて受信した要求言語情報に基づいた目標言語に
翻訳可能か否かを判定する(S604)。本実施の形態では、
前述したように各目標言語毎に個別の目標言語文書生成
プログラムを持つので、S408にて受信した要求言語情報
に対応した目標言語文書生成プログラムが目標言語文書
生成プログラム記憶部202bに記憶されているか否かで、
S604の判定を行う。
をS408にて受信した要求言語情報に基づいた目標言語に
翻訳可能か否かを判定する(S604)。本実施の形態では、
前述したように各目標言語毎に個別の目標言語文書生成
プログラムを持つので、S408にて受信した要求言語情報
に対応した目標言語文書生成プログラムが目標言語文書
生成プログラム記憶部202bに記憶されているか否かで、
S604の判定を行う。
【0049】S605では、読み込んだ中間形式文書データ
から目標言語文書データを生成する、目標言語文書生成
処理を実行する。S605の詳細は後述する。S606では、S6
05にて生成された目標言語文書データを、送信のために
一旦生成文書メモリ0203bに記憶する。S607では、S602
とS604での判定を受けて、エラー処理をするためにエラ
ーフラグをセットしてエラー状態を記憶する。
から目標言語文書データを生成する、目標言語文書生成
処理を実行する。S605の詳細は後述する。S606では、S6
05にて生成された目標言語文書データを、送信のために
一旦生成文書メモリ0203bに記憶する。S607では、S602
とS604での判定を受けて、エラー処理をするためにエラ
ーフラグをセットしてエラー状態を記憶する。
【0050】次に、本発明の文書解析手段の主体をなす
中間形式文書データ作成プログラムの処理の詳細を、図
7、図8、図9を用いて説明する。先ず、入力部206よ
り、所定の自然言語で記述された文書データを入力する
(S701)。入力された文書データは、一旦原文書メモリ20
3cに保存される(S702)。この文書データが原文書データ
として処理される。原文書データは、先ず、形態素解析
処理を受ける(S703)。S703では、翻訳辞書記憶部202eに
記憶された形態素解析辞書を参照し、原文書データを形
態素に分割し、形態素列に変換し、各形態素の品詞の判
定を行う。日本語から中間形式文書データを生成する一
例として、図8(a)に示す原文書データであれば、形態
素解析処理により図8(b)のような形態素列からなる形
態素解析結果が得られる。
中間形式文書データ作成プログラムの処理の詳細を、図
7、図8、図9を用いて説明する。先ず、入力部206よ
り、所定の自然言語で記述された文書データを入力する
(S701)。入力された文書データは、一旦原文書メモリ20
3cに保存される(S702)。この文書データが原文書データ
として処理される。原文書データは、先ず、形態素解析
処理を受ける(S703)。S703では、翻訳辞書記憶部202eに
記憶された形態素解析辞書を参照し、原文書データを形
態素に分割し、形態素列に変換し、各形態素の品詞の判
定を行う。日本語から中間形式文書データを生成する一
例として、図8(a)に示す原文書データであれば、形態
素解析処理により図8(b)のような形態素列からなる形
態素解析結果が得られる。
【0051】次に、構文解析処理を行う(S704)。S704で
は、S703で解析された品詞情報を含む形態素列に、翻訳
辞書記憶部202eに記憶された構文規則データと、構文解
析辞書の情報を適用し、各形態素間の修飾関係を解析す
ると共に、格の意味的な役割を決定し、構文解析木を形
成する。例えば、図8(b)のような形態素解析結果は、
図8(c)で示される構文解析木からなる構文解析結果を
得る。ここで、「S」は文を、「NP」は名詞句を、「AD
V」は副詞を、「VP」は動詞句をそれぞれ表す。
は、S703で解析された品詞情報を含む形態素列に、翻訳
辞書記憶部202eに記憶された構文規則データと、構文解
析辞書の情報を適用し、各形態素間の修飾関係を解析す
ると共に、格の意味的な役割を決定し、構文解析木を形
成する。例えば、図8(b)のような形態素解析結果は、
図8(c)で示される構文解析木からなる構文解析結果を
得る。ここで、「S」は文を、「NP」は名詞句を、「AD
V」は副詞を、「VP」は動詞句をそれぞれ表す。
【0052】次に、原文書データに曖昧さがあるかどう
かの判定を行う(S705)。具体的には、構文解析処理(S70
4)において複数の構文解析木が形成された場合は、原文
所データに曖昧さがあると判断し、そうでない場合、即
ち、1種類の構文解析木のみ形成した場合は、曖昧さが
無いと判断する。例えば、図8(a)に示す原文書データ
から形成される構文解析木は、図8(c)に示した1種類
であるのでS705では、原文に曖昧さが無いと判断する。
そして、依存構造解析処理(S706)に処理を進める。
かの判定を行う(S705)。具体的には、構文解析処理(S70
4)において複数の構文解析木が形成された場合は、原文
所データに曖昧さがあると判断し、そうでない場合、即
ち、1種類の構文解析木のみ形成した場合は、曖昧さが
無いと判断する。例えば、図8(a)に示す原文書データ
から形成される構文解析木は、図8(c)に示した1種類
であるのでS705では、原文に曖昧さが無いと判断する。
そして、依存構造解析処理(S706)に処理を進める。
【0053】一方、図10に示す例文は、「美しい」が
「少女」を修飾しているか、「少女の母親」を修飾して
いるか曖昧である。このような曖昧な原文書データを入
力した場合、構文解析処理(S704)において、図11の
(a)、(b)に示す2通りの構文解析木が形成される。(な
お、図11に示す構文解析木は、構文解析結果の差異が
明らかであれば良いので、文や句や品詞を示す表示を省
いてある。)この様に複数の解析木を形成した場合、S7
05では、原文に曖昧さがあると判断し、解析候補表示(S
708)を行う。解析候補表示は、本発明の解析結果表示手
段の主体をなす中間形式作成プログラムが行う処理であ
る。具体的には、モニター208に図11に示す構文解析
木をそれぞれ結果a、結果bとして表示する。次に、解
析結果確定処理(S709)を行う。解析候補表示は、本発明
の解析結果確定手段の主体をなす中間形式作成プログラ
ムが行う処理である。
「少女」を修飾しているか、「少女の母親」を修飾して
いるか曖昧である。このような曖昧な原文書データを入
力した場合、構文解析処理(S704)において、図11の
(a)、(b)に示す2通りの構文解析木が形成される。(な
お、図11に示す構文解析木は、構文解析結果の差異が
明らかであれば良いので、文や句や品詞を示す表示を省
いてある。)この様に複数の解析木を形成した場合、S7
05では、原文に曖昧さがあると判断し、解析候補表示(S
708)を行う。解析候補表示は、本発明の解析結果表示手
段の主体をなす中間形式作成プログラムが行う処理であ
る。具体的には、モニター208に図11に示す構文解析
木をそれぞれ結果a、結果bとして表示する。次に、解
析結果確定処理(S709)を行う。解析候補表示は、本発明
の解析結果確定手段の主体をなす中間形式作成プログラ
ムが行う処理である。
【0054】具体的には、サーバー装置の操作者が入力
部206へ入力した指示より、結果a、結果b何れの結果
が選択されたかを判断し、解析結果を確定する。そし
て、依存構造解析処理(S706)へ処理を進める。
部206へ入力した指示より、結果a、結果b何れの結果
が選択されたかを判断し、解析結果を確定する。そし
て、依存構造解析処理(S706)へ処理を進める。
【0055】本実施の形態では、構文解析木で解析候補
表示を行ったが、図12に示すように原文書データに括
弧を追加して、解析候補表示を行ってもよい。
表示を行ったが、図12に示すように原文書データに括
弧を追加して、解析候補表示を行ってもよい。
【0056】次に、依存構造解析処理を行う(S706)。S7
06では、S704の解析結果である構文解析木に基づき、依
存構造を形成する。図8(c)の構文解析結果に対して依
存構造解析処理を行うと、図9(a)に示されるような依
存構造が得られる。ここで、「PRED」は述部を、「NO
M」は依存構造名詞句を、「ADV」は副詞をそれぞれ表
す。次に、S706で得られた依存構造のデータを中間形式
文書データ記憶部203dに保存する(S707)。
06では、S704の解析結果である構文解析木に基づき、依
存構造を形成する。図8(c)の構文解析結果に対して依
存構造解析処理を行うと、図9(a)に示されるような依
存構造が得られる。ここで、「PRED」は述部を、「NO
M」は依存構造名詞句を、「ADV」は副詞をそれぞれ表
す。次に、S706で得られた依存構造のデータを中間形式
文書データ記憶部203dに保存する(S707)。
【0057】本実施の形態では、中間形式表現として文
の依存構造の表現を用い、前記のように文章を解析した
結果得られる、依存構造で表現された文章の意味内容を
表すデータを、中間形式文書データとして用いることと
する。具体的には、図13(a)に記載するような構造要
素1305の集合として記憶する。各構造要素1305は構造種
別1301と、格情報1302と、辞書ポインター1303と、従属
構造数1304の4つの項目を持つ。構造種別1301は述部と
か、名詞句とかの種別をフラグとして記憶する。格情報
1302は主格とか目的格、あるいは様態等の格の種別情報
を必要に応じてフラグとして記憶する。辞書ポインター
1303は、その構造要素に対応した単語の情報を収納して
いる辞書データへのポインターを記憶する。従属構造数
1304は、その構造要素に直接従属する構造要素がいくつ
あるかを記憶する。なお、従属構造数1304は、その構造
要素に従属する構造要素にさらに従属する、つまり、入
れ子として間接的に従属する要素の個数は含まない。
の依存構造の表現を用い、前記のように文章を解析した
結果得られる、依存構造で表現された文章の意味内容を
表すデータを、中間形式文書データとして用いることと
する。具体的には、図13(a)に記載するような構造要
素1305の集合として記憶する。各構造要素1305は構造種
別1301と、格情報1302と、辞書ポインター1303と、従属
構造数1304の4つの項目を持つ。構造種別1301は述部と
か、名詞句とかの種別をフラグとして記憶する。格情報
1302は主格とか目的格、あるいは様態等の格の種別情報
を必要に応じてフラグとして記憶する。辞書ポインター
1303は、その構造要素に対応した単語の情報を収納して
いる辞書データへのポインターを記憶する。従属構造数
1304は、その構造要素に直接従属する構造要素がいくつ
あるかを記憶する。なお、従属構造数1304は、その構造
要素に従属する構造要素にさらに従属する、つまり、入
れ子として間接的に従属する要素の個数は含まない。
【0058】例えば、図9(a)に示された依存構造を記
憶した場合は、図13(b)のようなデータとなる。ここ
で、「K1」は主格を、「K2」は目的格を、「K3」は様態
の格を表す。また、辞書ポインターは、図13(c)に例
示された辞書データの番号1306を表している。辞書デー
タには、原文書で用いられた言語の単語1307と、その品
詞1308、及び他の言語の対応する単語1309や、さらに、
各種の文法情報等が記憶される。図13(c)では、他の
言語が英語である場合の例示である。なお、中間形式文
書データとしては前記の方法以外に、人工的に定義され
た可読性のある言語(以下、共通言語という)を、中間形
式表現として用い、その言語で記述された文書データを
中間形式文書データとして用いてもよい。例えば、特開
平6-325080号公報に開示されているような、人工的に設
計した言語で記述した文章を中間形式文書データとして
もよい。
憶した場合は、図13(b)のようなデータとなる。ここ
で、「K1」は主格を、「K2」は目的格を、「K3」は様態
の格を表す。また、辞書ポインターは、図13(c)に例
示された辞書データの番号1306を表している。辞書デー
タには、原文書で用いられた言語の単語1307と、その品
詞1308、及び他の言語の対応する単語1309や、さらに、
各種の文法情報等が記憶される。図13(c)では、他の
言語が英語である場合の例示である。なお、中間形式文
書データとしては前記の方法以外に、人工的に定義され
た可読性のある言語(以下、共通言語という)を、中間形
式表現として用い、その言語で記述された文書データを
中間形式文書データとして用いてもよい。例えば、特開
平6-325080号公報に開示されているような、人工的に設
計した言語で記述した文章を中間形式文書データとして
もよい。
【0059】次に、S605の目標言語文書生成処理の詳細
を、図14と図9とを用いて説明する。目標言語文書生
成処理は、本発明の目標言語文書生成手段の主体をなす
目標言語文書生成プログラムが行う処理である。先ず、
S603にてワークメモリ203aに読み込まれた中間形式文書
データに対し、構文生成処理を行う(S1401)。構文生成
処理では、中間形式文書データに記述された依存構造に
基づいて、生成規則データを参照しつつ目標言語の構文
木を生成し、語順を決定する。次に、形態素生成処理を
行い(S1402)、単語の語尾等を必要に応じて変化させ、
生成文書データの生成を完了する。目標言語が英語であ
る一例を挙げれば、図9(a)で示される依存構造の文に
対し、構文生成処理と、形態素生成処理の処理を行う
と、図9(b)に示されるような目標言語文書生成結果が
得られることとなる。ここで、「PRON」は代名詞、
「V」は動詞、「ART」は冠詞、「N」は名詞をそれぞれ
表す。
を、図14と図9とを用いて説明する。目標言語文書生
成処理は、本発明の目標言語文書生成手段の主体をなす
目標言語文書生成プログラムが行う処理である。先ず、
S603にてワークメモリ203aに読み込まれた中間形式文書
データに対し、構文生成処理を行う(S1401)。構文生成
処理では、中間形式文書データに記述された依存構造に
基づいて、生成規則データを参照しつつ目標言語の構文
木を生成し、語順を決定する。次に、形態素生成処理を
行い(S1402)、単語の語尾等を必要に応じて変化させ、
生成文書データの生成を完了する。目標言語が英語であ
る一例を挙げれば、図9(a)で示される依存構造の文に
対し、構文生成処理と、形態素生成処理の処理を行う
と、図9(b)に示されるような目標言語文書生成結果が
得られることとなる。ここで、「PRON」は代名詞、
「V」は動詞、「ART」は冠詞、「N」は名詞をそれぞれ
表す。
【0060】なお、本実施の形態においては、中間形式
文書データとして記憶されている依存構造データをその
まま構文生成処理への入力としたが、構文生成処理への
入力の前に依存構造変換処理を行ってもよい。これは具
体的には、中間形式文書データに記憶されている文章の
依存構造をそのまま用いるのではなく、中間形式変換手
段に対応する依存構造変換処理を行い、目標言語に対応
した依存構造に変換してから、構文生成処理への入力と
する。
文書データとして記憶されている依存構造データをその
まま構文生成処理への入力としたが、構文生成処理への
入力の前に依存構造変換処理を行ってもよい。これは具
体的には、中間形式文書データに記憶されている文章の
依存構造をそのまま用いるのではなく、中間形式変換手
段に対応する依存構造変換処理を行い、目標言語に対応
した依存構造に変換してから、構文生成処理への入力と
する。
【0061】なお、本実施の形態に係わる前記の形態素
解析処理、構文解析処理、依存構造解析処理、構文生成
処理、及び形態素生成処理のそれぞれは、電子技術総合
研究所と京都大学による「日英科学技術文献の速報シス
テムに関する研究−言語処理システムの開発に関する報
告書」や、特開昭62-203273号公報に開示されている公
知の技術である。
解析処理、構文解析処理、依存構造解析処理、構文生成
処理、及び形態素生成処理のそれぞれは、電子技術総合
研究所と京都大学による「日英科学技術文献の速報シス
テムに関する研究−言語処理システムの開発に関する報
告書」や、特開昭62-203273号公報に開示されている公
知の技術である。
【0062】
【発明の効果】以上説明したことから明らかなように、
本発明の請求項1に記載の多言語対応通信システムは、
クライアントから所望の記述言語を指定でき、それに従
って中間形式文書データの形式で記憶された文書データ
から自然言語で記述された文書データを生成し、クライ
アント装置で出力できるので、サーバー装置に多数の言
語で記述した文書データを保存したり、クライアント装
置に言語翻訳プログラムを搭載することなく、所望の言
語で表記された文書データの閲覧をすることができる。
また、自然言語で記述された文書データから中間形式文
書データを生成するため、中間形式文書データを容易に
作成できる。さらに、自然言語で記述された文書データ
が曖昧である場合は、その解析結果が表示されるため、
中間形式文書データが望ましいか否かが判断できる。
本発明の請求項1に記載の多言語対応通信システムは、
クライアントから所望の記述言語を指定でき、それに従
って中間形式文書データの形式で記憶された文書データ
から自然言語で記述された文書データを生成し、クライ
アント装置で出力できるので、サーバー装置に多数の言
語で記述した文書データを保存したり、クライアント装
置に言語翻訳プログラムを搭載することなく、所望の言
語で表記された文書データの閲覧をすることができる。
また、自然言語で記述された文書データから中間形式文
書データを生成するため、中間形式文書データを容易に
作成できる。さらに、自然言語で記述された文書データ
が曖昧である場合は、その解析結果が表示されるため、
中間形式文書データが望ましいか否かが判断できる。
【0063】また、請求項2に記載の多言語対応通信シ
ステムは、自然言語で記述された文書データが曖昧であ
る場合は、その解析結果を選択できるため、望ましい中
間形式文書データが作成できる。
ステムは、自然言語で記述された文書データが曖昧であ
る場合は、その解析結果を選択できるため、望ましい中
間形式文書データが作成できる。
【0064】また、請求項3に記載の多言語対応通信シ
ステムは、自然言語で記述された文書データが曖昧であ
る場合は、その解析結果が構文解析木で表示されるた
め、容易に解析結果を認識することができる。
ステムは、自然言語で記述された文書データが曖昧であ
る場合は、その解析結果が構文解析木で表示されるた
め、容易に解析結果を認識することができる。
【図1】本発明の多言語対応通信システムの概要を示す
説明図である。
説明図である。
【図2】本実施の形態のサーバー装置のブロック図であ
る。
る。
【図3】本実施の形態のクライアント装置のブロック図
である。
である。
【図4】本実施の形態のサーバー装置とクライアント装
置の処理の流れを示すフローチャートである。
置の処理の流れを示すフローチャートである。
【図5】本実施の形態の文書識別情報と要求言語情報と
の説明図である。
の説明図である。
【図6】本実施の形態の文書データ生成処理のフローチ
ャートである。
ャートである。
【図7】本実施の形態の中間形式文書データ作成プログ
ラムの処理のフローチャートである。
ラムの処理のフローチャートである。
【図8】本実施の形態の中間形式文書データ作成の処理
の説明に供する説明図である。
の説明に供する説明図である。
【図9】本実施の形態の中間形式文書データ作成の処理
と、目標言語文書生成処理の説明に供する説明図であ
る。
と、目標言語文書生成処理の説明に供する説明図であ
る。
【図10】本実施の形態の中間形式文書データ作成の処
理の説明に供する説明図である。
理の説明に供する説明図である。
【図11】本実施の形態の中間形式文書データ作成の処
理の説明に供する説明図である。
理の説明に供する説明図である。
【図12】本実施の形態の中間形式文書データ作成の処
理の説明に供する説明図である。
理の説明に供する説明図である。
【図13】本実施の形態の中間形式文書データの説明に
供する説明図である。
供する説明図である。
【図14】本実施の形態の目標言語文書生成処理のフロ
ーチャートである。
ーチャートである。
【図15】従来の通信システムの概要を示す説明図であ
る。
る。
101 通信ネットワーク 102 サーバー装置 103 クライアント装置 202 ROM 203 RAM 204 CPU 203d 中間形式文書データ記憶部
Claims (3)
- 【請求項1】 クライアント装置と、前記クライアント
装置からの要求に応じた文書データを前記クライアント
装置に送信するサーバー装置とから構成される通信シス
テムであって、 前記クライアント装置は、 前記文書データを特定可能な文書識別情報と、前記文書
データの記述言語を指定する要求言語情報とを前記サー
バー装置に送信する要求情報送信手段と、 前記サーバー装置より前記文書データを受信し、出力す
る受信出力手段とを備え、 前記サーバー装置は、 所定の言語で記述された文書データを入力する原文書入
力手段と、 前記原文書入力手段で入力した文書データを文法的、意
味的に解析した結果として得られる中間形式表現で記述
した中間形式文書データを生成する原文書解析手段と、 前記原文書解析手段で解析した結果が、その文書データ
の曖昧さにより複数生じる場合に、それら解析結果を表
示する解析結果表示手段と、 前記中間形式文書データを少なくとも一つ記憶する中間
形式文書記憶手段と、 前記クライアント装置から前記文書識別情報と、前記要
求言語情報とを受信する要求情報受信手段と、 前記中間形式文書記憶手段に記憶された、前記文書識別
情報に対応する中間形式文書データから、前記要求言語
情報に対応した言語で記述した目標言語文書データを生
成する目標言語文書生成手段と、 前記目標言語文書生成手段により生成される目標言語文
書データを前記クライアント装置に送信する文書送信手
段と、 を備えたことを特徴とする多言語対応通信システム。 - 【請求項2】 前記サーバー装置は、前記解析結果表示
手段が表示した複数の解析結果から特定の解析結果を選
択し、解析結果として確定させる解析結果確定手段を備
えたことを特徴とする請求項1に記載の多言語対応通信
システム。 - 【請求項3】 前記解析結果表示手段は、前記原文書入
力手段で入力した文書データの解析結果として構文解析
木を表示することを特徴とする請求項1もしくは2に記
載の多言語対応通信システム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9026343A JPH10222516A (ja) | 1997-02-10 | 1997-02-10 | 多言語対応通信システム |
| US08/984,293 US6092035A (en) | 1996-12-03 | 1997-12-03 | Server device for multilingual transmission system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9026343A JPH10222516A (ja) | 1997-02-10 | 1997-02-10 | 多言語対応通信システム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH10222516A true JPH10222516A (ja) | 1998-08-21 |
Family
ID=12190808
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9026343A Pending JPH10222516A (ja) | 1996-12-03 | 1997-02-10 | 多言語対応通信システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH10222516A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7493557B2 (en) | 2001-09-12 | 2009-02-17 | Seiko Epson Corporation | Source file generation apparatus |
| US9164989B2 (en) | 2012-10-05 | 2015-10-20 | Fuji Xerox Co., Ltd. | Translation processing device, non-transitory computer readable medium, and translation processing method |
-
1997
- 1997-02-10 JP JP9026343A patent/JPH10222516A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7493557B2 (en) | 2001-09-12 | 2009-02-17 | Seiko Epson Corporation | Source file generation apparatus |
| US9164989B2 (en) | 2012-10-05 | 2015-10-20 | Fuji Xerox Co., Ltd. | Translation processing device, non-transitory computer readable medium, and translation processing method |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3066274B2 (ja) | 機械翻訳装置 | |
| EP0940762A2 (en) | Multilingual patent information search system | |
| JPS6231467A (ja) | 文章作成装置 | |
| JPH0869470A (ja) | 自然言語処理装置及びその方法 | |
| MXPA04001729A (es) | Metodos y sistemas para traduccion de idiomas. | |
| JPH03278174A (ja) | 異言語交信用翻訳方法およびシステム | |
| US7401016B2 (en) | Communication support system, communication support method, and computer program | |
| JP3467160B2 (ja) | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 | |
| JPH0261763A (ja) | 機械翻訳装置 | |
| JP3467159B2 (ja) | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 | |
| JP2003296327A (ja) | 翻訳サーバ、ジャンル別オンライン機械翻訳方法、およびそのプログラム | |
| JPH10222516A (ja) | 多言語対応通信システム | |
| JP3434161B2 (ja) | 多言語対応通信システム | |
| JPH10222513A (ja) | 多言語対応通信システム | |
| JPH10187732A (ja) | 多言語対応通信システム | |
| JP6114090B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
| JP3467161B2 (ja) | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 | |
| JPH10187731A (ja) | 多言語対応通信システム | |
| JPH10214266A (ja) | 多言語対応通信システム | |
| JPH10207892A (ja) | 多言語対応通信システム | |
| KR100836159B1 (ko) | 반자동 번역 서비스 제공 시스템 및 방법 | |
| JP2020057195A (ja) | 要約生成サーバ、要約生成システム及び要約生成方法 | |
| JP3174664B2 (ja) | 機械翻訳装置 | |
| JP3353873B2 (ja) | 機械翻訳装置 | |
| JP2749954B2 (ja) | 自然言語解析装置 |