JPH1063665A - テキスト翻訳方法および装置 - Google Patents

テキスト翻訳方法および装置

Info

Publication number
JPH1063665A
JPH1063665A JP8224200A JP22420096A JPH1063665A JP H1063665 A JPH1063665 A JP H1063665A JP 8224200 A JP8224200 A JP 8224200A JP 22420096 A JP22420096 A JP 22420096A JP H1063665 A JPH1063665 A JP H1063665A
Authority
JP
Japan
Prior art keywords
data
sentence
text
character string
specific
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8224200A
Other languages
English (en)
Inventor
Mitsuhiro Aida
光廣 合田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP8224200A priority Critical patent/JPH1063665A/ja
Publication of JPH1063665A publication Critical patent/JPH1063665A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 翻訳すべき原言語文章を構成する語句間の関
係を考慮して、原言語を目的言語に正確に翻訳する。 【解決手段】 入力部2から翻訳すべき原言語文章が入
力されると、通常辞書を参照の上、入力された各入力文
章データが、予め定める基準に基づいて、ライブラリ記
憶部3に記憶される文章特定ライブラリ15および特定
文字列ライブラリ16に存在するかどうかが判定され
る。存在する場合に、存在する入力文章データをキーデ
ータとして、キーデータと次のキーデータとの間の入力
文章データを分離して、ライブラリ記憶部3に記憶され
る通常辞書およびライブラリ記憶手段を用いて翻訳す
る。分離して翻訳された各入力文章データの目的言語訳
に、キーデータに関連して設定される接合部分表現を含
んだ目的言語訳を接合編集して、入力された原言語文章
を翻訳処理する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、予め備える辞書な
どを用いて、入力された原言語テキストを目的言語テキ
ストに翻訳するテキスト翻訳方法および装置に関する。
【0002】
【従来の技術】従来からの翻訳装置は、文法的な解析、
原言語の単語および単語の変換などを行って、原言語の
文章から目的言語の文章に翻訳している。しかし、この
ような翻訳処理は、高水準の解析および変換処理能力を
必要とし、翻訳速度の遅延化が問題である。また翻訳す
べき原言語の文章を構成する単語が多義的な意味を有す
る場合および翻訳すべき原言語の文章が係り受け関係が
複雑な長文である場合には、正確な目的言語に翻訳する
ことが困難な場合が多い。
【0003】また特開平6−52220に開示されてい
る先行技術である翻訳装置は、原言語と目的言語とが対
照できる標準文例を備える。この翻訳装置は、翻訳すべ
き原言語の文章が入力されると、利用者が翻訳すべき原
言語の文章となるように、翻訳すべき原言語の文章に類
似した標準文例を部分的に変更することによって、目的
言語の文章に翻訳される。
【0004】また特開平6−52219に開示されてい
る先行技術である翻訳装置は、原文テンプレートと目的
言語テンプレートとで構成されるテンプレート対を備え
る。原文テンプレートは、原言語の1つの文章が分割さ
れた各句と、変更可能な句に用いられる変数とを含んで
構成され、目的言語テンプレートは、原文テンプレート
に合わせて構成される。利用者によって、翻訳すべき原
言語の文章が与えられると、翻訳装置は、その原言語の
文章と一部でも一致する原文テンプレートを選出し、対
となる目的言語テンプレートを用いて翻訳する。また選
出された原文テンプレートが複数である場合は、利用者
にテンプレート対を表示して、利用者がテンプレート対
を選択することによって、翻訳が行われる。
【0005】また他の従来技術として、翻訳すべき原言
語の文章を分割し、分割された語句ごとに翻訳する翻訳
装置も存在する。
【0006】
【発明が解決しようとする課題】特開平6−52220
の先行技術に開示されている翻訳装置は、標準文例を用
いて、原言語の文章から目的言語の文章に翻訳するの
で、標準文例に類似した文章の翻訳には有効である。し
かし、この翻訳装置は、翻訳すべき原言語の文章に類似
する標準文例が存在しない場合に、翻訳できないかまた
は翻訳できても精度の低い翻訳結果しか得られないとい
う問題点がある。
【0007】また特開平6−52219の先行技術に開
示されている翻訳装置は、翻訳すべき原言語の文章に一
部でも一致するテンプレート対を用いて目的言語の文章
に翻訳できる。しかし、翻訳すべき原言語の文章は、利
用者によって異なるので、利用者の種々の要求に対応す
るためには種々の分野にわたる膨大な数のテンプレート
対を用意する必要がある。
【0008】さらにまた前述の他の従来技術では、翻訳
すべき原言語の文章を分割して翻訳することによって、
利用者の翻訳すべき原言語の文章は、上述のテンプレー
トなどに制限されないが、分割部分とその分割部分の前
後の他の分割部分との整合が取れないことによる翻訳品
質の低下が問題である。
【0009】本発明の目的は、翻訳すべき原言語文章を
構成する語句を特定し、翻訳範囲を特定して翻訳を行っ
た後、各翻訳結果の間の整合を図り、予め設定の目的語
訳を含む翻訳情報を活用して原言語を目的言語により正
確に翻訳することができるテキスト翻訳方法および装置
を提供することである。
【0010】
【課題を解決するための手段】本発明は、原言語テキス
トを目的言語に翻訳する方法であって、予め、文章デー
タを特定するための文字列と、その文章データ内のその
文字列の前後の文章情報および目的言語訳を含む関連情
報とを複数、文章ライブラリとして記憶しておき、原言
語テキストを入力し、入力された原言語テキスト内の文
字列と、文章ライブラリ中に記憶されている文字列およ
びその関連情報とを照合し、照合によって、合致または
所定の類似度の文字列とその関連情報とが特定されると
き、特定される文字列、文頭、文末の間にある原言語テ
キストを分離し、分離された原言語テキストを目的言語
に翻訳し、その結果と、特定される文字列についての関
連情報の中の目的言語訳とを接合する編集によって、目
的言語テキストを得ることを特徴とするテキスト翻訳方
法である。 本発明に従えば、文章ライブラリは、原言語の文章デー
タを特定する文字列と、その文字列に関する関連情報と
を示す。利用者によって、原言語テキストが入力される
と、文章ライブラリの文字列と、原言語テキストを構成
する文字列とが照合される。照合の結果、合致または所
定の類似度の文字列が特定されるときに、文頭、特定文
字列と、その特定文字列の他の直近の特定文字列、文末
間の文章データを分離する。特定される文字列は文章ラ
イブラリ中の目的言語に変わり、分離された文章データ
は、たとえば予め設けられる通常辞書、文章ライブラリ
を用いて目的言語に翻訳される。それぞれの文字列およ
び文章データが目的言語に翻訳されると、それを接合す
る編集が行われる。したがって、翻訳すべき原言語テキ
スト内の分離箇所を特定する文字列と、分離の基準とな
る特定文字列の目的言語訳を含む関連情報を予め設定
し、特定文字列によって文章データを適切に一時的に分
離して翻訳し、結果を接合するので、比較的高速で誤り
の少ない翻訳処理を行うことができる。
【0011】また本発明は、原言語テキストを目的言語
に翻訳する方法であって、複数の原言語文章に基づいて
作成され、予め、文章ライブラリとして、各原言語文章
の先頭または所定語句位置から始まる略記号を含む文字
記号データからなる特定文字列と、その前後部分に対す
る接合表現を含む目的言語訳文と、特定文字列とその前
後に存在する一部または全部の原言語文章の文法および
文型とを含む文章データを記憶しておき、原言語テキス
トを入力し、予め定める基準に従って、入力された原言
語テキスト中の文章データと合致または類似範囲内にあ
る特定文字列が文章ライブラリ中に記憶されているか否
かを判定し、特定文字列が文章ライブラリ中に記憶され
ていると判定されるとき、記憶されている特定文字列に
基づいて、入力された原言語テキスト中の文章データの
先頭と特定文字列との間、または特定文字列と他の後続
する直近の特定文字列または文章の末尾との間にある原
言語文章データを順次抽出し、目的言語テキストを編集
処理することを特徴とするテキスト翻訳方法である。 本発明に従えば、原言語テキストが文章データとして入
力されると、予め定める基準に従って、入力されたテキ
スト中の文章データと合致または所定の類似範囲内にあ
る文章データが文章ライブラリ記憶手段に記憶されてい
るか否かが判定される。たとえば、入力された文章デー
タ内に、文章ライブラリ内の特定文字列と一致するもの
があるかどうかによって判定される。記憶されていると
判定されると、文頭、特定文字列、後続する特定文字列
および文末との間の原言語文章データが順次抽出され、
目的言語に翻訳される。翻訳された後、文章ライブラリ
の設定内容に従って、翻訳された目的言語をそれぞれ接
続する編集処理が行われる。したがって、翻訳すべき原
言語テキストの分離箇所を特定する文字列と、その前後
の分離および翻訳された目的言語との接続部分表現とを
含む目的言語訳を文章ライブラリに記憶することによっ
て、比較的誤りやすい係り受けに関わる接続部分表現を
含んだ目的言語訳が予め記憶され、その文章ライブラリ
を用いているので、比較的高速で、誤りの少ない翻訳処
理を行うことができる。
【0012】また本発明の文章ライブラリは、翻訳の熟
練者の知識および経験を加味し、目的言語への翻訳が困
難な実例文に基づいて特定データを作成し、その特定デ
ータを記憶することを特徴とする。 また本発明に従えば、特定データは、目的言語への翻訳
が困難な実例文に基づいて、翻訳の熟練者によって作成
される。作成された特定データは、文章ライブラリに記
憶される。したがって、文章ライブラリは翻訳の熟練者
の知識および経験を加味された特定データで構成される
ので、より正確な翻訳処理をすることができる。
【0013】また本発明は、原言語テキストを目的言語
に翻訳する装置であって、複数の原言語文章に基づいて
作成され、各原言語文章の先頭または所定語句位置から
始まる略記号を含む文字記号データからなる特定文字列
と、その前後部分に対する接合部分表現を含む目的言語
訳文と、特定文字列とその前後に存在する原言語文の文
法および文型とを含む一部または全部の文章データが、
予め記憶される文章ライブラリ記憶手段と、原言語テキ
ストを文章データとして入力する入力手段と、予め定め
る基準に従って、入力された原言語テキスト中の文章デ
ータと合致または類似範囲内にある特定データが、文章
ライブラリ記憶手段に記憶されているか否かを判定する
判定手段と、判定手段によって、特定データが文章ライ
ブラリ記憶手段に記憶されていると判定されるとき、記
憶されている特定データに基づいて、入力された原言語
テキスト中の特定データと先頭、特定データと後続する
直近の特定データ、または文章の末尾との間にある原言
語文章データを順次抽出し、目的言語テキストに編集処
理する文章編集手段とを含むことを特徴とするテキスト
翻訳装置である。 本発明に従えば、原言語テキストが文章データとして入
力されると、判定手段は、予め定める基準に従って、入
力されたテキスト中の文章データと合致または類似範囲
内にある特定文字列が文章ライブラリ記憶手段に記憶さ
れているか否かを判定する。判定手段によって記憶され
ていると判定されると、文章編集手段は、文頭と特定文
字列の間、特定文字列と後続する特定文字列、または文
末との間の原言語文章データを順次抽出する。抽出後、
文章編集手段は、文章ライブラリ記憶手段の記憶内容に
従って、たとえば抽出された原言語文章データの目的言
語訳をそれぞれ接続する編集処理を行う。したがって、
翻訳すべき原言語テキストの分離箇所を特定する特定文
字列と、その前後の分離および翻訳された目的言語との
接続部分表現を含む目的言語訳とを、文章ライブラリ記
憶手段に記憶することによって、誤りやすい部分の目的
言語訳が予め設定されていれば、比較的高速で、誤りの
少ない翻訳処理を行うことができる。
【0014】また本発明の文章編集手段は、抽出される
原言語文章データを目的言語に変換する翻訳手段と、翻
訳手段による変換結果を、原言語の特定文字列とその前
後部分に対する接合部分表現を含む目的言語訳に接合
し、目的言語の文章データとして出力する文章出力手段
とを備えることを特徴とする。 本発明に従えば、文章編集手段の翻訳手段は、文頭、特
定文字列と後続する他の特定文字列、文末との間の原言
語文章データが抽出されると、その原言語文章データを
目的言語に翻訳する。原言語文章データが目的言語に翻
訳されると、文章出力手段は、翻訳された目的言語と、
文章ライブラリ記憶手段に記憶される特定文字列とその
前後部分とに対する接合部分表現を含む目的言語訳とを
接合して、たとえば装置が備える表示部などに出力す
る。したがって、翻訳手段の翻訳結果と、予め文章ライ
ブラリ記憶手段に設定している誤りやすい係り受け関係
に関わる接合部分表現を含む目的言語訳文を接合するの
で、比較的高速で誤りの少ない翻訳処理を行うことがで
きる。
【0015】また本発明の文章ライブラリ記憶手段は、
各原言語文章の先頭または特定語句位置から始まり、略
記号を含む文字記号データからなる特定文字列と、その
前後部分に対する接合部分表現を含む目的言語訳文と、
特定文字列とその前後の直近の特定文字列、または文末
との間にある文章データの品詞および活用を含む文法・
文型・代入文とを含む特定データを一部または全部記憶
する文章特定ライブラリ記憶手段と、特定文字列と、特
定文字列の前後の原言語文章データの文法・文型情報と
を記憶する特定文字列ライブラリ記憶手段と、文章特定
ライブラリ記憶手段または特定文字列ライブラリ記憶手
段への参照度数を記憶する度数記憶手段とを備え、前記
文章編集手段は、順次抽出される原言語文章データを、
文章特定ライブラリ記憶手段および特定文字列ライブラ
リ記憶手段の記憶内容に基づいて、係り受け関係を示す
レベル表示形式の文章データに編集するレベル編集手段
と、原言語文章データ内の文頭と特定文字列の間、特定
文字列と他の直近の特定文字列または文末の間にある原
言語文章データと、特定文字列の接合部分表現を含む目
的言語訳とを接合し、原言語部分および目的言語部分を
含むレベル表現形式の文章データとして出力するレベル
出力手段とを備えることを特徴とする。 本発明に従えば、文章ライブラリ記憶手段は3つの記憶
手段を備える。利用者が文章特定ライブラリ記憶手段の
使用を設定する場合、翻訳すべき原言語テキストが入力
されると、文章特定ライブラリ記憶手段および特定文字
列ライブラリ記憶手段が参照される。また設定されてい
ない場合は、特定文字列ライブラリ記憶手段のみが参照
される。また度数記憶手段は、文章特定ライブラリ手段
および特定文字列ライブラリ記憶手段の参照度数を計数
する。計数された参照度数は、文章特定ライブラリ手段
および特定文字列ライブラリ記憶手段内の文章データの
検索において用いられ、たとえば度数の大きさにしたが
って検索される。通常辞書は、原原語文章データの入力
時の解析、および翻訳処理において適宜参照される。 また文章編集手段は、レベル編集手段とレベル出力手
段とを備える。レベル編集手段は、文章特定ライブラリ
手段および特定文字列ライブラリ記憶手段を参照して、
順次抽出される文章データの係り受け関係を示すレベル
表示形式の文章データに編集する。レベル表示形式は、
各文章データをレベル別に分別し、そのレベルを用い
て、表現することによって、係り受け関係を示す。たと
えばレベルの小さい文章データからレベルの大きい文章
データに順番に係り受け関係が示される。レベル出力手
段は、文章特定ライブラリ手段および特定文字列ライブ
ラリ記憶手段を参照して、文頭、特定文字列、文末との
間から順次抽出される原言語文章データと、特定文字列
とその前後の文章との接合部分表現を含む予め設定の目
的言語訳を接合し、原言語部分および目的言語部分を含
むレベル表現形式の文章データとして出力する。
【0016】また本発明の判定手段は、入力される文章
データと合致または所定の類似度を有する文章データ
が、前記文章特定および特定文字列ライブラリ記憶手段
内に、唯一か予め設定される数の範囲内で存在するか否
かを判定することを特徴とする。 本発明に従えば、判定手段は、入力された各文章データ
を構成する特定文字列とその前後の文章データ情報が含
まれているデータが、唯一か予め定める範囲内に存在す
るどうかによって判定する。入力された文章データの文
字列と特定文字列が一致しなくても、予め定める範囲内
にあれば、文章特定および特定文字列ライブラリ記憶手
段の記憶内容を用いるので、比較的正確な翻訳処理を行
うことができる。
【0017】また本発明は、文章編集手段の編集処理結
果に基づいて、前記文章特定ライブラリ記憶手段、前記
特定文字列ライブラリ記憶手段および前記度数記憶手段
の記憶内容をそれぞれ累積および更新するライブラリ内
容更新手段を備えることを特徴とする。 本発明に従えば、ライブラリ内容更新手段は、編集処理
結果によって、文章特定ライブラリ記憶手段、前記特定
文字列ライブラリ記憶手段および前記度数記憶手段の記
憶内容をそれぞれ累積および更新する。たとえば、ライ
ブラリ内容更新手段は、同一の文章データが頻繁に使用
されると、その文章データに対する使用回数を度数記憶
手段を更新することによって記憶する。したがって、現
在の装置の利用状態を記憶するので、記憶された利用状
態を用いることによって、利便性を増大することができ
る。
【0018】また本発明は、原言語の各語句に対して目
的言語への翻訳情報が予め記憶される通常辞書記憶手段
と、前記入力手段から入力される原言語テキスト中の先
頭または特定語句位置から始まる略記号を含む文字記号
データからなる文章データの特定文字列とその前後部分
とについて、通常辞書記憶手段、文章特定ライブラリ記
憶手段および特定文字列ライブラリ記憶手段を参照して
目的言語の接合部分表現を含む目的言語に翻訳し、文章
特定ライブラリ記憶手段および特定文字列ライブラリ記
憶手段の記憶内容を新たに設定するライブラリ設定手段
を備えることを特徴とする。 また本発明に従えば、たとえば、新規の原言語文章を用
いて、新規の文章データを文章特定ライブラリ記憶手段
および特定文字列ライブラリ記憶手段に設定する場合を
想定する。この場合に、新規の原言語文章の特定文字列
が、たとえば利用者または専門家などによって設定され
る。この特定文字列が設定されると、通常辞書記憶手
段、文章特定ライブラリ記憶手段および特定文字列ライ
ブラリ記憶手段が参照されて、その特定文字列とその前
後部分との接合表現を含む目的言語訳および文法・文型
などの情報が取込まれる。その情報に基づいて、その特
定文字列とその前後部分とが、接合部分表現を含んだ目
的言語に翻訳される。翻訳されると、接合部分表現を含
んだ目的言語訳と、特定文字列とが関連付けられて、文
章特定ライブラリ記憶手段および特定文字列ライブラリ
記憶手段に記憶される。したがって、通常辞書記憶手
段、文章特定ライブラリ記憶手段および特定文字列ライ
ブラリ記憶手段を参照するので、容易かつ簡便に文章特
定ライブラリ記憶手段および特定文字列ライブラリ記憶
手段の文章データを設定することできる。
【0019】また本発明は、原言語テキストを目的言語
に翻訳する装置であって、原言語テキストを構成する文
章データの先頭または特定位置から始まる文字記号デー
タと、文字記号データとその前後に存在する一部または
全部の原言語文章データの文法・文型情報と、文字記号
データとその前後の原言語文章データとの接合表現部分
を含む目的言語訳と、出力順位基準情報とからなる特定
データを記憶する特定データ辞書記憶手段と、原言語テ
キストを文章データとして入力する入力手段と、入力さ
れた原言語文章データについて特定データ辞書記憶手段
を照合し、特定データ辞書記憶手段内に、入力された文
章データおよびその前後の文章データの文法・文型情報
と合致または所定の類似度を有する特定データが存在す
るか否かの判定を原言語テキストの終了まで繰返す判定
手段と、判定手段によって存在すると判定される特定デ
ータについて、その特定データが翻訳対象であって、か
つそれが文章内において第1番目の場合、照合対象の文
章データの先頭と、判定された特定データとの間に存在
する文章データを抽出し、第2番目以降の場合、前回の
照合対象の特定データと、今回の特定データ、または文
章データの末尾との間に存在する文章データを抽出する
文章データ抽出手段と、抽出された文章データのみ、ま
たは特定データ辞書記憶手段内の特定データを含めて、
目的言語に変換する翻訳手段と、判定手段によって判定
された特定データ辞書記憶手段内の文字記号データの目
的言語訳と、翻訳手段によって翻訳された目的言語訳と
を接合編集し、出力順位を決定して出力する編集出力手
段とを含むことを特徴とするテキスト翻訳装置である。 本発明に従えば、入力手段によって、原言語テキストが
文章データとして入力されると、判定手段は、入力され
た各文章データの文字記号データについて、特定データ
辞書記憶手段の記憶内容を照合し、特定データ辞書記憶
手段内に、入力された文字記号データおよびその前後の
文字記号データの文法・文型情報と合致または所定の類
似度を有する特定データが存在するか否かを判定する。
判定手段は、入力された原言語テキストの最後まで、各
文章データに対して、この判定を繰り返す。この判定が
行われた後、文章データ抽出手段は、その文章データが
翻訳対象であって、かつ文章内においてそれが第1番目
の場合は、照合対象の文章データの先頭から判定された
特定データとの間に存在する文章データが抽出される。
また第2番目以降の場合、前回の照合対象の特定データ
と、今回の特定データまたは文章データの末尾との間に
存在する文章データを抽出する。翻訳手段は、抽出され
た文章データのみ、または特定データ辞書記憶手段内の
特定データを含めて、目的言語訳に変換する。編集出力
手段は、判定手段によって判定された特定データ辞書記
憶手段内の文字記号データの目的言語訳と、翻訳手段に
よって翻訳された目的言語訳とを、接合編集して、出力
順位を決定して出力する。 したがって、原言語テキストの文章データが短く分離さ
れ、分離された文章データの内で特定データ辞書記憶手
段に記憶される文字記号データで構成される文章データ
は、特定データ辞書記憶手段に記憶される接合表現部分
を含む目的言語訳が用いられる。特定データ辞書記憶手
段に記憶される目的言語訳と、文章データの翻訳手段に
よって翻訳された目的言語訳とが接合編集されるので、
より正確な翻訳処理を行うことができる。
【0020】
【発明の実施の形態】図1は、本発明の実施の一形態で
あるテキスト翻訳装置1の内部構成を示すブロック図で
ある。テキスト翻訳装置1は、入力部2と、ライブラリ
記憶部3と、記憶部4と、表示部5と、制御部6とを含
んで構成される。入力部2は、キーボード等の入力装置
で構成され、文字・記号キー群および編集などの処理を
指示する機能キー群および実行キーなどを有する。ライ
ブラリ記憶部3は、ROM(リードオンリメモリ)、R
AM(ランダムアクセスメモリ)などで構成され、後述
する原言語から目的言語に翻訳するためのデータが格納
される。またライブラリ記憶部3は、文章特定ライブラ
リ記憶領域8、特定文字列ライブラリ記憶領域9および
通常辞書記憶領域10で構成され、それぞれ後述する文
章特定ライブラリ、特定文字列ライブラリおよび通常辞
書が格納される。
【0021】記憶部4はROMおよびRAMで構成さ
れ、本テキスト翻訳装置1の処理動作を制御するプログ
ラムおよび入力されたデータを格納する。また記憶部4
は、翻訳処理のためのワーク領域としても用いられる。
表示部5は、液晶表示装置などで実現され、入力された
文字および目的言語に翻訳された文字などを表示する。
制御部6は、記憶部4に格納されたプログラムに基づい
て、本テキスト翻訳装置1の全体の処理動作の制御を行
う。
【0022】図2は、文章特定ライブラリ15および特
定文字列ライブラリ16を作成するためのデータである
原言語文章17を示す図である。図3は、文章特定ライ
ブラリ15を説明するための図である。図4および図5
は、特定文字列ライブラリ16を説明するための図であ
る。本テキスト翻訳装置1は、通常辞書に加えて、後述
する文章特定ライブラリ15および特定文字列ライブラ
リ16を備えて目的言語への翻訳を行う。文章特定ライ
ブラリ15および特定文字列ライブラリ16は、原言語
と目的言語との両方に精通した専門家および翻訳の熟練
者などによって、原言語文章17をもとに作成される。
また利用者によって、利用者の得意分野および業務上の
分野などの例文をもとに作成される。
【0023】文章特定ライブラリ15は、1つの文章を
構成する各語句にあたる各文章データの中の焦点となる
特定文字列であり、n個のキーデータで構成されるキー
データ群20が集合したキーデータ集合群と、目的言語
訳文の出力順位のための編集順位データ21とで構成さ
れる。キーデータ群20は、原語文章の語句などを示す
文字記号データおよびキーデータと後続のキーデータと
の間の文章データの文法・文型情報などに基づいて生成
される登録内容A1〜Anと、目的言語訳文の出力編集
順位のための編集順位データ21とで構成される。
【0024】キーデータは、原言語文章17中の文章に
対して、専門家および利用者がその文章の焦点となる文
章データを選択することによって決定される方法があ
る。たとえば、図2で示される一文において、キーデー
タ群20は、専門家および利用者が、図3に示されるよ
うに、文字記号データの“It is”と、“that”と、“b
ecause”とを選択することによって決定される。この文
章のキーデータ群の各キーデータは、特定文字列ライブ
ラリ16の索引項目として用いられる。これらのキーデ
ータL1〜L3の文字記号データと、文法・文型情報お
よび代入文などとに基づいて、制御部6によってソフト
ウエア的に制御されてキーデータ群20の登録内容A1
〜Anが生成される。
【0025】次に、図3に示される文章特定ライブラリ
15の登録の例について説明する。キーデータは、登録
する原言語文章データの内の焦点となる部分を選択す
る。この設定を基に入力原言語文章データの文章構成に
マッチするデータを特定するので、対象の文章内容を幾
つかのグループに分け、翻訳の面倒な部分を分離するこ
とを念頭に置きながら、特定文字列を設定する。この例
では、“it is”,“that”等が設定されているが、任
意数のキーデータを指定することができるし、また、指
定したキーデータに合致しない場合は、特定文字列ライ
ブラリ16内を検索して、該当のキーデータと置き換え
可能なデータを探索して、代用することもできる。
【0026】次の登録内容は、上述のキーデータに対応
して設定される特定文字列部分、その特定文字列とそれ
以降の直近の特定文字列との間にある文章データの文法
・文型情報、代入文、および目的言語訳文の出力編集の
ためのレベル#(もしくはリンク#)で構成する。利用
者が設定の特定文字列に基づき、当該文章データの文法
・文型等の情報は、ライブラリ登録ソフトウエアが処理
して、利用者の意向を加味して設定する。
【0027】この例では、A1である先頭の“L1=I
t is<a>”は、原言語文章17内のキーデータと
して設定された“It is”という文字列が“L1”、す
なわち第1番目の特定文字列であることを示す。ただ
し、このケースでは目的言語訳文の出力時には、逆順と
なり、“L1”として指定された語句の出力順番は最後
となる。“<a>”は次の「aまたはa=文型(文型が
指定できる場合)」に関連する。これは、“L1”指定
の“It is”に続き、次の“L2”指定までの間にある
文章データを“a”と規定し、特に必要があれば、その
文型を指定してもよいことを示す。A2である“L2=
that<b>(bということが、aである,bがaで
ある)”は、原言語文章17内のキーデータとして設定
された“that”が第2番目のキーデータであることを示
す。“( )”内は、対応の目的言語訳であり、「{b
の部分の翻訳結果}ということが、{aの部分の翻訳結
果}である」というように置き換えられる。次の「bま
たはb=文型(文型指定が出来る場合)」は、“L2”
指定の“that”に続き、次の“L3”指定までの間にあ
る文章データを“b”と規定し、必要があれば、その文
型を指定出来ることを示す。A3である“L3=bec
ause <c>(理由は、cので)”は、原言語文章1
7内のキーデータとして設定された“because”が第3
番目のキーデータであることを示し、( )内は、対応
の目的言語訳を示し、「理由は、{cの部分の翻訳結
果}なので」ということを意味する。A1に“()”が
付いていないのは、この場合の“It is”は、目的言語
訳を持たないことを意味する。
【0028】文章特定ライブラリ15は、1つの文章の
中の複数のキーデータの集合であるキーデータ群に基づ
いて構成される。これに対して、特定文字列ライブラリ
16は、1つの文章を構成する文章データ中の焦点とな
る1つのキーデータの登録データの集合で構成される。
このキーデータは、前述の文章特定ライブラリ15にお
いて説明したキーデータの中の1つと同一のものであ
る。図2に示される原言語文章17に基づいて作成され
るこの特定文字列ライブラリ16は、1つの方法として
専門家および利用者が原言語文章17内のキーデータを
指定すると、制御部6によってソフトウエア的に制御さ
れて、そのキーデータの前後の文章データ内容が検索さ
れて、必要な情報を設定し、利用者に表示することによ
って、生成される。
【0029】図4に示すように、特定文字列ライブラリ
16で1つのキーデータは、複数の登録データ内容で構
成される。たとえばキーデータ“It is”について以下
に説明する。登録された順番に登録データ内容番号“#
1”が付される。登録データ内容は、登録語句、前後文
章データ情報、参照度数および翻訳出力制御情報を含ん
で構成される。登録語句は、“It is”などの文字記号
データを示す。前後文章データ情報は、文法・文型情報
と、目的言語訳とを含んで構成される。
【0030】文法・文型情報は、登録語句である文字記
号データの前の文章データおよび後の文章データの品
詞、文型などの情報で構成される。たとえば、この登録
語句“It is”の前文章データに関しては“無し”であ
り、後文章データに関して文法・文型情報は、形容詞ま
たは名詞を示す“形/名”で構成される。目的言語訳
は、このキーデータと、前の文章データあるいは後の文
章データとの接合表現部分が含まれた目的言語訳で構成
される。たとえば、後の文章データは“です。”で構成
される。
【0031】参照度数は、この登録データ内容が参照さ
れた回数Xで構成される。翻訳出力制御情報は、このキ
ーデータを含んだ翻訳すべき原言語文章の目的言語への
翻訳に関する制御情報が格納されたり、キーデータを目
的言語に翻訳して表示部6に出力するときに関する情報
で構成される。たとえば、後述する分離および翻訳が行
われる場合にこのキーデータの目的言語訳、翻訳すべき
原言語文章17のこのキーデータの前または後の直近の
キーデータの情報、および前述の文章特定ライブラリ1
5が用いられない場合の出力編集順位のための出力順位
基準情報が示される。
【0032】なお、図4では上述したようにキーデータ
の文字記号データ“It is”について説明したが、図5
(1)および図5(2)に示される他のキーデータ“th
at”および“because”についは、同様であるので、説
明を省略する。
【0033】図6は、本テキスト翻訳装置1が備える通
常辞書18を説明するための図である。通常辞書18
は、見出し語句、品詞コード、訳語、属性コードおよび
その他の関連情報を含んで構成される。品詞コード、訳
語、属性コードおよび他の関連情報は、見出し語句に関
連付けられて構成される。たとえば、見出し語句“nea
r”に対して、副詞を示す“ad”と、訳語“近く,接近
して”と、属性コード“−”と、その他の関連情報とが
順番に構成される。見出し語句は、原言語の単語で構成
され、品詞コードはその見出し語句の品詞を示す。また
訳語はその見出し語句の目的言語訳を示し、属性コード
はその見出し語句の属性、たとえば動物、金属などを示
す。その他の関連情報は、たとえばその見出し語句の用
法などが示される。また通常辞書18は新規設定、追
加、削除および変更することができる。
【0034】図7は、本テキスト翻訳装置1の処理動作
を説明するための概略図である。翻訳すべき原言語文章
27が入力部2から入力されると、ライブラリ記憶部3
から通常辞書18、文章特定ライブラリ15および特定
文字列ライブラリ16のデータ22が読出されて、翻訳
処理・生成更新部23で後述する翻訳処理が行われる。
翻訳処理が行われると、翻訳処理結果リスト部25から
翻訳処理結果が出力される。また翻訳処理が行われる
と、翻訳時の情報に基づいて、文章特定ライブラリ15
および特定文字列ライブラリ16のデータ、たとえば参
照度数などのデータが変更される。
【0035】また文章特定ライブラリ15および特定文
字列ライブラリ16に対して、新規登録データ・追加デ
ータ・変更データ28が入力されると、翻訳処理・生成
更新部23で各データに即した処理が行われる。新規登
録データが入力されると、翻訳処理・生成更新部23に
制御されて新規ライブラリデータモジュール24によっ
て、新規の文章特定ライブラリ15および特定文字列ラ
イブラリ16が作成されてライブラリ記憶部3に記憶さ
れる。また翻訳・新規・追加・削除・変更リスト部26
によって新規リストが出力される。追加データ・変更デ
ータが入力されると、翻訳処理・生成更新モジュール2
3で、文章特定ライブラリ15および特定文字列ライブ
ラリ16の追加および変更の処理を行い、翻訳・新規・
追加・削除・変更リスト部26によって追加・削除・変
更リストが出力される。
【0036】図8〜図11は、本テキスト装置1の処理
動作を説明するフローチャートである。ステップs1で
は、翻訳すべき原言語文章の入力が行われる。この原言
語文章は、入力部2によって入力される。翻訳処理を行
うために、一文毎に、その文を構成する単語および語句
に相当する入力文章データとして取込まれる。ステップ
s2では、入力された翻訳すべき原言語文章が終りであ
るかどうかが判断される。翻訳すべき原言語文章が終り
である場合には翻訳処理動作は終了し、終りでない場合
にはステップs3に進む。
【0037】ステップs3では、前述の通常辞書18に
おいて、取り込まれた一文を構成する入力文章データが
それぞれ照合される。これによって、各入力文章データ
の目的言語訳、品詞および文法情報などが検索され、各
入力文章データに関連付けられて記憶部4に格納され
る。これは独立した処理ではなく、通常辞書18と文章
特定ライブラリ15および特定文字列ライブラリ16の
適時参照である。
【0038】ステップs4では、一文を構成する入力文
章データと文章特定ライブラリ15および特定文字列ラ
イブラリ16(以下、辞書ライブラリと称する)とが照
合される。各入力文章データを構成する”It is”など
の文字記号データと、辞書ライブラリのキーデータの文
字記号データとが照合される。なお、このステップの詳
細な説明は図12を用いて後述する。ステップs5で
は、検索された各入力文章データに関連づけて記憶され
ている文法情報と、辞書ライブラリの文法・文型情報と
が照合される。なお、このステップの詳細は図13を用
いて後述する。
【0039】図12は、各入力文章データを構成する文
字記号データと、通常辞書および辞書ライブラリとの照
合の処理動作を説明するためのフローチャートである。
このフローチャートは図8〜図11に示すステップs4
の処理に相当する。ステップm1では、各入力文章デー
タを構成する文字記号データと、通常辞書および辞書ラ
イブラリとを照合するために、たとえば入力された一文
の先頭の入力文章データに読出し位置ポインタが設定さ
れる。ステップm2では、前述の読出し位置ポインタが
設定された入力文章データが、照合データとして文字お
よび語句単位で取込まれる。ステップm3では、入力文
章データが終わりであるかどうかが判断される。すなわ
ち、入力された一文の最終の入力文章データの取込みが
終了したかどうかが判断される。終わりである場合に
は、ステップs5に戻り、終わりでない場合にはステッ
プm4に進む。
【0040】ステップm4では、取込まれた入力文章デ
ータが句読点データを示すかどうかが判断される。句読
点データの場合、ステップm9に進み、句読点データで
ない場合はステップm5に進む。
【0041】ステップm5では、取込まれた入力文章デ
ータと通常辞書およびライブラリの文字記号データであ
るキーデータとが照合される。ステップm6では、前ス
テップの照合結果において、入力文章データと合致する
キーデータが通常辞書および辞書ライブラリに存在する
かどうかが判断される。存在する場合はステップm7に
進み、存在しない場合はステップm8に進む。ステップ
m7では、合致した入力文章データの一文中の位置ポイ
ンタが記憶部4のワーク領域に格納される。ステップm
8では、位置ポインタの更新が行われて、次の入力文章
データの照合が行われる。ステップm9では、照合中の
入力文章データ内の照合対象データ読出しポインタをリ
セットして、ステップm2に戻り、照合を続ける。(こ
こで照合文字列が一旦クリアされる。すなわち、句読点
を含む特定文字列は存在しない。)図13は、検索され
て各入力文章データに関連付けて記憶されている文法・
文型情報と、通常辞書およびライブラリの文法・文型情
報との照合の処理動作を説明するためのフローチャート
である。このフローチャートは図8〜図11に示すステ
ップs5の処理に相当する。ステップn1では、各入力
文章データの文法・文型情報と、辞書ライブラリの文法
・文型情報とを照合するために、たとえば入力された一
文の先頭の文章データに読出し位置ポインタが設定され
る。ステップn2では、前述の読出し位置ポインタが設
定された文章データが、照合データとして文字および語
句単位で取込まれる。ステップn3では、入力文章デー
タが終わりであるかどうかが判断される。すなわち、入
力された一文の最終の文章データの取込みが終了したか
どうかが判断される。終わりである場合には、ステップ
s6に進み、終わりでない場合にはステップn4に進
む。
【0042】ステップn4では、取込まれた文章データ
が句読点データを示すかどうかが判断される。句読点デ
ータの場合、ステップn9に進み、句読点データでない
場合はステップn5に進む。
【0043】ステップn5では、取込まれた入力文章デ
ータの文法・文型情報と、通常辞書およびライブラリの
各キーデータの文法・文型情報とが照合される。ステッ
プn6では、前ステップの照合結果において、入力文章
データの文法・文型情報と合致する文法・文型情報を有
するキーデータがライブラリに存在するかどうかが判断
される。存在する場合はステップn7に進み、存在しな
い場合はステップn8に進む。ステップn7では、合致
した入力文章データの一文中の位置ポインタが記憶部4
のワーク領域に格納される。ステップn8では、位置ポ
インタの更新が行われて、次の入力文章データに位置ポ
インタが設定される。上述の処理が行われた後、ステッ
プn2に戻り、次の入力文章データの照合が行われる。
ステップn9では、照合中の入力文章データ内の照合対
象データ読出しポインタをリセットした後、照合を続け
るために、ステップn2に戻る。
【0044】上述のようにして、入力された一文を単語
または語句単位で構成する入力文章データと、通常辞書
および辞書ライブラリとが照合される。一文の入力文章
データの照合が終了すると、以下に説明するような分離
・翻訳処理が行われる。すなわち、前述の図8〜図11
に示すステップs6からの処理が行われる。
【0045】ステップs6では、文章特定ライブラリ1
5の使用が設定されているかどうかが判断される。設定
されていない場合はステップs7に進み、設定されてい
ない場合はステップs8に進む。本テキスト翻訳装置1
において、文章特定ライブラリ15が設定されていない
場合、特定文字列ライブラリ16のみで翻訳が行われ
る。
【0046】ステップs7では、記憶部3のワーク領域
に設けられる文章特定ライブラリフラグがオン状態に設
定され、ステップs9に進む。ステップs8では、記憶
部3のワーク領域に設けられる文章特定ライブラリフラ
グがオフ状態に設定され、ステップs11に進む。
【0047】ステップs9では、各入力文章データとラ
イブラリとの照合の結果、記憶部4に格納された位置ポ
インタ群が示す特定データ(以下、照合結果データと称
する)群が、文章特定ライブラリの1つの文章に対して
設けられるキーデータ群に包含されるかまたは合致する
かどうかが判断される。包含または合致される場合はス
テップs10に進み、包含または合致されない場合はス
テップs11に進む。たとえば、照合結果データ群が、
図3に示される各文字記号データ“It is”,“that”
で構成される場合に、図3に示される文章特定ライブラ
リ15のキーデータ群の各文字記号データ“It is”,
“that”,“because”に包含される。ステップs10
では、文章特定ライブラリ15から照合結果データ群に
応じたデータが検索されて読出され、そのデータに基づ
いて後述のステップs11以下の処理が行われる。すな
わち、図3に示される登録内容A1〜A3が読出されて
処理が行われる。なお、照合結果データ群が、キーデー
タの文字記号データ“It is”と上述のキーデータとは
異なるキーデータで構成される場合には、キーデータの
文字記号データ“It is”を含んだ文章構成に基づいて
作成された文章特定ライブラリ15のキーデータ群の中
から適切なキーデータ群が検索される。
【0048】図14は、翻訳すべき一文である原言語文
章データから目的言語に翻訳する翻訳処理の例を示す図
である。以下の処理について図14を用いて説明を行
う。図8〜図11のステップs11では、入力された一
文を翻訳できる状態にするために文章特定データリスト
が編集される。文章特定データリストは、図14(1)
において、たとえばD1,D3,D5の情報で構成され
る。
【0049】ステップs12では、記憶部4のワーク領
域に格納された位置ポインタによって示される照合結果
データ群に基づいて、文章特定データリストからキーデ
ータが順次取出される。図14(1)では、キーデータ
は入力文章データD1,D3,D5である。ステップs
13では、取込むべきキーデータが存在するかどうかが
判断される。存在する場合はステップs14に進み、存
在しない場合はステップs16に進む。ステップs14
では、文章の先頭から取込まれたキーデータまで、もし
くはキーデータ間、もしくは、キーデータから文末まで
の文章の分離・翻訳処理が行われる。また特に特定文字
列ライブラリ16では、同一のキーデータに対して登録
内容が複数設けられるので、キーデータの検索におい
て、参照回数Xの大きい順番に検索するようにしてもよ
い。
【0050】文章特定データリストからキーデータD1
が取込まれると、特定文字列ライブラリ16のキーデー
タD1の“It is”の登録データ内容#1の対目的言語
訳“です”が取込まれる。これによって、キーデータD
1の“It is”は、“です”に翻訳される。次にキーデ
ータD3の“that”が取り込まれると、その間にある入
力文章データD2の“necessary”は、一時的に分離さ
れ、通常辞書18によって検索された“必要”が取込ま
れる。キーデータD3の“that”もキーデータD1の場
合と同様に、特定文字列ライブラリ16から“ことが”
が取込まれる。入力文章データD4〜D6も、同様に図
14(2)に示されるように翻訳される。
【0051】ステップs15では、キーデータに対して
予め定められる接合部分表現を含む目的言語訳と、通常
辞書18などによって翻訳処理された翻訳結果とが接合
編集される。ステップs16で、文章特定ライブラリフ
ラグがオン状態であるがどうかが判断される。オフ状態
である場合はステップs17に進み、オン状態である場
合はステップs20に進む。ステップs17では、特定
文字列ライブラリ15の翻訳出力制御情報の出力順位基
準情報に基づいて、出力編集が行われる。ステップs1
8では、出力編集された目的言語訳が出力部5に出力さ
れる。図14(2)に示されるように、目的言語訳が出
力される。ステップs19では、記憶部4のワーク領域
がクリアされ、ステップs1に戻る。ステップs20で
は、文章特定ライブラリ15の編集順位データ21に基
づいて出力編集が行われる。
【0052】
【発明の効果】以上のように本発明によれば、翻訳すべ
き原言語テキストの分離箇所を特定する文字列とその前
後の文章データ情報、その文字列とその前後部分との接
合表現を含む目的言語訳を予め文章ライブラリに設定し
ていることによって、誤りやすい部分の目的言語訳が予
め登録されるので、比較的高速で誤りの少ない翻訳処理
することができる。
【0053】また本発明によれば、文章ライブラリは翻
訳の熟練者の知識および経験を加味された文章データで
構成されるので、正確な翻訳処理をすることができる。
【0054】また本発明によれば、ライブラリ内容更新
手段は、編集処理結果によって、文章特定ライブラリ記
憶手段、前記特定文字列ライブラリ記憶手段および前記
度数記憶手段の記憶内容をそれぞれ累積および更新す
る。したがって、現在の装置の利用状態を記憶するの
で、記憶された利用状態を用いることによって、利便性
を増大することができる。
【0055】また本発明によれば、通常辞書記憶手段、
文章特定ライブラリ記憶手段および特定文字列ライブラ
リ記憶手段を参照するので、容易かつ簡便に文章特定ラ
イブラリ記憶手段および特定文字列ライブラリ記憶手段
の特定データを設定することできる。
【図面の簡単な説明】
【図1】本発明の実施の一形態であるテキスト翻訳装置
1の内部構成を示すブロック図である。
【図2】文章特定ライブラリ15および特定文字列ライ
ブラリ16を作成するためのデータである原言語文章1
7を示す図である。
【図3】文章特定ライブラリ15を説明するための図で
ある。
【図4】特定文字列ライブラリ16を説明するための図
である。
【図5】特定文字列ライブラリ16を説明するための図
である。
【図6】本テキスト翻訳装置1が備える通常辞書18を
説明するための図である。
【図7】本テキスト翻訳装置1の処理動作を説明するた
めの概略図である。
【図8】本テキスト装置1の入力処理動作を説明するた
めのフローチャートである。
【図9】本テキスト装置1の入力処理動作を説明するた
めのフローチャートである。
【図10】本テキスト装置1の翻訳処理動作を説明する
ためのフローチャートである。
【図11】本テキスト装置1の翻訳処理動作を説明する
ためのフローチャートである。
【図12】本テキスト装置1の翻訳処理動作を説明する
ためのフローチャートである。
【図13】本テキスト装置1の翻訳処理動作を説明する
ためのフローチャートである。
【図14】翻訳すべき原言語テキストの一文を目的言語
訳に翻訳する翻訳処理の例を示す図である。
【符号の説明】
1 テキスト翻訳装置 2 入力部 3 ライブラリ記憶部 4 記憶部 5 表示部 6 制御部 15 文章特定ライブラリ 16 特定文字列ライブラリ 17 原言語文章 18 通常辞書

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 原言語テキストを目的言語に翻訳する方
    法であって、 予め、文章データを特定するための文字列と、その文章
    データ内のその文字列の前後の文章情報および目的言語
    訳を含む関連情報とを複数、文章ライブラリとして記憶
    しておき、 原言語テキストを入力し、 入力された原言語テキスト内の文字列と、文章ライブラ
    リ中に記憶されている文字列およびその関連情報とを照
    合し、 照合によって、合致または所定の類似度の文字列とその
    関連情報とが特定されるとき、特定される文字列、文
    頭、文末の間にある原言語テキストを分離し、 分離された原言語テキストを目的言語に翻訳し、その結
    果と、特定される文字列についての関連情報の中の目的
    言語訳とを接合する編集によって、目的言語テキストを
    得ることを特徴とするテキスト翻訳方法。
  2. 【請求項2】 原言語テキストを目的言語に翻訳する方
    法であって、 原言語文章に基づいて作成され、予め、文章ライブラリ
    として、各原言語文章の先頭または所定語句位置から始
    まる略記号を含む文字記号データからなる特定文字列
    と、その前後部分に対する接合表現を含む目的言語訳文
    と、文章データの先頭、特定文字列とその前後の直近の
    特定文字列、および文章の末尾との間に存在する原言語
    文章の文法および文型とを含む文章データを記憶してお
    き、 原言語テキストを入力し、 予め定める基準に従って、入力された原言語テキスト中
    の文章データと合致または類似範囲内にある文章データ
    が文章ライブラリ中に記憶されているか否かを判定し、 文章データが文章ライブラリ内に記憶されていると判定
    されるとき、記憶されている文章データに基づいて、入
    力された原言語テキストの中の文章データの先頭、特定
    文字列、その前後の直近の特定文字列、文章の末尾との
    間にある原言語文章データを順次抽出し、目的言語テキ
    ストを編集処理することを特徴とするテキスト翻訳方
    法。
  3. 【請求項3】 前記文章ライブラリは、翻訳の熟練者の
    知識および経験を加味し、目的言語への翻訳が困難な実
    例文に基づいて特定データを作成し、その特定データを
    記憶することを特徴とする請求項1または2記載のテキ
    スト翻訳方法。
  4. 【請求項4】 原言語テキストを目的言語に翻訳する装
    置であって、 原言語文章に基づいて作成され、各言語文章の先頭また
    は所定語句位置から始まる略記号を含む文字記号データ
    からなる特定文字列と、その前後部分に対する接合表現
    を含む目的言語訳文と、特定文字列とその前後の特定文
    字列との間に存在する原言語文の文法および文型とを含
    む文章データが、予め記憶される文章ライブラリ記憶手
    段と、 原言語テキストを文章データとして入力する入力手段
    と、 予め定める基準に従って、入力されたテキスト中の文章
    データと合致または類似範囲内にある文章データが、文
    章ライブラリ記憶手段に記憶されているか否かを判定す
    る判定手段と、 判定手段によって、文章データが文章ライブラリ記憶手
    段に記憶されていると判定されるとき、記憶されている
    文章データに基づいて、入力された原言語テキスト中の
    文章データの先頭、特定文字列、その前後の直近の特定
    文字列、末尾の間にある原言語文章データを順次抽出
    し、目的言語テキストに編集処理する文章編集手段とを
    含むことを特徴とするテキスト翻訳装置。
  5. 【請求項5】 前記文章編集手段は、抽出される原言語
    文章データを目的言語に変換する翻訳手段と、 翻訳手段による変換結果を、原言語の特定文字列とその
    前後部分との接合部分表現を含む目的言語訳に接合し、
    目的言語の文章データとして出力する文章出力手段とを
    備えることを特徴とする請求項4記載のテキスト翻訳装
    置。
  6. 【請求項6】 前記文章ライブラリ記憶手段は、 各原言語文章の先頭または特定語句位置から始まり、略
    記号を含む文字記号データからなる特定文字列と、その
    前後部分に対する接合部分表現を含む目的言語訳文と、
    原言語文章の先頭または特定語句位置の特定文字列とそ
    の前後の特定文字列との間にある文章データの品詞およ
    び活用を含む文法・文型・代入文とを含む文章データを
    記憶する文章特定ライブラリ記憶手段と、 特定文字列とその前後の原言語文章データの文法・文型
    情報を記憶する特定文字列ライブラリ記憶手段と、 文章特定ライブラリ記憶手段または特定文字列ライブラ
    リ記憶手段への参照度数を記憶する度数記憶手段とを備
    え、 前記文章編集手段は、順次抽出される文章データを、文
    章特定ライブラリ記憶手段および特定文字列ライブラリ
    記憶手段の記憶内容に基づいて、係り受け関係を示すレ
    ベル表示形式の文章データに編集するレベル編集手段
    と、 原言語文章データの先頭または特定文字列との間、また
    は特定文字列と他の特定文字列との間、または文章の末
    尾との間の原言語文章データを、各特定文字列の接合部
    分表現を含む目的言語訳と接合し、原言語部分および目
    的言語部分を含むレベル表現形式の文章データとして出
    力するレベル出力手段とを備えることを特徴とする請求
    項4記載のテキスト翻訳装置。
  7. 【請求項7】 前記判定手段は、 入力された文章データと合致または所定の類似度を有す
    る文章データが、前記文章特定ライブラリ記憶手段内
    に、唯一であるかまたは予め設定される数の範囲内で存
    在するかを判定することを特徴とする請求項6記載のテ
    キスト翻訳装置。
  8. 【請求項8】 前記文章編集手段の編集処理結果に基づ
    いて、 前記文章特定ライブラリ記憶手段、前記特定文字列ライ
    ブラリ記憶手段および前記度数記憶手段の記憶内容をそ
    れぞれ累積および更新するライブラリ内容更新手段を備
    えることを特徴とする請求項6または7記載のテキスト
    翻訳装置。
  9. 【請求項9】 原言語の各語句に対して目的言語への翻
    訳情報が予め記憶される通常辞書記憶手段と、 前記入力手段から入力される原言語テキスト中の先頭と
    特定文字列との間、または特定文字列と他の特定文字列
    との間、または文章の末尾との間にある原言語文章につ
    いて、 通常辞書記憶手段、文章特定ライブラリ記憶手段および
    特定文字列ライブラリ記憶手段を参照して目的言語に翻
    訳し、文章特定ライブラリ記憶手段および特定文字列ラ
    イブラリ記憶手段の記憶内容を新たに設定するライブラ
    リ設定手段を備えることを特徴とする請求項6〜8のい
    ずれかに記載のテキスト翻訳装置。
  10. 【請求項10】 原言語テキストを目的言語に翻訳する
    装置であって、 原言語テキストを構成する文章データの先頭または特定
    位置から始まる文字記号データと、その目的言語訳と、 原言語文章の文頭と前記文字記号データとの間、文字記
    号データの前後に存在する他の直近の文字記号データと
    の間に存在する一部または全部の原言語文章データの文
    法・文型情報と、文字記号データとその前後部分との接
    合表現部分を含む目的言語訳と、出力順位基準情報とを
    記憶する特定データ辞書記憶手段と、 通常辞書記憶手段と、 原言語テキストを文章データとして入力する入力手段
    と、 入力された原言語文章データを通常辞書記憶手段および
    特定データ辞書記憶手段と照合し、特定データ辞書記憶
    手段内に、入力データと一致し、かつその前後の文章デ
    ータの文法・文型情報と合致または所定の類似度を有す
    る特定データが存在するか否かの判定を原言語テキスト
    の終了まで繰返す判定手段と、 判定手段によって存在すると判定された特定データにつ
    いて、それが翻訳対象であり、かつそれが文章データの
    中で第1番目の場合、照合対象の文章データの先頭と、
    判定された特定データとの間に存在する文章データを抽
    出し、第2番目以降の場合、直前の特定データと、今回
    の特定データ、または文章データの末尾との間に存在す
    る文章データを抽出する文章データ抽出手段と、 抽出された原言語文章データのみ、または特定された前
    記特定データとを含めて、目的言語に変換する翻訳手段
    と、 判定手段によって判定された特定データ辞書記憶手段内
    の特定データの目的言語訳と、翻訳手段によって翻訳さ
    れた目的言語訳とを接合編集し、出力順位を決定して出
    力する編集出力手段とを含むことを特徴とするテキスト
    翻訳装置。
JP8224200A 1996-08-26 1996-08-26 テキスト翻訳方法および装置 Pending JPH1063665A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8224200A JPH1063665A (ja) 1996-08-26 1996-08-26 テキスト翻訳方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8224200A JPH1063665A (ja) 1996-08-26 1996-08-26 テキスト翻訳方法および装置

Publications (1)

Publication Number Publication Date
JPH1063665A true JPH1063665A (ja) 1998-03-06

Family

ID=16810101

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8224200A Pending JPH1063665A (ja) 1996-08-26 1996-08-26 テキスト翻訳方法および装置

Country Status (1)

Country Link
JP (1) JPH1063665A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6523000B1 (en) 1998-12-25 2003-02-18 Nec Corporation Translation supporting apparatus and method and computer-readable recording medium, wherein a translation example useful for the translation task is searched out from within a translation example database

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6523000B1 (en) 1998-12-25 2003-02-18 Nec Corporation Translation supporting apparatus and method and computer-readable recording medium, wherein a translation example useful for the translation task is searched out from within a translation example database

Similar Documents

Publication Publication Date Title
EP0180888B1 (en) Method and apparatus for natural language processing
US5652896A (en) Language conversion system and text creating system using such
JP4504555B2 (ja) 翻訳支援システム
US5890103A (en) Method and apparatus for improved tokenization of natural language text
EP0645720B1 (en) Dictionary creation supporting system
JP2002513970A (ja) マシンアシスト翻訳ツール
JP2005535007A (ja) 文書検索システム用の知識抽出のための自己学習システムの合成方法
JPH0567144A (ja) 前編集支援方法およびその装置
CN108255818B (zh) 利用分割技术的复合式机器翻译方法
JPH1063665A (ja) テキスト翻訳方法および装置
JPH0877196A (ja) 文書情報抽出装置
CN108280066B (zh) 一种汉语到英语的离线翻译方法
JP3892227B2 (ja) 機械翻訳システム
JPH0561902A (ja) 機械翻訳システム
JPH05282361A (ja) データベース作成支援装置及び機械翻訳装置
JP3176750B2 (ja) 自然言語の翻訳装置
JPH1021242A (ja) 機械翻訳装置及び機械翻訳後編集方法
JPH1031676A (ja) 対訳例文検索装置
JPH03273360A (ja) 機械翻訳方法及び装置
JP2806352B2 (ja) 機械翻訳用辞書メンテナンス装置
JPH10149364A (ja) 訳語選択装置と記憶媒体
JP2002183134A (ja) 翻訳装置
JP2786211B2 (ja) 機械翻訳装置における後編集装置
JPH05225232A (ja) テキスト自動前編集装置
JPH09231217A (ja) 言語解析システムおよび方法