JPH0883280A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH0883280A
JPH0883280A JP6220007A JP22000794A JPH0883280A JP H0883280 A JPH0883280 A JP H0883280A JP 6220007 A JP6220007 A JP 6220007A JP 22000794 A JP22000794 A JP 22000794A JP H0883280 A JPH0883280 A JP H0883280A
Authority
JP
Japan
Prior art keywords
text data
data
text
translation
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6220007A
Other languages
English (en)
Inventor
Hidezo Kugimiya
秀造 釘宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP6220007A priority Critical patent/JPH0883280A/ja
Publication of JPH0883280A publication Critical patent/JPH0883280A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 テキストデータと非テキストデータが混在す
る原文書データからテキストデータのみを正確に抽出し
て翻訳処理をする文書処理装置を提供する。 【構成】 テキストデータ抽出手段により、入力された
原文書データからテキストデータを抽出しその抽出した
テキストデータにテキストID番号を対応させてテキス
トデータ記憶部に記憶させるとともにテキストデータ抽
出後の対応箇所にテキストID番号を付加し非テキスト
データを原文書と同一のレイアウトで非テキストデータ
記憶部に記憶させ、編集手段が抽出されたテキストデー
タに対して編集処理を行うと、翻訳手段は編集したテキ
ストデータに対して第1言語から第2言語に翻訳処理を
実行する。テキストデータ置換手段が、非テキストデー
タ記憶部に記憶されたテキストID番号と非テキストデ
ータを読み出しそのテキストID番号を翻訳処理の結果
得られた第2言語からなるテキストデータに置き換える
構成である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文章を形成するテキス
トデータと形式情報からなる非テキストデータの混在す
る文書の編集や翻訳などの文書データ処理を行う文書処
理装置に関する。
【0002】
【従来の技術】最近は、DTP(Desk Top Publishing
)機能を持った文書処理装置により、テキストデータ
(言語データ)からなる文書データ以外に図や表を含む
文書データが多く作成されるようになっている。また、
TeXのように文書中に、書体やフォントのサイズ等の
組版の指定情報を表すマークアップ記号が埋め込まれた
文書データも増大している。そして、これらの文書デー
タを他の言語データに翻訳するという技術に対する需要
も増えてきている。
【0003】しかし、従来の機械翻訳機能を備えた文書
処理装置では、入力される文書データのうちテキストデ
ータ(言語データ)しか処理することができない。その
ため、例えば、図や表を含んだDTP文書を翻訳しよう
とする場合、利用者が、一旦、図、表、レイアウト情報
などの非テキストデータ(非言語データ)を原文書から
取り除き、テキストデータのみを翻訳した後で、非テキ
ストデータを結合するという操作が必要となる。これは
利用者には大きな負担であり、また、翻訳作業も非常に
効率が悪い。
【0004】そこで、原文書から言語データだけを抽出
して翻訳処理を行い、原文書の言語データと翻訳処理さ
れた言語データとを置き換えることにより、非言語デー
タが含まれた文書の文書処理を行うことができるように
した文書処理システムが提案されている(特開平4−2
59057号公報、参照)。
【0005】
【発明が解決しようとする課題】しかしながら、特開平
4−259057号公報の文書処理システムでは、処理
された言語データが元の文書内のどこの箇所にあったか
という情報がないために、元の文書内の言語データと処
理された言語データとを置き換えるための対応箇所決定
手段が必要である。また、この対応箇所決定手段の方法
として、例えば、文同士が一致する文、同一のキーワー
ドが含まれる文、パラグラフの先頭の文同士は対応する
文、対応がとれた文から同一距離にある文、などは元の
文と対応することからその状態を検索して対応箇所を決
定しているため、文書処理システムが複雑になるという
問題がある。また、対応箇所決定手段が、常に正しい対
応箇所を決定するとは限らないために、非効率であると
ともに信頼性に欠けるという問題点がある。
【0006】本発明は以上の事情を考慮してなされたも
ので、テキストデータと非テキストデータが混在する文
書データで構成される文書データのレイアウトからテキ
ストデータのみを正確に抽出して信頼性の高い翻訳処理
をすることができる文書処理装置を提供するものであ
る。
【0007】
【課題を解決するための手段】本発明は、第1言語から
なるテキストデータと非テキストデータとが混在する原
文書データを入力するとともに編集、レイアウト、翻訳
等の処理指示を入力する入力手段と、テキストデータを
記憶するテキストデータ記憶部と非テキストデータを記
憶する非テキストデータ記憶部を有する記憶手段と、入
力された原文書データからテキストデータを抽出しその
抽出したテキストデータにテキストID番号を対応させ
て前記テキストデータ記憶部に記憶させるとともにテキ
ストデータ抽出後の対応箇所に前記テキストID番号を
付加し非テキストデータを原文書と同一のレイアウトで
前記非テキストデータ記憶部に記憶させるテキストデー
タ抽出手段と、抽出されたテキストデータに対して編集
処理を実行する編集手段と、編集されたテキストデータ
に対して第1言語から第2言語に翻訳処理を実行する翻
訳手段と、非テキストデータ記憶部に記憶されたテキス
トID番号と非テキストデータを読み出しそのテキスト
ID番号を翻訳処理の結果得られた第2言語からなるテ
キストデータに置き換えるテキストデータ置換手段と、
置き換えられた第2言語からなるテキストデータと非テ
キストデータとが混在する文書データを出力する出力手
段とをそれぞれ備えたことを特徴とする文書処理装置で
ある。
【0008】さらに、他の発明としては、第1言語から
なるテキストデータと非テキストデータとが混在する原
文書データを入力するとともに編集、レイアウト、翻訳
等の処理指示を入力する入力手段と、テキストデータを
記憶するテキストデータ記憶部とテキストデータ対応関
係情報を記憶するテキストデータ対応関係記憶部を有す
る記憶手段と、入力された原文書データからテキストデ
ータを抽出するとともに抽出したテキストデータを記憶
手段のテキストデータ記憶部に記憶させるテキストデー
タ抽出手段と、抽出されたテキストデータに対して編集
処理を実行するとともに編集後のテキストデータと原文
書データとのテキストデータ対応関係情報を記憶手段の
テキストデータ対応関係記憶部に記憶させる編集手段
と、編集されたテキストデータに対して翻訳処理を実行
する翻訳手段と、テキストデータ対応関係記憶部に記憶
されたテキストデータ対応関係情報に基づき第1言語か
らなるテキストデータを翻訳処理の結果得られた第2言
語からなるテキストデータに置き換える置換手段と、置
き換えられた第2言語からなるテキストデータと非テキ
ストデータとが混在する文書データを出力する出力手段
とをそれぞれ備えたことを特徴とする文書処理装置であ
る。
【0009】前記テキストデータ抽出手段はテキストデ
ータ抽出部およびテキストデータ判別部を備え、前記テ
キストデータ抽出部が入力された原文書データからテキ
ストデータを抽出する際、テキストデータ判別部はテキ
ストデータであるか非テキストデータであるかを判別す
るよう構成されることが好ましい。
【0010】なお、本発明において、入力手段として
は、キーボード、OCR等の入力装置が用いられる。記
憶手段(テキストデータ記憶部、非テキストデータ記憶
部、キストデータ対応関係記憶部)、テキストデータ抽
出手段(テキストデータ抽出部、テキストデータ判別
部)、編集手段、翻訳手段、テキストデータ置換手段と
しては、CPU、RAM、ROM、I/Oポートからな
るマイクロコンピュータが用いられる。また、記憶手段
としては、特に、RAMが用いられる。また、翻訳手段
としては、翻訳用の辞書、文法規則等を格納しているR
OMが用いられる。出力手段としては、CRT、LCD
等の表示装置、あるいは熱転写プリンタ、レーザプリン
タ等の印刷装置が用いられる。
【0011】
【作用】本発明の構成によれば、入力手段からは、第1
言語からなるテキストデータと非テキストデータとが混
在する原文書データを入力するとともに編集、レイアウ
ト、翻訳等の処理指示を入力する。テキストデータを記
憶するテキストデータ記憶部と非テキストデータを記憶
する非テキストデータ記憶部から構成されている記憶手
段が備えられている。テキストデータ抽出手段は、入力
された原文書データからテキストデータを抽出しその抽
出したテキストデータにテキストID番号を対応させて
前記テキストデータ記憶部に記憶させるとともにテキス
トデータ抽出後の対応箇所に前記テキストID番号を付
加し非テキストデータを原文書と同一のレイアウトで前
記非テキストデータ記憶部に記憶させる。編集手段が抽
出されたテキストデータに対して編集処理を実行する
と、翻訳手段は編集されたテキストデータに対して第1
言語から第2言語に翻訳処理を実行する。テキストデー
タ置換手段は、非テキストデータ記憶部に記憶されたテ
キストID番号と非テキストデータを読み出しそのテキ
ストID番号を翻訳処理の結果得られた第2言語からな
るテキストデータに置き換える。従って、出力手段は置
き換えられた第2言語からなるテキストデータと非テキ
ストデータとが混在する文書データを出力することがで
きる。従って、原文書と同じレイアウトの翻訳文書が得
られることになり、翻訳処理の効率を大幅に向上するこ
とができるので翻訳利用者の負担も大幅に軽減される。
【0012】さらに、他の発明の構成によれば、入力手
段からは、第1言語からなるテキストデータと非テキス
トデータとが混在する原文書データを入力するとともに
編集、レイアウト、翻訳等の処理指示を入力する。テキ
ストデータを記憶するテキストデータ記憶部とテキスト
データ対応関係情報を記憶するテキストデータ対応関係
記憶部から構成されている記憶手段が備えられている。
テキストデータ抽出手段は、入力された原文書データか
らテキストデータを抽出するとともに抽出したテキスト
データを記憶手段のテキストデータ記憶部に記憶させる
と、編集手段は、抽出されたテキストデータに対して編
集処理を実行するとともに編集後のテキストデータと原
文書データとのテキストデータ対応関係情報を記憶手段
のテキストデータ対応関係記憶部に記憶させる。翻訳手
段が編集されたテキストデータに対して翻訳処理を実行
すると、置換手段はテキストデータ対応関係記憶部に記
憶されたテキストデータ対応関係情報に基づき第1言語
からなるテキストデータを翻訳処理の結果得られた第2
言語からなるテキストデータに置き換える。従って、出
力手段は置き換えられた第2言語からなるテキストデー
タと非テキストデータとが混在する文書データを出力す
ることができる。従って、原文書と同じレイアウトの翻
訳文書が得られることになり、翻訳処理の効率を大幅に
向上することができるので翻訳利用者の負担も大幅に軽
減される。
【0013】前記テキストデータ抽出手段はテキストデ
ータ抽出部およびテキストデータ判別部を備えた構成で
あれば、前記テキストデータ抽出部が入力された原文書
データからテキストデータを抽出する際、テキストデー
タ判別部はテキストデータであるか非テキストデータで
あるかを判別することができる。
【0014】
【実施例】以下、図面に示す実施例に基づいて本発明を
詳述する。なお、これによって本発明は限定されるもの
でない。本発明は、主として、コンピュータ、DTP
(Desk Top Publishing )などに搭載された機械翻訳装
置に適用されて好適であり、各構成要素は本発明の翻訳
処理機能を達成する以外に、文書データの編集処理機能
を有する。
【0015】図1は本発明の文書処理装置の一実施例を
示すブロック図である。図1において、1は制御部であ
り、判別手段、データ格納手段、データ処理手段として
装置全体の制御を行うCPU(Central Processing Uni
t )2と、このCPU2の動作時のデータを記憶するR
AM(Random Access Memory)からなるメインメモリ3
から構成されてる。また、メインメモリ3はテキストデ
ータ、編集されたテキストデータ及び翻訳されたテキス
トデータを記憶するテキストデータ記憶部、非テキスト
データ及びテキストID番号(テキストデータ識別番
号)等を記憶する非テキストデータ記憶部で構成されて
いる。
【0016】また、4は翻訳手段として機能するCP
U、翻訳プログラムを格納したROM、翻訳バッファ
(RAM)等からなる翻訳モジュールであり、5は翻訳
モジュール4が入力された原文を翻訳する際に使用する
翻訳用の辞書、文法規則等を格納しているROM(Read
Only Memory)からなる辞書メモリでる。また、制御部
1には、翻訳モジュール4、辞書メモリ5が接続されて
いる。
【0017】6はテキストデータ抽出部であり、このテ
キストデータ抽出部6により、外部記憶装置10に記憶
されているテキストデータと非テキストデータとが混在
する原文ファイルからテキストデータを抽出してメイン
メモリ3のテキストデータ記憶部に記憶させると同時に
テキストデータが抽出された場所にはテキストID番号
を生成して非テキストデータとともにメインメモリ3の
非テキストデータ記憶部に記憶させる。7は編集部であ
り、この編集部7により、テキストデータ抽出部6によ
って抽出されたテキストデータを編集する。
【0018】8はテキストデータ置換部であり、このテ
キストデータ置換部8により、テキストデータ抽出部6
によってメインメモリ3の非テキストデータ部に記憶さ
れたテキストIDと、同じくテキストデータ抽出部6に
よって抽出されたテキストデータが翻訳モジュール4に
よる翻訳処理を行った結果得られた第2言語からなるテ
キストデータとを置き換える。9は入力原文の文字入
力、文書編集、翻訳に対する指示等の入力のためのキー
ボード、OCR等で構成される入力装置である。10は
入力装置9から入力された原文のファイル(原文ファイ
ル)や翻訳文のファイルを格納するためのFD(フロピ
ィーディスク)装置、HD(ハードディスク)装置で構
成される外部記憶装置である。11はCRT(Cathode
Ray Tube)、LCD(Liquid Crystal Disply )等の表
示装置である。
【0019】上記翻訳モジュール4は、翻訳される原文
に使用されている第1言語であるソース言語が入力され
ると、それを翻訳して翻訳文に使用されている第2言語
であるターゲット言語を出力するものである。すなわ
ち、CPU2の制御により、外部記憶装置10に格納さ
れた複数の原文ファイルのうち、あらかじめ指定された
1つの原文ファイルが外部記憶装置10からメインメモ
リ3に転送され、その原文ファイルの中の1文のソース
言語が翻訳モジュール4に送られる。翻訳モジュール4
は、辞書メモリ5に記憶されている辞書、文法規則を用
いて、入力されたソース言語をターゲット言語に翻訳す
る。翻訳された文は、メインメモリ3に一旦記憶される
と共に、表示装置11の画面に表示されるようになって
いる。
【0020】図2は本発明を機械翻訳装置1に適用した
機能構成を示すブロック図である。図2において、20
1はキーボード、OCRからなる入力手段(入力装置)
であり、入力原文の文字入力、文書編集、翻訳に対する
指示等の入力をする。202はテキストデータ記憶部、
非テキストデータ記憶部からなる記憶手段(メインメモ
リ)であり、テキストデータ記憶部には、テキストデー
タ、編集されたテキストデータ及び翻訳されたテキスト
データが記憶され、非テキストデータ部には、非テキス
トデータ及びテキストID番号が記憶される。
【0021】203はテキストデータ判別部、テキスト
データ抽出部、テキストID生成部、データ格納部から
なるテキストデータ抽出手段(テキストデータ抽出部)
であり、第1言語からなるテキストデータと非テキスト
データとが混在する文書からテキストデータか非テキス
トデータかを判別し、テキストデータを抽出する。テキ
ストデータ抽出後の対応箇所にテキストID番号を付加
し元の文書レイアウトに対応して非テキストデータを非
テキストデータ記憶部に記憶させるとともに抽出したテ
キストデータをテキストID番号と対応させてテキスト
データ記憶部に記憶させる。
【0022】204は削除処理部、連結処理部、分割処
理部、挿入処理部からなる編集手段(編集部)であり、
抽出されたテキストに対して前記の各処理部で削除、連
結、分割、挿入等の編集処理を実行する。205は一文
切り出し部、翻訳実行部からなる翻訳手段(翻訳部)で
あり、編集されたテキストに対して翻訳処理を実行す
る。206はテキストデータ判別部、テキストデータ検
索部、データ格納部からなるテキストデータ置換手段
(テキストデータ置換部)であり、非テキストデータ記
憶部に記憶されたテキストID番号による文書レイアウ
トに基づいて第1言語からなるテキストデータを翻訳処
理の結果得られた第2言語からなるテキストデータに置
き換える。207は表示装置、あるいはプリンタからな
る出力手段であり、テキストデータ、非テキストデータ
等を表示出力あるいはプリント出力する。
【0023】図3は本発明の機械翻訳装置1におけるデ
ータ処理の概略を示すフローチャートである。次に、図
3を参照して、テキストデータと非テキストデータとが
混在する文書を翻訳するための処理手順を説明する。 ステップ301:まず、翻訳対象となる、テキストデー
タと非テキストデータとが混在している原文書を読み込
み、メインメモリ3に格納する。 ステップ302:入力された原文書からテキストデータ
を抽出する処理が行われる。この結果、翻訳処理の対象
となるテキストデータ308と非テキストデータ307
が得られる。
【0024】このとき、テキストデータ抽出後の対応箇
所にテキストID番号を付加し元の文書レイアウトに対
応して非テキストデータを非テキストデータ記憶部に記
憶させるとともに抽出したテキストデータをテキストI
D番号と対応させてテキストデータ記憶部に記憶させ
る。 ステップ303:必要に応じて、ステップ302で抽出
されたテキストデータに対して編集部7により編集処理
が行われる。 ステップ304:編集が行われたテキストデータ309
を受け取り、翻訳モジュール4(図1、参照)によって
翻訳処理が行われる。翻訳処理の結果、翻訳文すなわち
第2言語のテキストデータ310が得られる。
【0025】ステップ305:ステップ302で得られ
た非テキストデータ307とともにテキストID番号を
記憶していた箇所に、ステップ304で得られた第2言
語のテキストデータ310を置換する処理が行われる。 ステップ306:以上のようにして得られた、原文書の
第1言語からなるテキストデータを第2言語からなるテ
キストデータに置き換えた結果文書を出力する処理が行
われる。
【0026】図4は図3のステップ302に対応するテ
キストデータ抽出処理の詳細を示すフローチャートであ
る。また、図5は本発明の機械翻訳装置1で翻訳される
入力文書の1ページのレイアウトを示す説明図である。
図5に示すように、この文書のレイアウトでは、例え
ば、ブロック1〜2とブロック4〜5にはテキストデー
タである文書データから構成され、ブロック3には非テ
キストデータである図形データが存在している。また、
図6は図5の入力文書を文書データとして記憶する場合
の記憶例を示す説明図である。表示装置11には図5に
示すような文書が表示されるが、メインメモリ3には図
6に示すような形式のデータとして記憶される。また、
図7は図6の文書データに対してテキストデータ抽出処
理を行った後の非テキストデータを示す説明図である。
また、図8は図6の文書データに対してテキストデータ
抽出処理を行った後のテキストデータを示す説明図であ
る。
【0027】ステップ401:まず、翻訳対象となる、
テキストデータと非テキストデータとが混在している原
文書を読み込む。 ステップ402:次に、データポインタを原文書の先頭
にセットする。図6に示す例では、ブロック1を指す。 ステップ403:テキストID番号の初期値を「#1
#」にセットする。ここでは、テキストID番号の値を
示していることを他のデータと区別するため「#」の記
号の間に数字を入れるようにしてある。この数字は連番
でデータ毎にカウントアップしていく。
【0028】ステップ404:CPU2において、デー
タポインタが指しているデータがテキストデータである
か非テキストデータあるかを判別する。図6に示す例で
は、テキスト/非テキストを示すフラグによりテキスト
データか非テキストデータかを判別することができる。
ここで、テキストデータか非テキストデータかの判別は
原文書の形式によって異なる。例えば、TeX文書で
は、「/」で始まるものは非テキストデータであり、R
TF(Rich Text Format:文書データ交換のためのフォ
ーマット)形式の文書も同様である。また、frame
−makerで作成された文書では「<string」で始ま
るものがテキストデータである。
【0029】ステップ405:ステップ404におい
て、テキストデータと判別された場合は、テキストID
番号をテキストデータファイル308に書き込む。 ステップ406:入力文書の「内容」の部分に入ってい
るデータをテキストデータファイル308にコピーす
る。図6の文書の例では、ブロック1のテキストデータ
ファイルは、図8のID「#1#」に示すようになる。
【0030】ステップ407:そして、入力文書のブロ
ックIDとフラグを非テキストデータファイル307に
コピーする。 ステップ408:テキストID番号を非テキストデータ
ファイル307の内容部に書き込む。図6の例では、ブ
ロック1の「内容」の部分がテキストID番号に置き換
えられて、図7のブロック1に示すような非テキストデ
ータファイルになる。
【0031】ステップ409:さらに、テキストID番
号を+1する。 ステップ412:一方、ステップ404において、テキ
ストデータでないと判別された場合、例えば、図6にお
いて、ブロック3のデータの場合、ブロック3のデータ
は非テキストデータであるので、データポインタが指し
ているデータを非テキストデータファイル307に書き
込む。図6の例では、ブロック3のデータが図7のブロ
ック3にそのまま書き込まれる。 ステップ410:以上のようにテキストデータと非テキ
ストデータの各々に応じた処理が行われた後、データポ
インタを+1する。 ステップ411:入力文書データがまだあるかどうか判
断する。データがある場合は、ステップ404に戻る。
【0032】このようにして、テキストデータのブロッ
ク2、ブロック3、…と上記の処理を繰り返し、データ
が無くなれば処理を終了する。これにより、翻訳処理の
対象となるテキストデータ308と非テキストデータ3
07が得られる。このようにして、図6の入力文書デー
タから得られた非テキストデータファイルを図7に、テ
キストデータファイルを図8に示す。
【0033】図9は図8のテキストデータに対して編集
処理を行った後のテキストデータを示す説明図である。
すなわち、ステップ302で抽出されたテキストデータ
をステップ303の編集処理で削除、連結、分割等の編
集作業が行われた後のテキストデータを示している。図
10は図9のテキストデータに対して翻訳処理の中の一
文切り出し処理を行った後のテキストデータを示す説明
図である。すなわち、ステップ304の翻訳処理の中の
一文切り出し処理が終了した時点でのテキストデータを
示している。図11は図10のテキストデータに対して
翻訳処理を行った結果得られた第2言語のテキストデー
タを示す説明図である。すなわち、ステップ304の翻
訳処理によって得られた第2言語のテキストデータを示
している。
【0034】図12は図3のステップ305に対応する
テキストデータ置換処理の詳細を示すフローチャートで
ある。 ステップ1201:まず、ステップ302のテキストデ
ータ抽出処理で得られた非テキストデータファイル30
7を読み込む。 ステップ1202:続いて、ステップ304の翻訳処理
で得られた訳文すなわち第2言語のテキストデータファ
イル310を読み込む。
【0035】ステップ1203:次に、非テキストデー
タポインタを非テキストデータの先頭にセットする。図
6に示す例では、ブロック1を指す。 ステップ1204:そして、非テキストデータポインタ
が指しているデータがテキストデータか非テキストデー
タかを判別する。図7に示す例では、テキスト/非テキ
ストを示すフラグによりテキストデータか非テキストデ
ータかを判別することができる。
【0036】ステップ1205:ステップ1204にお
いて、テキストデータと判別された場合は、非テキスト
データポインタが指すデータのうちブロックIDトフラ
グを非テキストデータファイルから出力ファイルにコピ
ーする。 ステップ1206:次に、非テキストデータポインタが
指すデータの内容部にあるテキストID番号をキーとし
てテキストデータファイル310を検索し、テキストI
D番号が一致するテキストデータを取り出す。図7のブ
ロック1を処理する場合、内容部にあるテキストID番
号は「#1#」なので、図11のテキストデータID番
号が「#1#」であるテキストが取り出される。
【0037】ステップ1207:そして、取り出したテ
キストデータを出力ファイルの内容部に格納する。図7
のブロック1の例では、図13のブロック1のようにな
る。 ステップ1210:一方ステップ1204において、テ
キストデータでないと判別された場合、例えば、図7に
おいてブロック3のデータが処理される場合、ブロック
3のデータは非テキストデータであるので、ブロックI
D/フラグ/内容のデータを非テキストデータファイル
から出力ファイルにコピーする。この結果は、図13の
ブロック3に示すようになる。
【0038】図13は本発明の機械翻訳装置1により得
られた出力文書を示す説明図である。 ステップ1208:次に、非テキストデータポインタを
+1する。 ステップ1209:非テキストデータポインタが指す場
所にデータがあるかどうか判断する。データがある場合
は、ステップ1204に戻る。このようにして、非テキ
ストデータファイルのブロック2、ブロック3、…と上
記の処理を繰り返し、データが無くなれば処理を終了す
る。
【0039】これにより、記憶しておいた非テキストデ
ータファイル307のテキストID番号が翻訳処理ステ
ップ304の結果出力された第2言語からなるテキスト
データ310と置き換えられる。このようにして、図7
の非テキストデータと図11のテキストデータから、図
6に示す文書データの「内容」が第2言語のテキストデ
ータに変換されたものが得られる(図13参照)。
【0040】従って、本発明によれば、原文書データの
テキストデータと翻訳処理されたテキストデータとの置
き換えを、テキストID番号を非テキストデータファイ
ルに記憶しておき、後でテキストID番号を第2言語の
テキストデータに置き換えるという方法で実現する。ま
た、翻訳されたテキストデータが原文書データ内のどこ
にあったかという対応を求めるための特別な手段を用意
する必要がないので、単純な構成で実現できる。また、
対応を求める処理を行う必要がないので翻訳処理時間も
短くなる。さらに、テキストデータとテキストID番号
が1対1に対応しているので対応を間違うことがなく、
原文書データのテキストデータを翻訳処理されたテキス
トデータに正確に置き換えることができる。従って、翻
訳処理における作業の効率を図ることができる。
【0041】次に、本発明の他の実施例について図面を
参照しながら説明する。図14は本発明の文書処理装置
の他の実施例を示すブロック図である。図14に示すよ
うに、1401は制御部であり、判別手段、データ格納
手段、データ処理手段として装置全体の制御を行うCP
U(Central Processing Unit )1402と、このCP
U1402の動作時のデータを記憶するRAM(Random
AccessMemory)からなるメインメモリ1403から構
成されてる。また、メインメモリ1403はテキストデ
ータ、編集されたテキストデータ及び翻訳されたテキス
トデータを記憶するテキストデータ記憶部、テキストデ
ータ対応関係情報等を記憶するテキストデータ対応関係
記憶部で構成されている。
【0042】また、1404は翻訳手段として機能する
CPU、翻訳プログラムを格納したROM、翻訳バッフ
ァ(RAM)等からなる翻訳モジュールであり、140
5は翻訳モジュール1404が入力された原文を翻訳す
る際に使用する翻訳用の辞書、文法規則等を格納してい
るROM(Read Only Memory)からなる辞書メモリで
る。また、制御部1401には、翻訳モジュール140
4、辞書メモリ1405が接続されている。
【0043】1406はテキストデータ抽出部であり、
このテキストデータ抽出部1406により、外部記憶装
置1410に記憶されているテキストデータと非テキス
トデータとが混在する原文ファイルからテキストデータ
を抽出して、一文切り出しを行った後、テキストデータ
をメインメモリ1403のテキストデータ記憶部に記憶
する。1407は編集部であり、この編集部1407に
より、テキストデータ抽出部1410によって抽出され
たテキストデータを編集すると同時に編集後のテキスト
データと原文書のテキストデータの対応関係をメインメ
モリ1403のテキストデータ対応関係記憶部に記憶さ
せる。
【0044】また、1404は翻訳手段として機能する
CPU、翻訳プログラムを格納したROM、翻訳バッフ
ァ(RAM)等からなる翻訳モジュールであり、140
5は翻訳モジュール1404が入力された原文を翻訳す
る際に使用する翻訳用の辞書、文法規則等を格納してい
るROM(Read Only Memory)からなる辞書メモリで
る。また、制御部1401には、翻訳モジュール140
4、辞書メモリ1405が接続されている。
【0045】1408はテキストデータ置換部であり、
このテキストデータ置換部1408により、テキストデ
ータ対応関係記憶部に記憶されたテキストデータ対応関
係を参照して、入力文書のテキストデータを、抽出され
たテキストデータから翻訳モジュール1404による翻
訳処理を行った結果得られた第2言語からなるテキスト
データに置き換える。
【0046】1409は入力原文の文字入力、文書編
集、翻訳に対する指示等の入力のためのキーボード、O
CR等で構成される入力装置である。1410は入力装
置1409から入力された原文のファイル(原文ファイ
ル)や翻訳文のファイルを格納するためのFD(フロピ
ィーディスク)装置、HD(ハードディスク)装置で構
成される外部記憶装置である。1411はCRT(Cath
ode Ray Tube)、LCD(液晶ディスプレイ)等の表示
装置である。
【0047】上記翻訳モジュール1404は、翻訳され
る原文に使用されている第1言語であるソース言語が入
力されると、それを翻訳して翻訳文に使用されている第
2言語であるターゲット言語を出力するものである。す
なわち、CPU1402の制御により、外部記憶装置1
410に格納された複数の原文ファイルのうち、あらか
じめ指定された1つの原文ファイルが外部記憶装置14
10からメインメモリ3に転送され、その原文ファイル
の中の1文のソース言語が翻訳モジュール1404に送
られる。翻訳モジュール1404は、辞書メモリ140
5に記憶されている辞書、文法規則を用いて、入力され
たソース言語をターゲット言語に翻訳する。翻訳された
文は、メインメモリ1403に一旦記憶されると共に、
表示装置1411の画面に表示されるようになってい
る。
【0048】図15は本発明を機械翻訳装置2に適用し
た機能構成を示すブロック図である。図15において、
1501はキーボード、OCRからなる入力手段(入力
装置)であり、入力原文の文字入力、文書編集、翻訳に
対する指示等の入力をする。1502はテキストデータ
記憶部、テキストデータ対応関係記憶部からなる記憶手
段(メインメモリ)であり、テキストデータ記憶部に
は、テキストデータ、編集されたテキストデータ及び翻
訳されたテキストデータが記憶され、テキストデータ対
応関係記憶部には、テキストデータ対応関係情報が記憶
される。
【0049】1503はテキストデータ判別部、テキス
トデータ抽出部、一文切り出し部、データ格納部からな
るテキストデータ抽出手段(テキストデータ抽出部)で
あり、第1言語からなるテキストデータと非テキストデ
ータとが混在する文書からテキストデータか非テキスト
データかを判別し、テキストデータを抽出する。150
4は削除処理部、連結処理部、分割処理部、挿入処理部
からなる編集手段(編集部)であり、抽出されたテキス
トに対して前記の各処理部で削除、連結、分割、挿入等
の編集処理を実行すると同時に編集後のテキストデータ
と原文書のテキストデータの対応関係情報をメインメモ
リ1503のテキストデータ対応関係記憶部に記憶させ
る。
【0050】1505は翻訳実行部からなる翻訳手段
(翻訳部)であり、編集されたテキストに対して翻訳処
理を実行する。1506はテキストデータ判別部、テキ
ストデータ検索部、データ格納部からなるテキストデー
タ置換手段(テキストデータ置換部)であり、テキスト
データ対応関係記憶部に記憶されたテキストデータ対応
関係による文書レイアウトに基づいて第1言語からなる
テキストデータを翻訳処理の結果得られた第2言語から
なるテキストデータに置き換える。1507は表示装
置、あるいはプリンタからなる出力手段であり、テキス
トデータ、非テキストデータ等を表示出力あるいはプリ
ント出力する。
【0051】図16は本発明の機械翻訳装置2における
データ処理の概略を示すフローチャートである。次に、
図16を参照して、テキストデータと非テキストデータ
とが混在する文書を翻訳するための処理手順を説明す
る。 ステップ1601:まず、翻訳対象となる、テキストデ
ータと非テキストデータとが混在している原文書を読み
込み、メインメモリ1403に格納する。 ステップ1602:入力された原文書からテキストデー
タを抽出する処理が行われる。この結果、翻訳処理の対
象となるテキストデータ1608が得られる。
【0052】ステップ1603:必要に応じて、ステッ
プ1602で抽出されたテキストデータに対して編集処
理が行われる。この結果、翻訳処理の対象となるテキス
トデータ1609と、原文書から抽出されたテキストデ
ータ168と編集後のテキストデータ1609との対応
関係を示すテキストデータ対応関係ファイル1607が
得られる。なお、ここでの対応関係は、文単位の関係を
表している。 ステップ1604:編集が行われたテキストデータ16
09を受け取り、翻訳モジュール1404(図14、参
照)によって翻訳する処理が行われる。翻訳処理の結
果、翻訳文すなわち第2言語のテキストデータ1610
が得られる。
【0053】ステップ1605:ステップ1603で得
られたテキストデータ対応関係ファイル1607に記憶
していた情報に基づいて、原文書のテキストを記憶して
いた箇所に、ステップ1604で得られた第2言語のテ
キストデータ1610を置換する処理が行われる。 ステップ1606:以上のようにして得られた、原文書
の第1言語からなるテキストデータを第2言語からなる
テキストデータに置き換えた結果文書を出力する処理が
行われる。
【0054】図17は図16のステップ1602に対応
するテキストデータ抽出処理の詳細を示すフローチャー
トである。また、図18は本発明の機械翻訳装置2で翻
訳される文書の1ページのレイアウトを示す説明図であ
る。図18に示すように、この文書のレイアウトでは、
例えば、ブロック1〜2とブロック4〜5にはテキスト
データである文書データから構成され、ブロック3には
非テキストデータである図形データが存在している。ま
た、図19は図18の入力文書を文書データとして記憶
する場合の記憶例を示す説明図である。表示装置141
1には図18に示すような文書が表示されるが、メイン
メモリ1403には図19に示すような形式のデータと
して記憶される。また、図20は図19の文書データに
対してテキストデータ抽出処理を行った後のテキストデ
ータの説明図である。
【0055】ステップ1701:まず、翻訳対象とな
る、テキストデータと非テキストデータとが混在してい
る原文書を読み込む。 ステップ1702:次に、データポインタを原文書の先
頭にセットする。図19に示す例では、ブロック1を指
す。 ステップ1703:テキストNoを1にセットする。 ステップ1704:CPU1402において、データポ
インタが指しているデータがテキストデータか非テキス
トデータかを判別する。図19に示す例では、テキスト
/非テキストを示すフラグによりテキストデータか非テ
キストデータかを判別することができる。
【0056】ステップ1705:ステップ1704にお
いてテキストデータと判別された場合は、入力文書の
「内容」の部分に入っているデータを取り出す。 ステップ1706:このデータに対して一文切り出しを
行う。一文切り出しでは、連続する文をピリオドやクエ
スチョンマークにより一文ごとに分割する。 ステップ1707:一文切り出しの結果得られた一文ご
とにテキストNoを付加しながらテキストデータファイ
ルに書き込む。一方、ステップ1704において、テキ
ストデータでないと判別された場合、例えば、図19に
示すブロック3のデータが指定された場合、ブロック3
のデータは非テキストデータであるので、何も処理は行
われずステップ1708へと進む。
【0057】ステップ1708:以上のように、テキス
トデータと非テキストデータの各々に応じた処理が行わ
れた後、データポインタを+1する。 ステップ1709:データポインタが指す場所にデータ
があるかどうか判断する。データがある場合は、ステッ
プ1704に戻る。このようにして、文書データのブロ
ック2、ブロック3、…と上記の処理を繰り返し、デー
タが無くなれば処理を終了する。これにより、翻訳処理
の対象となるテキストデータ1608が得られる。この
ようにして図19の文書データから得られたテキストデ
ータファイルが図20に示すものである。
【0058】また、図21は図20のテキストデータに
対して編集処理を行った後のテキストデータを示す説明
図である。すなわち、ステップ1602で抽出されたテ
キストデータに対して、ステップ1603の編集処理で
削除、連結、分割の編集作業が行われた後のテキストデ
ータを示している。図22は図20の原文書テキストと
図21の編集後のテキストとのテキストデータ対応関係
を示す説明図である。これは、ステップ1603の編集
処理の前後のテキストを比較することにより得られる。
【0059】図23は図21のテキストデータに対して
翻訳処理を行った結果得られた第2言語のテキストデー
タを示す説明図である。すなわち、ステップ1604の
翻訳処理によって得られた第2言語のテキストデータを
示している。ここで、翻訳処理は一文単位で行われる。
従って、図23のテキストデータは図21のテキストデ
ータと一対一に対応している。このことは、図22は原
文書テキストと編集後のテキストデータとの対応関係を
示しているが、また同時に、原文書テキストと第2言語
のテキストデータとの対応関係も示していることにな
る。
【0060】図24は図16のステップ1605に対応
するテキストデータ置換処理の詳細を示すフローチャー
トである。 ステップ2401:まず、原文書を読み込む。 ステップ2402:続いて、ステップ1604の翻訳処
理で得られた翻訳文すなわち第2言語のテキストデータ
ファイル1610を読み込む。 ステップ2403:更に、ステップ1603の編集処理
で得られたテキストデータ対応関係ファイル1607を
読み込む。 ステップ2404:次に、原文書データポインタを原文
書の先頭にセットする。図19に示す例では、ブロック
1を指す。原文書データポインタはブロック1、ブロッ
ク2、…と指していく。
【0061】ステップ2405:原文書テキストポイン
タを原文書の先頭の文にセットする。図19の例では、
ブロック1の「内容」部にあるテキストの先頭の文を指
す。原文書テキストポインタは、一文ごとに指してい
く。 ステップ2406:原文書データポインタが指している
データがテキストデータか非テキストデータかを判別す
る。図19に示す例では、テキスト/非テキストを示す
フラグによりテキストデータか非テキストデータかを判
別することができる。 ステップ2407:ステップ2406において、テキス
トデータと判別された場合は、原文書テキストポインタ
が指すブロックIDとフラグのデータを出力ファイルに
コピーする。
【0062】ステップ2408:続いて、原文書テキス
トポインタに対応するテキストデータNoをテキストデ
ータ対応関係ファイルから得る。図22の例では、N
o.1の原文書テキストにはNo.1のテキストが対応
している。つまり、No.1の原文書テキストは図21
と図23に示すテキストデータの両方のNo.1のテキ
ストに対応している。 ステップ2409:テキストデータファイル1610を
検索し、テキストデータNoのテキストを取り出す。図
23の例では、No.1のテキストが取り出される。
【0063】ステップ2410:そして、ステップ24
09で取り出したテキストデータを出力ファイルに書き
込む。図23では、No.1のテキストが出力ファイル
に書き込まれる。つまり、図19のブロック1の「内
容」の部分の1番目の文が図23の1番目のテキストデ
ータに置き換えられて出力ファイルに書き込まれたとい
うことになる。 ステップ2411:原文書テキストポインタを+1す
る。 ステップ2412:原文書テキストポインタが指す場所
にデータがあるかどうか判断する。つまり、現在処理中
のブロック内に文が残っているかどうか判断する。デー
タがある場合は、ステップ2408に戻る。図19のブ
ロック1の例では、2番目の文があるのでステップ24
08に戻り上記の処理を繰り返すことになる。
【0064】図22の例の中からいくつかを説明する
と、No.5の原文書テキストには対応するテキストが
ない。従って、原文書のNo.5のテキスト部分は出力
では空白となる。No.7とNo.8の原文書テキスト
はどちらも同じNo.6のテキストに対応している。従
って、原文書のNo.7とNo.8の2つのテキスト部
分がNo.6のテキストひとつに置き換えられる。N
o.11の原文書テキストはNo.9とNo.10のテ
キストと対応している。従って、原文書のNo.11の
テキスト部分ひとつがNo.9とNo.10の2つのテ
キストに置き換えられる。このようにして、原文書デー
タポインタが指すブロック内でテキストデータがなくな
るまで上記処理を繰り返す。
【0065】ステップ2415:一方、ステップ240
6において、テキストデータでないと判別された場合、
例えば、図19においてブロックのデータが指定された
場合、ブロック3のデータは非テキストデータであるの
で、原文書データポインタが指すブロックID、フラ
グ、内容を出力ファイルにコピーする。 ステップ2413:次に、原文書データポインタを+1
する。 ステップ2414:原文書データポインタが指す場所に
データがあるかどうか判断する。つまり、原文書にブロ
ックが残っているかどうかを判断する。データがある場
合は、ステップ2406に戻る。このようにして、原文
書データファイルのブロック2、ブロック3、…と上記
の処理を繰り返し、データが無くなれば処理を終了す
る。
【0066】これにより、原文書のテキストが翻訳処理
ステップ1604の結果出力された第2言語からなるテ
キストデータ1610と置き換えられる。このようにし
て、図23のテキストデータと図22のテキストデータ
対応関係ファイルから、図19に示す文書データの「内
容」が第2言語のテキストデータに変換されたものが得
られる(図25、参照)。図25は機械翻訳装置2によ
り得られた出力文書を示す説明図である。
【0067】従って、本発明によれば、原文書データの
テキストデータと翻訳処理されたテキストデータとの置
き換えを、テキストデータ対応関係情報をテキストデー
タ対応関係情報記憶部に記憶しておき、後でテキストデ
ータ対応関係情報に基づいて第2言語のテキストデータ
を置き換えるという方法で実現できる。従って、テキス
トデータと非テキストデータが混在する文書データで構
成される文書データのレイアウトからテキストデータの
みを正確に抽出して信頼性の高い翻訳処理をすることが
できる。従って、翻訳処理の効率を大幅に向上すること
ができる。
【0068】
【発明の効果】本発明によれば、テキストデータと非テ
キストデータが混在する文書データで構成される文書デ
ータのレイアウトからテキストデータのみを正確に抽出
して信頼性の高い翻訳処理をすることができる。従っ
て、原文書と同じレイアウトの翻訳文書が得られること
になり、翻訳処理の効率を大幅に向上することができる
ので翻訳利用者の負担も大幅に軽減される。
【図面の簡単な説明】
【図1】本発明の文書処理装置の一実施例を示すブロッ
ク図である。
【図2】本発明を機械翻訳装置1に適用した機能構成を
示すブロック図である。
【図3】本発明の機械翻訳装置1におけるデータ処理の
概略を示すフローチャートである。
【図4】図3のステップ302に対応するテキストデー
タ抽出処理の詳細を示すフローチャートである。
【図5】本発明の機械翻訳装置1で翻訳される入力文書
1頁のレイアウトを示す説明図である。
【図6】図5の入力文書を文書データとして記憶する場
合の記憶例を示す説明図である。
【図7】図6の文書データに対してテキストデータ抽出
処理を行なった後の非テキストデータを示す説明図であ
る。
【図8】図6の文書データに対してテキストデータ抽出
処理を行なった後のテキストデータを示す説明図であ
る。
【図9】図8のテキストデータに対して編集処理を行な
った後のテキストデータを示す説明図である。
【図10】図9のテキストデータに対して翻訳処理の中
の一文切り出し処理を行なった後のテキストデータを示
す説明図である。
【図11】図10のテキストデータに対して翻訳処理を
行なった結果得られた第2言語のテキストデータを示す
説明図である。
【図12】図3のステップ305に対応するテキストデ
ータ置換処理の詳細を示すフローチャートである。
【図13】本発明の機械翻訳装置1により得られた出力
文書を示す説明図である。
【図14】本発明の文書処理装置の他の実施例を示すブ
ロック図である。
【図15】本発明を機械翻訳装置2に適用した機能構成
を示すブロック図である。
【図16】本発明の機械翻訳装置2におけるデータ処理
の概略を示すフローチャートである。
【図17】図16のステップ1602に対応するテキス
トデータ抽出処理の詳細を示すフローチャートである。
【図18】本発明の機械翻訳装置2で翻訳される入力文
書の1頁のレイアウトを示す説明図である。
【図19】図18の入力文書を文書データとして記憶す
る場合の記憶例を示す説明図である。
【図20】図19の文書データに対してテキストデータ
抽出処理を行なった後のテキストデータを示す説明図で
ある。
【図21】図20のテキストデータに対して編集処理を
行なった後のテキストデータを示す説明図である。
【図22】図20の原文書テキストと図21の編集後の
テキストとのテキストデータ対応関係を示す説明図であ
る。
【図23】図21のテキストデータに対して翻訳処理を
行なった結果得られた第2言語のテキストデータであ
る。
【図24】図16のステップ1605に対応するテキス
トデータ置換処理の詳細を示すフローチャートである。
【図25】本発明の機械翻訳装置2により得られた出力
文書を示す説明図である。
【符号の説明】
1、1401 制御部 2、1402 CPU 3、1403 メインメモリ 4、1404 翻訳モジュール(翻訳手段) 5、1405 辞書メモリ 6、1406 テキストデータ抽出部(テキストデータ
抽出手段) 7、1407 編集部(編集手段) 8、1408 テキストデータ置換部(テキストデータ
置換手段) 9、1409 入力装置 10、1410 外部記憶装置 11、1411 表示装置

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 第1言語からなるテキストデータと非テ
    キストデータとが混在する原文書データを入力するとと
    もに編集、レイアウト、翻訳等の処理指示を入力する入
    力手段と、 テキストデータを記憶するテキストデータ記憶部と非テ
    キストデータを記憶する非テキストデータ記憶部を有す
    る記憶手段と、 入力された原文書データからテキストデータを抽出しそ
    の抽出したテキストデータにテキストID番号を対応さ
    せて前記テキストデータ記憶部に記憶させるとともにテ
    キストデータ抽出後の対応箇所に前記テキストID番号
    を付加し非テキストデータを原文書と同一のレイアウト
    で前記非テキストデータ記憶部に記憶させるテキストデ
    ータ抽出手段と、 抽出されたテキストデータに対して編集処理を実行する
    編集手段と、 編集されたテキストデータに対して第1言語から第2言
    語に翻訳処理を実行する翻訳手段と、 非テキストデータ記憶部に記憶されたテキストID番号
    と非テキストデータを読み出しそのテキストID番号を
    翻訳処理の結果得られた第2言語からなるテキストデー
    タに置き換えるテキストデータ置換手段と、 置き換えられた第2言語からなるテキストデータと非テ
    キストデータとが混在する文書データを出力する出力手
    段とをそれぞれ備えたことを特徴とする文書処理装置。
  2. 【請求項2】 第1言語からなるテキストデータと非テ
    キストデータとが混在する原文書データを入力するとと
    もに編集、レイアウト、翻訳等の処理指示を入力する入
    力手段と、 テキストデータを記憶するテキストデータ記憶部とテキ
    ストデータ対応関係情報を記憶するテキストデータ対応
    関係記憶部を有する記憶手段と、 入力された原文書データからテキストデータを抽出する
    とともに抽出したテキストデータを記憶手段のテキスト
    データ記憶部に記憶させるテキストデータ抽出手段と、 抽出されたテキストデータに対して編集処理を実行する
    とともに編集後のテキストデータと原文書データとのテ
    キストデータ対応関係情報を記憶手段のテキストデータ
    対応関係記憶部に記憶させる編集手段と、 編集されたテキストデータに対して翻訳処理を実行する
    翻訳手段と、 テキストデータ対応関係記憶部に記憶されたテキストデ
    ータ対応関係情報に基づき第1言語からなるテキストデ
    ータを翻訳処理の結果得られた第2言語からなるテキス
    トデータに置き換える置換手段と、 置き換えられた第2言語からなるテキストデータと非テ
    キストデータとが混在する文書データを出力する出力手
    段とをそれぞれ備えたことを特徴とする文書処理装置。
  3. 【請求項3】 前記テキストデータ抽出手段はテキスト
    データ抽出部およびテキストデータ判別部を備え、前記
    テキストデータ抽出部が入力された原文書データからテ
    キストデータを抽出する際、テキストデータ判別部はテ
    キストデータであるか非テキストデータであるかを判別
    することを特徴とする請求項1又は2記載の文書処理装
    置。
JP6220007A 1994-09-14 1994-09-14 文書処理装置 Pending JPH0883280A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6220007A JPH0883280A (ja) 1994-09-14 1994-09-14 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6220007A JPH0883280A (ja) 1994-09-14 1994-09-14 文書処理装置

Publications (1)

Publication Number Publication Date
JPH0883280A true JPH0883280A (ja) 1996-03-26

Family

ID=16744476

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6220007A Pending JPH0883280A (ja) 1994-09-14 1994-09-14 文書処理装置

Country Status (1)

Country Link
JP (1) JPH0883280A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002033607A1 (en) * 2000-10-16 2002-04-25 Iis Inc. Method for offering multilingual information translated in many languages through a communication network
JP2009157882A (ja) * 2007-12-28 2009-07-16 Ricoh Co Ltd 翻訳支援システム、翻訳支援方法及びプログラム
JP2011018122A (ja) * 2009-07-07 2011-01-27 Tec Communications:Kk 文書処理装置およびプログラム
KR101059631B1 (ko) * 2008-07-04 2011-08-25 야후! 인크. 자동 입출력 인터페이스를 갖춘 번역기 및 그 인터페이싱방법
KR20120014239A (ko) * 2009-03-18 2012-02-16 구글 인코포레이티드 디스플레이 대체물에 의한 웹 번역
KR101875820B1 (ko) * 2011-11-25 2018-07-06 구글 엘엘씨 어플리케이션 로컬화에 있어서의 번역 지원 제공

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002033607A1 (en) * 2000-10-16 2002-04-25 Iis Inc. Method for offering multilingual information translated in many languages through a communication network
US7130792B2 (en) 2000-10-16 2006-10-31 Iis Inc. Method for offering multilingual information translated in many languages through a communication network
JP2009157882A (ja) * 2007-12-28 2009-07-16 Ricoh Co Ltd 翻訳支援システム、翻訳支援方法及びプログラム
KR101059631B1 (ko) * 2008-07-04 2011-08-25 야후! 인크. 자동 입출력 인터페이스를 갖춘 번역기 및 그 인터페이싱방법
KR20120014239A (ko) * 2009-03-18 2012-02-16 구글 인코포레이티드 디스플레이 대체물에 의한 웹 번역
JP2012521023A (ja) * 2009-03-18 2012-09-10 グーグル・インコーポレーテッド ディスプレイ置換を用いたウェブ翻訳
US8683329B2 (en) 2009-03-18 2014-03-25 Google Inc. Web translation with display replacement
JP2011018122A (ja) * 2009-07-07 2011-01-27 Tec Communications:Kk 文書処理装置およびプログラム
KR101875820B1 (ko) * 2011-11-25 2018-07-06 구글 엘엘씨 어플리케이션 로컬화에 있어서의 번역 지원 제공

Similar Documents

Publication Publication Date Title
EP0370774B1 (en) Machine translation system
JP3220560B2 (ja) 機械翻訳装置
US5748805A (en) Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
JPH05303590A (ja) 自動翻訳装置
JPH077410B2 (ja) 文書レイアウト方法
JPH05158401A (ja) 文書速読支援表示方式並びに文書処理装置及び文書検索装置
JPH0883280A (ja) 文書処理装置
JP2848729B2 (ja) 翻訳方法および翻訳装置
JPH0442704B2 (ja)
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JP2943791B2 (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JPH11272671A (ja) 機械翻訳装置及び機械翻訳方法
JPH0696288A (ja) 文字認識装置及び機械翻訳装置
JP3206600B2 (ja) 文書生成装置
JP3999771B2 (ja) 翻訳支援プログラム、翻訳支援装置、翻訳支援方法
JPH07182344A (ja) 機械翻訳装置
JP3147947B2 (ja) 機械翻訳装置
JPH06290209A (ja) 文切り装置
JP2000029882A (ja) 要約文作成装置
JP2894064B2 (ja) 機械翻訳装置
JP2575947B2 (ja) 文節切出し装置
JPH10293811A (ja) 文書認識装置及び方法並びにプログラム記憶媒体
JPS62143178A (ja) 自然言語翻訳方式
JP3204517B2 (ja) 未知語認定方法
JPH0421169A (ja) 翻訳装置