JPH1063667A - Document processing system - Google Patents

Document processing system

Info

Publication number
JPH1063667A
JPH1063667A JP8225472A JP22547296A JPH1063667A JP H1063667 A JPH1063667 A JP H1063667A JP 8225472 A JP8225472 A JP 8225472A JP 22547296 A JP22547296 A JP 22547296A JP H1063667 A JPH1063667 A JP H1063667A
Authority
JP
Japan
Prior art keywords
special symbol
data
conversion
document
collation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8225472A
Other languages
Japanese (ja)
Inventor
Tadayuki Tsunashima
督之 綱島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8225472A priority Critical patent/JPH1063667A/en
Publication of JPH1063667A publication Critical patent/JPH1063667A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To efficiently convert a special symbol in a source sentence into the other special symbol designated by a user by detecting the part of a processing object concerning the special symbol and executing conversion according to conversion information. SOLUTION: When a special symbol data registration/edition processing mode is selected by a mode discriminating part 101, while referring to a special symbol registration/edition table 112 or a special symbol conversion reference table 113, data are set to a special symbol conversion collation table 114 by starting a special symbol processing control part 108. On the other hand, an input processing part 102 transfers source sentence data to a tag information extracting part 102 and tag information is extracted and separated. Afterwards, the tag information is added and synthesized with translated sentence data by a tag information synthesizing part 105 and at a special symbol conversion discriminating processing part 106, while using the data extracted from the special symbol collation table 114, the special symbol data in the translated sentence data are replaced with special symbols or the like designated by the user. Then, replaced document data are outputted to an output processing part 107.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は文書処理システムに
関し、例えば、タグ記号等を含むハイパーテキスト等の
文書を他の言語の文書に翻訳する機械翻訳システムに適
用し得るものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document processing system, and is applicable to, for example, a machine translation system for translating a document such as a hypertext including a tag symbol into a document in another language.

【0002】[0002]

【従来の技術】文書が表示、印刷出力されたときの形式
(表示、印刷出力されたときに発揮する特殊効果;例え
ば下線付与や、文字強調や、文字部を複数に区分する区
切り罫線付与等)を指定するような文字列(以下、文字
列も適宜文字と呼ぶ)でなるタグ情報を含んだ文書を、
計算機システムを用いて翻訳する方式が既に提案されて
いる(例えば、下記文献参照)。この方式は、タグ部分
を翻訳せずに、タグ部分以外の文章部分を翻訳し、訳文
にもそのタグ情報を残すという方式である。
2. Description of the Related Art A format when a document is displayed and printed out (special effects exerted when the document is displayed and printed out; for example, underlining, character emphasis, and dividing ruled lines for dividing a character portion into a plurality of parts, etc.). ), A document containing tag information consisting of a character string that specifies
A method of translating using a computer system has already been proposed (for example, see the following document). In this method, the text portion other than the tag portion is translated without translating the tag portion, and the tag information is left in the translated text.

【0003】文献『石川直太、檜山正幸共著、「タグ付
き文書の英日機械翻訳支援システム」、CALS Japan '9
4, S2-1』 なお、この明細書においては、タグ情報は、HTML
(Hypertext Markup Language )に準拠して表してい
る。
Literature, Naota Ishikawa and Masayuki Hiyama, "English-Japanese Machine Translation Support System for Tagged Documents", CALS Japan '9
4, S2-1] In this specification, the tag information is HTML
(Hypertext Markup Language).

【0004】ところで、タグ付文書では、例えば、出力
時に「強調文字」で表示又は印刷出力される文字列の開
始位置を規定するタグ情報の文書データ中の表記は「<
EM>」であり、「強調文字」で出力される文字列の終
了位置を規定するタグ情報の文書データ中の表記は「<
/EM>」である。このようなタグ情報の表記に用いら
れる「<」や「>」は、文書データ中において、通常の
括弧情報として用いられることもある。そこで、タグ情
報を規定する文字(記号を含む概念)として用いられて
いるか、括弧情報としてこの文字が用いられているかを
出力処理部等が容易に弁別できるように、表示、印刷出
力時に括弧情報「<」、「>」で表示されるものに対し
て、文書データ中は「<」、「>」以外の所定の文字列
で記述している。このような文書データ中で表記(記
述)が出力時と異なるものを特殊記号と呼んでいる。
By the way, in a document with tags, for example, the notation in the document data of the tag information that defines the start position of a character string displayed or printed out in "highlighted characters" at the time of output is "<
EM>", and the notation in the document data of the tag information that defines the end position of the character string output as" highlighted characters "is"<
/ EM>".“<” And “>” used for notation of such tag information may be used as ordinary parenthesis information in document data. Therefore, the parenthesis information is displayed and printed so that the output processing unit or the like can easily discriminate whether the character is used as a character (concept including a symbol) defining the tag information or whether this character is used as the parenthesis information. In contrast to those indicated by “<” and “>”, the document data is described with a predetermined character string other than “<” and “>”. In this kind of document data, a symbol whose description (description) is different from that at the time of output is called a special symbol.

【0005】例えば、特殊記号「&」は文書データ中で
は「&amp;」で表され、特殊記号「<」は文書デー
タ中では「&lt;」で表され、特殊記号「>」は文書
データ中では「&gt;」で表される。
For example, the special symbol "&" is represented by "&amp;" in the document data, the special symbol "<" is represented by "&lt;" in the document data, and the special symbol ">" is represented in the document data. In this case, “&gt;” is used.

【0006】なお、以下の説明において、特殊記号の
「通常の形態」とは、出力時と同じ表記で文書データに
存在する態様を言い、特殊記号の「特殊な形態」とは、
出力時と異なる表記で文書データに存在する態様を言
う。例えば、特殊記号「<」が文書データ中においても
「<」で記述されている場合は「通常の形態」にあり、
特殊記号「<」が文書データ中において「&lt;」で
記述されている場合は「特殊な形態」にある。従って、
文書データにおいては、基本的には、特殊な形態で特殊
記号が表記されている。
In the following description, the "ordinary form" of a special symbol refers to a mode that exists in the document data in the same notation as when output, and the "special form" of the special symbol is
A mode that exists in the document data in a notation different from that at the time of output. For example, if the special symbol “<” is described as “<” in the document data, it is in “normal form”.
If the special symbol “<” is described as “&lt;” in the document data, it is in a “special form”. Therefore,
In the document data, basically, a special symbol is described in a special form.

【0007】[0007]

【発明が解決しようとする課題】ところで、機械翻訳シ
ステムにおいては、原文中の特定の語句をユーザの望む
訳にして訳出させるためにユーザ辞書が備えられている
のが一般である。そして、特殊記号の訳出においても、
ユーザの望む形態として訳出するニーズが存在する。例
えば、括弧表記として英文中に「<」や「>」がある場
合において、日本語ではこれら括弧表記に馴染みがない
ので、他の括弧表記に置き換えた訳文をユーザが望むこ
とがある。このような要求に対応するため、例えばユー
ザ辞書等に特殊記号を登録したとしても、タグ付文書で
は特殊記号が文書データ中では特殊な形態で表現されて
いるため、ユーザ辞書の見出しがマッチせず、ユーザの
望む訳出結果が得られない。そこで、タグ付文書内での
特殊記号の特殊な形態をそのまま、ユーザ辞書に登録さ
せることも考えられるが、原文の出力表記(表示表記)
とデータ中での表記とが異なるため、ユーザ辞書の登録
作業を困難なものとし、翻訳処理の利用を阻害する恐れ
があると共に、登録動作を混乱させる恐れがある。
In general, a machine translation system is provided with a user dictionary for translating a specific phrase in an original text into a translation desired by the user. And in translating special symbols,
There is a need to translate as a form desired by the user. For example, in a case where “<” or “>” is included in an English sentence as a bracket notation, the user may desire a translated sentence replaced with another bracket notation because the bracket notation is not familiar in Japanese. In order to respond to such a request, even if a special symbol is registered in a user dictionary or the like, for example, in a tagged document, the special symbol is represented in a special form in the document data. Therefore, the translation result desired by the user cannot be obtained. Therefore, it is conceivable to register the special form of the special symbol in the tagged document as it is in the user dictionary.
And the notation in the data are different, making the work of registering the user dictionary difficult, hindering the use of the translation process, and confusing the registration operation.

【0008】なお、原文における特殊記号を他の特殊記
号等に変換する同一言語間での文書変換においても、上
述と同様な課題が生じている。
The same problem as described above occurs in document conversion between the same languages for converting a special symbol in an original text into another special symbol or the like.

【0009】そのため、文書中で出力表記とは異なる特
殊な形態として扱われる特殊記号を、ユーザの特殊記号
登録時には通常の形態で登録でき、文書処理において
は、文書内の特殊な形態のデータとして処理可能とし、
原文内の特殊記号をユーザの指定する他の特殊記号に効
率的に変換できる環境を実現し、文書処理を柔軟に効率
良く行なうことのできる文書処理システムが望まれてい
る。
For this reason, a special symbol which is treated as a special form different from the output notation in a document can be registered in a normal form when the user registers the special symbol, and in the document processing, as a special form of data in the document. Processable,
There is a demand for a document processing system that realizes an environment in which a special symbol in an original text can be efficiently converted to another special symbol specified by a user and that can perform document processing flexibly and efficiently.

【0010】[0010]

【課題を解決するための手段】かかる課題を解決するた
め、本発明においては、表示、印刷出力時の表記とは異
なる特殊な形態で記述されている特殊記号を有する文書
を処理する文書処理システムにおいて、以下の手段を有
することを特徴とする。
According to the present invention, there is provided a document processing system for processing a document having a special symbol which is described in a special form different from the notation at the time of display and printout. Is characterized by having the following means.

【0011】すなわち、(1) 特殊記号の特殊な形態と、
表示、印刷出力時の表記と同じ特殊記号の普通の形態と
の対応関係を記憶している特殊記号記述情報記憶手段
と、(2) 特殊記号を他の特殊記号や文字に変換したり、
及び又は、文字を特殊記号に変換したりするための変換
情報を取込むものであって、その変換情報における変換
元又は変換先の特殊記号を普通の形態で取込み、特殊記
号記述情報記憶手段の記憶内容を参照して特殊な形態に
変換する特殊記号変換情報取込手段と、(3) 特殊記号変
換情報取込手段が取込み、特殊記号については表記形態
が変換されている変換情報の変換元に該当する、処理対
象文書の部分を検出して、変換情報に従った変換を実行
する特殊記号変換実行手段とを有することを特徴とす
る。
That is, (1) the special form of the special symbol;
Special symbol description information storage means that stores the correspondence between the notation at the time of display and printout and the normal form of the same special symbol, and (2) conversion of the special symbol to another special symbol or character,
And / or to take in conversion information for converting a character to a special symbol, take in the conversion source or destination special symbol in the conversion information in a normal form, and store the special symbol description information storage means. Special symbol conversion information importing means for converting into a special form by referring to stored contents, and (3) special symbol conversion information importing means. And a special symbol conversion executing means for detecting a portion of the document to be processed and executing conversion in accordance with the conversion information.

【0012】このような構成により、変換元又は変換先
を特殊記号とする、処理対象文書に対する変換情報をユ
ーザが容易に入力でき、このように入力を容易化させて
も、特殊記号に関連した変換を正しく実行させることが
できる。
With such a configuration, the user can easily input the conversion information for the processing target document in which the conversion source or the conversion destination is a special symbol. The conversion can be performed correctly.

【0013】[0013]

【発明の実施の形態】以下、本発明による文書処理シス
テムを機械翻訳システムに適用した一実施形態を図面を
参照しながら詳述する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment in which a document processing system according to the present invention is applied to a machine translation system will be described below in detail with reference to the drawings.

【0014】この実施形態の機械翻訳システムは、例え
ば、入力装置や処理装置や記憶装置(補助記憶装置を含
む)や出力装置を備えたワークステーション等の情報処
理装置上に構築されるが、機能的には図1のブロック図
に示す構成を有する。
The machine translation system of this embodiment is constructed on an information processing device such as a workstation having an input device, a processing device, a storage device (including an auxiliary storage device), and an output device. Specifically, it has the configuration shown in the block diagram of FIG.

【0015】図1において、この機械翻訳システムは、
機能的には、モード判定部101、入力処理部102、
タグ情報抽出部103、翻訳部104、タグ情報合成部
105、特殊記号変換判定処理部106、出力処理部1
07、特殊記号処理制御部108、入力バッファ10
9、タグ情報保持部110、出力バッファ111、特殊
記号登録・編集テーブル112、特殊記号変換参照テー
ブル113及び特殊記号変換照合テーブル114から構
成されている。
Referring to FIG. 1, the machine translation system includes:
Functionally, the mode determination unit 101, the input processing unit 102,
Tag information extraction unit 103, translation unit 104, tag information synthesis unit 105, special symbol conversion determination processing unit 106, output processing unit 1
07, special symbol processing control unit 108, input buffer 10
9, a tag information holding unit 110, an output buffer 111, a special symbol registration / edit table 112, a special symbol conversion reference table 113, and a special symbol conversion collation table 114.

【0016】モード判定部101は、ユーザの指定した
処理モードの判定を行ない、データの処理を制御する部
分である。この実施形態の場合、処理モードには2種類
ある。すなわち、タグ付文書の翻訳処理を実行する翻訳
処理モードと、特殊記号を他の特殊記号あるいは特定文
字に訳出したり、特定文字を特殊記号に訳出したりする
場合に、その原文データ中の見出し形態とその訳文デー
タでの見出し形態をデータとして登録したり又は登録し
ているデータを編集したりする特殊記号データ登録・編
集処理モードである。モード判定部101は、この2種
類の処理モードのいずれであるかを判定する。
The mode determining unit 101 is a part for determining a processing mode designated by a user and controlling data processing. In this embodiment, there are two types of processing modes. That is, the translation processing mode for executing the translation processing of the tagged document, and the translation of the special symbol to another special symbol or a specific character, and the translation of the specific character to the special symbol, the heading in the original data. This is a special symbol data registration / edit processing mode in which the form and the heading form in the translation data are registered as data or the registered data is edited. The mode determination unit 101 determines which of the two types of processing mode is in.

【0017】翻訳処理モードが選択されたときには、入
力処理部102へと制御が移り、特殊記号データ登録・
編集処理モードが選択されたときには、特殊記号処理制
御部108へと制御が移る。
When the translation processing mode is selected, control is transferred to the input processing unit 102 to register special symbol data.
When the editing processing mode is selected, control is transferred to the special symbol processing control unit 108.

【0018】入力処理部102は、モード判定部101
の判定に基づき起動し、キーボード等の入力装置から入
力される原文データあるいは外部記憶装置内にある原文
データを管理し、処理が実行されると必要な原文データ
を入力バッファ109に格納し、次段のタグ情報抽出部
103に必要な原文データを転送するものである。ま
た、入力処理部102は、出力処理部107からの信号
により、次の原文データをタグ情報抽出部103に転送
したり、あるいは処理すべき原文データが存在しないと
きには、モード判定部101に制御を移したりするもの
である。
The input processing unit 102 includes a mode determination unit 101
, And manages original text data input from an input device such as a keyboard or original data in an external storage device, and stores necessary original text data in the input buffer 109 when the processing is executed. The necessary original text data is transferred to the tag information extraction unit 103 of the row. Also, the input processing unit 102 transfers the next original data to the tag information extracting unit 103 according to a signal from the output processing unit 107, or when there is no original data to be processed, controls the mode determining unit 101. Or move it.

【0019】タグ情報抽出部103は、入力処理部10
2から出力された原文データを入力し、タグ情報を抽出
分離し、その位置情報と共にタグ情報をタグ情報保持部
110に出力して格納させ、また、タグ情報が分離され
た原文データを翻訳部104へ出力するものである。
The tag information extraction unit 103 includes the input processing unit 10
2, the tag information is extracted and separated, and the tag information together with the position information is output to the tag information holding unit 110 for storage, and the original data from which the tag information is separated is translated. The data is output to 104.

【0020】翻訳部104は、タグ情報抽出部103か
ら出力されたタグ情報が存在しない原文データを入力
し、利用者の指定した目的言語へと翻訳し(例えば、英
語から日本語あるいは日本語から英語)、訳文データ
(翻訳結果)をタグ情報合成部105に出力するもので
ある。
The translation unit 104 inputs the original text data having no tag information output from the tag information extraction unit 103, and translates it into a target language specified by the user (for example, from English to Japanese or from Japanese to Japanese). English) and translated data (translation result) are output to the tag information synthesizing unit 105.

【0021】タグ情報合成部105は、翻訳部104か
ら出力された訳文データを入力し、タグ情報保持部11
0から抽出した原文データに付与されていたタグ情報を
もとに、訳文データにタグ情報を付与合成して、そのタ
グ付の目的言語文書データを特殊記号変換判定処理部1
06に出力するものである。
The tag information synthesizing unit 105 receives the translated sentence data output from the translating unit 104 and
0 based on the tag information added to the original sentence data extracted from the original sentence data, the target sentence document data with the tag is added to the target sentence data and converted into the special symbol conversion determination processing unit 1.
06.

【0022】特殊記号変換判定処理部106は、後述す
るようにタグ情報合成部105から出力されたタグ付の
文書データ(訳文データ)を入力し、後述する特殊記号
変換照合テーブル114から抽出したデータを用いて、
訳文データ中における、ユーザが登録した特殊記号デー
タの存在を判定し、存在している場合には、ユーザの指
定する特殊記号等に置換して、置換後の文書データを出
力処理部107に出力するものである。
The special symbol conversion determination processing unit 106 receives the tagged document data (translation data) output from the tag information synthesizing unit 105 as described later, and extracts the data extracted from the special symbol conversion collation table 114 described later. Using,
The presence of the special symbol data registered by the user in the translated data is determined, and if it exists, it is replaced with a special symbol specified by the user, and the replaced document data is output to the output processing unit 107. Is what you do.

【0023】出力処理部107は、特殊記号変換判定処
理部106から出力された訳文データを入力し、出力バ
ッファ111に格納し、ユーザの指示操作によりディス
プレイ装置にデータを表示させたり、あるいは外部記憶
装置にデータを転送して訳文を保存させたりするもので
ある。また、出力処理部107は、訳文データの格納が
完了したときなどに、入力処理部102に次の原文デー
タの入力を起動したりするものである。
The output processing unit 107 receives the translation data output from the special symbol conversion determination processing unit 106, stores the translated data in the output buffer 111, displays the data on a display device in accordance with a user's instruction operation, or stores the data in an external storage. For example, data is transferred to a device to store a translation. The output processing unit 107 activates input of the next original text data to the input processing unit 102 when the storage of the translation data is completed.

【0024】特殊記号処理制御部108は、モード判定
部101の判定に基づき起動され、ユーザが特殊記号登
録・編集テーブル112を用いて特殊記号関連の訳出に
関するデータを登録したり編集するための処理や、作成
されたデータを用いて特殊記号変換参照テーブル113
を参照し、特殊記号変換照合テーブル114にデータを
セットしたりする処理を制御するものである。
The special symbol processing control unit 108 is activated based on the judgment of the mode judgment unit 101, and is used by the user to register or edit data relating to translation of special symbols using the special symbol registration / edit table 112. Or the special symbol conversion reference table 113 using the created data.
, And controls processing for setting data in the special symbol conversion / collation table 114.

【0025】特殊記号登録・編集テーブル112は、ユ
ーザが特殊記号関連の訳出に関するデータを登録したり
編集するために用いるテーブルである。このテーブルへ
の登録又は編集では、ユーザは特殊記号関連データをタ
グ付文書で扱われる特殊な形態を意識せずに、通常の形
態で作業を行なうことができるようになされている。特
殊記号登録・編集テーブル112の構成は、後述する登
録例を示す図3に示している。
The special symbol registration / edit table 112 is a table used by a user to register and edit data relating to translation of special symbols. In registration or editing in this table, the user can work in a normal form without being aware of a special form in which special symbol-related data is handled in a tagged document. The configuration of the special symbol registration / edit table 112 is shown in FIG. 3 showing a registration example described later.

【0026】特殊記号変換参照テーブル113は、例え
ば後述する図2に示す構成を有し、ユーザが特殊記号登
録・編集テーブル112に登録・編集した通常の形態の
特殊記号関連のデータを、これに対応するタグ付文書で
特殊な形態として扱われる特殊記号関連データに変換す
るためのデータが格納されているものである。すなわ
ち、特殊記号変換参照テーブル113には、特殊記号処
理制御部108が、特殊記号登録・編集テーブル112
に登録されている通常の形態の特殊記号関連のデータ
を、これに対応するタグ付文書で特殊な形態として扱わ
れる特殊記号関連データに変換して特殊記号変換照合テ
ーブル114にセットする際の変換のための参照データ
が格納されている。
The special symbol conversion reference table 113 has, for example, the configuration shown in FIG. 2 described below, and stores special symbol related data in a normal form registered and edited by the user in the special symbol registration / edit table 112. It stores data to be converted into special symbol related data that is treated as a special form in the corresponding tagged document. That is, in the special symbol conversion reference table 113, the special symbol processing control unit 108 stores the special symbol registration / edit table 112
Is converted to special symbol-related data that is handled as a special form in a corresponding tagged document and is set in the special symbol conversion / collation table 114. The reference data for is stored.

【0027】特殊記号変換照合テーブル114は、例え
ば後述する図4に示す構成を有し、ユーザが登録・編集
した通常の形態の特殊記号関連のデータに対応する、タ
グ付文書で特殊な形態として扱われる特殊記号関連デー
タがセットされるものである。特殊記号変換照合テーブ
ル114にセットされたデータは、特殊記号変換判定処
理部106で利用される。
The special symbol conversion / collation table 114 has, for example, a configuration shown in FIG. 4 described later, and is a special form in a tagged document corresponding to the special form-related data registered and edited by the user. The special symbol related data to be handled is set. The data set in the special symbol conversion collation table 114 is used by the special symbol conversion determination processing unit 106.

【0028】図2は、上述した特殊記号変換参照テーブ
ル113の構成例を示す説明図である。
FIG. 2 is an explanatory diagram showing a configuration example of the special symbol conversion lookup table 113 described above.

【0029】特殊記号変換参照テーブル113は、特殊
記号参照見出し項目113Aと、特殊記号変換参照見出
し項目113Bとから構成されている。特殊記号参照見
出し項目113Aには、ユーザが登録する通常の形態の
特殊記号の見出しが格納されている。すなわち、表示、
印刷出力時の表記でのキャラクタコードが格納されてい
る。これに対して、特殊記号変換参照見出し項目113
Bには、特殊記号参照見出し項目113Aのデータに対
応する、タグ付文書の中で特殊な形態で用いられる特殊
記号の見出しが格納されている。すなわち、その表示、
印刷出力時に特殊記号参照見出し項目113Aのキャラ
クタを出力させるために、文書データ中に記述されてい
るキャラクタが格納されている。
The special symbol conversion reference table 113 includes a special symbol reference heading item 113A and a special symbol conversion reference heading item 113B. The special symbol reference heading item 113A stores a heading of a special symbol in a normal form registered by the user. That is, display,
The character code in the notation at the time of print output is stored. In contrast, special symbol conversion reference heading item 113
B stores the heading of the special symbol used in a special form in the tagged document corresponding to the data of the special symbol reference heading item 113A. That is, its display,
Characters described in the document data are stored in order to output the character of the special symbol reference heading item 113A at the time of printout.

【0030】この図2では、特殊記号参照見出し項目1
13Aのデータとして、「<」、「>」が格納され、こ
れにそれぞれ対応する特殊記号変換参照見出し項目11
3Bのデータとして「&lt;」、「&gt;」が格納
されている。
In FIG. 2, special symbol reference heading item 1
“<” And “>” are stored as the data of 13A, and the corresponding special symbol conversion reference heading item 11 is stored.
“&Lt;” and “&gt;” are stored as 3B data.

【0031】図3は、ユーザが特殊記号関連の訳出に関
するデータの登録・編集作業に用いる上述した特殊記号
登録・編集テーブル112の構成及びその登録例を示す
図である。
FIG. 3 is a diagram showing the configuration of the above-mentioned special symbol registration / edit table 112 used by a user for registering / editing data relating to translation of special symbols and an example of registration thereof.

【0032】特殊記号登録・編集テーブル112は、特
殊記号見出し項目112Aと特殊記号変換見出し項目1
12Bとから構成されている。特殊記号見出し項目11
2Aには、ユーザが入力した原文中の登録したい語句の
見出し(出力時の形態での見出し)が格納され、特殊記
号変換見出し項目112Bには、ユーザが入力した特殊
記号見出し項目112Aに登録した見出しに対応する、
訳出させたい語句の見出し(出力時の形態での見出し)
を格納している。
The special symbol registration / edit table 112 includes a special symbol heading item 112A and a special symbol conversion heading item 1
12B. Special symbol heading item 11
2A stores the headline of the word to be registered in the original sentence (the heading in the form at the time of output) input by the user, and the special symbol conversion heading item 112B stores the special symbol heading item 112A input by the user. Corresponding to the headline,
The heading of the phrase to be translated (heading in the format at the time of output)
Is stored.

【0033】図3では、特殊記号見出しデータとして、
「<」、「>」、「{」、「}」が登録され、これにそ
れぞれ対応する特殊記号変換見出しデータとし
て、「『」、「』」、「<」、「>」が登録されてい
る。
In FIG. 3, as special symbol heading data,
“<”, “>”, “{”, And “}” are registered, and “”, “”, “<”, and “>” are registered as the corresponding special symbol conversion heading data. I have.

【0034】図4は、特殊記号変換照合テーブル114
の構成例及び格納内容例を示す説明図である。なお、図
4は、特殊記号変換参照テーブル113の格納内容が図
2に示す内容であり、特殊記号登録・編集テーブル11
2の格納内容が図3に示す内容である場合の特殊記号変
換照合テーブル114の格納内容を示している。
FIG. 4 shows a special symbol conversion / collation table 114.
FIG. 3 is an explanatory diagram showing an example of the configuration and an example of stored contents. FIG. 4 shows the contents stored in the special symbol conversion reference table 113 shown in FIG.
3 shows the contents stored in the special symbol conversion / collation table 114 when the contents stored in No. 2 are the contents shown in FIG.

【0035】特殊記号変換照合テーブル114には、特
殊記号登録・編集テーブル112へのユーザの特殊記号
関連データの登録・編集作業が終了すると、特殊記号処
理制御部108が、図2に示した特殊記号変換参照テー
ブル113を参照し、ユーザが登録・編集した通常の形
態(出力時の形態)の特殊記号関連のデータに対応す
る、タグ付文書で特殊な形態として扱われる特殊記号関
連データがセットされる。
When the user registers and edits the special symbol related data in the special symbol registration / edit table 112 in the special symbol conversion / collation table 114, the special symbol processing control unit 108 causes the special symbol processing control unit 108 shown in FIG. By referring to the symbol conversion reference table 113, special symbol related data which is treated as a special form in a tagged document and corresponding to a special form related data in a normal form (form at the time of output) registered and edited by a user is set. Is done.

【0036】特殊記号変換照合テーブル114は、特殊
記号照合見出し項目114A及び特殊記号変換照合見出
し項目114Bから構成されている。
The special symbol conversion collation table 114 includes a special symbol collation heading item 114A and a special symbol conversion collation heading item 114B.

【0037】特殊記号照合見出し項目114Aには、特
殊記号登録・編集テーブル112の特殊記号見出し項目
112Aのデータを、特殊記号変換参照テーブル113
を参照し、タグ付文書の中で特殊な形態で用いられる特
殊記号の見出しに変換したデータがセットされる。この
変換時において、対象となった特殊記号登録・編集テー
ブル112の特殊記号見出し項目112A中のデータが
タグ付文書の中で特殊な形態で用いられる特殊記号の見
出しとして存在しない場合には、ユーザが登録した通常
の形態の特殊記号の見出しがそのままの形態として特殊
記号照合見出し項目114Aにセットされる。
In the special symbol collation heading item 114A, the data of the special symbol heading item 112A of the special symbol registration / editing table 112 is stored in the special symbol conversion reference table 113.
, Data converted to a special symbol heading used in a special form in the tagged document is set. At the time of this conversion, if the data in the special symbol heading item 112A of the target special symbol registration / edit table 112 does not exist as a heading of a special symbol used in a special form in the tagged document, the user Is set in the special symbol collation heading item 114A as the normal symbol heading of the special symbol registered in the normal symbol.

【0038】同様に、特殊記号変換照合見出し項目11
4Bにも、特殊記号登録・編集テーブル112の特殊記
号変換見出し項目112Bのデータを、特殊記号変換参
照テーブル113を参照し、タグ付文書の中で特殊な形
態で用いられる特殊記号の見出しに変換したデータがセ
ットされる。この変換時においても、対象となった特殊
記号登録・編集テーブル112の特殊記号変換見出し項
目112B中のデータがタグ付文書の中で特殊な形態で
用いられる特殊記号の見出しとして存在しない場合に
は、ユーザが登録する通常の形態の特殊記号の見出しが
そのままの形態として特殊記号変換照合見出し項目11
4Bにセットされる。
Similarly, special symbol conversion collation heading item 11
4B, the data of the special symbol conversion heading item 112B of the special symbol registration / edit table 112 is converted into the heading of the special symbol used in a special form in the tagged document by referring to the special symbol conversion reference table 113. The set data is set. Even at the time of this conversion, if the data in the special symbol conversion heading item 112B of the target special symbol registration / editing table 112 does not exist as a heading of a special symbol used in a special form in the tagged document. The special symbol conversion collation heading item 11 is a form in which the heading of the special symbol of the normal form registered by the user is unchanged.
Set to 4B.

【0039】図4の例では、特殊記号照合見出し項目1
14Aのデータは、図3の特殊記号登録・編集テーブル
112の特殊記号見出し項目112Aのデータである特
殊記号「<」、「>」に対してはそれぞれ、図2の特殊
記号変換参照テーブル113を参照し、「&lt;」、
「&gt;」がセットされ、特殊記号以外
の「{」、「}」に対しては、図2の特殊記号変換参照
テーブル113を参照し、対応する特殊記号参照見出し
項目113Aのデータが存在しないので、そのままの見
出しである「{」、「}」がセットされている。
In the example of FIG. 4, the special symbol collation heading item 1
The data of the special symbol conversion reference table 113 of FIG. 2 is used for the special symbols “<” and “>”, which are the data of the special symbol heading item 112A of the special symbol registration / edit table 112 of FIG. "&Lt;",
"&Gt;" is set, and for "@" and "@" other than special symbols, reference is made to the special symbol conversion reference table 113 of FIG. 2, and there is no corresponding special symbol reference heading item 113A. Therefore, "@" and "@" which are the headings as they are are set.

【0040】また、特殊記号変換照合見出し項目114
Bのデータは、図3の特殊記号登録・編集テーブル11
2の特殊記号変換見出し項目112Bのデータである特
殊記号以外の「『」、「』」に対しては、図2の特殊記
号変換参照テーブル113を参照し、対応する特殊記号
参照見出し項目113Aのデータが存在しないので、そ
のままの見出しである「『」、「』」がセットされ、特
殊記号「<」、「>」に対しては、図2の特殊記号変換
参照テーブル113を参照し、「&lt;」、「&g
t;」がセットされる。
Also, special symbol conversion collation heading item 114
The data of B is stored in the special symbol registration / edit table 11 of FIG.
2 for the special symbol conversion heading item 112B other than the special symbol "", "", refer to the special symbol conversion reference table 113 in FIG. Since there is no data, the headings "" and "" are set as they are, and the special symbols "<" and ">" are referred to the special symbol conversion reference table 113 in FIG. &Lt;","& g
t; "is set.

【0041】以下、この実施形態の特徴的な処理を実行
する特殊記号処理制御部108及び特殊記号変換判定処
理部106の動作を順に説明する。
Hereinafter, the operations of the special symbol processing control unit 108 and the special symbol conversion determination processing unit 106 for executing the characteristic processing of this embodiment will be described in order.

【0042】ここで、図5及び図6は、特殊記号処理制
御部108の処理フローチャートである。
FIGS. 5 and 6 are processing flowcharts of the special symbol processing control unit 108.

【0043】上述したように、特殊記号処理制御部10
8は、大きく言えば、モード判定部101の判定に基づ
き起動し、ユーザが特殊記号登録・編集テーブル112
を用いて特殊記号関連の訳出に関するデータを登録した
り編集したりするための処理や、作成されたデータを用
いて特殊記号変換参照テーブル113を参照し、特殊記
号変換照合テーブル114にデータをセットする処理を
制御し、起動された一連の処理が終了すると、モード判
定部101に制御を戻す。
As described above, the special symbol processing control unit 10
8 is activated based on the determination of the mode determination unit 101, and the user operates the special symbol registration / edit table 112
Processing for registering and editing data relating to translation of special symbols using data, and referring to the special symbol conversion reference table 113 using the created data, and setting data in the special symbol conversion collation table 114. When the series of activated processes is completed, the process returns to the mode determination unit 101.

【0044】ユーザにより特殊記号データ登録・編集処
理モードが指定されると、モード判定部101がこのモ
ードを判定し、特殊記号処理制御部108による制御を
起動し、このとき、特殊記号処理制御部108は図5及
び図6に示す一連の処理を開始する。
When the special symbol data registration / edit processing mode is designated by the user, the mode determination section 101 determines this mode and activates the control by the special symbol processing control section 108. At this time, the special symbol processing control section 108 starts a series of processes shown in FIGS.

【0045】特殊記号登録・編集テーブル112から、
存在する特殊記号登録・編集テーブルデータを抽出し、
ユーザが特殊記号関連データを登録又は編集できるよう
に表示する(ステップ1001)。
From the special symbol registration / edit table 112,
Extract existing special symbol registration / edit table data,
A display is made so that the user can register or edit the special symbol related data (step 1001).

【0046】その後、ユーザとのインタラクチィブなデ
ータ授受を通じて、表示された特殊記号登録・編集テー
ブルに対し、ユーザに特殊記号関連データの登録・編集
作業が実行させ、その登録・編集作業を完了まで導き、
ユーザからの完了命令を受信すると、次のステップ10
04へと制御を移す(ステップ1002、1003)。
なお、この登録及び編集作業において、ユーザは特殊記
号関連データを、タグ付文書で扱われる特殊な形態を意
識せずに、通常の形態のデータとして作業を行なうこと
ができるようになされている。
Thereafter, through interactive data exchange with the user, the user registers and edits the special symbol related data in the displayed special symbol registration / edit table, and completes the registration / edit operation. Guide to
When a completion command is received from the user, the next step 10
The control is shifted to 04 (steps 1002 and 1003).
In this registration and editing work, the user can work on the special symbol-related data as normal form data without being conscious of the special form handled in the tagged document.

【0047】次のステップ1004では、登録・編集作
業を終了した特殊記号登録・編集テーブルに格納すべき
データを特殊記号登録・編集テーブル112に保存す
る。
In the next step 1004, the data to be stored in the special symbol registration / edit table for which the registration / edit work has been completed is stored in the special symbol registration / edit table 112.

【0048】その後、特殊記号登録・編集テーブル11
2に保存した特殊記号登録・編集テーブル112の1個
のデータを抽出する(ステップ1005)。なお、この
1データの抽出処理は、ステップ1005〜1010の
処理ループが繰り返される毎に実行されるが、その抽出
順番は、例えば以下の通りである。特殊記号登録・編集
テーブル112の特殊記号見出し項目112Aのデータ
から先に抽出し、次にこのステップ1005に制御が移
った時には抽出した特殊記号見出し項目112Aのデー
タに対応する特殊記号変換見出し項目112Bのデータ
を抽出し、その次は特殊記号見出し項目112Aの次の
データというような順番で抽出が実行される。
Thereafter, the special symbol registration / editing table 11
Then, one piece of data of the special symbol registration / edit table 112 stored in 2 is extracted (step 1005). Note that this one data extraction process is executed each time the processing loop of steps 1005 to 1010 is repeated, and the extraction order is, for example, as follows. The special symbol conversion heading item 112B corresponding to the extracted data of the special symbol heading item 112A is extracted first from the data of the special symbol heading item 112A of the special symbol registration / editing table 112, and then when the control is shifted to step 1005. Is extracted, and extraction is performed in the order of the next data of the special symbol heading item 112A.

【0049】このような1データの抽出動作を実行する
と、この抽出動作によってデータが抽出できなかったか
否かを判定する(ステップ1006)。ここで、肯定結
果を得た場合には、特殊記号登録・編集テーブル112
に格納されている全てのデータに対して、後述するステ
ップ1008〜1010を実行したことを意味するの
で、一連の処理を終了し、制御をモード判定部101に
戻す。
When such one data extraction operation is performed, it is determined whether or not data could not be extracted by this extraction operation (step 1006). Here, if a positive result is obtained, the special symbol registration / edit table 112
Means that steps 1008 to 1010, which will be described later, have been executed for all the data stored in the mode.

【0050】特殊記号登録・編集テーブル112から抽
出したデータが存在する場合には、その抽出したデータ
を、特殊記号変換参照テーブル113の特殊記号参照見
出し項目113Aのデータと照合し、その照合結果を確
認して、対象とするデータにマッチする特殊記号参照見
出し項目113Aのデータが存在するか否かを判定する
(ステップ1007、1008)。
If there is data extracted from the special symbol registration / edit table 112, the extracted data is collated with the data of the special symbol reference heading item 113A of the special symbol conversion reference table 113, and the collation result is obtained. It is determined whether or not there is data of the special symbol reference heading item 113A that matches the target data (steps 1007 and 1008).

【0051】この判定の結果、マッチするデータが存在
すれば、マッチした特殊記号参照見出し項目113Aの
データに対応する特殊記号変換参照見出し項目113B
のデータを抽出し、対象としているステップ1005で
抽出したデータと置換する(ステップ1009)。そし
て、特殊記号変換照合テーブル114中の特殊記号照合
見出し項目114A又は特殊記号変換照合見出し項目1
14Bに、その対象とするデータを置換したデータをセ
ットする(ステップ1010)。
As a result of this determination, if there is matching data, the special symbol conversion reference heading item 113B corresponding to the matched special symbol reference heading item 113A
Is extracted and replaced with the data extracted in the target step 1005 (step 1009). Then, the special symbol collation heading item 114A or the special symbol conversion collation heading item 1 in the special symbol conversion collation table 114
14B is set with data obtained by replacing the target data (step 1010).

【0052】これに対して、ステップ1008の判定の
結果、マッチするデータが存在しなければ、特殊記号登
録・編集テーブル112から抽出したデータをそのま
ま、特殊記号変換照合テーブル114中の特殊記号照合
見出し項目114A又は特殊記号変換照合見出し項目1
14Bにセットする(ステップ1010)。
On the other hand, if the result of determination in step 1008 is that there is no matching data, the data extracted from the special symbol registration / editing table 112 is used as is in the special symbol collation header Item 114A or special symbol conversion collation heading item 1
14B (step 1010).

【0053】ここで、特殊記号変換照合テーブル114
中の特殊記号照合見出し項目114A又は特殊記号変換
照合見出し項目114Bにデータをセットしていく順番
は、最初は特殊記号照合見出し項目114Aであり、次
のステップ1010でのデータは特殊記号変換照合見出
し項目114Bであり、その次のステップ1010での
データは特殊記号照合見出し項目114Aにセットされ
るというような順番であり、特殊起動登録・編集テーブ
ル112から1データを抽出する順番と同様である。
Here, the special symbol conversion collation table 114
The order in which data is set in the special symbol collation heading item 114A or the special symbol conversion collation heading item 114B is the special symbol collation header item 114A at first, and the data in the next step 1010 is the special symbol conversion collation heading. The item 114B is the order in which the data in the next step 1010 is set in the special symbol collation heading item 114A, and is the same as the order in which one data is extracted from the special activation registration / edit table 112.

【0054】これにより、特殊記号登録・編集テーブル
112の特殊記号見出し項目112Aから抽出したデー
タ又はそれを置換したデータは、特殊記号変換照合テー
ブル114の特殊記号照合見出し項目114Aにセット
され、特殊記号登録・編集テーブル112の特殊記号変
換見出し項目112Bから抽出したデータ又はそれを置
換したデータは、特殊記号変換照合テーブル114の特
殊記号照合見出し項目114Aに対応して特殊記号変換
照合見出し項目114Bにセットされることになる。
As a result, the data extracted from the special symbol heading item 112A of the special symbol registration / editing table 112 or the data obtained by replacing the data is set in the special symbol collating heading item 114A of the special symbol conversion / collation table 114, and the special symbol Data extracted from the special symbol conversion heading item 112B of the registration / editing table 112 or data obtained by replacing the data is set in the special symbol conversion collation heading item 114B corresponding to the special symbol collation heading item 114A of the special symbol conversion collation table 114. Will be done.

【0055】このようにして特殊記号登録・編集テーブ
ル112から抽出した1データに対する処理が終了すれ
ば、上述したステップ1005に戻り、特殊記号登録・
編集テーブル112の次のデータを抽出し、同様な処理
を行なう。従って、特殊記号登録・編集テーブル112
に存在するデータ数だけ、ステップ1005〜ステップ
1010でなる処理ループが繰り返される。この処理ル
ープの繰り返しによって、特殊記号登録・編集テーブル
112から未抽出データが存在しなくなれば、ステップ
1006でデータ不存在と判定され、特殊記号処理制御
部108の処理を終了する。
When the processing for one data extracted from the special symbol registration / editing table 112 is completed in this way, the process returns to the above-described step 1005, where the special symbol registration / editing is performed.
The next data in the editing table 112 is extracted and the same processing is performed. Therefore, the special symbol registration / edit table 112
The processing loop consisting of steps 1005 to 1010 is repeated for the number of data existing in. If the unextracted data does not exist from the special symbol registration / edit table 112 by repeating this processing loop, it is determined that there is no data in step 1006, and the processing of the special symbol processing control unit 108 ends.

【0056】次に、特殊記号変換照合テーブル114の
格納内容を適宜利用する特殊記号変換判定処理部106
の動作を、図面を参照しながら説明する。
Next, the special symbol conversion determination processing unit 106 that appropriately uses the contents stored in the special symbol conversion collation table 114
Will be described with reference to the drawings.

【0057】ここで、図7及び図8が、特殊記号変換判
定処理部106の処理フローチャートである。
FIGS. 7 and 8 are processing flowcharts of the special symbol conversion determination processing unit 106.

【0058】特殊記号変換判定処理部106は、上述し
たように、タグ情報合成部105から出力された訳文デ
ータを入力し、特殊記号変換照合テーブル114から抽
出したデータを用いて、訳文データ中におけるユーザが
登録した特殊記号データの存在を判定し、存在している
場合にはユーザの指定する特殊記号等に置換して、訳文
データを出力処理部107へ出力するように処理を行な
う。
As described above, the special symbol conversion determination processing unit 106 receives the translated text data output from the tag information synthesizing unit 105 and uses the data extracted from the special symbol conversion collation table 114 to convert the translated text data in the translated text data. The presence / absence of the special symbol data registered by the user is determined, and if it exists, the process is performed so that the translated data is output to the output processing unit 107 by replacing the special symbol data with the special symbol designated by the user.

【0059】特殊記号変換判定処理部106は、図7及
び図8に示す処理を開始するとまず、タグ情報合成部1
05から出力されたタグ付訳文データを読み込む(ステ
ップ2001)。
When the special symbol conversion determination processing unit 106 starts the processing shown in FIGS.
The tag-added translation data output from step 05 is read (step 2001).

【0060】その後、特殊記号変換照合テーブル114
の特殊記号照合見出し項目114Aから1データの抽出
動作を行ない、抽出できたか否かを判定することによ
り、抽出されていない特殊記号照合見出し項目のデータ
の存在を確認する(ステップ2002、2003)。
After that, the special symbol conversion collation table 114
Then, by performing an operation of extracting one data from the special symbol collation heading item 114A, it is determined whether or not the data has been extracted, thereby confirming the existence of the unextracted data of the special symbol collation heading item (steps 2002 and 2003).

【0061】ここで、抽出動作によっても、未抽出デー
タが取出せなければ、後述するステップ2009に移行
する。これに対して、抽出動作によって未抽出データが
取出せれば、読み込んだ訳文データの先頭側から文字デ
ータを抽出し(ステップ2004)、その文字データの
抽出が文末に達したか否かをさらに判定する(ステップ
2005)。
Here, if unextracted data cannot be taken out by the extraction operation, the flow shifts to step 2009 described later. On the other hand, if unextracted data can be extracted by the extraction operation, character data is extracted from the head of the read translated data (step 2004), and it is further determined whether or not the extraction of the character data has reached the end of the sentence. (Step 2005).

【0062】文字データの抽出が文末に達した場合に
は、上述したステップ2002に戻って、特殊記号変換
照合テーブル114からの次の未抽出データの抽出動作
を実行する。
When the extraction of character data reaches the end of the sentence, the process returns to step 2002 to execute the operation of extracting the next unextracted data from the special symbol conversion / collation table 114.

【0063】一方、読み込んだ訳文データからの抽出が
文末に達していない場合には、ステップ2004で抽出
した文字データ(文字データ列を含む)と、ステップ2
002で抽出した特殊記号変換照合テーブル114の特
殊記号照合見出し項目114Aのデータとを照合し(ス
テップ2006)、その照合結果に基づき、読み込んだ
訳文データ中に、対象とする特殊記号変換照合テーブル
114の特殊記号照合見出し項目114Aのデータにマ
ッチする文字データが存在するか否かを判定する(ステ
ップ2007)。
On the other hand, if the extraction from the translated sentence data does not reach the end of the sentence, the character data (including the character data string) extracted in step 2004
The data is compared with the data of the special symbol collation index item 114A of the special symbol translation collation table 114 extracted in step 002 (step 2006), and based on the collation result, the target special symbol conversion collation table 114 It is determined whether or not there is character data that matches the data of the special symbol collation heading item 114A (step 2007).

【0064】この判定の結果、マッチする文字データが
存在しなければ、上述したステップ2004に戻り、読
み込んだ訳文データより次の(より文末側に近い)文字
データを抽出する。
As a result of this determination, if there is no matching character data, the process returns to the above-described step 2004 to extract the next (closer to the sentence end) character data from the read translated data.

【0065】これに対して、マッチする文字データが存
在すれば、マッチした特殊記号変換照合テーブル114
の特殊記号照合見出し項目114Aのデータに対応する
特殊記号変換照合テーブル114の特殊記号変換照合見
出し項目114Bのデータを抽出し、訳文データ中にお
けるマッチした文字データの部分を、項目114Bから
抽出したデータに置換する(ステップ2008)。そし
て、上述したステップ2004に戻り、読み込んだ訳文
データより次の(より文末側に近い)文字データを抽出
し、文末まで照合処理を繰り返す。
On the other hand, if matching character data exists, the matched special symbol conversion / collation table 114
The data of the special symbol conversion collation heading item 114B of the special symbol conversion collation table 114 corresponding to the data of the special symbol collation heading item 114A is extracted, and the part of the matched character data in the translation data is extracted from the item 114B. (Step 2008). Then, the process returns to the above-described step 2004 to extract the next (closer to the end of the sentence) character data from the read translated data and repeat the collation processing until the end of the sentence.

【0066】以上のようなステップ2002〜2008
の処理を繰返し、ステップ2003で特殊記号変換照合
テーブル114の特殊記号照合見出し項目114Aの抽
出されていないデータがなくなれば、入力された訳文デ
ータ(一部置換されていることもあるデータ)を出力処
理部107に出力し、一連の処理を終了する。
Steps 2002 to 2008 as described above
Is repeated, and in step 2003, if there is no more unextracted data in the special symbol collation heading item 114A of the special symbol conversion collation table 114, the input translation data (data that may be partially replaced) is output. The data is output to the processing unit 107, and a series of processing ends.

【0067】以下、実施形態の機械翻訳システムによる
動作を、英文を日本文に翻訳処理する場合として、例文
を用いて具体的に説明する。
Hereinafter, the operation of the machine translation system according to the embodiment will be specifically described using an example sentence as a case of translating an English sentence into a Japanese sentence.

【0068】ここでは、出力(表示出力又は印字出力)
が以下のようになる英文1及び英文2が原文データとし
て入力され、これらの英文1及び英文2を日本語に翻訳
する場合を説明する。また、第1英文中の特殊記号
「<」、「>」をそれぞれ、「『」、「』」として訳出
させ、第2英文中の特殊記号「{」、「}」をそれぞ
れ、「<」、「>」として訳出させるとして説明する。
Here, output (display output or print output)
A case will be described in which English sentences 1 and 2 are input as original sentence data, and these English sentences 1 and 2 are translated into Japanese. The special symbols "<" and ">" in the first English sentence are translated as "" and "", respectively, and the special symbols "記号" and "、" in the second English sentence are respectively "<" , ">".

【0069】 英文1 This is <a pen>. 英文2 That is {a pencil}. 以上のように特殊記号をそのまま訳出させない場合に
は、特殊記号に関するデータである「<」、「>」をそ
れぞれ「『」、「』」として、また、「{」、「}」を
それぞれ「<」、「>」として訳出させるために、特殊
記号関連の訳出に関するデータを予め登録しておくこと
を要する。
English 1 This is <a pen>. English 2 That is {a pencil}. As described above, when a special symbol is not to be translated as it is, "<" and ">" which are data relating to the special symbol are respectively "" and "", and "、" and "}" are respectively " In order to translate as <>, “>”, it is necessary to register data relating to translation related to special symbols in advance.

【0070】このような登録は、この実施形態のシステ
ムを起動し、モード判定部101にて、特殊記号を他の
特殊記号あるいは特定文字に訳出したり、又はその逆を
実行するために、原文中の特殊記号に関する見出し形態
とその訳出形態をデータとして登録したり又は登録して
いるデータを編集するモードである特殊記号データ登録
・編集処理モードを選択することにより行なう。特殊記
号データ登録・編集処理モードが選択されると、特殊記
号処理制御部108に制御が移る。
Such registration is performed by activating the system of this embodiment and causing the mode determining unit 101 to translate the special symbol into another special symbol or specific character, or to execute the reverse of the conversion. This is performed by registering a heading form and a translation form of the special symbol therein as data, or by selecting a special symbol data registration / editing processing mode for editing the registered data. When the special symbol data registration / edit processing mode is selected, control is transferred to the special symbol processing control unit 108.

【0071】特殊記号処理制御部108では、ステップ
1001で特殊記号登録・編集テーブル112から、存
在する特殊記号登録・編集テーブルを抽出し、ユーザが
特殊記号関連データを登録又は編集できるように表示す
る。
The special symbol processing control unit 108 extracts the existing special symbol registration / edit table from the special symbol registration / edit table 112 in step 1001 and displays it so that the user can register or edit the special symbol related data. .

【0072】次に、ステップ1002で、ステップ10
01で表示された特殊記号登録・編集テーブル112に
ユーザが特殊記号関連のデータを登録・編集する作業を
行なう。この例では、登録・編集テーブル112の特殊
記号見出し項目112Aに「<」、
「>」、「{」、「}」というデータを登録し、特殊記
号変換見出し項目112Bに、特殊記号見出し項目11
2Aに登録したデータに対応させて「『」、「』」、
「<」、「>」というデータを登録する。この登録され
た状態は、上述した図3に示すようになる。
Next, in step 1002, step 10
The user performs an operation of registering and editing special symbol-related data in the special symbol registration / edit table 112 indicated by 01. In this example, "<", "<"
The data “>”, “{”, and “}” are registered, and the special symbol conversion heading item 112B is added to the special symbol heading item 11B.
"[", """, Corresponding to the data registered in 2A,
The data “<” and “>” are registered. This registered state is as shown in FIG. 3 described above.

【0073】次に、ステップ1003で、ユーザがステ
ップ1002の登録・編集作業を完了し、完了命令をシ
ステムに指定すると特殊記号処理制御部108が受信
し、次のステップ1004へと制御を移す。ステップ1
004では、登録・編集作業を終了した特殊記号登録・
編集テーブルに格納すべきデータを特殊記号登録・編集
テーブル112に保存する。
Next, in step 1003, when the user completes the registration / editing work in step 1002 and designates a completion command to the system, the special symbol processing control unit 108 receives the command and transfers control to the next step 1004. Step 1
In 004, the special symbol registration /
Data to be stored in the edit table is stored in the special symbol registration / edit table 112.

【0074】次に、ステップ1005で、ステップ10
04で保存した特殊記号登録・編集テーブル112の1
データを抽出する処理を行なう。この例では、特殊記号
登録・編集テーブル112の特殊記号見出し項目112
Aの最初にあるデータである「<」が抽出され、次にこ
のステップ1005に制御が移ったときには特殊記号変
換見出し項目112Bの最初にあるデータ「『」が抽出
され、以下、ステップ1005に制御が移る毎に、
「>」、「』」、「{」、「<」、「}」、「>」が抽
出される。
Next, in step 1005, step 10
Special symbol registration / edit table 112 stored in step 04
Perform data extraction processing. In this example, the special symbol heading item 112 in the special symbol registration / edit table 112 is used.
The data “<” which is the first data of A is extracted, and when the control is shifted to the next step 1005, the data ““ ”which is the first of the special symbol conversion heading item 112B is extracted. Every time
“>”, “”, “{”, “<”, “}”, “>” Are extracted.

【0075】ステップ1006では、特殊記号登録・編
集テーブル112から抽出したデータの存在を判定する
が、最初にこのステップ1006に入ったときには、
「<」というデータが存在するので次のステップ100
7に進む。このステップ1007では、ステップ100
5で抽出したデータと特殊記号変換参照テーブル113
の特殊記号参照見出し項目113Aのデータとの照合を
行ない、ステップ1008でマッチするデータの存在が
判定されるが、抽出されたデータが「<」であり、特殊
記号変換参照テーブル113の特殊記号参照見出し項目
113Aのデータが図2に示すようであるので、マッチ
しており、次のステップ1009に進む。
In step 1006, it is determined whether there is data extracted from the special symbol registration / editing table 112.
Since there is data "<", the next step 100
Go to 7. In Step 1007, Step 100
5 and Special Symbol Conversion Lookup Table 113
Is compared with the data of the special symbol reference heading item 113A, and the existence of matching data is determined in step 1008. The extracted data is “<”, and the special symbol reference in the special symbol conversion lookup table 113 is referred to. Since the data of the heading item 113A is as shown in FIG. 2, it matches, and the process proceeds to the next step 1009.

【0076】このステップ1009では、マッチした特
殊記号参照見出し項目113Aのデータに対応する特殊
記号変換参照見出し項目113Bのデータを抽出し、対
象としているステップ1005で抽出したデータと置換
する。今回の例では、対象とするステップ1005で抽
出したデータは「<」であり、特殊記号変換参照テーブ
ル113の特殊記号参照見出し項目113Aにマッチす
るデータが存在して対応する特殊記号変換参照見出し項
目113Bのデータは「&lt;」であるので、対象デ
ータ「<」を「&lt;」に置換する。
In this step 1009, the data of the special symbol conversion reference heading item 113B corresponding to the data of the matched special symbol reference heading item 113A is extracted and replaced with the data extracted in the target step 1005. In this example, the data extracted in the target step 1005 is “<”, and there is data matching the special symbol reference heading item 113A of the special symbol conversion reference table 113 and the corresponding special symbol conversion reference heading item. Since the data of 113B is “&lt;”, the target data “<” is replaced with “&lt;”.

【0077】次のステップ1010では、対象とするデ
ータを特殊記号変換照合テーブル114中の特殊記号照
合見出し項目114A又は特殊記号変換照合見出し項目
114Bにセットするが、ステップ1009から当該ス
テップ1010に移行したときには置換したデータをセ
ットし、ステップ1008から当該ステップ1010に
移行したときには抽出したそのままのデータがセットさ
れる。セットする順番は、上述した通りである。今回の
例では、ステップ1009で置換されたデータ「&l
t;」が、特殊記号変換照合テーブル114中の特殊記
号照合見出し項目114Aにセットされる。この段階で
の特殊記号変換照合テーブル114のセット内容は、図
9(A)に示すようになる。
In the next step 1010, the target data is set in the special symbol collation heading item 114 A or the special symbol conversion collation heading item 114 B in the special symbol conversion collation table 114, but the process proceeds from step 1009 to step 1010. Sometimes, the replaced data is set, and when the process proceeds from step 1008 to step 1010, the extracted data is set as it is. The setting order is as described above. In this example, the data “& l
t; ”is set in the special symbol collation heading item 114A in the special symbol conversion collation table 114. The set contents of the special symbol conversion / collation table 114 at this stage are as shown in FIG.

【0078】その後、ステップ1005に制御が戻り、
特殊記号登録・編集テーブル112の特殊記号変換見出
し項目112Bから次のデータとして「『」が抽出さ
れ、ステップ1006でデータの存在が判定されるが、
データが存在するので、ステップ1007で特殊記号変
換参照テーブル113の特殊記号参照見出し項目113
Aのデータとの照合を行ない、ステップ1008で、照
合結果を確認する。この対象データ「『」は、マッチす
るデータが特殊記号変換参照テーブル113の特殊記号
参照見出し項目113Aに存在しないので、ステップ1
010に進み、特殊記号変換照合テーブル114中の特
殊記号変換照合見出し項目114Bにデータ「『」がセ
ットさせる。この段階での特殊記号変換照合テーブル1
14のセット内容は、図9(B)に示すようになる。
Thereafter, control returns to step 1005,
"" Is extracted as the next data from the special symbol conversion heading item 112B of the special symbol registration / edit table 112, and the existence of the data is determined in step 1006.
Since the data exists, in step 1007, the special symbol reference heading item 113 of the special symbol conversion reference table 113
The collation with the data of A is performed, and in step 1008, the collation result is confirmed. Since the matching data does not exist in the special symbol reference heading item 113A of the special symbol conversion reference table 113, the target data ""
In step 010, the data "" is set in the special symbol conversion collation heading item 114B in the special symbol conversion collation table 114. Special symbol conversion collation table 1 at this stage
The set contents of 14 are as shown in FIG. 9 (B).

【0079】次に、再度ステップ1005に制御が移
り、特殊記号登録・編集テーブル112からデータを抽
出し、順次、特殊記号登録・編集テーブル112に存在
するデータ数だけステップ1005からステップ101
0が繰り返される。そして、特殊記号登録・編集テーブ
ル112から抽出されるデータが存在しなくなれば、ス
テップ1006でそのことが判定され、特殊記号処理制
御部108の処理を終了する。
Next, control is transferred to step 1005 again, data is extracted from the special symbol registration / editing table 112, and the number of data existing in the special symbol registration / editing table 112 is sequentially changed from step 1005 to step 101.
0 is repeated. If there is no longer any data extracted from the special symbol registration / edit table 112, this is determined in step 1006, and the processing of the special symbol processing control unit 108 ends.

【0080】今回の例で、特殊記号処理制御部108の
処理が終了したときの特殊記号変換照合テーブル114
の格納内容は、上述した図4に示すようになる。
In this example, the special symbol conversion / collation table 114 when the processing of the special symbol processing control unit 108 is completed.
Are as shown in FIG. 4 described above.

【0081】特殊記号処理制御部108の処理が終了す
ると、モード判定部101に制御が戻る。このときに、
登録した特殊記号に関するデータを確認したり、あるい
は登録した特殊記号に関するデータを修正したりする場
合には、特殊記号データ登録・編集処理モードを選択す
る。また、登録した特殊記号に関するデータを反映させ
てタグ付文書の翻訳処理を実行する場合には、翻訳処理
モードを選択する。
When the processing of the special symbol processing control unit 108 is completed, the control returns to the mode determination unit 101. At this time,
When confirming the data related to the registered special symbol or correcting the data related to the registered special symbol, the special symbol data registration / edit processing mode is selected. When the translation processing of the tagged document is performed by reflecting the data on the registered special symbol, the translation processing mode is selected.

【0082】以下では、翻訳処理モードが選択された場
合におけるシステムの動作について説明する。
The operation of the system when the translation processing mode is selected will be described below.

【0083】翻訳処理モードが選択されると、入力処理
部102に制御が移る。翻訳対象となる画面表示された
英文は、上述した英文1及び英文2である。
When the translation processing mode is selected, control is transferred to the input processing unit 102. The English sentences displayed on the screen to be translated are English sentence 1 and English sentence 2 described above.

【0084】しかし、入力原文データとしては文書が印
刷されたときの形式を指定するようなタグ情報を含んだ
原文データとなっており、英文1及び英文2に対応した
原文データ1及び原文データ2はそれぞれ、以下のよう
になっている。
However, the input original text data is original text data including tag information for designating a format when a document is printed, and original text data 1 and original text data 2 corresponding to English text 1 and English text 2. Are as follows.

【0085】原文データ1 This is &lt;
a pen&gt;. 原文データ2 That is {a penci
l}. 従って、これら原文データが入力処理部102の入力デ
ータとなり、入力バッファ109に格納されると共に、
次段のタグ情報抽出部103に1文ずつ渡されることに
なる。なお、入力バッファ109中の処理対象文が全て
処理されると、モード判定部101に制御が戻る。
Original data 1 This is &lt;
a pen &gt; Original data 2 That is @a penci
l}. Therefore, these original text data become input data of the input processing unit 102, are stored in the input buffer 109, and
The sentence is sent one by one to the tag information extraction unit 103 in the next stage. When all the processing target statements in the input buffer 109 have been processed, the control returns to the mode determination unit 101.

【0086】タグ情報抽出部103からタグ情報合成部
105までの翻訳処理系における、タグ付文書の翻訳処
理の詳細な説明は省略するが(上記文献参照)、タグ付
文書である原文データ1に対する翻訳処理により、タグ
情報合成部105からは「これは、&lt;ペン&g
t;です。」が出力されて特殊記号変換判定処理部10
6へ入力されることになる。
A detailed description of the translation processing of the tagged document in the translation processing system from the tag information extracting unit 103 to the tag information synthesizing unit 105 is omitted (see the above-mentioned document). As a result of the translation processing, the tag information synthesizing unit 105 outputs “This is &lt;
t; Is output and the special symbol conversion determination processing unit 10
6 will be input.

【0087】特殊記号変換判定処理部106では、ステ
ップ2001でタグ情報合成部105から出力された訳
文データを読み込む。次のステップ2002で、特殊記
号変換照合テーブル114の特殊記号照合見出し項目1
14Aから1データを抽出する。また、次にこのステッ
プ2002に制御が移った場合には、特殊記号照合見出
し項目114Aから次のデータが抽出される。
The special symbol conversion determination processing unit 106 reads the translated sentence data output from the tag information synthesis unit 105 in step 2001. In the next step 2002, the special symbol collation heading item 1 of the special symbol conversion collation table 114 is set.
One data is extracted from 14A. Next, when the control shifts to step 2002, the next data is extracted from the special symbol collation heading item 114A.

【0088】最初にステップ2002に入ったときに
は、特殊記号変換照合テーブル114の特殊記号照合見
出し項目114Aから先頭にあるデータ「&lt;」が
抽出される。次に、ステップ2003でステップ200
2で抽出した特殊記号照合見出し項目114Aのデータ
が存在するか判定されるが、データ「&lt;」が存在
するので、次のステップ2004に進む。
When the process first enters step 2002, the leading data "&lt;" is extracted from the special symbol collation heading item 114A of the special symbol conversion collation table 114. Next, in step 2003, step 200
It is determined whether or not the data of the special symbol collation heading item 114A extracted in step 2 exists. However, since the data “&lt;” exists, the process proceeds to the next step 2004.

【0089】ステップ2004では、ステップ2001
で読み込んだデータ「これは、&lt;ペン&gt;で
す。」の先頭から文字データが抽出され、ステップ20
05で文末に達したか否かが判定される。文末に達して
いない場合には、抽出された文字データは、ステップ2
006で、ステップ2002で抽出した特殊記号変換照
合テーブル114の特殊記号照合見出し項目114Aの
データ「&lt;」との照合が行なわれ、次のステップ
2007でその照合結果が判定され、マッチしていれば
次のステップ2008へと進む。今回の入力データ「こ
れは、&lt;ペン&gt;です。」には特殊記号照合
見出し項目114Aのデータ「&lt;」が1個存在す
るので、ステップ2007でマッチすると判定され、ス
テップ2008に進む。
In step 2004, step 2001
The character data is extracted from the head of the data read in step "20. This is &lt; pen &gt;"
At 05, it is determined whether the end of the sentence has been reached. If the end of the sentence has not been reached, the extracted character data is stored in step 2
In 006, the data is compared with the data “&lt;” of the special symbol collation heading item 114A of the special symbol conversion collation table 114 extracted in step 2002, and in the next step 2007, the collation result is determined, and a match is found. If so, the process proceeds to the next step 2008. Since the input data “this is &lt; pen &gt;” has one piece of data “&lt;” of the special symbol collation heading item 114A, it is determined in step 2007 that there is a match, and the process proceeds to step 2008.

【0090】ステップ2008では、マッチした特殊記
号変換照合テーブル114の特殊記号照合見出し項目1
14Aのデータ「&lt;」に対応する特殊記号変換照
合テーブル114の特殊記号変換照合見出し項目114
Bのデータ「『」が特殊記号変換照合テーブル114か
ら抽出され、入力データ「これは、&lt;ペン&g
t;です。」の中でマッチした文字データ(正確には文
字列データ)と置換される。今回の例では、この置換処
理の結果「これは、『ペン&gt;です。」という訳文
データが生成される。
In step 2008, the special symbol collation heading item 1 of the matched special symbol conversion collation table 114
Special symbol conversion collation heading item 114 of special symbol conversion collation table 114 corresponding to data “&lt;” of 14A
B data "" is extracted from the special symbol conversion collation table 114, and the input data "this is &lt;
t; Is replaced with the matching character data (actually, character string data). In this example, as a result of the replacement processing, translated data “This is“ Pen &gt; ”is generated.

【0091】次に、ステップ2004へと進み次の文字
データの抽出が行なわれるが、マッチする文字データが
存在しないので、文末まで達し、ステップ2005で文
末と判定され、ステップ2002に進む。
Next, the process proceeds to step 2004, where the next character data is extracted. However, since no matching character data exists, the process reaches the end of the sentence. In step 2005, the end of the sentence is determined, and the process proceeds to step 2002.

【0092】この2回目のステップ2002では特殊記
号変換照合テーブル114の特殊記号照合見出し項目1
14Aから次のデータ「&gt;」が抽出され、以下、
ステップ2003〜ステップ2007を介し、入力訳文
データ中にマッチするデータの存在が判定され、ステッ
プ2008で置換処理が行なわれ、「これは、『ペン』
です。」という訳文データが生成される。
In the second step 2002, the special symbol collation heading item 1 of the special symbol conversion collation table 114 is used.
The next data “&gt;” is extracted from 14A.
Through steps 2003 to 2007, it is determined whether there is matching data in the input translation data, and a replacement process is performed in step 2008.
is. Is generated.

【0093】次にステップ2004へと進み、次の文字
データの抽出が行なわれるが、マッチする文字列データ
が存在しないので、ステップ2005で文末と判定さ
れ、ステップ2002に進む。
Next, proceeding to step 2004, the next character data is extracted. However, since there is no matching character string data, it is determined in step 2005 that this is the end of the sentence, and the flow proceeds to step 2002.

【0094】この3回目のステップ2002では、特殊
記号変換照合テーブル114の特殊記号照合見出し項目
114Aから次のデータ「{」が抽出され、以下、ステ
ップ2003〜ステップ2008が実行されるが、入力
データ中にマッチするデータが存在しないので、ステッ
プ2005から4回目のステップ2002に進み、特殊
記号変換照合テーブル114の特殊記号照合見出し項目
114Aから次のデータ「}」が抽出され、以下、ステ
ップ2003〜ステップ2008が実行されるが、入力
データ中にマッチするデータの存在しないので、再びス
テップ2005からステップ2002に進む。
In the third step 2002, the next data “{” is extracted from the special symbol collation heading item 114A of the special symbol conversion collation table 114. Thereafter, steps 2003 to 2008 are executed. Since there is no matching data, the process proceeds from the step 2005 to the fourth step 2002, where the next data “}” is extracted from the special symbol collation heading item 114A of the special symbol conversion collation table 114. Step 2008 is executed, but since there is no matching data in the input data, the process proceeds from step 2005 to step 2002 again.

【0095】この5回目のステップ2002では、抽出
すべきデータが存在しないのでデータを抽出できず、ス
テップ2003で未抽出データの不存在が判定され、ス
テップ2009に進み、ステップ2008で置換処理が
施された訳文データ「これは、『ペン』です。」が出力
される。
In the fifth step 2002, no data can be extracted because there is no data to be extracted. In step 2003, it is determined that there is no unextracted data. The process proceeds to step 2009, and the replacement process is performed in step 2008. The translated data “This is a“ pen ”” is output.

【0096】次に、特殊記号変換判定処理部106から
出力された訳文データ「これは、『ペン』です。」が出
力処理部107へと出力される。出力処理部107で
は、特殊記号変換判定処理部106から出力された訳文
データを入力し、出力バッファ111に格納すると共
に、入力処理部102に処理の終了メッセージを発信す
る。また、出力処理部107は、出力バッファ111の
訳文データをユーザの指示操作によりディスプレイ装置
に表示したり、あるいは外部記憶装置に転送し訳文を保
存したりする。
Next, the translated sentence data “This is a“ pen ”” output from the special symbol conversion determination processing unit 106 is output to the output processing unit 107. The output processing unit 107 receives the translation data output from the special symbol conversion determination processing unit 106, stores the translated data in the output buffer 111, and transmits a processing end message to the input processing unit 102. The output processing unit 107 displays the translated text data in the output buffer 111 on a display device by a user's instruction operation, or transfers the translated data to an external storage device and stores the translated text.

【0097】次に、出力処理部107のメッセージによ
り、入力処理部102は、原文データ2(英文2に対応
している)をタグ情報抽出部103に転送する。この原
文データ2についての処理の詳細は、省略するが、タグ
情報保持部110からは「あれは、{鉛筆}です。」が
特殊記号変換判定処理部106へ出力され、特殊記号変
換判定処理部106からは「あれは、&lt;鉛筆&g
t;です。」が出力処理部107へと出力される。
Next, the input processing unit 102 transfers the original text data 2 (corresponding to English text 2) to the tag information extraction unit 103 according to the message of the output processing unit 107. Although details of the processing for the original text data 2 are omitted, “that is {pencil}” is output from the tag information holding unit 110 to the special symbol conversion determination processing unit 106, and the special symbol conversion determination processing unit From 106, "That is &lt; pencil & g
t; Is output to the output processing unit 107.

【0098】出力処理部107では、特殊記号変換判定
処理部106から出力されたデータを入力し、出力バッ
ファ111に格納すると共に、入力処理部102に処理
の終了メッセージを発信する。また、出力処理部107
は、出力バッファ111のデータをユーザの指示操作に
よりディスプレイ装置に表示したり、あるいは外部記憶
装置に転送し訳文を保存したりする。
The output processing unit 107 receives the data output from the special symbol conversion determination processing unit 106, stores the data in the output buffer 111, and transmits a processing end message to the input processing unit 102. The output processing unit 107
Displays the data in the output buffer 111 on a display device in response to a user's instruction operation, or transfers the data to an external storage device to store the translation.

【0099】なお、この文書データ「あれは、&lt;
鉛筆&gt;です。」が表示に供した場合には、「あれ
は、<鉛筆>です。」となる。
Note that this document data "that is &lt;
Pencil &gt; Is displayed, "that is <pencil>."

【0100】上記実施形態によれば、画面表示(印刷)
上は「&」、「<」、「>」といった通常の形態として
表記され、タグ付文書内では特殊な形態とし扱われる特
殊記号に関するデータに対して、ユーザの望む形態とし
て訳出させるためにその変換情報を登録させる際に、そ
の特殊記号をユーザは通常の形態で登録でき、翻訳処理
内では自動的にタグ付文書内の特殊な形態のデータとし
て処理できるようにしたので、ユーザが特殊記号に関す
る変換情報を容易に登録・編集でき、また、このように
変換情報の登録・編集操作を容易にしても、それが翻訳
結果に悪影響を及ぼすことを防止することができる。
According to the above embodiment, screen display (print)
The upper part is written as normal forms such as "&", "<", and ">". In order to translate data related to special symbols that are treated as special forms in tagged documents as the form desired by the user, When registering the conversion information, the user can register the special symbol in a normal format and automatically process it as a special format in the tagged document in the translation process. The conversion information can be easily registered and edited, and even if the operation of registering and editing the conversion information is facilitated, it is possible to prevent the conversion information from adversely affecting the translation result.

【0101】また、上述のように、特殊記号に関し、ユ
ーザが指定する形態で訳出できるため、タグ付文書の翻
訳処理を柔軟に効率良く行なうことでき、効率的な翻訳
環境を実現できるという実用上多大なる効果を奏する。
因に、従来は、特殊記号を変換元又は変換先とする変換
情報の登録・編集処理の困難性のため、特殊記号を変換
元又は変換先とする変換情報をユーザ登録できない機械
翻訳システムが多く存在していた。
Further, as described above, special symbols can be translated in a form designated by the user, so that translation of tagged documents can be performed flexibly and efficiently, and a practical translation environment can be realized. It has a great effect.
Conventionally, there are many machine translation systems in which conversion information using a special symbol as a conversion source or a conversion destination cannot be user-registered due to the difficulty of registering and editing conversion information using a special symbol as a conversion source or a conversion destination. Existed.

【0102】なお、上記実施形態においては、タグ付き
文書で特殊の形態で表現される特殊記号が「&」、
「<」、「>」であるものを示したが、他の特殊記号を
含むものであっても良く、特殊な形態と通常の形態とが
存在するものが、記号ではない文字であっても良い。特
許請求の範囲における特殊記号の用語は、このような特
殊文字を含む概念とする。
In the above embodiment, the special symbol represented by a special form in the tagged document is “&”,
Although "<" and ">" have been shown, other special symbols may be included. Even if a special form and a normal form are present, even if the character is not a symbol. good. The term “special symbol” in the claims is a concept including such special characters.

【0103】また、上記実施形態においては、特殊記号
を含み得るタグ付文書を翻訳するものを示したが、特殊
記号を含む文書であれば翻訳対象文書はタグ付文書に限
定されない。
Further, in the above-described embodiment, the translation of a tagged document which may include a special symbol has been described, but the document to be translated is not limited to the tagged document as long as the document includes the special symbol.

【0104】さらに、上記実施形態においては、特殊記
号変換判定処理部を、タグ情報合成部及び出力処理部間
に介挿したものを示したが、特殊記号変換判定処理部
を、入力処理部及びタグ情報抽出部間や、タグ情報抽出
部及び翻訳部間や、翻訳部及びタグ情報合成部間等の他
の位置に介挿するようにしても良い。
Further, in the above embodiment, the special symbol conversion judging section is interposed between the tag information synthesizing section and the output processing section. It may be inserted at other positions such as between the tag information extracting units, between the tag information extracting unit and the translating unit, or between the translating unit and the tag information synthesizing unit.

【0105】さらにまた、上記実施形態においては、特
殊記号登録・編集テーブルを有するものを示したが、こ
れを省略し、ユーザ登録情報が入力されたときに、特殊
記号を普通の形態から特殊の形態へ変換しながら直ちに
特殊記号変換照合テーブルに格納させるようにしても良
い。この場合、特殊記号の変換情報の登録内容を編集さ
せるべく表示させる際にも、特殊記号変換照合テーブル
から読出して、特殊記号を特殊な形態から普通の形態へ
変換させることを要する。
Further, in the above embodiment, the special symbol registration / edit table is shown. However, this is omitted, and when the user registration information is input, the special symbol is changed from the ordinary form to the special form. You may make it store in a special symbol conversion collation table immediately, converting into a form. In this case, when the registered content of the special symbol conversion information is displayed for editing, it is necessary to read the special symbol conversion collation table and convert the special symbol from a special form to a normal form.

【0106】また、上記実施形態においては、特殊記号
変換照合テーブルを備えて特殊記号に関連する変換情報
を特殊記号登録・編集テーブルに登録した際に、普通の
形態から特殊な形態への変換を行なうものを示したが、
特殊記号変換照合テーブルを省略し、特殊記号変換判定
処理部が、特殊記号処理制御部へデータの取出しや普通
の形態から特殊の形態への変換を所定タイミング(ステ
ップ2002、ステップ2008)で依頼するものであ
っても良い。
Further, in the above embodiment, when the conversion information related to the special symbol is registered in the special symbol registration / editing table by providing the special symbol conversion collation table, the conversion from the normal form to the special form is performed. I showed you what to do,
The special symbol conversion collation table is omitted, and the special symbol conversion determination processing unit requests the special symbol processing control unit to take out data or convert from a normal form to a special form at a predetermined timing (step 2002, step 2008). It may be something.

【0107】さらに、上記実施形態においては、特殊記
号変換判定処理部が特殊記号変換照合テーブルに記憶さ
れている特殊記号の変換内容にマッチする訳文データの
文字データを常に変換するものを示したが、特殊記号変
換判定処理部による変換動作を実行させるか実行させな
いかを入力装置から選択できるようにしても良い。
Further, in the above-described embodiment, the special symbol conversion determination processing unit always converts character data of translated sentence data that matches the conversion content of the special symbol stored in the special symbol conversion collation table. Alternatively, it may be possible to select from the input device whether or not to execute the conversion operation by the special symbol conversion determination processing unit.

【0108】さらにまた、上記実施形態においては、単
独の情報処理装置上に構成したシステムを示したが、ネ
ットワークを介して接続されたシステムの端末装置に本
発明に係るシステムを適用するようにしても良い。例え
ば、タグ記号等を含むテキスト又はハイパーテキスト
が、コンピュータネットワーク上の任意のサーバに存在
し、他の任意のクライアントから検索して、クライアン
ト上に表示するようなシステムにおける機械翻訳システ
ムにおいても適用可能である。
Furthermore, in the above-described embodiment, the system configured on a single information processing apparatus is shown. However, the system according to the present invention is applied to a terminal device of a system connected via a network. Is also good. For example, the present invention can also be applied to a machine translation system in which text or hypertext including a tag symbol or the like exists in any server on a computer network, is retrieved from any other client, and displayed on the client. It is.

【0109】また、上記実施形態においては、本発明
を、機械翻訳システムに適用したものを示したが、本発
明はこれに限定されず、特殊記号を含む文書を処理する
他の文書処理システムにも適用することができる。例え
ば、特殊記号を含むタグ付文書を要約する要約システム
や、特殊記号を含むタグ付文書に対して意味解析を行な
う意味解析システム等にも適用することができる。
In the above embodiment, the present invention is applied to a machine translation system. However, the present invention is not limited to this, and may be applied to other document processing systems for processing documents containing special symbols. Can also be applied. For example, the present invention can be applied to a summarizing system for summarizing a tagged document including a special symbol, a semantic analysis system for performing a semantic analysis on a tagged document including a special symbol, and the like.

【0110】[0110]

【発明の効果】以上のように、本発明によれば、特殊記
号の特殊な形態と普通の形態との対応関係を記憶してい
る特殊記号記述情報記憶手段と、特殊記号に関連した変
換情報を取込むものであって、その変換情報における変
換元又は変換先の特殊記号を普通の形態で取込み、特殊
記号記述情報記憶手段の記憶内容を参照して特殊な形態
に変換する特殊記号変換情報取込手段と、特殊記号につ
いては表記形態が変換されている変換情報の変換元に該
当する、処理対象文書の部分を検出して、変換情報に従
った変換を実行する特殊記号変換実行手段とを有するの
で、変換情報をユーザが容易に入力できて使い勝手を良
好にできると共に、入力を容易化させても、特殊記号に
関連した変換を正しく実行させることができるようにな
る。
As described above, according to the present invention, the special symbol description information storage means for storing the correspondence between the special form of the special symbol and the ordinary form, and the conversion information related to the special symbol Special symbol conversion information which takes in a conversion source or conversion destination special symbol in the conversion information in a normal form and refers to the storage contents of the special symbol description information storage means to convert it into a special form. Capturing means, and special symbol conversion executing means for detecting a part of the document to be processed, which corresponds to the conversion source of the conversion information in which the notation form has been converted for the special symbol, and executing conversion in accordance with the conversion information; Therefore, the conversion information can be easily input by the user and the usability can be improved, and the conversion related to the special symbol can be correctly executed even if the input is facilitated.

【図面の簡単な説明】[Brief description of the drawings]

【図1】実施形態の構成を示すブロック図である。FIG. 1 is a block diagram illustrating a configuration of an embodiment.

【図2】実施形態の特殊記号変換参照テーブルの構成例
を示す説明図である。
FIG. 2 is an explanatory diagram illustrating a configuration example of a special symbol conversion reference table according to the embodiment;

【図3】実施形態の特殊記号登録・編集テーブルの登録
例を示す説明図である。
FIG. 3 is an explanatory diagram illustrating a registration example of a special symbol registration / edit table according to the embodiment;

【図4】実施形態の特殊記号変換照合テーブルの構成例
を示す説明図である。
FIG. 4 is an explanatory diagram illustrating a configuration example of a special symbol conversion / collation table according to the embodiment;

【図5】実施形態の特殊記号処理制御部の処理フローチ
ャート(1)である。
FIG. 5 is a processing flowchart (1) of a special symbol processing control unit of the embodiment.

【図6】実施形態の特殊記号処理制御部の処理フローチ
ャート(2)である。
FIG. 6 is a processing flowchart (2) of the special symbol processing control unit of the embodiment.

【図7】実施形態の特殊記号変換判定処理部の処理フロ
ーチャート(1)である。
FIG. 7 is a processing flowchart (1) of a special symbol conversion determination processing unit of the embodiment.

【図8】実施形態の特殊記号変換判定処理部の処理フロ
ーチャート(2)である。
FIG. 8 is a processing flowchart (2) of the special symbol conversion determination processing unit of the embodiment.

【図9】実施形態の具体的動作説明に供する図面であ
る。
FIG. 9 is a diagram for explaining a specific operation of the embodiment;

【符号の説明】[Explanation of symbols]

101…モード判定部、102…入力処理部、103…
タグ情報抽出部、104…翻訳部、105…タグ情報合
成部、106…特殊記号変換判定処理部、107…出力
処理部、108…特殊記号処理制御部、109…入力バ
ッファ、110…タグ情報保持部、111…出力バッフ
ァ、112…特殊記号登録・編集テーブル、113…特
殊記号変換参照テーブル、114…特殊記号変換照合テ
ーブル。
101: mode determination unit, 102: input processing unit, 103 ...
Tag information extraction unit, 104 translation unit, 105 tag information synthesis unit, 106 special symbol conversion determination processing unit, 107 output processing unit, 108 special symbol processing control unit, 109 input buffer, 110 tag information holding Section, 111: output buffer, 112: special symbol registration / edit table, 113: special symbol conversion reference table, 114: special symbol conversion collation table.

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 表示、印刷出力時の表記とは異なる特殊
な形態で記述されている特殊記号を有する文書を処理す
る文書処理システムにおいて、 特殊記号の特殊な形態と、表示、印刷出力時の表記と同
じ特殊記号の普通の形態との対応関係を記憶している特
殊記号記述情報記憶手段と、 特殊記号を他の特殊記号や文字に変換したり、及び又
は、文字を特殊記号に変換したりするための変換情報を
取込むものであって、その変換情報における変換元又は
変換先の特殊記号を普通の形態で取込み、上記特殊記号
記述情報記憶手段の記憶内容を参照して特殊な形態に変
換する特殊記号変換情報取込手段と、 上記特殊記号変換情報取込手段が取込み、特殊記号につ
いては表記形態が変換されている変換情報の変換元に該
当する、処理対象文書の部分を検出して、上記変換情報
に従った変換を実行する特殊記号変換実行手段とを有す
ることを特徴とする文書処理システム。
1. A document processing system for processing a document having a special symbol described in a special form different from the notation at the time of display and print output, the method comprising: A special symbol description information storage unit that stores the correspondence between the notation and the ordinary form of the same special symbol, and converts a special symbol into another special symbol or character, and / or converts a character into a special symbol. In this case, the conversion source or the conversion destination special symbol in the conversion information is fetched in a normal form, and the special symbol description information storage means is referred to for storing the special symbol. The special symbol conversion information fetching means for converting to a special symbol conversion information fetching means and the special symbol conversion information fetching means for detecting the part of the document to be processed which corresponds to the conversion source of the conversion information in which the notation form is converted. And a special symbol conversion executing means for executing the conversion in accordance with the conversion information.
【請求項2】 上記文書が、表示、印刷出力時の形式を
規定するタグ情報を含むタグ付文書であることを特徴と
する請求項1に記載の文書処理システム。
2. The document processing system according to claim 1, wherein the document is a tagged document including tag information defining a format at the time of display and printout.
【請求項3】 上記原言語の文書を目的言語の文書に翻
訳する翻訳手段をさらに備え、上記特殊記号変換実行手
段が原言語の文書の段階又は目的言語の文書の段階で、
特殊記号に関連した文書部分の変換を実行することを特
徴とする請求項1又は2に記載の文書処理システム。
3. The apparatus according to claim 1, further comprising a translation unit for translating the source language document into a target language document, wherein the special symbol conversion executing unit performs a source language document stage or a target language document stage.
3. The document processing system according to claim 1, wherein conversion of a document portion related to the special symbol is performed.
JP8225472A 1996-08-27 1996-08-27 Document processing system Pending JPH1063667A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8225472A JPH1063667A (en) 1996-08-27 1996-08-27 Document processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8225472A JPH1063667A (en) 1996-08-27 1996-08-27 Document processing system

Publications (1)

Publication Number Publication Date
JPH1063667A true JPH1063667A (en) 1998-03-06

Family

ID=16829860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8225472A Pending JPH1063667A (en) 1996-08-27 1996-08-27 Document processing system

Country Status (1)

Country Link
JP (1) JPH1063667A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217809A (en) * 2008-04-02 2008-09-18 Fujitsu Ltd Structured document converter
JP2023071497A (en) * 2021-11-11 2023-05-23 株式会社日立製作所 Work support device, work support system, and work support program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217809A (en) * 2008-04-02 2008-09-18 Fujitsu Ltd Structured document converter
JP2023071497A (en) * 2021-11-11 2023-05-23 株式会社日立製作所 Work support device, work support system, and work support program

Similar Documents

Publication Publication Date Title
EP0597611B1 (en) Apparatus and Method for Use in Aligning Bilingual Corpora
JP3220560B2 (en) Machine translation equipment
US6286014B1 (en) Method and apparatus for acquiring a file to be linked
WO2008013720A2 (en) Method and apparatus for font subsetting
JP2003114882A (en) System and method for formatting contents for publication
US5778380A (en) Intelligent resource transformation engine for translating files
US20010029442A1 (en) Translation system, translation processing method and computer readable recording medium
JPH1063667A (en) Document processing system
JPH08212216A (en) Natural language processing device and natural language processing method
JP2001034611A (en) Reading information output device and recording medium
JPH0883280A (en) Document processor
JPH03233670A (en) Text data conversion system
JPH1063659A (en) Document processing system
JP2003345798A (en) Translation control method, translation control device, and processing program therefor
JPH09325960A (en) Document processing system
JP2006252164A (en) Chinese document processing device
JPH1011449A (en) Document processing system
JPH05290030A (en) Document processor
JP2000003365A (en) Machine translation system, reply mail creation support system and document creation support system, machine translation method, reply mail creation method and document creation method
JPH0844745A (en) Machine translation device
JPH07182344A (en) Machine translation device
JPH0778800B2 (en) Document processor
EP0731414A1 (en) An information retrieval system
JPH07319873A (en) Document processor
JPH077421B2 (en) Multilingual document creation method