JPS6133577A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPS6133577A JPS6133577A JP15448584A JP15448584A JPS6133577A JP S6133577 A JPS6133577 A JP S6133577A JP 15448584 A JP15448584 A JP 15448584A JP 15448584 A JP15448584 A JP 15448584A JP S6133577 A JPS6133577 A JP S6133577A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- katakana
- dictionary
- foreign language
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、機械翻訳の前処理において、入力テキスト中
の外国語を表す片仮名文字列を外国語表記の文字列に変
換し、しかる後にテキストを翻訳部に送るようになった
機械翻訳装置に関するものである。
の外国語を表す片仮名文字列を外国語表記の文字列に変
換し、しかる後にテキストを翻訳部に送るようになった
機械翻訳装置に関するものである。
従来の日本語を英語に翻訳する機械翻訳装置においては
、片仮名文字列を日本語単語辞書だけから検索していた
ため、英語単語で片仮名表記されているものは日本語単
語辞書に登録しておく必要がある。英語単語を片仮名表
記したものを日本語単語辞書に入れ且つ同一の英語単語
をアルファベット表記したものを英語単語辞書に入れて
おくことは、辞書の容量を増大させるばかりでなく翻訳
処理を複雑にするこという欠点がある。
、片仮名文字列を日本語単語辞書だけから検索していた
ため、英語単語で片仮名表記されているものは日本語単
語辞書に登録しておく必要がある。英語単語を片仮名表
記したものを日本語単語辞書に入れ且つ同一の英語単語
をアルファベット表記したものを英語単語辞書に入れて
おくことは、辞書の容量を増大させるばかりでなく翻訳
処理を複雑にするこという欠点がある。
本発明は、上記の欠点を除去するものであって、辞書の
容量を小さくできると共に機械翻訳の負荷を軽減できる
ようにした機械翻訳装置を提供することを目的としてい
る。
容量を小さくできると共に機械翻訳の負荷を軽減できる
ようにした機械翻訳装置を提供することを目的としてい
る。
そしてそのため、本発明の機械翻訳装置は、片仮名列抽
出部と辞書アクセス部とテキスト併合部とを有する前処
理部、翻訳部、日本語辞書、及び外国語辞書を具備する
機械翻訳装置であって、上記外国語辞書の中には外国語
文字表記の文字列に対応して片仮名文字表記の文字列が
書き込まれ、上記片仮名抽出部は、入力テキスト中の片
仮名文字列を上記辞書アクセス部に送り片仮名文字列以
外を上記テキスト併合部に送るように構成され、上記辞
書アクセス部は、送られて来た片仮名文字列と一致する
片仮名文字列が上記日本語辞書の中にあるか否かを調べ
、ない場合には送られて来た片仮名文字列と一致する片
仮名文字列が上記外国語辞書の中にあるか否かを調べ、
ある場合には対応する外国語文字表記の文字列を上記テ
キスト併合部に送るように構成され、上記テキスト併合
部は、送られて来た外国語文字列に対応する入力テキス
ト中の片仮名文字列を送られて来た外国語表記の文字列
に置き換え、置き換え済みのテキストを上記翻訳部に送
るよう構成されていることを特徴とするものである。
出部と辞書アクセス部とテキスト併合部とを有する前処
理部、翻訳部、日本語辞書、及び外国語辞書を具備する
機械翻訳装置であって、上記外国語辞書の中には外国語
文字表記の文字列に対応して片仮名文字表記の文字列が
書き込まれ、上記片仮名抽出部は、入力テキスト中の片
仮名文字列を上記辞書アクセス部に送り片仮名文字列以
外を上記テキスト併合部に送るように構成され、上記辞
書アクセス部は、送られて来た片仮名文字列と一致する
片仮名文字列が上記日本語辞書の中にあるか否かを調べ
、ない場合には送られて来た片仮名文字列と一致する片
仮名文字列が上記外国語辞書の中にあるか否かを調べ、
ある場合には対応する外国語文字表記の文字列を上記テ
キスト併合部に送るように構成され、上記テキスト併合
部は、送られて来た外国語文字列に対応する入力テキス
ト中の片仮名文字列を送られて来た外国語表記の文字列
に置き換え、置き換え済みのテキストを上記翻訳部に送
るよう構成されていることを特徴とするものである。
以下、本発明の実施例を図面を参照しつつ説明する。
第1図は本発明の1実施例の概要を示す図である。第1
図において、1は翻訳装置、2は前処理部、3は翻訳部
、4は日本語解析部、5は英語生成部をそれぞれ示して
いる。
図において、1は翻訳装置、2は前処理部、3は翻訳部
、4は日本語解析部、5は英語生成部をそれぞれ示して
いる。
翻訳装置!1は前処理部2と翻訳部3から構成されてい
る。前処理部2は、日本語文字列の入力テキストにおけ
る外来語の片仮名文字列をアルファベント表記の英語単
語に置き換え、この結果骨られるテキストを翻訳部3に
送る。翻訳部3は、日本語解析部4と英語生成部5を、
有している。なお、入力テキストは単語単位に分割され
ているものである。日本語解析部4は、単語の品詞種別
を調べ、単語間の係り受は関係を調べるものである。英
語生成部5は、日本語解析部4の解析結果に従って英語
を生成するものである。
る。前処理部2は、日本語文字列の入力テキストにおけ
る外来語の片仮名文字列をアルファベント表記の英語単
語に置き換え、この結果骨られるテキストを翻訳部3に
送る。翻訳部3は、日本語解析部4と英語生成部5を、
有している。なお、入力テキストは単語単位に分割され
ているものである。日本語解析部4は、単語の品詞種別
を調べ、単語間の係り受は関係を調べるものである。英
語生成部5は、日本語解析部4の解析結果に従って英語
を生成するものである。
第2図は前処理部2の1実施例のブロック図である。第
2図において、6は片仮名抽出部、7は辞書アクセス部
、8は日本語単語辞書、9は英語単語辞書、10はテキ
スト併合部をそれぞれ示している。片仮名列抽出部6は
、入力テキストの中から片仮名列を抽出し、抽出した片
仮名列を辞書アクセス部7に送り、片仮名以外をテキス
ト併合部10に送るものである。辞書アクセス部7は、
送られて来た片仮名列に基づいて日本語単語辞書8を検
索し、該当する単語が日本語辞書8の中に存在する場合
には当該片仮名列をそのままテキスト併合部10に送り
、該当する単語が日本語単語辞書8に存在しない場合に
は英語単語辞書9を検索し、該当するアルファベット表
記の英語単語をテキスト併合部10g送る。テキスト併
合部10は、送られて来たアルファベット表記の英語単
語で以て入力テキスト中の該当する片仮名列を置き換え
、その結果生成されるテキストを翻訳部3に送る。日本
語単語辞書8の中には複数の日本語単語レコードが格納
されており、日本語単語レコードは仮名の見出フィール
ド、対応する漢字が格納される漢字フィールド、品詞種
別を格納するフィールド、使用回数を格納するフィール
ド及び単語を表す記号が格納される記号フィールドなど
から構成されている。英語単語辞書9には複数の英語単
語レコードが格納されており、英語単語レコードはアル
ファベットの見出フィールド、対応する片仮名表記の英
語単語を格納するフィールド、品詞種別を格納するフィ
ールド、使用回数を格納するフィールド及び記号フィー
ルドなどから構成されている。
2図において、6は片仮名抽出部、7は辞書アクセス部
、8は日本語単語辞書、9は英語単語辞書、10はテキ
スト併合部をそれぞれ示している。片仮名列抽出部6は
、入力テキストの中から片仮名列を抽出し、抽出した片
仮名列を辞書アクセス部7に送り、片仮名以外をテキス
ト併合部10に送るものである。辞書アクセス部7は、
送られて来た片仮名列に基づいて日本語単語辞書8を検
索し、該当する単語が日本語辞書8の中に存在する場合
には当該片仮名列をそのままテキスト併合部10に送り
、該当する単語が日本語単語辞書8に存在しない場合に
は英語単語辞書9を検索し、該当するアルファベット表
記の英語単語をテキスト併合部10g送る。テキスト併
合部10は、送られて来たアルファベット表記の英語単
語で以て入力テキスト中の該当する片仮名列を置き換え
、その結果生成されるテキストを翻訳部3に送る。日本
語単語辞書8の中には複数の日本語単語レコードが格納
されており、日本語単語レコードは仮名の見出フィール
ド、対応する漢字が格納される漢字フィールド、品詞種
別を格納するフィールド、使用回数を格納するフィール
ド及び単語を表す記号が格納される記号フィールドなど
から構成されている。英語単語辞書9には複数の英語単
語レコードが格納されており、英語単語レコードはアル
ファベットの見出フィールド、対応する片仮名表記の英
語単語を格納するフィールド、品詞種別を格納するフィ
ールド、使用回数を格納するフィールド及び記号フィー
ルドなどから構成されている。
なお、コンセント等の和製英語は日本語単語辞書8に格
納される。
納される。
第3図は第2図の実施例の動作を説明する図である。■
のようなテキストが入力されると、■のような片仮名列
が片仮名抽出部6から辞書アクセス部7に送られ、■の
ような文字列が片仮名抽出部6からテキスト併合部】O
に送られ、■のようなアルファベント文字列が辞書アク
セス部7からテキスト併合部lOに送られ、■のような
テキストがテキスト併合部lOから出力される。
のようなテキストが入力されると、■のような片仮名列
が片仮名抽出部6から辞書アクセス部7に送られ、■の
ような文字列が片仮名抽出部6からテキスト併合部】O
に送られ、■のようなアルファベント文字列が辞書アク
セス部7からテキスト併合部lOに送られ、■のような
テキストがテキスト併合部lOから出力される。
翻訳部3は下記のような動作を行うものである。
例えば「私は5uper Con+puterを開発す
る。」という文字列が翻訳部3に入力されたと仮定する
。日本語解析部4は、入力テキストの単語の品詞種別及
び記号を調べる。「私」は代名詞、「はjは係助詞、r
super ComputerJは名詞、「を」は格助
詞、「開発する」は動詞という品詞域別を有している。
る。」という文字列が翻訳部3に入力されたと仮定する
。日本語解析部4は、入力テキストの単語の品詞種別及
び記号を調べる。「私」は代名詞、「はjは係助詞、r
super ComputerJは名詞、「を」は格助
詞、「開発する」は動詞という品詞域別を有している。
また、「私」は例えば001、「開発する」は例えば0
05という記号を有している。次に日本語解析部4は、
「私」と「は」とが名詞文節を作ること、rsuper
ComputerJと「を」が名詞文節を作ることを
知り、更に「私はJという名詞文節が「開発する」に係
ること、rSuper Computerを」という名
詞文節も「開発する」に係ることを知る。日本語解析部
4の解析結果は英語生成部5に渡され、”英語生成部5
はこの解析結果に基づいてrI develop a
5uper Computer、 Jという英語文を生
成する。
05という記号を有している。次に日本語解析部4は、
「私」と「は」とが名詞文節を作ること、rsuper
ComputerJと「を」が名詞文節を作ることを
知り、更に「私はJという名詞文節が「開発する」に係
ること、rSuper Computerを」という名
詞文節も「開発する」に係ることを知る。日本語解析部
4の解析結果は英語生成部5に渡され、”英語生成部5
はこの解析結果に基づいてrI develop a
5uper Computer、 Jという英語文を生
成する。
以上の説明から明らかなように、本発明によれば、辞書
の容量を小さく出来ること及び機械翻訳の負荷を軽減す
ること等の効果を奏することが出来る。
の容量を小さく出来ること及び機械翻訳の負荷を軽減す
ること等の効果を奏することが出来る。
第1図は本発明の翻訳装置の1実施例の概要を示す図、
第2図は第1図の前処理部の1実施例のブロック図、第
3図は第2図の動作を説明するための図である。 1・・・翻訳装置、2・・・前処理部、3・・・翻訳部
、4・・・日本語解析部、5・・・英語生成部、6・・
・片仮名抽出部、7・・・辞書アクセス部、8・・・日
本語単語辞書、9・・・英語単語辞書、10・・・テキ
スト併合部。
第2図は第1図の前処理部の1実施例のブロック図、第
3図は第2図の動作を説明するための図である。 1・・・翻訳装置、2・・・前処理部、3・・・翻訳部
、4・・・日本語解析部、5・・・英語生成部、6・・
・片仮名抽出部、7・・・辞書アクセス部、8・・・日
本語単語辞書、9・・・英語単語辞書、10・・・テキ
スト併合部。
Claims (1)
- 片仮名列抽出部と辞書アクセス部とテキスト併合部とを
有する前処理部、翻訳部、日本語辞書、及び外国語辞書
を具備する機械翻訳装置であつて、上記外国語辞書の中
には外国語文字表記の文字列に対応して片仮名文字表記
の文字列が書き込まれ、上記片仮名抽出部は、入力テキ
スト中の片仮名文字列を上記辞書アクセス部に送り片仮
名文字列以外を上記テキスト併合部に送るように構成さ
れ、上記辞書アクセス部は、送られて来た片仮名文字列
と一致する片仮名文字列が上記日本語辞書の中にあるか
否かを調べ、ない場合には送られて来た片仮名文字列と
一致する片仮名文字列が上記外国語辞書の中にあるか否
かを調べ、ある場合には対応する外国語文字表記の文字
列を上記テキスト併合部に送るように構成され、上記テ
キスト併合部は、送られて来た外国語文字列に対応する
入力テキスト中の片仮名文字列を送られて来た外国語表
記の文字列に置き換え、置き換え済みのテキストを上記
翻訳部に送るよう構成されていることを特徴とする機械
翻訳装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP15448584A JPS6133577A (ja) | 1984-07-25 | 1984-07-25 | 機械翻訳装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP15448584A JPS6133577A (ja) | 1984-07-25 | 1984-07-25 | 機械翻訳装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6133577A true JPS6133577A (ja) | 1986-02-17 |
| JPH0346865B2 JPH0346865B2 (ja) | 1991-07-17 |
Family
ID=15585271
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP15448584A Granted JPS6133577A (ja) | 1984-07-25 | 1984-07-25 | 機械翻訳装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6133577A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03211669A (ja) * | 1990-01-17 | 1991-09-17 | Nec Corp | 機械翻訳装置 |
| JPH07271786A (ja) * | 1994-10-20 | 1995-10-20 | Casio Comput Co Ltd | ワードプロセッサ |
-
1984
- 1984-07-25 JP JP15448584A patent/JPS6133577A/ja active Granted
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03211669A (ja) * | 1990-01-17 | 1991-09-17 | Nec Corp | 機械翻訳装置 |
| JPH07271786A (ja) * | 1994-10-20 | 1995-10-20 | Casio Comput Co Ltd | ワードプロセッサ |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0346865B2 (ja) | 1991-07-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Krauss et al. | Athabaskan, Eyak, and Tlingit Sonorants. Alaska Native Language Center Research Papers No. 5. | |
| JPH0689304A (ja) | テキスト処理システムにより使用されるテキストを準備する方法及び装置 | |
| US20070179932A1 (en) | Method for finding data, research engine and microprocessor therefor | |
| Marsi et al. | Memory-based morphological analysis generation and part-of-speech tagging of Arabic | |
| Khan et al. | Urdu word segmentation using machine learning approaches | |
| JPS58192173A (ja) | 機械翻訳装置 | |
| Jha et al. | Inflectional morphology analyzer for Sanskrit | |
| JPS61100861A (ja) | 文書編集装置 | |
| Saito et al. | Multi-language named-entity recognition system based on HMM | |
| JPS5892063A (ja) | イデイオム処理方式 | |
| JPS6133577A (ja) | 機械翻訳装置 | |
| Hiro et al. | Word‐sense disambiguation with a corpus‐based semantic network | |
| Carter | Lattice-based word identification in CLARE | |
| Nongmeikapam et al. | A transliteration of CRF based Manipuri POS tagging | |
| Moghadam et al. | A Survey of Part of Speech Tagging of Latin and non-Latin Script Languages: A more vivid view on Persian | |
| Prathibha et al. | Morphological analyzer for Kannada inflectional words using hybrid approach | |
| Tukur et al. | A Corpus-Based Approach to Parts-of-Speech Tagging of the Hausa-Based Texts Using Hidden Markov and Unigram Models | |
| JPS62130458A (ja) | かな漢字変換処理方式 | |
| KR100248386B1 (ko) | 인간 가독형 형태소 접속 정보와 자종(字種) 정보를 이용한 일본어 형태소 분석 장치 및 그 방법 | |
| Khoroshilov et al. | Introduction of Phrase Structures into the Example-Based Machine Translation System | |
| Bouhyaoui | What are the Challenges faced in the processing of Arabic language | |
| JPS63115264A (ja) | 文書処理装置 | |
| JPS6395573A (ja) | 日本語文形態素解析における未知語処理方法 | |
| Nain¹ et al. | POS Tagging and Structural Annotation of Handwritten Text Image Corpus of Devnagari Script | |
| Yona | A finite-state based morphological analyzer for Hebrew |