JPS6133577A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPS6133577A
JPS6133577A JP15448584A JP15448584A JPS6133577A JP S6133577 A JPS6133577 A JP S6133577A JP 15448584 A JP15448584 A JP 15448584A JP 15448584 A JP15448584 A JP 15448584A JP S6133577 A JPS6133577 A JP S6133577A
Authority
JP
Japan
Prior art keywords
character string
katakana
dictionary
foreign language
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP15448584A
Other languages
English (en)
Other versions
JPH0346865B2 (ja
Inventor
Masato Obe
正人 小部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP15448584A priority Critical patent/JPS6133577A/ja
Publication of JPS6133577A publication Critical patent/JPS6133577A/ja
Publication of JPH0346865B2 publication Critical patent/JPH0346865B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、機械翻訳の前処理において、入力テキスト中
の外国語を表す片仮名文字列を外国語表記の文字列に変
換し、しかる後にテキストを翻訳部に送るようになった
機械翻訳装置に関するものである。
〔従来技術と問題点〕
従来の日本語を英語に翻訳する機械翻訳装置においては
、片仮名文字列を日本語単語辞書だけから検索していた
ため、英語単語で片仮名表記されているものは日本語単
語辞書に登録しておく必要がある。英語単語を片仮名表
記したものを日本語単語辞書に入れ且つ同一の英語単語
をアルファベット表記したものを英語単語辞書に入れて
おくことは、辞書の容量を増大させるばかりでなく翻訳
処理を複雑にするこという欠点がある。
〔発明の目的〕
本発明は、上記の欠点を除去するものであって、辞書の
容量を小さくできると共に機械翻訳の負荷を軽減できる
ようにした機械翻訳装置を提供することを目的としてい
る。
〔目的を達成するための手段〕
そしてそのため、本発明の機械翻訳装置は、片仮名列抽
出部と辞書アクセス部とテキスト併合部とを有する前処
理部、翻訳部、日本語辞書、及び外国語辞書を具備する
機械翻訳装置であって、上記外国語辞書の中には外国語
文字表記の文字列に対応して片仮名文字表記の文字列が
書き込まれ、上記片仮名抽出部は、入力テキスト中の片
仮名文字列を上記辞書アクセス部に送り片仮名文字列以
外を上記テキスト併合部に送るように構成され、上記辞
書アクセス部は、送られて来た片仮名文字列と一致する
片仮名文字列が上記日本語辞書の中にあるか否かを調べ
、ない場合には送られて来た片仮名文字列と一致する片
仮名文字列が上記外国語辞書の中にあるか否かを調べ、
ある場合には対応する外国語文字表記の文字列を上記テ
キスト併合部に送るように構成され、上記テキスト併合
部は、送られて来た外国語文字列に対応する入力テキス
ト中の片仮名文字列を送られて来た外国語表記の文字列
に置き換え、置き換え済みのテキストを上記翻訳部に送
るよう構成されていることを特徴とするものである。
〔発明の実施例〕
以下、本発明の実施例を図面を参照しつつ説明する。
第1図は本発明の1実施例の概要を示す図である。第1
図において、1は翻訳装置、2は前処理部、3は翻訳部
、4は日本語解析部、5は英語生成部をそれぞれ示して
いる。
翻訳装置!1は前処理部2と翻訳部3から構成されてい
る。前処理部2は、日本語文字列の入力テキストにおけ
る外来語の片仮名文字列をアルファベント表記の英語単
語に置き換え、この結果骨られるテキストを翻訳部3に
送る。翻訳部3は、日本語解析部4と英語生成部5を、
有している。なお、入力テキストは単語単位に分割され
ているものである。日本語解析部4は、単語の品詞種別
を調べ、単語間の係り受は関係を調べるものである。英
語生成部5は、日本語解析部4の解析結果に従って英語
を生成するものである。
第2図は前処理部2の1実施例のブロック図である。第
2図において、6は片仮名抽出部、7は辞書アクセス部
、8は日本語単語辞書、9は英語単語辞書、10はテキ
スト併合部をそれぞれ示している。片仮名列抽出部6は
、入力テキストの中から片仮名列を抽出し、抽出した片
仮名列を辞書アクセス部7に送り、片仮名以外をテキス
ト併合部10に送るものである。辞書アクセス部7は、
送られて来た片仮名列に基づいて日本語単語辞書8を検
索し、該当する単語が日本語辞書8の中に存在する場合
には当該片仮名列をそのままテキスト併合部10に送り
、該当する単語が日本語単語辞書8に存在しない場合に
は英語単語辞書9を検索し、該当するアルファベット表
記の英語単語をテキスト併合部10g送る。テキスト併
合部10は、送られて来たアルファベット表記の英語単
語で以て入力テキスト中の該当する片仮名列を置き換え
、その結果生成されるテキストを翻訳部3に送る。日本
語単語辞書8の中には複数の日本語単語レコードが格納
されており、日本語単語レコードは仮名の見出フィール
ド、対応する漢字が格納される漢字フィールド、品詞種
別を格納するフィールド、使用回数を格納するフィール
ド及び単語を表す記号が格納される記号フィールドなど
から構成されている。英語単語辞書9には複数の英語単
語レコードが格納されており、英語単語レコードはアル
ファベットの見出フィールド、対応する片仮名表記の英
語単語を格納するフィールド、品詞種別を格納するフィ
ールド、使用回数を格納するフィールド及び記号フィー
ルドなどから構成されている。
なお、コンセント等の和製英語は日本語単語辞書8に格
納される。
第3図は第2図の実施例の動作を説明する図である。■
のようなテキストが入力されると、■のような片仮名列
が片仮名抽出部6から辞書アクセス部7に送られ、■の
ような文字列が片仮名抽出部6からテキスト併合部】O
に送られ、■のようなアルファベント文字列が辞書アク
セス部7からテキスト併合部lOに送られ、■のような
テキストがテキスト併合部lOから出力される。
翻訳部3は下記のような動作を行うものである。
例えば「私は5uper Con+puterを開発す
る。」という文字列が翻訳部3に入力されたと仮定する
。日本語解析部4は、入力テキストの単語の品詞種別及
び記号を調べる。「私」は代名詞、「はjは係助詞、r
super ComputerJは名詞、「を」は格助
詞、「開発する」は動詞という品詞域別を有している。
また、「私」は例えば001、「開発する」は例えば0
05という記号を有している。次に日本語解析部4は、
「私」と「は」とが名詞文節を作ること、rsuper
 ComputerJと「を」が名詞文節を作ることを
知り、更に「私はJという名詞文節が「開発する」に係
ること、rSuper Computerを」という名
詞文節も「開発する」に係ることを知る。日本語解析部
4の解析結果は英語生成部5に渡され、”英語生成部5
はこの解析結果に基づいてrI develop a 
5uper Computer、 Jという英語文を生
成する。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、辞書
の容量を小さく出来ること及び機械翻訳の負荷を軽減す
ること等の効果を奏することが出来る。
【図面の簡単な説明】
第1図は本発明の翻訳装置の1実施例の概要を示す図、
第2図は第1図の前処理部の1実施例のブロック図、第
3図は第2図の動作を説明するための図である。 1・・・翻訳装置、2・・・前処理部、3・・・翻訳部
、4・・・日本語解析部、5・・・英語生成部、6・・
・片仮名抽出部、7・・・辞書アクセス部、8・・・日
本語単語辞書、9・・・英語単語辞書、10・・・テキ
スト併合部。

Claims (1)

    【特許請求の範囲】
  1. 片仮名列抽出部と辞書アクセス部とテキスト併合部とを
    有する前処理部、翻訳部、日本語辞書、及び外国語辞書
    を具備する機械翻訳装置であつて、上記外国語辞書の中
    には外国語文字表記の文字列に対応して片仮名文字表記
    の文字列が書き込まれ、上記片仮名抽出部は、入力テキ
    スト中の片仮名文字列を上記辞書アクセス部に送り片仮
    名文字列以外を上記テキスト併合部に送るように構成さ
    れ、上記辞書アクセス部は、送られて来た片仮名文字列
    と一致する片仮名文字列が上記日本語辞書の中にあるか
    否かを調べ、ない場合には送られて来た片仮名文字列と
    一致する片仮名文字列が上記外国語辞書の中にあるか否
    かを調べ、ある場合には対応する外国語文字表記の文字
    列を上記テキスト併合部に送るように構成され、上記テ
    キスト併合部は、送られて来た外国語文字列に対応する
    入力テキスト中の片仮名文字列を送られて来た外国語表
    記の文字列に置き換え、置き換え済みのテキストを上記
    翻訳部に送るよう構成されていることを特徴とする機械
    翻訳装置。
JP15448584A 1984-07-25 1984-07-25 機械翻訳装置 Granted JPS6133577A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15448584A JPS6133577A (ja) 1984-07-25 1984-07-25 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15448584A JPS6133577A (ja) 1984-07-25 1984-07-25 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPS6133577A true JPS6133577A (ja) 1986-02-17
JPH0346865B2 JPH0346865B2 (ja) 1991-07-17

Family

ID=15585271

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15448584A Granted JPS6133577A (ja) 1984-07-25 1984-07-25 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPS6133577A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03211669A (ja) * 1990-01-17 1991-09-17 Nec Corp 機械翻訳装置
JPH07271786A (ja) * 1994-10-20 1995-10-20 Casio Comput Co Ltd ワードプロセッサ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03211669A (ja) * 1990-01-17 1991-09-17 Nec Corp 機械翻訳装置
JPH07271786A (ja) * 1994-10-20 1995-10-20 Casio Comput Co Ltd ワードプロセッサ

Also Published As

Publication number Publication date
JPH0346865B2 (ja) 1991-07-17

Similar Documents

Publication Publication Date Title
Krauss et al. Athabaskan, Eyak, and Tlingit Sonorants. Alaska Native Language Center Research Papers No. 5.
JPH0689304A (ja) テキスト処理システムにより使用されるテキストを準備する方法及び装置
US20070179932A1 (en) Method for finding data, research engine and microprocessor therefor
Marsi et al. Memory-based morphological analysis generation and part-of-speech tagging of Arabic
Khan et al. Urdu word segmentation using machine learning approaches
JPS58192173A (ja) 機械翻訳装置
Jha et al. Inflectional morphology analyzer for Sanskrit
JPS61100861A (ja) 文書編集装置
Saito et al. Multi-language named-entity recognition system based on HMM
JPS5892063A (ja) イデイオム処理方式
JPS6133577A (ja) 機械翻訳装置
Hiro et al. Word‐sense disambiguation with a corpus‐based semantic network
Carter Lattice-based word identification in CLARE
Nongmeikapam et al. A transliteration of CRF based Manipuri POS tagging
Moghadam et al. A Survey of Part of Speech Tagging of Latin and non-Latin Script Languages: A more vivid view on Persian
Prathibha et al. Morphological analyzer for Kannada inflectional words using hybrid approach
Tukur et al. A Corpus-Based Approach to Parts-of-Speech Tagging of the Hausa-Based Texts Using Hidden Markov and Unigram Models
JPS62130458A (ja) かな漢字変換処理方式
KR100248386B1 (ko) 인간 가독형 형태소 접속 정보와 자종(字種) 정보를 이용한 일본어 형태소 분석 장치 및 그 방법
Khoroshilov et al. Introduction of Phrase Structures into the Example-Based Machine Translation System
Bouhyaoui What are the Challenges faced in the processing of Arabic language
JPS63115264A (ja) 文書処理装置
JPS6395573A (ja) 日本語文形態素解析における未知語処理方法
Nain¹ et al. POS Tagging and Structural Annotation of Handwritten Text Image Corpus of Devnagari Script
Yona A finite-state based morphological analyzer for Hebrew