JPH05128146A - 英語形態素解析装置 - Google Patents
英語形態素解析装置Info
- Publication number
- JPH05128146A JPH05128146A JP3291146A JP29114691A JPH05128146A JP H05128146 A JPH05128146 A JP H05128146A JP 3291146 A JP3291146 A JP 3291146A JP 29114691 A JP29114691 A JP 29114691A JP H05128146 A JPH05128146 A JP H05128146A
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- morpheme
- word
- english
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 形態素分割の失敗による形態素解析の失敗を
解消する英語形態素解析装置の提供を目的とする。 【構成】 入力手段1によって入力された英文を形態素
解析制御部4において解析する過程で複数形態素分割の
パターンが考えられる英文であることがわかったとき、
その複数パターンを用いて形態素解析を行ない、その解
析結果を解析結果記憶部6に記憶しておき、複数の解析
結果を表示部7において表示する構成を有する。
解消する英語形態素解析装置の提供を目的とする。 【構成】 入力手段1によって入力された英文を形態素
解析制御部4において解析する過程で複数形態素分割の
パターンが考えられる英文であることがわかったとき、
その複数パターンを用いて形態素解析を行ない、その解
析結果を解析結果記憶部6に記憶しておき、複数の解析
結果を表示部7において表示する構成を有する。
Description
【0001】
【産業上の利用分野】本発明は、英語を日本語に翻訳す
る際に行なう英語形態素解析処理に関する。
る際に行なう英語形態素解析処理に関する。
【0002】
【従来の技術】形態素解析処理において、形態素分割の
方法次第で、複合語を含む英文や見かけ上重複して複合
語を形成しているような英文を解析すると、この英文に
ついて複合語にはなり得ないパターンを選択し、形態素
解析を誤ってしまう場合がある。
方法次第で、複合語を含む英文や見かけ上重複して複合
語を形成しているような英文を解析すると、この英文に
ついて複合語にはなり得ないパターンを選択し、形態素
解析を誤ってしまう場合がある。
【0003】
【発明が解決しようとする課題】上記のように、英文が
見かえ上重複して複合語を形成しているような英文を解
析すると、重複している複合語の内どれか一つのパター
ンのみしか解析することができず、そのパターンがこの
英文中においては複合語にはなり得なかった場合、これ
は形態素分割の誤りで、形態素解析の結果はその複合語
のパターンを選んだ時点で既に誤りということになり、
この形態素解析結果を用いて翻訳処理を行なうと誤りの
訳文しか出せなくなる。
見かえ上重複して複合語を形成しているような英文を解
析すると、重複している複合語の内どれか一つのパター
ンのみしか解析することができず、そのパターンがこの
英文中においては複合語にはなり得なかった場合、これ
は形態素分割の誤りで、形態素解析の結果はその複合語
のパターンを選んだ時点で既に誤りということになり、
この形態素解析結果を用いて翻訳処理を行なうと誤りの
訳文しか出せなくなる。
【0004】また、句動詞を含む文でも同様のことが言
える。英文の意味解析を行なわない形態素解析では、句
動詞としてまとめて形態素分割をしたものと、しなかっ
たものとでは、どちらが正しい解釈であるのか判断でき
ず形態素分割で誤り、形態素解析に失敗してしまうこと
もある。
える。英文の意味解析を行なわない形態素解析では、句
動詞としてまとめて形態素分割をしたものと、しなかっ
たものとでは、どちらが正しい解釈であるのか判断でき
ず形態素分割で誤り、形態素解析に失敗してしまうこと
もある。
【0005】本発明は上記課題を解決するもので、形態
素分割の誤りによる形態素解析の失敗を無くす英語形態
素解析装置の提供を目的とする。
素分割の誤りによる形態素解析の失敗を無くす英語形態
素解析装置の提供を目的とする。
【0006】
【課題を解決するための手段】上記目的を達成するため
に本発明は、重複する複合語など解析結果が複数考えら
れる場合は、一意に解析結果を決めずに、複数の解析結
果を出力する構成を有する。
に本発明は、重複する複合語など解析結果が複数考えら
れる場合は、一意に解析結果を決めずに、複数の解析結
果を出力する構成を有する。
【0007】
【作用】本発明は上記した構成で複数の形態素解析結果
を出力することによって、形態素分割のための解析誤り
を無くすことができる。
を出力することによって、形態素分割のための解析誤り
を無くすことができる。
【0008】
【実施例】以下、本発明の一実施例について図面を参照
しながら説明する。図1は本発明の一実施例における形
態素解析装置の機能ブロック図である。同図において、
1は英文の文字列を入力する入力手段、2は入力手段1
から入力された英文を記憶する入力英文記憶部、3は見
出し語と形態素情報を記憶している単語辞書部、4は3
の単語辞書部を用いて形態素解析処理を行なう形態素解
析制御部、5は解析途中で別の形態素分割の解釈が考え
られる場合にその形態素の位置を記憶しておく再解析位
置記憶部、6は形態素解析結果を記憶する解析結果記憶
部、7は解析結果を表示する表示部である。
しながら説明する。図1は本発明の一実施例における形
態素解析装置の機能ブロック図である。同図において、
1は英文の文字列を入力する入力手段、2は入力手段1
から入力された英文を記憶する入力英文記憶部、3は見
出し語と形態素情報を記憶している単語辞書部、4は3
の単語辞書部を用いて形態素解析処理を行なう形態素解
析制御部、5は解析途中で別の形態素分割の解釈が考え
られる場合にその形態素の位置を記憶しておく再解析位
置記憶部、6は形態素解析結果を記憶する解析結果記憶
部、7は解析結果を表示する表示部である。
【0009】上記構成要素よりなる装置の各構成要素の
関係と動作を述べる。まず、入力手段1によって入力さ
れた英文に対し、形態素解析制御部4を動作させ、形態
素解析を実行する。この形態素解析の処理過程において
は、入力された英文を構成するそれぞれの単語(形態
素)について単語辞書部3を検索する。この際、複合語
など、複数の形態素分割が可能な単語列が存在している
場合は再解析位置記憶部5にその位置を記憶しておき、
複数の分割パターンの内の一つのパターンで解析を続行
し、その解析結果が得られた時点で、解析結果記憶部6
に解析結果を記憶しておき、再解析位置記憶部5に記憶
された位置からまた新たに別のパターンの解釈で解析を
し直し、その結果も解析結果記憶部6に記憶される。こ
のように、一つ以上の解析結果が解析結果記憶部6に記
憶され、表示部7で表示される。
関係と動作を述べる。まず、入力手段1によって入力さ
れた英文に対し、形態素解析制御部4を動作させ、形態
素解析を実行する。この形態素解析の処理過程において
は、入力された英文を構成するそれぞれの単語(形態
素)について単語辞書部3を検索する。この際、複合語
など、複数の形態素分割が可能な単語列が存在している
場合は再解析位置記憶部5にその位置を記憶しておき、
複数の分割パターンの内の一つのパターンで解析を続行
し、その解析結果が得られた時点で、解析結果記憶部6
に解析結果を記憶しておき、再解析位置記憶部5に記憶
された位置からまた新たに別のパターンの解釈で解析を
し直し、その結果も解析結果記憶部6に記憶される。こ
のように、一つ以上の解析結果が解析結果記憶部6に記
憶され、表示部7で表示される。
【0010】以下、図2のフローチャートを参照しなが
ら複数の解析結果が得られる場合の処理について説明す
る。
ら複数の解析結果が得られる場合の処理について説明す
る。
【0011】まず、ステップAで形態素解析処理を始め
る。ステップBで形態素分割の処理が行なわれ、分割対
象単語列が複合語であったなどの理由で複数の分割が可
能な場合、ステップCで現在の形態素分割位置を再解析
位置として記憶しておく。複数の分割パターンのうちの
一つを用いて解析処理を続行し(ステップD)、一つの
解析結果が得られると、ステップEにおいて形態素解析
結果を記憶する。解析が終了したら、再解析位置を確認
し、再解析の必要があれば、ステップFで再解析位置を
求め再解析位置において先程とは別のパターンで形態素
分割し(ステップB)、形態素解析の処理を行ない(ス
テップC,D)、解析が終了したら、ステップEにおい
て解析結果を記憶する。こうして、一つ以上の形態素解
析結果が記憶され、ステップGで表示される。
る。ステップBで形態素分割の処理が行なわれ、分割対
象単語列が複合語であったなどの理由で複数の分割が可
能な場合、ステップCで現在の形態素分割位置を再解析
位置として記憶しておく。複数の分割パターンのうちの
一つを用いて解析処理を続行し(ステップD)、一つの
解析結果が得られると、ステップEにおいて形態素解析
結果を記憶する。解析が終了したら、再解析位置を確認
し、再解析の必要があれば、ステップFで再解析位置を
求め再解析位置において先程とは別のパターンで形態素
分割し(ステップB)、形態素解析の処理を行ない(ス
テップC,D)、解析が終了したら、ステップEにおい
て解析結果を記憶する。こうして、一つ以上の形態素解
析結果が記憶され、ステップGで表示される。
【0012】さらに、具体例を挙げて説明する。次のよ
うな英文に対し、形態素解析の要求があったとする。
うな英文に対し、形態素解析の要求があったとする。
【0013】The sun set in the west.この英文につい
て形態素分割を行なうと、setの単語でsetとset inの二
つの分割パターンが存在することがわかる。
て形態素分割を行なうと、setの単語でsetとset inの二
つの分割パターンが存在することがわかる。
【0014】まず、setと分割するパターンで解析を行
なうと、 The / sun / set / in / the/ west /
. に分割され、形態素情報を付加した形態素解析結果は、
(実際は、形態素情報として色々なものを付加するがこ
こではそれらを代表して品詞のみを示す。) The / sun / set / in / the / west / . 冠詞 名詞 名詞 前置詞 冠詞 名詞 記号 動詞 副詞 形容詞 が得られる。
なうと、 The / sun / set / in / the/ west /
. に分割され、形態素情報を付加した形態素解析結果は、
(実際は、形態素情報として色々なものを付加するがこ
こではそれらを代表して品詞のみを示す。) The / sun / set / in / the / west / . 冠詞 名詞 名詞 前置詞 冠詞 名詞 記号 動詞 副詞 形容詞 が得られる。
【0015】次に、set inという句動詞で形態素分割を
行ない解析すると、 The / sun / set in / the / west / . に分割され、形態素情報を付加した形態素解析結果は、 The / sun / set in / the / west / . 冠詞 名詞 動詞 冠詞 名詞 記号 となり、,の2つのパターンの形態素解析結果が得
られる。
行ない解析すると、 The / sun / set in / the / west / . に分割され、形態素情報を付加した形態素解析結果は、 The / sun / set in / the / west / . 冠詞 名詞 動詞 冠詞 名詞 記号 となり、,の2つのパターンの形態素解析結果が得
られる。
【0016】このように本発明の実施例の英語形態素解
析装置によれば、複合語などの複数の形態素分割が可能
な単語列を再解析位置記憶部に記憶しておき、複数の分
割パターンについて解析し、表示するので、形態素分割
の処理による形態素解析の失敗は無くなる。
析装置によれば、複合語などの複数の形態素分割が可能
な単語列を再解析位置記憶部に記憶しておき、複数の分
割パターンについて解析し、表示するので、形態素分割
の処理による形態素解析の失敗は無くなる。
【0017】
【発明の効果】以上の実施例から明らかなように本発明
によれば、複合語を含んでいる英文や見掛け上重複して
いる複合語などの、解析結果が複数考えられるような英
文の解析は、一意に解析結果を決めずに、複数の解析結
果を出力するので、形態素分割のための解析誤りの無い
英語形態素解析装置を提供できる。
によれば、複合語を含んでいる英文や見掛け上重複して
いる複合語などの、解析結果が複数考えられるような英
文の解析は、一意に解析結果を決めずに、複数の解析結
果を出力するので、形態素分割のための解析誤りの無い
英語形態素解析装置を提供できる。
【図1】本発明の一実施例における形態素解析装置の機
能ブロック図
能ブロック図
【図2】同実施例における複数の解析結果を得るための
処理を表わすフローチャート
処理を表わすフローチャート
1 入力手段 2 入力英文記憶部 3 単語辞書部 4 形態素解析制御部 5 再解析位置記憶部 6 解析結果記憶部 7 表示部
Claims (1)
- 【請求項1】 原文の文字列を入力する入力手段と、前
記入力手段によって入力された文字列を記憶する入力英
文記憶部と、単語の見出し語や形態素情報などを記憶し
た単語辞書部と、前記単語辞書部を用いて形態素解析処
理を行なう形態素解析制御部と、解析途中で別の形態素
分割の解釈が考えられる場合にその形態素の位置を記憶
しておく角解析位置記憶部と、複数の形態素解析結果を
記憶する解析結果記憶部と、解析結果を表示する表示部
とを備え、形態素解析結果を一つに決めず、複数のパタ
ーンの解析結果を出力するようにした英語形態素解析装
置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3291146A JPH05128146A (ja) | 1991-11-07 | 1991-11-07 | 英語形態素解析装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3291146A JPH05128146A (ja) | 1991-11-07 | 1991-11-07 | 英語形態素解析装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH05128146A true JPH05128146A (ja) | 1993-05-25 |
Family
ID=17765040
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3291146A Pending JPH05128146A (ja) | 1991-11-07 | 1991-11-07 | 英語形態素解析装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH05128146A (ja) |
-
1991
- 1991-11-07 JP JP3291146A patent/JPH05128146A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4502128A (en) | Translation between natural languages | |
| US4833611A (en) | Machine translation system | |
| US4953088A (en) | Sentence translator with processing stage indicator | |
| GB2241094A (en) | Translation machine | |
| GB2194084A (en) | Translation system | |
| JP3136973B2 (ja) | 言語解析システムおよび方法 | |
| JPH05128146A (ja) | 英語形態素解析装置 | |
| JPS6190269A (ja) | 翻訳方式 | |
| JPS61260366A (ja) | 学習機能付機械翻訳システム | |
| JP2632806B2 (ja) | 言語解析装置 | |
| JP2715419B2 (ja) | 翻訳装置 | |
| JP2807586B2 (ja) | 機械翻訳装置 | |
| JP2871300B2 (ja) | 機械翻訳装置 | |
| JPS6320567A (ja) | 翻訳装置 | |
| JPH0628396A (ja) | 電子化辞書装置 | |
| JPS61260367A (ja) | 機械翻訳システム | |
| JPH03282874A (ja) | 文書作成装置 | |
| JP3340124B2 (ja) | かな漢字変換装置 | |
| JPS63136264A (ja) | 機械翻訳装置 | |
| JPH07182342A (ja) | 機械翻訳装置 | |
| JPH0239357A (ja) | 日本文誤り自動検定・訂正装置 | |
| JPH07200588A (ja) | 翻訳装置 | |
| JPH0816599A (ja) | 翻訳支援装置 | |
| JPS62272358A (ja) | 翻訳装置における翻訳中断時の表示方式 | |
| JPH01316863A (ja) | 日本文誤り自動検定・訂正装置 |