JPH0576658B2 - - Google Patents
Info
- Publication number
- JPH0576658B2 JPH0576658B2 JP59185392A JP18539284A JPH0576658B2 JP H0576658 B2 JPH0576658 B2 JP H0576658B2 JP 59185392 A JP59185392 A JP 59185392A JP 18539284 A JP18539284 A JP 18539284A JP H0576658 B2 JPH0576658 B2 JP H0576658B2
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- relevance
- japanese
- sentence
- analysis device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】
技術分野
本発明は日本語解析装置、とくにワードプロセ
ツサ、翻訳システムなどに適用可能な構文解析を
行なう日本語解析装置に関する。
ツサ、翻訳システムなどに適用可能な構文解析を
行なう日本語解析装置に関する。
従来技術
従来のこの種の日本語解析装置にあつては入力
された日本語文に対し、文単位で、すなわち他の
文とは関係なく1つの文の中だけで構文解析を行
つていたために、解析結果に瞬味さが生じるとい
う欠点があつた。
された日本語文に対し、文単位で、すなわち他の
文とは関係なく1つの文の中だけで構文解析を行
つていたために、解析結果に瞬味さが生じるとい
う欠点があつた。
例えば「太郎は犬である。…吠えている彼の太
郎は…。」という日本語文が入力されたとする。
上記日本語文において「吠えている」の係り受け
先で可能性のあるのは、「彼」と「太郎」である
が、「彼」も「太郎」も一般的には人間を指称す
る。したがつて、上記日本語文において、「太郎」
が犬を指称していることは、他の文章からの情報
がなければ判らない。したがつて文単位で構文解
析したのでは、「吠えている」のが「彼」である
か「太郎」であるかを判別することは不可能であ
る。
郎は…。」という日本語文が入力されたとする。
上記日本語文において「吠えている」の係り受け
先で可能性のあるのは、「彼」と「太郎」である
が、「彼」も「太郎」も一般的には人間を指称す
る。したがつて、上記日本語文において、「太郎」
が犬を指称していることは、他の文章からの情報
がなければ判らない。したがつて文単位で構文解
析したのでは、「吠えている」のが「彼」である
か「太郎」であるかを判別することは不可能であ
る。
このように従来の日本語解析装置では、単なる
一文内の情報に基づいて文単位に構文解析してい
たので、解析結果に瞬味さが生じていた。
一文内の情報に基づいて文単位に構文解析してい
たので、解析結果に瞬味さが生じていた。
目 的
本発明はこのような従来技術の欠点を解消し、
構文解析結果の瞬味さを減少させることができる
日本語解析装置を提供することにある。
構文解析結果の瞬味さを減少させることができる
日本語解析装置を提供することにある。
構 成
本発明の構成について以下、実施例に基づいて
説明する。本発明によれば、入力された文章に現
れる単語の構文上の関連性を自動的に抽出し、こ
の関連性を示すデータを記憶手段に記憶させてお
き、構文解析時にこれらのデータを参照すること
により、解析結果の瞬味さを減少させている。
説明する。本発明によれば、入力された文章に現
れる単語の構文上の関連性を自動的に抽出し、こ
の関連性を示すデータを記憶手段に記憶させてお
き、構文解析時にこれらのデータを参照すること
により、解析結果の瞬味さを減少させている。
第1図には本発明に係る日本語解析装置の一実
施例の構成が示されており、同図において入力手
段としてのキーボード10は数字を示すテンキ
ー、ひらがな等の文字を示す文字キー、各種の機
能キー等から構成され、ユーザはキーボード10
のキー操作により構文解析すべき日本語文データ
を処理制御装置12に入力する。
施例の構成が示されており、同図において入力手
段としてのキーボード10は数字を示すテンキ
ー、ひらがな等の文字を示す文字キー、各種の機
能キー等から構成され、ユーザはキーボード10
のキー操作により構文解析すべき日本語文データ
を処理制御装置12に入力する。
処理制御装置12はバスライン30を介して形
態素解析装置14、構文解析装置16及び関連性
判定装置20に接続されている。処理制御装置1
2はキーボード10により入力された日本語文デ
ータをバスライン30を介して形態素解析装置1
4に送出し、また形態素解析装置14、構文解析
装置16の解析結果及び関連性判定手段20の判
定結果を示すデータを表示装置22に転送する。
態素解析装置14、構文解析装置16及び関連性
判定装置20に接続されている。処理制御装置1
2はキーボード10により入力された日本語文デ
ータをバスライン30を介して形態素解析装置1
4に送出し、また形態素解析装置14、構文解析
装置16の解析結果及び関連性判定手段20の判
定結果を示すデータを表示装置22に転送する。
形態素解析装置14は処理制御装置12より取
り込んだ日本語文データを形態素解析し、その解
析結果を構文解析装置16に送出する。
り込んだ日本語文データを形態素解析し、その解
析結果を構文解析装置16に送出する。
構文解析装置16では形態素解析結果に基づい
て日本語文データの構文解析を行う。
て日本語文データの構文解析を行う。
一方、関連性判定装置20は構文解析装置16
の解析結果に基づいて文単位に構文上、相互に関
連性を有する語の組を抽出し、これらの語の組及
びこれらの語の組の関連性等を示すデータを関連
性スタツク18に登録すると共に、構文解析装置
16の解析結果に瞬味さが生じた場に対象となる
語について関連性スタツク18の記憶内容を検索
してその語と関連語との関連性を判定し、該判定
結果と単語辞書ROM22から得られる辞書情報
を構文解析装置16に送出する。
の解析結果に基づいて文単位に構文上、相互に関
連性を有する語の組を抽出し、これらの語の組及
びこれらの語の組の関連性等を示すデータを関連
性スタツク18に登録すると共に、構文解析装置
16の解析結果に瞬味さが生じた場に対象となる
語について関連性スタツク18の記憶内容を検索
してその語と関連語との関連性を判定し、該判定
結果と単語辞書ROM22から得られる辞書情報
を構文解析装置16に送出する。
次に上記構成からなる日本語解析装置の具体的
動作を以下に説明する。まずキーボード10のキ
ー操作により、たとえば「……美しい山。……美
しい日本の山。……」なる文章の日本語文データ
が処理制御装置12に入力されると、処理制御装
置12はバスライン30を介して形態素解析装置
14に日本語文データを転送する。この日本語文
データは形態素解析装置14により形態素解析さ
れた後、その解析結果は構文解析装置16に送出
される。そして形態素解析された日本語文データ
のうち「美しい山。」が構文解析装置16により
第2図イに示すように解析されたとする。すなわ
ち、第2図イは単語「美しい山」が単語「山」を
修飾していることを意味している。この解析結果
は構文解析装置16より関連性判定装置20に送
出され、関連性判定装置20は第3図に示すよう
に中心語(対修となる語)である「美しい」と関
連語である「山」とをこれらの語の関連性を示す
データである識別番号、あるいは辞書アドレス
(単語辞書ROM22に登録されているアドレス)
及び文例その他の辞書情報と共に関連性スタツク
18に登録する。
動作を以下に説明する。まずキーボード10のキ
ー操作により、たとえば「……美しい山。……美
しい日本の山。……」なる文章の日本語文データ
が処理制御装置12に入力されると、処理制御装
置12はバスライン30を介して形態素解析装置
14に日本語文データを転送する。この日本語文
データは形態素解析装置14により形態素解析さ
れた後、その解析結果は構文解析装置16に送出
される。そして形態素解析された日本語文データ
のうち「美しい山。」が構文解析装置16により
第2図イに示すように解析されたとする。すなわ
ち、第2図イは単語「美しい山」が単語「山」を
修飾していることを意味している。この解析結果
は構文解析装置16より関連性判定装置20に送
出され、関連性判定装置20は第3図に示すよう
に中心語(対修となる語)である「美しい」と関
連語である「山」とをこれらの語の関連性を示す
データである識別番号、あるいは辞書アドレス
(単語辞書ROM22に登録されているアドレス)
及び文例その他の辞書情報と共に関連性スタツク
18に登録する。
なお、第3図において文番号は構文解析(ある
いは形態素解析)される際に文単位毎に付される
登録番号であり、また識別番号は例えば「1」は
修飾関係、「2」は置き替え関係、「3」は指示関
係,…を示している。
いは形態素解析)される際に文単位毎に付される
登録番号であり、また識別番号は例えば「1」は
修飾関係、「2」は置き替え関係、「3」は指示関
係,…を示している。
次に「美しい日本の山」という日本語文データ
が形態素解析された後に構文解析装置16に入力
されると、構文解析装置16では構文解析する際
に単語「美しい」が「日本」にも「山」にも修飾
し得るので、解析結果に瞬味さが生じ、構文解析
装置16は関連性判定装置20を起動する。
が形態素解析された後に構文解析装置16に入力
されると、構文解析装置16では構文解析する際
に単語「美しい」が「日本」にも「山」にも修飾
し得るので、解析結果に瞬味さが生じ、構文解析
装置16は関連性判定装置20を起動する。
起動された関連性判定装置20は単語「美し
い」をキーワードとして関連性スタツク18の記
憶内容を検索し、その関連語及び識別記号を調べ
る。この結果、単語「山」と単語「美しい」は修
飾関係にあることが判定され、この判定結果及び
辞書情報が構文解析装置16に送出される。
い」をキーワードとして関連性スタツク18の記
憶内容を検索し、その関連語及び識別記号を調べ
る。この結果、単語「山」と単語「美しい」は修
飾関係にあることが判定され、この判定結果及び
辞書情報が構文解析装置16に送出される。
構文解析装置16ではこれらの情報に基づいて
日本語文データ「美しい日本の山」における単語
「美しい」は単語「日本」よりも単語「山」を修
飾する可能性が大きいと判断し、上記日本語文デ
ータは第2図ロに示すように解析される。すなわ
ち「美しい山」、「日本の」がいづれも「山」を修
飾し、「日本の山が美しい」という意味に構文解
析される。
日本語文データ「美しい日本の山」における単語
「美しい」は単語「日本」よりも単語「山」を修
飾する可能性が大きいと判断し、上記日本語文デ
ータは第2図ロに示すように解析される。すなわ
ち「美しい山」、「日本の」がいづれも「山」を修
飾し、「日本の山が美しい」という意味に構文解
析される。
以上に説明したように本実施例では入力され日
本語文に現れる単語相互の関連性を自動的に抽出
し、しかも構文解析時にその関連性及び関連語を
示すデータを参照するように構成したので、構文
解析結果の瞬味さを減少させることができる。
本語文に現れる単語相互の関連性を自動的に抽出
し、しかも構文解析時にその関連性及び関連語を
示すデータを参照するように構成したので、構文
解析結果の瞬味さを減少させることができる。
また本実施例では構文解析と関連性抽出を同時
に行うので構文解析の処理速度を高速に行うこと
ができる。
に行うので構文解析の処理速度を高速に行うこと
ができる。
次に本発明に係る日本語解析装置の他の実施例
の構成を第4図に示す。本実施例が第1図に示し
た実施例と構成上、異なる点は単語と単語との関
連性を示す関連性パターンが記憶されている関連
性表現辞書ROM40と形態素解析された日本語
文データを関連性表現辞書ROM40の記憶内容
を参照して関連性ある語の組を抽出し、予め関連
性スタツク118に登録する関連性抽出装置50
とを設けた点であり、他の構成は全く同様である
ので重複する説明は省略する。
の構成を第4図に示す。本実施例が第1図に示し
た実施例と構成上、異なる点は単語と単語との関
連性を示す関連性パターンが記憶されている関連
性表現辞書ROM40と形態素解析された日本語
文データを関連性表現辞書ROM40の記憶内容
を参照して関連性ある語の組を抽出し、予め関連
性スタツク118に登録する関連性抽出装置50
とを設けた点であり、他の構成は全く同様である
ので重複する説明は省略する。
本実施例における日本語解析装置の動作を以下
に説明する。まずキーボード10のキー操作によ
り、たとえば「犬は太郎である。……吠えている
彼の太郎は……。彼は高校生である。…」なる文
章の日本語文データが処理制御装置12に入力さ
れ、この入力動作が完了すると、上記日本語文デ
ータは処理制御装置12より形態素解析装置14
に転送される。
に説明する。まずキーボード10のキー操作によ
り、たとえば「犬は太郎である。……吠えている
彼の太郎は……。彼は高校生である。…」なる文
章の日本語文データが処理制御装置12に入力さ
れ、この入力動作が完了すると、上記日本語文デ
ータは処理制御装置12より形態素解析装置14
に転送される。
そしてこの日本語文データは形態素解析装置1
4により形態素解析され、この解析結果は関連性
抽出装置50に送出される。
4により形態素解析され、この解析結果は関連性
抽出装置50に送出される。
関連性表現辞書ROM40には第5図に示すよ
うに関連性パターン、中心語と関連語との関連性
を示す識別記号及び中心語と関連語との一覧が登
録されている。ここで同図において、関連語及び
中心語の欄でA/Bの表示は「AまたはB」を意
味するものとする。
うに関連性パターン、中心語と関連語との関連性
を示す識別記号及び中心語と関連語との一覧が登
録されている。ここで同図において、関連語及び
中心語の欄でA/Bの表示は「AまたはB」を意
味するものとする。
さて、関連性抽出装置50は関連性表現辞書
ROM40の記憶内容を参照し、形態素解析装置
14から送出された日本語文データから関連性の
ある語の組を抽出して関連性スタツク118に書
き込む。この場合に上記日本語文データのうち
「犬は太郎である。」と「彼は高校生である。」が
関連性表現辞書ROM40における関連性パター
ンの「名詞1+は名詞2+である」と一致するので
第6図に示すように関連性スタツク18に書き込
む。
ROM40の記憶内容を参照し、形態素解析装置
14から送出された日本語文データから関連性の
ある語の組を抽出して関連性スタツク118に書
き込む。この場合に上記日本語文データのうち
「犬は太郎である。」と「彼は高校生である。」が
関連性表現辞書ROM40における関連性パター
ンの「名詞1+は名詞2+である」と一致するので
第6図に示すように関連性スタツク18に書き込
む。
一方、形態素解析装置14よりバスライン30
を介して構文解析装置16に日本語文データが送
出され、構文解析装置16で日本語文データ「吠
えている彼の太郎は……」を構文解析する場合に
「吠えている」は「彼」にも「太郎」にも係り得
る。ここで構文解析装置16には単語「彼」、「太
郎」についていずれも「名詞」であり、「人間」
を指称するという情報しかないために構文解析い
瞬味さが生じる。このように構文解析に瞬味さが
生じると、構文解析装置16より関連性判定装置
20が起動される。
を介して構文解析装置16に日本語文データが送
出され、構文解析装置16で日本語文データ「吠
えている彼の太郎は……」を構文解析する場合に
「吠えている」は「彼」にも「太郎」にも係り得
る。ここで構文解析装置16には単語「彼」、「太
郎」についていずれも「名詞」であり、「人間」
を指称するという情報しかないために構文解析い
瞬味さが生じる。このように構文解析に瞬味さが
生じると、構文解析装置16より関連性判定装置
20が起動される。
関連性判定装置20では単語「彼」と「太郎」
について関連性スタツク118の記憶内容を検索
し、その結果「彼」は「高校生」であり且つ「太
郎」は「犬」であるという単語の関連性について
の情報を得る。次にこれらの単語の辞書アドレス
から単語辞書ROM22の記憶内容を検索し、各
単語について辞書情報、すなわち「犬」は「動
物」であり、「高校生」は「人間」であるという
情報を得る。
について関連性スタツク118の記憶内容を検索
し、その結果「彼」は「高校生」であり且つ「太
郎」は「犬」であるという単語の関連性について
の情報を得る。次にこれらの単語の辞書アドレス
から単語辞書ROM22の記憶内容を検索し、各
単語について辞書情報、すなわち「犬」は「動
物」であり、「高校生」は「人間」であるという
情報を得る。
関連性判定装置20は単語の関連性情報及び辞
書情報を構文解析装置16に送出する。構文解析
装置16では関連性判定装置20からの前記各情
報に基づいて再び構文解析を行う。ここで単語辞
書ROM22からはすでに、「吠えている」とい
う語に関して「この状態は人間よりも動物である
可能性が大きい」という情報が得られている。し
たがつて既に「太郎」が「犬」という「動物」で
あることが判つているので第2図ハに示すよう
に、「彼の犬が吠えている」という意味に一意に
構文解析をすることができる。
書情報を構文解析装置16に送出する。構文解析
装置16では関連性判定装置20からの前記各情
報に基づいて再び構文解析を行う。ここで単語辞
書ROM22からはすでに、「吠えている」とい
う語に関して「この状態は人間よりも動物である
可能性が大きい」という情報が得られている。し
たがつて既に「太郎」が「犬」という「動物」で
あることが判つているので第2図ハに示すよう
に、「彼の犬が吠えている」という意味に一意に
構文解析をすることができる。
以上に説明したように本実施例では、入力され
た日本語文データ全体に出現する単語の関連性に
ついての情報を抽出し、該情報を参照して構文解
析するように構成したので、より正確に構文解析
を行うことができる。
た日本語文データ全体に出現する単語の関連性に
ついての情報を抽出し、該情報を参照して構文解
析するように構成したので、より正確に構文解析
を行うことができる。
効 果
本発明では入力された文章に現れる単語の構文
上の関連性を自動的に抽出し、この関連性を示す
データを記憶手段に記憶させておき、構文解析時
にこれらのデータを参照するように構成したの
で、構文解析結果の瞬味さを減少させることがで
きる。
上の関連性を自動的に抽出し、この関連性を示す
データを記憶手段に記憶させておき、構文解析時
にこれらのデータを参照するように構成したの
で、構文解析結果の瞬味さを減少させることがで
きる。
第1図は本発明に係る日本語解析装置の一実施
例の構成を示すブロツク図、第2図は、第1図の
実施例における構文解析装置の解析結果を示す説
明図、第3図は、第1図の実施例における関連性
スタツクの記憶内容を示す説明図、第4図は本発
明に係る日本語解析装置の他の実施例の構成を示
すブロツク図、第5図は、第4図の実施例におけ
る関連性表現辞書ROMの記憶内容を示す説明
図、第6図は、第4図の実施例における関連性ス
タツクの記憶内容を示す説明図である。 主要部分の符号の説明、10……キーボード、
12……処理制御装置、14……形態素解析装
置、16……構文解析装置、18……関連性スタ
ツク、20……関連性判定装置、40……関連性
表現辞書ROM、50……関連性抽出装置、11
8……関連性スタツク。
例の構成を示すブロツク図、第2図は、第1図の
実施例における構文解析装置の解析結果を示す説
明図、第3図は、第1図の実施例における関連性
スタツクの記憶内容を示す説明図、第4図は本発
明に係る日本語解析装置の他の実施例の構成を示
すブロツク図、第5図は、第4図の実施例におけ
る関連性表現辞書ROMの記憶内容を示す説明
図、第6図は、第4図の実施例における関連性ス
タツクの記憶内容を示す説明図である。 主要部分の符号の説明、10……キーボード、
12……処理制御装置、14……形態素解析装
置、16……構文解析装置、18……関連性スタ
ツク、20……関連性判定装置、40……関連性
表現辞書ROM、50……関連性抽出装置、11
8……関連性スタツク。
Claims (1)
- 【特許請求の範囲】 1 構文解析すべき日本語文データを入力するた
めの入力手段と、 前記入力手段により入力された日本語文データ
の形態素解析処理を行う形態素解析手段と、 形態素解析手段の解析結果に基づいて構文解析
を行う構文解析手段とを有する日本語解析装置に
おいて、 構文上、関連性を有する語の組及びこれらの組
の関連性等を示すデータを記憶する記憶手段と、 対象語を前記記憶手段の記憶内容を検索して、
該対象語と関連語との関連性を判定し、その判定
結果を前記構文解析手段に送出する関連性判定手
段とを有し、 前記構文解析手段は、構文解析結果に基づいて
文単位に構文上、相互に関連性を有する語の組を
抽出し、前記記憶手段に記憶させるとともに、構
文解析手段の解析結果に瞬昧味さが生じた場合に
前記関連性判定手段の判定結果をもとに瞬昧さを
減少させるようにしたことを特徴とする日本語解
析装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59185392A JPS6165358A (ja) | 1984-09-06 | 1984-09-06 | 日本語解析装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59185392A JPS6165358A (ja) | 1984-09-06 | 1984-09-06 | 日本語解析装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6165358A JPS6165358A (ja) | 1986-04-03 |
| JPH0576658B2 true JPH0576658B2 (ja) | 1993-10-25 |
Family
ID=16170004
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59185392A Granted JPS6165358A (ja) | 1984-09-06 | 1984-09-06 | 日本語解析装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6165358A (ja) |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS567173A (en) * | 1979-06-29 | 1981-01-24 | Sharp Corp | Sentence processor |
| JPS584481A (ja) * | 1981-06-30 | 1983-01-11 | Fujitsu Ltd | 日本語解析システム |
| JPH0656626B2 (ja) * | 1983-04-28 | 1994-07-27 | 日本電気株式会社 | 言語意味解析装置 |
| JPS60157659A (ja) * | 1984-01-27 | 1985-08-17 | Hitachi Ltd | 日本語解析方式 |
-
1984
- 1984-09-06 JP JP59185392A patent/JPS6165358A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6165358A (ja) | 1986-04-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3189186B2 (ja) | パターンに基づく翻訳装置 | |
| US4502128A (en) | Translation between natural languages | |
| JPH03185561A (ja) | 欧文単語入力方法 | |
| JP2815714B2 (ja) | 翻訳装置 | |
| Lamb | The nature of the machine translation problem | |
| JP2828692B2 (ja) | 情報検索装置 | |
| JPH0576658B2 (ja) | ||
| Carter | Lattice-based word identification in CLARE | |
| Moghadam et al. | A Survey of Part of Speech Tagging of Latin and non-Latin Script Languages: A more vivid view on Persian | |
| JP7739706B2 (ja) | 入力支援装置、入力支援システム及びプログラム | |
| JPH0715691B2 (ja) | 自動翻訳装置 | |
| Bar-Hillel | Can Translation be mechanized? | |
| JPS62203266A (ja) | 機械翻訳システム | |
| JP2856736B2 (ja) | 辞書参照装置及び辞書参照方法 | |
| JPS6395573A (ja) | 日本語文形態素解析における未知語処理方法 | |
| JPS61260367A (ja) | 機械翻訳システム | |
| JPH1166068A (ja) | 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体 | |
| JPH0816910B2 (ja) | 言語解析装置 | |
| JPH02110771A (ja) | 電訳機 | |
| JPH05233686A (ja) | 日本語処理装置 | |
| JPH04372047A (ja) | 仮名漢字変換装置 | |
| JPH0683809A (ja) | 文書処理装置 | |
| JPH0580021B2 (ja) | ||
| KR920005023A (ko) | 한글문장의 형태소 분석방식 | |
| JPH0340067A (ja) | 文章検索方式 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| EXPY | Cancellation because of completion of term |