JPS61134877A - 未登録語属性推定装置 - Google Patents
未登録語属性推定装置Info
- Publication number
- JPS61134877A JPS61134877A JP59255803A JP25580384A JPS61134877A JP S61134877 A JPS61134877 A JP S61134877A JP 59255803 A JP59255803 A JP 59255803A JP 25580384 A JP25580384 A JP 25580384A JP S61134877 A JPS61134877 A JP S61134877A
- Authority
- JP
- Japan
- Prior art keywords
- word
- unregistered
- attribute
- attributes
- unregistered word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
技術分野
本発明は1機械翻訳システムやワードプロセッサ等の自
然言語処理システムの日本語解析装置に関し、特に、未
登録語が出現した場合にも構文解析、およびシステムの
処理をを続行するため、未登録語の属性を自動的に推定
する未登録語属性推定装置に関する。
然言語処理システムの日本語解析装置に関し、特に、未
登録語が出現した場合にも構文解析、およびシステムの
処理をを続行するため、未登録語の属性を自動的に推定
する未登録語属性推定装置に関する。
従来技術
機械翻訳システムやワードプロセッサ等の自然言語処理
システムが注目されている。
システムが注目されている。
自然言語処理システムにおいては、日本文の構文を解析
する日本語解析装置が使用されている。
する日本語解析装置が使用されている。
与えられた日本語の構文を解析する場合、一般に、単語
とともにその属性が登録された単語辞書を用いて1日本
語の各単語の属性を求め、これら属性のつながり関係と
文法規則により解析処理が行われている。ところが、一
般的に、文章を構成する可能性のある単語が全て単語辞
書に登録されているとは限らず、しばしば未登録単語が
文章中に現われることが多い。この場合、その単語に対
する属性を決定することができないため、構文解析が不
可能となり、その文章に対する処理を中断せざるを得な
くなる。
とともにその属性が登録された単語辞書を用いて1日本
語の各単語の属性を求め、これら属性のつながり関係と
文法規則により解析処理が行われている。ところが、一
般的に、文章を構成する可能性のある単語が全て単語辞
書に登録されているとは限らず、しばしば未登録単語が
文章中に現われることが多い。この場合、その単語に対
する属性を決定することができないため、構文解析が不
可能となり、その文章に対する処理を中断せざるを得な
くなる。
そこで、未登録語の属性の自動推定方法がいくつか提案
された。すなわち、 ■特開昭58−175074号公報に開示された「構文
分析方式Jのように、属性推定を順次総あたりで行う方
法、 ■特開昭58−175075号公報に開示された[構文
分析方式」のように、構文解析方法により文法規則上推
定する方法、 である。
された。すなわち、 ■特開昭58−175074号公報に開示された「構文
分析方式Jのように、属性推定を順次総あたりで行う方
法、 ■特開昭58−175075号公報に開示された[構文
分析方式」のように、構文解析方法により文法規則上推
定する方法、 である。
しかし、これらの方法は、推定方法が複雑なため、推定
するのに長時間を要するという問題点がある。
するのに長時間を要するという問題点がある。
目 的
本発明の目的は、上記のような従来技術の問題点を解決
するため、迅速に未登録語の属性を推定し得る未登録語
属性推定装置を提供することにある。
するため、迅速に未登録語の属性を推定し得る未登録語
属性推定装置を提供することにある。
構 成
上記目的番達成するため、本発明の構成は、単語辞書に
登録されていない未登録語が出現した場合に、全ての属
性にわたって前記未登録語の属性を推定し得る第1の手
段を備えた自然言語処理システムの未登録語属性推定装
置において、前記未登録語が外来語であるか否かを識別
する第2の手段と、限られた品詞の範囲内で外来語の品
詞を推定する第3の手段とを設け、未登録語である外来
語に対しては、当該節3の手段による推定結果に以下、
本発明の構成を図面を参照して詳細に説明する。
登録されていない未登録語が出現した場合に、全ての属
性にわたって前記未登録語の属性を推定し得る第1の手
段を備えた自然言語処理システムの未登録語属性推定装
置において、前記未登録語が外来語であるか否かを識別
する第2の手段と、限られた品詞の範囲内で外来語の品
詞を推定する第3の手段とを設け、未登録語である外来
語に対しては、当該節3の手段による推定結果に以下、
本発明の構成を図面を参照して詳細に説明する。
第1図は、本発明の一実施例による未登録語属性推定装
置を適用した自然言語処理システムの一部を示すブロッ
ク図である。
置を適用した自然言語処理システムの一部を示すブロッ
ク図である。
第1図において、1は辞書検索装置、2は単語辞書・3
′″1′!1語検出装置・4は本発明0特徴
1である未登録語属性推定装置、5は構文解析装置、6
は文法辞書である。未登録語属性推定装置4は、外来語
識別部4a、属性順次付与部4b、外来語品詞推定部4
c、活用語尾表4dにより構成されている。
′″1′!1語検出装置・4は本発明0特徴
1である未登録語属性推定装置、5は構文解析装置、6
は文法辞書である。未登録語属性推定装置4は、外来語
識別部4a、属性順次付与部4b、外来語品詞推定部4
c、活用語尾表4dにより構成されている。
第1図の自然言語処理システムの動作概略を説明する。
辞書検索装置[1は、入力装置(図示省略)から入力さ
れた日本文に対し、単語辞書2を用いてその単語の属性
(品詞等)を調べることにより形態素解析を行う。
れた日本文に対し、単語辞書2を用いてその単語の属性
(品詞等)を調べることにより形態素解析を行う。
ところで、入力された日本文に対し、その単語が、単語
辞書2に総て登録されているとは限らず、単語辞書2に
登録されていない未登録語が出現することは避けられな
い。未登録語が出現した場合、未登録語の属性が不明で
あるため、以後の処理を実行することができなくなる。
辞書2に総て登録されているとは限らず、単語辞書2に
登録されていない未登録語が出現することは避けられな
い。未登録語が出現した場合、未登録語の属性が不明で
あるため、以後の処理を実行することができなくなる。
そこで、本実施例では、未登録語検出装置3により、形
態素解析された日本文中の全ての単語に属性が付与され
、形態素解析が完全に行われたか否かを調べ、もし完全
に行われており、未登録語が存在しない場合は、そのま
ま構文解析装置f5に転送する。未登録語が検出された
場合は、未登録語属性推定装置4にて未登録語の属性を
推定し、推定した属性を未登録語に付与して構文解析装
置5に送出する(これに4一 ついては、後で詳述する)。構文解析装置5は、形態素
解析された日本文に対し文法辞書6を用いて構文解析を
行う。構文解析された日本文に対して、以後、自然言語
処理システムの目的に応じた処理が施される。例えば1
日−英機械翻訳システムの場合は、さらに、意味解析、
日−英変換(翻訳)処理、英語構文生成、英語形態素生
成等の処理を径で、入力された日本文に対応する英語に
よる翻訳文が得られる。ワードプロセッサの場合は、接
続検定表等を用いて、単語辞書2から抽出された複数の
カナ漢字変換のための変換候補の中から適切な変換候補
を選択し、変換結果とする。
態素解析された日本文中の全ての単語に属性が付与され
、形態素解析が完全に行われたか否かを調べ、もし完全
に行われており、未登録語が存在しない場合は、そのま
ま構文解析装置f5に転送する。未登録語が検出された
場合は、未登録語属性推定装置4にて未登録語の属性を
推定し、推定した属性を未登録語に付与して構文解析装
置5に送出する(これに4一 ついては、後で詳述する)。構文解析装置5は、形態素
解析された日本文に対し文法辞書6を用いて構文解析を
行う。構文解析された日本文に対して、以後、自然言語
処理システムの目的に応じた処理が施される。例えば1
日−英機械翻訳システムの場合は、さらに、意味解析、
日−英変換(翻訳)処理、英語構文生成、英語形態素生
成等の処理を径で、入力された日本文に対応する英語に
よる翻訳文が得られる。ワードプロセッサの場合は、接
続検定表等を用いて、単語辞書2から抽出された複数の
カナ漢字変換のための変換候補の中から適切な変換候補
を選択し、変換結果とする。
以下、第1図、第2図、第3図を用いて未登録語属性推
定袋!3の動作を説明する。
定袋!3の動作を説明する。
第2図は、未登録語属性推定装置4の動作を示すフロー
チャート、第3図は活用語尾表3dの内容を示す図であ
る。
チャート、第3図は活用語尾表3dの内容を示す図であ
る。
未登録語検出袋!3により検出された未登録語は、未登
録語属性推定装置!t4内の外来語識別部4aに送られ
、未登録語が外来語であるか否かが識別される(201
)。なお、外来語であるか否かは、単語のコード体系に
より容易に識別することができる。外来語でない場合は
、属性順次付与部4bに送られ、属性(例えば名詞)が
付与される(202.203)。この属性順次付与部4
bは。
録語属性推定装置!t4内の外来語識別部4aに送られ
、未登録語が外来語であるか否かが識別される(201
)。なお、外来語であるか否かは、単語のコード体系に
より容易に識別することができる。外来語でない場合は
、属性順次付与部4bに送られ、属性(例えば名詞)が
付与される(202.203)。この属性順次付与部4
bは。
全ての属性を付与し得る機構である。次に、付与された
属性のもとで、構文解析装置5により構文解析を行う(
204)。構文解析に成功すれば、その解析結果をスタ
ックする(205.20 F)。スタック後、および構
文解析に失敗した場合は、まだ付与されていない属性が
残っているか否かを調べ、まだ上記属性が残っている時
は、残った属性を付与し、その属性のもとで構文解析を
行う(207,203)。未付与の属性が残っていない
場合は、スタックした解析結果を出力し、構文解析処理
を終了する(20 B)。
属性のもとで、構文解析装置5により構文解析を行う(
204)。構文解析に成功すれば、その解析結果をスタ
ックする(205.20 F)。スタック後、および構
文解析に失敗した場合は、まだ付与されていない属性が
残っているか否かを調べ、まだ上記属性が残っている時
は、残った属性を付与し、その属性のもとで構文解析を
行う(207,203)。未付与の属性が残っていない
場合は、スタックした解析結果を出力し、構文解析処理
を終了する(20 B)。
未登録語が外来語の場合は、外来語品詞推定部4cは、
第3図に示したような活用語足表4dを用いて外来語の
属性(品1ii1)を推定する。外来語の品詞は、名詞
、す変名側、形容動詞の3つがほとんであるので、活用
語足表4dは、これら3つの品詞の活用語尾みを記載し
ている。したがって、この活用語足表4dを使用して外
来語の属性を推定すれば、3つの属性についてのみ検討
すれば良く、属性順次付与部4bによる推定のように1
0数個の属性について検討する必要がないので、推定に
要する時間を短縮することができる。
第3図に示したような活用語足表4dを用いて外来語の
属性(品1ii1)を推定する。外来語の品詞は、名詞
、す変名側、形容動詞の3つがほとんであるので、活用
語足表4dは、これら3つの品詞の活用語尾みを記載し
ている。したがって、この活用語足表4dを使用して外
来語の属性を推定すれば、3つの属性についてのみ検討
すれば良く、属性順次付与部4bによる推定のように1
0数個の属性について検討する必要がないので、推定に
要する時間を短縮することができる。
外来語品詞推定部4cは、まず、外来語の語尾がす行変
格活用語尾であるか否かを検定し、す行変格活用謂尾で
あれば、す変名詞であると推定し、す変名詞という属性
のもとて構文解析装置5により構文解析を行う(209
,210,214)。
格活用語尾であるか否かを検定し、す行変格活用謂尾で
あれば、す変名詞であると推定し、す変名詞という属性
のもとて構文解析装置5により構文解析を行う(209
,210,214)。
す行変格活用語尾でない場合は、さらに形容動詞活用語
尾であるか否かを検定し、形容動詞活用語尾r、fF+
68合″・形容動1iiIF、%6に推定5・形容
1動詞という属性のもとて構文解析装置5によ
り構文解析を行う(211,212,214)、形容動
詞でない場合は、名詞であると推定し、名詞という属性
のもとで構文解析装置5により構文解析を行う(211
,213)。
尾であるか否かを検定し、形容動詞活用語尾r、fF+
68合″・形容動1iiIF、%6に推定5・形容
1動詞という属性のもとて構文解析装置5によ
り構文解析を行う(211,212,214)、形容動
詞でない場合は、名詞であると推定し、名詞という属性
のもとで構文解析装置5により構文解析を行う(211
,213)。
次に、構文解析の成否を検定し、失敗した場合は、属性
順次付与部4bに外来語を転送し、外来語以外の未登録
語に対するのと同様の処理を行う(215,203)。
順次付与部4bに外来語を転送し、外来語以外の未登録
語に対するのと同様の処理を行う(215,203)。
構文解析に成功した場合は。
それで、構文解析処理は終了する。
このように、外来語の品詞は、はとんどの場合、名詞、
す変名詞、形容動詞の3つのいずれかであるという事実
に着目し、未登録語が外来語である場合には、まず、こ
れら3つの品詞(属性)のうちのいずれかであると推定
し、その推定のもとて構)文解析を行い、解析に失敗し
た場合に、初めて付属語順次付与部4bによる未登録語
属性推定処理を行うことにより、未登録語属性推定処理
の迅速化が可能となる。
す変名詞、形容動詞の3つのいずれかであるという事実
に着目し、未登録語が外来語である場合には、まず、こ
れら3つの品詞(属性)のうちのいずれかであると推定
し、その推定のもとて構)文解析を行い、解析に失敗し
た場合に、初めて付属語順次付与部4bによる未登録語
属性推定処理を行うことにより、未登録語属性推定処理
の迅速化が可能となる。
なお、本実施例においては、全ての属性にわたって未登
録語の属性を推定し得る機構として、属性順次付与部4
bを採用したが、属性順次付与部4bの代わりに、構文
解析上の文法上期待される属性を与える属性推定機構等
、他の属性推定機構を採用することも可能である。
録語の属性を推定し得る機構として、属性順次付与部4
bを採用したが、属性順次付与部4bの代わりに、構文
解析上の文法上期待される属性を与える属性推定機構等
、他の属性推定機構を採用することも可能である。
効 果
以上説明したように、本発明の未登録語属性推定装置に
よれば、未登録語属性推定処理を迅速化することが可能
となる。
よれば、未登録語属性推定処理を迅速化することが可能
となる。
第1図は本発明の一実施例による未登録語属性推定装置
を示す図、第2図は第1図の動作を示すフローチャート
、第3図は第1図における活用額尾表の内容を示す図で
ある。 4:未登録語属性推定装置、4a:外来語識別部、4b
;属性順次付与部、4C:外来語品詞推定部、4d:活
用語足表、5:構文解析装置。
を示す図、第2図は第1図の動作を示すフローチャート
、第3図は第1図における活用額尾表の内容を示す図で
ある。 4:未登録語属性推定装置、4a:外来語識別部、4b
;属性順次付与部、4C:外来語品詞推定部、4d:活
用語足表、5:構文解析装置。
Claims (1)
- (1)単語辞書に登録されていない未登録語が出現した
場合に、全ての属性にわたって前記未登録語の属性を推
定し得る第1の手段を備えた自然言語処理システムの未
登録語属性推定装置において、前記未登録語が外来語で
あるか否かを識別する第2の手段と、限られた品詞の範
囲内において外来語の品詞を推定する第3の手段とを設
け、未登録語である外来語に対しては、当該第3の手段
による推定結果に基づいた構文解析が失敗した場合にの
み前記第1の手段により属性を推定するように構成した
ことを特徴とする未登録語属性推定装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59255803A JPS61134877A (ja) | 1984-12-05 | 1984-12-05 | 未登録語属性推定装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59255803A JPS61134877A (ja) | 1984-12-05 | 1984-12-05 | 未登録語属性推定装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS61134877A true JPS61134877A (ja) | 1986-06-21 |
Family
ID=17283848
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59255803A Pending JPS61134877A (ja) | 1984-12-05 | 1984-12-05 | 未登録語属性推定装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS61134877A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01156866A (ja) * | 1987-12-14 | 1989-06-20 | Nippon Telegr & Teleph Corp <Ntt> | 日本文処理方式 |
| JP2008176392A (ja) * | 2007-01-16 | 2008-07-31 | Nec Corp | 新語収集装置、方法およびプログラム |
-
1984
- 1984-12-05 JP JP59255803A patent/JPS61134877A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01156866A (ja) * | 1987-12-14 | 1989-06-20 | Nippon Telegr & Teleph Corp <Ntt> | 日本文処理方式 |
| JP2008176392A (ja) * | 2007-01-16 | 2008-07-31 | Nec Corp | 新語収集装置、方法およびプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| McKeown et al. | Collocations | |
| US6965857B1 (en) | Method and apparatus for deriving information from written text | |
| Drouin | Term extraction using non-technical corpora as a point of leverage | |
| JP3266246B2 (ja) | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 | |
| US5146406A (en) | Computer method for identifying predicate-argument structures in natural language text | |
| US20050171757A1 (en) | Machine translation | |
| EP1349079A1 (en) | Machine translation | |
| WO2003056450A1 (en) | Syntax analysis method and apparatus | |
| Carroll et al. | The automatic acquisition of verb subcategorisations and their impact on the performance of an HPSG parser | |
| CN113822043A (zh) | 事理因果关系抽取方法和系统 | |
| JP2005284723A (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
| Zong et al. | Approach to spoken Chinese paraphrasing based on feature extraction. | |
| JPS61134877A (ja) | 未登録語属性推定装置 | |
| KR100420474B1 (ko) | 부분문틀을 이용한 장문 번역 장치 및 그 방법 | |
| Berger et al. | Applying transfer learning to german metaphor prediction | |
| Komachi et al. | Learning based argument structure analysis of event-nouns in japanese | |
| JP2914988B2 (ja) | 日本語自動翻訳システムにおける日本語名詞複合語翻訳方式 | |
| KR100422809B1 (ko) | 기계 번역을 위한 장문 분할 방법 | |
| JPH0715691B2 (ja) | 自動翻訳装置 | |
| JP2742059B2 (ja) | 翻訳用辞書編集装置 | |
| JPS6368972A (ja) | 未登録語処理方式 | |
| JP3329371B2 (ja) | 機械翻訳用ルール装置、および機械翻訳用ルール生成プログラムを記録した記録媒体 | |
| Murthy | Parsing Telugu in the UCSG formalism | |
| JP2595043B2 (ja) | 日本文誤り自動検定装置 | |
| Srinivas et al. | Exploiting supertag representation for fast coreference resolution |