JPS61134877A

JPS61134877A - 未登録語属性推定装置

Info

Publication number: JPS61134877A
Application number: JP59255803A
Authority: JP
Inventors: Takanori Yano; 隆則矢野
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1984-12-05
Filing date: 1984-12-05
Publication date: 1986-06-21

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】技術分野本発明は１機械翻訳システムやワードプロセッサ等の自
然言語処理システムの日本語解析装置に関し、特に、未
登録語が出現した場合にも構文解析、およびシステムの
処理をを続行するため、未登録語の属性を自動的に推定
する未登録語属性推定装置に関する。

従来技術機械翻訳システムやワードプロセッサ等の自然言語処理
システムが注目されている。

自然言語処理システムにおいては、日本文の構文を解析
する日本語解析装置が使用されている。

与えられた日本語の構文を解析する場合、一般に、単語
とともにその属性が登録された単語辞書を用いて１日本
語の各単語の属性を求め、これら属性のつながり関係と
文法規則により解析処理が行われている。ところが、一
般的に、文章を構成する可能性のある単語が全て単語辞
書に登録されているとは限らず、しばしば未登録単語が
文章中に現われることが多い。この場合、その単語に対
する属性を決定することができないため、構文解析が不
可能となり、その文章に対する処理を中断せざるを得な
くなる。

そこで、未登録語の属性の自動推定方法がいくつか提案
された。すなわち、 ■特開昭５８−１７５０７４号公報に開示された「構文
分析方式Ｊのように、属性推定を順次総あたりで行う方
法、 ■特開昭５８−１７５０７５号公報に開示された［構文
分析方式」のように、構文解析方法により文法規則上推
定する方法、である。

しかし、これらの方法は、推定方法が複雑なため、推定
するのに長時間を要するという問題点がある。

目　　　　　的本発明の目的は、上記のような従来技術の問題点を解決
するため、迅速に未登録語の属性を推定し得る未登録語
属性推定装置を提供することにある。

構　　　成上記目的番達成するため、本発明の構成は、単語辞書に
登録されていない未登録語が出現した場合に、全ての属
性にわたって前記未登録語の属性を推定し得る第１の手
段を備えた自然言語処理システムの未登録語属性推定装
置において、前記未登録語が外来語であるか否かを識別
する第２の手段と、限られた品詞の範囲内で外来語の品
詞を推定する第３の手段とを設け、未登録語である外来
語に対しては、当該節３の手段による推定結果に以下、
本発明の構成を図面を参照して詳細に説明する。

第１図は、本発明の一実施例による未登録語属性推定装
置を適用した自然言語処理システムの一部を示すブロッ
ク図である。

第１図において、１は辞書検索装置、２は単語辞書・３
′″１′！１語検出装置・４は本発明０特徴　　　　　
１である未登録語属性推定装置、５は構文解析装置、６
は文法辞書である。未登録語属性推定装置４は、外来語
識別部４ａ、属性順次付与部４ｂ、外来語品詞推定部４
ｃ、活用語尾表４ｄにより構成されている。

第１図の自然言語処理システムの動作概略を説明する。

辞書検索装置［１は、入力装置（図示省略）から入力さ
れた日本文に対し、単語辞書２を用いてその単語の属性
（品詞等）を調べることにより形態素解析を行う。

ところで、入力された日本文に対し、その単語が、単語
辞書２に総て登録されているとは限らず、単語辞書２に
登録されていない未登録語が出現することは避けられな
い。未登録語が出現した場合、未登録語の属性が不明で
あるため、以後の処理を実行することができなくなる。

そこで、本実施例では、未登録語検出装置３により、形
態素解析された日本文中の全ての単語に属性が付与され
、形態素解析が完全に行われたか否かを調べ、もし完全
に行われており、未登録語が存在しない場合は、そのま
ま構文解析装置ｆ５に転送する。未登録語が検出された
場合は、未登録語属性推定装置４にて未登録語の属性を
推定し、推定した属性を未登録語に付与して構文解析装
置５に送出する（これに４一ついては、後で詳述する）。構文解析装置５は、形態素
解析された日本文に対し文法辞書６を用いて構文解析を
行う。構文解析された日本文に対して、以後、自然言語
処理システムの目的に応じた処理が施される。例えば１
日−英機械翻訳システムの場合は、さらに、意味解析、
日−英変換（翻訳）処理、英語構文生成、英語形態素生
成等の処理を径で、入力された日本文に対応する英語に
よる翻訳文が得られる。ワードプロセッサの場合は、接
続検定表等を用いて、単語辞書２から抽出された複数の
カナ漢字変換のための変換候補の中から適切な変換候補
を選択し、変換結果とする。

以下、第１図、第２図、第３図を用いて未登録語属性推
定袋！３の動作を説明する。

第２図は、未登録語属性推定装置４の動作を示すフロー
チャート、第３図は活用語尾表３ｄの内容を示す図であ
る。

未登録語検出袋！３により検出された未登録語は、未登
録語属性推定装置！ｔ４内の外来語識別部４ａに送られ
、未登録語が外来語であるか否かが識別される（２０１
）。なお、外来語であるか否かは、単語のコード体系に
より容易に識別することができる。外来語でない場合は
、属性順次付与部４ｂに送られ、属性（例えば名詞）が
付与される（２０２．２０３）。この属性順次付与部４
ｂは。

全ての属性を付与し得る機構である。次に、付与された
属性のもとで、構文解析装置５により構文解析を行う（
２０４）。構文解析に成功すれば、その解析結果をスタ
ックする（２０５．２０　Ｆ）。スタック後、および構
文解析に失敗した場合は、まだ付与されていない属性が
残っているか否かを調べ、まだ上記属性が残っている時
は、残った属性を付与し、その属性のもとで構文解析を
行う（２０７，２０３）。未付与の属性が残っていない
場合は、スタックした解析結果を出力し、構文解析処理
を終了する（２０　Ｂ）。

未登録語が外来語の場合は、外来語品詞推定部４ｃは、
第３図に示したような活用語足表４ｄを用いて外来語の
属性（品１ｉｉ１）を推定する。外来語の品詞は、名詞
、す変名側、形容動詞の３つがほとんであるので、活用
語足表４ｄは、これら３つの品詞の活用語尾みを記載し
ている。したがって、この活用語足表４ｄを使用して外
来語の属性を推定すれば、３つの属性についてのみ検討
すれば良く、属性順次付与部４ｂによる推定のように１
０数個の属性について検討する必要がないので、推定に
要する時間を短縮することができる。

外来語品詞推定部４ｃは、まず、外来語の語尾がす行変
格活用語尾であるか否かを検定し、す行変格活用謂尾で
あれば、す変名詞であると推定し、す変名詞という属性
のもとて構文解析装置５により構文解析を行う（２０９
，２１０，２１４）。

す行変格活用語尾でない場合は、さらに形容動詞活用語
尾であるか否かを検定し、形容動詞活用語尾ｒ、ｆＦ＋
６８合″・形容動１ｉｉＩＦ、％６に推定５・形容　　
　　　　１動詞という属性のもとて構文解析装置５によ
り構文解析を行う（２１１，２１２，２１４）、形容動
詞でない場合は、名詞であると推定し、名詞という属性
のもとで構文解析装置５により構文解析を行う（２１１
，２１３）。

次に、構文解析の成否を検定し、失敗した場合は、属性
順次付与部４ｂに外来語を転送し、外来語以外の未登録
語に対するのと同様の処理を行う（２１５，２０３）。

構文解析に成功した場合は。

それで、構文解析処理は終了する。

このように、外来語の品詞は、はとんどの場合、名詞、
す変名詞、形容動詞の３つのいずれかであるという事実
に着目し、未登録語が外来語である場合には、まず、こ
れら３つの品詞（属性）のうちのいずれかであると推定
し、その推定のもとて構）文解析を行い、解析に失敗し
た場合に、初めて付属語順次付与部４ｂによる未登録語
属性推定処理を行うことにより、未登録語属性推定処理
の迅速化が可能となる。

なお、本実施例においては、全ての属性にわたって未登
録語の属性を推定し得る機構として、属性順次付与部４
ｂを採用したが、属性順次付与部４ｂの代わりに、構文
解析上の文法上期待される属性を与える属性推定機構等
、他の属性推定機構を採用することも可能である。

効　　　果以上説明したように、本発明の未登録語属性推定装置に
よれば、未登録語属性推定処理を迅速化することが可能
となる。

【図面の簡単な説明】

第１図は本発明の一実施例による未登録語属性推定装置
を示す図、第２図は第１図の動作を示すフローチャート
、第３図は第１図における活用額尾表の内容を示す図で
ある。４：未登録語属性推定装置、４ａ：外来語識別部、４ｂ
；属性順次付与部、４Ｃ：外来語品詞推定部、４ｄ：活
用語足表、５：構文解析装置。

Claims

【特許請求の範囲】

（１）単語辞書に登録されていない未登録語が出現した
場合に、全ての属性にわたって前記未登録語の属性を推
定し得る第１の手段を備えた自然言語処理システムの未
登録語属性推定装置において、前記未登録語が外来語で
あるか否かを識別する第２の手段と、限られた品詞の範
囲内において外来語の品詞を推定する第３の手段とを設
け、未登録語である外来語に対しては、当該第３の手段
による推定結果に基づいた構文解析が失敗した場合にの
み前記第１の手段により属性を推定するように構成した
ことを特徴とする未登録語属性推定装置。