JPS6286429A - 自然言語処理方式 - Google Patents
自然言語処理方式Info
- Publication number
- JPS6286429A JPS6286429A JP60226075A JP22607585A JPS6286429A JP S6286429 A JPS6286429 A JP S6286429A JP 60226075 A JP60226075 A JP 60226075A JP 22607585 A JP22607585 A JP 22607585A JP S6286429 A JPS6286429 A JP S6286429A
- Authority
- JP
- Japan
- Prior art keywords
- verb
- word
- world model
- case
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野〕
本発明は自然言語処理方式、特にデータベース検索に自
然言語を用い、コマンドは内部的に発生させる際、入力
文の解析時に必要な動詞の格処理方式に関する。
然言語を用い、コマンドは内部的に発生させる際、入力
文の解析時に必要な動詞の格処理方式に関する。
データベースの検索は、データベース名、当該データベ
ースで採用している大分類、小分類の名前などを指定す
るコマンドを入力して行なうが、この方式では、検索者
はデータベースの構成を熟知していて所要のコマンドを
作成可能でなければならず、対象が限定される。入力文
は自然言語とし、システムでこれを解析してコマンド生
成、データベース検索を行なえるようにすれば、検索は
非常に容易になる。
ースで採用している大分類、小分類の名前などを指定す
るコマンドを入力して行なうが、この方式では、検索者
はデータベースの構成を熟知していて所要のコマンドを
作成可能でなければならず、対象が限定される。入力文
は自然言語とし、システムでこれを解析してコマンド生
成、データベース検索を行なえるようにすれば、検索は
非常に容易になる。
自然言語でのデータベース検索時の入力文は例えば、富
士屋が200円で6月17日に200本販売した商品は
?というものである。か\る入力文があるとシステムは
単語辞書を用いて形態素解析し、また世界モデルを用い
て構文・意味解析、文脈処理し、コマンドを生成する。
士屋が200円で6月17日に200本販売した商品は
?というものである。か\る入力文があるとシステムは
単語辞書を用いて形態素解析し、また世界モデルを用い
て構文・意味解析、文脈処理し、コマンドを生成する。
世界モデルとは本システムで使用する特定の単語に対す
る各種単語の属性関係を記述したものであり、構文・意
味解析、文脈処理に有効である。単語辞書には各種単語
、各単語の対応クラス、単語が動詞であれば該動詞に結
び付く単語とその助詞(格情報)などが収録されている
。
る各種単語の属性関係を記述したものであり、構文・意
味解析、文脈処理に有効である。単語辞書には各種単語
、各単語の対応クラス、単語が動詞であれば該動詞に結
び付く単語とその助詞(格情報)などが収録されている
。
単語辞書には動詞の格情報も記述されているから動詞の
格処理(動詞とそれを修飾する名詞節を1つの動詞節と
する処理)に当っては単語辞書を参照すればよいが、こ
れには動詞の全ての格情報を辞書中に記述して置かねば
ならず、記述もれがあると解析不能になることも有り得
る。
格処理(動詞とそれを修飾する名詞節を1つの動詞節と
する処理)に当っては単語辞書を参照すればよいが、こ
れには動詞の全ての格情報を辞書中に記述して置かねば
ならず、記述もれがあると解析不能になることも有り得
る。
ところで世界モデルは単語の属性関係を示しているので
、有力な格情報源になる。そこで本発明は動詞の格処理
に世界モデルも利用し、世界モデルの属性情報を動詞の
格情報の省略値に用いようとするものである。
、有力な格情報源になる。そこで本発明は動詞の格処理
に世界モデルも利用し、世界モデルの属性情報を動詞の
格情報の省略値に用いようとするものである。
本発明は、各種単語と各単語の対応クラス名及び単語が
動詞であれば該動詞に結び付く単語とその助詞を記述し
た単語辞書、および特定の単語と該単語に結び付く各種
単語を纏めた世界モデルを用いて、入力された自然言語
を解析木に処理する方式において、動詞とそれを修飾す
る名詞節を1つの動詞節にする格処理に際し、前記単語
辞書中に記述された格以外に、前記世界モデルの属性関
係を調べてその属性関係を当該動詞が取り得る格と見做
す手段を有することを特徴とするものである。
動詞であれば該動詞に結び付く単語とその助詞を記述し
た単語辞書、および特定の単語と該単語に結び付く各種
単語を纏めた世界モデルを用いて、入力された自然言語
を解析木に処理する方式において、動詞とそれを修飾す
る名詞節を1つの動詞節にする格処理に際し、前記単語
辞書中に記述された格以外に、前記世界モデルの属性関
係を調べてその属性関係を当該動詞が取り得る格と見做
す手段を有することを特徴とするものである。
世界モデルの属性情報を動詞格処理に用いれば、単語辞
書の格情報が不充分であっても又は正確に記述されてい
なくても動詞の係り受けが判定でき、自然言語の処理に
甚だ有効である。
書の格情報が不充分であっても又は正確に記述されてい
なくても動詞の係り受けが判定でき、自然言語の処理に
甚だ有効である。
図面を参照しながら説明すると、第1図はシステム全体
の概要を示し、1は端末装置でCRTディスプレイla
、キーボードIb、フロッピーディスクICを備える。
の概要を示し、1は端末装置でCRTディスプレイla
、キーボードIb、フロッピーディスクICを備える。
11は単語辞書、13は世界モデル、15はデータベー
スである。2はインタラクク、3は形態素解析、4は構
文・意味解析、5は文脈処理、6は言替生成、7はコン
ド生成、8はデータ検索、9は応答生成で、この部分は
ソフトウェアである。また10は単語辞書11、世界モ
デル13、およびモデリングシステム12のエディタ、
14はデータベース管理システムである。モデリングシ
ステム12はシステム定義のクラス、インチ−ジャなど
を持ち、ユーザ定義のデータベースはこの下にある。
スである。2はインタラクク、3は形態素解析、4は構
文・意味解析、5は文脈処理、6は言替生成、7はコン
ド生成、8はデータ検索、9は応答生成で、この部分は
ソフトウェアである。また10は単語辞書11、世界モ
デル13、およびモデリングシステム12のエディタ、
14はデータベース管理システムである。モデリングシ
ステム12はシステム定義のクラス、インチ−ジャなど
を持ち、ユーザ定義のデータベースはこの下にある。
単語辞書11には第2図に示すように、販売する、商品
、などの単語とそのモデル情報、即ち単語「販売する」
の対応クラスは「販売」であること、付く単語は数量、
販売店、および商品で、数量は助詞なしくn1l)、販
売店の助詞は[販売店が、又は販売店は」と「が」又は
「は」であり、「商品」の助詞は「商品を」と「を」で
あること、また単語「商品」に対してはその対応クラス
は「商品」であること等が収録されている。なお(販売
店かは)などの格情報の記述の仕方には、直接書く、記
号にカテゴライズして書くなど各種の方法がある。「販
売」の世界モデルは第3図に示す如くで、「販売」に対
して「200円で販売」など「販売単価」が、また「富
士層が販売した」など「販売店」が、また「シャープペ
ンを販売した」など「商品」が、また「6月17日に販
売した」など「販売日付」が結び付くことを示している
。
、などの単語とそのモデル情報、即ち単語「販売する」
の対応クラスは「販売」であること、付く単語は数量、
販売店、および商品で、数量は助詞なしくn1l)、販
売店の助詞は[販売店が、又は販売店は」と「が」又は
「は」であり、「商品」の助詞は「商品を」と「を」で
あること、また単語「商品」に対してはその対応クラス
は「商品」であること等が収録されている。なお(販売
店かは)などの格情報の記述の仕方には、直接書く、記
号にカテゴライズして書くなど各種の方法がある。「販
売」の世界モデルは第3図に示す如くで、「販売」に対
して「200円で販売」など「販売単価」が、また「富
士層が販売した」など「販売店」が、また「シャープペ
ンを販売した」など「商品」が、また「6月17日に販
売した」など「販売日付」が結び付くことを示している
。
これらの販売店、販売単価、・・・・・・はインスタン
スという。
スという。
今、端末キーボードを操作して「富士層が200円で6
月17日に200本販売した商品は?」と入力されたと
すると、形態素解析では単語辞書を参照しながら入力文
を単語に分解し、各単語に次の如くモデル情報を付ける
。
月17日に200本販売した商品は?」と入力されたと
すると、形態素解析では単語辞書を参照しながら入力文
を単語に分解し、各単語に次の如くモデル情報を付ける
。
富士層 が 200円 で 6月17日 に(販売店)
(価格) (日付)200本 販売した
商品は ? (数量) (販売) (商品) 構文・意味解析では文節統合を行ない、単語化した入力
文を文節にまとめる。
(価格) (日付)200本 販売した
商品は ? (数量) (販売) (商品) 構文・意味解析では文節統合を行ない、単語化した入力
文を文節にまとめる。
次に係り受は解析(解析木生成処理)を行なう。
第4図はその要領を示す。先ず、辞書中に動詞の格情報
の記述があるか否かヂエソクし、有ればそれと入力文の
それを比較し、一致すればそれで係り受は処理を行なう
(解析木を作る)。辞書中に動詞の格情報の記述がない
とき、またはそれがあっても入力文の助詞情報と一致し
ないときは当該動詞の世界モデルを参照し、該モデルで
他の単語との結び付きをチェックする。該当するものが
あればそれで解析木を作り、なければ係り受は不可とす
る。解析木作成は構文意味解析で行ない、前の入力文を
考慮してのそれは文脈処理で行なう。
の記述があるか否かヂエソクし、有ればそれと入力文の
それを比較し、一致すればそれで係り受は処理を行なう
(解析木を作る)。辞書中に動詞の格情報の記述がない
とき、またはそれがあっても入力文の助詞情報と一致し
ないときは当該動詞の世界モデルを参照し、該モデルで
他の単語との結び付きをチェックする。該当するものが
あればそれで解析木を作り、なければ係り受は不可とす
る。解析木作成は構文意味解析で行ない、前の入力文を
考慮してのそれは文脈処理で行なう。
第5図は動詞節処理され、解析木が作られた状態を示す
。入力文「富士層が200円で6月17日に200本販
売した商品は?」が入ると単語辞書を参照しての形態素
解析で点線で示すように区切られ、辞書で得られたモデ
ル情報、及び世界モデルを参照して得られたモデル情報
により、構文意味解析及び文脈処理で図示のようにトリ
ーが作られ、相互の関連をはっきりさせる。この図で「
モ」としたのは、単語「200円で」及び「200本」
はモデル情報が辞書にはなかったので「販売」の世界モ
デルで関連を求めたことを示す。サブモデルとは、世界
モデルに特定の単語を入れたものであり、第2図の販売
に「販売した」、販売店に「富士層が」、販売単価に「
200円で」、販売日付に「6月17日に」、そして販
売数量に「200本」を挿入すると第5図の最初のサブ
モデルになる。このような解析木作成過程で処理が行き
詰まると言替を行ない、言替えた単語をディスプレイに
表示し、これでもよいか否か検索者に尋ねる。OKの入
力があるとそれにより処理を進める。これが言替生成の
ルーチンである。
。入力文「富士層が200円で6月17日に200本販
売した商品は?」が入ると単語辞書を参照しての形態素
解析で点線で示すように区切られ、辞書で得られたモデ
ル情報、及び世界モデルを参照して得られたモデル情報
により、構文意味解析及び文脈処理で図示のようにトリ
ーが作られ、相互の関連をはっきりさせる。この図で「
モ」としたのは、単語「200円で」及び「200本」
はモデル情報が辞書にはなかったので「販売」の世界モ
デルで関連を求めたことを示す。サブモデルとは、世界
モデルに特定の単語を入れたものであり、第2図の販売
に「販売した」、販売店に「富士層が」、販売単価に「
200円で」、販売日付に「6月17日に」、そして販
売数量に「200本」を挿入すると第5図の最初のサブ
モデルになる。このような解析木作成過程で処理が行き
詰まると言替を行ない、言替えた単語をディスプレイに
表示し、これでもよいか否か検索者に尋ねる。OKの入
力があるとそれにより処理を進める。これが言替生成の
ルーチンである。
このようにして解析木が作られると次はコマンド生成に
入る。データベースには次のような商品テーブル及び販
売テーブルがあるとすると、商品テーブル 販売テーブル 生成されるコマンドは次の如くなる。
入る。データベースには次のような商品テーブル及び販
売テーブルがあるとすると、商品テーブル 販売テーブル 生成されるコマンドは次の如くなる。
get 商品名
f rom 商品テーブル
1vhere 商品テーブル、価格−200〃、商品
名−販売テーブル、商品名 販売テーブル、販売店−富士層 〃 01寸−6月17日 〃 販売量=200 解析木はデータベースの構成に対応しており、第5図の
如き解析木が得られたらこれより上記のコマンドを作成
することが可能である。コマンドが得られたらそれでテ
ーブルを検索し、求める商品名が得られると、それをデ
ィスプレイに表示する。
名−販売テーブル、商品名 販売テーブル、販売店−富士層 〃 01寸−6月17日 〃 販売量=200 解析木はデータベースの構成に対応しており、第5図の
如き解析木が得られたらこれより上記のコマンドを作成
することが可能である。コマンドが得られたらそれでテ
ーブルを検索し、求める商品名が得られると、それをデ
ィスプレイに表示する。
以上説明したように本発明によれば、世界モデルの属性
関係を使用して動詞の格処理を進めるので、単語辞書中
に記述もれがあってもそれをカバーでき、また単語辞書
中に厳密に格情報を記述する必要がないという利点が得
られる。例えば第2図の単語辞書では単語「販売する」
には数量ni!、販売店かは、商品を、の3種の格情報
しかないので、×月×日に(販売)に対しては格情報が
得られないが、これは販売の世界モデルを調べることに
より属性情報が得られる。勿論世界モデルを参照しても
助詞そのものは得られず、この点は不明のま−であるが
、属性関係が分れば、これで解析木の作成は可能である
。また入力文には「販売店の販売する」など、単語辞書
にはない助詞(この場合は「の」)が含まれることがあ
るが、この場合も世界モデルを見て属性関係を知り、そ
れで処理することができる。
関係を使用して動詞の格処理を進めるので、単語辞書中
に記述もれがあってもそれをカバーでき、また単語辞書
中に厳密に格情報を記述する必要がないという利点が得
られる。例えば第2図の単語辞書では単語「販売する」
には数量ni!、販売店かは、商品を、の3種の格情報
しかないので、×月×日に(販売)に対しては格情報が
得られないが、これは販売の世界モデルを調べることに
より属性情報が得られる。勿論世界モデルを参照しても
助詞そのものは得られず、この点は不明のま−であるが
、属性関係が分れば、これで解析木の作成は可能である
。また入力文には「販売店の販売する」など、単語辞書
にはない助詞(この場合は「の」)が含まれることがあ
るが、この場合も世界モデルを見て属性関係を知り、そ
れで処理することができる。
なお第4図のアルゴリズムで、係り受は可能の基準を変
更することにより色々なアプリケーションで本発明は適
用可能である。またデータベース更新の入力文では、こ
れは厳密な意味解釈を必要とするから助詞の間違いは認
めない。即ち、世界モデルを使用しての動詞格処理は行
なわず、単語辞書の格情報と一致した文節のみ係り受は
可能とする。
更することにより色々なアプリケーションで本発明は適
用可能である。またデータベース更新の入力文では、こ
れは厳密な意味解釈を必要とするから助詞の間違いは認
めない。即ち、世界モデルを使用しての動詞格処理は行
なわず、単語辞書の格情報と一致した文節のみ係り受は
可能とする。
第1図は本発明の実施例を示すブロック図、第2図は単
語辞書の説明図、第3図は世界モデルの説明図、第4図
は係り受は処理の説明図、第5図は解析木の説明図であ
る。
語辞書の説明図、第3図は世界モデルの説明図、第4図
は係り受は処理の説明図、第5図は解析木の説明図であ
る。
Claims (1)
- 【特許請求の範囲】 各種単語と各単語の対応クラス名及び単語が動詞であれ
ば該動詞に結び付く単語とその助詞を記述した単語辞書
、および特定の単語と該単語に結び付く各種単語を纏め
た世界モデルを用いて、入力された自然言語を解析木に
処理する方式において、 動詞とそれを修飾する名詞節を1つの動詞節にする格処
理に際し、前記単語辞書中に記述された格以外に、前記
世界モデルの属性関係を調べてその属性関係を当該動詞
が取り得る格と見做す手段を有することを特徴とする自
然言語処理方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60226075A JPH0743716B2 (ja) | 1985-10-11 | 1985-10-11 | 自然言語処理方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60226075A JPH0743716B2 (ja) | 1985-10-11 | 1985-10-11 | 自然言語処理方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6286429A true JPS6286429A (ja) | 1987-04-20 |
| JPH0743716B2 JPH0743716B2 (ja) | 1995-05-15 |
Family
ID=16839420
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60226075A Expired - Lifetime JPH0743716B2 (ja) | 1985-10-11 | 1985-10-11 | 自然言語処理方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0743716B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0446397A (ja) * | 1990-06-14 | 1992-02-17 | Nec Corp | 連続音声認識方式 |
| JPH07200607A (ja) * | 1993-12-28 | 1995-08-04 | Nec Corp | データベース検索式生成装置 |
-
1985
- 1985-10-11 JP JP60226075A patent/JPH0743716B2/ja not_active Expired - Lifetime
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0446397A (ja) * | 1990-06-14 | 1992-02-17 | Nec Corp | 連続音声認識方式 |
| JPH07200607A (ja) * | 1993-12-28 | 1995-08-04 | Nec Corp | データベース検索式生成装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0743716B2 (ja) | 1995-05-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Vasiliev | Natural language processing with Python and spaCy: A practical introduction | |
| Roche et al. | Finite-state language processing | |
| AU753108B2 (en) | Data input and retrieval apparatus | |
| US6745161B1 (en) | System and method for incorporating concept-based retrieval within boolean search engines | |
| EP0907923B1 (en) | Method and system for computing semantic logical forms from syntax trees | |
| Padró et al. | FreeLing 3.0: Towards wider multilinguality. | |
| JP3009215B2 (ja) | 自然語処理方法および自然語処理システム | |
| Baptist et al. | GENESIS-II: a versatile system for language generation in conversational system applications. | |
| Cuteri et al. | A logic-based question answering system for cultural heritage | |
| Krivochen | Mixed computation: Grammar up and down the Chomsky hierarchy | |
| JPH11272710A (ja) | 情報検索システム、情報検索方法および記録媒体 | |
| Passarotti | Leaving behind the less-resourced status. The case of Latin through the experience of the Index Thomisticus Treebank | |
| JPS6286429A (ja) | 自然言語処理方式 | |
| Houndji et al. | Umldesigner: An automatic uml diagram design tool | |
| Sawant et al. | AI Model to Generate SQL Queries from Natural Language Instructions through Voice | |
| Uszkoreit | Language technology a first overview | |
| Naeem et al. | Generating OLAP queries from natural language specification | |
| Kharitonov et al. | Extraction of morphological features of technical systems from russian patent | |
| Karpa et al. | Researching Etiquette Figures of Hercule Poirot's Character Using Javascript Libraries React and Node. Js | |
| Smrž et al. | Learning to use the prague arabic dependency Treebank | |
| Kang et al. | Automatic Extraction of Base Noun Phrases from Law Corpus by Stanza | |
| Azubuike et al. | Design and implementation of an automated web-based Igbo text analyzer using natural language processing (NLP) tools | |
| Yousof et al. | An Intelligent NLP-Based Framework for Digital Scripts Concordance and Semantic Exploration | |
| Muthusamy | Processing the Textual Information Using Open Natural Language Processing | |
| JPH04137073A (ja) | 設計図面作成装置 |