JPH0258166A - Knowledge search method - Google Patents
Knowledge search methodInfo
- Publication number
- JPH0258166A JPH0258166A JP63208328A JP20832888A JPH0258166A JP H0258166 A JPH0258166 A JP H0258166A JP 63208328 A JP63208328 A JP 63208328A JP 20832888 A JP20832888 A JP 20832888A JP H0258166 A JPH0258166 A JP H0258166A
- Authority
- JP
- Japan
- Prior art keywords
- knowledge
- data
- semantic
- structure data
- semantic structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Devices For Executing Special Programs (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は知識データの検索方法、特に知識データの意味
内容に関して知識データを検索する装置に関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a method for searching knowledge data, and particularly to an apparatus for searching knowledge data regarding the semantic content of the knowledge data.
従来、文献等に関する情報検索システムにおいては、検
索手段として文書等に含まれるキーワードないしその論
理的組み合わせ(AND、○■く等)が用いられていた
。しかし、この方法では、キーワード間の意味的関係に
関する情報が検索キーに反映されていないので曖昧さが
残り、検索結果にノイズが含まれることが多かった。Conventionally, in information retrieval systems related to documents, etc., keywords included in documents, etc., or logical combinations thereof (AND, ○■, etc.) have been used as search means. However, with this method, information about the semantic relationship between keywords is not reflected in the search key, so ambiguity remains, and search results often contain noise.
たとえば、ニュース記事に関する情報検索においては、
「米国が日本に要求した貿易自由化対策の内容は?」と
いう質問文に対するキーワードは、「米国」 「日本」
「貿易自由化政策」などとなるが、これは「日本が米
国に要求した貿易自由化政策の内容は?」という質問文
の場合と区別がつがない。For example, when searching for information about news articles,
The keywords for the question “What are the trade liberalization measures that the United States has requested from Japan?” are “United States” and “Japan.”
"Trade liberalization policy" is used, but this is indistinguishable from the question "What is the content of the trade liberalization policy that Japan has requested from the United States?"
またたとえば、LISPなどのプログラミングR語のオ
ンラインマニュアルの内容検索におい′C1「文字を対
応する数字コードに変える関数は?」という質問文は、
「数字コードを対応する文字に変える関数は?Jという
質問文と区別がつがない。For example, in a content search for an online manual for programming R language such as LISP, the question 'C1: ``What is the function that converts a character into its corresponding numeric code?''
``What is the function that changes a numeric code to the corresponding letter?'' It is indistinguishable from the question 'J'.
キーワードを利用する情報検索ではさらに、キーワード
のミスマツチによる検索ちれという問題がある。情報検
索システムのデータベースの各知識データに付与されて
いるキーワードと、ユーザが検索時に思いつくキーワー
ドのずれによるミスマツチである。これを防ぐために、
知識データに付与可能なキーワードを制限するというこ
とが行なわれているが、こうすると検索の都度、ユーザ
は自分が検索したい情報に関連するキーワードを調べな
くてはならず負担になる。An additional problem with information retrieval using keywords is that keywords may be mismatched, leading to incomplete searches. This is a mismatch caused by a discrepancy between the keywords assigned to each piece of knowledge data in the database of the information retrieval system and the keywords that the user comes up with when searching. To prevent this,
Although keywords that can be assigned to knowledge data are restricted, this creates a burden on users who have to search for keywords related to the information they want to search for each time they perform a search.
以上の問題に対し、自然盾語を利用して問題点を解消し
ようとすることが試みられている。Attempts have been made to solve the above problems by using natural shield words.
例えば、情報処理学会自然−゛語処理研究会資料58−
8 (杉山他「自然゛i°語理解に基づく情報検索シス
テムIRISJ 、1986年11月22日)では、日
本語等の自然i゛語による質問文を受けつけて、質問文
に含まれるキーワードおよびその間の関係情報を用いて
検索を行なう方法が論じられている。For example, Information Processing Society of Japan Natural Language Processing Research Group Materials 58-
8 (Sugiyama et al., "Information Retrieval System IRISJ Based on Natural Language Understanding," November 22, 1986) accepts question sentences in natural i language such as Japanese, and searches for keywords contained in the question sentences and the keywords between them. A method of searching using relational information is discussed.
このシステムにおいては、以下に述べる手順によって知
識データの検索が行なわれている。In this system, knowledge data is searched by the procedure described below.
まず、入力質問文をいわゆる自然i語の解析技術を用い
て解析しく形態素解析および構文意味解析)、質問文の
意味構造を抽出する。次にこの意味構造から質問文の概
念的キーワードとその論理結合である検索式(and
とOrによる論理式)を生成する。この概念的キーワー
ドの検索式によって従来型のキーワードによる情報検索
システムのテキストデータ9検索を行ない、検索式に対
応する!、歪、
テキストデータを得る。この段階では、質問文が自然盲
語文になったことにより検索式を作成する手間がなくな
ってユーザの負担が減ったということ以外、従来の情報
検索システムと変わりがない。First, an input question sentence is analyzed using a so-called natural i-word analysis technique (morphological analysis and syntactic-semantic analysis) to extract the semantic structure of the question sentence. Next, from this semantic structure, the conceptual keywords of the question and the search expression (and
and Or) is generated. Using this conceptual keyword search formula, the text data 9 of the information retrieval system using conventional keywords is searched and corresponds to the search formula! , distortion, obtain text data. At this stage, there is no difference from conventional information retrieval systems, except that the burden on the user is reduced because the question text becomes natural blind text, eliminating the need to create a search formula.
しかし、この後、得られたテキストデータをさらに自然
i語解析し、テキストデータに対応する意味構造を作成
する。そして、先はどの質問文の意味構造とこのテキス
トデータの意味構造との照合を行なうことによって、質
問文が要求している内容の曖昧性の少ない検索結果を得
ている。However, after this, the obtained text data is further subjected to natural i-word analysis to create a semantic structure corresponding to the text data. Then, by comparing the semantic structure of which question text with the semantic structure of this text data, a search result with less ambiguity of the content requested by the question text is obtained.
上記従来システムにおいては、−旦キーワードによる検
索式を生成し、これを用いて情報検索システムにアクセ
スしているが、これは必要不可欠な処理内容ではない。In the conventional system described above, a search formula using keywords is first generated and used to access the information retrieval system, but this is not an essential process.
まず、キーワード検索によって最終的には不要となるデ
ータが途中段階で候補として取り出されてしまって、最
後の意味構造の照合で余分なデータの照合を行なわなけ
ればならないし、そもそもキーワード検索式の作成とい
う余分な作業が発生している。また、最終段階で検索し
たテキストデータの自然−5語解析を行っているが、こ
の作業も情報検索システムのデータベースの作成段階で
事前に行っておけば不要となる作業である。First of all, data that is ultimately unnecessary is picked up as candidates during a keyword search, and extra data must be checked in the final semantic structure comparison, and the keyword search formula must be created in the first place. This creates extra work. In addition, natural five-word analysis of the searched text data is performed at the final stage, but this work would be unnecessary if it had been performed in advance at the stage of creating the database of the information retrieval system.
本発明の目的は、このような従来システム従来技術の問
題点を解決し、効率的かつ精度のよい内容検索手段を提
供することを目的としている。An object of the present invention is to solve the problems of the conventional system and technology, and to provide an efficient and accurate content retrieval means.
上記の目的を達成するために、本発明では以下に示す方
法を用いる。In order to achieve the above object, the present invention uses the method shown below.
(1)知識データベース中の知識データにその内容を代
表する意味を表現する一つ以上の意味構成要素からなる
一つまたは複数の意味構造データを知識データの知識デ
ータベースへの登録時に予じめ付与し。(1) One or more semantic structure data consisting of one or more semantic components expressing the meaning representative of the content is assigned to the knowledge data in the knowledge database in advance when the knowledge data is registered in the knowledge database. death.
知識の検索時においては、入力された質問文を解析して
質問文の意味内容に対応する意味構造データを抽出し、
該知識データベースの各知識データに付与した該意味構
造データと、該質問文の該意味構造データとを逐一照合
し、照合成功したものを選択し出力することを特徴とす
る知識検索方法。When searching for knowledge, the input question text is analyzed and semantic structure data corresponding to the semantic content of the question text is extracted.
A knowledge retrieval method characterized in that the semantic structure data assigned to each piece of knowledge data in the knowledge database is compared one by one with the semantic structure data of the question sentence, and those that are successfully matched are selected and output.
(2)該意味構造データは、意味を構成する語すなわち
意味素と、各意味素どうしを結びつけて複合的な意味を
表わすための意味素間の関係を表わす格標識、および意
味素と格標識の対を構成要素としてそれらを複合的に構
成した木構造からなることを特徴とする知識検索方法。(2) The semantic structure data includes words that make up the meaning, that is, semantics, case indicators that express the relationship between the semantics to express a complex meaning by linking the semantics, and the semantics and case indicators. A knowledge retrieval method characterized in that it consists of a tree structure composed of pairs of components as components.
(3)上記質問文解析処理は、質問文を単語ないし形態
素に分割する形態素解析、形態素解析結果をもとに質問
文の意味構造データによる表現を生成する構文意味解析
、ならびに構文意味解析結果の意味構造データ中に存在
する意味表現上の冗長性を吸収して標準的な意味構造デ
ータを生成する意味標準化処理からなることを特徴とす
る知識検索方法。(3) The above question analysis process includes morphological analysis that divides the question into words or morphemes, syntactic-semantic analysis that generates an expression using semantic structure data of the question based on the results of the morphological analysis, and syntactic-semantic analysis of the results of the syntactic-semantic analysis. A knowledge retrieval method characterized by comprising a semantic standardization process for generating standard semantic structure data by absorbing redundancy in semantic expressions present in the semantic structure data.
(4)該意味標準化処理は、表現上の冗長性を含む意味
構造データの全体または部分と照合するための照合パタ
ン部と、照合時に各種条件をチェックするための条件部
、および照合成功時にその結果として生成する結果パタ
ン部とからなる意味標準化規則を使用することを特徴と
する知識検索方法。(4) The semantic standardization process includes a matching pattern section for matching the whole or part of the semantic structure data including redundancy in expression, a condition section for checking various conditions during matching, and a condition section for checking various conditions at the time of matching, and A knowledge retrieval method characterized by using a semantic standardization rule consisting of a result pattern part generated as a result.
(5)意味構造データによる知識データベースの検索失
敗時、質問文の意味構造データの一部を関連する別のデ
ータで置き換えて、再度照合を試みることを特徴とする
知識検索方法。(5) A knowledge retrieval method characterized in that when a search of a knowledge database using semantic structure data fails, a part of the semantic structure data of the question sentence is replaced with other related data and the comparison is attempted again.
前記(1)は2本発明による知識検索方法を実現するた
めの主たる方法である。これによって、知蛾データの意
味内容に関する質問文を入力し、それに該当する知識の
検索を行なうことが可能となる。The above (1) is the main method for realizing the knowledge retrieval method according to the present invention. This makes it possible to input a question regarding the meaning and content of knowledge data and search for knowledge corresponding to the question.
(2)は、目的とする知識データベースの作成にあたり
、知識データベースの各知識データに付与する意味構造
データの具体的形式を示したものである。質問文および
知識データの意味構造データを、格標識と意味素の対か
らなる木構造として表現することにより、任意の質問文
または知識データの意味を表現可能とするとともに、両
者の照合を統一的かつ容易に実現可能としている。(2) shows the specific format of the semantic structure data to be added to each piece of knowledge data in the knowledge database when creating the target knowledge database. By expressing the semantic structure data of question sentences and knowledge data as a tree structure consisting of pairs of case indicators and semantics, it is possible to express the meaning of any question sentence or knowledge data, and the matching of both can be unified. And it is easily realized.
(3)、 (4)の方法は、入力される質問文の多様性
に対処するためのもので、意味標準化規則を質問文の意
味構造データに適用して標準的な形式の意味表現を得る
ことにより、知識データベース内の知識データに付与す
る意味構造データの必要データ量を少なくし、照合処理
の負担を軽くするとともに、質問文に対する回答の適中
率を高くすることに効果がある。なお、当然のことなが
ら、各知識データには、上記の意味標準化処理後の意味
構造データを付与する。Methods (3) and (4) are used to deal with the diversity of input question sentences, and apply semantic standardization rules to the semantic structure data of question sentences to obtain a standard format of semantic expression. This is effective in reducing the required amount of semantic structure data to be added to the knowledge data in the knowledge database, lightening the burden of verification processing, and increasing the accuracy rate of answers to question sentences. Note that, as a matter of course, each knowledge data is given semantic structure data after the above semantic standardization process.
(6)は、照合失敗時、質問文の意味構造データを部分
的に変えることにより、他の回答の可能性を探索する方
法を提供している。(3)、 (4)と同じく1回答の
適中率を高くする効果がある。(6) provides a method of searching for other answer possibilities by partially changing the semantic structure data of the question text when matching fails. Similar to (3) and (4), this has the effect of increasing the precision rate of one answer.
以下、実施例を用いて本発明の詳細な説明する。 Hereinafter, the present invention will be explained in detail using Examples.
なお、以下の説明では、知識データとしてLISP i
語、特にCommon L I S Pi語の知識を例
として取り上げて説明するが、容易にわかるように1本
発明はこれに限定されるものではない。In the following explanation, LISP i is used as knowledge data.
Although knowledge of the language, particularly the Common LIS Pi language will be taken as an example, the present invention is not limited thereto, as can be easily understood.
第2図に、本発明による知識検索方法を実現する装置の
ハードウェア構成の例を示す。基本的に通常のパソコン
やワークステーションないし汎用計算機と同様の構成で
ある。1はキーボード等の質問文を入力するための装置
、2は検索結果を表示するためのデイスプレィないしプ
リンタ等の表示装置、3は計算機の中央演算処理装置、
4はプログラムや作業データを格納する主記憶、5は知
識データベース等を格納するための磁気ディスクなどの
外部記憶である。FIG. 2 shows an example of the hardware configuration of a device that implements the knowledge retrieval method according to the present invention. Basically, it has the same configuration as a normal personal computer, workstation, or general-purpose computer. 1 is a device for inputting a question such as a keyboard; 2 is a display device such as a display or printer for displaying search results; 3 is a central processing unit of the computer;
4 is a main memory for storing programs and work data, and 5 is an external storage such as a magnetic disk for storing knowledge databases and the like.
第1図は、外部記憶5内に格納された知識データベース
内の各知識データ10の構造および内容の例を示したも
のである。Common L I S Pの関数ch
ar−codeおよびcode−charの知識データ
の例である。図に示すように、知識データの名称欄11
には関数名が入り、意味構造データの欄12にはそれぞ
九の関数を代表する意味構造データを格納する。ここで
は関数の機能実現に対応する意味構造を入れている。内
容欄13には各関数に関する詳細説明が入れられている
。FIG. 1 shows an example of the structure and contents of each knowledge data 10 in the knowledge database stored in the external storage 5. As shown in FIG. Common L I S P function ch
This is an example of knowledge data of ar-code and code-char. As shown in the figure, the name column 11 of knowledge data
contains the function name, and the semantic structure data column 12 stores semantic structure data representing each of the nine functions. Here, we include the semantic structure that corresponds to the realization of the function. The content column 13 contains detailed explanations regarding each function.
第1図の各知識データの意味構造データを普通の文で書
くと、それぞれ「文字を数に変換する」(関数char
−code) r数を文字に変換する」 (関数co
de −char )となる。これらの意味構造は、文
中において各語と他の構文要素との意味的関係を示す格
標識と、話自体の意味を表わす意味標識の対を単位とし
、それらの依存関係を表わす木構造からなっている。関
数char −codeの場合、「対象」「終点」が格
標識で、「変換する」 「文字」 「数」が語の意味標
識である。格標識「対象」は、この場合「文字」が動詞
「変換する」の対象格であること−を表わし、「終点」
は「交換する」の終点格すなわち変換の結果行き着く先
を表わしている。If we write the semantic structure data of each knowledge data in Figure 1 in ordinary sentences, we can use the function char to convert a character into a number.
-code) Convert r number to character” (function co
de-char). These semantic structures consist of pairs of case markers that indicate the semantic relationships between each word and other syntactic elements in a sentence, and semantic markers that express the meaning of the story itself, and consist of a tree structure that expresses the dependence relationships between them. ing. In the case of the function char -code, "object" and "end point" are case indicators, and "convert,""character," and "number" are word meaning indicators. In this case, the case marker ``object'' indicates that the ``character'' is the object case of the verb ``convert,'' and the ``terminal''
represents the final case of ``exchange'', that is, the destination as a result of conversion.
第3図に、本発明による知識検索方法の第1の実施例の
概略処理手順を示す。まずキーボード1から入力された
質問文を受けつけ、それを解析して質問内容に対応する
意味構造データを抽出する。FIG. 3 shows a schematic processing procedure of the first embodiment of the knowledge retrieval method according to the present invention. First, a question text input from the keyboard 1 is received, and it is analyzed to extract semantic structure data corresponding to the content of the question.
次に質問文の意味構造データと知識データベース内の各
知識データの意味構造データとを逐一照合し、照合成功
したものがあればそれを取り出し結果を出力する。Next, the semantic structure data of the question sentence is compared one by one with the semantic structure data of each knowledge data in the knowledge database, and if there is a successfully matched one, it is extracted and the result is output.
次に第3図の各ステップを順により詳しく説明する。Next, each step in FIG. 3 will be explained in more detail.
第1ステツプの質問文の入力処理は、通常第2図のよう
な一般的な計算機装置に標準で搭載されているオペレー
ティングシステムのプログラムに付属している入力プロ
グラムを用いて実行される。The first step of inputting the question text is normally performed using an input program attached to an operating system program installed as standard in a general computer device as shown in FIG.
第4図は、第3図第2ステツプの質問文解析のより詳細
な処理手順を示したものである。FIG. 4 shows a more detailed processing procedure for analyzing the question text in the second step of FIG.
まず人力された質問文を構成する文字列を、単語ないし
形態素に分割する形態素解析を行なう。First, a morphological analysis is performed to divide the character string that makes up the human-written question into words or morphemes.
日本語の場合、形態素解析は文節を単位として行なわれ
るのが一般的である。解析にあたって、システム内で使
用される単語ないし形態素を登録しである単語辞書、お
よび単語ないし形態素間の文節内での接続関係を示す文
節白文法規などが用いられる。In the case of Japanese, morphological analysis is generally performed in units of clauses. In the analysis, a word dictionary that registers the words or morphemes used within the system, and clause white grammar rules that indicate the connections between words or morphemes within a clause are used.
システム的に見た場合、質問文の入力には、漢字かな混
じり文で行なう方法と、カナ人力で行なう方法とが考え
られる。カナ入力の場合、形態素解析結果に同音異議語
等のあいまい性が増えるなどの違いがあるが、大局的に
見ると両者の入力に対する形態素解析の処理内容に本質
的な違いはない。カナ入力文に対する形態素解析の処理
力法は、例えば、情報処理学会第28口金国大会(昭和
59年前記)、4M−6〜4M−9(1237〜I24
4頁)などに記されている。From a system perspective, there are two possible ways to enter a question: one is to use a mixture of kanji and kana, and the other is to manually enter the question using kana. In the case of kana input, there are differences in the morphological analysis results, such as increased ambiguities such as homonyms, but overall there is no essential difference in the processing content of morphological analysis for both inputs. The processing power method of morphological analysis for kana input sentences is described, for example, in Information Processing Society of Japan's 28th National Conference (1981), 4M-6 to 4M-9 (1237 to I24).
(page 4) etc.
[文字を数に変換する関数は?」という質問文に対する
形態素解析処理結果を第5図に示す。[What is the function that converts characters to numbers? ” is shown in FIG. 5.
質問文解析の第2ステツプは構文意味解析である。形態
素解析された質問文を入力として、質問文の意味構造を
生成する。構文意味解析においては、一般にいわゆる文
法規則と、名詞と動詞などの単°語間の意味的関係を記
した格フレーム辞書を利用する。構文意味解析の具体的
処理方法については、例えば、大島、阿部、湯浦、拭布
「格文法による仮名漢字変換の多義解消」、情報処理学
会論文誌第27巻第7号(昭和61年7月)679頁〜
687頁に記されている。The second step in question sentence analysis is syntax-semantic analysis. Using the morphologically analyzed question as input, the semantic structure of the question is generated. Syntax-semantic analysis generally uses so-called grammatical rules and a case frame dictionary that describes the semantic relationships between words such as nouns and verbs. Regarding the specific processing method of syntactic-semantic analysis, see, for example, Oshima, Abe, Yuura, and Fufu, "Resolving Ambiguity in Kana-Kanji Conversion Using Case Grammar," Transactions of the Information Processing Society of Japan, Vol. 27, No. 7 (July 1986). ) 679 pages ~
It is written on page 687.
先はどの、「文字を数に変換する関数は?」という質問
文に対する構文意味解析結果の例を第6図に示す。結果
として生成された意味構造は、第1図の知識データの意
味構造と同じ形をしている。FIG. 6 shows an example of the syntactic and semantic analysis results for the question "What is the function that converts characters into numbers?". The resulting semantic structure has the same form as the semantic structure of the knowledge data in FIG.
質問文解析の第3ステツプは、意味標準化処理である。The third step in question text analysis is semantic standardization processing.
構文意味解析結果として得られた質問文の意味構造中に
含まれる意味表現上の冗長性を吸収し、意味構造データ
のW4S化を行なう。以下に意味の標準化が必要となる
場合の例を示す。The redundancy in the semantic expression contained in the semantic structure of the question sentence obtained as a result of the syntax-semantic analysis is absorbed, and the semantic structure data is converted into W4S. Examples of cases where standardization of meaning is required are shown below.
(1)用語の多様性
前述の例「文字を数に変換する関数は?」において、「
変換する」は「変える」とi゛つても同じことである。(1) Diversity of terminology In the example above, “What is the function that converts letters to numbers?”
``Convert'' is the same as ``change''.
また「直すJr置き換える」と轟っでもよい。また、「
数」は「コード」または「数字コート」、あるいはrn
umberJ rcodeJ と入力することもでき
る。You can also say, ``I'll fix it and replace it with Jr.''. Also,"
``number'' is ``code'' or ``number code'' or rn
You can also enter umberJ rcodeJ.
(2)構造的表現の多様性
「文字列の部分」 「リストの部分」は、r部分文字列
」あるいは「部分リスト」とi゛つても同じことである
。また、「(リストを)逆にする」(2文節)は、「(
リストを)逆転する」 (1文節)と同じ意味である。(2) Diversity of Structural Expression ``Character string part'' ``List part'' is the same as ``r substring'' or ``partial list.'' Also, ``reverse (a list)'' (2nd clause) means ``(
It has the same meaning as "to reverse the list" (1 clause).
以上のような表現上の冗長性に対し、その標準化規則を
作り、これを利用して意味構造に含まれる表現上の多様
性を吸収するようにしておけば、より広範な質問文の入
力表現に対応することが可能となり、ユーザが質問文を
作成するときの負担を軽減し、かつまた検索もれを減少
させることに効果がある。また、後続の知識データの意
味構造との照合処理の負担を軽くすることができる。If we create standardization rules for the above-mentioned redundancies in expressions and use them to absorb the diversity of expressions contained in the semantic structure, we can create a wider range of input expressions for question sentences. This is effective in reducing the burden on the user when creating a question, and also in reducing search omissions. Furthermore, the burden of checking with the semantic structure of subsequent knowledge data can be reduced.
意味標準化規則の構文の1例を、第7図に示す。An example of the syntax of the semantic standardization rule is shown in FIG.
図に示すように、規則は照合パタン部、照合条件部、結
果パタン部からなる。照合パタン部は、意味標準化処理
の入力となる意味構造データの全体または部分との照合
一致をとるためのパタン、照合条件部は、照合時に関連
する各種条件をチェックするためのもの、結果パタン部
は照合成功時に結果として生成する意味構造データのパ
タンである。As shown in the figure, a rule consists of a matching pattern part, a matching condition part, and a result pattern part. The matching pattern part is a pattern for matching the whole or part of the semantic structure data that is input to the semantic standardization process, the matching condition part is for checking various conditions related to matching, and the result pattern part is a pattern of semantic structure data generated as a result when matching is successful.
第8図に意味標準化規則の具体例を示す。(1)(2)
はそれぞれ前記の用語の多様性および構造的表現の多様
性の説明であげた例である。これらの例では、照合時特
に条件のチェックは行なわないので、規則の照合条件部
はrt」 (tは論理条件の真を示す)、すなわち条件
は常に成り立っていることを示している。また、第8図
(2)の3番目の規則では、「?X」という記号を入れ
ているが、これは変数を意味する。照合パタン部に現れ
ている変数は何とでも照合一致させることが可能で。FIG. 8 shows a concrete example of the semantic standardization rules. (1) (2)
are examples given above in explaining the variety of terms and the variety of structural expressions, respectively. In these examples, the conditions are not checked at the time of verification, so the verification condition part of the rule is "rt" (t indicates the truth of the logical condition), that is, the condition is always true. Furthermore, in the third rule in FIG. 8(2), the symbol "?X" is included, which means a variable. It is possible to match any variable that appears in the match pattern section.
照合パタン部で照合成功した場合は、その変数と照合一
致した意味構造内のデータがその変数に代入される。変
数に代入された値は、照合条件部および結果パタン内の
同一名称の変数によって参照することができる。特に結
果パタンにおいては。If the matching is successful in the matching pattern section, data in the semantic structure that matches the variable is assigned to that variable. The value assigned to a variable can be referenced by a variable with the same name in the matching condition part and result pattern. Especially in terms of result patterns.
変数がその値と置き換えられたものが、最終的な結果パ
タンとなる。例えば「リストを逆にする」という文、す
なわち意味構造で表わすと(する(結果 逆 (対象
リスト)))」という文と照合させた場合、?Xの値は
[リストjとなり、生成される結果パタンは「(逆転す
る (対象 リスト))」 となる。The final result pattern is what the variable is replaced with its value. For example, if the sentence ``reverse a list'' is expressed in the semantic structure ((result reverse (object
If you match it with the sentence "List)))", ? The value of X becomes [list j, and the generated result pattern is "(reverse (target list))".
第8図(3)は照合条件部を利用した規則の例である。FIG. 8(3) is an example of a rule using the matching condition part.
この規則の照合条件部は、「変数?Xのデータ型は判型
の副型(subtype)である」という意味を、Co
mmon L I S P ’i語のプログラムで表わ
したものである。Common L I S P ’i
語では、データ型は階層的になっており1列型の下には
、リスト型、ベクトル型、文字列型などの副型がある。The matching condition part of this rule means "The data type of variable ?X is a subtype of format".
This is expressed in a program written in the mmon LISP'i language. Common L I S P'i
In Japanese, data types are hierarchical, with subtypes such as list type, vector type, and string type below the single column type.
したがって、この規則が表わすところの意味は、「?x
に?Xを加える」という入力文があったとき、?Xの値
が判型またはその副型であれば、「?Xを連結する」と
いう文に変えなさい、ということである。入力文[リス
トにリストを加える」[ベクトルにベクトルを加える」
[文字列に文字列を加える」は、「リストを連結する
」 「ベクトルを連結する」 「文字列を連結する」に
変換される。Therefore, the meaning of this rule is "?x
To? When there is an input sentence "Add X", ? If the value of X is a size type or its subtype, change the sentence to ``?Concatenate X.'' Input sentence [Add list to list] [Add vector to vector]
[Add strings to strings] is converted to "concatenate lists,""concatenatevectors," and "concatenate strings."
意味!M準化処理の処理手順を第9図および第10図に
示す。処理の骨子は、対象となる意味構造データの全体
を含む全ての部分構造について意味標準化規則との照合
を行ない、照合成功した場合には、その部分構造を照合
成功した規則の結果パタンで置き換える、という作業を
可能な限り行なうということである。「可能な限り」と
いう表現は、照合成功した変換結果のパタンについても
またそれを処理対象とする、ということを含む。meaning! The processing procedure of the M normalization process is shown in FIGS. 9 and 10. The gist of the process is to match all partial structures including the entire target semantic structure data with the semantic standardization rules, and if the matching is successful, replace the partial structure with the result pattern of the successfully matched rule. This means doing as much of this work as possible. The expression "as much as possible" includes the fact that patterns of conversion results that are successfully matched are also processed.
第9図は処理の全体の流れを示したもので、照合一致フ
ラグなる変数を設けて、上記の「可能な限り」という意
味を実際の処理に置き換えている。FIG. 9 shows the overall flow of processing, and a variable called a matching flag is provided to replace the above meaning of "as much as possible" with actual processing.
ループの先頭で照合一致フラグをnjQとし1次にプロ
グラムconvertを呼び出しているが、プログラム
convert内での処理中に1回でも照合成功した場
合は照合一致フラグがtとなり、ループが繰り返される
。At the beginning of the loop, the verification match flag is set to njQ and the program convert is called as the primary call, but if verification is successful even once during processing within the program convert, the verification match flag becomes t and the loop is repeated.
第1o図は、実際に意味構造と規則との照合および変換
を行なうプログラムcanνertの処理手順を示した
ものである。本プログラムは、意味構造の全ての部分構
造に規則を適用するということを実現するために、再帰
呼出しによる制御を行なっている。FIG. 1o shows the processing procedure of the program cannvert which actually performs matching and conversion between semantic structures and rules. This program uses recursive calls to apply rules to all substructures of the semantic structure.
処理ステップ2301,2302,2303゜2304
.2305.2306から成る部分は、意味構造のある
部分構造について、全ての意味標準化規則との照合を行
ない、各規則の照合パタン部との照合および照合条件部
での条件チェックが成功した場合には、その部分構造を
規則の結果パタンで置き換える処理を示す。Processing steps 2301, 2302, 2303° 2304
.. The part consisting of 2305.2306 performs matching with all semantic standardization rules for a partial structure of a semantic structure, and if the matching with the matching pattern part of each rule and the condition check in the matching condition part are successful, , indicates the process of replacing the substructure with the result pattern of the rule.
ステップ2307,2308,2309,2310゜2
311から成る部分は、意味構造の全ての部分構造に上
記の処理を適用するための制御を記述したものである。Steps 2307, 2308, 2309, 2310゜2
The part consisting of 311 describes control for applying the above processing to all substructures of the semantic structure.
前記したように、ここでは再帰呼び出しによる制御を行
なっている。ステップ2307では現在の部分構造が木
の末端の葉となっているかをチェックしている。部分構
造が末端の葉ならばそれ以上分解して部分構造をとるこ
とはできないので、現在の部分構造を戻り値として、呼
出したプログラムへ戻る(ステップ2311)。部分構
造が末の末端の葉ではない場合は、さらにその部分構造
について処理を適用する。ステップ2308では部分構
造をリストで表わしたときの先頭部にプログラムcon
vert を再帰的に適用する。ステップ2309では
、部分構造の先頭を除く残りの部分にプログラムcon
vertを再帰的に適用する。ここで、リストの先頭部
ないし残りの部分とは、LISP1語の用語でiうと、
リストのCar部およびcdr部に相当する。ステップ
2310では。As mentioned above, control is performed here using recursive calls. In step 2307, it is checked whether the current partial structure is the terminal leaf of the tree. If the partial structure is a terminal leaf, it is not possible to decompose it further to obtain a partial structure, so the current partial structure is used as a return value and the process returns to the called program (step 2311). If the substructure is not the final leaf, further processing is applied to that substructure. In step 2308, the program con is placed at the beginning of the list of substructures.
Apply vert recursively. In step 2309, the program con
Apply vert recursively. Here, the beginning of the list or the rest of the list is defined as i in the LISP language terminology.
This corresponds to the Car part and cdr part of the list. In step 2310.
ステップ2308およびステップ2309で得られた結
果をもとに、もとの部分構造と同一レベルの部分構造を
生成し、これを戻り値として呼出したプログラムへ戻る
処理を行なう。Based on the results obtained in steps 2308 and 2309, a partial structure at the same level as the original partial structure is generated, and this is used as a return value to return to the calling program.
次に、第3図第3ステツプおよび第4ステツプの意味構
造データの照合と知識データの検索、および結果の表示
の処理について説明する。Next, the processing of collating semantic structure data, searching for knowledge data, and displaying the results in the third and fourth steps of FIG. 3 will be explained.
第11図は、意味構造の照合と知識データの検索の処理
手順を示したものである。FIG. 11 shows the processing procedure for semantic structure matching and knowledge data retrieval.
まず、質問解析部の出力、すなわち構文意味解析され意
味m準化された質問文の意味構造から、知識データベー
スの各知識データの意味構造に対応する部分を切り出す
。次に知識データベースから順に一つずつ知識データを
取り出し、知識データの意味構造と比較照合を行なう。First, a portion corresponding to the semantic structure of each knowledge data in the knowledge database is cut out from the output of the question analysis section, that is, the semantic structure of the question sentence that has been syntactically and semantically analyzed and standardized. Next, knowledge data is extracted one by one from the knowledge database and compared and verified against the semantic structure of the knowledge data.
照合が成功したら、その知識の内容(説明)の欄の内容
を取り出し1表示装置5を通じて出力する。照合成功し
なければ、上記の処理を知識データベースの知識データ
がなくなるまで繰り返す。If the verification is successful, the contents of the knowledge content (explanation) column are taken out and outputted through the display device 5. If the matching is not successful, the above process is repeated until there is no knowledge data in the knowledge database.
ここで、質問文の意味構造と、複数の知識データの意味
構造とが一致することが考えられる場合がある。そのよ
うな状況が考えられる場合には、照合成功しても処理を
中断せず、知識データベースの知識データがなくなるま
で処理を繰り返せばよい。Here, it may be possible that the semantic structure of the question text and the semantic structure of a plurality of pieces of knowledge data match. If such a situation is possible, the process may be repeated until there is no more knowledge data in the knowledge database, without interrupting the process even if the matching is successful.
ところで、上述の実施例では、一つの質問文に対し、知
識データベースの全て(または照合成功のものが見つか
るまで)の知識データと照合を行なうようにしているが
、これでは知識データの数が多くなったとき性能上問題
が生じる。By the way, in the above embodiment, one question sentence is checked against all the knowledge data in the knowledge database (or until a successful check is found). When this happens, performance problems occur.
このような場合、通常のファイルシステムでは、検索デ
ータ中の何らかのキーに着目したインデクス(索引)を
作成し、このインデクスを用いることによって、検索照
合の処理量の削減をはかつている。さらに、このインデ
クスを木構造にしたりハツシングの技術を採用したりし
て、インデクス内での検索照合のさらなる速度向上をは
かつている。In such a case, in a typical file system, an index is created that focuses on some key in the search data, and this index is used to reduce the amount of search and collation processing. Furthermore, by creating this index into a tree structure and employing hashing technology, we are working to further speed up searches and matching within the index.
本実施例の説明で用いているCommon L I
S Pi゛語の知識データベースについていうと、 C
ommonLISPの多くの関数は、特定のデータ型(
リスト、ベクトル、文字測地)に属するデータに関する
処理を行なう関数であり、各関数の機能表現すなわち知
識データに登録する意味構造には通常これらのデータ型
を表わす語が含まれている。したがって、このデータ型
に関するインデクスを設け1、各関数の知識データをデ
ータ型のインデクスキーの下に置くことにすれば、照合
検索の高速化をはかることができる。また、データ型で
はなく関数の機能表現中の動詞をインデクスキーとして
用いてもよく、またデータ型と動詞の両方をインデクス
キーとして用いてもよい。Common LI used in the explanation of this example
Regarding the S Pi language knowledge database, C
Many functions in ommonLISP require specific data types (
It is a function that performs processing on data belonging to a list, vector, character geodesic), and the functional expression of each function, that is, the semantic structure registered in knowledge data, usually includes words representing these data types. Therefore, if an index regarding this data type is provided 1 and the knowledge data of each function is placed under the index key of the data type, it is possible to speed up the verification search. Further, a verb in the functional expression of a function may be used as the index key instead of the data type, or both the data type and the verb may be used as the index key.
さらに弁別ネットの技法を用いて、意味構造データの多
段のインデクスを作ることもできる。なお、弁別ネット
の技法に関しては、H,Charniak。Furthermore, it is also possible to create a multi-stage index of semantic structure data using the discriminant net technique. Regarding the discriminative net technique, see H. Charniak.
C,に、Riesbeck、 D、V、McDermo
tt著[人工知能ハ’、/ドブツク」、日本コンピュー
タ協会、1986年などに記されている。C., Riesbeck, D.V., McDermoh
It is written in "Artificial Intelligence Ha',/Dobtsuku" by TT, Japan Computer Association, 1986.
なお、以上の知識データベースの照合検索の高速化の技
法は、前述の意味標準化規則の照合検索の高速化に対し
ても、全く同様に適用できる。Note that the technique for speeding up the matching search of knowledge databases described above can be applied in exactly the same way to speeding up the matching search of the above-mentioned semantic standardization rules.
ところで1以上に説明した第1の実施例では必ずしも、
ユーザが望んでいる内容のCommonLISPの関数
が得られない場合がある。Con+monL I S
Pでは多くのデータ型が用意されており、それらは階層
構成をなしているので、上位データ型のほうで総称的な
関数が用意されている場合には、−ド位データ型におい
てはそのデータ型専用の関数は用意されていないことが
多い。例を上げれば、ユーザの「ベクトルを復写する関
数は?」という質問に直接対応する関数がない。しかし
、ベクトル型の上位型である判型にcopy −seq
という関数があり、これでユーザの要求を満すことがで
きるので、この場合にはこの関数を答えればよい。また
、このような状況を配慮して、本来[文字列を比較する
関数は?」と質問したいのに1文字列の上位データ型で
あるベクトル型を質問に用いて、「ベクトルを比較する
関数は?」などと質問することもありうる。ところが、
CommonL I S Pにはベクトルを直接比較す
る関数はなく、あるのはベクトルの下位型である文字列
を比較する関数Stt”lng ” +string<
+ strjng/ = 、等と、ベクトルの上位型
である列を比較する関数mismatchである。この
ような場合は、上位型、下位型に対応する関数両方を答
えてくれると有難い。By the way, in the first embodiment described above, it is not necessary to
There are cases where the CommonLISP function desired by the user cannot be obtained. Con+monL I S
There are many data types available in P, and they form a hierarchical structure, so if a generic function is provided in a higher-level data type, that data is Type-specific functions are often not provided. For example, there is no function that directly corresponds to the user's question, "What is the function that reproduces a vector?" However, copy -seq in the format which is a higher type of vector type.
There is a function called, which can satisfy the user's request, so in this case, you can use this function. Also, taking this situation into consideration, we originally created the [What is the function that compares strings?] '', but you may use a vector type, which is a higher-level data type for a single string, and ask, ``What is the function that compares vectors?'' However,
CommonLISP does not have a function that directly compares vectors, but there is a function that compares strings, which are subtypes of vectors, Stt"lng"+string<
+strjng/=, etc., is a function mismatch that compares a column that is a higher type of vector. In such cases, it would be helpful if you could provide both the functions corresponding to the upper and lower types.
このような要求を実現するための、第2の実施例につい
て以下に説明する。本実施例のハードウェア構成は、第
1の実施例と同様、第2図で示すものである。また知識
データベースの構成および知識データのデータ形式も第
1の実施例の場合と同様である(知識データの形式は第
1図に示したもの)。さらに、本実施例の概略処理手順
も第1の実施例の場合と同様で、第3図で表わされる。A second embodiment for realizing such a request will be described below. The hardware configuration of this embodiment is shown in FIG. 2, similar to the first embodiment. Furthermore, the configuration of the knowledge database and the data format of the knowledge data are also the same as in the first embodiment (the format of the knowledge data is shown in FIG. 1). Furthermore, the general processing procedure of this embodiment is similar to that of the first embodiment, and is shown in FIG.
第12図および第13図に1本実施例と第1の実施例と
の相違部分、すなわち、意味構造の照合と知識データの
検索の処理手順を示す。FIGS. 12 and 13 show differences between this embodiment and the first embodiment, that is, processing procedures for matching semantic structures and retrieving knowledge data.
第13図は基本的には第11図の処理手順と同じであり
、それをサブルーチン化したものである。The process shown in FIG. 13 is basically the same as the process shown in FIG. 11, and is a subroutine.
第12図のステップ601でまず、質問文の意味構造か
ら比較すべき関数の意味構造相当部分を切出す。次に、
第1の実施例と同様、意味構造データと知識データの意
味構造データとの照合を行なう(ステップ6o2)。こ
のとき、第13図の照合プログラムを呼出して処理を実
行する。照合が成功した場合はそれで処理はおしまいで
ある。照合失敗した場合は、質問文の意味構造データ中
に含まれるデータ参照表現の上位データ型、下位データ
型の有無をチェックし、存在すれば、それぞれについて
データ参照表現を上位または下位データ型と置き換え、
最初の処理と同様の照合処理を実行する。照合成功した
ものがあれば、該当知識データの知識内容の説明部分を
取り出し、出力装置5を通じて出力を行なう(ステップ
603〜610)。In step 601 of FIG. 12, first, a portion corresponding to the semantic structure of the function to be compared is extracted from the semantic structure of the question sentence. next,
As in the first embodiment, the semantic structure data is compared with the semantic structure data of the knowledge data (step 6o2). At this time, the collation program shown in FIG. 13 is called to execute the process. If the matching is successful, the process is over. If matching fails, check whether there is an upper data type or lower data type of the data reference expression included in the semantic structure data of the question, and if it exists, replace the data reference expression with the upper or lower data type for each. ,
Perform matching processing similar to the first processing. If there is a successfully verified item, the explanatory part of the knowledge content of the corresponding knowledge data is extracted and outputted through the output device 5 (steps 603 to 610).
例えば、「ベクトルを比較する関数は?」という質問文
が入力されたとき、この質問文の要求に直接対応する関
数はないので、「ベクトルJの部分を上位データ型1列
」または下位データ型「文字列」で置きかえて照合を行
ない、関数mismatchおよびqtring= 、
5triB< 、 string/ =等の説明を得
る。For example, when the question ``What is the function that compares vectors?'' is input, there is no function that directly corresponds to the request of this question, so ``the part of vector J should be converted into one column of the upper data type'' or the lower data type Replace it with a "string" and perform a match, using the functions mismatch and qtring=,
Obtain explanations such as 5triB<, string/=, etc.
本実施例で述べた推論方式は、必ずしもCommonL
ISP局語に関する知識データベースに限られるもので
はない。知識データベースの内容が他の知識データの場
合にも適用可能である。例えば、知識データベースが生
物の種々の性質に関するもので、質問文が「すずめは空
を飛ぶことができるか?」という質問に対し、「すずめ
」の上位意味カテゴリである「鳥」の知識を使ってYE
Sと答えるというようなことにも利用することができる
。The inference method described in this example does not necessarily apply to CommonL
The knowledge database is not limited to the ISP language. It is also applicable when the content of the knowledge database is other knowledge data. For example, if the knowledge database is about various properties of living things, and the question is ``Can sparrows fly?'', knowledge of ``bird,'' which is a superordinate semantic category of ``sparrow,'' is used. teYE
It can also be used for things like answering S.
以上説明したように1本発明によれば、知識の意味内容
による知識データベースの検索システムを容易に構築す
ることが可能となる。また、多様な質問表現に対応する
こともできる。さらに、旦システムが完成したあとで、
知識データや用語、および意味に関するデータをシステ
ムに追加することは簡単であるので、システムの拡張も
容易に行なうことができる。As explained above, according to the present invention, it is possible to easily construct a knowledge database search system based on the semantic content of knowledge. Furthermore, it is possible to respond to a variety of question expressions. Furthermore, after the Dan system is completed,
Since it is easy to add knowledge data, terminology, and meaning data to the system, the system can be easily expanded.
本発明は、プログラミングi語の知識のみならず、一般
に知識をその意味内容により検索する機能を持つシステ
ムにおいては全て有効である。文献や新聞記事の内容に
よる検索、あるいは国語辞典や外国語辞典に掲載されて
いる語の意味よる検索、また、計算機ハードウェアなら
びに応用プログラムの操作手順の知識に関する検索、計
算機による教授装置、いわゆるCAI装置において、質
問に応じて知識の説明を行なう装置においても有効であ
る。以上のような、知識ベースから知識を検索して提示
することが重要なポイントとなるコンサルテーションシ
ステムのようなシステムにおいては極めて有効な発明で
ある。The present invention is effective in all systems having a function of searching not only knowledge of programming i-words but also knowledge in general based on its semantic content. Searches based on the content of literature and newspaper articles, searches based on the meaning of words listed in Japanese and foreign language dictionaries, searches related to computer hardware and knowledge of operating procedures for application programs, computer-based teaching devices, so-called CAI It is also effective in devices that explain knowledge in response to questions. This invention is extremely effective in systems such as consultation systems, where searching and presenting knowledge from a knowledge base is an important point.
第1図は本発明による第1および第2の実施例における
知識データベース内の知識データの構成および内容を示
した図、第2図は同じくハードウェア構成を示す図、第
3図は同じく本発明における知識検索方法の概略処理手
順を示す図である。
第4図は質問文解析のより詳細な処理手順を示した図、
第5図は「文字を数に変換する関数は?」という質問文
に対する形態素解析結果、第6図は同しく構文意味解析
結果を表わす意味構造データである。第7図は意味標準
化規則の形式を示したもの、第8図はその具体例である
。第9図、第10図は意味標準化処理の処理手順を示し
たフローチャートである。第11図は、第1の実施例に
おける意味構造データの照合と知識データの検索の処理
手順を示すフローチャートである。第12゜13図は第
2の実施例における意味構造データの照合と知識データ
の検索の処理手順を示すフローチャートである。
1・・・キーボード、2・・表示装置、3・・・中央演
算処理装置、4・・主記憶、5・・・外部記憶、1o・
・・知識データの例、11・・知識データの名称、12
・・知識データの内容を表わす意味構造データ、13・
・・知識データの内容。FIG. 1 is a diagram showing the structure and content of knowledge data in the knowledge database in the first and second embodiments according to the present invention, FIG. 2 is a diagram also showing the hardware configuration, and FIG. 3 is also a diagram according to the present invention. It is a figure showing the outline processing procedure of the knowledge search method in . Figure 4 is a diagram showing a more detailed processing procedure for question text analysis.
FIG. 5 shows the morphological analysis results for the question "What is the function that converts characters into numbers?" and FIG. 6 shows the semantic structure data representing the syntactic-semantic analysis results. FIG. 7 shows the format of the semantic standardization rules, and FIG. 8 shows a specific example thereof. FIGS. 9 and 10 are flowcharts showing the processing procedure of the semantic standardization process. FIG. 11 is a flowchart showing the processing procedure for collating semantic structure data and searching for knowledge data in the first embodiment. FIGS. 12 and 13 are flowcharts showing processing procedures for collating semantic structure data and retrieving knowledge data in the second embodiment. DESCRIPTION OF SYMBOLS 1... Keyboard, 2... Display device, 3... Central processing unit, 4... Main memory, 5... External memory, 1o.
...Example of knowledge data, 11...Name of knowledge data, 12
...Semantic structure data representing the content of knowledge data, 13.
...Contents of knowledge data.
Claims (1)
ス中から所望の知識データを取り出す知識検索装置にお
いて、 知識データベース中の知識データにその内容を代表する
意味を表現する一つ以上の意味構成要素からなる一つま
たは複数の意味構造データを知識データの知識データベ
ースへの登録時に予じめ付与し、 知識の検索時においては、入力された質問文を解析して
質問文の意味内容に対応する意味構造データを抽出し、
該知識データベースの各知識データに付与した該意味構
造データと、該質問文の該意味構造データとを逐一照合
し、照合成功したものを選択し出力することを特徴とす
る知識検索方法。 2、該意味構造データは、意味を構成する語すなわち意
味素と、各意味素どうしを結びつけて複合的な意味を表
わすための意味素間の関係を表わす格標識、および意味
素と格標識の対を構成要素としてそれらを複合的に構成
した木構造からなることを特徴とする特許請求の範囲第
1項記載の知識検索方法。 3、該質問文解析処理は、質問文を単語ないし形態素に
分割する三態素解析、形態素解析結果をもとに質問文の
意味構造データによる表現を生成する構文意味解析、な
らびに構文意味解析結果の意味構造データ中に存在する
意味表現上の冗長性を吸収して標準的な意味構造データ
を生成する意味標準化処理からなることを特徴とする特
許請求の範囲第1項記載の知識検索方法。 4、該意味標準化処理は、表現上の冗長性を含む意味構
造データの全体または部分と照合するための照合パタン
部と、照合時に各種条件をチェックするための条件部と
、照合成功時にその結果として生成する結果パタン部と
からなる意味標準化規則を使用することを特徴とする特
許請求の範囲第3項記載の知識検索方法。 5、意味構造データによる知識データベースの検索失敗
時、質問文の意味構造データの一部を関連する別のデー
タで置きかえて、再度照合を試みることを特徴とする特
許請求の範囲第1項記載の知識検索方法。[Scope of Claims] 1. In a knowledge retrieval device that extracts desired knowledge data from a knowledge database consisting of a large number of knowledge data such as documents, there is a device for expressing meaning representative of the content of the knowledge data in the knowledge database. One or more semantic structure data consisting of the above semantic constituent elements are assigned in advance when knowledge data is registered in the knowledge database, and when searching for knowledge, the input question text is analyzed and the question text is Extract the semantic structure data corresponding to the semantic content,
A knowledge retrieval method characterized in that the semantic structure data assigned to each piece of knowledge data in the knowledge database is compared one by one with the semantic structure data of the question sentence, and those that are successfully matched are selected and output. 2. The semantic structure data includes the words that make up the meaning, that is, the semantics, the case indicators that express the relationship between the semantics to express a complex meaning by linking the semantics, and the information between the semantics and the case indicators. 2. The knowledge retrieval method according to claim 1, wherein the knowledge retrieval method is comprised of a tree structure composed of pairs as constituent elements. 3. The question text analysis process includes three morphological analysis that divides the question text into words or morphemes, syntactic-semantic analysis that generates an expression using semantic structure data of the question text based on the morphological analysis results, and syntactic-semantic analysis results. 2. The knowledge retrieval method according to claim 1, further comprising a semantic standardization process for generating standard semantic structure data by absorbing redundancy in semantic expressions present in the semantic structure data. 4. The semantic standardization process consists of a matching pattern part for matching the whole or part of semantic structure data including redundancy in expression, a condition part for checking various conditions during matching, and a result when matching is successful. 4. The knowledge retrieval method according to claim 3, characterized in that a semantic standardization rule consisting of a result pattern part generated as a result pattern part is used. 5. When the search of the knowledge database using the semantic structure data fails, a part of the semantic structure data of the question text is replaced with other related data and the verification is attempted again. Knowledge retrieval method.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63208328A JPH0258166A (en) | 1988-08-24 | 1988-08-24 | Knowledge search method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63208328A JPH0258166A (en) | 1988-08-24 | 1988-08-24 | Knowledge search method |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0258166A true JPH0258166A (en) | 1990-02-27 |
Family
ID=16554448
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63208328A Pending JPH0258166A (en) | 1988-08-24 | 1988-08-24 | Knowledge search method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0258166A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0341560A (en) * | 1989-07-10 | 1991-02-22 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieving system |
| JP2007087401A (en) * | 2005-09-23 | 2007-04-05 | Fuji Xerox Co Ltd | System and method for indexing, and system and method and program for generating questionnaire template |
| JP2018013863A (en) * | 2016-07-19 | 2018-01-25 | 富士通株式会社 | Encoding program, search program, encoding apparatus, search apparatus, encoding method, and search method |
-
1988
- 1988-08-24 JP JP63208328A patent/JPH0258166A/en active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0341560A (en) * | 1989-07-10 | 1991-02-22 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieving system |
| JP2007087401A (en) * | 2005-09-23 | 2007-04-05 | Fuji Xerox Co Ltd | System and method for indexing, and system and method and program for generating questionnaire template |
| JP2018013863A (en) * | 2016-07-19 | 2018-01-25 | 富士通株式会社 | Encoding program, search program, encoding apparatus, search apparatus, encoding method, and search method |
| US10740562B2 (en) | 2016-07-19 | 2020-08-11 | Fujitsu Limited | Search apparatus, encoding method, and search method based on morpheme position in a target document |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6584470B2 (en) | Multi-layered semiotic mechanism for answering natural language questions using document retrieval combined with information extraction | |
| US6023697A (en) | Systems and methods for providing user assistance in retrieving data from a relational database | |
| EP0266001B1 (en) | A parser for natural language text | |
| JP4306894B2 (en) | Natural language processing apparatus and method, and natural language recognition apparatus | |
| US6269189B1 (en) | Finding selected character strings in text and providing information relating to the selected character strings | |
| DE69527229T2 (en) | Language interpreter with a compiler with uniform grammar | |
| US20020010714A1 (en) | Method and apparatus for processing free-format data | |
| JPH0447364A (en) | Natural language analying device and method and method of constituting knowledge base for natural language analysis | |
| JPH02301869A (en) | Method for maintaining and supporting natural language processing system | |
| US11386269B2 (en) | Fault-tolerant information extraction | |
| Reshma et al. | A review of different approaches in natural language interfaces to databases | |
| JP3743678B2 (en) | Automatic natural language translation | |
| JPH0258166A (en) | Knowledge search method | |
| Daelemans et al. | Part-of-speech tagging for Dutch with MBT, a memory-based tagger generator | |
| Karimi et al. | Natural language query and control interface for database using afghan language | |
| Nugues | Corpus processing tools | |
| JPH07244669A (en) | Document search method | |
| Hanane et al. | A model of a generic Arabic language interface for multimodel database | |
| Gebremeskel | Geez POS Tagger Using Hybrid Approach | |
| JPS61187077A (en) | Japanese language analysis device | |
| JPH0561902A (en) | Mechanical translation system | |
| Nijholt | Linguistic engineering: a survey | |
| Al-Johar | A portable natural language interface from Arabic to SQL. | |
| Lorchirachoonkul | A Thai soundex system | |
| Ateri | An analysis of the domain-specific applicability of text-to-SQL systems on a linguistic database |