JPH02297193A - Dictionary consulting device - Google Patents
Dictionary consulting deviceInfo
- Publication number
- JPH02297193A JPH02297193A JP1042380A JP4238089A JPH02297193A JP H02297193 A JPH02297193 A JP H02297193A JP 1042380 A JP1042380 A JP 1042380A JP 4238089 A JP4238089 A JP 4238089A JP H02297193 A JPH02297193 A JP H02297193A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- information
- superposition
- storage device
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、自然言語による文章または文を機械によって
解析しまたは生成する際に利用される辞書引き装置に関
するものである。DETAILED DESCRIPTION OF THE INVENTION Field of the Invention The present invention relates to a dictionary lookup device used when a machine analyzes or generates sentences or sentences written in a natural language.
従来の技術
自然言語による文章や文を機械によって処理する自然言
語処理装置において、予め蓄えておいた必要な語彙情報
を適宜参照して所定の語重情報を抽出する辞書引きが行
われる。2. Description of the Related Art In a natural language processing device that processes texts and sentences written in a natural language by a machine, a dictionary lookup is performed to extract predetermined word weight information by appropriately referring to necessary vocabulary information stored in advance.
従来、辞書引き装置としては、B木などの転置ファイル
によるファイル管理手法を応用することによって、1個
以上のキーワードのそれぞれについて検索を行い、その
結果を統合し、あるいは順次キーワードによって結果を
絞シ込むことにより得たものを検索結果として表示する
ものがあった。Conventionally, dictionary lookup devices search for one or more keywords individually by applying a file management method using transposed files such as B-tree, and then integrate the results or sequentially narrow down the results by keyword. There was one that displayed what was obtained by searching as a search result.
発明が解決しようとする課題
従来のB木などの転置ファイルによるファイル管理手法
を応用した辞書引き装置では、自然言語処理装置におい
て要求される1個以上のキーワードによる辞書の検索を
行う場合、1個以上のキーワードのそれぞれについて検
索を行い、その結果を統合し、あるいは順次キーワード
によって結果を絞υ込むことにより得たものを検索結果
とするので、辞書引き装置における転置ファイルのため
の記憶領域が大きく、辞書内容の変更に伴う転置ファイ
ルの変更の手間が大きく、辞書引き装置を実装する電子
計算機の環境に応じて転置ファイルのための記憶領域の
大きさを柔軟に設計することが困難であった。Problems to be Solved by the Invention In a dictionary lookup device that applies a conventional file management method using transposed files such as a B-tree, when searching a dictionary using one or more keywords required by a natural language processing device, only one keyword is required. Since the search results are obtained by searching for each of the above keywords, integrating the results, or sequentially narrowing down the results by keywords, the storage area for the transposed files in the dictionary lookup device is large. , it took a lot of effort to change the transposed file as the contents of the dictionary changed, and it was difficult to flexibly design the size of the storage area for the transposed file according to the environment of the computer on which the dictionary lookup device was implemented. .
本発明は上記課題を解決するもので、記憶領域が小さく
、辞書内容の変更の容易な辞書引き装置を提供すること
を目的とするものである。The present invention has been made to solve the above problems, and it is an object of the present invention to provide a dictionary lookup device that has a small storage area and allows easy modification of dictionary contents.
課題を解決するだめの手段
上記課題を解決するだめの本発明の技術的手段は、自然
言語の始業情報を蓄積した辞書情報蓄積装置と、辞書情
報蓄積装置の語粟情報の重ね合せ符号を蓄積する重ね合
せ符号蓄積装置と、辞書引きのための質問情報の重ね合
せ符号によシ重ね合せ符号蓄積装置の重ね合せ符号を検
索する検索装置と、検索結果と辞書情報蓄積装置の始業
情報とを照合する照合装置とを具備したものである。Means for Solving the Problems Technical means of the present invention for solving the above problems include a dictionary information storage device that stores natural language starting information, and a superimposed code of word information in the dictionary information storage device. a superposition code storage device for searching the superposition code of the superposition code storage device based on the superposition code of question information for dictionary lookup; It is equipped with a verification device for verification.
作用
上記構成の作用は次のようになる。辞書情報蓄積装置に
蓄積された始業情報が持つ1個以上のキーワードは・・
ツシュ関数を用いて符号化され、その重ね合せ符号が作
成されて重ね合せ符号蓄積装置に蓄積される。一方辞書
引きのための質問情報も同様にして重ね合せ符号化され
る。この質問情報の重ね合せ符号により重ね合せ符号蓄
積装置に蓄積されているデータを検索装置で照合し、質
問情報に対する正しい検索結果の候補であるドロップと
呼ばれる検索結果を得る。検索装置による検索結果であ
るドロップは質問に対する正しい検索結果の始業情報の
集合を必ず含んでいるが、7オルスドロツプと呼ばれる
誤って検索された始業情報も含む場合がある。照合装置
では、ドロップからフォルスドロップを除去するために
、ドロップが示す辞書情報蓄積装置中の始業情報と質問
とを照合する。そしてその結果正しい検索結果を出力装
置によシ表示する。Effect The effect of the above configuration is as follows. One or more keywords included in the start-of-day information stored in the dictionary information storage device are...
The data is encoded using the Tusch function, and its superposition code is created and stored in a superposition code storage device. On the other hand, question information for dictionary lookup is similarly superimposed encoded. The search device collates the data stored in the superposition code storage device using the superposition code of the question information, and obtains a search result called a drop, which is a candidate for the correct search result for the question information. A drop, which is a search result by a search device, always includes a set of starting information that is a correct search result for a question, but may also include incorrectly retrieved starting information called 7 orsdrops. In order to remove false drops from the drops, the collation device collates the question with the starting information in the dictionary information storage device indicated by the drop. Then, the correct search results are displayed on the output device.
実施例
以下、図面にもとづいて、本発明についてさらに詳しく
説明する。EXAMPLES Hereinafter, the present invention will be explained in more detail based on the drawings.
第1図には、本発明一実施例の辞書引き装置の概念図を
示す。あらかじめ辞書情報蓄積装置1に蓄えられた自然
言語の詔書情報を、重ね合せ符号作成装置2によって、
辞書重ね合せ符号として重ね合せ符号蓄積装置3に蓄え
ておき、入力装置4に与えられた質問を質問処理装置5
により分解し、重ね合せ符号作成装置2で質問重ね合せ
符号を作成し、この質問重ね合せ符号と辞書重ね合せ符
号を検索装置6で照合し、その検索結果が表わす始業情
報と質問を照合装置7で照合することによって、質問に
対する正しい辞書引き結果である始業情報を出力装置8
により表示する。FIG. 1 shows a conceptual diagram of a dictionary lookup device according to an embodiment of the present invention. The natural language edict information stored in the dictionary information storage device 1 in advance is processed by the superposition code creation device 2.
The dictionary superposition code is stored in the superposition code storage device 3, and the question given to the input device 4 is sent to the question processing device 5.
A question superimposition code is created by a superimposition code creation device 2, a search device 6 collates this question superimposition code with a dictionary superimposition code, and a collation device 7 compares the start-of-day information and the question represented by the search results. The output device 8 outputs starting information, which is the correct dictionary lookup result for the question.
Displayed by
第2図は、重ね合せ符号作成装置2の構成を示す。辞書
情報蓄積装置1からの自然言語の始業情報は重ね合せ符
号作成装置2のbcw作成装置21に与えられる。始業
情報Rは1つ以上の数Ri個のキーワードを有している
。たとえば語粟「日本」はキーワードとして「日本」、
「固有名詞」の2つのキーワードを有している。bcw
作成装置21では、入力される1個以上のキーワード1
つ1つに対し、bビットのうち幾つかのビットに“l”
を立て、残りは“0”とするようなノ・ノシュ関数を用
いてbcW(バイナリ コードワード)と呼ぶ長さbの
ビット列を作る。図示の例ではキーワード「日本jとし
て01010100.キーワード「固有名詞」として0
0011010の8ビツトのビット列が作られる。bc
w重ね合せ装置nではこれらRi本のbcwをビット毎
に論理和をとった長さbのビット列5(Ri)を始業情
報Riの辞書重ね合せ符号として作成する。図示の例で
は始業「日本」に対して辞書重ね合せ符号010111
10が作成される。この操作が辞書情報蓄積装置1のす
べての始業情報について行われ、それぞれの始業に対し
て辞書重ね合せ符号が作成される。こうして作成された
F本の辞書重ね合せ符号を第3図で説明するようにb本
の長さFのビット列として重ね合せ符号蓄積装置3に格
納する。ここで、Fは辞書情報蓄積装置1中の詔書情報
の個数である。なお、bをきめることにより重ね合せ符
号のサイズは自由に設計できる。FIG. 2 shows the configuration of the superposition code creation device 2. As shown in FIG. The natural language starting information from the dictionary information storage device 1 is given to the bcw creation device 21 of the superposition code creation device 2. The starting information R has one or more keywords, number Ri. For example, the word ``Japan'' is ``Japan'' as a keyword,
It has two keywords: "proper noun". bcw
In the creation device 21, one or more input keywords 1
For each one, some bits of b bits are “l”
A bit string of length b called bcW (binary code word) is created using a no-nosh function that sets 0 and the rest are 0. In the illustrated example, the keyword "Japan J" is 01010100. The keyword "proper noun" is 0.
An 8-bit bit string of 0011010 is created. bc
The w superimposition device n creates a bit string 5 (Ri) of length b by ORing these Ri bcw bit by bit as a dictionary superimposition code of the starting information Ri. In the illustrated example, the dictionary superimposition code is 010111 for "Japan" at the beginning of the school day.
10 is created. This operation is performed for all the start-of-day information in the dictionary information storage device 1, and a dictionary superimposition code is created for each start-of-day information. The F dictionary superposition codes thus created are stored in the superposition code storage device 3 as b bit strings of length F, as explained in FIG. Here, F is the number of pieces of edict information in the dictionary information storage device 1. Note that by determining b, the size of the superposition code can be freely designed.
第3図は重ね合せ符号作成装置2で作成されたF本の辞
書重ね合せ符号を重ね合せ符号蓄積装置3に蓄積する様
子を示す。前述したように、重ね合せ符号作成装置2で
は、辞書情報蓄積装置1に蓄積されているF個の語粟に
ついて重ね合せ符号を作成する。第3図に図示した例で
は、■「日本」、■「アメリカ」、■「イギリス」の3
つの始業に対してそハぞれ01011110.1101
1010.11011110の3本の重ね合せ符号が作
成された例を示している。これらF本の重ね合せ符号は
、重ね合せ符号蓄積装置3に蓄積される際には縦横を変
換したビット列として蓄積される。すなわち、第3図に
示したように、bcw重ね合せ装置nよシの形で出力さ
れた重ね合せ符号は、重ね合せ符号蓄積装置3では、そ
の縦横が変換されての形で蓄積される。このように、重
ね合せ符号作成装置2で作成されたF本、bビット列の
重ね合せ符号は、重ね合せ符号蓄積装置3ではb本、F
ビット列、すなわちb行F列の重ね合せ信号として蓄積
される。この場合詔書■、■、■は縦の列情報として蓄
積されることになる。FIG. 3 shows how F dictionary superposition codes created by the superposition code creation device 2 are stored in the superposition code storage device 3. As described above, the superposition code creation device 2 creates superposition codes for the F words stored in the dictionary information storage device 1. In the example shown in Figure 3, there are three
01011110.1101 for each starting day.
An example is shown in which three superposition codes of 1010.11011110 are created. When these F superposition codes are stored in the superposition code storage device 3, they are stored as bit strings whose vertical and horizontal directions have been converted. That is, as shown in FIG. 3, the superposition code outputted from the bcw superposition device n is stored in the superposition code storage device 3 in a form in which the vertical and horizontal directions have been converted. In this way, the superposition code of F and b bit strings created by the superposition code creation device 2 is stored in the superposition code storage device 3 of b and F bit strings.
It is stored as a bit string, that is, a superposed signal of rows B and columns F. In this case, the edicts ■, ■, ■ will be stored as vertical column information.
一方、入力装置4より与えられた質問も同様に重ね合せ
符号化される。この様子を第4図により説明する。いま
、入力装置4に「固有名詞の日本を辞書引きせよ。」と
いう指令が入力された場合を考える。On the other hand, questions given from the input device 4 are also superposition encoded in the same way. This situation will be explained with reference to FIG. Now, let us consider a case where the command ``Look up the proper noun Japan in a dictionary'' is input to the input device 4.
入力装置4から得た質問を質問処理装置5で1個以上の
キーワードに分解する。上記指令の場合には「固有名詞
」、「日本」の2つのキーワードに分解される。これら
のキーワードについて、辞書重ね合せ符号の作成・蓄積
の場合と同じ/・ソシュ関数を用いる重ね合せ符号作成
装置2を用いて、すなわちbcw作成装置21を用いて
bcwとして、「固有名詞;0OOIIOIOJ、「日
本; 01010100Jか作成され、つぎに、bcw
重ね合せ装置二により質問重ね合せ符号rQ;0IOI
IIIOJが作成される。こうして質問が重ね合せ符号
化される。A question obtained from an input device 4 is broken down into one or more keywords by a question processing device 5. In the case of the above directive, it is broken down into two keywords: "proper noun" and "Japan". Regarding these keywords, the same as in the case of creating and storing dictionary superposition codes/- Using the superposition code creation device 2 using the Sosch function, that is, using the bcw creation device 21, as bcw, "proper noun; 0OOIIOIOJ, “Japan; 01010100J was created, then bcw
The superposition device 2 generates a query superposition code rQ;0IOI
IIIOJ is created. The question is thus superposition coded.
この質問重ね合せ符号Qは検索装置6に供給される。検
索装置6では、質問重ね合せ符号と重ね合せ符号蓄積装
置中のデータを照合して、ドロップと呼ばれる検索結果
を求める。すなわち、質問重ね合せ符号で“1″が立っ
ているビット位置i(図示の例では位置” t’%
0% dX e)に対応する重ね合せ符号蓄積装置3に
おける蓄積データの1行めのビット列に対して、ビット
毎の論理積をとることによってドロップが簡単に求めら
れる。This query superposition code Q is supplied to the search device 6. The search device 6 compares the query superposition code with the data in the superposition code storage device to obtain a search result called a drop. That is, the bit position i where "1" is set in the query superposition code (position "t'% in the illustrated example)
Drops can be easily determined by performing a bit-by-bit logical product on the bit string of the first row of stored data in the superposition code storage device 3 corresponding to 0% dX e).
この論理積の結果であるビット列において“1”が立っ
ているビットjに対応する詔書情報が検索装置6におけ
る検索結果である。図示の例では始業■、■が検索結果
として得られる。検索装置6による検索結果であるドロ
ップは質問に対する正しい検索結果の詔書情報を必ず含
んでいるが、フォルスドロップと呼ばれる誤って検索さ
れた詔書情報も含む場合があるので、照合装置7により
、ドロップからフォルスドロップを除去する。この操作
を第5図によシ説明する。照合装置7は、検索装置6か
ら受けた検索結果、すなわち、ドロップにおいて“1”
が立りているビットが示す辞書情報蓄積装置1中の詔書
情報、図示の例では0日本と■イギリスの2つの語紮情
報を質問Qと照合し、一致したもの、図示の例では0日
本を正しい検索結果として出力装置8に出力表示する。The edict information corresponding to the bit j in which "1" is set in the bit string that is the result of this logical product is the search result in the search device 6. In the illustrated example, opening hours ■ and ■ are obtained as search results. The drop, which is the search result by the search device 6, always includes edict information that is the correct search result for the question, but it may also include edict information that was incorrectly searched, called a false drop. Eliminate false drops. This operation will be explained with reference to FIG. The collation device 7 receives the search result from the search device 6, that is, “1” in the drop.
The imperial edict information in the dictionary information storage device 1 indicated by the bit that is set, in the illustrated example, the two words of ``Japanese'' and ■British are compared with the question Q, and those that match are 0 Japanese in the illustrated example. is output and displayed on the output device 8 as a correct search result.
発明の効果
以上のように、本発明は辞書情報蓄積装置の詔書情報を
重ね合せ符号化して重ね合せ符号蓄積装置に蓄積し、重
ね合せ符号蓄積装置に蓄えられた辞書情報蓄積装置の内
容を表わす辞書重ね合せ符号と質問処理装置によりキー
ワードを変換した質問重ね合せ符号との部分照合検索を
行い、その検索結果が表わす辞書情報とキーワードとの
照合を行うようにしたもので、重ね合せ符号蓄積装置中
のデータは、従来の方式による辞書引き装置における転
置ファイルに比べてはるかに小さく、メンテナンスも容
易である。さらに、重ね合せ符号蓄積装置中のデータの
サイズを自由に変更することができるため、各種の電子
計算機上の自然言語処理装置に対して辞書引き機能を提
供することができる。Effects of the Invention As described above, the present invention superimposes the edict information in the dictionary information storage device, stores it in the superposition code storage device, and represents the contents of the dictionary information storage device stored in the superposition code storage device. A partial matching search is performed between the dictionary superimposition code and the query superimposition code whose keywords have been converted by the query processing device, and the dictionary information represented by the search result is compared with the keyword. The data contained therein is much smaller than the transposed file in a conventional dictionary lookup device, and maintenance is easy. Furthermore, since the size of data in the superposition code storage device can be changed freely, a dictionary lookup function can be provided to natural language processing devices on various electronic computers.
また、重ね合せ符号による処理を行っているので、辞書
情報蓄積装置の始業数にほとんど無関係に高速にドロッ
プの検索が可能である。Furthermore, since processing is performed using superimposed codes, it is possible to search for drops at high speed almost regardless of the number of starting operations of the dictionary information storage device.
第1図は本発明の一実施例における辞書引き装置の概念
を示すブロック図、第2図は第1図の構成における重ね
合せ符号作成部の概念を示すブロック図、第3図は第1
図の構成における重ね合せ符号蓄積部分の概念を示すブ
ロック図、第4図は第1図の構成における検索部の概念
を示すブロック図、第5図は第1図の構成における照合
部の概念を示すブロック図である。
l・・・辞書情報蓄積装置、2・・・重ね合せ符号作成
装置、3・・・重ね合せ符号蓄積装置、4・・・入力装
置、5・・・質問処理装置、6・・・検索装置、7・・
・照合装置、8・・・出力装置、21・・・bcw作成
装置、n・・・bcw重ね合せ装置。
代理人の氏名 弁理士 粟野重孝 ほか1名り
郊2図
i〒
O
し=
第
図FIG. 1 is a block diagram showing the concept of a dictionary lookup device in an embodiment of the present invention, FIG. 2 is a block diagram showing the concept of a superposition code creation section in the configuration of FIG. 1, and FIG.
FIG. 4 is a block diagram showing the concept of the superposition code storage part in the configuration shown in the figure. FIG. 4 is a block diagram showing the concept of the search unit in the configuration shown in FIG. 1. FIG. FIG. l... Dictionary information storage device, 2... Superposition code creation device, 3... Superposition code storage device, 4... Input device, 5... Question processing device, 6... Search device ,7...
- Collation device, 8... Output device, 21... bcw creation device, n... bcw superposition device. Name of agent: Patent attorney Shigetaka Awano and one other person Figure 2
Claims (2)
と、辞書引きのための質問を入力する入力装置と、前記
語彙情報および質問の各々について、各キーワードを符
号化後重ね合せ符号に変換する重ね合せ符号作成装置と
、語彙情報の重ね合せ符号と質問の重ね合せ符号との部
分照合を行う検索装置と、前記検索装置の検索結果に対
応する語彙情報と質問のキーワードを照合する照合装置
とを具備したことを特徴とする辞書引き装置。(1) A dictionary information storage device that stores natural language vocabulary information, an input device that inputs questions for dictionary lookup, and converts each keyword into a superposition code after encoding each keyword for each of the vocabulary information and questions. a search device that performs partial matching between the superposition code of vocabulary information and the superposition code of the question; and a matching device that matches the keywords of the question with the vocabulary information corresponding to the search results of the search device. A dictionary lookup device characterized by comprising:
重ね合せ符号蓄積装置を備え、この重ね合せ符号蓄積装
置に蓄積された重ね合せ符号を質問の重ね合せ符号で部
分照合する請求項1記載の辞書引き装置。(2) Claim 1, further comprising a superimposition code storage device for vertically and horizontally converting superimposed codes of vocabulary information and storing the superimposed codes, and partially collating the superimposed codes stored in the superimposed code storage device with the superimposed codes of questions. Dictionary lookup device described.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1042380A JPH02297193A (en) | 1989-02-22 | 1989-02-22 | Dictionary consulting device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1042380A JPH02297193A (en) | 1989-02-22 | 1989-02-22 | Dictionary consulting device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02297193A true JPH02297193A (en) | 1990-12-07 |
Family
ID=12634452
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1042380A Pending JPH02297193A (en) | 1989-02-22 | 1989-02-22 | Dictionary consulting device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02297193A (en) |
-
1989
- 1989-02-22 JP JP1042380A patent/JPH02297193A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6493713B1 (en) | Dictionary and index creating system and document retrieval system | |
| KR100734741B1 (en) | Word recognition method and system and computer program memory storage device | |
| JP4502114B2 (en) | Database search device | |
| KR100288144B1 (en) | Foreign language coding method in Korean and search method using the same | |
| JPH02297193A (en) | Dictionary consulting device | |
| EP1072986A2 (en) | System and method for extracting data from semi-structured text | |
| Baruah et al. | Design and development of soundex for assamese language | |
| JPH0869474A (en) | Similar character string search device | |
| KR102550868B1 (en) | verification system for achievements of faculty | |
| JPS63136224A (en) | Automatic key word extracting device | |
| JPS58123126A (en) | Dictionary retrieving device | |
| JP3048793B2 (en) | Character converter | |
| JPH01266670A (en) | Extracting processing system for characteristic vocabulary in japanese object sentence | |
| JPH10307839A (en) | Text search apparatus and method | |
| Segert et al. | A Computer Program for Analysis of Words According to Their Meaning (Conceptual analysis of Latin equivalents for the comparative dictionary of Semitic languages) | |
| JPH0236475A (en) | Character string retrieving device | |
| JPH09101951A (en) | Document retrieving device | |
| JPH06309360A (en) | Full-text searching method matching process of negation condition | |
| JP2839515B2 (en) | Character reading system | |
| JPH0298778A (en) | Automatic document classification device | |
| JPH0916575A (en) | Pronunciation dictionary device | |
| JPS62160534A (en) | String matching method | |
| JPS63138479A (en) | Character recognizing device | |
| JPH01199263A (en) | Keyword extraction device | |
| JPH03127254A (en) | Word retrieving device |