JPH01237724A - Ambiguous string search display method - Google Patents

Ambiguous string search display method

Info

Publication number
JPH01237724A
JPH01237724A JP63063444A JP6344488A JPH01237724A JP H01237724 A JPH01237724 A JP H01237724A JP 63063444 A JP63063444 A JP 63063444A JP 6344488 A JP6344488 A JP 6344488A JP H01237724 A JPH01237724 A JP H01237724A
Authority
JP
Japan
Prior art keywords
search
displayed
ambiguous
string
search results
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63063444A
Other languages
Japanese (ja)
Inventor
Yoshiko Ogawa
小川 佳子
Yoshinori Okami
吉規 岡見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63063444A priority Critical patent/JPH01237724A/en
Publication of JPH01237724A publication Critical patent/JPH01237724A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はあいまい文字列検索表示方法にかかり、更に詳
しくはオペレータが検索結果を認識・把握するのに好適
なあいまい文字列検索表示方法に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to an ambiguous character string search and display method, and more particularly to an ambiguous character string search and display method suitable for an operator to recognize and understand search results.

〔従来の技術〕[Conventional technology]

従来技術は、光デイスクファイルシステムHitFil
e 650のマニュアル、2250−10−012−3
0 (日立製作所発行)、第152頁から第241頁に
記載のように、単に検索結果を検索した順に表示するか
、あるいは検索結果自体に対してソーティングを行い、
表示していた。
The conventional technology is the optical disk file system HitFil.
e 650 manual, 2250-10-012-3
0 (published by Hitachi, Ltd.), pages 152 to 241, you can simply display the search results in the order they were searched, or sort the search results themselves.
It was displayed.

尚、あいまい文字列検索については、日経エレクトロニ
ツクス、1987.6.1 (No、422)第165
頁から第181頁で論じられている。
Regarding ambiguous character string search, see Nikkei Electronics, June 1, 1987 (No. 422) No. 165.
Discussed on pages 181 to 181.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

上記従来技術においては、あいまい文字列検索を行い、
その検索結果を表示する際、検索類に表示するか、又は
検索結果自体に対してソーティングを行い表示している
。そのため、あいまい文字列検索結果の表示は、あいま
い文字列検索ではない通常の完全一致型の検索結果の表
示と同様であり、検索文字列に一致した文字列と、あい
まい性を含むオペレータの入力した検索文字列に一致し
た文字列とが、同一表示画面上に煩雑に表示される。
In the above conventional technology, an ambiguous character string search is performed,
When displaying the search results, they are displayed in search categories, or the search results themselves are sorted and displayed. Therefore, the display of fuzzy string search results is the same as the display of normal exact match search results that are not fuzzy string searches, and the strings that match the search string and the operator's input that contains ambiguity are displayed. Character strings that match the search character string are displayed in a complicated manner on the same display screen.

そのため、オペレータは、どれがあいまい文字列検索結
果の表示であるか認識・把握するのに時間がかかり、大
変見にくい表示となっていた。
Therefore, it takes time for the operator to recognize and understand which display is an ambiguous character string search result, resulting in a display that is very difficult to read.

この発明は上記した従来技術の問題点に鑑みなされたも
ので、オペレータがあいまい文字列検索結果を容易に認
識・把握することができるあいまい文字列検索表示方法
を提供することを目的としている。
The present invention was made in view of the problems of the prior art described above, and an object of the present invention is to provide an ambiguous character string search display method that allows an operator to easily recognize and understand ambiguous character string search results.

〔課題を解決するための手段〕[Means to solve the problem]

上記目的は、検索を実施する際にオペレータより受けた
検索結果の表示方式の指定に基づいて、検索結果と検出
に至った理由を併せて表示し、あるいは検出理由毎に分
類して表示を行うことにより達成される。
The above purpose is to display the search results and the reason for detection together, or to display them categorized by detection reason, based on the search result display method specified by the operator when conducting the search. This is achieved by

〔作 用〕[For production]

検索時にいかなる理由によって検出したのかを検知して
おくことにより、検索結果に検出理由を付加した表示を
行うことができる。また、検出理由毎に分類した表示を
行う場合には、検出理由毎に検出された文字列をメモリ
に格納しておくことにより、類似度の高い順にも、ある
いはオペレータの希望する順にも自由に表示することが
できる。
By detecting the reason for detection at the time of search, it is possible to display search results with the detection reason added. In addition, when displaying characters classified by detection reason, by storing the character strings detected for each detection reason in memory, the character strings can be displayed in order of similarity or in the order desired by the operator. can be displayed.

さらに、該当件数の多い順に表示することができる。Furthermore, the items can be displayed in descending order of the number of matching items.

〔実施例〕〔Example〕

以下、添付の図面に示す実施例により、更に詳細に本発
明について説明する。
Hereinafter, the present invention will be explained in more detail with reference to embodiments shown in the accompanying drawings.

第2図はこの発明のあいまい文字列検索表示方法を実行
する光デイスク装置を用いた電子ファイルング装置を示
すブロック図である。オペレータによって操作部6から
入力された検索条件は、制御装置1に入力される。制御
装置1は、有限オートマトンをオートマトン・テーブル
7上へ作成し、光デイスク入出力制御装置2を通じて光
ディスク3より検索対象文字列の読み出しを行い、メモ
リ4へ格納する。検索処理部8は、オートマトンを活用
した検索機構を備えており、オートマトン・テーブル7
を用いてメモリ4に格納された検索対象文字列の検索を
実施する。検索文字列に適合した検索対象文字列はメモ
リ4格納される。制御装置1はメモリ4上に検出された
検索結果を適切な表示形式に修正し1表示装置5に表示
を行う。
FIG. 2 is a block diagram showing an electronic filing device using an optical disk device that executes the ambiguous character string search and display method of the present invention. Search conditions input by the operator from the operation unit 6 are input to the control device 1 . The control device 1 creates a finite automaton on the automaton table 7, reads the search target character string from the optical disk 3 through the optical disk input/output control device 2, and stores it in the memory 4. The search processing unit 8 is equipped with a search mechanism that utilizes an automaton, and the automaton table 7
A search for the search target character string stored in the memory 4 is carried out using . A search target character string matching the search character string is stored in the memory 4. The control device 1 corrects the search results detected on the memory 4 into an appropriate display format and displays them on the display device 5.

文字列に広く幅を持たせた検索文字列を複数作成するこ
とにより達成する。例えば、′理化学辞典1のあいまい
文字列検索を実施する場合、検索文字列中の一文字を′
?′ に置き換える、または挿入することにより、前者
では誤りを、後者では混入といったあいまい性を含む文
字列の検索を行うことができる。また、検索文字列中の
文字を削除することにより欠如といったあいまい性を含
む文字列の検索実施可能となる。このように検索文字列
の一文字分を“?′に置き換える、挿入する、あるいは
文字を削除することによりあいまい文字列検索を実現さ
せる。
This is achieved by creating multiple search strings with a wide range of strings. For example, when performing an ambiguous string search for 'Physical and Chemistry Dictionary 1,'
? By replacing or inserting ′, it is possible to search for strings that contain ambiguities, such as errors in the former case and mixtures in the latter case. Furthermore, by deleting characters in the search string, it becomes possible to search for strings that include ambiguity such as missing characters. In this way, an ambiguous string search is realized by replacing, inserting, or deleting one character in the search string with "?".

次に、この発明のあいまい文字検索表示方法について、
第1図を用いて説明する。あいまい文字検索は、第1図
に示す様に、第2図に示す操作部6から入力された検索
条件の中から検索文字列を取り出し、これを展開して複
雑の検索文字列を生成し、オートマトン・テーブル7に
有限オートマトンを作成することから始まる(ステップ
100)。
Next, regarding the ambiguous character search display method of this invention,
This will be explained using FIG. In the ambiguous character search, as shown in FIG. 1, a search string is extracted from the search conditions input from the operation unit 6 shown in FIG. 2, and expanded to generate a complex search string. The process begins by creating a finite automaton in the automaton table 7 (step 100).

更に、上記検索条件の中からオペレータが希望する検索
結果表示方法を取り込み(101) 、更に、オペレー
タから指示された検索条件に基き、検索を実施する上で
必要となる詳細な情報を検索処理な検索に関する情報を
基に光ディスクから読み出された検索対象文字列の検索
を実施する(103) 。
Furthermore, the search result display method desired by the operator is taken in from the above search conditions (101), and furthermore, detailed information necessary for carrying out the search is searched based on the search conditions instructed by the operator. A search is performed for the search target character string read from the optical disc based on the information regarding the search (103).

次に、オペレータが指示した検索文字列の長さと検索結
果の文字列の長さとを比較し、一致した場合にはステッ
プ105に進み、不一致の場合にはステップ106に進
む、ステップ105においては、オペレータが指示した
検索文字列と検索結果として得られた検索結果文字列と
が完全に一致するか否かが判定される。また、ステップ
106においては。
Next, the length of the search string specified by the operator is compared with the length of the search result string, and if they match, proceed to step 105; if they do not match, proceed to step 106. In step 105, It is determined whether the search string specified by the operator and the search result string obtained as a search result completely match. Also, in step 106.

検索結果の文字列が、オペレータの指示した検索文字列
中から文字を欠如したものか否なかが判定される。上記
ステップ104.105.106によって、検索結果の
文字は、検索結果の文字列と検索文字列とが″完全に一
致′″する場合(107)と、検索結果の文字列があい
まい文字を含む″あいまい誤り”の場合(108)と、
検索結果の文字列が検索文字列よりも文字数が少ない“
あいまい欠如″の場合(109)と、検索結果の文字列
のあいまい文字が混入している“あいまい混入”の場合
(11G)とに分けられる。そして、それぞれの場合に
おいて、図示するようにフラグを立てる処理を行う、そ
して、検索された全ての文字列について、上記の判定を
行い、″完全一致”の文字列数を計数しく111)。
It is determined whether the character string of the search result is one in which a character is missing from the search character string specified by the operator. Through steps 104, 105, and 106, the characters in the search result are divided into cases where the character string in the search result and the search string are a "perfect match" (107), and cases where the character string in the search result contains ambiguous characters (107). In the case of “ambiguous error” (108),
The search result string has fewer characters than the search string“
The search result can be divided into two cases: ``ambiguous absence'' (109) and ``ambiguous inclusion'' (11G) in which ambiguous characters are mixed in the string of search results.In each case, flags are set as shown in the figure. 111).

″あいまい誤り″の文字列数を計数しく112) 、 
”あいまい欠如″の文字列数を計数しく113) 、”
あいまい混入″の文字列数を計数する(114) 。
Count the number of character strings with "ambiguous errors"112),
Please count the number of strings with “ambiguous missing”113),”
The number of character strings with "ambiguous inclusion" is counted (114).

次に、オペレータの検索結果表示の指示が、検出理由の
添付のみか否かを判定しく115) 、イエスと判定さ
れた場合には、第4図に示すように検索結果の文字列D
−1〜D−Nを表示し、更に文字列毎に検出理由R−1
〜R−Nを表示する。
Next, it is determined whether the operator's instruction to display the search results is to only attach the detection reason (115), and if the determination is yes, the character string D of the search results is displayed as shown in FIG.
-1 to D-N are displayed, and the detection reason R-1 is displayed for each character string.
~Display RN.

ステップ116において、ノオと判定された場合には、
ステップ111.112.113.114で立てたフラ
グに従って、所定のメモリ領域に各検索結果の文字列を
格納する(117) 、次に、オペレータの検索結果の
表示の指示が″類似度の高い順に表示″か否かを判定し
く118) 、イエスと判定された場合には第5図に示
すように検索結果D−1〜D−8が類似度の高い順(一
致→誤り→欠如→混入の順)に表示される(119) 
、オペレータの検索結果の表示の指示が“類似度の高い
順に表示”ではないと判定された場合には、オペレータ
の検索結果の表示の指示が″オペレータの希望順に表示
”か否かを判定しく120) 、イエスと判定された場
合には第6図に示すように検索結果D−1〜D−8がオ
ペレータの希望順に表示される。第6図の例では、オペ
レータの希望順は、一致→欠如→混入→誤りの順となっ
ている。検索結果の表示の指示が“オペレータの希望順
に表示”ではないと判定された場合には、一致・混入・
欠如・誤りのうち、件数の多い順に表示される(122
)。
In step 116, if it is determined as NO,
In accordance with the flags set in steps 111, 112, 113, and 114, the character strings of each search result are stored in a predetermined memory area (117).Next, the operator's instruction to display the search results is "in order of similarity". 118), and if the determination is yes, the search results D-1 to D-8 are sorted in order of similarity (match → error → missing → contamination) as shown in Figure 5. (119)
, if it is determined that the operator's search result display instruction is not "display in order of similarity", then it is determined whether the operator's search result display instruction is "display in order of operator's preference" or not. 120) If the answer is yes, the search results D-1 to D-8 are displayed in the order desired by the operator, as shown in FIG. In the example shown in FIG. 6, the operator's desired order is match→missing→contamination→error. If it is determined that the instruction for displaying search results is not "display in the order of operator's preference", matching, mixing,
Displayed in descending order of missing items/errors (122
).

尚、上記の実施例においては、完全一致やあいまい誤り
等を表すフラグをステップ111.112゜113、1
14において立てるようにしたが、この発明はこれに限
定されるものではなく1例えばステップ103において
上記のフラグを立てるようにしてもよい。
In the above embodiment, flags indicating exact matches, ambiguous errors, etc. are set in steps 111, 112, 113, 1.
Although the flag is set in step 14, the present invention is not limited to this, and for example, the above flag may be set in step 103.

〔発明の効果〕〔Effect of the invention〕

本発明によれば、あいまい文字列検索によって得られた
検索結果を単にオペレータに知らせるだけでなく、オペ
レータの希望に応じて、次の様な表示をすることができ
る。即ち、検出に至った理由を検索結果に添加すること
により煩雑で見にくい検索結果の表示をオペレータが活
用し易い検索結果表示とすることができる。また、検出
に至った理由をまとめ、類似度の高い順(例:完全一致
、1文字の誤り、2文字の誤り・・・)に、あるいはオ
ペレータの希望する順に検索結果を表示することにより
、より一層オペレータの使い易さを向上させることがで
きる。さらには、該当件数の多い順に表示することによ
°す、オペレータの入力した検索文字列に対して最も使
用頻度の高い類似した文字列を知らせることができる。
According to the present invention, it is possible not only to simply notify the operator of the search results obtained by the ambiguous character string search, but also to display the following in accordance with the operator's wishes. That is, by adding the reason for the detection to the search results, it is possible to change the display of search results from being complicated and difficult to see to one that is easy for the operator to utilize. In addition, by summarizing the reasons for the detection and displaying the search results in order of similarity (for example, exact match, one character error, two character errors, etc.) or in the order desired by the operator, Ease of use for the operator can be further improved. Furthermore, by displaying the search strings in descending order of the number of matches, it is possible to notify the operator of the most frequently used strings similar to the search string input.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明のあいまい文字列検索表、置方法の一実
施例を示すフローチャート、第2図は本発明のあいまい
文字列検索表示方法を実行する電子ファイリング装置の
一例を示すブロック図、第3図は1つの検索文字列とこ
れを展開して作成した複数の検索文字列と作成された各
検索文字列に対する検索結果とを示す説明図、第4図、
第5図。 第6図、第7図は検索結果の表示例を示す説明図である
。 1:制御装置、2:光デイスク入出力制御装置、5:表
示装置、6:操作部、7:オートマトン・テーブル、8
:検索処理部、D−N :検出された文字列、R−N:
検出理由6 代理人弁理士  秋 本 正 実 第 2U5 第3図 腋俵文字列  展間        象4J6災第4図 第 5 図 第6図
FIG. 1 is a flowchart showing an embodiment of the ambiguous character string search table and storage method of the present invention, and FIG. Figure 3 is an explanatory diagram showing one search string, multiple search strings created by expanding this, and search results for each search string created;
Figure 5. FIGS. 6 and 7 are explanatory diagrams showing display examples of search results. 1: Control device, 2: Optical disk input/output control device, 5: Display device, 6: Operation unit, 7: Automaton table, 8
: Search processing unit, D-N: Detected character string, R-N:
Reason for Detection 6 Agent Patent Attorney Tadashi Akimoto Jitsu No. 2U5 Figure 3 Armpit Strings Tenma Elephant 4J6 Disaster Figure 4 Figure 5 Figure 6

Claims (1)

【特許請求の範囲】 1、オペレータが指定した検索文字列に基づいて複数の
検索文字列を生成し、生成された各検索文字列について
検索対象文字列の検索を行い、検索結果を表示するあい
まい文字列検索表示方法において、検索結果の文字列と
検出理由とを併せて表示することを特徴とするあいまい
文字列検索表示方法。 2、検索結果を検出理由毎に分類して表示することを特
徴とする請求項1記載のあいまい文字列検索表示方法。 3、上記検索結果を検出理由毎に分類して表示する際に
、検出理由毎に分類された検索結果を類似度が高い順に
表示することを特徴とする請求項2記載のあいまい文字
列検索表示方法。 4、上記検索結果を検出理由毎に分類して表示する際に
、オペレータの指定した順序で検出理由毎に分類された
検索結果を表示することを特徴とする請求項2記載のあ
いまい文字列検索表示方法。 5、上記検索結果を検出理由毎に分類して表示する際に
、検出理由毎に分類された検索結果を検出件数の多い分
類順に表示することを特徴とする請求項2記載のあいま
い文字列検索表示方法。
[Claims] 1. An ambiguous method in which a plurality of search strings are generated based on a search string specified by an operator, a search target string is searched for each generated search string, and the search results are displayed. An ambiguous character string search and display method characterized in that a character string of a search result and a detection reason are displayed together. 2. The ambiguous character string search and display method according to claim 1, wherein the search results are classified and displayed for each detection reason. 3. The ambiguous character string search display according to claim 2, characterized in that when the search results are classified and displayed for each detection reason, the search results classified for each detection reason are displayed in descending order of similarity. Method. 4. The ambiguous string search according to claim 2, characterized in that when the search results are classified and displayed according to the detection reason, the search results classified according to the detection reason are displayed in an order specified by the operator. Display method. 5. The ambiguous character string search according to claim 2, characterized in that when the search results are classified and displayed for each detection reason, the search results classified for each detection reason are displayed in the order of classification with the largest number of detected results. Display method.
JP63063444A 1988-03-18 1988-03-18 Ambiguous string search display method Pending JPH01237724A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63063444A JPH01237724A (en) 1988-03-18 1988-03-18 Ambiguous string search display method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63063444A JPH01237724A (en) 1988-03-18 1988-03-18 Ambiguous string search display method

Publications (1)

Publication Number Publication Date
JPH01237724A true JPH01237724A (en) 1989-09-22

Family

ID=13229427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63063444A Pending JPH01237724A (en) 1988-03-18 1988-03-18 Ambiguous string search display method

Country Status (1)

Country Link
JP (1) JPH01237724A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108004A (en) * 1991-10-14 1993-04-30 Matsushita Electric Ind Co Ltd Place name retrieving method for navigation system
JPH1074205A (en) * 1996-08-30 1998-03-17 Matsushita Electric Ind Co Ltd Similar name search device
JPH10154156A (en) * 1996-11-22 1998-06-09 Nec Corp English word retrieval device
WO2010026804A1 (en) * 2008-09-05 2010-03-11 日本電信電話株式会社 Approximate collation device, approximate collation method, program, and recording medium
JPWO2016113878A1 (en) * 2015-01-15 2017-04-27 三菱電機株式会社 Secret search system, secret search program, and converted search key generation device

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108004A (en) * 1991-10-14 1993-04-30 Matsushita Electric Ind Co Ltd Place name retrieving method for navigation system
JPH1074205A (en) * 1996-08-30 1998-03-17 Matsushita Electric Ind Co Ltd Similar name search device
JPH10154156A (en) * 1996-11-22 1998-06-09 Nec Corp English word retrieval device
WO2010026804A1 (en) * 2008-09-05 2010-03-11 日本電信電話株式会社 Approximate collation device, approximate collation method, program, and recording medium
CN102138141A (en) * 2008-09-05 2011-07-27 日本电信电话株式会社 Approximate collation device, approximate collation method, program, and recording medium
JP5238034B2 (en) * 2008-09-05 2013-07-17 日本電信電話株式会社 Approximate collation device, approximate collation method, program, and recording medium
JPWO2016113878A1 (en) * 2015-01-15 2017-04-27 三菱電機株式会社 Secret search system, secret search program, and converted search key generation device

Similar Documents

Publication Publication Date Title
US4775956A (en) Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes
KR890015115A (en) Application program provision method and multi-language system and data processing system for application program
JP2693914B2 (en) Search system
JPH01237724A (en) Ambiguous string search display method
KR920003457B1 (en) Relational data searching apparatus
JPH0233661A (en) Character processing device with automatic address input function
JPS6378228A (en) information retrieval device
JP2588261B2 (en) Address database search device by OCR
JP3585944B2 (en) Data processing method and apparatus
JP2549745B2 (en) Document search device
JPS62266619A (en) Keyword input method for document filing system
JPH07239861A (en) Document retrieval device
JP2806653B2 (en) File search device
JPH022458A (en) Similar document search device
JPS62121532A (en) Data search method
JP2000259637A (en) Information retrieval apparatus, information retrieval method, and recording medium recording information retrieval processing program
JPH10124523A (en) Method and device for retrieving guidance of multimedia data
JP2795931B2 (en) Document creation device
JPH03240824A (en) Japanese word data input system
JPH10283375A (en) Device and method for full-text retrieval
JPH08278980A (en) Data processor
JPH0221363A (en) Document search method
JPS61100834A (en) document creation device
JPS6280729A (en) document processing device
JPH0245872A (en) CD-ROM search device