JPH10501912A - Nグラム・ワード分解を用いた携帯型文書索引付け用のシステム及び方法 - Google Patents
Nグラム・ワード分解を用いた携帯型文書索引付け用のシステム及び方法Info
- Publication number
- JPH10501912A JPH10501912A JP8531146A JP53114696A JPH10501912A JP H10501912 A JPH10501912 A JP H10501912A JP 8531146 A JP8531146 A JP 8531146A JP 53114696 A JP53114696 A JP 53114696A JP H10501912 A JPH10501912 A JP H10501912A
- Authority
- JP
- Japan
- Prior art keywords
- page
- gram
- map
- word
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/268—Lexical context
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (1)
- 【特許請求の範囲】 1.複数のワードを含む格納された文書を索引付けして、少なくとも1つの照会 ワードを含む入力探索照会に一致する少なくとも1つの文書を探索する方法にお いて、 各文書の選択されたワードのnグラムを格納するステップと、 少なくとも1つの照会ワードに対して、少なくとも1つの照会ワードnグラ ムを決定するステップと、 照会ワードnグラムのうちの選択されたものに一致するnグラムを有する文 書を検索するステップと、 を含む方法。 2.nグラムを格納するステップは、 ある文書の各ページの非停止ワードを識別するステップと、 各非停止ワードに対して、少なくとも1つのnグラムを決定するステップと 、 各ページのnグラムを格納するステップと、 を更に含む、請求項1の方法。 3.各nグラムに対して、そのnグラムが生じる少なくとも1つのページのマッ プを格納するステップと、 nグラムのリストに対応して、マップのリストを格納するステップと、 を更に含む、請求項2の方法。 4.文書を検索するステップは、 照会ワードnグラムをnグラムのリストの1つに突合せるス テップと、 nグラムのリストの1つの対応するマップを決定するステップと、 マップから、照会ワードnグラムを含むページを決定するステップと、 ページ、及びそれと関連した文書を検索するステップと、 を更に含む、請求項3の方法。 5.nグラムにより文書を索引付けするための記憶構造を備えるコンピュータ読 み取り可能メモリであって、各文書は文書番号、文書名、及び少なくとも1つの ページを有し、各ページはページ番号を有するコンピュータ読み取り可能メモリ において、 ページエントリのリストからなるバンクであって、各ページエントリは、そ のページを含む文書の文書番号によりページを、また文書内のページ番号を識別 する、バンクと、 バンクと関連したバンク索引であって、 i)複数のnグラム・エントリマップであって、各nグラム・エントリマッ プは単一のnグラムと関連し、選択されたnグラム・エントリマップは、バンク で識別された少なくとも1つのページが、nグラム・エントリマップと関連した nグラムを含む索引エントリマップへの索引を有する、複数のnグラム・エント リマップと、 ii)複数の索引エントリマップであって、各索引エントリマップは、nグラ ム・エントリマップの1つにより索引付け られ、各索引エントリマップは、索引エントリマップを索引付けするnグラム・ エントリマップと関連したnグラムを含むあるページを識別する、バンク内の各 ページエントリを識別する、複数の索引エントリマップと、 を備えるバンク索引と、 からなるコンピュータ読み取り可能メモリ。 6.バンク内の各ページエントリはオフセットを有し、 各索引エントリマップは複数のビット位置を含み、各ビット位置はバンク内 のあるページエントリと関連し、各ビット位置は、そのビット位置と関連したペ ージエントリにおいて識別されるページが、索引エントリマップを索引付けする nグラム・エントリマップと関連したnグラムを含む第1の値と、そのビット位 置と関連したページエントリにおいて識別されるページが、索引エントリマップ を索引付けするnグラム・エントリマップと関連したnグラムを含まない第2の 値とを有する、請求項5のコンピュータ読み取り可能メモリ。 7.ドロワから更になり、該ドロワは、 i)文書のリストであって、各文書は該リスト内で固有に識別される、文書の リストと、 ii)複数のバンク、及び関連したバンク索引と、 iii)複数のバンクの各々に対して、バンク内の多数の空ページエントリのカ ウント値を含むバンクリストと、 を備える、請求項5のコンピュータ読み取り可能メモリ。 8.各バンクは更に、 少なくとも1つのページキーを含むページキーテーブルであって、各ページ キーはバンク内のあるページエントリと関連し、 i)ページの各ワードに対して、そのワード内のnグラムのリストを備えるペ ージキーテーブルからなる、請求項5のコンピュータ読み取り可能メモリ。 9.文書を検索するコンピュータ実施の方法において、 コンピュータ読み取り可能メモリ上に、請求項5の記憶構造を格納するステ ップと、 照会語を受信するステップであって、照会語内の多数のnグラムの各々に対 して、 i)照会語のnグラムと関連したバンク索引内のnグラムマップから、ある索 引エントリマップがnグラムに対して存在するか否かを判定するステップと、 ii)現存する索引エントリマップに応答して、索引エントリマップから、索引 エントリマップと関連したnグラムを含むあるページを識別する、バンク内の各 ページエントリを決定するステップと、 iii)nグラムを含む各ページに対して、nグラムカウンタをインクリメント するステップと、 を含むステップと、 バンク内の各ページに対して、そのページに対するnグラムカウンタが、そ のページが照会語を含むことを示すために、照 会語内のnグラムの数と十分類似しているか否かを判定するステップと、 照会語内のnグラムの数と十分類似しているページ用のnグラムカウンタに 応答して、後続の照会解析のためのページを含む文書を検索するステップと、 を含む方法。 10.ページ用のnグラムカウンタが、照会語内のnグラムの数と十分類似するの は、 G[P]≦K*E/100 の場合であり、ここで、Pはページであり、G[P]はページP用のnグラム 一致カウンタであり、Kは照会語内のnグラム数であり、Eはnグラム一致カウ ンタとKの間の一致の割合を制御するために選択された、一致パラメータである 、請求項9のコンピュータ実施の方法。 11.複数の文書を索引付けするコンピュータ実施の方法であって、各文書は少な くとも1つのページを有し、各ページは、データの最大量よりすくないデータ量 を有し、また複数のワードを有する、コンピュータ実施の方法において、 ページのリストを格納するステップであって、各ページはある文書と関連す る、ステップと、 nグラムのリストを決定するステップと、 各nグラムに対して、そのnグラムを含むページのマップを確立するステッ プであって、該ステップは、 i)文書から現在のページを検索するステップと、 ii)該現在のページの各非停止ワードに対して、 1)ワード内のnグラムを決定するステップと、 2)ワード内の各nグラムに対して、そのnグラムと固有に関連し、またペ ージのリスト内の各ページに対するあるエントリを含むマップにおいて、ページ がnグラムを含むことを指示するように、現在のページに対するエントリを更新 するステップと、 により行われる、ステップと、 を含むコンピュータ実施の方法。 12.照会語を含む書類を更に検索するために、 照会語を受信するステップと、 該照会語内の多数のnグラムの各々に対して、 i)マップがそのnグラムに対して存在するか否かを判定するステップと、 ii)現存するマップに応答して、そのマップから、マップと関連したnグラ ムを含むリスト内の各ページを決定するステップと、 iii)リスト内の各ページに対して、そのページが、照会語を含むことを指 示するために、照会語内の十分な数のnグラムを含むか否かを判定するステップ と、 照会語を含む各ページに応答して、後続の照会解析のためにそのページを含 む文書を検索するステップと、 を含む、請求項11のコンピュータ実施の方法。 13.請求項11のステップを実行するために、プロセッサを構成及び制御するコ ンピュータ・プログラムを含む、コンピュータ読み取り可能メモリ。 14.各文書が少なくともいつのページを含む、複数の文書を索引付けするプロセ ッサを制御するためのコンピュータ読み取り可能メモリにおいて、 索引付きページのリストと、 索引マップのリストであって、各索引マップは、1つのnグラムと固有に関 連し、且つ複数のエントリを有し、各エントリは、索引付きページのリスト内の ページと固有に関連し、且つそのページが、索引マップと関連したnグラムを含 むか否かを指示する、索引マップのリストと、 ページ索引付けモジュールであって、 i)索引付けすべき現在のページを受け取り、 ii)索引付きページのリストにおいて、現在のページに対するエントリを作 成し、 iii)現在のページの各非停止ワードに対して、ワード内のnグラムのリス トを格納して、 iv)各nグラムに対して、現在のページがnグラムを含むことを指示するた めに、nグラムと関連した索引マップにおいて、現在のページに対するエントリ を更新する、 ページ索引付けモジュールと、 からなるコンピュータ読み取り可能メモリ。 15.ページ索引付けモジュールは、現在のページの非停止ワードに対して、 ワード内の各nグラムに対してnグラム番号を決定し、 ワード内の各nグラムのnグラム番号を格納して、 現在のページと、格納されたnグラム番号を関連づけることにより、ワード 内のnグラムのリストを格納する、請求項14のコンピュータ読み取り可能メモ リ。 16.あるワードのnグラム番号は、 という式により決定され、ここで、NGはワードのnグラム番号であり、xは ワードの第i文字のnグラム文字番号であり、Cmaxは索引付け可能な文字の総 数であり、Npはnグラム内のレターの所望数である、請求項15のコンピュー タ読み取り可能メモリ。 17.各文書が少なくとも1つのページを含む、複数の文書からの照会語を含む文 書を索引付けするプロセッサを制御するためのコンピュータ読み取り可能メモリ において、 各ページがある文書と関連した、索引付きページのリストと、 索引マップのリストであって、各索引マップは、1つのnグラムと固有に関 連し、且つ複数のエントリを有し、各エントリは、索引付きページのリスト内の ページと固有に関連し、且つ そのページが、索引マップと関連したnグラムを含むか否かを指示する、索引マ ップのリストと、 探索モジュールであって、 i)照会語を受け取り、 ii)照会語内の多数のnグラムの各々に対して、 iii)照会語内の多数のnグラムの各々に対して、そのnグラムと関連した 索引マップがあるか否かを判定し、 iv)現存する索引マップに応答して、その索引マップから、マップと関連し たnグラムを含む索引付きページのリスト内の各ページを決定し、 v)索引付きページのリスト内の各ページに対して、そのページが、照会語 を含むことを指示するために、照会語内の充分な数のnグラムを含むか否かを判 定し、 vi)照会語を含むページに応答して、後続の照会解析のためにそのページを 含む文書を検索する、 探索モジュールと、 からなるコンピュータ読み取り可能メモリ。 18.探索モジュールは、あるページが、照会語内の充分な数のnグラムを含むか 否かを、 G[P]≦K*E/100 という式により判定し、ここで、Pはページであり、G[P]はページP内に 含まれる照会語におけるnグラム数であり、Kは照会語内のnグラム数であり、 Eは、ページP内に含まれる 照会語内のnグラム数とKの間の一致の割合を制御するために選択された、一致 パラメータである、請求項17のコンピュータ読み取り可能メモリ。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US08/419,126 | 1995-04-10 | ||
| US08/419,126 US5706365A (en) | 1995-04-10 | 1995-04-10 | System and method for portable document indexing using n-gram word decomposition |
| PCT/US1996/004945 WO1996032686A1 (en) | 1995-04-10 | 1996-04-10 | System and method for portable document indexing using n-gram word decomposition |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006031590A Division JP4559371B2 (ja) | 1995-04-10 | 2006-02-08 | Nグラム・ワード分解を用いた携帯型文書索引付け用のシステム及び方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH10501912A true JPH10501912A (ja) | 1998-02-17 |
| JP4162711B2 JP4162711B2 (ja) | 2008-10-08 |
Family
ID=23660908
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP53114696A Expired - Fee Related JP4162711B2 (ja) | 1995-04-10 | 1996-04-10 | Nグラム・ワード分解を用いた携帯型文書索引付け用のシステム及び方法 |
| JP2006031590A Expired - Fee Related JP4559371B2 (ja) | 1995-04-10 | 2006-02-08 | Nグラム・ワード分解を用いた携帯型文書索引付け用のシステム及び方法 |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006031590A Expired - Fee Related JP4559371B2 (ja) | 1995-04-10 | 2006-02-08 | Nグラム・ワード分解を用いた携帯型文書索引付け用のシステム及び方法 |
Country Status (10)
| Country | Link |
|---|---|
| US (1) | US5706365A (ja) |
| EP (1) | EP0764305B1 (ja) |
| JP (2) | JP4162711B2 (ja) |
| AU (1) | AU713572B2 (ja) |
| BR (1) | BR9606306A (ja) |
| DE (1) | DE69631457T2 (ja) |
| ES (1) | ES2214535T3 (ja) |
| NO (1) | NO965254L (ja) |
| NZ (1) | NZ306268A (ja) |
| WO (1) | WO1996032686A1 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011138230A (ja) * | 2009-12-25 | 2011-07-14 | Fujitsu Ltd | 情報処理プログラム、情報検索プログラム、情報処理装置、および情報検索装置 |
Families Citing this family (97)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6415307B2 (en) * | 1994-10-24 | 2002-07-02 | P2I Limited | Publication file conversion and display |
| US6243172B1 (en) * | 1995-01-18 | 2001-06-05 | Varis Corporation | Method and system for merging variable text and images into bitmaps defined by a page description language |
| US5729665A (en) * | 1995-01-18 | 1998-03-17 | Varis Corporation | Method of utilizing variable data fields with a page description language |
| US5875443A (en) * | 1996-01-30 | 1999-02-23 | Sun Microsystems, Inc. | Internet-based spelling checker dictionary system with automatic updating |
| US5864630A (en) * | 1996-11-20 | 1999-01-26 | At&T Corp | Multi-modal method for locating objects in images |
| US5852822A (en) * | 1996-12-09 | 1998-12-22 | Oracle Corporation | Index-only tables with nested group keys |
| GB9701866D0 (en) * | 1997-01-30 | 1997-03-19 | British Telecomm | Information retrieval |
| US5809496A (en) * | 1997-02-20 | 1998-09-15 | International Business Machines Corporation | Hybrid search |
| JP3554459B2 (ja) * | 1997-02-26 | 2004-08-18 | 株式会社日立製作所 | テキストデータ登録検索方法 |
| US5978797A (en) * | 1997-07-09 | 1999-11-02 | Nec Research Institute, Inc. | Multistage intelligent string comparison method |
| US6016546A (en) * | 1997-07-10 | 2000-01-18 | International Business Machines Corporation | Efficient detection of computer viruses and other data traits |
| US7302438B1 (en) | 1997-07-18 | 2007-11-27 | Tesseron Ltd. | Method and system for flowing data to an arbitrary path defined by a page description language |
| US6487568B1 (en) * | 1997-07-18 | 2002-11-26 | Tesseron, Ltd. | Method and system for flowing data to an arbitrary path defined by a page description language |
| US6118887A (en) * | 1997-10-10 | 2000-09-12 | At&T Corp. | Robust multi-modal method for recognizing objects |
| BE1012981A3 (nl) * | 1998-04-22 | 2001-07-03 | Het Babbage Inst Voor Kennis E | Werkwijze en systeem voor het weervinden van documenten via een elektronisch databestand. |
| US5991714A (en) * | 1998-04-22 | 1999-11-23 | The United States Of America As Represented By The National Security Agency | Method of identifying data type and locating in a file |
| WO2000007123A1 (en) * | 1998-07-28 | 2000-02-10 | Triada, Ltd. | Methods of deleting information in n-gram tree structures |
| US6169969B1 (en) * | 1998-08-07 | 2001-01-02 | The United States Of America As Represented By The Director Of The National Security Agency | Device and method for full-text large-dictionary string matching using n-gram hashing |
| US7315979B1 (en) | 1998-11-09 | 2008-01-01 | Tesseron Ltd. | Method and system for dynamic flowing data to an arbitrary path defined by a page description language |
| JP3696745B2 (ja) | 1999-02-09 | 2005-09-21 | 株式会社日立製作所 | 文書検索方法及び文書検索システム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
| US7031985B1 (en) * | 1999-03-08 | 2006-04-18 | Oracle International Corporation | Lexical cache |
| US6516329B1 (en) * | 1999-04-26 | 2003-02-04 | Gateway, Inc. | Method of maintaining search results pages |
| US6546383B1 (en) * | 1999-06-09 | 2003-04-08 | Ricoh Company, Ltd. | Method and device for document retrieval |
| US20020023123A1 (en) * | 1999-07-26 | 2002-02-21 | Justin P. Madison | Geographic data locator |
| JP4115048B2 (ja) * | 1999-08-17 | 2008-07-09 | 株式会社リコー | 文書検索システム |
| US6785810B1 (en) * | 1999-08-31 | 2004-08-31 | Espoc, Inc. | System and method for providing secure transmission, search, and storage of data |
| EP1236354A4 (en) | 1999-11-10 | 2009-04-22 | Yahoo Inc | INTERNET RADIO AND BROADCASTING METHOD |
| US6772156B1 (en) | 1999-11-29 | 2004-08-03 | Actuate Corporation | Method and apparatus for creating and displaying a table of content for a computer-generated report having page-level security |
| US6859805B1 (en) * | 1999-11-29 | 2005-02-22 | Actuate Corporation | Method and apparatus for generating page-level security in a computer generated report |
| US6389467B1 (en) | 2000-01-24 | 2002-05-14 | Friskit, Inc. | Streaming media search and continuous playback system of media resources located by multiple network addresses |
| CA2400345C (en) * | 2000-03-06 | 2007-06-05 | Iarchives, Inc. | System and method for creating a searchable word index of a scanned document including multiple interpretations of a word at a given document location |
| US6950553B1 (en) * | 2000-03-23 | 2005-09-27 | Cardiff Software, Inc. | Method and system for searching form features for form identification |
| US7024485B2 (en) * | 2000-05-03 | 2006-04-04 | Yahoo! Inc. | System for controlling and enforcing playback restrictions for a media file by splitting the media file into usable and unusable portions for playback |
| US8352331B2 (en) | 2000-05-03 | 2013-01-08 | Yahoo! Inc. | Relationship discovery engine |
| US7251665B1 (en) * | 2000-05-03 | 2007-07-31 | Yahoo! Inc. | Determining a known character string equivalent to a query string |
| US7162482B1 (en) * | 2000-05-03 | 2007-01-09 | Musicmatch, Inc. | Information retrieval engine |
| US6556990B1 (en) * | 2000-05-16 | 2003-04-29 | Sun Microsystems, Inc. | Method and apparatus for facilitating wildcard searches within a relational database |
| EP1307831A4 (en) * | 2000-07-11 | 2007-05-09 | Yahoo Inc | ONLINE LISTENING SYSTEM BASED ON THE PREFERENCES OF A COMMUNITY |
| KR100406671B1 (ko) * | 2000-07-24 | 2003-11-21 | 주식회사 유니마이다스 | 문장 표절 및 도용 검색 방법 |
| JP5033277B2 (ja) * | 2000-09-12 | 2012-09-26 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体 |
| DE10048478C2 (de) * | 2000-09-29 | 2003-05-28 | Siemens Ag | Verfahren zum Zugriff auf eine Speichereinheit bei der Suche nach Teilzeichenfolgen |
| US8271333B1 (en) | 2000-11-02 | 2012-09-18 | Yahoo! Inc. | Content-related wallpaper |
| US7406529B2 (en) * | 2001-02-09 | 2008-07-29 | Yahoo! Inc. | System and method for detecting and verifying digitized content over a computer network |
| US20020156809A1 (en) * | 2001-03-07 | 2002-10-24 | O'brien Thomas A. | Apparatus and method for locating and presenting electronic content |
| US7574513B2 (en) | 2001-04-30 | 2009-08-11 | Yahoo! Inc. | Controllable track-skipping |
| SG103289A1 (en) * | 2001-05-25 | 2004-04-29 | Meng Soon Cheo | System for indexing textual and non-textual files |
| CA2451208A1 (en) * | 2001-06-21 | 2003-01-03 | Paul P. Vagnozzi | Database indexing method and apparatus |
| JP4342753B2 (ja) | 2001-08-10 | 2009-10-14 | 株式会社リコー | 文書検索装置、文書検索方法、プログラム及びコンピュータに読み取り可能な記憶媒体 |
| US6925475B2 (en) * | 2001-10-12 | 2005-08-02 | Commissariat A L'energie Atomique | Process and apparatus for management of multimedia databases |
| US7031910B2 (en) * | 2001-10-16 | 2006-04-18 | Xerox Corporation | Method and system for encoding and accessing linguistic frequency data |
| US20030149566A1 (en) * | 2002-01-02 | 2003-08-07 | Esther Levin | System and method for a spoken language interface to a large database of changing records |
| US7707221B1 (en) | 2002-04-03 | 2010-04-27 | Yahoo! Inc. | Associating and linking compact disc metadata |
| US7305483B2 (en) | 2002-04-25 | 2007-12-04 | Yahoo! Inc. | Method for the real-time distribution of streaming data on a network |
| US7370271B2 (en) * | 2002-10-30 | 2008-05-06 | Actuate Corporation | Methods and apparatus for generating a spreadsheet report template |
| US7743061B2 (en) * | 2002-11-12 | 2010-06-22 | Proximate Technologies, Llc | Document search method with interactively employed distance graphics display |
| US7284009B2 (en) * | 2002-12-13 | 2007-10-16 | Sun Microsystems, Inc. | System and method for command line prediction |
| US20050004799A1 (en) * | 2002-12-31 | 2005-01-06 | Yevgenly Lyudovyk | System and method for a spoken language interface to a large database of changing records |
| US6990224B2 (en) * | 2003-05-15 | 2006-01-24 | Federal Reserve Bank Of Atlanta | Method and system for communicating and matching electronic files for financial transactions |
| WO2005026916A2 (en) * | 2003-09-10 | 2005-03-24 | Musicmatch, Inc. | Music purchasing and playing system and method |
| US7644076B1 (en) * | 2003-09-12 | 2010-01-05 | Teradata Us, Inc. | Clustering strings using N-grams |
| US7325013B2 (en) * | 2004-04-15 | 2008-01-29 | Id3Man, Inc. | Database with efficient fuzzy matching |
| US8874504B2 (en) * | 2004-12-03 | 2014-10-28 | Google Inc. | Processing techniques for visual capture data from a rendered document |
| US7730012B2 (en) * | 2004-06-25 | 2010-06-01 | Apple Inc. | Methods and systems for managing data |
| US7693856B2 (en) * | 2004-06-25 | 2010-04-06 | Apple Inc. | Methods and systems for managing data |
| US8131674B2 (en) | 2004-06-25 | 2012-03-06 | Apple Inc. | Methods and systems for managing data |
| US7305385B1 (en) * | 2004-09-10 | 2007-12-04 | Aol Llc | N-gram based text searching |
| US7925658B2 (en) * | 2004-09-17 | 2011-04-12 | Actuate Corporation | Methods and apparatus for mapping a hierarchical data structure to a flat data structure for use in generating a report |
| US7478081B2 (en) * | 2004-11-05 | 2009-01-13 | International Business Machines Corporation | Selection of a set of optimal n-grams for indexing string data in a DBMS system under space constraints introduced by the system |
| JP4314204B2 (ja) * | 2005-03-11 | 2009-08-12 | 株式会社東芝 | 文書管理方法、システム及びプログラム |
| US7870480B1 (en) | 2005-03-14 | 2011-01-11 | Actuate Corporation | Methods and apparatus for storing and retrieving annotations accessible by a plurality of reports |
| KR100622129B1 (ko) | 2005-04-14 | 2006-09-19 | 한국전자통신연구원 | 동적으로 변화하는 웹 페이지의 변조 점검 시스템 및 방법 |
| US7685106B2 (en) * | 2005-04-29 | 2010-03-23 | International Business Machines Corporation | Sharing of full text index entries across application boundaries |
| US7991767B2 (en) * | 2005-04-29 | 2011-08-02 | International Business Machines Corporation | Method for providing a shared search index in a peer to peer network |
| US8700404B1 (en) * | 2005-08-27 | 2014-04-15 | At&T Intellectual Property Ii, L.P. | System and method for using semantic and syntactic graphs for utterance classification |
| US7805430B2 (en) * | 2005-12-22 | 2010-09-28 | Sap Ag | Evaluation of name prefix and suffix during a search |
| US8307276B2 (en) * | 2006-05-19 | 2012-11-06 | Symantec Corporation | Distributed content verification and indexing |
| US20080155399A1 (en) * | 2006-12-20 | 2008-06-26 | Yahoo! Inc. | System and method for indexing a document that includes a misspelled word |
| US8583419B2 (en) * | 2007-04-02 | 2013-11-12 | Syed Yasin | Latent metonymical analysis and indexing (LMAI) |
| JP5224851B2 (ja) * | 2008-02-27 | 2013-07-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 検索エンジン、検索システム、検索方法およびプログラム |
| KR101615164B1 (ko) * | 2009-03-20 | 2016-04-26 | 삼성전자주식회사 | 엔-그램 기반의 질의 처리 장치 및 그 방법 |
| WO2010141598A2 (en) * | 2009-06-02 | 2010-12-09 | Index Logic, Llc | Systematic presentation of the contents of one or more documents |
| DE102009031872A1 (de) * | 2009-07-06 | 2011-01-13 | Siemens Aktiengesellschaft | Verfahren und Vorrichtung zur automatischen Suche nach Dokumenten in einem Datenspeicher |
| US8761512B1 (en) | 2009-12-03 | 2014-06-24 | Google Inc. | Query by image |
| JP5083367B2 (ja) * | 2010-04-27 | 2012-11-28 | カシオ計算機株式会社 | 検索装置、検索方法、ならびに、コンピュータプログラム |
| JP5708117B2 (ja) * | 2011-03-24 | 2015-04-30 | カシオ計算機株式会社 | Nグラム検索のための転置インデックスの生成方法および生成装置、当該転置インデックスを用いた検索方法および検索装置、ならびに、コンピュータプログラム |
| EP2706466A4 (en) * | 2011-05-02 | 2015-06-17 | Fujitsu Ltd | EXTRACTION PROCESS, INFORMATION PROCESSING, EXTRACTION PROGRAM, INFORMATION PROCESSING, EXTRACTION DEVICE AND INFORMATION PROCESSING DEVICE |
| US8694474B2 (en) * | 2011-07-06 | 2014-04-08 | Microsoft Corporation | Block entropy encoding for word compression |
| JP5802924B2 (ja) * | 2011-07-29 | 2015-11-04 | アーカイブ技術研究所株式会社 | 文書検索システムおよび文書検索プログラム |
| US9218411B2 (en) | 2012-08-07 | 2015-12-22 | International Business Machines Corporation | Incremental dynamic document index generation |
| US9026522B2 (en) * | 2012-10-09 | 2015-05-05 | Verisign, Inc. | Searchable web whois |
| US10318523B2 (en) | 2014-02-06 | 2019-06-11 | The Johns Hopkins University | Apparatus and method for aligning token sequences with block permutations |
| US11282091B2 (en) * | 2016-09-30 | 2022-03-22 | Transitiv, Inc. | Systems, methods, and devices for dynamic page feed management |
| JP2018121133A (ja) * | 2017-01-23 | 2018-08-02 | 京セラドキュメントソリューションズ株式会社 | ファクシミリ装置 |
| US11030151B2 (en) * | 2017-03-29 | 2021-06-08 | AVAST Software s.r.o. | Constructing an inverted index |
| US10459999B1 (en) * | 2018-07-20 | 2019-10-29 | Scrappycito, Llc | System and method for concise display of query results via thumbnails with indicative images and differentiating terms |
| US12118041B2 (en) * | 2019-10-13 | 2024-10-15 | Thoughtspot, Inc. | Query execution on compressed in-memory data |
| JP7767051B2 (ja) * | 2021-08-04 | 2025-11-11 | シャープ株式会社 | 記憶方法、記憶システム、読取装置、及び画像処理装置 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0773187A (ja) * | 1993-09-01 | 1995-03-17 | Hokkaido Nippon Denki Software Kk | 検索システム |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4495566A (en) * | 1981-09-30 | 1985-01-22 | System Development Corporation | Method and means using digital data processing means for locating representations in a stored textual data base |
| US5469354A (en) * | 1989-06-14 | 1995-11-21 | Hitachi, Ltd. | Document data processing method and apparatus for document retrieval |
| US5062143A (en) * | 1990-02-23 | 1991-10-29 | Harris Corporation | Trigram-based method of language identification |
| US5062142A (en) * | 1990-12-14 | 1991-10-29 | General Electric Company | Data processor producing a medial axis representation of an extended region |
| US5265065A (en) * | 1991-10-08 | 1993-11-23 | West Publishing Company | Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query |
| US5375235A (en) * | 1991-11-05 | 1994-12-20 | Northern Telecom Limited | Method of indexing keywords for searching in a database recorded on an information recording medium |
| US5412807A (en) * | 1992-08-20 | 1995-05-02 | Microsoft Corporation | System and method for text searching using an n-ary search tree |
| GB9220404D0 (en) * | 1992-08-20 | 1992-11-11 | Nat Security Agency | Method of identifying,retrieving and sorting documents |
-
1995
- 1995-04-10 US US08/419,126 patent/US5706365A/en not_active Expired - Fee Related
-
1996
- 1996-04-10 EP EP96911690A patent/EP0764305B1/en not_active Expired - Lifetime
- 1996-04-10 NZ NZ306268A patent/NZ306268A/en not_active IP Right Cessation
- 1996-04-10 DE DE69631457T patent/DE69631457T2/de not_active Expired - Lifetime
- 1996-04-10 AU AU54496/96A patent/AU713572B2/en not_active Ceased
- 1996-04-10 JP JP53114696A patent/JP4162711B2/ja not_active Expired - Fee Related
- 1996-04-10 WO PCT/US1996/004945 patent/WO1996032686A1/en not_active Ceased
- 1996-04-10 ES ES96911690T patent/ES2214535T3/es not_active Expired - Lifetime
- 1996-04-10 BR BR9606306A patent/BR9606306A/pt not_active Application Discontinuation
- 1996-12-09 NO NO965254A patent/NO965254L/no not_active Application Discontinuation
-
2006
- 2006-02-08 JP JP2006031590A patent/JP4559371B2/ja not_active Expired - Fee Related
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0773187A (ja) * | 1993-09-01 | 1995-03-17 | Hokkaido Nippon Denki Software Kk | 検索システム |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011138230A (ja) * | 2009-12-25 | 2011-07-14 | Fujitsu Ltd | 情報処理プログラム、情報検索プログラム、情報処理装置、および情報検索装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| NO965254D0 (no) | 1996-12-09 |
| EP0764305A1 (en) | 1997-03-26 |
| US5706365A (en) | 1998-01-06 |
| DE69631457D1 (de) | 2004-03-11 |
| JP4559371B2 (ja) | 2010-10-06 |
| BR9606306A (pt) | 1997-09-09 |
| AU5449696A (en) | 1996-10-30 |
| NO965254L (no) | 1997-02-06 |
| DE69631457T2 (de) | 2004-09-16 |
| AU713572B2 (en) | 1999-12-02 |
| EP0764305B1 (en) | 2004-02-04 |
| ES2214535T3 (es) | 2004-09-16 |
| JP4162711B2 (ja) | 2008-10-08 |
| NZ306268A (en) | 1998-05-27 |
| JP2006155657A (ja) | 2006-06-15 |
| WO1996032686A1 (en) | 1996-10-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4162711B2 (ja) | Nグラム・ワード分解を用いた携帯型文書索引付け用のシステム及び方法 | |
| US4775956A (en) | Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes | |
| US6055528A (en) | Method for cross-linguistic document retrieval | |
| US5465353A (en) | Image matching and retrieval by multi-access redundant hashing | |
| US6523030B1 (en) | Sort system for merging database entries | |
| US6496820B1 (en) | Method and search method for structured documents | |
| US20020010714A1 (en) | Method and apparatus for processing free-format data | |
| EP0378848A2 (en) | Method for use of morphological information to cross reference keywords used for information retrieval | |
| JP2011511366A (ja) | データの検索および索引付けの方法およびそれを実施するシステム | |
| JP2002510089A (ja) | 光学的文字認識により作成された電子的文書を検索するためのシステムおよび方法 | |
| CN111400323A (zh) | 数据检索方法、系统、设备及存储介质 | |
| KR100459832B1 (ko) | N-그램워드(n-gramword)분해원리를이용하여이식가능한문서를인덱싱하는시스템및방법 | |
| US20030023584A1 (en) | Universal information base system | |
| JP2693914B2 (ja) | 検索システム | |
| US6792428B2 (en) | Method of storing and flattening a structured data document | |
| WO2002059726A2 (en) | Method of performing a search of a numerical document object model | |
| CN110347804A (zh) | 一种线性时间复杂度的敏感信息检测方法 | |
| CA2192435C (en) | System and method for portable document indexing using n-gram word decomposition | |
| JPH0991297A (ja) | 文字列検索方法及び装置 | |
| JPH08314950A (ja) | テキストの検索方法及び装置 | |
| JPH08115330A (ja) | 類似文書検索方法および装置 | |
| JPH06309368A (ja) | 文書検索装置 | |
| JPH09259132A (ja) | 情報登録検索装置及びその方法 | |
| JPH09212523A (ja) | 全文検索方法 | |
| CN116126795A (zh) | 日志检索方法、装置、电子设备及存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041019 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20050117 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20050228 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050419 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20051011 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060209 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080618 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080723 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110801 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |