JPH02115973A - 記号列照合装置とその制御方法 - Google Patents

記号列照合装置とその制御方法

Info

Publication number
JPH02115973A
JPH02115973A JP63269746A JP26974688A JPH02115973A JP H02115973 A JPH02115973 A JP H02115973A JP 63269746 A JP63269746 A JP 63269746A JP 26974688 A JP26974688 A JP 26974688A JP H02115973 A JPH02115973 A JP H02115973A
Authority
JP
Japan
Prior art keywords
symbol
symbol string
cell
matching
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63269746A
Other languages
English (en)
Other versions
JP2737173B2 (ja
Inventor
Masato Motomura
真人 本村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63269746A priority Critical patent/JP2737173B2/ja
Priority to EP89119841A priority patent/EP0366115B1/en
Priority to DE68927625T priority patent/DE68927625T2/de
Publication of JPH02115973A publication Critical patent/JPH02115973A/ja
Priority to US07/958,467 priority patent/US5377349A/en
Application granted granted Critical
Publication of JP2737173B2 publication Critical patent/JP2737173B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/02Comparing digital values
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2207/00Indexing scheme relating to methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F2207/02Indexing scheme relating to groups G06F7/02 - G06F7/026
    • G06F2207/025String search, i.e. pattern matching, e.g. find identical word or best match in a string
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は情報処理システムの構成要素に係り、より具体
的には複数の被照合記号列の中から照合記号列と特定の
関係にある被照合記号列を抽出する記号列照合装置とそ
の制御方式に関するものである。
(従来の技術) 記号列照合装置はテキストデータベースの検索や、バタ
ン認識システムでの特徴系列の照合、ワープロで作成さ
れた文書からのキーワード抽出、言語翻訳の支援や電子
メールのアドレスフィルタリング等に使われ、これらの
情報処理システムにおいて欠くことの出来ないものであ
る。
記号列照合では、照合記号列と完全に一致する被照合記
号列のみならず、照合記号列とある類似性を持った被照
合記号列をも複数の被照合記号列の中から抽出できるこ
とが望まれる。なぜならば、例えば、テキストデータベ
ース検索においては、テキストがミススペルを含む場合
や、あやふやなキーワードで検索を行なう場合にこの機
能が必要であるし、パターン認識において特徴系列同士
の照合を行なう場合には、完全に一致するものが見つか
ることは希で、複数の被照合記号列中より照合記号列に
最もよく似た被照合記号列を選び出すことが必要になる
からである。
照合記号列と被照合記号列の類似度を測るのには距離と
いう概念が用いられる。ここで言う距離とは、1記号の
除去、置換、挿入を単位操作として、何回の操作である
記号列からある記号列に移れるかを考え、そのうち最少
の回数をこの二つの記号列間の距離とするものである。
この距離という概念については、例えば1980年発行
のコンピユーテイング・サーベイ(Computing
 5urveys)誌、第12巻4号1.381ページ
の文献、題名アブロクシメイトストリング・マツチング
(Approximate StringMatchi
ng)、著者パトリックホール(Patrick、 H
all)、ジェオフ・ダウリング(Geoff、 Do
wling)、に詳しく記載されている。
第10図(a)〜(C)はそれぞれ上で述べた1記号の
除去、置換、挿入という単位操作の定義を例によって示
したものである。同図では、元の記号列“ABCD””
にこれらの単位操作を加えて記号列を変化させている。
同図において、CはC以外の任意の記号の意味であり、
Xは任意の記号の意味である。なお、これらの記号は以
下の文中において同様の意味で用いる。
第10図(d)は例として記号列“ABCD”から距離
3の範囲内にある記号列の一部を示したものである。
同図より、例えば“ABCD”は距離1であるから、距
離2である“ACXD”よりも“ABCD”に近いとい
うことになる。
照合記号列から距離1の範囲内の被照合記号列を抽出で
きる記号列照合装置としては、特開昭59−21680
8号公報[記号列照合装置」(以下先行発明と呼ぶ)が
ある。
第11図に先行発明による記号列照合装置の動作の概念
を示す。同図は一例として“ABCD””を照合記号列
とし、この照合記号列から距離1の範囲内の被照合記号
列を抽出する場合を示している。−は1ビツトの情報を
記憶できるセルを示し、矢印はセル間の記憶データの転
送を示している。各セルは矢印の横に書かれた記号が入
力されたときに矢印で示された次のセルに記憶データを
転送する。矢印の横に書かれた記号以外の記号が人力さ
れると、図示していないが、セルの記憶データによらず
0が転送される。各矢印により転送されてきたデータは
、図示していないが、理論和を取られてセルに入力され
る。
同図において、初期状態ではセルf11の記憶データの
み1にし、他の全てのセルの記憶データは0にしておく
。この状態から、被照合記号列として、例えば、”AB
CD”を1記号ずつ順に入力するとセルf15の記憶デ
ータが1になり、”ABD”、”ABCD”、“ABX
CD”などを入力するとセルf25の記憶データが1に
なる。すなわち、セルf15を監視することによリ、入
力された被照合記号列が照合記号列から距離0であるか
どうかわかり、七ノ鴨、を監視することにより、入力さ
れた被照合記号列が照合記号列から距離1であるかどう
かがわかる。
これにより照合記号列から距離1の範囲内にある被照合
記号列を抽出する記号列照合装置を構成することが可能
になった。しかし、音声認識や手書き文字認識などのパ
ターン認識への応用においては、抽出する記号列間の距
離は1では足りない。例えば音声認識においては、音声
から抽出された特徴系列(照合記号列にあたる)には話
者の年齢や性別、出身地などの違いにより様々なゆらぎ
が含まれており、あらかじめ用意された特徴系列のテン
プレート(被照合記号列にあたる)との距離が距離1の
範囲内に納まることは希である。このような用途に応用
するためには、もっと遠くの距離にある被照合記号列ま
で抽出できるようにし、抽出された被照合記号列の中か
ら最も照合記号列に近いものを選べるようにならなけれ
ばならない。このような問題を解決するため前述の先行
発明は別の記号列照合装置を提示している。
第12図は先行発明による記号列照合装置の動作の概念
を示すものである。同図は第11図と同じく例として照
合記号例“ABCD”の場合を示している。
同図中のセルと矢印は第11図と同じ意味を持っており
、このような構成により照合記号列に対してその記号列
長未満の任意数の記号を挿入、また置換した被照合記号
列を抽出することができる。
(発明が解決しようとする課題) しかしこの構成では、単位操作の一つである上記号の除
去を考慮にいれていないため、照合記号列から一定の距
離内にある被照合記号列を公平に抽出することができな
い。具体的にいうと、例えば、距離3である“AXBX
CXD”は抽出できるが、距離2である“AD”は抽出
できないということになる。
これでは、照合記号列と類似度の高い被照合記号列が抽
出できず代わりに類似度の低い被照合記号列が抽出され
るといことになり、パターン認識などへの応用は困難で
ある。
以上説明したように従来の記号列照合装置では、照合記
号列から距離1の範囲内にある被照合記号列は抽出でき
るが、それ以上の距離になると有効な抽出を行なうこと
が出来ないという問題があった。
本発明の目的はこのような問題を解決し、簡易な構成で
照合記号例から任意の距離にある被照合記号列を抽出す
ることが可能な記号列照合装置とその制御方式を提供す
ることにある。
(課題を解決しようとするための手段)上記目的を達成
するため、本発明の記号列照合装置は、長さN(Nは正
整数)の照合記号列に対して、記号列比較結果を記憶す
るセルをM行(Mは正整数)N+1列に並べたセルアレ
イと、照合記号列のj番目(jはN以下の任意の正整数
)の記号と同じ被照合記号が与えられたときのみ前記セ
ルアレイのi行(iはM以下の任意の正整数カ列目であ
るセルf1.の記憶リ データを七)I/fij+、に転送する第1の転送手段
と、照合記号列のj番目の記号と違う被照合記号が与え
られなときのみ前記セルアレイのh行(hはM未満の任
意の正整数)j列目であるセルf)1jの記憶データを
セルfh+1j+1に転送する第2の転送手段と、被照
合記号が与えられると、与えられた被照合記号の如何に
かかわらず前記セルアレイのh行に列目(kはN+1以
下の任意の正整数)である七ノ鴨、の記憶データをセル
fh+1kに転送する第3の転送手段と、前記第1から
第3の転送手段によりセル−に少なくとも一つ1が転送
されてくると七ルーの記憶データを1にし、前記第1か
ら第3の転送手段によりセル−に1が一つも転送されて
こなければセルf1にの記憶データを0にする人力手段
と、セル萄の記憶データが1になると、前記入力手段に
よりセ” ’h + lj + 1に与えられた入力に
よらず、セルf)l+1j+1の記憶データを1にセッ
トするセット手段より構成されており、このような構成
において、少なくとも、前記セルアレイの全てのセルの
記憶データを0にした後、セルf11の記憶データを1
にセットすることにより初期設定を行なうことと、被照
合記号列を上記号ずつ順に与えることにより記号列照合
を実行することと、前記セルアレイのN+1列目のM個
のセルの中から、記憶データが1であり、かついちばん
行番号が小さいセルを探すことにより、照合結果として
照合記号列と被照合記号列との距離を得ることとを含む
ことを特徴とする制御方式を用いている。
(作用) 第7図は本発明の技術思想を説明するための概念図であ
る。同図は列として4行5列のセルアレイを用い“AB
CD”′を照合記号列とした場合を示している。以下詳
しく説明するように、この構成により、“ABCD’”
から距離3の範囲内にある任意の被照合記号列を抽出す
ることができる。
同図において、セルは丸印で示され、第一の転送手段は
行方向の実線の矢印、第二の転送手段は列方向の実線の
矢印、第3の転送手段は対角線方向の実線の矢印、セッ
ト手段は対角線方向の二重線の矢印で示されている。第
1及び第2の転送手段は、その矢印の横に書いである被
照合記号が与えられたときだけ、矢印にしたがって各セ
ルの記憶データを次のセルに転送する。第3の転送手段
は、被照合記号が与えられると、与えられた被照合記号
の如何にかかわらず、矢印にしたがって各セルの記憶デ
ータを次のセルに転送する。図中には明示していないが
、セルにはこれらの転送手段から転送されてきたデータ
を受は取る入力手段があり、少なくとも一つ1が転送さ
れてくるとセルの記憶データは1になり、一つも1が転
送されてこないとセルの記憶データは0になる。セット
手段は、本発明におけるもっとも特徴的な部分であって
、あるセルの記憶データが1になると、入力手段から入
力されたデータに関係なく、二重線の矢印に従って次の
セルの記憶データも1にセットする働きを持つ。つまり
、例えばセルr1□が1であると、同時にセルf23、
f34、f45も1となり、セルf2□が1であると、
同時にセルf33、f44も1となる。このような構成
において、第5列目のセルの記憶データを読み取ること
により照合結果を得ることができる。以下本発明を、第
8図、第9図(a)−(h)に基づいて更に詳細に説明
する。
第8図、第9図(a)−(h)はそれぞれ第7図と同じ
構成を示すものであるが、簡単のため一部の記号を省略
して描いである。以下で用いる記号でこれらの図中に明
示いていないものは、第7図中の対応する部位の記号を
用いている。また図中のセルで斜線を施したものは記憶
データが1であることを示し、白いセルは記憶データが
0であること示している。
第8図は、照合を始める前の、本発明による記号列照合
装置の初期状態を示す図である。初期状態ではセルf1
1の記憶データを1にセットしておく。するとセット手
段により、セノL/f22、f33、f44の記憶デー
タも1にセットされる。これら以外のセルの記憶データ
はすべてOにしておく。
第9図(a)−(d)は照合記号列“’ABCD’”に
対して被照合記号列“ABCD”を順にA、 B、 C
,Dと入力していったときの本発明による記号列照合装
置の動作を、1記号の入力毎に示したものである。各被
照合記号が人力された後のセルアレイは、それまでに入
力された被照合記号列と照合記号列“ABCD”との照
合結果を示している。この照合結果を知るには、5列目
のセルの記憶データを読み取ればよい。具体的には、5
列目のセルで記憶データが1になっているものの中で、
一番行番号が小さいものを探し、それがセルf15なら
、被照合記号列と照合記号列との距離は距離0、セルf
25なら距離1、セル曳なら距離2、r45なら距離3
、該当するセルがなければ距離4以上となる。以下、図
の順にしたがって各図について詳しく説明する。
まず初期状態から被照合記号Aが入力されると、各セル
の記憶データは、第8図で示した初期状態から第9図(
a)のように変化する。この図は、上で述べたように、
被照合記号列“ABCD”の照合の途中経過として、照
合記号列“ABCD”に対する被照合記号列“A”の照
合結果を示している。七ノt/f45の記憶データが1
になっており、これはA″が1“ABCD”から距離3
にあることを示している。
次に被照合記号Bが入力されると、各セルの記憶データ
は、第9図(a)で示した状態から第9図(b)のよう
に変化する。この図は照合記号列“ABCD”に対する
被照合記号列“’AB”の照合結果を示している。セル
f35の記憶データが1になっており、これは“’AB
”が“ABCD”から距離2にあることを示している。
続いて被照合記号Cが入力されると、各セルの記憶デー
タは、第9図(b)で示した状態から第9図(e)のよ
うに変化する。この図は照合記号列“ABCD”に対す
る被照合記号列“ABC”の照合結果を示している。
セル’25の記憶データが1になっており、これは“A
BC”が“ABCD”から距離1にあることを示してい
る。
最後に被照合記号りが入力されると、各セルの記憶デー
タは、第9図(C)で示した状態から第9図(d)のよ
うに変化する。この図は照合記号“ABCD””に対す
る被照合記号列“ABCD”の最終的な照合結果を示し
ている。セルf15の記憶データが1になっており、こ
れは“ABCD”が“ABCD”から距離0にあること
を示している。
このように、被照合記号列“ABCD”を順に1記号ず
つ入力していくことにより、この被照合記号列に対する
照合の途中経過及び最終結果を順次知ることが出来る。
このようにして得られた照合結果は、明らかに被照合記
号列と照合記号列との間の正しい距離を与えている。な
ぜなら、被照合記号列“Atjは“ABCD””に単位
操作である1記号の除去を3回行なったものだし、同じ
くAB”は2回、”ABC”′は1回、“ABCD”は
0回行なったものだからである。
第9図(e)−(h)は第9図(a)−(d)と同じ条
件で、被照合記号列を“ACXD”にした場合を示した
ものである。
簡単に説明すると、第9図(e)は被照合記号列“A”
が照合記号列“ABCD”から距離3であることを、第
9図(Ol(g)、(h)はそれぞれ被照合記号列“A
C”、”ACX”1、”ACXD”が照合記号列”AB
CD”から距離2であることを示している。これらの結
果がそれぞれの記号列間の正しい距離を与えていること
は明らかである。
このようにして、第7図に示した構成により、ある被照
合記号列が照合記号列“ABCD”から距離3の範囲内
にあるかどうか判別することできる。よって、複数の被
照合記号列を次々に人力していけば、その中から照合記
号列から距離3の範囲内にある全ての被照合記号列を抽
出することが可能になる。他の任意の照合記号列に対し
ても、その記号列長に応じた列数を持ち、抽出したい任
意の距離数に応じた行数を持つセルアレイを構成すれば
、同様の記号列照合を行なうことができる。
(実施例) 第1図は、本発明による記号列照合装置の一実施例を示
す構成図である。以下同図について説明する。
まず第1図の構成について説明する。同図において記号
列照合装置は、初期セット端子110と、N本(Nは正
整数)の入力端子120−1〜120−Nと、M行(M
は正整数)N+1列に並べられ、データを入力するD端
子、データを出力するQ端子、データを1にセットする
SET端子を持つレジスター30と、i行(iはM以下
の任意の正整数)j列(jはN以下の任意の正整数)目
のレジスタf、、130のQ端子と入力端子120−j
に入力端子す がつながり、i=1であれば右横のレジスタfij+1
130のD端子に出力端子がつながる第1のアンドゲー
ト140と、レジスター130(hはM未満の任意の正
整数)のQ端子に入力がつながり、入力端子120−j
に反転入力端子がつながる第2のアンドゲート150と
、レジスター、130(kはN+1以下の任意の正整数
)のQ端子に入力がつながるデータ転送線160と、入
力として、レジスタfh+1,130のQ端子につなが
る第1のアンドゲート140の出力と、レジスター13
0のQ端子につながる第2のアンドゲート150の出力
と、レジスタf、1130のQ端子につながるデータ転
送線160の出力とを受はレジスタf)l+1j+11
30のD端子に出力するオアゲート170と、レジスタ
fゎ、130のQ端子の出力をレジスタfh+1j+1
130のSET端子に入力するセット線180と、N+
1列目のレジスタ130のQ端子のデータを出力するM
本の出力端子190−1〜190−Mとを備えている。
次に請求項1に記載の各構成要素との対応について説明
する。レジスタfik130はセル−に対応するもので
ある。第1のアンドゲート140、第2のアンドゲート
150、データ転送線160は、それぞれ第1の転送手
段、第2の転送手段、第3の転送手段に対応するもので
ある。また、オアゲート170は入力手段、セット線1
80はセット手段に対応するものである。
第1図において、入力端子120−jには、照合記号列
のj番目の記号と被照合記号とが一致すれば1、一致し
なければ0が与えられる。すると、第1のアンドゲート
140は、照合記号列のj番目と被照合同じ記号が与え
られたときだけレジスタf)lj130の記憶データを
レジスタf、1130に転送し、それ以外は0を転送す
る。逆に第2のアンドゲート150は照合記号列のj番
目と違う被照合記号が与えられたときはレジスター、1
30の記憶データをレジスター+J+1130に転送し
、同じであれば0を転送する。これらは明らかに特許請
求範囲第1項記載の第1及び第2の転送手段の機能に対
応している。
続いて、第1図の実施例の動作について、第2図及び第
3図に基づいて説明する。
第2図は、レジスタ130のD端子に与えられた入力デ
ータとSET端子に与えられたセット信号による、Q端
子の出力データの変化を示したものである。同図は、レ
ジスタ130はSET端子が0であればD端子より与え
られたデータを1周期遅らせてQ端子より出力し、SE
T端子が1であれば、Q端子より与えられたデータによ
らず、Q端子から1を出力することを示している。この
ような機能を持つものとしては、例えばセット入力付き
のマスタースレーブ型フリップフロップなどがある。
第3図はこの実施例の動作を説明するためのものである
。同図は第1図においてN=M=4とし、(作用)の項
の説明で用いたのと同じく、照合記号列を“ABCD”
、被照合記号列を“ABCD”とした場合について、入
力端子120−1〜120−4に与えられる入力と、出
力端子190−1〜190−4からの出力とを示したも
のである。
以下、(作用)の項で行なった説明に対応させながら同
図を説明する。まず、これは同図には示していないが、
初期状態を設定するために始めに全てのレジスタ130
の記憶データを0にリセットする必要がある。これは、
新たにレジスタ130にリセット端子をもうけるか、あ
るいは全てのレジスタ130の記憶データが0になるま
で入力端子120−1〜120−4にOを与える続ける
ことなどによって実行される。次に、初期セット端子1
10に1を与えることによりf11〜f44のレジスタ
130のみが1にセットされる。この状態は第8図に対
応する。続いてAを入力することに対応して、入力端子
120−1のみに1を与え、他の入力端子には0を与え
る。この入力後、出力端子190−4には1が、他の出
力端子にはOが出力される。
これは第9図(a)におけるN列目のセルの状態に対応
する。同様に、B、 C,Dを入力することに対応した
入力信号を次々に入力端子120−1〜120−4に入
力することにより、第9図(b)〜(d)におけるN列
目のセルの状態に対応した出力が出力端子190−1〜
190−4より得られる。これらの出力により、(作用
)の項で詳細に説明したように、照合の途中経過として
、照合記号列“ABCD’と被照合記号列“A”、“A
B”、“ABC’”との照合結果が、最終結果として被
照合記号列“ABCD”との照合結果がわかる。
以上説明した実施例では、入力端子120−1〜12〇
−Nには上述のように、被照合記号と照合記号列の各記
号との一致信号を与える必要がある。また出力端子19
0−1〜190−Mの出力は、照合結果がすぐ判るよう
にはなっていないため、照合結果を直接示すように変換
する必要がある。以下、これらの機能を実現する周辺装
置の例を第4図、第5図第6図に基づいて説明する。
第4図は第1図で示した本発明の実施例に入力を与える
入力装置の一例である。同図は各記号が1ビツトで構成
されている場合を示している。まず照合記号列登録端子
410−1〜41ONから、照合記号列をレジスタ43
0に登録する。被照合記号列は、被照合列入力端子42
0より1記号ずつ入力され、比較器440で照合記号列
の各記号と比較される。比較の結果、両記号が一致して
いれば1、一致していなければ0が一致信号出力端子4
50−1〜450−Nから出力される。この450−j
の出力を第1図の入力端子120−jに入力することに
より第1図の説明で述べたような入力を得ることができ
る。なお、ここでは1記号が1ビツトで構成されている
場合を例として示したが、1記号が数ビットで構成され
ている場合も同様の装置を構成することができることは
明らかである。
第5図は第1図で示した本発明の実施例の出力を受は取
り、照合結果を出力する出力装置の一例である。同図に
おいて、入力端子510−1〜510−Mには、第1図
の出力端子190−1〜190−Mの対応する番号の出
力が与えられる。この回路は公知のものであるので詳し
い説明は省くが、入力端子510−iに与えられた入力
データの中に1が複数あれば、その中でiの値が最も小
さいものだけ残して他の全てをOとし、対応する番号の
出力端子580−iから出力する機能を持っている。ま
た、入力データ中に1が一つ以下であれば入力をそのま
ま出力する。これにより、出力端子580−iの出力が
1であれば、照合結果は距離i−1であるとすぐわかる
ようになる。
第6図は第1図の記号列照合装置、第4図の入力装置、
第5図の出力装置の接続を示したものである。
同図において、照合記号列登録端子610−1〜610
−Nから照合記号列を登録し、初期セット端子630で
初期セットを行なった後、被照合記号列入力端子620
から被照合記号を1記号ずつ入力することにより、照合
結果が照合結果出力端子670−1〜670−Mから出
力される。照合結果出力端子670−iの出力が1であ
れば、照合結果は距離i−1であることを示す。
(発明の効果) 以上説明してきたように、本発明による記号列照合装置
は、転送手段とセット手段でセル間が結ばれたセルアレ
イにより構成されている。ここで、セット手段を導入し
たことが本発明の最大の特徴である。このセット手段を
導入することによって、 A、セル間の結合が局所的なものに限られており、遠い
セルとの結合がない。
B、セル間の結合が規則的であり、セルアレイの中でど
こでも同じである。
という二つの長所を持ったセルアレイで、任意の抽出距
離に対応できる記号列照合装置を構成することが可能に
なった。
この二つの長所は、本発明による記号列照合装置が、単
に照合記号列から任意の距離にある被照合記号列を抽出
できるというだけでなく、以下に示すような効果をも有
することを意味している。
1、任意の長さの照合記号列に対応する記号列照合装置
を簡単に構成できる。
2、任意の抽出距離に対応する記号列照合装置を簡単に
構成することができる。
3、照合記号副長の変更や、抽出距離の変更をきわめて
容易に行なうことができる。
4、集積回路化する際に設計時間が短くてすみ、しかも
チップ面積が小さくなる。
1.2の効果は、セルアレイの列数もしくは行数の設定
を変えるだけで、任意の照合記号副長Nや抽出距離Mに
対応できることを指している。つまり本発明による記号
列照合装置のハードウェアー量はNとMの積に比例して
おり、NやMが増えると装置がとたんに複雑化するとい
ったことがない。これは、Aの結合の局所性とBの結合
の規則性の二点による大きな効果である。
3の効果は、1,2と似ているが、本発明による記号列
照合装置を任意の台数だけ行方向や列方向に接続するこ
とにより、1台では対応できなかった長い照合記号列や
、遠い抽出距離に容易に対応できるということを指して
いる。これもやはり、A、Bの二点による効果である。
実際の応用の場面では照合記号副長や抽出距離は固定さ
れず、様々に変化することが考えられるので、このよう
な柔軟性は記号列照合装置に欠くことのできないもので
ある。
4の効果は、本発明の実用性を高めているものである。
よく知られているように、集積回路化する際、規則的な
構成をしているものの方が、そうでないものより、設計
時間が短くしかもチップ面積も小さくできる。本発明に
よる記号列照合装置はBの長所により極めて集積回路化
に適したものになっている。また、Aの長所も配線の引
き回しが短くて済むという点で、集積回路化の際の利点
となる。
以上説明したことから明らかなように、本発明により、
高機能で、柔軟性に富み、かつ実用性の高い記号列照合
装置を提供することができる。
なお、以上の実施例の説明において、レジスタ130の
例として、マスタースレーブ型のフリップフロップをあ
げたが、第2図のような入出力関係を満たすものであれ
ばこれはどのようなものでもよく、第1図において第1
、第2の転送手段はそれぞれ、アンドゲート140.1
50で構成されているが、被照合記号と照合記号列の各
記号が一致したか否かによって開閉するスイッチの機能
をもつものであればこれらはどのようなものでもよい。
また、第3図の波形図では入力が終わった後で対応する
出力が出るようになっているが、入力が終わる前に出力
が出るようになっていてもよい。このように、以上の実
施例は単なる一例であって、何ら本発明を限定するもの
ではない。
【図面の簡単な説明】
第1図は本発明の記号列照合装置の実施例を示す構成図
、第2図はレジスタの入出力関係を示す波形図、第3図
は実施例の動作を示す波形図、第4図は実施例の記号列
照合装置に入力を与える入力装置の例を示す構成図、第
5図は実施例の記号列照合装置の出力を変換する出力装
置の例を示す構成図、第6図は、入力装置、記号列照合
装置、出力装置の接続を示す構成図、第7図、第8図、
第9図は本発明の詳細な説明する原理図、第10図は記
号列間の距離という概念を説明するための説明図、第1
1図、第12図は従来技術を説明するための原理図であ
る。

Claims (2)

    【特許請求の範囲】
  1. (1)複数の被照合記号列の中から照合記号列と関係す
    る被照合記号列を抽出する記号列照合装置において、長
    さN(Nは正整数)の照合記号列に対して、記号列比較
    結果を記憶するセルをM行(Mは正整数)N+1列に並
    べたセルアレイと、照合記号列のj番目(jはN以下の
    任意の正整数)の記号と同じ被照合記号が与えられたと
    きのみ、前記セルアレイのi行(iはM以下の任意の正
    整数)j列目であるセルf_i_jの記憶データをセル
    f_i_j_+_1に転送する第1の転送手段と、照合
    記号列のj番目の記号と違う被照合記号が与えられたと
    きのみ、前記セルアレイのh行(hはM未満の任意の正
    整数)j列目であるセルf_h_jの記憶データをセル
    f_h_+_1_j_+_1に転送する第2の転送手段
    と、被照合記号が与えられると、与えられた被照合記号
    の如何にかかわらず前記セルアレイのh行k列目(kは
    N+1以下の任意の正整数)であるセルf_h_kの記
    憶データをセルf_h_+_1_kに転送する第3の転
    送手段と、前記第1から第3の転送手段によりセルf_
    i_kに少なくとも一つ1が転送されてくるとセルf_
    i_kの記憶データを1にし、前記第1から第3の転送
    手段によりセルf_i_kに1が一つも転送されてこな
    ければセルf_i_kの記憶データを0にする入力手段
    と、セルf_h_jの記憶データが1になると、前記入
    力手段によりセルf_h_+_1_j_+_1に与えら
    れた入力によらず、セルf_h_+_1_j_+_1の
    記憶データを1にセットするセット手段を備えたことを
    特徴とする記号列照合装置。
  2. (2)請求項1に記載の記号列照合装置の制御方式であ
    って、少なくとも、前記セルアレイの全てのセルの記憶
    データを0にした後、セルf_1_1の記憶データを1
    にセットすることにより初期設定を行なうことと、被照
    合記号列を1記号ずつ順に与えることにより記号列照合
    を実行することと、前記セルアレイのN+1列目のM個
    のセルの中から、記憶データが1であり、かついちばん
    行番号が小さいセルを探すことにより、照合結果として
    照合記号列と被照合記号列との距離を得ることとを含む
    ことを特徴とする記号列照合装置の制御方式。
JP63269746A 1988-10-25 1988-10-25 記号列照合装置とその制御方法 Expired - Fee Related JP2737173B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP63269746A JP2737173B2 (ja) 1988-10-25 1988-10-25 記号列照合装置とその制御方法
EP89119841A EP0366115B1 (en) 1988-10-25 1989-10-25 String collating system for searching for character string of arbitrary length within a given distance from reference string
DE68927625T DE68927625T2 (de) 1988-10-25 1989-10-25 Folgenkollationierungssystem zum Suchen nach einer Charakterfolge willkürlicher Länge innerhalb eines gegebenen Abstands einer Referenzfolge
US07/958,467 US5377349A (en) 1988-10-25 1992-10-08 String collating system for searching for character string of arbitrary length within a given distance from reference string

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63269746A JP2737173B2 (ja) 1988-10-25 1988-10-25 記号列照合装置とその制御方法

Publications (2)

Publication Number Publication Date
JPH02115973A true JPH02115973A (ja) 1990-04-27
JP2737173B2 JP2737173B2 (ja) 1998-04-08

Family

ID=17476579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63269746A Expired - Fee Related JP2737173B2 (ja) 1988-10-25 1988-10-25 記号列照合装置とその制御方法

Country Status (4)

Country Link
US (1) US5377349A (ja)
EP (1) EP0366115B1 (ja)
JP (1) JP2737173B2 (ja)
DE (1) DE68927625T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0460871A (ja) * 1990-06-29 1992-02-26 Nec Corp 記号列照合装置の制御方式
US10844848B2 (en) 2010-01-21 2020-11-24 The Abell Foundation, Inc. Ocean thermal energy conversion power plant

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5511159A (en) * 1992-03-18 1996-04-23 At&T Corp. Method of identifying parameterized matches in a string
US5553272A (en) * 1994-09-30 1996-09-03 The University Of South Florida VLSI circuit structure for determining the edit distance between strings
US5864683A (en) * 1994-10-12 1999-01-26 Secure Computing Corporartion System for providing secure internetwork by connecting type enforcing secure computers to external network for limiting access to data based on user and process access rights
US5913024A (en) 1996-02-09 1999-06-15 Secure Computing Corporation Secure server utilizing separate protocol stacks
US6072942A (en) * 1996-09-18 2000-06-06 Secure Computing Corporation System and method of electronic mail filtering using interconnected nodes
US6144934A (en) * 1996-09-18 2000-11-07 Secure Computing Corporation Binary filter using pattern recognition
EP0859332A1 (en) * 1997-02-12 1998-08-19 STMicroelectronics S.r.l. Word recognition device and method
CN1092362C (zh) * 1998-02-10 2002-10-09 北京多思科技工业园股份有限公司 阵列错位比较装置及用来实现查询的方法
US7031002B1 (en) 1998-12-31 2006-04-18 International Business Machines Corporation System and method for using character set matching to enhance print quality
US7039637B2 (en) * 1998-12-31 2006-05-02 International Business Machines Corporation System and method for evaluating characters in an inputted search string against a character table bank comprising a predetermined number of columns that correspond to a plurality of pre-determined candidate character sets in order to provide enhanced full text search
US7191114B1 (en) 1999-08-27 2007-03-13 International Business Machines Corporation System and method for evaluating character sets to determine a best match encoding a message
JP2001291060A (ja) * 2000-04-04 2001-10-19 Toshiba Corp 単語列照合装置および単語列照合方法
JP4740060B2 (ja) * 2006-07-31 2011-08-03 富士通株式会社 重複データ検出プログラム、重複データ検出方法および重複データ検出装置
DE102007010259A1 (de) 2007-03-02 2008-09-04 Volkswagen Ag Sensor-Auswertevorrichtung und Verfahren zum Auswerten von Sensorsignalen
US8872888B2 (en) 2010-10-01 2014-10-28 Sony Corporation Content transmission apparatus, content transmission method, content reproduction apparatus, content reproduction method, program and content delivery system
US10528556B1 (en) * 2017-12-31 2020-01-07 Allscripts Software, Llc Database methodology for searching encrypted data records
CN112637600B (zh) * 2020-12-14 2024-04-05 绍兴文理学院 对数据进行有损或无损压缩的编码、解码的方法或装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3584205A (en) * 1968-10-14 1971-06-08 Ibm Binary arithmetic and logic manipulator
US4630234A (en) * 1983-04-11 1986-12-16 Gti Corporation Linked list search processor
JPS6195442A (ja) * 1984-10-16 1986-05-14 Nec Corp 記号列照合装置
US4916655A (en) * 1986-02-14 1990-04-10 Hitachi, Ltd. Method and apparatus for retrieval of a search string
US4823306A (en) * 1987-08-14 1989-04-18 International Business Machines Corporation Text search system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0460871A (ja) * 1990-06-29 1992-02-26 Nec Corp 記号列照合装置の制御方式
US10844848B2 (en) 2010-01-21 2020-11-24 The Abell Foundation, Inc. Ocean thermal energy conversion power plant
US11371490B2 (en) 2010-01-21 2022-06-28 The Abell Foundation, Inc. Ocean thermal energy conversion power plant
US11859597B2 (en) 2010-01-21 2024-01-02 The Abell Foundation, Inc. Ocean thermal energy conversion power plant
US12258947B2 (en) 2010-01-21 2025-03-25 The Abell Foundation, Inc. Ocean thermal energy conversion power plant

Also Published As

Publication number Publication date
DE68927625D1 (de) 1997-02-20
EP0366115B1 (en) 1997-01-08
US5377349A (en) 1994-12-27
EP0366115A3 (en) 1991-11-21
JP2737173B2 (ja) 1998-04-08
DE68927625T2 (de) 1997-08-14
EP0366115A2 (en) 1990-05-02

Similar Documents

Publication Publication Date Title
JPH02115973A (ja) 記号列照合装置とその制御方法
JPS60501921A (ja) 並列テキスト照合の方法および装置
CN110019795B (zh) 敏感词检测模型的训练方法和系统
JP2715465B2 (ja) 記号列照合装置
US3521238A (en) Multi-processor computing apparatus
JPS60105039A (ja) 文字列照合方式
JPH04308B2 (ja)
JPH0484367A (ja) 記号列照合装置の制御方式
CN116662598B (zh) 基于矢量索引的人物画像信息管理方法及电子设备
JP2692345B2 (ja) 記号列照合装置
JPH03208172A (ja) 記号列照合装置の制御方式
JP2773657B2 (ja) 文字列検索装置
Alsharif et al. Remote sensing image retrieval using multilingual texts
JPH0460871A (ja) 記号列照合装置の制御方式
JP2839515B2 (ja) 文字読取システム
JPS60583A (ja) 単語認識方式
JPS6128134A (ja) 記号列照合装置とその制御方式
RU2065207C1 (ru) Ассоциативная запоминающая матрица
JPS60225273A (ja) 単語検索方式
JPH0529950B2 (ja)
JPH01245493A (ja) 連想メモリ装置
JPS60211539A (ja) 記号列識別装置及びその制御方式
JPH01224831A (ja) 文字列検索装置
JPS5820075B2 (ja) パタ−ン認識装置
JPH05314169A (ja) 並列データ処理装置および並列形態素抽出方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees