JPS6128133A - 記号列照合装置 - Google Patents
記号列照合装置Info
- Publication number
- JPS6128133A JPS6128133A JP14892584A JP14892584A JPS6128133A JP S6128133 A JPS6128133 A JP S6128133A JP 14892584 A JP14892584 A JP 14892584A JP 14892584 A JP14892584 A JP 14892584A JP S6128133 A JPS6128133 A JP S6128133A
- Authority
- JP
- Japan
- Prior art keywords
- register
- symbol string
- symbol
- output
- register array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は情報処理システムの構成要素に係り、よシ具体
的には長大な記号列の中から特定の記号列を抽出する記
号列照合装置とその照合方式に関するものである。
的には長大な記号列の中から特定の記号列を抽出する記
号列照合装置とその照合方式に関するものである。
(従来技術とその問題点)
上記記号列照合装置はバタン認識システムでのへ゛¥徴
系列の抽出グワープロで作成された文章の原文ファイル
からのキーワードの抽出、言語翻訳の支援や通信文章の
略文の解読、図形、イメージ、テキスト等による非構造
データベースの構築に利用され、知能化されるこれらの
情報処理システムの形成に欠くことができないものであ
る。
系列の抽出グワープロで作成された文章の原文ファイル
からのキーワードの抽出、言語翻訳の支援や通信文章の
略文の解読、図形、イメージ、テキスト等による非構造
データベースの構築に利用され、知能化されるこれらの
情報処理システムの形成に欠くことができないものであ
る。
従来の記号列照合は汎用コンピュータのソフトウェアに
たよった逐次処理によるため、膨大な処理時間を必要と
し、小規模なものに限定されていた。1だ、単語毎に区
切られて構造化された記号列に照合対象が制限さオ]て
いた。−例として、n個の記号列からなるテキスト中に
m個の記号列からなるバタンかどこに有るかを調べる場
合には、m(n m+1)回の照合処理を必要とする
。磁気ディスクや光ディスク等(で格納されたm=10
9個の文字列のテキストから、n=103個の文字列の
文章を抄すには1012回の照合処理を必要とする。従
って、テキストツイメージヌ図形y音声等の大容量な原
情報による検索は非現実的であるだめ、予め原情報にキ
ーワードを付加しての検索や表形式に構造化されたデー
タの検索に限定されていた。まだ、記号列の構成要素の
変動を許容する柔軟な記号列照合に対して処理時間の長
くなシすぎる欠点があった。
たよった逐次処理によるため、膨大な処理時間を必要と
し、小規模なものに限定されていた。1だ、単語毎に区
切られて構造化された記号列に照合対象が制限さオ]て
いた。−例として、n個の記号列からなるテキスト中に
m個の記号列からなるバタンかどこに有るかを調べる場
合には、m(n m+1)回の照合処理を必要とする
。磁気ディスクや光ディスク等(で格納されたm=10
9個の文字列のテキストから、n=103個の文字列の
文章を抄すには1012回の照合処理を必要とする。従
って、テキストツイメージヌ図形y音声等の大容量な原
情報による検索は非現実的であるだめ、予め原情報にキ
ーワードを付加しての検索や表形式に構造化されたデー
タの検索に限定されていた。まだ、記号列の構成要素の
変動を許容する柔軟な記号列照合に対して処理時間の長
くなシすぎる欠点があった。
さらに具体的に従来の記号列照合装置とその照合方式の
問題点について説明する。
問題点について説明する。
第1図は記号列照合の対象となるテキストを示している
。このテキストは報告書の始めの部分を一例として示し
ている。このようなテキストはワープロのファイルメモ
リに多数個格納される。それ等のテキストの中から必要
なものをさがし出す時に、要求内容を示す単語によって
直接に検索できる詞1が求められる。
。このテキストは報告書の始めの部分を一例として示し
ている。このようなテキストはワープロのファイルメモ
リに多数個格納される。それ等のテキストの中から必要
なものをさがし出す時に、要求内容を示す単語によって
直接に検索できる詞1が求められる。
たとえば、第1図のテキストがmemory r bu
−bble %の記号列ケ含む論文であるかを知るため
には)そのデキストの中でmemory z memo
riesやbubble等の記号列に整合する部分があ
るか否がを検索する必要がろる。そのような記号列のテ
キストとの比較照合は従来のコンピュータとソフトウェ
アで対応させると、非常に長い時間を要する。
−bble %の記号列ケ含む論文であるかを知るため
には)そのデキストの中でmemory z memo
riesやbubble等の記号列に整合する部分があ
るか否がを検索する必要がろる。そのような記号列のテ
キストとの比較照合は従来のコンピュータとソフトウェ
アで対応させると、非常に長い時間を要する。
一般のA、サイズの英文はワード間のスペースを含める
と、約3000文字分の長さになる。一方、比較照合を
行なう記号列の長さはmemoryの場合もbubbl
eの場合も6文字である。6文字と3000文字の記号
列間の照合に一般にその積に等しいオーダの回数に及ぶ
文字の比較を必要とする。マイクロプロセッサでの文字
比較時間が1μm1eCであったとしても各記号列の検
索に18 mse’cの時間がかかる。
と、約3000文字分の長さになる。一方、比較照合を
行なう記号列の長さはmemoryの場合もbubbl
eの場合も6文字である。6文字と3000文字の記号
列間の照合に一般にその積に等しいオーダの回数に及ぶ
文字の比較を必要とする。マイクロプロセッサでの文字
比較時間が1μm1eCであったとしても各記号列の検
索に18 mse’cの時間がかかる。
現実に検索の対象となるテキストの文字数は10°個に
及び、照合を行なう記号列の文字数も100を越すこと
もあり得る。照合される記号列の数も1個だけでなく、
数10個に及ぶ。その場合の照合時間は数100時間に
及ぶ。故に、このような照合は現実的に不可能であり、
実除は人手により予めキーワードを抽出しておき、抽出
されたキーワードに対する照合に限定されていた。
及び、照合を行なう記号列の文字数も100を越すこと
もあり得る。照合される記号列の数も1個だけでなく、
数10個に及ぶ。その場合の照合時間は数100時間に
及ぶ。故に、このような照合は現実的に不可能であり、
実除は人手により予めキーワードを抽出しておき、抽出
されたキーワードに対する照合に限定されていた。
本発明の目的は上記従来の記号列照合装置やその方式の
欠点を容易に解決し、テキスト2イメージを図形等の非
構造の記号列の中から任意の記号列を短時間にして、柔
軟な抽出が可能な記号列照合装置とその照合方式を提供
することにある。
欠点を容易に解決し、テキスト2イメージを図形等の非
構造の記号列の中から任意の記号列を短時間にして、柔
軟な抽出が可能な記号列照合装置とその照合方式を提供
することにある。
まだ、本発明の他の目的は照合記号列の長さを任意に設
定可能な低価格な記号列照合装置を提供することにある
。
定可能な低価格な記号列照合装置を提供することにある
。
まだ、本発明の他の目的は出力端子数の少ないL S
I化が容易な記号列照合装置を提供することにある。
I化が容易な記号列照合装置を提供することにある。
(発明の構成)
従って本発明によれば、各記号に関連づけだビットパタ
ンで複数の照合記号列を記憶する記号列記憶手段と、こ
の各出力につながる第1の伝達手段と、互いに隣接する
各レジスタ間が第1の伝達手段により連結された複数の
第1のレジスタアレイと、I!”+接する各レジスタ間
が直列に接続された第2のレジスタアレイと、第2のレ
ジスタアレイの各段のレジスタの内容により、6第1の
レジスタアレイの出力を7′!ル択的に出力する出力手
段と、6第1のレジスタアレイの出力と第2のレジスト
アレイ内のレジスタの出力とを選択的に次の第1のレジ
スタアレイに伝達する第2の伝達手段とを含む記号列照
合装置及び該装置の出力手段にエンコーダ又はシフトレ
ジストが付加された記号列照合装fiが得られる。
ンで複数の照合記号列を記憶する記号列記憶手段と、こ
の各出力につながる第1の伝達手段と、互いに隣接する
各レジスタ間が第1の伝達手段により連結された複数の
第1のレジスタアレイと、I!”+接する各レジスタ間
が直列に接続された第2のレジスタアレイと、第2のレ
ジスタアレイの各段のレジスタの内容により、6第1の
レジスタアレイの出力を7′!ル択的に出力する出力手
段と、6第1のレジスタアレイの出力と第2のレジスト
アレイ内のレジスタの出力とを選択的に次の第1のレジ
スタアレイに伝達する第2の伝達手段とを含む記号列照
合装置及び該装置の出力手段にエンコーダ又はシフトレ
ジストが付加された記号列照合装fiが得られる。
(実施例)
第2図は本発明の第1の実施例の説明図である。
この記号列照合装置は長大な記号列となるテキストを逐
次入力し、その中に登録した照合記号列が含1れている
か否かを調べ、外部に伝達するものであり、照合記号列
をビットバタンで記憶する記号列記憶手段210と、こ
の各出力につながる第1の伝達手段230となるアンド
ゲート回路と、互いに隣接する各レジスタ245間が該
アンドゲート回路230により連結された複数の第1の
レジスタアレイ240と、隣接する第2レジスタ255
間が直列姉接続された第2のレジスタアレイ250と、
第2のレジメ・タアレイ250の各レジスタ255の内
容により選択された第1のレジスタアレイ240の出力
を選択的に出力する出力手段260と、6第1のレジス
タアレイ240の出力と第2のレジスタアレイ250内
のレジスタ255の出力とを選択的に次の第1のレジス
タアレイ240に伝達する第2の伝達手段270とから
なる。
次入力し、その中に登録した照合記号列が含1れている
か否かを調べ、外部に伝達するものであり、照合記号列
をビットバタンで記憶する記号列記憶手段210と、こ
の各出力につながる第1の伝達手段230となるアンド
ゲート回路と、互いに隣接する各レジスタ245間が該
アンドゲート回路230により連結された複数の第1の
レジスタアレイ240と、隣接する第2レジスタ255
間が直列姉接続された第2のレジスタアレイ250と、
第2のレジメ・タアレイ250の各レジスタ255の内
容により選択された第1のレジスタアレイ240の出力
を選択的に出力する出力手段260と、6第1のレジス
タアレイ240の出力と第2のレジスタアレイ250内
のレジスタ255の出力とを選択的に次の第1のレジス
タアレイ240に伝達する第2の伝達手段270とから
なる。
上段に位1賀する第1のレジスタアレイ240内には図
の例では6個の第ルジスタ245を含み、下段の第1の
レジスタアレイ240内には5個の第1のレジスタ24
5を含む。6第1のレジスタアレイ240間はオアゲー
ト回路270とアンドゲート回路230とで連結されて
いる。記号の個数が6個以下の照合記号列を用いる場合
には第2レジスタの第1番目の第2レジスタ255に”
1″を格納させる。この場合、fP、1番目の第2レジ
スタ255につながる第2の伝達手段270は第1のレ
ジスタアレイ240の出力を通過させずに第2レジスタ
255の内容すなわち@1″をアンドゲート回路に供給
する。従って、上段と下段に位置する6第1のレジスタ
アレイ240の入出力は分離される。また、上段の第1
のレジスタアレイ240は出力手段260を介して外部
に照合出力として出力される。
の例では6個の第ルジスタ245を含み、下段の第1の
レジスタアレイ240内には5個の第1のレジスタ24
5を含む。6第1のレジスタアレイ240間はオアゲー
ト回路270とアンドゲート回路230とで連結されて
いる。記号の個数が6個以下の照合記号列を用いる場合
には第2レジスタの第1番目の第2レジスタ255に”
1″を格納させる。この場合、fP、1番目の第2レジ
スタ255につながる第2の伝達手段270は第1のレ
ジスタアレイ240の出力を通過させずに第2レジスタ
255の内容すなわち@1″をアンドゲート回路に供給
する。従って、上段と下段に位置する6第1のレジスタ
アレイ240の入出力は分離される。また、上段の第1
のレジスタアレイ240は出力手段260を介して外部
に照合出力として出力される。
一方、7個以上の記号を有する照合記号列に対しては、
第2のレジスタアレイ250の第1段目と第2段目のf
4fJ2レジスタ255に各々″0″と′1′を格納さ
せる。この場合、第2の伝達手段270は上段の第1の
レジスタアレイ240の出力を通過させ、アンドゲート
回路230に供給する。従って、上段と下段の第1のレ
ジスタアレイ240が連結される。また、出力手段26
0は下段の第1のレジスタアレイ240の出力を照合出
力として通過させる。仁のように、7個以上の記号から
なる照合記号列に対しては、6第1のレジスタアレイ2
40を連結させて用いる。この連結ハ第2のレジスタア
レイ250の内容により制御できる。
第2のレジスタアレイ250の第1段目と第2段目のf
4fJ2レジスタ255に各々″0″と′1′を格納さ
せる。この場合、第2の伝達手段270は上段の第1の
レジスタアレイ240の出力を通過させ、アンドゲート
回路230に供給する。従って、上段と下段の第1のレ
ジスタアレイ240が連結される。また、出力手段26
0は下段の第1のレジスタアレイ240の出力を照合出
力として通過させる。仁のように、7個以上の記号から
なる照合記号列に対しては、6第1のレジスタアレイ2
40を連結させて用いる。この連結ハ第2のレジスタア
レイ250の内容により制御できる。
照合記号列の各記号は記号記憶手段210の各ビットに
記号に関連づけたピッドパクンで格納される。このビッ
トパタンは記号で選択された番地のみ”1″になってい
る。第2図の例では11ビツトの記号記憶手段210に
”A、BABB″ の5個の記号からなる照合記号例を
格納している。すなわち、記号″A”で指定されるアド
レスの第1f3ビツトと記号″B”で指定されるアドレ
スの第:2j4+5ビツトにのみ1″が格納され、他は
0”が格納される。但し、記号列記憶手段2】0の第6
ビツトは全アドレスに1”を格納させる。
記号に関連づけたピッドパクンで格納される。このビッ
トパタンは記号で選択された番地のみ”1″になってい
る。第2図の例では11ビツトの記号記憶手段210に
”A、BABB″ の5個の記号からなる照合記号例を
格納している。すなわち、記号″A”で指定されるアド
レスの第1f3ビツトと記号″B”で指定されるアドレ
スの第:2j4+5ビツトにのみ1″が格納され、他は
0”が格納される。但し、記号列記憶手段2】0の第6
ビツトは全アドレスに1”を格納させる。
従って、それにつながるアンドゲート回路230は第5
番目の第ルジスタ245の内容Q5をそのまま第6番目
の第ルジスタ245に供給する。
番目の第ルジスタ245の内容Q5をそのまま第6番目
の第ルジスタ245に供給する。
また、第2のレジスタアレイ250の第1番目の第2レ
ジスタには1″を格納させ、上段の第1のレジスタアレ
イ240の出力Q 5 lx出力手段270を介して外
部に出力させる。
ジスタには1″を格納させ、上段の第1のレジスタアレ
イ240の出力Q 5 lx出力手段270を介して外
部に出力させる。
先にi兄明したように、記号記憶手段210の番地は記
号の種類に対応し、その第1.3ビツトの読取や出力は
記号゛A”が入力されたときのみ1”となシ、第2ν4
,5ビツトの読取り出力は”B″が入力されたときのみ
”1″となる。また、第6ビツトの読取り出力は常に”
1”を発生する。
号の種類に対応し、その第1.3ビツトの読取や出力は
記号゛A”が入力されたときのみ1”となシ、第2ν4
,5ビツトの読取り出力は”B″が入力されたときのみ
”1″となる。また、第6ビツトの読取り出力は常に”
1”を発生する。
照合しようとするテキストを構成する記号は逐次記号記
憶手段210のアドレス人力211に印加され、その記
号に対応する番地の内容が読み出される。記号記憶手段
210の第1ビツトの読取多出力は内部信号として第1
のレジスタアレイ240の初段のレジスタ245に供給
される。他の読取り出力はアンドゲート回路で構成され
た内部信号の伝達手段230に供給され、レジスタアレ
イ240内の各段のレジスタ245に蓄積された内部信
号を次段のレジスタ245に伝達するか否かを制御する
。このレジスタアレイ240内の各段のレジスタ245
は、記号の入力毎に印加される同一のクロック信号24
1で内部信号の取込みを行なう。内部信号は記号記憶手
段210のアドレス人力211に記号列”ABABB”
が入カネれたときにのみレジスタアレイ240の各段の
レジスタを通過し、出力手段270を介して特定のレジ
スタの内容が照合出力端子280から出力される。
憶手段210のアドレス人力211に印加され、その記
号に対応する番地の内容が読み出される。記号記憶手段
210の第1ビツトの読取多出力は内部信号として第1
のレジスタアレイ240の初段のレジスタ245に供給
される。他の読取り出力はアンドゲート回路で構成され
た内部信号の伝達手段230に供給され、レジスタアレ
イ240内の各段のレジスタ245に蓄積された内部信
号を次段のレジスタ245に伝達するか否かを制御する
。このレジスタアレイ240内の各段のレジスタ245
は、記号の入力毎に印加される同一のクロック信号24
1で内部信号の取込みを行なう。内部信号は記号記憶手
段210のアドレス人力211に記号列”ABABB”
が入カネれたときにのみレジスタアレイ240の各段の
レジスタを通過し、出力手段270を介して特定のレジ
スタの内容が照合出力端子280から出力される。
第3図は第2図の記号列照合装置の動作説明図である。
これは第2図に示したように記号記憶手段210にAB
ABB”の照合記号列が格納され、そのアドレス人力2
11にテキスト”ABABAABBABABBAB″の
記号列が入力されたときの第1のレジスタアレイ240
の各段の出力Q1〜Q6を示している。第1のレジスタ
アレイ240の初段の出力Q1は記号”A″が入力され
たときのみ1”となり、まだ第2段の出力Q2はQlが
1で記号″B”が入力されたときにのみ1′となる。こ
のようにして、照合出力端子280に出力されるQ6は
テキスト内に照合記号夕じABABB”に等しい記号列
が現われたときに1″となる。
ABB”の照合記号列が格納され、そのアドレス人力2
11にテキスト”ABABAABBABABBAB″の
記号列が入力されたときの第1のレジスタアレイ240
の各段の出力Q1〜Q6を示している。第1のレジスタ
アレイ240の初段の出力Q1は記号”A″が入力され
たときのみ1”となり、まだ第2段の出力Q2はQlが
1で記号″B”が入力されたときにのみ1′となる。こ
のようにして、照合出力端子280に出力されるQ6は
テキスト内に照合記号夕じABABB”に等しい記号列
が現われたときに1″となる。
この例では時刻T14にQ6が“1”となるので、それ
より一時刻前に入力された下線で示す記号列が照合記合
列に等しいとわかる。
より一時刻前に入力された下線で示す記号列が照合記合
列に等しいとわかる。
この例では記号記憶手段210に格納された照合記号列
″ABABB″のみ検知しているが、テキスト内の記号
列の1部が重複したシ、欠けたシしても混同がなければ
検知することも可能である。
″ABABB″のみ検知しているが、テキスト内の記号
列の1部が重複したシ、欠けたシしても混同がなければ
検知することも可能である。
たとえば、照合記号列の先頭が記号″Z″でも良いとす
る場合には記号記憶手段210の第0ピツトの記号2で
指定される番地にも1”を格納しておくことで、ABA
B B”および” ZBABB″の両記号列を抽出でき
る。
る場合には記号記憶手段210の第0ピツトの記号2で
指定される番地にも1”を格納しておくことで、ABA
B B”および” ZBABB″の両記号列を抽出でき
る。
この記号列照合装置は単語等の意味を持つ記号列毎にス
ペース等の区切り記号等がない記号列の照合も可能にす
る。また、同様な意味を有する異なる記号列の照合も可
能である。英単語、特に名詞V1:単数形と板数形で最
終文字が異なる場合が多い。例えば’ rlemory
”は複数形になるとme−mories ”になる。こ
の場合、照合記号列としてmemo r y”とmem
ori ”すなわちS”memoryの最後に”y”と
i″の両記号を付加した記号列を記憶しておくことで、
”memory”と”m em −ories”の両記
号列を照合できる。
ペース等の区切り記号等がない記号列の照合も可能にす
る。また、同様な意味を有する異なる記号列の照合も可
能である。英単語、特に名詞V1:単数形と板数形で最
終文字が異なる場合が多い。例えば’ rlemory
”は複数形になるとme−mories ”になる。こ
の場合、照合記号列としてmemo r y”とmem
ori ”すなわちS”memoryの最後に”y”と
i″の両記号を付加した記号列を記憶しておくことで、
”memory”と”m em −ories”の両記
号列を照合できる。
この記号列照合装置は容易にLSI化が可能であるので
低価格化をもたらし、また1個の記号を記号列記憶手段
、例えばICメモリのほぼサイクルタイムで照合可能で
あるため、高速な記号列照合を可能にする。また、種々
の長さの記号列長の照合記号列を取扱うことができる。
低価格化をもたらし、また1個の記号を記号列記憶手段
、例えばICメモリのほぼサイクルタイムで照合可能で
あるため、高速な記号列照合を可能にする。また、種々
の長さの記号列長の照合記号列を取扱うことができる。
まだ、照合出力を発生する出力端子数が削減され、よシ
容易にLSI化を可能にする。
容易にLSI化を可能にする。
第4図は本発明による記号列照合装置の他の実施例の説
明図である。この記号列照合装置は任意の記号列長の複
数の照合記号列を並列に照合できる。これを可能にする
ために、第2図の記号列記憶装置に使用した第2の伝達
手段270と第1の伝達手段230と出力手段260と
に各々対応するオアゲート回路470と第1のアンドゲ
ート回路430と第2のアンドゲート回路460と、さ
らに記号列記憶手段210と第1のレジスタアレイ44
0と第2のレジスタアレイ450と出力手段としてのア
ンドゲート回路460に付加されるエンコーダ490と
から構成される。
明図である。この記号列照合装置は任意の記号列長の複
数の照合記号列を並列に照合できる。これを可能にする
ために、第2図の記号列記憶装置に使用した第2の伝達
手段270と第1の伝達手段230と出力手段260と
に各々対応するオアゲート回路470と第1のアンドゲ
ート回路430と第2のアンドゲート回路460と、さ
らに記号列記憶手段210と第1のレジスタアレイ44
0と第2のレジスタアレイ450と出力手段としてのア
ンドゲート回路460に付加されるエンコーダ490と
から構成される。
第1のレジスタアレイ440はM個有シ、各々N個のレ
ジスタ445を含んでいる。各節」のレジスタアレイ4
40内の各レジスタ445は第1のアンドゲート回路4
30を介して連結され、各節1のレジスタアレイ440
はオアゲート回路470と第1のアンドゲート回路43
0を介して接続される。第2のレジスタアレイ450は
第1のレジスタアレイ440の個数に対応するM個のレ
ジスタを含み、それらは直列に接続されている。
ジスタ445を含んでいる。各節」のレジスタアレイ4
40内の各レジスタ445は第1のアンドゲート回路4
30を介して連結され、各節1のレジスタアレイ440
はオアゲート回路470と第1のアンドゲート回路43
0を介して接続される。第2のレジスタアレイ450は
第1のレジスタアレイ440の個数に対応するM個のレ
ジスタを含み、それらは直列に接続されている。
照合記号列は第2図と同様に記号に関連づけたビットバ
タンで記号列記憶手段210に格納される。すなわち、
照合記号列の記号で示される記号列記憶手段210のア
ドレスにのみ1″を書込むことでその記号が格納される
。照合記号列の記号数が第1のレジスタアレイ440の
レジスタ445の個数Nよシ小さい場合には、記号列記
憶手段210に第1のレジスタアレイ440に対応して
M個の照合記号列を格納できる。このとき、第2のレジ
スタアレイ450の各レジスタ455には、M個の照合
記号列を区切るマーカとして”1”を格納する。このマ
ーカはマーカ入力信号451と共に第2のレジスタアレ
イ450へのマーカ書込みクロック信号452を印加す
ることで直列に書込める。また、照合記号列の記号数と
Nとの差に相当する記号列記憶手段2100ピツトには
全てのアドレスに”1”を格納して訃く必要がある。
タンで記号列記憶手段210に格納される。すなわち、
照合記号列の記号で示される記号列記憶手段210のア
ドレスにのみ1″を書込むことでその記号が格納される
。照合記号列の記号数が第1のレジスタアレイ440の
レジスタ445の個数Nよシ小さい場合には、記号列記
憶手段210に第1のレジスタアレイ440に対応して
M個の照合記号列を格納できる。このとき、第2のレジ
スタアレイ450の各レジスタ455には、M個の照合
記号列を区切るマーカとして”1”を格納する。このマ
ーカはマーカ入力信号451と共に第2のレジスタアレ
イ450へのマーカ書込みクロック信号452を印加す
ることで直列に書込める。また、照合記号列の記号数と
Nとの差に相当する記号列記憶手段2100ピツトには
全てのアドレスに”1”を格納して訃く必要がある。
例えば、第1のレジスタアレイ440のレジスタ445
0個数Nを8とし、そこに6文字の照合記号列” me
mory”を格納する場合には、記号列記憶手段の第1
ビツト目と第2ビツト目の全アドレスに”1″を格納し
、第3ビツト目から第8ビツト目に各々 m″9″′e
″ 1 ” wO″ツ6r″?”y”の記号に対応する
アドレスにのみ1”を格納させる。このように格納する
と、第1のレジスタアレイ440内の第1段目と第2段
目のレジスタ445には、記号列入力端子221から入
力される記号にかかわらず常に”1″が保持され
・る。その結果、照合記号夕1じmemory ″に等
しい6市袖列が記号列入力端子221から入力されたと
きのみ、”■”の内部信号が第1のレジスタアレイ44
0内の最終段のレジスタ445に伝達され、第2のアン
ドゲート回路460を介して、照合出力480が発生す
る。すなわち、レジスタ445の段数Nよシ短い詫号列
長の照合記号列の照合が可能となる。
0個数Nを8とし、そこに6文字の照合記号列” me
mory”を格納する場合には、記号列記憶手段の第1
ビツト目と第2ビツト目の全アドレスに”1″を格納し
、第3ビツト目から第8ビツト目に各々 m″9″′e
″ 1 ” wO″ツ6r″?”y”の記号に対応する
アドレスにのみ1”を格納させる。このように格納する
と、第1のレジスタアレイ440内の第1段目と第2段
目のレジスタ445には、記号列入力端子221から入
力される記号にかかわらず常に”1″が保持され
・る。その結果、照合記号夕1じmemory ″に等
しい6市袖列が記号列入力端子221から入力されたと
きのみ、”■”の内部信号が第1のレジスタアレイ44
0内の最終段のレジスタ445に伝達され、第2のアン
ドゲート回路460を介して、照合出力480が発生す
る。すなわち、レジスタ445の段数Nよシ短い詫号列
長の照合記号列の照合が可能となる。
一方:記号列長がNより大きい照合記号列に対しては、
2個以上の第1のレジスタアレイ44.0にまたがって
照合記号列を格納する。このために、その第1のレジス
タアレイ440のつなが9に対応する第2のレジスタア
レイ450のレジスタ455に連続していることを意味
するO″を格納させる。この結果、”0”を出力する第
2のレジスタアレイ450のレジスタ455につながる
一オアゲー)・回路470は、第1のレジスタアレイ4
40の最終段のレジスタ445の内容を次の策1のレジ
スタアレイ4400Å力につながるアンドゲート回路4
30に伝達する。すなわち、2個の第1のレジスタアレ
イ440が連わ1′、に接続されたことになる。とのよ
うに、第2のレジスタアレイ450内のレジスタ455
の内容により、各節1のレジスタアレイ440を直列に
接続しだシ、捷だ分離することができる。すなわち、第
1のレジスタアレイ440内のレジスタ445の段数N
の単位でそのレジスタ445・をっなけることできる。
2個以上の第1のレジスタアレイ44.0にまたがって
照合記号列を格納する。このために、その第1のレジス
タアレイ440のつなが9に対応する第2のレジスタア
レイ450のレジスタ455に連続していることを意味
するO″を格納させる。この結果、”0”を出力する第
2のレジスタアレイ450のレジスタ455につながる
一オアゲー)・回路470は、第1のレジスタアレイ4
40の最終段のレジスタ445の内容を次の策1のレジ
スタアレイ4400Å力につながるアンドゲート回路4
30に伝達する。すなわち、2個の第1のレジスタアレ
イ440が連わ1′、に接続されたことになる。とのよ
うに、第2のレジスタアレイ450内のレジスタ455
の内容により、各節1のレジスタアレイ440を直列に
接続しだシ、捷だ分離することができる。すなわち、第
1のレジスタアレイ440内のレジスタ445の段数N
の単位でそのレジスタ445・をっなけることできる。
このように第2のレジスタアレイ450の内容により、
任意の第1のレジスタアレイ440内の最終段のレジス
タ445内の内部信号を照合出力480に導くことがで
き、複数の第1のレジスタアレイ440を任意に分割、
接続ができる。従って、記号列記憶手段210に任意の
記号列長の複数の照合記号列を格納でき、その照合記号
列に関する並列照合が可能となる。
任意の第1のレジスタアレイ440内の最終段のレジス
タ445内の内部信号を照合出力480に導くことがで
き、複数の第1のレジスタアレイ440を任意に分割、
接続ができる。従って、記号列記憶手段210に任意の
記号列長の複数の照合記号列を格納でき、その照合記号
列に関する並列照合が可能となる。
また、照合出力端子480の数は、第1のレジスタアレ
イ440の数Mで複数の第1のレジスタアレイ440内
のレジスタ445の111数のN分の1である。出力端
子数が少ないため、容易にI、S■化が可能となシ価格
低下をもたらす。
イ440の数Mで複数の第1のレジスタアレイ440内
のレジスタ445の111数のN分の1である。出力端
子数が少ないため、容易にI、S■化が可能となシ価格
低下をもたらす。
各照合出力480はエンコーダ490に導かれ、照合し
た記号列の分類コード49】をエンコーダは発生する。
た記号列の分類コード49】をエンコーダは発生する。
いずれの照合出力480もエンコーダ490に到達して
いない場合に、エンコーダ490は判別不能信号492
を出力する。このようなエンコーダ490はプライオリ
ティ・エンコーダの商品名で市販されている。分類コー
ト491のビット数は照合出力480の個数を2Nとす
ると、Nビットとなり、記号列照合装置の出力端子数を
削減し、容易にLS’I化を実現できる。
いない場合に、エンコーダ490は判別不能信号492
を出力する。このようなエンコーダ490はプライオリ
ティ・エンコーダの商品名で市販されている。分類コー
ト491のビット数は照合出力480の個数を2Nとす
ると、Nビットとなり、記号列照合装置の出力端子数を
削減し、容易にLS’I化を実現できる。
また、エンコーダ490の代シに照合出力480の信号
を並列に入力し、それを直列に出力するシフトレジスタ
に鰺換えることも可能である。仁の場合、出力端子数が
1個となりさらにLSI化が容易になる。
を並列に入力し、それを直列に出力するシフトレジスタ
に鰺換えることも可能である。仁の場合、出力端子数が
1個となりさらにLSI化が容易になる。
々お、第12第2のアンドゲート回路430゜460及
びオアゲート回路470は各々内部信号の第1の伝達手
段、内部信号の出力手段、内部信号の第2の伝達 手段
の機能を有するものならば、他のゲート回路に11テ換
えることも可能である。
びオアゲート回路470は各々内部信号の第1の伝達手
段、内部信号の出力手段、内部信号の第2の伝達 手段
の機能を有するものならば、他のゲート回路に11テ換
えることも可能である。
(発明の効果)
以上述べたように、本発明によれば従来の記号列照合に
おいて照合時間が掛かりすぎる問題を容易に解決した記
号列照合装置を実現できる。才だ一部の記号の誤りや変
化にも柔軟に対応できる照合が可能である。さらに、記
号列長が異なる複数の照合記号列を格納でき、それらを
並列に照合できる。従って、ハードウェアを効率的に利
用し、価格低下と照合時間の短縮をもたらす。
おいて照合時間が掛かりすぎる問題を容易に解決した記
号列照合装置を実現できる。才だ一部の記号の誤りや変
化にも柔軟に対応できる照合が可能である。さらに、記
号列長が異なる複数の照合記号列を格納でき、それらを
並列に照合できる。従って、ハードウェアを効率的に利
用し、価格低下と照合時間の短縮をもたらす。
本発明の記号列照合装置は現状の256キロピツ) R
AMの半導体技術を用いれば、記号のコード長を8ビツ
トとすると、平均8個の記号列長の照合記号列を128
個を1チツプに収納でき、それらを並列に照合できる。
AMの半導体技術を用いれば、記号のコード長を8ビツ
トとすると、平均8個の記号列長の照合記号列を128
個を1チツプに収納でき、それらを並列に照合できる。
1チツプで256種の記号から成る記号列を128クラ
スに分類することができる事はワープロで作成した文章
の原文ファイルからシーケンシアルに読出される記号列
文章の中から128個寸でのキーワード(記号列)の抽
出を一挙にやシとけれる事を意味する。従来は多数のキ
ーワードの同時検索が困難であったから、上記チップの
インパクトは太きい。
スに分類することができる事はワープロで作成した文章
の原文ファイルからシーケンシアルに読出される記号列
文章の中から128個寸でのキーワード(記号列)の抽
出を一挙にやシとけれる事を意味する。従来は多数のキ
ーワードの同時検索が困難であったから、上記チップの
インパクトは太きい。
この記号列識別装置はOCR装置や音声認識装置などバ
タン認識を行なうシステムにおける特徴系列の分X口に
おいても役立つ。この記号列識別装置の1チツプLSI
化は言語翻訳に必要な辞書としても役立つ。このチップ
に通常RAMを接続し各記号列の分類コードに対応すけ
て、単語の訳語を格納すると、1チツプにつき128単
語までの翻訳が記号列の入力の完了時に直ちに求まる。
タン認識を行なうシステムにおける特徴系列の分X口に
おいても役立つ。この記号列識別装置の1チツプLSI
化は言語翻訳に必要な辞書としても役立つ。このチップ
に通常RAMを接続し各記号列の分類コードに対応すけ
て、単語の訳語を格納すると、1チツプにつき128単
語までの翻訳が記号列の入力の完了時に直ちに求まる。
記号列識別チップに接続される通常RAMには記号列の
分)頂コードに対応ずけて、各種の情報を格納すること
が可能であって、それによって種々の記号列情報処理機
能が達成される。たとえば、記号列の分’4’a4コー
ドに対応すけ、単語の品詞コードや記号列の出現回数や
記号列文章に対する処理命令を格納すると、知識情報の
収集や整理が行ないやすくなる。
分)頂コードに対応ずけて、各種の情報を格納すること
が可能であって、それによって種々の記号列情報処理機
能が達成される。たとえば、記号列の分’4’a4コー
ドに対応すけ、単語の品詞コードや記号列の出現回数や
記号列文章に対する処理命令を格納すると、知識情報の
収集や整理が行ないやすくなる。
この記号列抽出装置の処理速度は、記号記憶手段に使わ
れる半導体RAMのサイクルタイムTcが1つの記号の
処理時間にはぼ対応する。Tcを100 nsとすると
、109個の記号列のテギス)K対する103個の記号
列による照合を10秒で行なえる。現状のソフトウェア
による照合では10時間程度を必要とするので、本発明
の記号列照合装置は著しく照合時間を短縮する。
れる半導体RAMのサイクルタイムTcが1つの記号の
処理時間にはぼ対応する。Tcを100 nsとすると
、109個の記号列のテギス)K対する103個の記号
列による照合を10秒で行なえる。現状のソフトウェア
による照合では10時間程度を必要とするので、本発明
の記号列照合装置は著しく照合時間を短縮する。
以上まとめると、従来のマイコンとソフトウェアの組合
わせによる記号列の分類による処理時間の大きい事と柔
軟性に欠ける事の欠陥が容易に解決する。また、本発明
の記号列識別装置が1チツプのLSIにまとまシ易い事
を考えると、このようなLS’Iは文章の原文ファイル
からのキーワードの抽出や言語翻訳用の電子辞書やバタ
ン認識システムの特徴系列の分類において欠かすことの
できない機能素子になる。
わせによる記号列の分類による処理時間の大きい事と柔
軟性に欠ける事の欠陥が容易に解決する。また、本発明
の記号列識別装置が1チツプのLSIにまとまシ易い事
を考えると、このようなLS’Iは文章の原文ファイル
からのキーワードの抽出や言語翻訳用の電子辞書やバタ
ン認識システムの特徴系列の分類において欠かすことの
できない機能素子になる。
第1図は記号列照合問題の説明図、第2図は本発明によ
る記号列照合装置の一実施例の説明図、第7図 第3図
る記号列照合装置の一実施例の説明図、第7図 第3図
Claims (4)
- (1)各記号に関連づけたビットパタンで複数の照合記
号列を記憶する記号列記憶手段と、この各出力につなが
る第1の伝達手段と、互いに隣接する各レジスタ間が第
1の伝達手段により連結された複数の第1のレジスタア
レイと、隣接する各レジスタ間が直列に接続された第2
のレジスタアレイと、第2のレジスタアレイの各段のレ
ジスタの内容により各第1のレジスタアレイの出力を選
択的に出力する出力手段と、各第1のレジスタアレイの
出力と第2のレジスタアレイ内のレジスタの出力とを選
択的に次の第1のレジスタアレイに伝達する第2の伝達
手段とを備えたことを特徴とする記号列照合装置。 - (2)第1の伝達手段と出力手段がアンドゲート回路で
あり、前記第2の伝達手段がオアゲート回路であること
を特徴とする特許請求の範囲第1項記載の記号列照合装
置。 - (3)各記号に関連づけたビットパタンで複数の照合記
号列を記憶する記号列記憶手段と、この各出力につなが
る第1の伝達手段と、互いに隣接する各レジスタ間が第
1の伝達手段により連結された複数の第1のレジスタア
レイと、隣接する各レジスタ間が直列に接続された第2
のレジスタアレイと、第2のレジスタアレイの各段のレ
ジスタの内容により各第1のレジスタアレイの出力を選
択的に出力する出力手段と、各第1のレジスタアレイの
出力と第2のレジスタアレイ内のレジスタの出力とを選
択的に次の第1のレジスタアレイに伝達する第2の伝達
手段と前記出力手段に付加するエンコーダ又はシフトレ
ジスタとを備えたことを特徴とする記号列照合装置。 - (4)第1の伝達手段と出力手段がアンドゲート回路で
あり、前記第2の伝達手段がオアゲート回路であること
を特徴とする特許請求の範囲第3項記載の記号列照合装
置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP14892584A JPS6128133A (ja) | 1984-07-18 | 1984-07-18 | 記号列照合装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP14892584A JPS6128133A (ja) | 1984-07-18 | 1984-07-18 | 記号列照合装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6128133A true JPS6128133A (ja) | 1986-02-07 |
| JPH0527150B2 JPH0527150B2 (ja) | 1993-04-20 |
Family
ID=15463726
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP14892584A Granted JPS6128133A (ja) | 1984-07-18 | 1984-07-18 | 記号列照合装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6128133A (ja) |
-
1984
- 1984-07-18 JP JP14892584A patent/JPS6128133A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0527150B2 (ja) | 1993-04-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0533422B2 (ja) | ||
| JP2737173B2 (ja) | 記号列照合装置とその制御方法 | |
| JP2715465B2 (ja) | 記号列照合装置 | |
| JPS6128133A (ja) | 記号列照合装置 | |
| JPH0554147B2 (ja) | ||
| JPH0529950B2 (ja) | ||
| JPH0554148B2 (ja) | ||
| JPS6128130A (ja) | 記号列照合装置の制御方式 | |
| JPS6195443A (ja) | 記号列照合装置 | |
| JPS60225273A (ja) | 単語検索方式 | |
| JP3007697B2 (ja) | 単語照合装置及び単語照合方法 | |
| JPH0438026B2 (ja) | ||
| JPS5814710B2 (ja) | パタ−ン分類装置 | |
| JPH0583957B2 (ja) | ||
| JPS6095689A (ja) | 光学的文字読取装置 | |
| JP2784004B2 (ja) | 文字認識装置 | |
| JPS6128131A (ja) | 記号列照合装置とその照合方式 | |
| JPS60150169A (ja) | 電子式単語辞書 | |
| JPS6120178A (ja) | 記号列識別装置とその制御方式 | |
| CN1147655A (zh) | 一种汉字信息检索方法和使用该方法的电子记事簿 | |
| JPH0283594A (ja) | 形態素合成形英単語辞書構成方式 | |
| JPS63138479A (ja) | 文字認識装置 | |
| JPS61161588A (ja) | 文字認識後処理方式 | |
| JPS63268082A (ja) | パタ−ン認識装置 | |
| Downton et al. | A visual programming toolkit demonstrator for offline handwritten forms recognition |