JPS6128134A - 記号列照合装置とその制御方式 - Google Patents
記号列照合装置とその制御方式Info
- Publication number
- JPS6128134A JPS6128134A JP14892684A JP14892684A JPS6128134A JP S6128134 A JPS6128134 A JP S6128134A JP 14892684 A JP14892684 A JP 14892684A JP 14892684 A JP14892684 A JP 14892684A JP S6128134 A JPS6128134 A JP S6128134A
- Authority
- JP
- Japan
- Prior art keywords
- symbol string
- symbol
- storage means
- temporary storage
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000012795 verification Methods 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 11
- 238000012546 transfer Methods 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000015654 memory Effects 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000000630 rising effect Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- XDLMVUHYZWKMMD-UHFFFAOYSA-N 3-trimethoxysilylpropyl 2-methylprop-2-enoate Chemical compound CO[Si](OC)(OC)CCCOC(=O)C(C)=C XDLMVUHYZWKMMD-UHFFFAOYSA-N 0.000 description 1
- 241000272201 Columbiformes Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は情報処理システムの構成要素に係り、より具体
的CCは長大な記号列の、中から特定の記号列を抽出す
る記号列照合装置とその照合方式に関するものである。
的CCは長大な記号列の、中から特定の記号列を抽出す
る記号列照合装置とその照合方式に関するものである。
(従来技術とその問題点)
−F記記号列照合装置はバタン認識システムでの%徴系
列の抽出、ワ、−プロで作成された文章の原文ファイル
からのキーワードの抽出、言語翻訳の支援や通信文章の
略又の解説、図形、イメー7、テキスト等による弁構造
テークベースの構築に利用され、知能化されるこれらの
情報処理システムの形に欠くことができないものである
。
列の抽出、ワ、−プロで作成された文章の原文ファイル
からのキーワードの抽出、言語翻訳の支援や通信文章の
略又の解説、図形、イメー7、テキスト等による弁構造
テークベースの構築に利用され、知能化されるこれらの
情報処理システムの形に欠くことができないものである
。
従来の記号列照合は汎用コンピュータのソフトウェアに
たよった逐次処理によるため、膨大な処理時間を必要と
し、小規模なものに限定されていた。また、単語毎に区
切られて構造化された記号列に照合対象が制限されて諭
た。−列として、。
たよった逐次処理によるため、膨大な処理時間を必要と
し、小規模なものに限定されていた。また、単語毎に区
切られて構造化された記号列に照合対象が制限されて諭
た。−列として、。
個の記号列からなるテキスト中Kn個の記号列から々る
バタンかどこに有るかを調べる場合には、m (n、−
m + 1 )回の照合処理を必要とする。磁気ディス
クや元ディスク等に格納されたm=109個の文字列の
テキストから、n−=10”個の文字列の文章を捜すに
は10 回の照合処理を必要とする従って、テキスト、
イメージ、図形、音声等の犬容附な原情報による検索は
非現実的であるため、予め原情報にキーワードを付加し
ての検束や表形式に構造化されたテークの検束に限定さ
れていた。
バタンかどこに有るかを調べる場合には、m (n、−
m + 1 )回の照合処理を必要とする。磁気ディス
クや元ディスク等に格納されたm=109個の文字列の
テキストから、n−=10”個の文字列の文章を捜すに
は10 回の照合処理を必要とする従って、テキスト、
イメージ、図形、音声等の犬容附な原情報による検索は
非現実的であるため、予め原情報にキーワードを付加し
ての検束や表形式に構造化されたテークの検束に限定さ
れていた。
また、記号列の構成要素の変動を許容する柔軟な記号列
照合に対して処理時間の長くなりすぎる欠点があった。
照合に対して処理時間の長くなりすぎる欠点があった。
さらKJ4体的に従来の記号列照合装置とその照合方式
の問題点について説明する。
の問題点について説明する。
第6図は記号列照合の対象となるテキストを示している
。このテキストは報告書の始めの部分を一列として示し
ている。このようなテキストはワープロのファイルメモ
リに多数個格納される。それ等のテキストの中から、必
要なものをさがし出す時に、要求内容を示す単語によっ
て直接に検原できる事が求められる。
。このテキストは報告書の始めの部分を一列として示し
ている。このようなテキストはワープロのファイルメモ
リに多数個格納される。それ等のテキストの中から、必
要なものをさがし出す時に、要求内容を示す単語によっ
て直接に検原できる事が求められる。
たとえば、第1図のテキストがmemory、 bub
ble等の記号列を含む論文であるかを知るためKは、
そのテキストの中でmemory、 memories
Jpbubble等の記号列に整合する部分があるか
否かを検束する必要がある。そのような記号列のテキス
トとの比較照合は従来のコンピュータとソフトウェアで
対応させると、非常に長い時間を要する。
ble等の記号列を含む論文であるかを知るためKは、
そのテキストの中でmemory、 memories
Jpbubble等の記号列に整合する部分があるか
否かを検束する必要がある。そのような記号列のテキス
トとの比較照合は従来のコンピュータとソフトウェアで
対応させると、非常に長い時間を要する。
一般のA4ザイズの英文はワード間のスペースを含める
と、約3000 文字の是さはなる。一方、比較照合を
行なう記号列の長さはmelno r Yの場合もde
viceの場合も6文字である。6文字と3000文字
の記号列間の照合は一般にその積に等しいオーダの回数
に及ぶ文字の比較を必要とする。マイクロプロセッサで
の文字比較時間が1μsec であったとしても、各
記号列の検束に18m5ecの時間がかかる。
と、約3000 文字の是さはなる。一方、比較照合を
行なう記号列の長さはmelno r Yの場合もde
viceの場合も6文字である。6文字と3000文字
の記号列間の照合は一般にその積に等しいオーダの回数
に及ぶ文字の比較を必要とする。マイクロプロセッサで
の文字比較時間が1μsec であったとしても、各
記号列の検束に18m5ecの時間がかかる。
現実に横飛の対象となるテキストの文字数は10個に及
び、照合を行なう記号列の文字数も100を越すことも
ありうる。照合恣れる記号列の数を1個だけでなく、数
10個に及ぶ。その場合の照合時間は数100時間に及
ぶ。故に、このような照合は現実的に不可能であり、実
際は入手により予めキーソードを抽出しておき、抽出さ
れたキーワドに対する照合に限定されていた。
び、照合を行なう記号列の文字数も100を越すことも
ありうる。照合恣れる記号列の数を1個だけでなく、数
10個に及ぶ。その場合の照合時間は数100時間に及
ぶ。故に、このような照合は現実的に不可能であり、実
際は入手により予めキーソードを抽出しておき、抽出さ
れたキーワドに対する照合に限定されていた。
また、一部の記号に欠けや誤りのある記号列や余分な記
号が付加された記号列の照合が困難である。例えば、文
字列’ MEMORY“ に門し、その中文字゛0“が
他の文字11 X″に置換った文字列皐MEMXR,Y
“や、文字110 L/が欠けたMEMRY“や余分な
文字It X l/が付加された”MRMXOI(、Y
“が入力された場合に、照合又字列′″M、BΔ40R
Y”と類似していることを出力できることが記号列照合
VC望まれる。しかし、従来の記号列照合装置や照合方
式では一部の記号の誤りに関しでは照合記号列と重ね合
せて比較することにより類似性を調べることができるが
、一部の記号の欠けや余分な文字の付加に苅しては対処
できなかった。
号が付加された記号列の照合が困難である。例えば、文
字列’ MEMORY“ に門し、その中文字゛0“が
他の文字11 X″に置換った文字列皐MEMXR,Y
“や、文字110 L/が欠けたMEMRY“や余分な
文字It X l/が付加された”MRMXOI(、Y
“が入力された場合に、照合又字列′″M、BΔ40R
Y”と類似していることを出力できることが記号列照合
VC望まれる。しかし、従来の記号列照合装置や照合方
式では一部の記号の誤りに関しでは照合記号列と重ね合
せて比較することにより類似性を調べることができるが
、一部の記号の欠けや余分な文字の付加に苅しては対処
できなかった。
(発明の目的)
本発明の目的は上記従来の記号列照合装置やその方式の
欠点を容易に解決し、テキスト、イメージ、図形等の非
構造の記号列の1中から任意の記号列を短時間にして、
柔軟な抽出が可能な記号列照合装置とその照合方式を提
供することにある。
欠点を容易に解決し、テキスト、イメージ、図形等の非
構造の記号列の1中から任意の記号列を短時間にして、
柔軟な抽出が可能な記号列照合装置とその照合方式を提
供することにある。
捷た、一部の記号の欠けや誤り、あるいは余分な記号が
付加された記号列についても照合可能な低価格な記号列
照合装置を提供することにある、(発明の構成) したがって、本発明によれば以下の記号列照合装置4と
その開側j方式が得られる。すなわち、記号コードをア
ドレス入力とし、照合記号列を記憶する記号列記憶手段
と、この各出力線につながる第1の演算手段と、複数の
演算手段間を相互に結合する第1の一時記憶手段と、特
定の第1の一時記憶手段の出力につながる第2の一時記
憶手段・と、第2の一時記憶手段につながる第2の演算
手段とを含む記号列照合装置。
付加された記号列についても照合可能な低価格な記号列
照合装置を提供することにある、(発明の構成) したがって、本発明によれば以下の記号列照合装置4と
その開側j方式が得られる。すなわち、記号コードをア
ドレス入力とし、照合記号列を記憶する記号列記憶手段
と、この各出力線につながる第1の演算手段と、複数の
演算手段間を相互に結合する第1の一時記憶手段と、特
定の第1の一時記憶手段の出力につながる第2の一時記
憶手段・と、第2の一時記憶手段につながる第2の演算
手段とを含む記号列照合装置。
1把号コートをアドレス入力とし、照合記号列を記憶す
る記号列記憶手段と、この間出力線につながるEf41
の演算手段と、ネジ数の演算手段間を相互に結合するε
様lの一時記憶手段と、特定の第1の一時〒:+21’
、は手段の出力につながる第2の一時記憶手段と、第2
の一時記憶手段Vこつながる第2の演算手段と、外部か
ら与えられる許容類似度全記憶するレジスタと、このレ
ジスタの内容と第2の演算手段の出力とを比較し、照合
結果を出力するコンパレータどを含む記号列照合装置。
る記号列記憶手段と、この間出力線につながるEf41
の演算手段と、ネジ数の演算手段間を相互に結合するε
様lの一時記憶手段と、特定の第1の一時〒:+21’
、は手段の出力につながる第2の一時記憶手段と、第2
の一時記憶手段Vこつながる第2の演算手段と、外部か
ら与えられる許容類似度全記憶するレジスタと、このレ
ジスタの内容と第2の演算手段の出力とを比較し、照合
結果を出力するコンパレータどを含む記号列照合装置。
とさらに該コンパレータに接続するエン:1〜ダとト亥
レジスタに接続するデコータとを4#+iえた記号列照
合装置4と記号に関連づけたビットパタンで照合記号列
を記憶する記号列記憶手段のへ(正精叔)節目と(へ+
1)番目の出力線に各々つながるN番目第1;猜理演算
手段と(N+11街目第1演算手段との間のN番目第1
一時記憶手段の内容’(C(N−1)番目第1一時記憶
手段の内容V?CN番目1己号列記憶手段の出方線によ
り制御されたN番目第1演算手段の演算処理をjIfQ
こいtものとし且つ、特定の第1一時記憶手段の互いに
異なる時刻の内容に第2の演:!:’?]手段による演
算処理を測ずことで前記記号り1托1シ憶手段の内容と
鏝次入力された記号列の類似1ノ1を求める記号列照合
装(I¥、OIIi:I &II方式ティ〉ル、(実施
例) 以]・図面を用いて本・h゛、明の史に11組(な説明
を行なう。
レジスタに接続するデコータとを4#+iえた記号列照
合装置4と記号に関連づけたビットパタンで照合記号列
を記憶する記号列記憶手段のへ(正精叔)節目と(へ+
1)番目の出力線に各々つながるN番目第1;猜理演算
手段と(N+11街目第1演算手段との間のN番目第1
一時記憶手段の内容’(C(N−1)番目第1一時記憶
手段の内容V?CN番目1己号列記憶手段の出方線によ
り制御されたN番目第1演算手段の演算処理をjIfQ
こいtものとし且つ、特定の第1一時記憶手段の互いに
異なる時刻の内容に第2の演:!:’?]手段による演
算処理を測ずことで前記記号り1托1シ憶手段の内容と
鏝次入力された記号列の類似1ノ1を求める記号列照合
装(I¥、OIIi:I &II方式ティ〉ル、(実施
例) 以]・図面を用いて本・h゛、明の史に11組(な説明
を行なう。
第1図は本発明の一実施例の説明図である。この記号列
照合装置I′7は第6図に示したような長大な記号列と
なるチキン、1・あるいはイメージ、画像、音声等をコ
ード化し、i己号列人カ端子111 がら逐次入力(7
、その中に登録済みの照合記号列と類似する記号列がど
こに含まれるがを外部に伝達するものであり、記号に関
連づけたビットパタンで記号列を記憶する記号列記憶手
段110、とその読み取り信号112 により内容の変
化がfHIJ (+ilIあれる複数段の複数ビットの
カウンタ120 と、最下段のカウンタ120 の
出力につながる第2の一時記憶手段としてのレジスタ1
30 最下段のカウンタ120 の内容N6とレジス
タ130 の内容とを加算する第2の演算手段である加
算器140 とから構成される。カウンタ120 Fi
論理演算手段123とそれからの演算結果を記憶する一
時記憶手段124 とを含んでいる。ここでは論理演算
手段123と一時記憶手段124 とをカウンタ120
で代表させて説明を行なう、 照合記号列の各記号は記号列記憶手段110 の各ビッ
トに記号に関連づけたビットパタンで格納される。図の
例でFi6ビノトの記号列記憶手段110に’MEMO
RY“06個の記号からなる照合記号列を格納している
。すなわち、記号列記憶手段110 の第1から第6ビ
ツト目の各々記号1M“気へ〃、・・E〃、RM II
、鳩0〃、′″R〃、’Y“で指定されるアドレスにの
み“■〃が格納され、他は′0″が格納される。記号列
記憶手段110 のアドレスは記号の種類に対応し、そ
の第1から第6ビツト目の読取り信号112 は、各々
記号1−M〃、It I、; /7. IXM /l気
O〃、気R〃、パY〃 が入力されたときのみ■″とな
る。
照合装置I′7は第6図に示したような長大な記号列と
なるチキン、1・あるいはイメージ、画像、音声等をコ
ード化し、i己号列人カ端子111 がら逐次入力(7
、その中に登録済みの照合記号列と類似する記号列がど
こに含まれるがを外部に伝達するものであり、記号に関
連づけたビットパタンで記号列を記憶する記号列記憶手
段110、とその読み取り信号112 により内容の変
化がfHIJ (+ilIあれる複数段の複数ビットの
カウンタ120 と、最下段のカウンタ120 の
出力につながる第2の一時記憶手段としてのレジスタ1
30 最下段のカウンタ120 の内容N6とレジス
タ130 の内容とを加算する第2の演算手段である加
算器140 とから構成される。カウンタ120 Fi
論理演算手段123とそれからの演算結果を記憶する一
時記憶手段124 とを含んでいる。ここでは論理演算
手段123と一時記憶手段124 とをカウンタ120
で代表させて説明を行なう、 照合記号列の各記号は記号列記憶手段110 の各ビッ
トに記号に関連づけたビットパタンで格納される。図の
例でFi6ビノトの記号列記憶手段110に’MEMO
RY“06個の記号からなる照合記号列を格納している
。すなわち、記号列記憶手段110 の第1から第6ビ
ツト目の各々記号1M“気へ〃、・・E〃、RM II
、鳩0〃、′″R〃、’Y“で指定されるアドレスにの
み“■〃が格納され、他は′0″が格納される。記号列
記憶手段110 のアドレスは記号の種類に対応し、そ
の第1から第6ビツト目の読取り信号112 は、各々
記号1−M〃、It I、; /7. IXM /l気
O〃、気R〃、パY〃 が入力されたときのみ■″とな
る。
各段のカウンタ120 はクロック信号121 に同期
して動作し、その各段の出力は次段のデータ入力に接続
されている。初段のカウンタ120 のデータ入力には
零が供給され、最終段のカウンタ120 の出力N6は
レジスタ130 に印加される。
して動作し、その各段の出力は次段のデータ入力に接続
されている。初段のカウンタ120 のデータ入力には
零が供給され、最終段のカウンタ120 の出力N6は
レジスタ130 に印加される。
クロック信号12】 の立上り時に転送信号122が
印加されていると、各段のカウンタ120 の内容は図
において上段から下段方向に一段づつ転送される。また
、転送信号122 が印加されておらず、記号列記憶手
段110 から1″の読取り信号】12 が供給される
と、カウンタ120 の内容は1だけ増加(以後、イン
クリメントと称す)し、0“の読取り信号の場合には内
容が保たれる、このように動作させるカウンタ120
として、市販されている集積回路、例えばテキサス・イ
ンストルメント社製の5N74L8161N ’に利用
できる。
印加されていると、各段のカウンタ120 の内容は図
において上段から下段方向に一段づつ転送される。また
、転送信号122 が印加されておらず、記号列記憶手
段110 から1″の読取り信号】12 が供給される
と、カウンタ120 の内容は1だけ増加(以後、イン
クリメントと称す)し、0“の読取り信号の場合には内
容が保たれる、このように動作させるカウンタ120
として、市販されている集積回路、例えばテキサス・イ
ンストルメント社製の5N74L8161N ’に利用
できる。
第2図はクロック信号121 と転送信号122のタイ
ミング図ケ示す。照合対象となる記号列は周期T@に1
個の記号が記号列入力端子111 から入力され、そ
の間に前後2発のパルス信号がクロック信号121 と
して印加される。転送信号122 はクロック信号12
1 の創見のパルス信号の立上り時を含むパルス信号と
して印加される。
ミング図ケ示す。照合対象となる記号列は周期T@に1
個の記号が記号列入力端子111 から入力され、そ
の間に前後2発のパルス信号がクロック信号121 と
して印加される。転送信号122 はクロック信号12
1 の創見のパルス信号の立上り時を含むパルス信号と
して印加される。
従って、1個の記号が入力されるごとに各段のカウンタ
120 の転送動作とインクリメント(但し、読取り信
号112が1“の場合)が交互に行なわれる。レジスタ
130は転送信号122により最終段のカウンタ120
の内容を取込む。
120 の転送動作とインクリメント(但し、読取り信
号112が1“の場合)が交互に行なわれる。レジスタ
130は転送信号122により最終段のカウンタ120
の内容を取込む。
第3図は第1図の記号列照合装置の動作説明図である。
第1図に示したように記号列記憶手段110に’ MF
iNOR,Y ″の照合記号列が格納されている状態で
、照合記号列と同じ記号列″MEMORY“ が記号列
入力端子111から入力された場合の動作を同図(al
で説明する。また照合記号列内の一部の記号″0“が誤
った場合、欠けた場合及び余分な記号II X rrが
付加された場合について、それぞれ同図(bl、(cl
、(d)を用いて説明する。
iNOR,Y ″の照合記号列が格納されている状態で
、照合記号列と同じ記号列″MEMORY“ が記号列
入力端子111から入力された場合の動作を同図(al
で説明する。また照合記号列内の一部の記号″0“が誤
った場合、欠けた場合及び余分な記号II X rrが
付加された場合について、それぞれ同図(bl、(cl
、(d)を用いて説明する。
図において、第1行は記号列入力端子111 から入力
された記号列、第2行は記号の入力毎に仮に定めた時刻
’]’o−’l’7を示し、第3行以下はクロック信号
121 の後発のパルス信号が印加された後のカウンタ
120の内容を上段よりNl、 N2. N3゜N4.
N5.N6で代表させ、そめ値を示す。最後の行は加算
器140の出力への値を示す。
された記号列、第2行は記号の入力毎に仮に定めた時刻
’]’o−’l’7を示し、第3行以下はクロック信号
121 の後発のパルス信号が印加された後のカウンタ
120の内容を上段よりNl、 N2. N3゜N4.
N5.N6で代表させ、そめ値を示す。最後の行は加算
器140の出力への値を示す。
まず、照合動作前に各段のカウンタ120の内容N1か
らN6を零に設定しておく。これは図示していないが、
カウンタ120のクリア端子にパルス信号を印加するこ
とで容易に行なえる。
らN6を零に設定しておく。これは図示していないが、
カウンタ120のクリア端子にパルス信号を印加するこ
とで容易に行なえる。
第3図(alを参照して、照合記号列と同じ記号列’M
EMORY“が記号列入力端子111から入力された場
合の動作について説明する。まず、先頭の記号″′M“
が入力されたときに、クロック信号121の創見のパル
ス信号の立上り時に転送信号122が印加されているの
で、各段のカウンタ120の内容は上段から下段方向に
一斉に次段に転送される。この時点での全段のカウンタ
120の内容N1から〜6は零になっている。また、記
号列記憶手段110の第1ビツト目と第3ビツト目の読
堆り信号1】2のみ1“となる、L7?:、かって、ク
ロック信号】21 の後発のノくルス信号が印加される
と、第1段目と第3段目のカウンタ120 の内容へ1
とN3のみインクリメントされ0から1となる、 これで照合対象となる記号列の先頭記号゛XM〃に対す
る照合処理がなされる。
EMORY“が記号列入力端子111から入力された場
合の動作について説明する。まず、先頭の記号″′M“
が入力されたときに、クロック信号121の創見のパル
ス信号の立上り時に転送信号122が印加されているの
で、各段のカウンタ120の内容は上段から下段方向に
一斉に次段に転送される。この時点での全段のカウンタ
120の内容N1から〜6は零になっている。また、記
号列記憶手段110の第1ビツト目と第3ビツト目の読
堆り信号1】2のみ1“となる、L7?:、かって、ク
ロック信号】21 の後発のノくルス信号が印加される
と、第1段目と第3段目のカウンタ120 の内容へ1
とN3のみインクリメントされ0から1となる、 これで照合対象となる記号列の先頭記号゛XM〃に対す
る照合処理がなされる。
同様にして次の記号″′E“が入力されると、第2段目
のカウンタの内容N2のみインクリメントされ、Jから
2となる。このようにして、全ての記号列に対する照合
処理に行なう。最終段のカウンタ120の各時刻におけ
る内容(この例ではNO)は、その時刻以前に入力’J
!’l−た記号列の各記号とが一致する記号のf固数
を示すことになる。第3図(a)では時111T6の〜
6の値の6は、その時刻以前すなわちTl〜T6に入力
をれた記号列に一致していることを示す。
のカウンタの内容N2のみインクリメントされ、Jから
2となる。このようにして、全ての記号列に対する照合
処理に行なう。最終段のカウンタ120の各時刻におけ
る内容(この例ではNO)は、その時刻以前に入力’J
!’l−た記号列の各記号とが一致する記号のf固数
を示すことになる。第3図(a)では時111T6の〜
6の値の6は、その時刻以前すなわちTl〜T6に入力
をれた記号列に一致していることを示す。
従って、照合記号列の記号数をMとすると(図の例では
M=6)、同一の記号列が入力された場合に〜6の値は
Mとなり、1個の記号のみが異なるな゛らばM−1とな
る。すなわち、最終的段のカウンタ120の内容は入力
された記号列と照合記号列との類似度を示す。加算器1
20は最終段のカウンタ120の内容と1時刻前のその
内容を記憶するレジスタ130の内容とを加算し、類似
度出力125 として外部に伝達する。
M=6)、同一の記号列が入力された場合に〜6の値は
Mとなり、1個の記号のみが異なるな゛らばM−1とな
る。すなわち、最終的段のカウンタ120の内容は入力
された記号列と照合記号列との類似度を示す。加算器1
20は最終段のカウンタ120の内容と1時刻前のその
内容を記憶するレジスタ130の内容とを加算し、類似
度出力125 として外部に伝達する。
第3図(b)は一部の記号′0″が他の記号″X″に誤
っている記号例が入力された場合の各段のカウンタ12
0の内容を示す。先頭から3個の記号゛M〃、′E“、
′M“の入力に対する各段のカウンタ120は、第3図
(a)と同様に動作する。しかし、次の4番目の記号″
′X“が入力されると、第4段目のカウンタ120の内
容N4は、記号列記憶手段110の第4ビツト目の読取
り信号112がO“であるためインクリメントされず、
同じ値3全保つ。従って、6個の記号からなる記号列″
IMEMXR,Y″が入力され′f?、、後の〜6の値
は、第3図(a)の場合より1だけ小さい5となる。す
なわち、照合記号列と1個の記号のみが異なる記号列が
入力されたと認識できる。
っている記号例が入力された場合の各段のカウンタ12
0の内容を示す。先頭から3個の記号゛M〃、′E“、
′M“の入力に対する各段のカウンタ120は、第3図
(a)と同様に動作する。しかし、次の4番目の記号″
′X“が入力されると、第4段目のカウンタ120の内
容N4は、記号列記憶手段110の第4ビツト目の読取
り信号112がO“であるためインクリメントされず、
同じ値3全保つ。従って、6個の記号からなる記号列″
IMEMXR,Y″が入力され′f?、、後の〜6の値
は、第3図(a)の場合より1だけ小さい5となる。す
なわち、照合記号列と1個の記号のみが異なる記号列が
入力されたと認識できる。
第3図(C1は照合記号列内の一部の配列゛0“が欠け
た記号列″” M E Mll、 Y X“が入力され
た場合の各段のカウンタの内界条′示す。先頭から3個
の記号の入力に対し2てi’Ti: 2B 3図(XI
lと同様な動作をする。
た記号列″” M E Mll、 Y X“が入力され
た場合の各段のカウンタの内界条′示す。先頭から3個
の記号の入力に対し2てi’Ti: 2B 3図(XI
lと同様な動作をする。
しかし、以後の記号列” R,γX″′は照合記号と1
記号つれでいろため、時刻’J’4. T5. T6に
おけるN4.〜5.〜6の11?iに変化せず、3を保
つ。〕Fだ、記号″R//が入力される時刻′■゛4に
〜5はインクリメントされ、0から1となる。次の記号
″Y“が入力されたときに〜6はインクリメント式れ、
1から2となる。この結果、最終段のカウンタ120
の内容N6の最大イ1げは3となり、N6乏・監視し
ているだけでは入力された記号列が照合記号列からT
1lIIIの記号を抜いた記号列であることを認識でき
ない。しかし、加算器】40の出力N &:1: 5と
なるので時刻T1から’I’6−+でに入力されグこ記
号列内に照合記号列と整合する記号が5個含まれている
ことを認識できろ。4ilっで、一部の記号が欠r7だ
記号列についても加算器140の出力へを監視すること
により、照合が可能となる。加シ、器J 40 の出力
〜は類似反出力125 として外部に伝達される。
記号つれでいろため、時刻’J’4. T5. T6に
おけるN4.〜5.〜6の11?iに変化せず、3を保
つ。〕Fだ、記号″R//が入力される時刻′■゛4に
〜5はインクリメントされ、0から1となる。次の記号
″Y“が入力されたときに〜6はインクリメント式れ、
1から2となる。この結果、最終段のカウンタ120
の内容N6の最大イ1げは3となり、N6乏・監視し
ているだけでは入力された記号列が照合記号列からT
1lIIIの記号を抜いた記号列であることを認識でき
ない。しかし、加算器】40の出力N &:1: 5と
なるので時刻T1から’I’6−+でに入力されグこ記
号列内に照合記号列と整合する記号が5個含まれている
ことを認識できろ。4ilっで、一部の記号が欠r7だ
記号列についても加算器140の出力へを監視すること
により、照合が可能となる。加シ、器J 40 の出力
〜は類似反出力125 として外部に伝達される。
第3図(d+は余分な記号″′X″ケ含む記七列’Mi
l射JXOR,Y’′ が入力され′fiC場合の各段
のカウンタ]20のl”J谷をボラ−0先 号の入力に対し′tは第31ン」(a)と同様な動作を
する。
l射JXOR,Y’′ が入力され′fiC場合の各段
のカウンタ]20のl”J谷をボラ−0先 号の入力に対し′tは第31ン」(a)と同様な動作を
する。
しかし、4 (161目以抜の記号列ir. I′i余
分な鮨シ号+S X #か含まれているのて、照合B1
シ合列と1記号つれている、このため、時刻′1゛4、
1゛5、′J.’ 6 の各々におけるN4、〜5、j
〜0 のイ1iにインクリメン1されず、3を保つ。し
かし、1叫刻ずラシ’fr時:21j ’i’ 5、1
゛6、9゛7の各々i/−二ふ・け4,〜4、〜5、〜
6の1直b、それそインクリメント式れ、0から3とな
る。し7たかつて、N6λ・’.fK Ill’. L
,ている/こけてぐま入力された記−号列が照合mlも
列に1つの余分な記号を付加した記号例であることを認
識できない。しかし、加算器140の出力への値は時刻
117で6となるので入力をれた記号列が畠い類似性を
持つことを認識できる。
分な鮨シ号+S X #か含まれているのて、照合B1
シ合列と1記号つれている、このため、時刻′1゛4、
1゛5、′J.’ 6 の各々におけるN4、〜5、j
〜0 のイ1iにインクリメン1されず、3を保つ。し
かし、1叫刻ずラシ’fr時:21j ’i’ 5、1
゛6、9゛7の各々i/−二ふ・け4,〜4、〜5、〜
6の1直b、それそインクリメント式れ、0から3とな
る。し7たかつて、N6λ・’.fK Ill’. L
,ている/こけてぐま入力された記−号列が照合mlも
列に1つの余分な記号を付加した記号例であることを認
識できない。しかし、加算器140の出力への値は時刻
117で6となるので入力をれた記号列が畠い類似性を
持つことを認識できる。
一般に照合記号列の記号列長fnとすると、時刻Tiに
おける最終段のカウンタ]20の内容N nは、時刻T
i −n+1 から時刻Ti捷でに入力きれた記号列が
照合記号列と整合する記号の個数を示す。Ti時刻にお
ける加算器140の出力へすなわち類似度出力125は
、最終段のカウンタ120の時刻Ti とその1時刻前
の内容の和を示す。すなわち、類似度出力】25は入力
した記号列及びそれを1記号分ずらした記号列が照合記
号列と整合する記号の個数の和を示す。従って、一部の
記号が欠けた記号列および余分な記号が付加された記号
列についても、類似度出力125を監視することで照合
できる。
おける最終段のカウンタ]20の内容N nは、時刻T
i −n+1 から時刻Ti捷でに入力きれた記号列が
照合記号列と整合する記号の個数を示す。Ti時刻にお
ける加算器140の出力へすなわち類似度出力125は
、最終段のカウンタ120の時刻Ti とその1時刻前
の内容の和を示す。すなわち、類似度出力】25は入力
した記号列及びそれを1記号分ずらした記号列が照合記
号列と整合する記号の個数の和を示す。従って、一部の
記号が欠けた記号列および余分な記号が付加された記号
列についても、類似度出力125を監視することで照合
できる。
以上述べ女ように第1図に示した記号列照合装置は照合
記号列と完全に一致する記号列だけでなく、その中の任
意の個数の記号が誤っている記号列も抽出でき、柔軟性
の茜い記号列照合装置といえる。
記号列と完全に一致する記号列だけでなく、その中の任
意の個数の記号が誤っている記号列も抽出でき、柔軟性
の茜い記号列照合装置といえる。
一般に記号列の照合に際しては、照合記号列と一致した
記号の個数よりも異なる記号の個数が出力される方が取
扱いやすい。第1図に示したように一致する記号の個数
全計数すると、カウンタ120は照合記号列の記号数を
へ4とすると0がらM4で計数できるlog2(M−f
−1)のビット数が必要となる。しかし、異なる記号の
個数を計数するならば、許容できる不一致の割合を5%
とすると、カウンタ120はMの5チ程度を計数できれ
ば良いため、そのビット数を削減できる。
記号の個数よりも異なる記号の個数が出力される方が取
扱いやすい。第1図に示したように一致する記号の個数
全計数すると、カウンタ120は照合記号列の記号数を
へ4とすると0がらM4で計数できるlog2(M−f
−1)のビット数が必要となる。しかし、異なる記号の
個数を計数するならば、許容できる不一致の割合を5%
とすると、カウンタ120はMの5チ程度を計数できれ
ば良いため、そのビット数を削減できる。
これを可能にする記号列照合装置は第1図に示した記号
列照合装置を少し変更することで実現できる。
列照合装置を少し変更することで実現できる。
例えば、記号列記憶手段110の読取り信号112が”
0“であるときにカラ/り120 をインクリメントあ
るいはティクリメント(値を1だけ減少)させる。また
は、記号列記憶手段110の内容を反転させ、読取りイ
百号112が1“であるときに、カウンタ120の増減
を行なってもよい。この場合、カウンタ120の初期値
としてインクリメン、トを行なわせる場合Ku、零、テ
ィクリメントを行なわせる場合にはその計数可能な最大
値以上のインクリメン) ji13作あるいはディクリ
メント動作を禁止する必要がある。これは、カウンタ1
20の全てのビットを入力とするナントゲート回路で全
ビットが1、あるいはノアゲート回路で零を検出し、そ
の検出出力で記号列記憶手・段110の読取り信号21
2をマスクすることで容易に実現できる。但し、カウン
タ120 としてその最大値あるいは最小値を検出する
回路を内蔵しているカウンタ、金利用する場合には、ナ
ントゲート回路あるいはノアケート回路が不要となる。
0“であるときにカラ/り120 をインクリメントあ
るいはティクリメント(値を1だけ減少)させる。また
は、記号列記憶手段110の内容を反転させ、読取りイ
百号112が1“であるときに、カウンタ120の増減
を行なってもよい。この場合、カウンタ120の初期値
としてインクリメン、トを行なわせる場合Ku、零、テ
ィクリメントを行なわせる場合にはその計数可能な最大
値以上のインクリメン) ji13作あるいはディクリ
メント動作を禁止する必要がある。これは、カウンタ1
20の全てのビットを入力とするナントゲート回路で全
ビットが1、あるいはノアゲート回路で零を検出し、そ
の検出出力で記号列記憶手・段110の読取り信号21
2をマスクすることで容易に実現できる。但し、カウン
タ120 としてその最大値あるいは最小値を検出する
回路を内蔵しているカウンタ、金利用する場合には、ナ
ントゲート回路あるいはノアケート回路が不要となる。
ifr、カウンタ120を並列入力可能なシフトレジス
タに置換えることも可能である。この場合、転送イム号
122で次段のシフトレジスタへの並列転送が開側1さ
れ、読取り信号112により内容の左シフトあるいは右
シフトが制御される。初段のシフトレジスタのデータ入
力にニ最上位ピッ)6るいは最下位ビットのみ異なるデ
ータを供給する。
タに置換えることも可能である。この場合、転送イム号
122で次段のシフトレジスタへの並列転送が開側1さ
れ、読取り信号112により内容の左シフトあるいは右
シフトが制御される。初段のシフトレジスタのデータ入
力にニ最上位ピッ)6るいは最下位ビットのみ異なるデ
ータを供給する。
このようなシフトレジスタにはテキサス・インストルメ
ント社から敗売されている7 4.LS 299の集積
回路を利用できる。カウンタ120の代りにシフトレジ
スタを用いると、照合記号列と異なる記号数を計数した
場合、シフトレジスタのビット数以上の異なる記号数が
入力されると、シフトレジスタの内容は自動的に零に設
定はれるので、制御が容易になる。
ント社から敗売されている7 4.LS 299の集積
回路を利用できる。カウンタ120の代りにシフトレジ
スタを用いると、照合記号列と異なる記号数を計数した
場合、シフトレジスタのビット数以上の異なる記号数が
入力されると、シフトレジスタの内容は自動的に零に設
定はれるので、制御が容易になる。
さらに、カウンタ】20けシフトレジスタたけでなく他
の論理演算手段に置換えることも容易に可能である。
の論理演算手段に置換えることも容易に可能である。
また、以上の説明では1個の記号の欠けや付加を許容で
きる記号列照合装置について説明したが、複数個の記号
の欠けや伺加を許容できるように拡張できる。これは、
レジスタ130として直列に接続した複数段のレジスタ
を使用し、加算器140が各レジスタの内容を加算する
ことで可能となる。
きる記号列照合装置について説明したが、複数個の記号
の欠けや伺加を許容できるように拡張できる。これは、
レジスタ130として直列に接続した複数段のレジスタ
を使用し、加算器140が各レジスタの内容を加算する
ことで可能となる。
第4図も本発明による実施例の説明図である。
この記号列照合装置は照合対象となる記号列の中から照
合記号列と高り類似#を示す記号列のみ抽出するもので
あり、第1図の記号列照合装置400にコンパレータ4
10 とレベル設定レジスタ420を追加している。
合記号列と高り類似#を示す記号列のみ抽出するもので
あり、第1図の記号列照合装置400にコンパレータ4
10 とレベル設定レジスタ420を追加している。
照合動作開始前にレベル設定レジスタ420には抽出し
ようとする記号列の許容類似度が設定される。これは、
許容類似度を示すレベル信号421とレジスタセノ)信
号422をレベル設定レジスタ420に供給することに
よ−り行なわれる。
ようとする記号列の許容類似度が設定される。これは、
許容類似度を示すレベル信号421とレジスタセノ)信
号422をレベル設定レジスタ420に供給することに
よ−り行なわれる。
コンパレータ410 it類(U度出力125 とレベ
ル設定レジスタ420の内容とを各々入力A、Bに入力
し、両者を比較する。そして前者が太きいか等しいかを
示すAZB出力を照合出力信号41]として外部に伝達
する。記号列記号記憶手段110に格納づれている照合
記号列の記号数Mに対し、レベル設定レジスタ420
に1l−1)を設定すると、記号列入力端子111 力
・ら入力された記号列と照合記号列とが(M−1)個以
上の記号が整合しているνΔ合に、コンパレータ4】0
は照合出力411 を発生ずる。従って、IAφ合出力
出力411監視することで照合記号列と1hり類イυ度
を示す記号列のみ抽出できる。
ル設定レジスタ420の内容とを各々入力A、Bに入力
し、両者を比較する。そして前者が太きいか等しいかを
示すAZB出力を照合出力信号41]として外部に伝達
する。記号列記号記憶手段110に格納づれている照合
記号列の記号数Mに対し、レベル設定レジスタ420
に1l−1)を設定すると、記号列入力端子111 力
・ら入力された記号列と照合記号列とが(M−1)個以
上の記号が整合しているνΔ合に、コンパレータ4】0
は照合出力411 を発生ずる。従って、IAφ合出力
出力411監視することで照合記号列と1hり類イυ度
を示す記号列のみ抽出できる。
第5図も本発明による実施例の説明図である。
この記号列照合装置は複数の照合記号列を並列に照合し
、整合17れ照合記号列を示す整合コードを出力するも
のであり、第4図に示した記号列照合装置に対応する記
号列照合ユニット500を複数個含む記号列照合部51
0 と、各記号列照合ユニット500から出力される各
照合出力411 f入力するエンコーダ520 と、
各記号列照合ユニット500にレジスタセット信号42
2を供給するデコーダ530 とから構成される。
、整合17れ照合記号列を示す整合コードを出力するも
のであり、第4図に示した記号列照合装置に対応する記
号列照合ユニット500を複数個含む記号列照合部51
0 と、各記号列照合ユニット500から出力される各
照合出力411 f入力するエンコーダ520 と、
各記号列照合ユニット500にレジスタセット信号42
2を供給するデコーダ530 とから構成される。
記号列入力端子111から入力される記号コード、りO
,り信号121、転送イh号122、許容類似度を示す
レベル信号421は各記号列照合ユニッ) 500に共
通に供給される。
,り信号121、転送イh号122、許容類似度を示す
レベル信号421は各記号列照合ユニッ) 500に共
通に供給される。
記号列照合ユニット500への許容類似度の設定は、ユ
ニット選択値+j53x と共に基本レジスタセット
信号532をデコーダ530 に供給し、レベル信号4
21 全記号列照合部510に供給することに、!:り
行なわれる。このとき、デコーダ530は許容類似度を
設定しようとする記号列照合ユニット500にのみレジ
スタセット信号422を印加する。
ニット選択値+j53x と共に基本レジスタセット
信号532をデコーダ530 に供給し、レベル信号4
21 全記号列照合部510に供給することに、!:り
行なわれる。このとき、デコーダ530は許容類似度を
設定しようとする記号列照合ユニット500にのみレジ
スタセット信号422を印加する。
記号列入力Aj5子111 から照合ヌゴ称となる記号
列を71′八成する記号コードを逐次入力すると、各記
号列照合ユニット50(l 内に登録されている各照合
記号列と並列に1j4j合17、許容類似度以上の高い
’Jul イjヅ塵を小す11f(合Be号夕1島記憶
し、ている;)1シ号列照合ユニノ)5(1(+からI
Iべ合出力411か発生する。
列を71′八成する記号コードを逐次入力すると、各記
号列照合ユニット50(l 内に登録されている各照合
記号列と並列に1j4j合17、許容類似度以上の高い
’Jul イjヅ塵を小す11f(合Be号夕1島記憶
し、ている;)1シ号列照合ユニノ)5(1(+からI
Iべ合出力411か発生する。
エン−1−夕52(1に−この照合出力411を蛍けで
それをニー7〜l−イl< L、入力さ力/6二記号列
の分類コード5;21と七・合したこと4−示す0〃の
イ1幼イば号522不二発生する。いずれの!](1合
出力411も不整合を示L77いる土・・シ合VこkJ
l、エンコーダは不整合を示す1″のイ」効(+’j号
522攻゛発生1″る。
それをニー7〜l−イl< L、入力さ力/6二記号列
の分類コード5;21と七・合したこと4−示す0〃の
イ1幼イば号522不二発生する。いずれの!](1合
出力411も不整合を示L77いる土・・シ合VこkJ
l、エンコーダは不整合を示す1″のイ」効(+’j号
522攻゛発生1″る。
従って、イ]幻化号522と分類コード521を監視す
イ、ことにより、入力さオ]た記+じ一列の分類か可能
とな4、。また、エンコーダ520とテコータ′530
とにより、入出力端子数を削減し、木りに一吋列照合
装置道のLSI化を容易にする。
イ、ことにより、入力さオ]た記+じ一列の分類か可能
とな4、。また、エンコーダ520とテコータ′530
とにより、入出力端子数を削減し、木りに一吋列照合
装置道のLSI化を容易にする。
(発明の効果)
以上述べたように、本発明の記号列照合部■?は類似度
による照合を可能とするので、一部の記号が誤った記号
列の照合も可能にする。英単語、特に名詞は単数形、複
数形に」こり最終文学が異なる場合が多い。例えは、’
rnemory”は複数形になるとVmemories
“になる。この場合、基本の” nIemo r 3’
”を照合記号列とし、−文学の誤りをボ「すように許
容類似度を設定すれは、memo r i e s ”
も抽出できる。捷だ、一部の記号が欠けた記号列あるい
は余分な記号が付加された記号列の照合も〒1」能にす
る。このような一部の記号の欠けや余分な記号の付加は
一般に記号列内のどこに生ずるかまたどのように記号が
欠けるか、付加されるか予め判断できない。したがって
、起りうるすべでの記号列の変化に刈し、従来の記号列
照合ではそれらの許容するようにプログラミングしてお
かなければならない。しかし、本発明の記号列照合方式
及び記号列照合装置では許容類似度を設定しておくこと
で容易に対処できる。すなわち、本発明の記号列照合装
置ζCとその方式し1柔軟な記号列照合全可能にする !!た、人υ3力Qif1:子数を削減し、J、SI化
を容易に可能にし、価格低下をもたらす。
による照合を可能とするので、一部の記号が誤った記号
列の照合も可能にする。英単語、特に名詞は単数形、複
数形に」こり最終文学が異なる場合が多い。例えは、’
rnemory”は複数形になるとVmemories
“になる。この場合、基本の” nIemo r 3’
”を照合記号列とし、−文学の誤りをボ「すように許
容類似度を設定すれは、memo r i e s ”
も抽出できる。捷だ、一部の記号が欠けた記号列あるい
は余分な記号が付加された記号列の照合も〒1」能にす
る。このような一部の記号の欠けや余分な記号の付加は
一般に記号列内のどこに生ずるかまたどのように記号が
欠けるか、付加されるか予め判断できない。したがって
、起りうるすべでの記号列の変化に刈し、従来の記号列
照合ではそれらの許容するようにプログラミングしてお
かなければならない。しかし、本発明の記号列照合方式
及び記号列照合装置では許容類似度を設定しておくこと
で容易に対処できる。すなわち、本発明の記号列照合装
置ζCとその方式し1柔軟な記号列照合全可能にする !!た、人υ3力Qif1:子数を削減し、J、SI化
を容易に可能にし、価格低下をもたらす。
なお、現状の256キロビツトH,AMの半251体技
術を用いれば、8ビツトコードの記号8個からなる照合
記号列全128個を1チツプに格納でき、それらを並列
に照合できる。
術を用いれば、8ビツトコードの記号8個からなる照合
記号列全128個を1チツプに格納でき、それらを並列
に照合できる。
】テップで256禅の記号から成る記号列を128クラ
スに分類することができる事はワープロで作成しfc文
章の原文ファイルからシーケンシアルに読出される記号
列文章の中から128個までのキーワード(記号列)の
抽出を一挙にやりとけれる事を、色味する。従来は多数
のキーワードの同時検束が困難であったから、上記チッ
プのインパクトは太きい。
スに分類することができる事はワープロで作成しfc文
章の原文ファイルからシーケンシアルに読出される記号
列文章の中から128個までのキーワード(記号列)の
抽出を一挙にやりとけれる事を、色味する。従来は多数
のキーワードの同時検束が困難であったから、上記チッ
プのインパクトは太きい。
この記号列識別装置はOCR,装置や音声認識装置など
バタン認ii!g!を行なうシステムにおける特徴系列
の分類においても役立つ。この記号列識別装置なの1チ
ツプLSI化は言語翻訳に必要な辞言としでも役立つ。
バタン認ii!g!を行なうシステムにおける特徴系列
の分類においても役立つ。この記号列識別装置なの1チ
ツプLSI化は言語翻訳に必要な辞言としでも役立つ。
このチップに通常I(、A Mを接続し、各記号列の分
類コードに対応すけて、単語の訳語を格納すると、1チ
ノフにつき128単語丑での翻訳が記号列の入力の完了
時に直ちに求する。記号列識別チップに接続される通常
R,AMには記号別の分類コードに対応ずけて、各種の
情報を格納することが可能であって、そF′Lによっで
、種々の記号列情報処理構能が達成される。、たとえは
、記号列の分類コードに対応すけ、単語の品詞コードや
記号列の出現回数や記号列文章に対する処理命令を格納
すると、知識情報の収集や整理が行ないやすくなる。
類コードに対応すけて、単語の訳語を格納すると、1チ
ノフにつき128単語丑での翻訳が記号列の入力の完了
時に直ちに求する。記号列識別チップに接続される通常
R,AMには記号別の分類コードに対応ずけて、各種の
情報を格納することが可能であって、そF′Lによっで
、種々の記号列情報処理構能が達成される。、たとえは
、記号列の分類コードに対応すけ、単語の品詞コードや
記号列の出現回数や記号列文章に対する処理命令を格納
すると、知識情報の収集や整理が行ないやすくなる。
この記号列抽出装置の処理速度は、記号記憶手段2]0
.4]0に使われる半導体RAMのサイクルタイムTc
が1つの記号の処理時間にほぼヌ゛1応する。1゛Cを
100m5とすると、10 個の記号列のテキストに対
する10 個の記号列による照合を10秒で行なえる。
.4]0に使われる半導体RAMのサイクルタイムTc
が1つの記号の処理時間にほぼヌ゛1応する。1゛Cを
100m5とすると、10 個の記号列のテキストに対
する10 個の記号列による照合を10秒で行なえる。
現状のソフトウェアによる照合では10時間程度を心太
とするので、本発明の記号列照合装置は著しく照合時間
を短酩する。
とするので、本発明の記号列照合装置は著しく照合時間
を短酩する。
以上せとめると、本発明によれば、従来のマイコンとソ
フトウェアの組合わせによる記号列の分・グ11による
処理時間の大きい事と柔軟性に欠ける事の欠陥が容易に
解決する。メだ、本発明の記号列識別装置が1チツプの
L s I Kまとまり易い事を考えると、このような
LSIは文章の原文ファイルからのキーワードの抽出や
言語翻訳用の電子辞言やバタン認識システムの特徴系列
の分類において欠かすことのできない機能素子になる。
フトウェアの組合わせによる記号列の分・グ11による
処理時間の大きい事と柔軟性に欠ける事の欠陥が容易に
解決する。メだ、本発明の記号列識別装置が1チツプの
L s I Kまとまり易い事を考えると、このような
LSIは文章の原文ファイルからのキーワードの抽出や
言語翻訳用の電子辞言やバタン認識システムの特徴系列
の分類において欠かすことのできない機能素子になる。
第1図は本発明による記号列照合装置の一実施例の説明
図、第2図はクロ2248号と転送信号のタイミング図
、第3図は記号列照合装置の動作説明図、第4図、45
図は本発明の他の実施例の説明図、第6図は記号夕1」
照合の説明図である。 1】()・・・・・・記号列記憶手段、120・・・・
・カウンタ、123・・・・・・第1の演算手段、】2
4・−一時記憶手段、130・・・・・レジスタ、14
0・・・・・加算器、41o・・曲コンパレータ、’4
20・・・・・・レベル設定レジスタ、500・・・・
・・記号列照合ユニット、5]0・・・・・・記号列照
合部、520・・・・・ エンコーダ、530・・・・
・・テコータ。 第2図 MEMRYX ME7.lX0RYTo
T′ThT3T4T51下2
丁OT+ 丁2丁3丁4丁5丁6−「i第4図 第5図 第6図
図、第2図はクロ2248号と転送信号のタイミング図
、第3図は記号列照合装置の動作説明図、第4図、45
図は本発明の他の実施例の説明図、第6図は記号夕1」
照合の説明図である。 1】()・・・・・・記号列記憶手段、120・・・・
・カウンタ、123・・・・・・第1の演算手段、】2
4・−一時記憶手段、130・・・・・レジスタ、14
0・・・・・加算器、41o・・曲コンパレータ、’4
20・・・・・・レベル設定レジスタ、500・・・・
・・記号列照合ユニット、5]0・・・・・・記号列照
合部、520・・・・・ エンコーダ、530・・・・
・・テコータ。 第2図 MEMRYX ME7.lX0RYTo
T′ThT3T4T51下2
丁OT+ 丁2丁3丁4丁5丁6−「i第4図 第5図 第6図
Claims (7)
- (1)記号コードをアドレス入力とし、照合記号列を記
憶する記号列記憶手段と、この各出力線につながる第1
の演算手段と、複数の演算手段間を相互に結合する第1
の一時記憶手段と、特定の第1の一時記憶手段の出力に
つながる第2の一時記憶手段と、第2の一時記憶手段に
つながる第2の演算手段とを備えたことを特徴とする記
号列照合装置。 - (2)第1の演算手段と第1一時記憶手段とがそれぞれ
カウンタあるいはシフトレジスタであることを特徴とす
る特許請求の範囲第1項、記載の記号列照合装置。 - (3)記号コードをアドレス入力とし、照合記号列を記
憶する記号列記憶手段と、この各出力線につながる第1
の演算手段と、複数の演算手段間を相互に結合する第1
の一時記憶手段と、特定の第1の一時記憶手段の出力に
つながる第2の一時記憶手段と、第2の一時記憶手段に
つながる第2の演算手段と、外部から与えられる許容類
似度を記憶するレジスタと、このレジスタの内容と第2
の演算手段の出力とを比較し、照合結果を出力するコン
パレータとを含むことを特徴とする記号列照合装置。 - (4)第1の演算手段と第1一時記憶手段とがそれぞれ
カウンタあるいはシフトレジスタであることを特徴とす
る特許請求の範囲第3項記載の記号列照合装置。 - (5)記号コードをアドレス入力とし、照合記号列を記
憶する記号列記憶手段と、この各出力線につながる第1
の演算手段と、複数の演算手段間を相互に結合する第1
の一時記憶手段と、特定の第1の一時記憶手段の出力に
つながる第2の一時記憶手段と、第2の一時記憶手段に
つながる第2の演算手段と、外部から与えられる許容類
似度を記憶するレジスタと、このレジスタの内容と第2
の演算手段の出力とを比較し、照合結果を出力するコン
パレータと該コンパレータに接続するエンコーダと、該
レジスタに接続するデコーダとを備えたことを特徴とす
る記号列照合装置。 - (6)第1の演算手段と第1一時記憶手段とがそれぞれ
カウンタあるいはシフトレジスタであることを特徴とす
る特請許求の範囲第5項記載の記号列照合装置。 - (7)記号に関連づけたビットパタンで照合記合列を記
憶する記号列記憶手段のN(正整数)番目と(N+1)
番目の出力線に各々つながるN番目第1論理演算手段と
(N+1)番目第1演算手段との間のN番目第1一時記
憶手段の内容を(N−1)番目第1一時記憶手段の内容
にN番目記号列記憶手段の出力線により制御されたN番
目第1演算出段の演算処理を施こしたものとし且つ、特
定の第1一時記憶手段の互いに異なる時刻の内容に第2
の演算手段による演算処理を施すことで前記記号列記憶
手段の内容と逐次入力された記号列の類似度を求めるこ
とを特徴とする記号列照合装置の制御方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP14892684A JPS6128134A (ja) | 1984-07-18 | 1984-07-18 | 記号列照合装置とその制御方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP14892684A JPS6128134A (ja) | 1984-07-18 | 1984-07-18 | 記号列照合装置とその制御方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6128134A true JPS6128134A (ja) | 1986-02-07 |
| JPH0554148B2 JPH0554148B2 (ja) | 1993-08-11 |
Family
ID=15463749
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP14892684A Granted JPS6128134A (ja) | 1984-07-18 | 1984-07-18 | 記号列照合装置とその制御方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6128134A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS62217321A (ja) * | 1985-12-10 | 1987-09-24 | テイア−ルダブリユ− インコ−ポレ−テツド | 高速サ−チプロセツサ |
| JPS63225857A (ja) * | 1987-03-14 | 1988-09-20 | Fujitsu Ltd | 類似文字列検索装置 |
-
1984
- 1984-07-18 JP JP14892684A patent/JPS6128134A/ja active Granted
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS62217321A (ja) * | 1985-12-10 | 1987-09-24 | テイア−ルダブリユ− インコ−ポレ−テツド | 高速サ−チプロセツサ |
| JPS63225857A (ja) * | 1987-03-14 | 1988-09-20 | Fujitsu Ltd | 類似文字列検索装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0554148B2 (ja) | 1993-08-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS60501921A (ja) | 並列テキスト照合の方法および装置 | |
| JPH0533422B2 (ja) | ||
| JPH02115973A (ja) | 記号列照合装置とその制御方法 | |
| JPS6128134A (ja) | 記号列照合装置とその制御方式 | |
| RU2004115749A (ru) | Неограниченная языком компьютеризованная кодирующая-декодирующая система и способ | |
| JPH0529950B2 (ja) | ||
| JPS63103393A (ja) | 単語認識装置 | |
| JPS6128131A (ja) | 記号列照合装置とその照合方式 | |
| JPS60225273A (ja) | 単語検索方式 | |
| JPS62285189A (ja) | 文字認識後処理方式 | |
| JP3045886B2 (ja) | 手書き入力機能付き文字処理装置 | |
| JP2874199B2 (ja) | 単語辞書照合装置 | |
| JPS6029823A (ja) | 適応型記号列変換方式 | |
| JP2773657B2 (ja) | 文字列検索装置 | |
| JPS63268082A (ja) | パタ−ン認識装置 | |
| JPH0527150B2 (ja) | ||
| JPH0554147B2 (ja) | ||
| JP3725206B2 (ja) | 文字認識装置 | |
| JPS58146927A (ja) | 関連語情報を有する単語辞書作成方式 | |
| JPS6195443A (ja) | 記号列照合装置 | |
| JPS60211539A (ja) | 記号列識別装置及びその制御方式 | |
| JPH0290364A (ja) | 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法 | |
| JPH0576675B2 (ja) | ||
| JPS5930176A (ja) | 文字判定処理方式 | |
| JPH01217584A (ja) | 文字認識後処理方式 |