JPH0554148B2 - - Google Patents

Info

Publication number
JPH0554148B2
JPH0554148B2 JP59148926A JP14892684A JPH0554148B2 JP H0554148 B2 JPH0554148 B2 JP H0554148B2 JP 59148926 A JP59148926 A JP 59148926A JP 14892684 A JP14892684 A JP 14892684A JP H0554148 B2 JPH0554148 B2 JP H0554148B2
Authority
JP
Japan
Prior art keywords
symbol string
symbol
storage means
temporary storage
counter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59148926A
Other languages
English (en)
Other versions
JPS6128134A (ja
Inventor
Hachiro Yamada
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP14892684A priority Critical patent/JPS6128134A/ja
Publication of JPS6128134A publication Critical patent/JPS6128134A/ja
Publication of JPH0554148B2 publication Critical patent/JPH0554148B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は情報処理システムの構成要素に係り、
より具体的には長大な記号列の中から特定の記号
列を抽出する記号列照合装置とその制御方式に関
するものである。
(従来技術とその問題点) 上記記号照合装置はパタン認識システムでの特
徴系列の抽出、ワープロで作成された文章の原文
フアイルからのキーワードの抽出、言語翻訳の支
援や通信文章の略文の解説、図形、イメージ、テ
キスト等による非構造データベースの構築に利用
され、知能化されるこれらの情報処理システムの
形に欠くことができないものである。
従来の記号列照合は汎用コンピユータのソフト
ウエアにたよつた逐次処理によるため、膨大な処
理時間を必要とし、小規模なのに限定されてい
た。また、単語毎に区切られて構造化された信号
列に照合対象が制限されていた。一例として、n
子の記号列からなるテキスト中にn子の記号列か
らなるパタンがどこに有るかを調べる場合には、
m(n−m+1)回の照合処理を必要とする。磁
気デイスクや光デイスク等に格納されたm=109
個の文字列のテキストから、n=103個の文字列
の文章を捜すには1012回の照合処理を必要とす
る。従つて、テキスト、イメージ、図形、音声等
の大容量な原情報による検策は非現実的であるた
め、予め原情報にキーワードを付加しての検策や
表形式に構造化されたデータの検策に限定されて
いた。また、記号列の構成要素の変動を許容する
柔軟な記号列照合に対して処理時間の長くなりす
ぎる欠点があつた。
さらに具体的に従来の記号列照合装置とその制
御方式の問題点について説明する。
第6図は記号列照合の対象となるテキストを示
している。このテキストは報告書の始めの部分を
一例として示している。このようなテキストはワ
ープロのフアイルメモリに多数個格納される。そ
れ等のテキストの中から、必要なものをさがし出
す時に、要求内容を示す単語によつて直接に検索
できる事が求められる。
たとえば、第1図のテキストがmemory、
bubble等の記号列を含む論文であるかを知るた
めには、そのテキストの中でmemory、
memoriesやbubble等の記号列に整合する部分が
あるか否かを検索する必要がある。そのような記
号列のテキストとの比較照合は従来のコンピユー
タとソフトウエアで対応させると、非常に長い時
間を要する。
一般のA4サイズの英文はワード間のスペース
を含めると、約3000文字の長さになる。一方、比
較照合を行なう記号列の長さはmemoryの場合も
deviceの場合も6文字である。6文字と3000文字
の記号列間の照合は一般にその積に等しいオーダ
の回数に及ぶ文字の比較を必要とする。マイクロ
プロセツサでの文字比較時間が1μsecであつたと
しても、各記号列の検策に18msecの時間がかか
る。
現実に検索の対象となるテキストの文字数は
109個に及び、照合を行なう記号列の文字数も100
を越すこともありうる。照合される記号列の数も
1個だけでなく、数10個に及ぶ。その場合の照合
時間は数100時間に及ぶ。故に、このような照合
は現実的に不可能であり、実際は人手により予め
キーワードを抽出しておき、抽出されたキーワー
ドに対する照合に限定されていた。
また、一部の記号に欠けや誤りのある記号列や
余分な記号が付加された記号列の照合が困難であ
る。例えば、文字列“MEMORY”に関し、そ
の中の文字“O”が他の文字“X”に置換つた文
字列“MEMXRY”や、文字“O”が欠けた
“MEMRY”や余分な文字“X”が付加された
“MEMXORY”が入力された場合に、照合文字
列“MEMORY”と類似していることを出力で
きることが記号列照合に望まれる。しかし、従来
の記号列照合装置や制御方式では一部の記号に誤
りに関しては照合記号列と重ね合わせて比較する
ことにより類似性を調べることができるが、一部
の記号の欠けや余分な文字の付加に対しては対処
できなかつた。
(発明の目的) 本発明の目的は上記従来の記号列照合装置やそ
の方式の欠点を容易に解決し、テキスト、イメー
ジ、図形等の非構造の記号列の中から任意の記号
列を短時間にして、柔軟な抽出が可能な記号列照
合装置とその制御方式を提供することにある。
また、一部の記号の欠けや誤り、あるいは余分
な記号が付加された記号列についても照合可能な
低価格な記号列照合装置を提供することにある。
(発明の構成) したがつて、本発明によれば以下の記号列照合
装置とその制御方式が得られる。すなわち、記号
コードをアドレス入力とし、照合記号列を記憶す
る記号列記憶手段と、この各出力線につながる第
1の演算手段と、複数の演算手段間を相互に結合
する第1の一時記憶手段と、特定の第1の一時記
憶手段の出力につながる第2の一時記憶手段と、
第2の一時記憶手段につながる第2の演算手段と
を含む記号列照合装置。
記号コードをアドレス入力とし、照合記号列を
記憶する記号列記憶手段と、この各出力線につな
がる第1の演算手段と、複数の演算手段間を相互
に結合する第1の一時記憶手段と、特定の第1の
一時記憶手段の出力につながる第2の一時記憶手
段と、第2の一時記憶手段につながる第2の演算
手段と、外部から与えられる許容類似度を記憶す
るレジスタと、このレジスタの内容と第2の演算
手段の出力とを比較し、照合結果を出力するコン
パレータとを含む記号列照合装置、とさらに記号
で指定された番地のみ値が異なるように記号列内
の各記号を記号列記憶手段の各列に記憶させ、記
号列の照合時に記号を前記記号列記憶手段のデコ
ーダに入力し、前記記号列記憶手段の入力された
記号で示される番地の複数列の内容を並列に読み
取り、前記号列記憶手段の各列に読み取り情報に
基づき連結された各段のカウンタの内容の増加及
び次段のカウンタへの転送を制御し、最終段のカ
ウンタの互いに1時刻異なる2つ内容とを加算す
ることで前記記号列記憶手段の内容と逐次入力さ
れた記号列の類似度を求めることを特徴とする記
号列照合装置の制御方式である。
(実施例) 以下図面を用いて本発明の更に詳細な説明を行
なう。
第1図は本発明の一実施例の説明図である。こ
の記号列照合装置は第6図に示したような長大な
記号列となるテキストあるいはイメージ、画像、
音声等をコード化し、記号列入力端子111から
逐次入力し、その中に登録済みの照合記号列と類
似する記号列がどこに含まれるかを外部に伝達す
るものであり、記号に関連づけたビツトパタンで
記号列を記憶する記号列記憶手段110、とその
読み取り記号112により内容の変化が制御され
る複数段の複数ビツトのカウンタ120と、最下
段のカウンタ120の出力につながる第2の一時
記憶手段としてのレジスタ130と、最下段のカ
ウンタ120の内容N6とレジスタ130の内容
とを加算する第2の演算手段である加算器140
とから構成される。カウンタ120は論理演算手
段123とそれからの演算結果を記憶する一時記
憶手段124とを含んでいる。ここでは論理演算
手段123と一時記憶手段124とをカウンタ1
20で代表させて説明を行なう。
照合記号列の各記号は記号列記憶手段110の
各ビツトに記号に関連づけたビツトパタンで格納
される。図の例では6ビツトの記号列記憶手段1
10に“MEMORY”の6個の記号からなる照
合記号列を格納している。すなわち、記号列記憶
手段110の第1から第6ビツト目の各々記号
“M”“N”、“E”、“M”、“O”、“R”、“Y
”で指
定されるアドレスにのみ“1”が格納され、他は
“0”が格納される。記号列記憶手段110のア
ドレスは記号の種類に対応し、その第1から第6
ビツト目の読取り信号112は、各々記号“M”、
“E”、“M”“O”、“R”、“Y”が入力されたと

のみ“1”となる。
各段のカウンタ120はクロツク信号121に
同期して動作し、その各段の出力は次段のデータ
入力に接続されている。初段のカウンタ120の
データ入力には零が供給され、最終段のカウンタ
120の出力N6はレジスタ130に印加され
る。クロツク信号121の立上り時に転送信号1
22が印加されていると、各段のカウンタ120
の内容は図において上段から下段方向に一段づつ
転送される。また転送信号122が印加されてお
らず、記号列記憶手段110から“1”の読取り
信号112が供給されると、カウンタ120の内
容は1だけ増加(以後、インクリメントと称す)
し、“0”の読取り信号の場合には内容が保たれ
る、このように動作させるカウンタ120とし
て、市販されている集積回路、例えばテキサス・
インストルメント社製のSN74LS161Nを利用で
きる。
第2図はクロツク信号121と転送信号122
のタイミング図を示す。照合対象となる記号列は
周期T毎に1個の記号が記号列入力端子111か
ら入力され、その間に前後2発のパルス信号がク
ロツク信号121として印加される。転送信号1
22はクロツク信号121の前発のパルス信号の
立上り時の含むパルス信号として印加される。従
つて、1個の記号が入力されるごとに各段のカウ
ンタ120の転送動作とインクリメント(但し、
読取り信号112が“1”の場合)が交互に行な
われる。レジスタ130は転送信号122により
最終段のカウンタ120の内容を取込む。
第3図は第1図の記号列照合装置の動作説明図
である。
第1図に示したように記号列記憶手段110に
“MEMORY”の照合記号列が格納されている状
態で、照合記号列と同じ記号列“MEMORY”
が記号列入力端子111から入力された場合の動
作を同図aで説明する。また照合記号列内の一部
の記号“O”が誤つた場合、欠けた場合及び余分
な記号“X”が付加された場合について、それぞ
れ同図b,c,dを用いて説明する。
図において、第1行は記号列入力端子111か
ら入力された記号列、第2行は記号の入力毎に仮
に定めた時刻T0〜T7を示し、第3行以下はクロ
ツク信号121の後発のパルス信号が印加された
後のカウンタ120の内容を上段よりN1,N
2,N3,N4,N5,N6で代表させ、その値
を示す。最後の行は加算器140の出力Nの値を
示す。
まず、照合動作前に各段のカウンタ120の内
容N1からN6を零に設定しておく。これは図示
していないが、カウンタ120のクリア端子にパ
ルス信号を印加することで容易に行なえる。
第3図aを参照して、照合記号列と同じ記号列
“MEMORY”が記号列入力端子111から入力
された場合の動作について説明する。まず、先頭
の記号“M”が入力されたときに、クロツク信号
121の前発のパルス信号の立上り時に転送信号
122が印加されているので、各段のカウンタ1
20の内容は上段から下段方向に一斉に次段に転
送される。この時点での全段のカウンタ120の
内容N1からN6は零になつている。また、記号
列記憶手段110の第1ビツト目と第3ビツト目
の読取り信号112のみ“1”となる。したがつ
て、クロツク信号121の後発のパルス信号が印
加されると、第1段目と第3段目のカウンタ12
0の内容N1とN3のみインクリメントされ0か
ら1となる。
これで照合対象となる記号列の先頭記号“M”
に対する照合処理がなされる。
同様にして次の記号“E”が入力されると、第
2段目のカウンタの内容N2のみインクリメント
され、1から2となる。このようにして、全ての
記号列に対する照合処理を行なう。最終段のカウ
ンタ120の各時刻における内容(この列ではN
6)は、その時刻以前に入力された記号列の各記
号とが一致する記号の個数を示すことになる。第
3図aでは時刻T6のN6の値の6は、その時刻
以前すなわちT1〜T6に入力された記号列に一致
していることを示す。
従つて、照合記号列の記号数をMとすると(図
の例ではM=6)、同一の記号列が入力された場
合にN6の値はMとなり、1個の記号のみが異な
るならばM−1となる。すなわち、最終的段のカ
ウンタ120の内容は入力された記号列と照合記
号列との類似度を示す。加算器120は最終段の
カウンタ120の内容と1時刻前のその内容を記
憶するレジスタ130の内容とを加算し、類似度
出力125として外部に伝達する。
第3図bは一部の記号“O”が他の記号“X”
に誤つている記号例が入力された場合の各段のカ
ウンタ120の内容を示す。先頭から3個の記号
“M”、“E”、“M”の入力に対する各段のカウン
タ120は、第3図aと同様に動作する。しか
し、次の4番目の記号“X”が入力されると、第
4段目のカウンタ120の内容N4は、記号列記
憶手段110の第4ビツト目の読取り信号112
が“O”であるためインクリメントされず、同じ
値3を保つ。従つて、6個の記号からなる記号列
“MEMXRY”が入力された後のN6の値は、第
3図aの場合より1だけ小さい5となる。すなわ
ち、照合記号列と1個の記号のみが異なる記号列
が入力されたと認識できる。
第3図cは照合記号列内の一部の記号“O”
が、欠けた記号列“MEMRYX”が入力された
場合の各段のカウンタの内容を示す。先頭から3
個の記号の入力に対しては第3図aと同様な動作
をする。しかし、以後の記号列“RYX”は照合
記号と1記号づれているため、時刻T4,T5,T6
におけるN4,N5,N6の値は変化せず、3を
保つ。また、記号“R”が入力される時刻T4に
N5はインクリメントされ、0から1となる。次
の記号“Y”が入力されたときにN6はインクリ
メントされ、1から2となる。この結果、最終段
のカウンタ120の内容N6の最大値は3とな
り、N6を監視しているだけでは入力された記号
列が照合記号列から1個の記号を抜いた記号列で
あることを認識できない。しかし、加算器140
の出力Nは5となるので時刻T1からT6までに入
力された記号列内に照合記号列と整合する記号が
5個含まれていることを認識できる。従つて、一
部の記号が欠けた記号列についても加算器140
の出力Nを監視することにより、照合が可能とな
る。加算器140の出力Nは類似度出力125と
して外部に伝達される。
第3図dは余分な記号“X”を含む記号列
“MEMXORY”が入力された場合の各段のカウ
ンタ120の内容を示す。先頭から3個までの記
号の入力に対しては第3図aと同様な動作をす
る。しかし、4番目以後の記号列には余分な記号
“X”が含まれているので、照合記号列と1記号
づれている。このため、時刻T4,T5,T6の各々
におけるN4,N5,N6の値はインクリメントされ
ず、3を保つ。しかし、1時刻ずらした時刻T5
T6,T7の各々におけるN4,N5,N6の値はそれ
ぞインクリメントされ、0から3となる。したが
つて、N6を監視しているだけでは入力された記
号列が照合記号列に1つの余分な記号を付加した
記号列であることを認識できない。しかし、加算
器140の出力Nの値は時刻T7で6となるので
入力された記号列が高い類似性を持つことを認識
できる。
一般に照合記号列の記号列長をnとすると、時
刻Tiにおける最終段のカウンタ120の内容Nn
は、時刻Ti−n+1から時刻Tiまでに入力され
た記号列が照合記号列と整合する記号の個数を示
す。Ti時刻における加算器140の出力Nすな
わち類似度出力125は、最終段のカウンタ12
0の時刻Tiとその1時刻前の内容の和を示す。
すなわち、類似度出力125は入力した記号列及
びそれを1記号分ずらした記号列が照合記号列と
整合する記号の個数の和を示す。従つて、一部の
記号が欠けた記号列および余分な記号が付加され
た記号列についても、類似度出力125を監視す
ることで照合できる。
以上述べたように第1図に示した記号列照合装
置は照合記号列と完全に一致する記号列だけでな
く、その中の任意の個数の記号が誤つている記号
列も抽出でき、柔軟性の高い記号列照合装置とい
える。
一般に記号列の総合に際しては、照合記号列と
一致した記号の個数よりも異なる記号の個数が出
力される方が取扱いやすい。第1図に示したよう
に一致する記号の個数を計数すると、カウンタ1
20は照合記号列の記号数をMとすると0からM
まで計数できるlog2(M+1)のビツト数が必要
となる。しかし、異なる記号の個数を計数するな
らば、許容できる不一致の割合を5%とすると、
カウンタ120はMの5%程度を計数できれば良
いため、そのビツト数を削減できる。
これを可能にする記号列照合装置は第1図に示
した記号列照合装置を少し変更することで実現で
きる。
例えば、記号列記憶手段110の読取り信号1
12が“O”であるときにカウンタ120をイン
クリメントあるいはデイクリメント(値を1だけ
減少)させる。または、記号列記憶手段110の
内容を反転させ、読取り信号112が“1”であ
るときに、カウンタ120の増減を行なつてもよ
い。この場合、カウンタ120の初期値としてイ
ンクリメントを行なわせる場合には、零、デイク
リメントを行なわせる場合にはその計数可能な最
大値以上のインクリメント動作あるいはデイクリ
メント動作を禁止する必要がある。これは、カウ
ンタ120の全てのビツトを入力とするナンドゲ
ート回路で全ビツトが1、あるいはノアゲート回
路で零を検出し、その検出出力で記号列記憶手段
110の読取り信号212をマスクすることで容
易に実現できる。但し、カウンタ120としてそ
の最大値あるいは最小値を検出する回路を内蔵し
ているカウンタ、を利用する場合には、ナンドゲ
ート回路あるいはノアゲート回路が不要となる。
また、カウンタ120を並列入力可能なシフト
レジスタに置換えることも可能である。この場
合、転送信号122で次段のシフトレジスタへの
並列転送が制御され、読取り信号112により内
容の左シフトあるいは右シフトが制御される。初
段のシフトレジスタのデータ入力には最上位ビツ
トあるいは最下位ビツトのみ異なるデータを供給
する。このようなシフトレジスタにはテキサス・
インストルメント社から販売されている74LS299
の集積回路を利用できる。カウンタ120の代り
にシフトレジスタを用いると、照合記号列と異な
る記号数を計数した場合、シフトレジスタのビツ
ト数以上の異なる記号数が入力されると、シフト
レジスタの内容は自動的に零に設定されるので、
制御が容易になる。
さらに、カウンタ120はシフトレジスタだけ
でなく他の論理演算手段に置換えることも容易に
可能である。
また、以上の説明では1個の記号の欠けや付加
を許容できる記号列照合装置について説明した
が、複数個の記号の欠けや付加を許容できるよう
に拡張できる。これは、レジスタ130として直
列に接続した複数段のレジスタを使用し、加算器
140が各レジスタの内容を加算することで可能
となる。
第4図も本発明による実施例の説明図である。
この記号列照合装置は照合対象となる記号列の中
から照合記号列と高り類似度を示す記号列のみ抽
出するものであり、第1図の記号列照合装置40
0にコンパレータ410とレベル設定レジスタ4
20を追加している。
照合動作開始前にレベル設定レジスタ420に
は抽出しようとする記号列の許容類似度が設定さ
れる。これは、許容類似度を示すレベル信号42
1とレジスタセツト信号422をレベル設定レジ
スタ420に供給することにより行なわれる。
コンパレータ410は類似度出力125とレベ
ル設定レジスタ420の内容とを各々入力A、B
に入力し、両者を比較する。そして前者が大きい
か等しいかを示すAZB出力を照合出力信号41
1として外部に伝達する。記号列記号記憶手段1
10に格納されている照合記号列の記号数Mに対
し、レベル設定レジスタ420に(M−1)を設
定すると、記号列入力端子111から入力された
記号列と照合記号列とが(M−1)個以上の記号
が整合している場合に、コンパレータ410は照
合出力411を発生する。従つて、照合出力41
1を監視することで照合記号列と高り類似度を示
す記号列のみ抽出できる。
第5図も本発明による実施例の説明図である。
この記号列照合装置は複数の照合記号列を並列
に照合し、整合しれ照合記号列を示す整合コード
を出力するものであり、第4図に示した記号列照
合装置に対応する記号列照合ユニツト500を複
数個含む記号列照合部510と、各記号列照合ユ
ニツト500から出力される各照合出力411を
入力するエンコーダ520と、各記号列照合ユニ
ツト500にレジスタセツト信号422を供給す
るデコーダ530とから構成される。
記号列入力端子111から入力される記号コー
ド、クロツク信号121、転送信号122、許容
類似度を示すレベル信号421は各記号列照合ユ
ニツト500に共通に供給される。
記号列照合ユニツト500への許容類似度の設
定は、ユニツト選択信号531と共に基本レジス
タセツト信号532をデコーダ530に供給し、
レベル信号421を記号列照合部510に供給す
ることにより行なわれる。このとき、デコーダ5
30は許容類似度を設定しようとする記号列照合
ユニツト500にのみレジスタセツト信号422
を印加する。
記号列入力端子111から照合対称となる記号
列を構成する記号コードを逐次入力すると、各記
号列照合ユニツト500内に登録されている各照
合記号列と並列に照合し、許容類似度以上の高い
類似度を示す照合記号列を記憶している照合列照
合ユニツト500から照合出力411が発生す
る。エンコーダ520はこの照合出力411を受
けてそれをコード化し、入力された記号列の分類
コード521と整合したことを示す“0”の有効
信号522を発生する。いずれの照合出力411
も不整合を示している場合には、エンコーダは不
整合を示す“1”の有効信号522を発生する。
従つて、有効信号522と分類コード521を
監視することにより、入力された記号列の分類が
可能となる。また、エンコーダ520とデコーダ
530とにより、入出力端子数を削減し、本記号
列照合装置のLSI化を容易にする。
(発明の効果) 以上述べたように、本発明の記号列照合装置は
類似度による照合を可能とするので、一部の記号
が誤つた記号列の照合も可能にする。英単語、特
に名詞は単数形、複数形により最終文字が異なる
場合が多い。例えば、“memory”は複数形にな
ると“memories”になる。この場合、基本の
“memory”を照合記号列とし、一文字の誤りを
許すように許容類似度を設定すれば、
“memories”も抽出できる。また、一部の記号
が欠けた記号列あるいは余分な記号が付加された
記号列の照合も可能にする。このような一部の記
号の欠けや余分な記号の付加は一般に記号列内の
どこに生ずるかまたはどのように記号が欠ける
か、付加されるか予め判断できない。したがつ
て、起りうるすべての記号列の変化に対し、従来
の記号列照合ではそれらの許容するようにプログ
ラミングしておかなければならない。しかし、本
発明の記号列照合方式及び記号列照合装置では許
容類似度を設定しておくことで容易に対処でき
る。すなわち、本発明の記号列照合装置とその方
式は柔軟な記号列照合を可能にする。
また、入出力端子数を削減し、LSI化を容易に
可能にし、価格低下をもたらす。
なお、現状の256キロビツトRAMの半導体技
術を用いれば、8ビツトコードの記号8個からな
る照合記号列を128個を1チツプに格納でき、そ
れらを並列に照合できる。
1テツプで256種の記号から成る記号列を128ク
ラスに分類することができる事はワープロで作成
した文章の原文フアイルからシーケンシヤルに読
出される記号列文章の中から128個までのキーワ
ード(記号列)の抽出を一挙にやりとげれる事を
意味する。従来は多数のキーワードの同時検策が
困難であつたから、上記チツプのインパクトは大
きい。
この記号列識別装置はOCR装置や音声認識装
置などパタン認識を行なうシステムにおける特徴
系列の分類においても役立つ。この記号列識別装
置の1チツプLSI化は言語翻訳に必要な辞言とし
ても役立つ。このチツプに通常RAMを接続し、
各記号列の分類コードに対応ずけて、単語の訳語
を格納すると、1チツプにつき128単語までの翻
訳が記号列の入力の完了時に直ちに求まる。記号
列識別チツプに接続される通常RAMには記号別
の分類コードに対応ずけて、各種の情報を格納す
ることが可能であつて、それによつて、種々の記
号列情報処理機能が達成される。たとえば、記号
列の分類コードに対応ずけ、単語の品詞コードや
記号列の出現回数や記号列文章に対する処理命令
を格納すると、知識情報の収集や整理が行ないや
すくなる。
この記号列抽出装置の処理速度は、記号記憶手
段210,410に使われる半導体RAMのサイ
クルタイムTcが1つの記号の処理時間にほぼ対
応する。Tcを100msとすると、109個の記号列
のテキストに対する103個の記号列による照合を
10秒で行なえる。現状のソフトウエアによる照合
では10時間程度を必要とするので、本発明の記号
列照合装置は著しく照合時間を短縮する。
以上まとめると、本発明によれば、従来のマイ
コンとソフトウエアの組合せによる記号列の分類
による処理時間の大きい事と柔軟性に欠ける事の
欠陥が容易に解決する。また、本発明の記号列識
別装置が1チツプのLSIにまとまり易い事を考え
ると、このようなLSIは文章の原文フアイルから
キーワードの抽出や言語翻訳用ので電子言やパタ
ン認識システムの特徴系列の分類において欠かす
ことのできない機能素子になる。
【図面の簡単な説明】
第1図は本発明による記号列照合装置の一実施
例の説明図、第2図はクロツク信号と転送信号の
タイミング図、第3図は記号列照合装置の動作説
明図、第4図、第5図は本発明の他の実施例の説
明図、第6図は記号列照合の説明図である。 110……記号列記憶手段、120……カウン
タ、123……第1の演算手段、124……一時
記憶手段、130……レジスタ、140……加算
器、410……コンパレータ、420……レベル
設定レジスタ、500……記号列照合ユニツト、
510……記号列照合部、520……エンコー
ダ、530……デコーダ。

Claims (1)

  1. 【特許請求の範囲】 1 記号コードをアドレス入力とし、照合記号列
    を記憶する記号列記憶手段と、この各出力線につ
    ながる第1の演算手段と、複数の演算手段間を相
    互に結合する第1の一時記憶手段と、特定の第1
    の一時記憶手段の出力につながる第2の一時記憶
    手段と、第2の一時記憶手段につながる第2の演
    算手段とを備えたことを特徴とする記号列照合装
    置。 2 第1の演算手段と第1の一時記憶手段とがそ
    れぞれカウンタあるいはシフトレジスタであるこ
    とを特徴とする特許請求の範囲第1項記載の記号
    列照合装置。 3 記号コードをアドレス入力とし、照合記号列
    を記憶する記号列記憶手段と、この各出力線につ
    ながる第1の演算手段と、複数の演算手段間を相
    互に結合する第1の一時記憶手段と、特定の第1
    の一時記憶手段の出力につながる第2の一時記憶
    手段と、第2の一時記憶手段につながる第2の演
    算手段と、外部から与えられる許容類似度を記憶
    するレジスタと、このレジスタの内容と第2の演
    算手段の出力とを比較し、照合結果を出力するコ
    ンパレータとを含むことを特徴とする信号列照合
    装置。 4 第1の演算手段と第1の一時記憶手段とがそ
    れぞれカウンタあるいはシフトレジスタであるこ
    とを特徴とする特許請求の範囲第3項記載の記号
    列照合装置。 5 記号コードをアドレス入力とし、照合記号列
    を記憶する記号列記憶手段と、この各出力線につ
    ながる第1の演算手段と、複数の演算手段間を相
    互に結合する第1の一時記憶手段と、特定の第1
    の一時記憶手段の出力につながる第2の一時記憶
    手段と、第2の一時記憶手段につながる第2の演
    算手段と、外部から与えられる許容類似度を記憶
    するレジスタと、このレジスタの内容と第2の演
    算手段の出力とを比較し、照合結果を出力するコ
    ンパレータと該コンパレータに接続するエンコー
    ダと、該レジスタに接続するデコーダとを備える
    ことを特徴とする記号列照合装置。 6 第1の演算手段と第1の一時記憶手段とがそ
    れぞれカウンタあるいはシフトレジスタであるこ
    とを特徴とする特許請求の範囲第5項記載の記号
    列照合装置。 7 記号で指定された番地のみ値が異なるように
    記号列内の各記号を記号列記憶手段の各列に記憶
    させ、記号列の照合時に記号を前記記号列記憶手
    段のデコーダに入力し、前記記号列記憶手段の入
    力された記号で示される番地の複数列の内容を並
    列に読み取り、前記号列記憶手段の各列の読み取
    り情報に基づき連結された各段のカウンタの内容
    の増加及び次段のカウンタへの転送を制御し、最
    終段のカウンタの互いに1時刻異なる2つ内容と
    を加算することで前記記号列記憶手段の内容と逐
    次入力された記号列の類似度を求めることを特徴
    とする記号列照合装置の制御方式。
JP14892684A 1984-07-18 1984-07-18 記号列照合装置とその制御方式 Granted JPS6128134A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14892684A JPS6128134A (ja) 1984-07-18 1984-07-18 記号列照合装置とその制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14892684A JPS6128134A (ja) 1984-07-18 1984-07-18 記号列照合装置とその制御方式

Publications (2)

Publication Number Publication Date
JPS6128134A JPS6128134A (ja) 1986-02-07
JPH0554148B2 true JPH0554148B2 (ja) 1993-08-11

Family

ID=15463749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14892684A Granted JPS6128134A (ja) 1984-07-18 1984-07-18 記号列照合装置とその制御方式

Country Status (1)

Country Link
JP (1) JPS6128134A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5051947A (en) * 1985-12-10 1991-09-24 Trw Inc. High-speed single-pass textual search processor for locating exact and inexact matches of a search pattern in a textual stream
JPH0799521B2 (ja) * 1987-03-14 1995-10-25 富士通株式会社 類似文字列検索装置

Also Published As

Publication number Publication date
JPS6128134A (ja) 1986-02-07

Similar Documents

Publication Publication Date Title
JP2726568B2 (ja) 文字認識方法及び装置
JPH02299068A (ja) 入力文字列からワードを分離する方法
JPH0533422B2 (ja)
JPH0554148B2 (ja)
JPH0529950B2 (ja)
JP2655087B2 (ja) 文字認識後処理方式
JPS6128131A (ja) 記号列照合装置とその照合方式
JPS63103393A (ja) 単語認識装置
JPH0554147B2 (ja)
JP2008059389A (ja) 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム
JPS62285189A (ja) 文字認識後処理方式
JPH0527150B2 (ja)
JP3021224B2 (ja) 辞書検索装置
JPS60225273A (ja) 単語検索方式
JPS6195443A (ja) 記号列照合装置
JPH04153880A (ja) 文字列の部分列抽出処理方式
Marukawa et al. A post-processing method for handwritten Kanji name recognition using Furigana information
JP3725206B2 (ja) 文字認識装置
AU612263B2 (en) Method of data retrieval from a data base and a system therefor
JPH0554146B2 (ja)
JPS6029823A (ja) 適応型記号列変換方式
JPS60211539A (ja) 記号列識別装置及びその制御方式
JPH0863487A (ja) 文書検索方法及び文書検索装置
JPH04340166A (ja) 単語辞書検索装置
JPH0583957B2 (ja)