JPH0527150B2 - - Google Patents
Info
- Publication number
- JPH0527150B2 JPH0527150B2 JP59148925A JP14892584A JPH0527150B2 JP H0527150 B2 JPH0527150 B2 JP H0527150B2 JP 59148925 A JP59148925 A JP 59148925A JP 14892584 A JP14892584 A JP 14892584A JP H0527150 B2 JPH0527150 B2 JP H0527150B2
- Authority
- JP
- Japan
- Prior art keywords
- symbol
- register
- symbol string
- output
- register array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005540 biological transmission Effects 0.000 claims description 20
- 238000003491 array Methods 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 2
- 238000012795 verification Methods 0.000 description 16
- 230000015654 memory Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000000034 method Methods 0.000 description 6
- 238000013519 translation Methods 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 230000010365 information processing Effects 0.000 description 3
- 238000003909 pattern recognition Methods 0.000 description 3
- 230000008054 signal transmission Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は情報処理システムの構成要素に係り、
より具体的には長大な記号列の中から特定の記号
列を抽出する記号列照合装置とその照合方式に関
するものである。
より具体的には長大な記号列の中から特定の記号
列を抽出する記号列照合装置とその照合方式に関
するものである。
(従来技術とその問題点)
上記記号列照合装置はパタン認識システムでの
特徴系列の抽出、ワープロで作成された文章の原
文フアイルからのキーワードの抽出、言語翻訳の
支援や通信文章の略文の解読、図形、イメージ、
テキスト等による非構造データベースの構築に利
用され、知能化されるこれらの情報処理システム
の形成に欠くことができないものである。
特徴系列の抽出、ワープロで作成された文章の原
文フアイルからのキーワードの抽出、言語翻訳の
支援や通信文章の略文の解読、図形、イメージ、
テキスト等による非構造データベースの構築に利
用され、知能化されるこれらの情報処理システム
の形成に欠くことができないものである。
従来の記号列照合は汎用コンピユータのソフト
ウエアにたよつた逐次処理によるため、膨大な処
理時間を必要とし、小規模なものに限定されてい
た。また、単語毎に区切られて構造化された記号
列に照合対象が制限されていた。一例として、n
個の記号列からなるテキスト中にm個の記号列か
らなるパタンがどこに有るかを調べる場合には、
m(n−m+1)回の照合処理を必要とする。磁
気デイスクや光デイスク等に格納されたm=109
個の文字列のテキストから、n=103個の文字列
の文章を捜すには1012回の照合処理を必要とす
る。従つて、テキスト、イメージ、図形、音声等
の大容量な原情報による検索は非現実的であるた
め、予め原情報にキーワードを付加しての検索や
表形式に構造化されたデータの検索に限定されて
いた。また、記号列の構成要素の変動を許容する
柔軟な記号列照合に対して処理時間の長くなりす
ぎる欠点があつた。
ウエアにたよつた逐次処理によるため、膨大な処
理時間を必要とし、小規模なものに限定されてい
た。また、単語毎に区切られて構造化された記号
列に照合対象が制限されていた。一例として、n
個の記号列からなるテキスト中にm個の記号列か
らなるパタンがどこに有るかを調べる場合には、
m(n−m+1)回の照合処理を必要とする。磁
気デイスクや光デイスク等に格納されたm=109
個の文字列のテキストから、n=103個の文字列
の文章を捜すには1012回の照合処理を必要とす
る。従つて、テキスト、イメージ、図形、音声等
の大容量な原情報による検索は非現実的であるた
め、予め原情報にキーワードを付加しての検索や
表形式に構造化されたデータの検索に限定されて
いた。また、記号列の構成要素の変動を許容する
柔軟な記号列照合に対して処理時間の長くなりす
ぎる欠点があつた。
さらに具体的に従来の記号列照合装置とその照
合方式の問題点について説明する。
合方式の問題点について説明する。
第1図は記号列照合の対象となるテキストを示
している。このテキストは報告書の始めの部分を
一例として示している。このようなテキストはワ
ープロのフアイルメモリに多数個格納される。そ
れ等のテキストの中から必要なものをさがし出す
時に、要求内容を示す単語によつて直接に検索で
きる事が求められる。
している。このテキストは報告書の始めの部分を
一例として示している。このようなテキストはワ
ープロのフアイルメモリに多数個格納される。そ
れ等のテキストの中から必要なものをさがし出す
時に、要求内容を示す単語によつて直接に検索で
きる事が求められる。
たとえば、第1図のテキストがmemory,
bubble等の記号列を含む論文であるかを知るた
めには、そのテキストの中でmemory,
memoriesやbubble等の記号列に整合する部分が
あるか否かを検索する必要がある。そのような記
号列のテキストとの比較照合は従来のコンピユー
タとソフトウエアで対応させると、非常に長い時
間を要する。
bubble等の記号列を含む論文であるかを知るた
めには、そのテキストの中でmemory,
memoriesやbubble等の記号列に整合する部分が
あるか否かを検索する必要がある。そのような記
号列のテキストとの比較照合は従来のコンピユー
タとソフトウエアで対応させると、非常に長い時
間を要する。
一般のA4サイズの英文はワード間のスペース
を含めると、約3000文字分の長さになる。一方、
比較照合を行なう記号列の長さはmemoryの場合
もbubbleの場合も6文字である。6文字と3000
文字の記号列間の照合に一般にその積に等しいオ
ーダの回数に及ぶ文字の比較を必要とする。マイ
クロプロセツサでの文字比較時間が1μsecであつ
たとしても各記号列の検索に18msecの時間がか
かる。
を含めると、約3000文字分の長さになる。一方、
比較照合を行なう記号列の長さはmemoryの場合
もbubbleの場合も6文字である。6文字と3000
文字の記号列間の照合に一般にその積に等しいオ
ーダの回数に及ぶ文字の比較を必要とする。マイ
クロプロセツサでの文字比較時間が1μsecであつ
たとしても各記号列の検索に18msecの時間がか
かる。
現実に検索の対象となるテキストの文字数は
109個に及び、照合を行なう記号列の文字数も100
を越すこともあり得る。照合される記号列の数も
1個だけでなく、数10個に及ぶ。その場合の照合
時間は数100時間に及ぶ。故に、このような照合
は現実的に不可能であり、実際は人手により予め
キーワードを抽出しておき、抽出されたキーワー
ドに対する照合に限定されていた。
109個に及び、照合を行なう記号列の文字数も100
を越すこともあり得る。照合される記号列の数も
1個だけでなく、数10個に及ぶ。その場合の照合
時間は数100時間に及ぶ。故に、このような照合
は現実的に不可能であり、実際は人手により予め
キーワードを抽出しておき、抽出されたキーワー
ドに対する照合に限定されていた。
本発明の目的は上記従来の記号列照合装置やそ
の方式の欠点を容易に解決し、テキスト、イメー
ジ、図形等の非構造の記号列の中から任意の記号
列を短時間にして、柔軟な抽出が可能な記号列照
合装置とその照合方式を提供することにある。
の方式の欠点を容易に解決し、テキスト、イメー
ジ、図形等の非構造の記号列の中から任意の記号
列を短時間にして、柔軟な抽出が可能な記号列照
合装置とその照合方式を提供することにある。
また、本発明の他の目的は照合記号列の長さを
任意に設定可能な低価格な記号列照合装置を提供
することにある。
任意に設定可能な低価格な記号列照合装置を提供
することにある。
また、本発明の他の目的は出力端子数の少ない
LSI化が容易な記号列照合装置を提供することに
ある。
LSI化が容易な記号列照合装置を提供することに
ある。
(発明の構成)
従つて本発明によれば、各記号に関連づけたビ
ツトパタンで複数の照合記号列を記憶する記号列
記憶手段と、この各出力につながる第1の伝達手
段と、互いに隣接する各レジスタ間が第1の伝達
手段により連結された複数の第1のレジスタアレ
イと、隣接する各レジスタ間が直列に接続された
第2のレジスタアレイと、第2のレジスタアレイ
の各段のレジスタの内容により、各第1のレジス
タアレイの出力を選択的に出力する出力手段と、
各第1のレジスタアレイの出力と第2のレジスト
アレイ内のレジスタの出力とを選択的に次の第1
のレジスタアレイに伝達する第2の伝達手段とを
含む記号列照合装置及び該装置の出力手段にエン
コーダ又はシフトレジストが付加された記号列照
合装置が得られる。
ツトパタンで複数の照合記号列を記憶する記号列
記憶手段と、この各出力につながる第1の伝達手
段と、互いに隣接する各レジスタ間が第1の伝達
手段により連結された複数の第1のレジスタアレ
イと、隣接する各レジスタ間が直列に接続された
第2のレジスタアレイと、第2のレジスタアレイ
の各段のレジスタの内容により、各第1のレジス
タアレイの出力を選択的に出力する出力手段と、
各第1のレジスタアレイの出力と第2のレジスト
アレイ内のレジスタの出力とを選択的に次の第1
のレジスタアレイに伝達する第2の伝達手段とを
含む記号列照合装置及び該装置の出力手段にエン
コーダ又はシフトレジストが付加された記号列照
合装置が得られる。
(実施例)
第2図は本発明の第1の実施例の説明図であ
る。この記号列照合装置は長大な記号列となるテ
キストを逐次入力し、その中に登録した照合記号
列が含まれているか否かを調べ、外部に伝達する
ものであり、照合記号列をビツトパタンで記憶す
る記号列記憶手段210と、この各出力につなが
る第1の伝達手段230となるアンドゲート回路
と、互いに隣接する各レジスタ245間が該アン
ドゲート回路230により連結された複数の第1
のレジスタアレイ240と、隣接する第2レジス
タ255間が直列に接続された第2のレジスタア
レイ250と、第2のレジスタアレイ250の各
レジスタ255の内容により選択された第1のレ
ジスタアレイ240の出力を選択的に出力する出
力手段260と、各第1のレジスタアレイ240
の出力と第2のレジスタアレイ250内のレジス
タ255の出力とを選択的に次の第1のレジスタ
アレイ240に伝達する第2の伝達手段270と
からなる。
る。この記号列照合装置は長大な記号列となるテ
キストを逐次入力し、その中に登録した照合記号
列が含まれているか否かを調べ、外部に伝達する
ものであり、照合記号列をビツトパタンで記憶す
る記号列記憶手段210と、この各出力につなが
る第1の伝達手段230となるアンドゲート回路
と、互いに隣接する各レジスタ245間が該アン
ドゲート回路230により連結された複数の第1
のレジスタアレイ240と、隣接する第2レジス
タ255間が直列に接続された第2のレジスタア
レイ250と、第2のレジスタアレイ250の各
レジスタ255の内容により選択された第1のレ
ジスタアレイ240の出力を選択的に出力する出
力手段260と、各第1のレジスタアレイ240
の出力と第2のレジスタアレイ250内のレジス
タ255の出力とを選択的に次の第1のレジスタ
アレイ240に伝達する第2の伝達手段270と
からなる。
上段に位置する第1のレジスタアレイ240内
には図の例では6個の第1レジスタ245を含
み、下段の第1のレジスタアレイ240内には5
個の第1のレジスタ245を含む。各第1のレジ
スタアレイ240間はオアゲート回路270とア
ンドゲート回路230とで連結されている。記号
の個数が6個以下の照合記号列を用いる場合には
第2レジスタの第1番目の第2レジスタ255に
“1”を格納させる。この場合、第1番目の第2
レジスタ255につながる第2の伝達手段270
は第1のレジスタアレイ240の出力を通過させ
ずに第2レジスタ255の内容すなわち“1”を
アンドゲート回路に供給する。従つて、上段と下
段に位置する各第1のレジスタアレイ240の入
出力は分離される。また、上段の第1のレジスタ
アレイ240は出力手段260を介して外部に照
合出力として出力される。
には図の例では6個の第1レジスタ245を含
み、下段の第1のレジスタアレイ240内には5
個の第1のレジスタ245を含む。各第1のレジ
スタアレイ240間はオアゲート回路270とア
ンドゲート回路230とで連結されている。記号
の個数が6個以下の照合記号列を用いる場合には
第2レジスタの第1番目の第2レジスタ255に
“1”を格納させる。この場合、第1番目の第2
レジスタ255につながる第2の伝達手段270
は第1のレジスタアレイ240の出力を通過させ
ずに第2レジスタ255の内容すなわち“1”を
アンドゲート回路に供給する。従つて、上段と下
段に位置する各第1のレジスタアレイ240の入
出力は分離される。また、上段の第1のレジスタ
アレイ240は出力手段260を介して外部に照
合出力として出力される。
一方、7個以上の記号を有する照合記号列に対
しては、第2のレジスタアレイ250の第1段目
と第2段目の第2レジスタ255に各々“0”と
“1”を格納させる。この場合、第2の伝達手段
270は上段の第1のレジスタアレイ240の出
力を通過させ、アンドゲート回路230に供給す
る。従つて、上段と下段の第1のレジスタアレイ
240が連結される。また、出力手段260は下
段の第1のレジスタアレイ240の出力を照合出
力として通過させる。このように、7個以上の記
号からなる照合記号列に対しては、各第1のレジ
スタアレイ240を連結させて用いる。この連結
は第2のレジスタアレイ250の内容により制御
できる。
しては、第2のレジスタアレイ250の第1段目
と第2段目の第2レジスタ255に各々“0”と
“1”を格納させる。この場合、第2の伝達手段
270は上段の第1のレジスタアレイ240の出
力を通過させ、アンドゲート回路230に供給す
る。従つて、上段と下段の第1のレジスタアレイ
240が連結される。また、出力手段260は下
段の第1のレジスタアレイ240の出力を照合出
力として通過させる。このように、7個以上の記
号からなる照合記号列に対しては、各第1のレジ
スタアレイ240を連結させて用いる。この連結
は第2のレジスタアレイ250の内容により制御
できる。
照合記号列の各記号は記号記憶手段210の各
ビツトに記号に関連づけたビツトパタンで格納さ
れる。このビツトパタンは記号で選択された番地
のみ“1”になつている。第2図の例では11ビツ
トの記号記憶手段210に“ABABB”の5個の
記号からなる照合記号列を格納している。すなわ
ち、記号“A”で指定されるアドレスの第1,3
ビツトと記号“B”で指定されるアドレスの第
2,4,5ビツトにのみ“1”が格納され、他は
“0”が格納される。但し、記号列記憶手段21
0の第6ビツトは全アドレスに“1”を格納させ
る。従つて、それにつながるアンドゲート回路2
30は第5番目の第1レジスタ245の内容Q5
をそのまま第6番目の第1レジスタ245に供給
する。
ビツトに記号に関連づけたビツトパタンで格納さ
れる。このビツトパタンは記号で選択された番地
のみ“1”になつている。第2図の例では11ビツ
トの記号記憶手段210に“ABABB”の5個の
記号からなる照合記号列を格納している。すなわ
ち、記号“A”で指定されるアドレスの第1,3
ビツトと記号“B”で指定されるアドレスの第
2,4,5ビツトにのみ“1”が格納され、他は
“0”が格納される。但し、記号列記憶手段21
0の第6ビツトは全アドレスに“1”を格納させ
る。従つて、それにつながるアンドゲート回路2
30は第5番目の第1レジスタ245の内容Q5
をそのまま第6番目の第1レジスタ245に供給
する。
また、第2のレジスタアレイ250の第1番目
の第2レジスタには“1”を格納させ、上段の第
1のレジスタアレイ240の出力Q6を出力手段
270を介して外部に出力させる。
の第2レジスタには“1”を格納させ、上段の第
1のレジスタアレイ240の出力Q6を出力手段
270を介して外部に出力させる。
先に説明したように、記号記憶手段210の番
地は記号の種類に対応し、その第1,3ビツトの
読取り出力は記号“A”が入力されたときのみ
“1”となり、第2,4,5ビツトの読取り出力
は“B”が入力されたときのみ“1”となる。ま
た、第6ビツトの読取り出力は常に“1”を発生
する。
地は記号の種類に対応し、その第1,3ビツトの
読取り出力は記号“A”が入力されたときのみ
“1”となり、第2,4,5ビツトの読取り出力
は“B”が入力されたときのみ“1”となる。ま
た、第6ビツトの読取り出力は常に“1”を発生
する。
照合しようとするテキストを構成する記号は逐
次記号記憶手段210のアドレス入力211に印
加され、その記号に対応する番地の内容が読み出
される。記号記憶手段210の第1ビツトの読取
り出力は内部記号として第1のレジスタアレイ2
40の初段のレジスタ245に供給される。他の
読取り出力はアンドゲート回路で構成された内部
信号の伝達手段230に供給され、レジスタアレ
イ240内の各段のレジスタ245に蓄積された
内部信号を次段のレジスタ245に伝達するか否
かを制御する。このレジスタアレイ240内の各
段のレジスタ245は、記号の入力毎に印加され
る同一のクロツク信号241で内部信号の取込み
を行なう。内部信号は記号記憶手段210のアド
レス入力211に記号列“ABABB”が入力され
たときにのみレジスタアレイ240の各段のレジ
スタを通過し、出力手段270を介して特定のレ
ジスタの内容が照合出力端子280から出力され
る。
次記号記憶手段210のアドレス入力211に印
加され、その記号に対応する番地の内容が読み出
される。記号記憶手段210の第1ビツトの読取
り出力は内部記号として第1のレジスタアレイ2
40の初段のレジスタ245に供給される。他の
読取り出力はアンドゲート回路で構成された内部
信号の伝達手段230に供給され、レジスタアレ
イ240内の各段のレジスタ245に蓄積された
内部信号を次段のレジスタ245に伝達するか否
かを制御する。このレジスタアレイ240内の各
段のレジスタ245は、記号の入力毎に印加され
る同一のクロツク信号241で内部信号の取込み
を行なう。内部信号は記号記憶手段210のアド
レス入力211に記号列“ABABB”が入力され
たときにのみレジスタアレイ240の各段のレジ
スタを通過し、出力手段270を介して特定のレ
ジスタの内容が照合出力端子280から出力され
る。
第3図は第2図の記号列照合装置の動作説明図
である。これは第2図に示したように記号記憶手
段210に“ABABB”の照合記号列が格納さ
れ、そのアドレス入力211にテキスト
“ABABAABBABABBAB”の記号列が入力さ
れたときの第1のレジスタアレイ240の各段の
出力Q1〜Q6を示している。第1のレジスタア
レイ240の初段の出力Q1は記号“A”が入力
されたときのみ“1”となり、また第2段の出力
Q2はQ1が1で記号“B”が入力されたときに
のみ“1”となる。このようにして、照合出力端
子280に出力されるQ6はテキスト内に照合記
号列“ABABB”に等しい記号列が現われたとき
に“1”となる。この例では時刻T14にQ6が
“1”となるので、それより一時刻前に入力され
た下線で示す記号列が照合記合列に等しいとわか
る。
である。これは第2図に示したように記号記憶手
段210に“ABABB”の照合記号列が格納さ
れ、そのアドレス入力211にテキスト
“ABABAABBABABBAB”の記号列が入力さ
れたときの第1のレジスタアレイ240の各段の
出力Q1〜Q6を示している。第1のレジスタア
レイ240の初段の出力Q1は記号“A”が入力
されたときのみ“1”となり、また第2段の出力
Q2はQ1が1で記号“B”が入力されたときに
のみ“1”となる。このようにして、照合出力端
子280に出力されるQ6はテキスト内に照合記
号列“ABABB”に等しい記号列が現われたとき
に“1”となる。この例では時刻T14にQ6が
“1”となるので、それより一時刻前に入力され
た下線で示す記号列が照合記合列に等しいとわか
る。
この例では記号記憶手段210に格納された照
合記号列“ABABB”のみ検知しているが、テキ
スト内の記号列の1部が重複したり、欠けたりし
ても混同がなければ検知することも可能である。
たとえば、照合記号列の先頭が記号“Z”でも良
いとする場合には記号記憶手段210の第0ビツ
トの記号Zで指定される番地にも“1”を格納し
ておくことで、“ABABB”および“ZBABB”
の両記号列を抽出できる。
合記号列“ABABB”のみ検知しているが、テキ
スト内の記号列の1部が重複したり、欠けたりし
ても混同がなければ検知することも可能である。
たとえば、照合記号列の先頭が記号“Z”でも良
いとする場合には記号記憶手段210の第0ビツ
トの記号Zで指定される番地にも“1”を格納し
ておくことで、“ABABB”および“ZBABB”
の両記号列を抽出できる。
この記号列照合装置は単語等の意味を持つ記号
列毎にスペース等の区切り記号等がない記号列の
照合も可能にする。また、同様な意味を有する異
なる記号列の照合も可能である。英単語、特に名
詞は単数形と複数形で最終文字が異なる場合が多
い。例えば“memory”は複数形になると
“memories”になる。この場合、照合記号列と
して“memory”と“memori”すなわち、
“memor”の最後に“y”と“i”の両記号を付
加した記号列を記憶しておくことで、“memory”
と“memories”の両記号列を照合できる。
列毎にスペース等の区切り記号等がない記号列の
照合も可能にする。また、同様な意味を有する異
なる記号列の照合も可能である。英単語、特に名
詞は単数形と複数形で最終文字が異なる場合が多
い。例えば“memory”は複数形になると
“memories”になる。この場合、照合記号列と
して“memory”と“memori”すなわち、
“memor”の最後に“y”と“i”の両記号を付
加した記号列を記憶しておくことで、“memory”
と“memories”の両記号列を照合できる。
この記号列照合装置は容易にLSI化が可能であ
るので低価格化をもたらし、また1個の記号を記
号列記憶手段、例えばICメモリのほぼサイクル
タイムで照合可能であるため、高速な記号列照合
を可能にする。また、種々の長さの記号列長の照
合記号列を取扱うことができる。また、照合出力
を発生する出力端子数が削減され、より容易に
LSI化を可能にする。
るので低価格化をもたらし、また1個の記号を記
号列記憶手段、例えばICメモリのほぼサイクル
タイムで照合可能であるため、高速な記号列照合
を可能にする。また、種々の長さの記号列長の照
合記号列を取扱うことができる。また、照合出力
を発生する出力端子数が削減され、より容易に
LSI化を可能にする。
第4図は本発明による記号列照合装置の他の実
施例の説明図である。この記号列照合装置は任意
の記号列長の複数の照合記号列を並列に照合でき
る。これを可能にするために、第2図の記号列記
憶装置に使用した第2の伝達手段270と第1の
伝達手段230と出力手段260とに各々対応す
るオアゲート回路470と第1のアンドゲート回
路430と第2のアンドゲート回路460と、さ
らに記号列記憶手段210と第1のレジスタアレ
イ440と第2のレジスタアレイ450と出力手
段としてのアンドゲート回路460に付加される
エンコーダ490とから構成される。
施例の説明図である。この記号列照合装置は任意
の記号列長の複数の照合記号列を並列に照合でき
る。これを可能にするために、第2図の記号列記
憶装置に使用した第2の伝達手段270と第1の
伝達手段230と出力手段260とに各々対応す
るオアゲート回路470と第1のアンドゲート回
路430と第2のアンドゲート回路460と、さ
らに記号列記憶手段210と第1のレジスタアレ
イ440と第2のレジスタアレイ450と出力手
段としてのアンドゲート回路460に付加される
エンコーダ490とから構成される。
第1のレジスタアレイ440はM個有り、各々
N個のレジスタ445を含んでいる。各第1のレ
ジスタアレイ440内の各レジスタ445は第1
のアンドゲート回路430を介して連結され、各
第1のレジスタアレイ440はオアゲート回路4
70と第1のアンドゲート回路430を介して接
続される。第2のレジスタアレイ450は第1の
レジスタアレイ440の個数に対応するM個のレ
ジスタを含み、それらは直列に接続されている。
N個のレジスタ445を含んでいる。各第1のレ
ジスタアレイ440内の各レジスタ445は第1
のアンドゲート回路430を介して連結され、各
第1のレジスタアレイ440はオアゲート回路4
70と第1のアンドゲート回路430を介して接
続される。第2のレジスタアレイ450は第1の
レジスタアレイ440の個数に対応するM個のレ
ジスタを含み、それらは直列に接続されている。
照合記号列は第2図と同様に記号に関連づけた
ビツトパタンで記号列記憶手段210に格納され
る。すなわち、照合記号列の記号で示される記号
列記憶手段210のアドレスにのみ“1”を書込
むことでその記号が格納される。照合記号列の記
号数が第1のレジスタアレイ440のレジスタ4
45の個数Nより小さい場合には、記号列記憶手
段210に第1のレジスタアレイ440に対応し
てM個の照合記号列を格納できる。このとき、第
2のレジスタアレイ450の各レジスタ455に
は、M個の照合記号列を区切るマーカとして
“1”を格納する。このマーカはマーカ入力信号
451と共に第2のレジスタアレイ450へのマ
ーカ書込みクロツク信号452を印加することで
直列に書込める。また、照合記号列の記号数とN
との差に相当する記号列記憶手段210のビツト
には全てのアドレスに“1”を格納しておく必要
がある。例えば、第1のレジスタアレイ440の
レジスタ445の個数Nを8とし、そこに6文字
の照合記号列“memory”を格納する場合には、
記号列記憶手段の第1ビツト目と第2ビツト目の
全アドレスに“1”を格納し、第3ビツト目から
第8ビツト目に各々“m”,“e”,“m”,“o”,
“r”,“y”の記号に対応するアドレスにのみ
“1”を格納させる。このように格納すると、第
1のレジスタアレイ440内の第1段目と第2段
目のレジスタ445には、記号列入力端子221
から入力される記号にかかわらず常に“1”が保
持される。その結果、照合記号列“memory”に
等しい記号列が記号列入力端子221から入力さ
れたときのみ、“1”の内部信号が第1のレジス
タアレイ440内の最終段のレジスタ445に伝
達され、第2のアンドゲート回路460を介し
て、照合出力480が発生する。すなわち、レジ
スタ445の段数Nより短い記号列長の照合記号
列の照合が可能となる。
ビツトパタンで記号列記憶手段210に格納され
る。すなわち、照合記号列の記号で示される記号
列記憶手段210のアドレスにのみ“1”を書込
むことでその記号が格納される。照合記号列の記
号数が第1のレジスタアレイ440のレジスタ4
45の個数Nより小さい場合には、記号列記憶手
段210に第1のレジスタアレイ440に対応し
てM個の照合記号列を格納できる。このとき、第
2のレジスタアレイ450の各レジスタ455に
は、M個の照合記号列を区切るマーカとして
“1”を格納する。このマーカはマーカ入力信号
451と共に第2のレジスタアレイ450へのマ
ーカ書込みクロツク信号452を印加することで
直列に書込める。また、照合記号列の記号数とN
との差に相当する記号列記憶手段210のビツト
には全てのアドレスに“1”を格納しておく必要
がある。例えば、第1のレジスタアレイ440の
レジスタ445の個数Nを8とし、そこに6文字
の照合記号列“memory”を格納する場合には、
記号列記憶手段の第1ビツト目と第2ビツト目の
全アドレスに“1”を格納し、第3ビツト目から
第8ビツト目に各々“m”,“e”,“m”,“o”,
“r”,“y”の記号に対応するアドレスにのみ
“1”を格納させる。このように格納すると、第
1のレジスタアレイ440内の第1段目と第2段
目のレジスタ445には、記号列入力端子221
から入力される記号にかかわらず常に“1”が保
持される。その結果、照合記号列“memory”に
等しい記号列が記号列入力端子221から入力さ
れたときのみ、“1”の内部信号が第1のレジス
タアレイ440内の最終段のレジスタ445に伝
達され、第2のアンドゲート回路460を介し
て、照合出力480が発生する。すなわち、レジ
スタ445の段数Nより短い記号列長の照合記号
列の照合が可能となる。
一方:記号列長がNより大きい照合記号列に対
しては、2個以上の第1のレジスタアレイ440
にまたがつて照合記号列を格納する。このため
に、その第1のレジスタアレイ440のつながり
に対応する第2のレジスタアレイ450のレジス
タ455に連続していることを意味する“0”を
格納させる。この結果、“0”を出力する第2の
レジスタアレイ450のレジスタ455につなが
るオアゲート回路470は、第1のレジスタアレ
イ440の最終段のレジスタ445の内容を次の
第1のレジスタアレイ440の入力につながるア
ンドゲート回路430に伝達する。すなわち、2
個の第1のレジスタアレイ440が連続に接続さ
れたことになる。このように、第2のレジスタア
レイ450内のレジスタ455の内容により、各
第1のレジスタアレイ440を直列に接続した
り、また分離することができる。すなわち、第1
のレジスタアレイ440内のレジスタ445の段
数Nの単位でそのレジスタ445をつなげること
できる。
しては、2個以上の第1のレジスタアレイ440
にまたがつて照合記号列を格納する。このため
に、その第1のレジスタアレイ440のつながり
に対応する第2のレジスタアレイ450のレジス
タ455に連続していることを意味する“0”を
格納させる。この結果、“0”を出力する第2の
レジスタアレイ450のレジスタ455につなが
るオアゲート回路470は、第1のレジスタアレ
イ440の最終段のレジスタ445の内容を次の
第1のレジスタアレイ440の入力につながるア
ンドゲート回路430に伝達する。すなわち、2
個の第1のレジスタアレイ440が連続に接続さ
れたことになる。このように、第2のレジスタア
レイ450内のレジスタ455の内容により、各
第1のレジスタアレイ440を直列に接続した
り、また分離することができる。すなわち、第1
のレジスタアレイ440内のレジスタ445の段
数Nの単位でそのレジスタ445をつなげること
できる。
このように第2のレジスタアレイ450の内容
により、任意の第1のレジスタアレイ440内の
最終段のレジスタ445内の内部信号を照合出力
480に導くことができ、複数の第1のレジスタ
アレイ440を任意に分割、接続ができる。従つ
て、記号列記憶手段210に任意の記号列長の複
数の照合記号列を格納でき、その照合記号列に関
する並列照合が可能となる。
により、任意の第1のレジスタアレイ440内の
最終段のレジスタ445内の内部信号を照合出力
480に導くことができ、複数の第1のレジスタ
アレイ440を任意に分割、接続ができる。従つ
て、記号列記憶手段210に任意の記号列長の複
数の照合記号列を格納でき、その照合記号列に関
する並列照合が可能となる。
また、照合出力端子480の数は、第1のレジ
スタアレイ440の数Mで複数の第1のレジスタ
アレイ440内のレジスタ445の個数のN分の
1である。出力端子数が少ないため、容易にLSI
化が可能となり価格低下をもたらす。
スタアレイ440の数Mで複数の第1のレジスタ
アレイ440内のレジスタ445の個数のN分の
1である。出力端子数が少ないため、容易にLSI
化が可能となり価格低下をもたらす。
各照合出力480はエンコーダ490に導か
れ、照合した記号列の分類コード491をエンコ
ーダは発生する。いずれの照合出力480もエン
コーダ490に到達していない場合に、エンコー
ダ490は判別不能信号492を出力する。この
ようなエンコーダ490はプライオリテイ・エン
コーダの商品名で市販されている。分類コード4
91のビツト数は照合出力480の個数を2Nとす
ると、Nビツトとなり、記号列照合装置の出力端
子数を削減し、容易にLSI化を実現できる。
れ、照合した記号列の分類コード491をエンコ
ーダは発生する。いずれの照合出力480もエン
コーダ490に到達していない場合に、エンコー
ダ490は判別不能信号492を出力する。この
ようなエンコーダ490はプライオリテイ・エン
コーダの商品名で市販されている。分類コード4
91のビツト数は照合出力480の個数を2Nとす
ると、Nビツトとなり、記号列照合装置の出力端
子数を削減し、容易にLSI化を実現できる。
また、エンコーダ490の代りに照合出力48
0の信号を並列に入力し、それを直列に出力する
シフトレジスタに置換えることも可能である。こ
の場合、出力端子数が1個となりさらにLSI化が
容易になる。
0の信号を並列に入力し、それを直列に出力する
シフトレジスタに置換えることも可能である。こ
の場合、出力端子数が1個となりさらにLSI化が
容易になる。
なお、第1、第2のアンドゲート回路430,
460及びオアゲート回路470は各々内部信号
の第1の伝達手段、内部信号の出力手段、内部信
号の第2の伝達手段の機能を有するものならば、
他のゲート回路に置換えることも可能である。
460及びオアゲート回路470は各々内部信号
の第1の伝達手段、内部信号の出力手段、内部信
号の第2の伝達手段の機能を有するものならば、
他のゲート回路に置換えることも可能である。
(発明の効果)
以上述べたように、本発明によれば従来の記号
列照合において照合時間が掛かりすぎる問題を容
易に解決した記号列照合装置を実現できる。また
一部の記号の誤りや変化にも柔軟に対応できる照
合が可能である。さらに、記号列長が異なる複数
の照合記号列を格納でき、それらを並列に照合で
きる。従つて、ハードウエアを効率的に利用し、
価格低下と照合時間の短縮をもたらす。
列照合において照合時間が掛かりすぎる問題を容
易に解決した記号列照合装置を実現できる。また
一部の記号の誤りや変化にも柔軟に対応できる照
合が可能である。さらに、記号列長が異なる複数
の照合記号列を格納でき、それらを並列に照合で
きる。従つて、ハードウエアを効率的に利用し、
価格低下と照合時間の短縮をもたらす。
本発明の記号列照合装置は現状の256キロビツ
トRAMの半導体技術を用いれば、記号のコード
長を8ビツトとすると、平均8個の記号列長の照
合記号列を128個を1チツプに収納でき、それら
を並列に照合できる。
トRAMの半導体技術を用いれば、記号のコード
長を8ビツトとすると、平均8個の記号列長の照
合記号列を128個を1チツプに収納でき、それら
を並列に照合できる。
1チツプで256種の信号から成る記号列を128ク
ラスに分類することができる事はワープロで作成
した文章の原文フアイルからシーケンシアルに読
出される記号列文章の中から128個までのキーワ
ード(記号列)の抽出を一挙にやりとげれる事を
意味する。従来は多数のキーワードの同時検索が
困難であつたから、上記チツプのインパクトは大
きい。
ラスに分類することができる事はワープロで作成
した文章の原文フアイルからシーケンシアルに読
出される記号列文章の中から128個までのキーワ
ード(記号列)の抽出を一挙にやりとげれる事を
意味する。従来は多数のキーワードの同時検索が
困難であつたから、上記チツプのインパクトは大
きい。
この記号列識別装置はOCR装置や音声認識装
置などパタン認識を行なうシステムにおける特徴
系列の分類においても役立つ。この記号列識別装
置の1チツプLSI化は言語翻訳に必要な辞書とし
ても役立つ。このチツプに通常RAMを接続し各
記号列の分類コードに対応ずけて、単語の訳語を
格納すると、1チツプにつき128単語までの翻訳
が記号列の入力の完了時に直ちに求まる。記号列
識別チツプに接続される通常RAMには記号列の
分類コードに対応ずけて、各種の情報を格納する
ことが可能であつて、それによつて種々の記号列
情報処理機能が達成される。たとえば、記号列の
分類コードに対応ずけ、単語の品詞コードや記号
列の出現回数や記号列文章に対する処理命令を格
納すると、知識情報の収集や整理が行ないやすく
なる。
置などパタン認識を行なうシステムにおける特徴
系列の分類においても役立つ。この記号列識別装
置の1チツプLSI化は言語翻訳に必要な辞書とし
ても役立つ。このチツプに通常RAMを接続し各
記号列の分類コードに対応ずけて、単語の訳語を
格納すると、1チツプにつき128単語までの翻訳
が記号列の入力の完了時に直ちに求まる。記号列
識別チツプに接続される通常RAMには記号列の
分類コードに対応ずけて、各種の情報を格納する
ことが可能であつて、それによつて種々の記号列
情報処理機能が達成される。たとえば、記号列の
分類コードに対応ずけ、単語の品詞コードや記号
列の出現回数や記号列文章に対する処理命令を格
納すると、知識情報の収集や整理が行ないやすく
なる。
この記号列抽出装置の処理速度は、記号記憶手
段に使われる半導体RAMのサイクルタイムTcが
1つの記号の処理時間にほぼ対応する。Tcを
100nsとすると、109個の記号列のテキストに対す
る103個の記号列による照合を10秒で行なえる。
現状のソフトウエアによる照合では10時間程度を
必要とするので、本発明の記号列照合装置は著し
く照合時間を短縮する。
段に使われる半導体RAMのサイクルタイムTcが
1つの記号の処理時間にほぼ対応する。Tcを
100nsとすると、109個の記号列のテキストに対す
る103個の記号列による照合を10秒で行なえる。
現状のソフトウエアによる照合では10時間程度を
必要とするので、本発明の記号列照合装置は著し
く照合時間を短縮する。
以上まとめると、従来のマイコンとソフトウエ
アの組合わせによる記号列の分類による処理時間
の大きい事と柔軟性に欠ける事の欠陥が容易に解
決する。また、本発明の記号列識別装置が1チツ
プのLSIにまとまり易い事を考えると、このよう
なLSIは文章の原文フアイルからのキーワードの
抽出や言語翻訳用の電子辞書やパタン認識システ
ムの特徴系列の分類において欠かすことのできな
い機能素子になる。
アの組合わせによる記号列の分類による処理時間
の大きい事と柔軟性に欠ける事の欠陥が容易に解
決する。また、本発明の記号列識別装置が1チツ
プのLSIにまとまり易い事を考えると、このよう
なLSIは文章の原文フアイルからのキーワードの
抽出や言語翻訳用の電子辞書やパタン認識システ
ムの特徴系列の分類において欠かすことのできな
い機能素子になる。
第1図は記号列照合問題の説明図、第2図は本
発明による記号列照合装置の一実施例の説明図、
第3図は動作説明図、第4図は本発明による他の
実施例の説明図である。 210……記号列記憶手段、230……第1の
伝達手段、240,440……第1のレジスタア
レイ、245……レジスタ、250,450……
第2のレジスタアレイ、255……レジスタ、2
60……出力手段、270……第2の伝達手段、
430……第1のアンドゲート回路、460……
第2のアンドゲート回路、470……オアゲート
回路、490……エンコーダ。
発明による記号列照合装置の一実施例の説明図、
第3図は動作説明図、第4図は本発明による他の
実施例の説明図である。 210……記号列記憶手段、230……第1の
伝達手段、240,440……第1のレジスタア
レイ、245……レジスタ、250,450……
第2のレジスタアレイ、255……レジスタ、2
60……出力手段、270……第2の伝達手段、
430……第1のアンドゲート回路、460……
第2のアンドゲート回路、470……オアゲート
回路、490……エンコーダ。
Claims (1)
- 【特許請求の範囲】 1 各記号に関連づけたビツトパタンで複数の照
合記号列を記憶する記号列記憶手段と、この各出
力につながる第1の伝達手段と、互いに隣接する
各レジスタ間が第1の伝達手段により連結された
複数の第1のレジスタアレイと、隣接する各レジ
スタ間が直列に接続された第2のレジスタアレイ
と、第2のレジスタアレイの各段のレジスタの内
容により各第1のレジスタアレイの出力を選択的
に出力する出力手段と、各第1のレジスタアレイ
の出力と第2のレジスタアレイ内のレジスタの出
力とを選択的に次の第1のレジスタアレイに伝達
する第2の伝達手段とを備えたことを特徴とする
記号列照合装置。 2 第1の伝達手段と出力手段がアンドゲート回
路であり、前記第2の伝達手段がオアゲート回路
であることを特徴とする特許請求の範囲第1項記
載の記号列照合装置。 3 各記号に関連づけたビツトパタンで複数の照
合記号列を記憶する記号列記憶手段と、この各出
力につながる第1の伝達手段と、互いに隣接する
各レジスタ間が第1の伝達手段により連結された
複数の第1のレジスタアレイと、隣接する各レジ
スタ間が直列に接続された第2のレジスタアレイ
と、第2のレジスタアレイの各段のレジスタの内
容により各第1のレジスタアレイの出力を選択的
に出力する出力手段と、各第1のレジスタアレイ
の出力と第2のレジスタアレイ内のレジスタの出
力とを選択的に次の第1のレジスタアレイに伝達
する第2の伝達手段と前記出力手段に付加するエ
ンコーダ又はシフトレジスタとを備えたことを特
徴とする記号列照合装置。 4 第1の伝達手段と出力手段がアンドゲート回
路であり、前記第2の伝達手段がオアゲート回路
であることを特徴とする特許請求の範囲第3項記
載の記号列照合装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP14892584A JPS6128133A (ja) | 1984-07-18 | 1984-07-18 | 記号列照合装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP14892584A JPS6128133A (ja) | 1984-07-18 | 1984-07-18 | 記号列照合装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6128133A JPS6128133A (ja) | 1986-02-07 |
| JPH0527150B2 true JPH0527150B2 (ja) | 1993-04-20 |
Family
ID=15463726
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP14892584A Granted JPS6128133A (ja) | 1984-07-18 | 1984-07-18 | 記号列照合装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6128133A (ja) |
-
1984
- 1984-07-18 JP JP14892584A patent/JPS6128133A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6128133A (ja) | 1986-02-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0533422B2 (ja) | ||
| US3938099A (en) | Electronic digital system and method for reproducing languages using the Arabic-Farsi script | |
| JP2737173B2 (ja) | 記号列照合装置とその制御方法 | |
| JPS5660972A (en) | Recognition device for basic form of word and translator using it | |
| JP2715465B2 (ja) | 記号列照合装置 | |
| JPH0527150B2 (ja) | ||
| KR20010046695A (ko) | 외래어를 한국어로 표기하기 위한 한국어 표기장치 및 방법 | |
| JPH0554147B2 (ja) | ||
| JPH0529950B2 (ja) | ||
| JPH0554148B2 (ja) | ||
| KR100289332B1 (ko) | 전자화된 문서의 어절 데이터베이스 자동 구축장치 및 방법 | |
| JPH0554146B2 (ja) | ||
| JPS6128131A (ja) | 記号列照合装置とその照合方式 | |
| JPS62299879A (ja) | 漢字学習装置 | |
| Roberto Busa | The Use of Punched Cards in Linguistic Analysis | |
| JPS60225273A (ja) | 単語検索方式 | |
| JP3007697B2 (ja) | 単語照合装置及び単語照合方法 | |
| JPS6120178A (ja) | 記号列識別装置とその制御方式 | |
| JPS62285189A (ja) | 文字認識後処理方式 | |
| JPH01258069A (ja) | 日本語文字列の形態素解析方式 | |
| JPS61161588A (ja) | 文字認識後処理方式 | |
| JPS6195443A (ja) | 記号列照合装置 | |
| JPH0583957B2 (ja) | ||
| JPS60211539A (ja) | 記号列識別装置及びその制御方式 | |
| JPS61267130A (ja) | 記号列識別装置 |