JPS6128130A - 記号列照合装置の制御方式 - Google Patents
記号列照合装置の制御方式Info
- Publication number
- JPS6128130A JPS6128130A JP14892284A JP14892284A JPS6128130A JP S6128130 A JPS6128130 A JP S6128130A JP 14892284 A JP14892284 A JP 14892284A JP 14892284 A JP14892284 A JP 14892284A JP S6128130 A JPS6128130 A JP S6128130A
- Authority
- JP
- Japan
- Prior art keywords
- symbol
- symbol string
- stage
- input
- register
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005540 biological transmission Effects 0.000 claims abstract description 4
- 238000012795 verification Methods 0.000 claims description 12
- 230000008054 signal transmission Effects 0.000 claims description 7
- 238000000034 method Methods 0.000 claims description 5
- 230000010365 information processing Effects 0.000 abstract description 4
- 238000000605 extraction Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は情報処理システムの構成要素に係シ、よシ具体
的には長大な記号列の中から特定の記号列を抽出する記
号列抽出装置と記号列抽出方式に関するものでおる。
的には長大な記号列の中から特定の記号列を抽出する記
号列抽出装置と記号列抽出方式に関するものでおる。
上記記号列抽出装置はバタン認識システムでの特徴系列
の分類、ワープロで作成された文章の原文ファイルから
のキーワードの抽出、言語翻訳の支援や通信文章の略文
の解読、図形、イメージ、テキスト等の非構造データベ
ースの構築に使われ、知能化されるこれらの情報処理シ
ステムの形成において欠くことのできないものである。
の分類、ワープロで作成された文章の原文ファイルから
のキーワードの抽出、言語翻訳の支援や通信文章の略文
の解読、図形、イメージ、テキスト等の非構造データベ
ースの構築に使われ、知能化されるこれらの情報処理シ
ステムの形成において欠くことのできないものである。
(従来技術とその問題点)
従来の記号列抽出はマイクロコンピュータ等に抽出プロ
グラムを設定することによって達成可能であったが、プ
ログラムの逐次処理によるために膨大な処理時間を必要
とし、小規模なものに限定された。また単語毎に区切ら
れて構造化された記号列に識別対象が限定されていた。
グラムを設定することによって達成可能であったが、プ
ログラムの逐次処理によるために膨大な処理時間を必要
とし、小規模なものに限定された。また単語毎に区切ら
れて構造化された記号列に識別対象が限定されていた。
すなわち、n個の記号列からなるテキスト中にm個の記
号列からなるバタンかどこに有るかを調べるにはm(n
−m+1)回の照合処理を必要とする。光ディスク等に
格納されたm=10’個の文字列のテキストからn=1
0’個の文字列の文章を捜すには10 回の照合処理を
必要とする。従って、テキス)=イメージッ図形等の原
情報による検索は非現実的であるため、予め原情報にキ
ーワードを付加しての検索や表形式に構造化されたデー
タの検索に限定されていた。
号列からなるバタンかどこに有るかを調べるにはm(n
−m+1)回の照合処理を必要とする。光ディスク等に
格納されたm=10’個の文字列のテキストからn=1
0’個の文字列の文章を捜すには10 回の照合処理を
必要とする。従って、テキス)=イメージッ図形等の原
情報による検索は非現実的であるため、予め原情報にキ
ーワードを付加しての検索や表形式に構造化されたデー
タの検索に限定されていた。
また、記号列の構成要素の変動を許容する柔軟な記号列
識別に対して処理時間の長くなシすぎる欠陥があった。
識別に対して処理時間の長くなシすぎる欠陥があった。
(発明の目的)
本発明は上記欠陥を解決するものであシ、その目的とす
る所はテキス)=イメージ1図形等の非構造の記号列の
中から任意の記号列を短時間に抽出可能な記号列抽出装
置と記号列抽出方式を提供することにある。
る所はテキス)=イメージ1図形等の非構造の記号列の
中から任意の記号列を短時間に抽出可能な記号列抽出装
置と記号列抽出方式を提供することにある。
(発明の構成)
したがって、本発明によれば記号に関連ずけたピッドパ
クンを記憶する複数組の記号に関する記号記憶手段と、
記号の入力毎に記号記憶手段から選択的に出力されたビ
ットによ多制御される内部信号の伝達手段と、特定の記
号記憶手段の出力を内部信号として入力とし、内部信号
の伝達手段を介して連結され一部を記号列照合信号とし
て出力するレジスタアレイとを含む記号列照合装置と、
記号に関連ずけたビットパタンで照合記号列を記号記憶
手段に格納させておき、記号列の照合時に記号記憶手段
のアドレス部に入力された記号で示されるアドレスの内
容を読み取り、その読み取り情報に基づきレジスタアレ
イ各段の内容の伝達を制御し、レジスタアレイの特定段
の内容によ多入力された記号列内の特定の記号列を抽出
する記号列照合装置の制御方式が得られる。
クンを記憶する複数組の記号に関する記号記憶手段と、
記号の入力毎に記号記憶手段から選択的に出力されたビ
ットによ多制御される内部信号の伝達手段と、特定の記
号記憶手段の出力を内部信号として入力とし、内部信号
の伝達手段を介して連結され一部を記号列照合信号とし
て出力するレジスタアレイとを含む記号列照合装置と、
記号に関連ずけたビットパタンで照合記号列を記号記憶
手段に格納させておき、記号列の照合時に記号記憶手段
のアドレス部に入力された記号で示されるアドレスの内
容を読み取り、その読み取り情報に基づきレジスタアレ
イ各段の内容の伝達を制御し、レジスタアレイの特定段
の内容によ多入力された記号列内の特定の記号列を抽出
する記号列照合装置の制御方式が得られる。
(構成に関する説明)
以下、図面を用いて本発明の更に詳細な説明を行なう。
まず、第1図は言語翻訳のための電子辞書に格納される
データテーブルの一例を示す。このテーブルの第1欄の
英単語は第2欄のアドレスを介して第3欄の日本語訳に
変換されるとする。外部から与えられる入力英単語が第
1欄のどの英単語と一致するかを見つける事がこの電子
辞書での一番難かしいプロセスであシ、これが記号列照
合の問題である。
データテーブルの一例を示す。このテーブルの第1欄の
英単語は第2欄のアドレスを介して第3欄の日本語訳に
変換されるとする。外部から与えられる入力英単語が第
1欄のどの英単語と一致するかを見つける事がこの電子
辞書での一番難かしいプロセスであシ、これが記号列照
合の問題である。
すなわち、入力英単語が第1欄のどの英単語と一致する
かを見つけるにはアドレス順に第1欄の英単語を全部読
取って比較を行う事が最も楽であるが、時間がかかる。
かを見つけるにはアドレス順に第1欄の英単語を全部読
取って比較を行う事が最も楽であるが、時間がかかる。
第1欄の英単語をアルファベット順に並べて、入力英単
語の文字を見て、第1欄の英単語のサーチの範囲を順次
に絞るトリーサーチが比較時間を短縮させるのに役立つ
。
語の文字を見て、第1欄の英単語のサーチの範囲を順次
に絞るトリーサーチが比較時間を短縮させるのに役立つ
。
このような言語翻訳のだめの電子辞書は大容量のメモリ
を持つマイコンによって容易に実現されると考えられる
が、英単語長や単語数の増加と共に処理時間が太きくな
シすぎる問題があって広範囲には使われていない。また
英単語の入力ミスに対して柔軟性のない点も問題となっ
て、使い難い。
を持つマイコンによって容易に実現されると考えられる
が、英単語長や単語数の増加と共に処理時間が太きくな
シすぎる問題があって広範囲には使われていない。また
英単語の入力ミスに対して柔軟性のない点も問題となっ
て、使い難い。
記号列抽出の機能は言語翻訳のだめの電子辞書以外でも
必要である。ワープロで作成された多数の論文が磁気デ
ィスクや光ディスクに原文のま\でファイルされていた
とする。その原文ファイルから著者が誰々であるような
論文を捜すとか、Computer SystemやD
ata base などのキーワードを含んでいるか否
かを調べるとかが記号列抽出の対象となる。
必要である。ワープロで作成された多数の論文が磁気デ
ィスクや光ディスクに原文のま\でファイルされていた
とする。その原文ファイルから著者が誰々であるような
論文を捜すとか、Computer SystemやD
ata base などのキーワードを含んでいるか否
かを調べるとかが記号列抽出の対象となる。
新聞社や出版社など情報発生の源となる所で印刷される
過去の記事や解説文など各種の文章は原文のま\でファ
イルされるようになシ、知識情報社会の中で今までとは
違った形でアクセスされるようになる。すなわち、読者
が過去に印刷された書物を紙の形で保存しないで、端末
から通信回線とコンビーータを介して直接、原文ファイ
ルへ知識問合わせのアクセスを行うようになると考えら
れる。
過去の記事や解説文など各種の文章は原文のま\でファ
イルされるようになシ、知識情報社会の中で今までとは
違った形でアクセスされるようになる。すなわち、読者
が過去に印刷された書物を紙の形で保存しないで、端末
から通信回線とコンビーータを介して直接、原文ファイ
ルへ知識問合わせのアクセスを行うようになると考えら
れる。
知識問合せのアクセスの際にはキーワードが原文ファイ
ルに設定され、そのキーワードを含む箇所、またはその
出典が検索されて、読者に送り返えされるとする。この
時の原文ファイルからのキーワードの抽出が必要となる
。多くのユーザからの知識間合わせに対して、多くのキ
ーワードの検索を並列に行なえることが重要であシ、従
来のマイコンでは対応が困難である。
ルに設定され、そのキーワードを含む箇所、またはその
出典が検索されて、読者に送り返えされるとする。この
時の原文ファイルからのキーワードの抽出が必要となる
。多くのユーザからの知識間合わせに対して、多くのキ
ーワードの検索を並列に行なえることが重要であシ、従
来のマイコンでは対応が困難である。
(実施例)
第2図は本発明の第1の実施例の説明図である。
この記号列照合装置とその方式は長大な記号列となるテ
キストを逐次入力し、その中に登録済みの照合記号列が
含まれているか否かを調べ、外部に伝達するものであり
、照合記号列をビットパタンで記憶する記号記憶手段2
10と、その読取り出力により制御される内部信号の伝
達手段230と、これに連結されたレジスタアレイ24
0とからなる。
キストを逐次入力し、その中に登録済みの照合記号列が
含まれているか否かを調べ、外部に伝達するものであり
、照合記号列をビットパタンで記憶する記号記憶手段2
10と、その読取り出力により制御される内部信号の伝
達手段230と、これに連結されたレジスタアレイ24
0とからなる。
照合記号列の各記号は記号記憶手段210の各ビットに
記号に関連づけたビットパタンで格納される。このビッ
トパタンは記号で選択された番地のみ”1″になってい
る。第2図の例では5ビツトの記号記憶手段210に’
ABABB”の5個の記号からなる照合記号列を格納し
ている。すなわち、記号″A”で指定されるアドレスの
第1す3ビツトと記号”B”で指定されるアドレスの第
2.475ビツトにのみ1″が格納され、他は0″が格
納されている。記号記憶手段210の番地は記号の種類
に対応し、その第1j3ビツトの読取多出力は記号”A
″が入力されたときのみ“1″となシ、第2.4.5ビ
ツトの読取多出力は”B”が入力されたときのみ”1”
となる。
記号に関連づけたビットパタンで格納される。このビッ
トパタンは記号で選択された番地のみ”1″になってい
る。第2図の例では5ビツトの記号記憶手段210に’
ABABB”の5個の記号からなる照合記号列を格納し
ている。すなわち、記号″A”で指定されるアドレスの
第1す3ビツトと記号”B”で指定されるアドレスの第
2.475ビツトにのみ1″が格納され、他は0″が格
納されている。記号記憶手段210の番地は記号の種類
に対応し、その第1j3ビツトの読取多出力は記号”A
″が入力されたときのみ“1″となシ、第2.4.5ビ
ツトの読取多出力は”B”が入力されたときのみ”1”
となる。
照合しようとするテキストを構成する記号は逐次記号記
憶手段210のアドレス人力211に印加され、その記
号に対応する番地の内容が読み出される。記号記憶手段
210の第1ピツトの読取多出力は内部信号としてレジ
スタアレイ240の初段のレジスタに供給される。他の
読取υ出力はアンドゲート回路で構成された内部信号の
伝達手段230に供給され、レジスタアレイ240内の
各段のレジスタに蓄積された内部信号を次段のレジスタ
に伝達するか否かを制御する。このレジスタアレイ24
0内の各段のレジスタは、記号の入力毎に印加される同
一のクロック信号241で内部信号の取込みを行なう。
憶手段210のアドレス人力211に印加され、その記
号に対応する番地の内容が読み出される。記号記憶手段
210の第1ピツトの読取多出力は内部信号としてレジ
スタアレイ240の初段のレジスタに供給される。他の
読取υ出力はアンドゲート回路で構成された内部信号の
伝達手段230に供給され、レジスタアレイ240内の
各段のレジスタに蓄積された内部信号を次段のレジスタ
に伝達するか否かを制御する。このレジスタアレイ24
0内の各段のレジスタは、記号の入力毎に印加される同
一のクロック信号241で内部信号の取込みを行なう。
内部信号は記号記憶手段210のアドレス入力211に
記号列″ABABB”が入力されたときにのみレジスタ
アレイ240の各段のレジスタを通過し、照合出力端子
242から出力される。
記号列″ABABB”が入力されたときにのみレジスタ
アレイ240の各段のレジスタを通過し、照合出力端子
242から出力される。
第3図は第2図の記号列照合装置の動作説明図である。
これは第2図に示したように記号記憶手段210に“A
BABB”の照合記号列が格納され、そのアドレス人力
211にテキスト”ABABAABBABABBA″の
記号列が入力されたときのレジスタアレイ240の各段
の出力Q1〜Q5を示している。レジスタアレイ240
の初段の出力Q1は記号”A″が入力されたときのみ1
″となり、また第2段の出力Q2はQlが1で記号“B
″が入力されたときにのみ”1”となる。このようにし
て、照合出力端子242すなわちQ5はテキスト内に照
合記号列“ABABB″に等しい記号列が表われたとき
に11″となる。この例では時刻T13にQ5が1”と
なるので、テキストの下線で示された記号列が照合記号
列に等しいとわかる。
BABB”の照合記号列が格納され、そのアドレス人力
211にテキスト”ABABAABBABABBA″の
記号列が入力されたときのレジスタアレイ240の各段
の出力Q1〜Q5を示している。レジスタアレイ240
の初段の出力Q1は記号”A″が入力されたときのみ1
″となり、また第2段の出力Q2はQlが1で記号“B
″が入力されたときにのみ”1”となる。このようにし
て、照合出力端子242すなわちQ5はテキスト内に照
合記号列“ABABB″に等しい記号列が表われたとき
に11″となる。この例では時刻T13にQ5が1”と
なるので、テキストの下線で示された記号列が照合記号
列に等しいとわかる。
この例では記号記憶手段210に格納された照合記号列
“ABABB″のみ検知しているが、テキスト内の記号
列の1部が重複したシ、欠けたシしても混同がなければ
検知するととも可能である。
“ABABB″のみ検知しているが、テキスト内の記号
列の1部が重複したシ、欠けたシしても混同がなければ
検知するととも可能である。
たとえば、照合記号列の先頭が記号”2″でも良いとす
る場合には記号記憶手段210の第Oビットの記号2で
指定される番地にも1″を格納しておくことで、”AB
ABB”および”ZBABB”の両記号列を抽出できる
。
る場合には記号記憶手段210の第Oビットの記号2で
指定される番地にも1″を格納しておくことで、”AB
ABB”および”ZBABB”の両記号列を抽出できる
。
第4図は本発明の第2の実施例の説明図であシ、よシ柔
軟性の高い記号列を照合可能な記号列照合装置について
説明する。同図の記号列照合装置は記号列記憶手段41
0と、この読取多出力を符号化する複数のデコーダ42
0と、この出力により制御される複数の選択回路430
と、この出力を一時記憶するレジスタアレイ440と、
これに供給されるクロック信号451をデコーダ420
でマスクするアンドゲート回路450とからなる。
軟性の高い記号列を照合可能な記号列照合装置について
説明する。同図の記号列照合装置は記号列記憶手段41
0と、この読取多出力を符号化する複数のデコーダ42
0と、この出力により制御される複数の選択回路430
と、この出力を一時記憶するレジスタアレイ440と、
これに供給されるクロック信号451をデコーダ420
でマスクするアンドゲート回路450とからなる。
デコーダ420と、選択回路430及びアンドゲート回
路450は第2図における内部信号の伝達手段230に
対応する。
路450は第2図における内部信号の伝達手段230に
対応する。
第2図での記号列記憶手段210では、記憶情報″1”
をレジスタのシフト、10″をクリアに対応させていた
が、第4図の記号列記憶手段410KUレジスタアレイ
440の内容のクリアyシフト?ホールド1バイパスを
2ビツトで表現させている。ここではデコーダ420は
入力00,01j10yllに対応して各々クリア制御
信号421、シフト制御信号422、ホールド制御信号
423、バイパス制御信号424を出力する。クリア制
御信号421は選択回路430の出力をマスクし、クロ
ック信号451の供給時にレジスタの内容のクリアを行
ない、シフト制御信号422は他に接続されず、レジス
タアレイ440をシフトレジスタとして動作させる。ホ
ールド制御信号423はレジスタスレイ440の各段へ
のクロック信号451をマスクし、レジスタの内容を保
持する。
をレジスタのシフト、10″をクリアに対応させていた
が、第4図の記号列記憶手段410KUレジスタアレイ
440の内容のクリアyシフト?ホールド1バイパスを
2ビツトで表現させている。ここではデコーダ420は
入力00,01j10yllに対応して各々クリア制御
信号421、シフト制御信号422、ホールド制御信号
423、バイパス制御信号424を出力する。クリア制
御信号421は選択回路430の出力をマスクし、クロ
ック信号451の供給時にレジスタの内容のクリアを行
ない、シフト制御信号422は他に接続されず、レジス
タアレイ440をシフトレジスタとして動作させる。ホ
ールド制御信号423はレジスタスレイ440の各段へ
のクロック信号451をマスクし、レジスタの内容を保
持する。
また、バイパス制御信号424は選択回路430を切換
え、レジスタをバイパスさせる。
え、レジスタをバイパスさせる。
照合対象となるテキストが記号毎に記号記憶手段410
のアドレス入力に供給されると、その記号で選択された
番地の内容がデコーダ420に供給され、レジスタアレ
イ440の制御が行なわれる。シフト?クリアだけでな
くホールドあるいはバイパスの機能を持たせると照合記
号に柔軟性を持たせることができる。例えば、”P 1
’LOM”、” P −ROM″、”RAM″、R0M
” のいずれの記号列もテキストから検知したい場合
、記号列記憶手段410に図のようなピットノくタンを
格納させればよい。すなわち、記号列記憶手段4】0の
第1段の記号゛P″ @ np・に対応する番孔 地ニ各々にシフトtバイイ(スtホールド動作を意味す
る01jlljlOを格納させ、さらに第2段の記号゛
R”、第3段の記号”A″y”0”、第4段の記号”M
′″に対応する番地にシフト動作を意味する01を格納
させている。
のアドレス入力に供給されると、その記号で選択された
番地の内容がデコーダ420に供給され、レジスタアレ
イ440の制御が行なわれる。シフト?クリアだけでな
くホールドあるいはバイパスの機能を持たせると照合記
号に柔軟性を持たせることができる。例えば、”P 1
’LOM”、” P −ROM″、”RAM″、R0M
” のいずれの記号列もテキストから検知したい場合
、記号列記憶手段410に図のようなピットノくタンを
格納させればよい。すなわち、記号列記憶手段4】0の
第1段の記号゛P″ @ np・に対応する番孔 地ニ各々にシフトtバイイ(スtホールド動作を意味す
る01jlljlOを格納させ、さらに第2段の記号゛
R”、第3段の記号”A″y”0”、第4段の記号”M
′″に対応する番地にシフト動作を意味する01を格納
させている。
この状態で記号列入力端子411に記号を入力すると共
に、クロック信号451を印加すると、レジスタアレイ
440の第1段の内容Q1は記号Pが入力されたときの
みセットされ、それに続き記号1・”が入力されてもホ
ールドされる。しかし記号゛R″が入力されると第1段
のレジスタをバイパスし、第2段のレジスタをセットす
る。従って、最終段の選択回路の出力につながる照合出
力端子452は記号列”FROM″#″P・ROM″り
”ROM”あるいは”RAM″が入力されたときに“1
”を示すことになる。すなわち、入力されたテキスト内
のいくつかの記号列を検知できる。
に、クロック信号451を印加すると、レジスタアレイ
440の第1段の内容Q1は記号Pが入力されたときの
みセットされ、それに続き記号1・”が入力されてもホ
ールドされる。しかし記号゛R″が入力されると第1段
のレジスタをバイパスし、第2段のレジスタをセットす
る。従って、最終段の選択回路の出力につながる照合出
力端子452は記号列”FROM″#″P・ROM″り
”ROM”あるいは”RAM″が入力されたときに“1
”を示すことになる。すなわち、入力されたテキスト内
のいくつかの記号列を検知できる。
第2.4図の記号列照合装置は現在の半導体■LSI技
術を用いれば容易に1チツプに収容される回路から成っ
ている。入出力端子数は記号コードのビット数とクロッ
ク信号端子、照合出力端子、電源系端子の和となるので
ICメモリと同程度になる。記号コードを8ビツトにす
ると、256種類の記号が受付は可能になシ、カタカナ
、ひらがな、アルファベット、特殊文字などを含ませる
ことが可能となる。この場合、1個の照合記号当925
6ピツトのメモリを必要とする。現状の256kbRA
Mの技術を用いれば、1チツプで1024列の照合記号
列を取扱える。A4サイズの文章の文字数は300文字
程度であるので、A4数枚の文章の照合が1チツプで可
能となる。あるいは512ドツ)X512ドツトで表現
、された画像1枚の照合や4KH2のサンプリング周波
数で8ビツトにコード化された8秒間の音声情報の照合
も1チツプで可能となる。
術を用いれば容易に1チツプに収容される回路から成っ
ている。入出力端子数は記号コードのビット数とクロッ
ク信号端子、照合出力端子、電源系端子の和となるので
ICメモリと同程度になる。記号コードを8ビツトにす
ると、256種類の記号が受付は可能になシ、カタカナ
、ひらがな、アルファベット、特殊文字などを含ませる
ことが可能となる。この場合、1個の照合記号当925
6ピツトのメモリを必要とする。現状の256kbRA
Mの技術を用いれば、1チツプで1024列の照合記号
列を取扱える。A4サイズの文章の文字数は300文字
程度であるので、A4数枚の文章の照合が1チツプで可
能となる。あるいは512ドツ)X512ドツトで表現
、された画像1枚の照合や4KH2のサンプリング周波
数で8ビツトにコード化された8秒間の音声情報の照合
も1チツプで可能となる。
また、キーワード等の短い記号列の抽出では、1チツプ
で多数の照合記号列を取扱える。記号コードのビット数
が8ビツト、照合記号列長が8個ならば、128クラス
の記号列を1チツプで並列に抽出できる。
で多数の照合記号列を取扱える。記号コードのビット数
が8ビツト、照合記号列長が8個ならば、128クラス
の記号列を1チツプで並列に抽出できる。
1チツプで256種の記号から成る記号列を128クラ
スに分類することができる事はワープロで作成した文章
の原文ファイルからシーケンシャルに読出される記号列
文章の中から128個までのキーワード(記号列)の抽
出を一挙にやシとけれる事を意味する。従来は多数のキ
ーワードの同時検索が困難であったから、上記チップの
インパクトは大きい。
スに分類することができる事はワープロで作成した文章
の原文ファイルからシーケンシャルに読出される記号列
文章の中から128個までのキーワード(記号列)の抽
出を一挙にやシとけれる事を意味する。従来は多数のキ
ーワードの同時検索が困難であったから、上記チップの
インパクトは大きい。
この記号列識別装置はOCR装置や音声認識装置などバ
タン認識を行々うシステムにおける特徴系列の分類にお
いても役立つ。この記号列識別装置の1チツプLSI化
は言語翻訳に必要な辞書としても役立つ。このチップに
通常RAMを接続し、各記号列の分類コードに対応ずけ
て、単語の訳語を格納すると、1チツプにつき、128
単語までの翻訳が記号列の入力の完了時に直ちに求まる
。
タン認識を行々うシステムにおける特徴系列の分類にお
いても役立つ。この記号列識別装置の1チツプLSI化
は言語翻訳に必要な辞書としても役立つ。このチップに
通常RAMを接続し、各記号列の分類コードに対応ずけ
て、単語の訳語を格納すると、1チツプにつき、128
単語までの翻訳が記号列の入力の完了時に直ちに求まる
。
記号列識別チップに接続される通常RAMには記号列の
分類コードに対応すけて、各種の情報を格納することが
可能であって、それによって、種々の記号列情報処理機
能が達成される。たとえば、記号列の分類コードに対応
すけ、単語、の品詞コードや記号列の出現回数や記号列
文章に対する処理命令を格納すると、知識情報の収集や
整理が行ないやずくなる。
分類コードに対応すけて、各種の情報を格納することが
可能であって、それによって、種々の記号列情報処理機
能が達成される。たとえば、記号列の分類コードに対応
すけ、単語、の品詞コードや記号列の出現回数や記号列
文章に対する処理命令を格納すると、知識情報の収集や
整理が行ないやずくなる。
この記号列抽出装置の処理速度は、記号記憶手段210
,410に使われる半導体RAMのサイクルタイムTc
が1つの記号の処理時間にほぼ対応する。Tcを100
nsとすると、109個の記号列のテキストに対する
10’個の記号列による照合を10秒で行なえる。現状
のソフトウェアによる照合では10時時間区を必要とす
るので、本発明の記号列照合装置は著しく照合時間1を
短縮する。
,410に使われる半導体RAMのサイクルタイムTc
が1つの記号の処理時間にほぼ対応する。Tcを100
nsとすると、109個の記号列のテキストに対する
10’個の記号列による照合を10秒で行なえる。現状
のソフトウェアによる照合では10時時間区を必要とす
るので、本発明の記号列照合装置は著しく照合時間1を
短縮する。
(発明の効果)
以上に述べたように、本発明によれば、従来のマイコン
とソフトウェアの組合わせによる記号列の分類による処
理時間の大きい事と柔軟性に欠ける事の欠陥が容易に解
決する。また、本発明の記号列識別装置が1チツプのL
SIにまとまシ易い事を考えると、このようなLSI’
は文章の原文ファイルからのキーワードの抽出や言語翻
訳用の電子辞書やバタン認識システムの特徴系列の分類
において欠かすことのできない機能素子になる。
とソフトウェアの組合わせによる記号列の分類による処
理時間の大きい事と柔軟性に欠ける事の欠陥が容易に解
決する。また、本発明の記号列識別装置が1チツプのL
SIにまとまシ易い事を考えると、このようなLSI’
は文章の原文ファイルからのキーワードの抽出や言語翻
訳用の電子辞書やバタン認識システムの特徴系列の分類
において欠かすことのできない機能素子になる。
第11図は記号列照合問題の説明図、第2図は本発明に
よる第1の実施例の説明図、第3図は第1の実施例の動
作説明図、第4図は本発明による第2の実施例の説明図
である。 210 、410・・・記号記憶手段、230・・・内
部信号の伝達手段、240 、440・・・レジスタア
レイ、42o・・・テコータ、430・・・選択回路、
45o・・・アンドゲート回路。 第1図 鞘2図 第3図 ABA 8AA88ABA8BA 16 TI 72 ′r3TaTs T4 T7 Te
Tq工oT++TzTzL第4図 45ど
よる第1の実施例の説明図、第3図は第1の実施例の動
作説明図、第4図は本発明による第2の実施例の説明図
である。 210 、410・・・記号記憶手段、230・・・内
部信号の伝達手段、240 、440・・・レジスタア
レイ、42o・・・テコータ、430・・・選択回路、
45o・・・アンドゲート回路。 第1図 鞘2図 第3図 ABA 8AA88ABA8BA 16 TI 72 ′r3TaTs T4 T7 Te
Tq工oT++TzTzL第4図 45ど
Claims (2)
- (1)記号に関連ずけたビットパタンを記憶する複数組
の記号に関する記号記憶手段と、記号の入力毎に記号記
憶手段から選択的に出力されたビットにより制御される
内部信号の伝達手段と、特定の記号記憶手段の出力を内
部信号として入力とし、内部信号の伝達手段を介して連
結され、一部を記号列照合信号として出力するレジスタ
アレイとを含むことを特徴とする記号列照合装置。 - (2)記号に関連ずけたビットパタンで照合記号列を記
号記憶手段に格納させておき、記号列の照合時に記号記
憶手段のアドレス部に入力された記号で示されるアドレ
スの内容を読み取り、その読み取り情報に基づきレジス
タアレイ各段の内容の伝達を制御し、レジスタアレイの
特定段の内容により入力された記号列内の特定の記号列
を抽出することを特徴とする記号列照合装置の制御方式
。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP14892284A JPS6128130A (ja) | 1984-07-18 | 1984-07-18 | 記号列照合装置の制御方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP14892284A JPS6128130A (ja) | 1984-07-18 | 1984-07-18 | 記号列照合装置の制御方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6128130A true JPS6128130A (ja) | 1986-02-07 |
| JPH0554146B2 JPH0554146B2 (ja) | 1993-08-11 |
Family
ID=15463657
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP14892284A Granted JPS6128130A (ja) | 1984-07-18 | 1984-07-18 | 記号列照合装置の制御方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6128130A (ja) |
-
1984
- 1984-07-18 JP JP14892284A patent/JPS6128130A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0554146B2 (ja) | 1993-08-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TW310400B (ja) | ||
| US7359896B2 (en) | Information retrieving system, information retrieving method, and information retrieving program | |
| JPS6128130A (ja) | 記号列照合装置の制御方式 | |
| JP3253657B2 (ja) | 文書検索方法 | |
| JPH0215904B2 (ja) | ||
| JPS61248160A (ja) | 文書情報登録方式 | |
| JPH0256086A (ja) | 文字認識の後処理方法 | |
| JP2570784B2 (ja) | 文書リーダ後処理装置 | |
| JP2560959B2 (ja) | 文字認識後処理方式 | |
| JPS6128133A (ja) | 記号列照合装置 | |
| JPS6128132A (ja) | 記号列照合装置 | |
| KR20250006516A (ko) | 텍스트 자동 변환 시스템 및 그 방법 | |
| JP3007697B2 (ja) | 単語照合装置及び単語照合方法 | |
| JPH0298778A (ja) | 文書自動分類装置 | |
| JPH03210627A (ja) | 電子計算機 | |
| JPS595335A (ja) | 日本語入力装置 | |
| JPS60207983A (ja) | 文字認識用辞書作成方式 | |
| JPS61267824A (ja) | 日本語デ−タ整列化処理方式 | |
| JPH06309360A (ja) | 否定論理条件の処理に適したフルテキストサーチ方法 | |
| JPH06215038A (ja) | データベース検索装置 | |
| JPS6120178A (ja) | 記号列識別装置とその制御方式 | |
| EP0612017A1 (en) | A method and a computer system for storing terms in a data base | |
| JPH04188364A (ja) | 日本文固有用語抽出装置 | |
| Holstege et al. | Visual parsing: an aid to text understanding | |
| JPH0529950B2 (ja) |