JPH02297193A - 辞書引き装置 - Google Patents

辞書引き装置

Info

Publication number
JPH02297193A
JPH02297193A JP1042380A JP4238089A JPH02297193A JP H02297193 A JPH02297193 A JP H02297193A JP 1042380 A JP1042380 A JP 1042380A JP 4238089 A JP4238089 A JP 4238089A JP H02297193 A JPH02297193 A JP H02297193A
Authority
JP
Japan
Prior art keywords
dictionary
information
superposition
storage device
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1042380A
Other languages
English (en)
Inventor
Yasushi Tamakoshi
玉越 靖司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1042380A priority Critical patent/JPH02297193A/ja
Publication of JPH02297193A publication Critical patent/JPH02297193A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、自然言語による文章または文を機械によって
解析しまたは生成する際に利用される辞書引き装置に関
するものである。
従来の技術 自然言語による文章や文を機械によって処理する自然言
語処理装置において、予め蓄えておいた必要な語彙情報
を適宜参照して所定の語重情報を抽出する辞書引きが行
われる。
従来、辞書引き装置としては、B木などの転置ファイル
によるファイル管理手法を応用することによって、1個
以上のキーワードのそれぞれについて検索を行い、その
結果を統合し、あるいは順次キーワードによって結果を
絞シ込むことにより得たものを検索結果として表示する
ものがあった。
発明が解決しようとする課題 従来のB木などの転置ファイルによるファイル管理手法
を応用した辞書引き装置では、自然言語処理装置におい
て要求される1個以上のキーワードによる辞書の検索を
行う場合、1個以上のキーワードのそれぞれについて検
索を行い、その結果を統合し、あるいは順次キーワード
によって結果を絞υ込むことにより得たものを検索結果
とするので、辞書引き装置における転置ファイルのため
の記憶領域が大きく、辞書内容の変更に伴う転置ファイ
ルの変更の手間が大きく、辞書引き装置を実装する電子
計算機の環境に応じて転置ファイルのための記憶領域の
大きさを柔軟に設計することが困難であった。
本発明は上記課題を解決するもので、記憶領域が小さく
、辞書内容の変更の容易な辞書引き装置を提供すること
を目的とするものである。
課題を解決するだめの手段 上記課題を解決するだめの本発明の技術的手段は、自然
言語の始業情報を蓄積した辞書情報蓄積装置と、辞書情
報蓄積装置の語粟情報の重ね合せ符号を蓄積する重ね合
せ符号蓄積装置と、辞書引きのための質問情報の重ね合
せ符号によシ重ね合せ符号蓄積装置の重ね合せ符号を検
索する検索装置と、検索結果と辞書情報蓄積装置の始業
情報とを照合する照合装置とを具備したものである。
作用 上記構成の作用は次のようになる。辞書情報蓄積装置に
蓄積された始業情報が持つ1個以上のキーワードは・・
ツシュ関数を用いて符号化され、その重ね合せ符号が作
成されて重ね合せ符号蓄積装置に蓄積される。一方辞書
引きのための質問情報も同様にして重ね合せ符号化され
る。この質問情報の重ね合せ符号により重ね合せ符号蓄
積装置に蓄積されているデータを検索装置で照合し、質
問情報に対する正しい検索結果の候補であるドロップと
呼ばれる検索結果を得る。検索装置による検索結果であ
るドロップは質問に対する正しい検索結果の始業情報の
集合を必ず含んでいるが、7オルスドロツプと呼ばれる
誤って検索された始業情報も含む場合がある。照合装置
では、ドロップからフォルスドロップを除去するために
、ドロップが示す辞書情報蓄積装置中の始業情報と質問
とを照合する。そしてその結果正しい検索結果を出力装
置によシ表示する。
実施例 以下、図面にもとづいて、本発明についてさらに詳しく
説明する。
第1図には、本発明一実施例の辞書引き装置の概念図を
示す。あらかじめ辞書情報蓄積装置1に蓄えられた自然
言語の詔書情報を、重ね合せ符号作成装置2によって、
辞書重ね合せ符号として重ね合せ符号蓄積装置3に蓄え
ておき、入力装置4に与えられた質問を質問処理装置5
により分解し、重ね合せ符号作成装置2で質問重ね合せ
符号を作成し、この質問重ね合せ符号と辞書重ね合せ符
号を検索装置6で照合し、その検索結果が表わす始業情
報と質問を照合装置7で照合することによって、質問に
対する正しい辞書引き結果である始業情報を出力装置8
により表示する。
第2図は、重ね合せ符号作成装置2の構成を示す。辞書
情報蓄積装置1からの自然言語の始業情報は重ね合せ符
号作成装置2のbcw作成装置21に与えられる。始業
情報Rは1つ以上の数Ri個のキーワードを有している
。たとえば語粟「日本」はキーワードとして「日本」、
「固有名詞」の2つのキーワードを有している。bcw
作成装置21では、入力される1個以上のキーワード1
つ1つに対し、bビットのうち幾つかのビットに“l”
を立て、残りは“0”とするようなノ・ノシュ関数を用
いてbcW(バイナリ コードワード)と呼ぶ長さbの
ビット列を作る。図示の例ではキーワード「日本jとし
て01010100.キーワード「固有名詞」として0
0011010の8ビツトのビット列が作られる。bc
w重ね合せ装置nではこれらRi本のbcwをビット毎
に論理和をとった長さbのビット列5(Ri)を始業情
報Riの辞書重ね合せ符号として作成する。図示の例で
は始業「日本」に対して辞書重ね合せ符号010111
10が作成される。この操作が辞書情報蓄積装置1のす
べての始業情報について行われ、それぞれの始業に対し
て辞書重ね合せ符号が作成される。こうして作成された
F本の辞書重ね合せ符号を第3図で説明するようにb本
の長さFのビット列として重ね合せ符号蓄積装置3に格
納する。ここで、Fは辞書情報蓄積装置1中の詔書情報
の個数である。なお、bをきめることにより重ね合せ符
号のサイズは自由に設計できる。
第3図は重ね合せ符号作成装置2で作成されたF本の辞
書重ね合せ符号を重ね合せ符号蓄積装置3に蓄積する様
子を示す。前述したように、重ね合せ符号作成装置2で
は、辞書情報蓄積装置1に蓄積されているF個の語粟に
ついて重ね合せ符号を作成する。第3図に図示した例で
は、■「日本」、■「アメリカ」、■「イギリス」の3
つの始業に対してそハぞれ01011110.1101
1010.11011110の3本の重ね合せ符号が作
成された例を示している。これらF本の重ね合せ符号は
、重ね合せ符号蓄積装置3に蓄積される際には縦横を変
換したビット列として蓄積される。すなわち、第3図に
示したように、bcw重ね合せ装置nよシの形で出力さ
れた重ね合せ符号は、重ね合せ符号蓄積装置3では、そ
の縦横が変換されての形で蓄積される。このように、重
ね合せ符号作成装置2で作成されたF本、bビット列の
重ね合せ符号は、重ね合せ符号蓄積装置3ではb本、F
ビット列、すなわちb行F列の重ね合せ信号として蓄積
される。この場合詔書■、■、■は縦の列情報として蓄
積されることになる。
一方、入力装置4より与えられた質問も同様に重ね合せ
符号化される。この様子を第4図により説明する。いま
、入力装置4に「固有名詞の日本を辞書引きせよ。」と
いう指令が入力された場合を考える。
入力装置4から得た質問を質問処理装置5で1個以上の
キーワードに分解する。上記指令の場合には「固有名詞
」、「日本」の2つのキーワードに分解される。これら
のキーワードについて、辞書重ね合せ符号の作成・蓄積
の場合と同じ/・ソシュ関数を用いる重ね合せ符号作成
装置2を用いて、すなわちbcw作成装置21を用いて
bcwとして、「固有名詞;0OOIIOIOJ、「日
本; 01010100Jか作成され、つぎに、bcw
重ね合せ装置二により質問重ね合せ符号rQ;0IOI
IIIOJが作成される。こうして質問が重ね合せ符号
化される。
この質問重ね合せ符号Qは検索装置6に供給される。検
索装置6では、質問重ね合せ符号と重ね合せ符号蓄積装
置中のデータを照合して、ドロップと呼ばれる検索結果
を求める。すなわち、質問重ね合せ符号で“1″が立っ
ているビット位置i(図示の例では位置” t’%  
0% dX e)に対応する重ね合せ符号蓄積装置3に
おける蓄積データの1行めのビット列に対して、ビット
毎の論理積をとることによってドロップが簡単に求めら
れる。
この論理積の結果であるビット列において“1”が立っ
ているビットjに対応する詔書情報が検索装置6におけ
る検索結果である。図示の例では始業■、■が検索結果
として得られる。検索装置6による検索結果であるドロ
ップは質問に対する正しい検索結果の詔書情報を必ず含
んでいるが、フォルスドロップと呼ばれる誤って検索さ
れた詔書情報も含む場合があるので、照合装置7により
、ドロップからフォルスドロップを除去する。この操作
を第5図によシ説明する。照合装置7は、検索装置6か
ら受けた検索結果、すなわち、ドロップにおいて“1”
が立りているビットが示す辞書情報蓄積装置1中の詔書
情報、図示の例では0日本と■イギリスの2つの語紮情
報を質問Qと照合し、一致したもの、図示の例では0日
本を正しい検索結果として出力装置8に出力表示する。
発明の効果 以上のように、本発明は辞書情報蓄積装置の詔書情報を
重ね合せ符号化して重ね合せ符号蓄積装置に蓄積し、重
ね合せ符号蓄積装置に蓄えられた辞書情報蓄積装置の内
容を表わす辞書重ね合せ符号と質問処理装置によりキー
ワードを変換した質問重ね合せ符号との部分照合検索を
行い、その検索結果が表わす辞書情報とキーワードとの
照合を行うようにしたもので、重ね合せ符号蓄積装置中
のデータは、従来の方式による辞書引き装置における転
置ファイルに比べてはるかに小さく、メンテナンスも容
易である。さらに、重ね合せ符号蓄積装置中のデータの
サイズを自由に変更することができるため、各種の電子
計算機上の自然言語処理装置に対して辞書引き機能を提
供することができる。
また、重ね合せ符号による処理を行っているので、辞書
情報蓄積装置の始業数にほとんど無関係に高速にドロッ
プの検索が可能である。
【図面の簡単な説明】
第1図は本発明の一実施例における辞書引き装置の概念
を示すブロック図、第2図は第1図の構成における重ね
合せ符号作成部の概念を示すブロック図、第3図は第1
図の構成における重ね合せ符号蓄積部分の概念を示すブ
ロック図、第4図は第1図の構成における検索部の概念
を示すブロック図、第5図は第1図の構成における照合
部の概念を示すブロック図である。 l・・・辞書情報蓄積装置、2・・・重ね合せ符号作成
装置、3・・・重ね合せ符号蓄積装置、4・・・入力装
置、5・・・質問処理装置、6・・・検索装置、7・・
・照合装置、8・・・出力装置、21・・・bcw作成
装置、n・・・bcw重ね合せ装置。 代理人の氏名 弁理士 粟野重孝 ほか1名り 郊2図 i〒 O し= 第 図

Claims (2)

    【特許請求の範囲】
  1. (1)自然言語の語彙情報を蓄積した辞書情報蓄積装置
    と、辞書引きのための質問を入力する入力装置と、前記
    語彙情報および質問の各々について、各キーワードを符
    号化後重ね合せ符号に変換する重ね合せ符号作成装置と
    、語彙情報の重ね合せ符号と質問の重ね合せ符号との部
    分照合を行う検索装置と、前記検索装置の検索結果に対
    応する語彙情報と質問のキーワードを照合する照合装置
    とを具備したことを特徴とする辞書引き装置。
  2. (2)語彙情報の重ね合せ符号を縦横変換して蓄積する
    重ね合せ符号蓄積装置を備え、この重ね合せ符号蓄積装
    置に蓄積された重ね合せ符号を質問の重ね合せ符号で部
    分照合する請求項1記載の辞書引き装置。
JP1042380A 1989-02-22 1989-02-22 辞書引き装置 Pending JPH02297193A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1042380A JPH02297193A (ja) 1989-02-22 1989-02-22 辞書引き装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1042380A JPH02297193A (ja) 1989-02-22 1989-02-22 辞書引き装置

Publications (1)

Publication Number Publication Date
JPH02297193A true JPH02297193A (ja) 1990-12-07

Family

ID=12634452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1042380A Pending JPH02297193A (ja) 1989-02-22 1989-02-22 辞書引き装置

Country Status (1)

Country Link
JP (1) JPH02297193A (ja)

Similar Documents

Publication Publication Date Title
US6493713B1 (en) Dictionary and index creating system and document retrieval system
KR100734741B1 (ko) 단어 인식 방법 및 시스템 및 컴퓨터 프로그램 메모리저장 디바이스
JP4502114B2 (ja) データベース検索装置
KR100288144B1 (ko) 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법
JPH02297193A (ja) 辞書引き装置
EP1072986A2 (en) System and method for extracting data from semi-structured text
Baruah et al. Design and development of soundex for assamese language
JPH0869474A (ja) 類似文字列検索装置
KR102550868B1 (ko) 교원 업적 검증 시스템
JPS63136224A (ja) キ−ワ−ド自動抽出装置
JPS58123126A (ja) 辞書検索装置
JP3048793B2 (ja) 文字変換装置
JPH01266670A (ja) 日本語対象文固有用語抽出処理装置
JPH10307839A (ja) テキスト検索装置及び方法
Segert et al. A Computer Program for Analysis of Words According to Their Meaning (Conceptual analysis of Latin equivalents for the comparative dictionary of Semitic languages)
JPH0236475A (ja) 文字列検索装置
JPH09101951A (ja) 文書検索装置
JPH06309360A (ja) 否定論理条件の処理に適したフルテキストサーチ方法
JP2839515B2 (ja) 文字読取システム
JPH0298778A (ja) 文書自動分類装置
JPH0916575A (ja) 発音辞書装置
JPS62160534A (ja) 文字列照合方式
JPS63138479A (ja) 文字認識装置
JPH01199263A (ja) キーワード抽出装置
JPH03127254A (ja) 単語検索装置