JPH02302888A - 単語辞書照合装置 - Google Patents
単語辞書照合装置Info
- Publication number
- JPH02302888A JPH02302888A JP1125601A JP12560189A JPH02302888A JP H02302888 A JPH02302888 A JP H02302888A JP 1125601 A JP1125601 A JP 1125601A JP 12560189 A JP12560189 A JP 12560189A JP H02302888 A JPH02302888 A JP H02302888A
- Authority
- JP
- Japan
- Prior art keywords
- word
- keyword
- dictionary
- word dictionary
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 3
- 235000011613 Pinus brutia Nutrition 0.000 description 3
- 241000018646 Pinus brutia Species 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は単語辞書照合装置に関し、特に入力された文字
列と単語辞書に登録されている単語との照合を行い、入
力文字列を認識する単語辞書即金装置に関する。
列と単語辞書に登録されている単語との照合を行い、入
力文字列を認識する単語辞書即金装置に関する。
第3図は従来の単語辞書照合装置のブロック図である。
文字入力部31から入力された文字列は文字コード変換
部32で単語辞書35との照合に適した文字コードに変
換される。読出制御部34では単語辞書35から単語を
読出し照合部33へ転送する。照合部33では文字コー
ド変換部32から転送されてきた文字列と、読出制御部
34から転送さ五てきた文字列とを照合し、両文字列が
一致したとき、これを代表するコードを出力する。
部32で単語辞書35との照合に適した文字コードに変
換される。読出制御部34では単語辞書35から単語を
読出し照合部33へ転送する。照合部33では文字コー
ド変換部32から転送されてきた文字列と、読出制御部
34から転送さ五てきた文字列とを照合し、両文字列が
一致したとき、これを代表するコードを出力する。
上述した従来の単語辞書照合装置は、入力された文字列
を用いて単語辞書を検索しても、一致する単語が得られ
ないことがしばしばある。これは同義の単語が複数の綴
りで表現されることがあるためである。これに対処する
ため、通常、異る綴りすべてを含む単語列を単語辞書に
登録する手段がとられる。
を用いて単語辞書を検索しても、一致する単語が得られ
ないことがしばしばある。これは同義の単語が複数の綴
りで表現されることがあるためである。これに対処する
ため、通常、異る綴りすべてを含む単語列を単語辞書に
登録する手段がとられる。
しかし、異る綴りを有する単語が単語辞書に含まれる複
数の単語列の1部として存在するときには、それらの単
語列と同数の単語列を単語辞書に追加登録する必要があ
り、その結果、単語辞書の容量を増大させ、検索照合に
要する時間を増大させてしまうという問題点がある。
数の単語列の1部として存在するときには、それらの単
語列と同数の単語列を単語辞書に追加登録する必要があ
り、その結果、単語辞書の容量を増大させ、検索照合に
要する時間を増大させてしまうという問題点がある。
又、通常、単語辞書は分類して配列されている1 た
め、単語列の追加は単語辞書ファイルを際分類する必要
があり、大容量ファイルでは膨大な時間を必要とすると
いう問題点がある。
め、単語列の追加は単語辞書ファイルを際分類する必要
があり、大容量ファイルでは膨大な時間を必要とすると
いう問題点がある。
本発明の目的は、上記の問題点を解決することができる
単語辞書照合装置を提供することにある。
単語辞書照合装置を提供することにある。
本発明の単語辞書照合装置は、文字入力装置で入力され
た文字列を用いて単語辞書に登録されている単語と一致
する単語を検索する単語辞書照合装置において、 (A>複数の綴りで表現される頻度の高い単語を、文字
列と同義単語を代表するコードであるキーワードコード
として登録しているキーワード辞書1 、 (B)前記キーワード辞書と入力文字列との照合
を行い、前記キーワード辞書に登録されている単語と一
致したときには、その文字列をキーワードコードとして
出力する第1の照合手段、 (C)検索対象となる全単語列を登録し、前記キーワー
ド辞書に登録されている文字列の部分についてはキーワ
ードコードとして登録している単語辞書、 (D>前記単語辞書と前記入力文字列との照合を、文字
列の部分とキーワードコードの部分とを分離して、独立
に行う第2の照合手段、を備えて構成されている。
た文字列を用いて単語辞書に登録されている単語と一致
する単語を検索する単語辞書照合装置において、 (A>複数の綴りで表現される頻度の高い単語を、文字
列と同義単語を代表するコードであるキーワードコード
として登録しているキーワード辞書1 、 (B)前記キーワード辞書と入力文字列との照合
を行い、前記キーワード辞書に登録されている単語と一
致したときには、その文字列をキーワードコードとして
出力する第1の照合手段、 (C)検索対象となる全単語列を登録し、前記キーワー
ド辞書に登録されている文字列の部分についてはキーワ
ードコードとして登録している単語辞書、 (D>前記単語辞書と前記入力文字列との照合を、文字
列の部分とキーワードコードの部分とを分離して、独立
に行う第2の照合手段、を備えて構成されている。
次に、本発明の実施例について図面を参照して説明する
。
。
第1図は本発明の一実施例のブロック図であり、第2図
は第1図の単語辞書照合装置で入力される住所例を示す
図である。
は第1図の単語辞書照合装置で入力される住所例を示す
図である。
第1図に示す単語辞書照合装置は、文字読取機で読取っ
た文字列を入力する文字入力部l、文字入力部1から入
力された文字列をキーワード辞書7との照合に適した文
字コードに変換する文字コード変換部2、キーワード辞
書7と入力文字列との照合を行い、キーワード辞書7に
登録されている単語と一致したときには、文字列をキー
ワードコードとして出力する第1の照合手段15、第1
の照合手段15の指令にもとづいてキーワード辞書7か
らキーワード文字列とキーワードコードとを読出す読出
制御部6、複数の綴りで表現される頻度が高い単語の文
字列と、それを代表するキーワードコードを登録したキ
ーワード辞書7、単語辞書と入力文字列との照合を、文
字列の部分とキーワードコードの部分とを分離して、独
立に行う第2の照合手段16、第2の照合手段16の指
令にもとづいて単語辞書12からキーワード文字列とキ
ーワードコードとを読出す読出制御部11、検索対象と
なる全単語(住所)の単語情報が登録されていて、単語
列の文字列の中でキーワード辞書7に登録されている文
字列と一致する文字列の部分については、キーワード辞
書7のキーワードが有しているものと同じキーワードコ
ードに′変換されて登録されている単語辞書12、第2
の照合手段16の文字コード照合部での照合結果と、キ
ーワードコード照合部での照合結果とを用いて、一定の
設定基準に従って単語辞−6〜 舎内に入力文字列と一致した単語が登録されていたかど
うかの判定を行う単語照合判定部13、単語照合判定部
13からの出力を用いて宛先住所例による郵便物の仕分
けを行う区分機14から構成されている。
た文字列を入力する文字入力部l、文字入力部1から入
力された文字列をキーワード辞書7との照合に適した文
字コードに変換する文字コード変換部2、キーワード辞
書7と入力文字列との照合を行い、キーワード辞書7に
登録されている単語と一致したときには、文字列をキー
ワードコードとして出力する第1の照合手段15、第1
の照合手段15の指令にもとづいてキーワード辞書7か
らキーワード文字列とキーワードコードとを読出す読出
制御部6、複数の綴りで表現される頻度が高い単語の文
字列と、それを代表するキーワードコードを登録したキ
ーワード辞書7、単語辞書と入力文字列との照合を、文
字列の部分とキーワードコードの部分とを分離して、独
立に行う第2の照合手段16、第2の照合手段16の指
令にもとづいて単語辞書12からキーワード文字列とキ
ーワードコードとを読出す読出制御部11、検索対象と
なる全単語(住所)の単語情報が登録されていて、単語
列の文字列の中でキーワード辞書7に登録されている文
字列と一致する文字列の部分については、キーワード辞
書7のキーワードが有しているものと同じキーワードコ
ードに′変換されて登録されている単語辞書12、第2
の照合手段16の文字コード照合部での照合結果と、キ
ーワードコード照合部での照合結果とを用いて、一定の
設定基準に従って単語辞−6〜 舎内に入力文字列と一致した単語が登録されていたかど
うかの判定を行う単語照合判定部13、単語照合判定部
13からの出力を用いて宛先住所例による郵便物の仕分
けを行う区分機14から構成されている。
又、第1の照合手段15は、文字コード変換部2で変換
され出力された文字列とキーワード辞書7とから読取っ
た単語の文字列との照合を行う文字コード照合部3、文
字コード照合部3での照合で一致した単語文字列が検出
された場合に、単語をキーワードコードに変換するキー
ワードコード変換部4、キーワード辞書7からキーワー
ド文字列とキーワードコードとを読出すために、キーワ
ード辞書7の読出指令を読出制御部6に発行し、読出制
御部6からキーワードが読出されてきたときには、ここ
を経由してキーワードを文字コード照合部3へ送出し、
文字コード照合部3での照合が終了したときに、照合結
果を第2の照合手段16へ転送するキーワード照合制御
部5から1 構成されている。
され出力された文字列とキーワード辞書7とから読取っ
た単語の文字列との照合を行う文字コード照合部3、文
字コード照合部3での照合で一致した単語文字列が検出
された場合に、単語をキーワードコードに変換するキー
ワードコード変換部4、キーワード辞書7からキーワー
ド文字列とキーワードコードとを読出すために、キーワ
ード辞書7の読出指令を読出制御部6に発行し、読出制
御部6からキーワードが読出されてきたときには、ここ
を経由してキーワードを文字コード照合部3へ送出し、
文字コード照合部3での照合が終了したときに、照合結
果を第2の照合手段16へ転送するキーワード照合制御
部5から1 構成されている。
さらに、第2の照合手段16は、第1の照合手段15の
キーワード照合制御部5から送出されてきた文字列と、
単語辞書12から読出した単語情報の文字列の部分との
照合を行う文字コード照合部8、キーワード照合制御部
5から送出されてきたキーワードコードと、単語辞書1
2から読出した単語情報のキーワードコードの部分との
照合を行うキーワードコード照合部9、第1の照合手段
15の文字コード照合部3での照合結果をキーワード照
合制御部5から受信し、単語辞書12からキーワード文
字列とキーワードコードとを読出すために、読出制御部
11に対し単語辞書12の読出し指令を発行し、読出制
御部11から単語情報のキーワードコードの部分が読出
されてきたときに、文字列の部分については、文字コー
ド照合部8へ送出し、キーワードコードの部分について
はキーワードコード照合部9へ送出する単語照合制御部
10から構成されている。
キーワード照合制御部5から送出されてきた文字列と、
単語辞書12から読出した単語情報の文字列の部分との
照合を行う文字コード照合部8、キーワード照合制御部
5から送出されてきたキーワードコードと、単語辞書1
2から読出した単語情報のキーワードコードの部分との
照合を行うキーワードコード照合部9、第1の照合手段
15の文字コード照合部3での照合結果をキーワード照
合制御部5から受信し、単語辞書12からキーワード文
字列とキーワードコードとを読出すために、読出制御部
11に対し単語辞書12の読出し指令を発行し、読出制
御部11から単語情報のキーワードコードの部分が読出
されてきたときに、文字列の部分については、文字コー
ド照合部8へ送出し、キーワードコードの部分について
はキーワードコード照合部9へ送出する単語照合制御部
10から構成されている。
次に、動作を説明する。
まず、複数の綴りで表現される頻度の高い単語を登録し
た、キーワード辞書とキーワードコードとを含む単語辞
書があらかじめ作成されているものとする。例えば、r
Avenue」という単語に対し、rAvenue」と
いう文字コードと、同義の単語としてr A v e
Jとr A v 」とを文字コードで登録し、rAve
nue」のキーワードコードとして「01」がキーワー
ド辞書に登録されているものとする。又、単語辞書には
、rPine Avenue」という単語がrPin
e」という文字コードと、「ol」というAvenue
のキーワードコードとして登録されているものとする。
た、キーワード辞書とキーワードコードとを含む単語辞
書があらかじめ作成されているものとする。例えば、r
Avenue」という単語に対し、rAvenue」と
いう文字コードと、同義の単語としてr A v e
Jとr A v 」とを文字コードで登録し、rAve
nue」のキーワードコードとして「01」がキーワー
ド辞書に登録されているものとする。又、単語辞書には
、rPine Avenue」という単語がrPin
e」という文字コードと、「ol」というAvenue
のキーワードコードとして登録されているものとする。
いま、第2図の(1)の住所名’PineA v e
n u e Jが文字入力部lから入力されると文字コ
ード変換部2でキーワード辞書7との照合に適したコー
ドに変換される。文字コード照合部3ではこの文字コー
ドの単語と単語を組合わせた単語列とを、キーワード辞
書7から読出した単語列との間で照合する。実施例の住
所では、次の単語及び単語列がキーワード辞書7の単語
と照合される。
n u e Jが文字入力部lから入力されると文字コ
ード変換部2でキーワード辞書7との照合に適したコー
ドに変換される。文字コード照合部3ではこの文字コー
ドの単語と単語を組合わせた単語列とを、キーワード辞
書7から読出した単語列との間で照合する。実施例の住
所では、次の単語及び単語列がキーワード辞書7の単語
と照合される。
■ Pine
■ Avenue
■ Pine Avenue
キーワード辞書7にはrAvenue」。
rAve」、rAv」が登録されているので、上記■〜
■の単語との照合結果として、■とrAvenue」と
の一致が確認される。そして、キーワードコード変換部
4は一致が確認された単語’ A V e n u e
Jをキーワードコード「01」に変換する。
■の単語との照合結果として、■とrAvenue」と
の一致が確認される。そして、キーワードコード変換部
4は一致が確認された単語’ A V e n u e
Jをキーワードコード「01」に変換する。
キーワード照合制御部5では、文字列
rPine」とキーワードコード「01」を単語照合制
御部10へ転送する。単語照合制御部10では文字列r
Pine」は文字コード照合部8へ、キーワードコード
「01」はキーワードコード照合部9へ転送し、かつ単
語辞書12から住所名を読出し、住所名の文字コードの
部分は文字コード照合部8へ、キーワードコードの部分
はキーワードコード照合部9へ転送し、文字コード照合
部8とキーワードコード照合部9に対して照合を実行さ
せる指令を出す。文字コード照合部8ではrPine」
と単語辞書から読出した文字コードとの照合を行い、文
字コードとしてrPi”nejを含む単語が読出されと
き一致が検出される。キーワードコード照合部9は、文
字コード照合部8で文字コードの一致が検出されたとき
に、キーワードコードの照合が行われ、同義の単語の一
致が確認される。ここでは、文字列がr P ’i n
e Jでキーワードコードが「01Jである単語が単
語辞書12から読出されたとき、キーワードコード照合
部9でキーワードコード「01」の一致が確認される。
御部10へ転送する。単語照合制御部10では文字列r
Pine」は文字コード照合部8へ、キーワードコード
「01」はキーワードコード照合部9へ転送し、かつ単
語辞書12から住所名を読出し、住所名の文字コードの
部分は文字コード照合部8へ、キーワードコードの部分
はキーワードコード照合部9へ転送し、文字コード照合
部8とキーワードコード照合部9に対して照合を実行さ
せる指令を出す。文字コード照合部8ではrPine」
と単語辞書から読出した文字コードとの照合を行い、文
字コードとしてrPi”nejを含む単語が読出されと
き一致が検出される。キーワードコード照合部9は、文
字コード照合部8で文字コードの一致が検出されたとき
に、キーワードコードの照合が行われ、同義の単語の一
致が確認される。ここでは、文字列がr P ’i n
e Jでキーワードコードが「01Jである単語が単
語辞書12から読出されたとき、キーワードコード照合
部9でキーワードコード「01」の一致が確認される。
上記の動作説明は住所例が第2図の(1)の場合につい
て説明したが、住所例が第2図の(2)。
て説明したが、住所例が第2図の(2)。
(3)の場合についても同じ動作をし、入力文字列と単
語辞書の単語文字列との一致が確認される。
語辞書の単語文字列との一致が確認される。
以上説明したように、本発明は、複数の綴りで表現され
る単語を含む入力文字列と単語辞書との照合を可能にし
、単語辞書に登録されている単語と同義で異る綴りの単
語を照合対象単語として追加するときに、キーワード辞
書へのキーワードの追加のみで対応可能とすることによ
り、同義単語を重複して単語辞書に登録する必要がなく
、単語辞書の容量及び検索照合に要する時間を大幅に節
約することができるという効果を有する。
る単語を含む入力文字列と単語辞書との照合を可能にし
、単語辞書に登録されている単語と同義で異る綴りの単
語を照合対象単語として追加するときに、キーワード辞
書へのキーワードの追加のみで対応可能とすることによ
り、同義単語を重複して単語辞書に登録する必要がなく
、単語辞書の容量及び検索照合に要する時間を大幅に節
約することができるという効果を有する。
図面の簡単な説明
第1図は本発明の一実施例のブロック図、第2図は第1
図の単語辞書照合装置で入力される住所例を示す図、第
3図は従来の単語辞書照合装置のブロック図である。
図の単語辞書照合装置で入力される住所例を示す図、第
3図は従来の単語辞書照合装置のブロック図である。
1・・・文字入力部、2・・文字コード変換部、3・・
・文字コード照合部、4・・・キーワードコード変換部
、5・・・キーワード照合制御部、6・・・読出制御部
、7・・・キーワード辞書、8・・・文字コード照合部
、9・・・キーワードコード照合部、10・・・単語照
合制御部、11・・・読出制御部、12・・・単語辞書
、13・・・単語照合判定部、14・・・区分機。
・文字コード照合部、4・・・キーワードコード変換部
、5・・・キーワード照合制御部、6・・・読出制御部
、7・・・キーワード辞書、8・・・文字コード照合部
、9・・・キーワードコード照合部、10・・・単語照
合制御部、11・・・読出制御部、12・・・単語辞書
、13・・・単語照合判定部、14・・・区分機。
(1) Pi′na Avertuc(2) P
lnct Avc C”5) Pi71A Av 第 2 ロ 第 5 邑
lnct Avc C”5) Pi71A Av 第 2 ロ 第 5 邑
Claims (1)
- 【特許請求の範囲】 文字入力装置で入力された文字列を用いて単語辞書に登
録されている単語と一致する単語を検索する単語辞書照
合装置において、 (A)複数の綴りで表現される頻度の高い単語を、文字
列と同義単語を代表するコードであるキーワードコード
として登録しているキーワード辞書、 (B)前記キーワード辞書と入力文字列との照合を行い
、前記キーワード辞書に登録されている単語と一致した
ときには、その文字列をキーワードコードとして出力す
る第1の照合手段、 (C)検索対象となる全単語列を登録し、前記キーワー
ド辞書に登録されている文字列の部分についてはキーワ
ードコードとして登録している単語辞書、 (D)前記単語辞書と前記入力文字列との照合を、文字
列の部分とキーワードコードの部分とを分離して、独立
に行う第2の照合手段、 を備えたことを特徴とする単語辞書照合装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1125601A JPH02302888A (ja) | 1989-05-18 | 1989-05-18 | 単語辞書照合装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1125601A JPH02302888A (ja) | 1989-05-18 | 1989-05-18 | 単語辞書照合装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02302888A true JPH02302888A (ja) | 1990-12-14 |
Family
ID=14914174
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1125601A Pending JPH02302888A (ja) | 1989-05-18 | 1989-05-18 | 単語辞書照合装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02302888A (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60207983A (ja) * | 1984-03-31 | 1985-10-19 | Toshiba Corp | 文字認識用辞書作成方式 |
| JPS60233782A (ja) * | 1984-05-07 | 1985-11-20 | Nec Corp | 住所読取装置 |
| JPS6286475A (ja) * | 1985-10-14 | 1987-04-20 | Hitachi Ltd | パターン認識装置 |
-
1989
- 1989-05-18 JP JP1125601A patent/JPH02302888A/ja active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60207983A (ja) * | 1984-03-31 | 1985-10-19 | Toshiba Corp | 文字認識用辞書作成方式 |
| JPS60233782A (ja) * | 1984-05-07 | 1985-11-20 | Nec Corp | 住所読取装置 |
| JPS6286475A (ja) * | 1985-10-14 | 1987-04-20 | Hitachi Ltd | パターン認識装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5745745A (en) | Text search method and apparatus for structured documents | |
| US5590317A (en) | Document information compression and retrieval system and document information registration and retrieval method | |
| US7269547B2 (en) | Tokenizer for a natural language processing system | |
| JPH09288676A (ja) | 全文インデックス作成装置および全文データベース検索装置 | |
| KR102338949B1 (ko) | 기술문서 번역 지원 시스템 | |
| JPH05324730A (ja) | 文書情報検索装置 | |
| JP4185399B2 (ja) | 顧客データ管理装置、顧客データ管理方法および顧客データ管理用プログラムならびに顧客データ管理用プログラムを格納した記録媒体 | |
| CN110928550A (zh) | 基于关键词Trie树消除GCC抽象语法树冗余的方法 | |
| JPH02302888A (ja) | 単語辞書照合装置 | |
| KR20040098862A (ko) | 색인 및 형태소 분석에 이용되는 특정문서 고유사전의 작성방법 및 작성을 위한 장치 | |
| JP3253657B2 (ja) | 文書検索方法 | |
| KR101793185B1 (ko) | 환자 개인정보 식별 방법 | |
| JPH09297766A (ja) | 類似文書検索装置 | |
| JP2535629B2 (ja) | 検索システムの入力文字列正規化方式 | |
| JPH0441388B2 (ja) | ||
| JP2874199B2 (ja) | 単語辞書照合装置 | |
| JP2585951B2 (ja) | コードデータ検索装置 | |
| JP2588261B2 (ja) | Ocrによる住所データベース検索装置 | |
| JP2813207B2 (ja) | 音声認識装置 | |
| JP2921119B2 (ja) | 数値検索装置および数値検索方法 | |
| JP3057090B2 (ja) | ソフトウェア部品検索方法およびソフトウェア部品検索装置 | |
| JPH0646423B2 (ja) | 単語辞書照合装置 | |
| JPH0795337B2 (ja) | 単語認識方式 | |
| JPH03164834A (ja) | プログラミング言語間相互変換方式 | |
| JP3722231B2 (ja) | コンパクトにエンコードされて記憶されたストリングの組を有する製品 |