JPH0528132A - 単語辞書照合装置 - Google Patents
単語辞書照合装置Info
- Publication number
- JPH0528132A JPH0528132A JP3181444A JP18144491A JPH0528132A JP H0528132 A JPH0528132 A JP H0528132A JP 3181444 A JP3181444 A JP 3181444A JP 18144491 A JP18144491 A JP 18144491A JP H0528132 A JPH0528132 A JP H0528132A
- Authority
- JP
- Japan
- Prior art keywords
- word
- input
- character
- character string
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 208000027697 autoimmune lymphoproliferative syndrome due to CTLA4 haploinsuffiency Diseases 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】単語の特徴に対応した最適の単語検索を可能と
する。 【構成】単語辞書6に登録される単語レコード内に検索
条件を記憶させるフィールドを設ける。この検索条件フ
ィールドには単語固有の検索条件を記憶させる。単語照
合部4では、文字入力部2から入力された文字列と単語
辞書6から読み出した文字列との照合を行ない、その結
果を検索条件照合部7へ出力する。検索条件照合部7で
は、単語照合結果が単語固有の検索条件を満足するか否
かの照合を行ない、条件を満足した単語照合結果のみが
単語判定部8へ出力される。単語判定部8では入力され
た単語照合結果の中から入力文字列と最大一致する単語
を表示するコードを出力する。
する。 【構成】単語辞書6に登録される単語レコード内に検索
条件を記憶させるフィールドを設ける。この検索条件フ
ィールドには単語固有の検索条件を記憶させる。単語照
合部4では、文字入力部2から入力された文字列と単語
辞書6から読み出した文字列との照合を行ない、その結
果を検索条件照合部7へ出力する。検索条件照合部7で
は、単語照合結果が単語固有の検索条件を満足するか否
かの照合を行ない、条件を満足した単語照合結果のみが
単語判定部8へ出力される。単語判定部8では入力され
た単語照合結果の中から入力文字列と最大一致する単語
を表示するコードを出力する。
Description
【0001】
【産業上の利用分野】本発明は、文字入力装置から入力
された文字列と単語辞書に登録されている単語とを照合
して入力文字列を認識する単語辞書照合装置に関する。
された文字列と単語辞書に登録されている単語とを照合
して入力文字列を認識する単語辞書照合装置に関する。
【0002】
【従来の技術】図2は従来の単語辞書照合装置を示すブ
ロック図である。文字入力部2から入力された文字列デ
ータは、文字コード変換部3で単語辞書25からの読み
出しコードとの照合に適合する文字コードに変換され
る。読出制御部24は、単語辞書25から単語を読み出
し、単語照合部23へ転送する。単語照合部23では、
文字コード変換部22から転送されてきた文字列コード
と読出し制御部24から転送されてきた文字列コードと
を照合し、照合結果を単語判定部26へ転送する。単語
判定部26では、単語照合部23での照合結果に応じ
て、入力文字列と最大一致する単語を出力する。
ロック図である。文字入力部2から入力された文字列デ
ータは、文字コード変換部3で単語辞書25からの読み
出しコードとの照合に適合する文字コードに変換され
る。読出制御部24は、単語辞書25から単語を読み出
し、単語照合部23へ転送する。単語照合部23では、
文字コード変換部22から転送されてきた文字列コード
と読出し制御部24から転送されてきた文字列コードと
を照合し、照合結果を単語判定部26へ転送する。単語
判定部26では、単語照合部23での照合結果に応じ
て、入力文字列と最大一致する単語を出力する。
【0003】
【発明が解決しようとする課題】上述した従来の単語辞
書照合装置では、単語辞書25内の全ての単語レコード
が同等の条件で検索されるので、単語の特徴に応じた固
有の検索処理をその特徴を有する単語レコードに限定し
て実行させることができないという欠点がある。例え
ば、特定の単語について検索の精度を上げたい場合に、
その単語の照合条件を他の単語と異ならせて検索を実行
させるという処理ができない。
書照合装置では、単語辞書25内の全ての単語レコード
が同等の条件で検索されるので、単語の特徴に応じた固
有の検索処理をその特徴を有する単語レコードに限定し
て実行させることができないという欠点がある。例え
ば、特定の単語について検索の精度を上げたい場合に、
その単語の照合条件を他の単語と異ならせて検索を実行
させるという処理ができない。
【0004】
【課題を解決するための手段】本発明の装置は、文字入
力手段から入力された文字列に応じて登録されている単
語のうちから前記入力文字列と最大一致する単語を検索
照合する単語辞書照合装置において、前記単語辞書に登
録される単語レコード内に該単語固有の検索条件を付与
したフィールドを設けて該単語と共に該検索条件を予め
記憶させた単語辞書と、該単語辞書および前記文字入力
手段から入力された文字列を照合し単語照合結果と単語
レコード内の前記検索条件とに応じて該検索条件を満足
した単語レコードに対応する照合結果のみを出力する単
語判定手段とを備えている。
力手段から入力された文字列に応じて登録されている単
語のうちから前記入力文字列と最大一致する単語を検索
照合する単語辞書照合装置において、前記単語辞書に登
録される単語レコード内に該単語固有の検索条件を付与
したフィールドを設けて該単語と共に該検索条件を予め
記憶させた単語辞書と、該単語辞書および前記文字入力
手段から入力された文字列を照合し単語照合結果と単語
レコード内の前記検索条件とに応じて該検索条件を満足
した単語レコードに対応する照合結果のみを出力する単
語判定手段とを備えている。
【0005】
【実施例】以下、本発明について図面を参照して説明す
る。
る。
【0006】図1は本発明の一実施例を示すブロック図
である。本実施例は、郵便物上に記載された住所表記の
内の地域名を検出し、その地域名によって郵便物を仕分
けするものである。
である。本実施例は、郵便物上に記載された住所表記の
内の地域名を検出し、その地域名によって郵便物を仕分
けするものである。
【0007】文字入力部2には、郵便物上に記載された
文字を文字読取装置1で読み取ったデータを与えられ
る。文字コード変換部3は、文字入力部2から入力され
た文字列データを単語辞書6からの読み出しコードとの
照合に適合する文字コードに変換する。読出制御部5
は、単語照合部4からの指令に応じて、単語辞書6から
単語レコードを読み出す。単語辞書6は、予め多数の地
域名を記憶させてある辞書であり、特定の単語レコード
の検索条件フィールドには、文字列の照合が完全に一致
しなければならないという検索条件が記憶されている。
単語照合部4は、文字コード変換部3より入力された文
字列コードと、読出制御部5を経由して単語辞書6から
読み出した地域名の文字列コードとを照合する。照合方
式としては、「DPマッチング方式」が用いられ、入力
文字列の誤り,欠け,混入に対しても対処可能である。
単語照合部4は、予め定められた類似度以上の照合結果
を有する単語レコード情報のみを検索条件照合部7へ出
力する。検索条件照合部7は、単語照合部4から出力さ
れた照合結果の地域名が単語レコードに検索条件を付与
された地域名に該当する時には、文字列の照合が完全に
一致したかどうかを判断し、不一致の場合には、その単
語レコードの照合結果の情報の単語判定部8への出力を
禁止する。また検索条件が一致した場合、及び検索条件
が付与されていない地域名の単語レコードの場合には、
その単語レコードの照合結果の情報を単語判定部8へ出
力する。
文字を文字読取装置1で読み取ったデータを与えられ
る。文字コード変換部3は、文字入力部2から入力され
た文字列データを単語辞書6からの読み出しコードとの
照合に適合する文字コードに変換する。読出制御部5
は、単語照合部4からの指令に応じて、単語辞書6から
単語レコードを読み出す。単語辞書6は、予め多数の地
域名を記憶させてある辞書であり、特定の単語レコード
の検索条件フィールドには、文字列の照合が完全に一致
しなければならないという検索条件が記憶されている。
単語照合部4は、文字コード変換部3より入力された文
字列コードと、読出制御部5を経由して単語辞書6から
読み出した地域名の文字列コードとを照合する。照合方
式としては、「DPマッチング方式」が用いられ、入力
文字列の誤り,欠け,混入に対しても対処可能である。
単語照合部4は、予め定められた類似度以上の照合結果
を有する単語レコード情報のみを検索条件照合部7へ出
力する。検索条件照合部7は、単語照合部4から出力さ
れた照合結果の地域名が単語レコードに検索条件を付与
された地域名に該当する時には、文字列の照合が完全に
一致したかどうかを判断し、不一致の場合には、その単
語レコードの照合結果の情報の単語判定部8への出力を
禁止する。また検索条件が一致した場合、及び検索条件
が付与されていない地域名の単語レコードの場合には、
その単語レコードの照合結果の情報を単語判定部8へ出
力する。
【0008】単語判定部8では、検索条件照合部7から
入力された照合結果の中から、文字読取装置1から入力
された文字列と、最大一致する地域名を表示するコード
を出力する。区分機9では、単語判定部8から入力され
た地域名コードによって郵便物を仕分けする。
入力された照合結果の中から、文字読取装置1から入力
された文字列と、最大一致する地域名を表示するコード
を出力する。区分機9では、単語判定部8から入力され
た地域名コードによって郵便物を仕分けする。
【0009】次に本実施例の動作を具体例によって説明
する。単語辞書6には、多数の地域名が登録されている
が、その中に「Chai Wan」、「Causewa
yBay」、「Yuen Long」、「Yuen K
ong」等が含まれているものとする。
する。単語辞書6には、多数の地域名が登録されている
が、その中に「Chai Wan」、「Causewa
yBay」、「Yuen Long」、「Yuen K
ong」等が含まれているものとする。
【0010】地域名「Chai Wan」は、人名「C
han Wan」、「Chan Won」等と類似した
文字列であり、しかもこれらの中国人名は出現頻度が高
い。もし、郵便物上で地域名記載領域でなく宛名記載領
域が文字読取装置1によって走査され、その結果文字入
力部2へ「Chan Wan」、「Chan Won」
等の文字列が入力された場合、従来の単語辞書照合装置
では、これらの入力文字列は地域名「Chai Wa
n」であると誤判定されてしまう。
han Wan」、「Chan Won」等と類似した
文字列であり、しかもこれらの中国人名は出現頻度が高
い。もし、郵便物上で地域名記載領域でなく宛名記載領
域が文字読取装置1によって走査され、その結果文字入
力部2へ「Chan Wan」、「Chan Won」
等の文字列が入力された場合、従来の単語辞書照合装置
では、これらの入力文字列は地域名「Chai Wa
n」であると誤判定されてしまう。
【0011】本実施例では、地域名「Chai Wa
n」のように、完全には一致しないが類似しておりしか
も出現頻度の高い人名がある地域名については、その単
語レコードの検索条件フィールドに、文字列の照合で完
全に一致しなければならないという条件を記憶させ、そ
れ以外の地域名の単語レコードの検索条件フィールドに
は、特定の検索条件を記憶させない。
n」のように、完全には一致しないが類似しておりしか
も出現頻度の高い人名がある地域名については、その単
語レコードの検索条件フィールドに、文字列の照合で完
全に一致しなければならないという条件を記憶させ、そ
れ以外の地域名の単語レコードの検索条件フィールドに
は、特定の検索条件を記憶させない。
【0012】(1)いま例えば、文字列「Yuan L
ong」が文字入力部2から入力されると、単語照合部
4では、入力文字列「Yuan Long」と、読取制
御部5を経由して単語辞書から読み出された地域名の文
字列とが、「DPマッチング方式」によって照合され
る。本実施例の場合、「Yuen Kong」、「Yu
en Long」が予め定られた値以上の類似度を有す
る地域名として、その照合結果の情報が検索条件照合部
7へ転送される。
ong」が文字入力部2から入力されると、単語照合部
4では、入力文字列「Yuan Long」と、読取制
御部5を経由して単語辞書から読み出された地域名の文
字列とが、「DPマッチング方式」によって照合され
る。本実施例の場合、「Yuen Kong」、「Yu
en Long」が予め定られた値以上の類似度を有す
る地域名として、その照合結果の情報が検索条件照合部
7へ転送される。
【0013】検索条件照合部7では、単語照合部4から
転送された地域名と共に検索条件フィールドが参照され
るが、地域名「Yuen Long」、「Yuen K
ong」の検索条件フィールドにはいずれも特定の検索
条件は記憶されていないので、両地域名とも単語判定部
へ転送される。
転送された地域名と共に検索条件フィールドが参照され
るが、地域名「Yuen Long」、「Yuen K
ong」の検索条件フィールドにはいずれも特定の検索
条件は記憶されていないので、両地域名とも単語判定部
へ転送される。
【0014】単語判定部8では、入力文字「Yuan
Long」と最大一致する地域名は「Yuen Lon
g」であるという判定を下し、「Yuen Long」
を表示するコードを出力する。
Long」と最大一致する地域名は「Yuen Lon
g」であるという判定を下し、「Yuen Long」
を表示するコードを出力する。
【0015】(2)次に例えば、文字列「Chan W
an」が文字入力部2から入力された場合には、前項
(1)と同様の動作の結果、単語照合部4での照合結果
として地域名「Chai Wan」の情報が検索条件照
合部7へ転送される。
an」が文字入力部2から入力された場合には、前項
(1)と同様の動作の結果、単語照合部4での照合結果
として地域名「Chai Wan」の情報が検索条件照
合部7へ転送される。
【0016】検索条件照合部7では、地域名「Chai
Wan」と共にその検索条件フィールドが参照される
が、ここには文字列の照合で完全に一致しなければなら
ないという条件が記憶されているので、この条件を満足
するか否か照合される。今の場合、地域名の文字列「C
hai Wan」と文字入力部2からの入力文字列「C
han Wan」とは、1文字異なり完全には一致しな
いので、地域名「Chai Wan」の情報の単語判定
部8への出力は禁止される。
Wan」と共にその検索条件フィールドが参照される
が、ここには文字列の照合で完全に一致しなければなら
ないという条件が記憶されているので、この条件を満足
するか否か照合される。今の場合、地域名の文字列「C
hai Wan」と文字入力部2からの入力文字列「C
han Wan」とは、1文字異なり完全には一致しな
いので、地域名「Chai Wan」の情報の単語判定
部8への出力は禁止される。
【0017】単語判定部8では、検索条件照合部7から
照合結果情報が入力されないので、入力文字列「Cha
n Wan」と一致する地域名は単語辞書6の中には無
いという判定を表示するコードを出力する。
照合結果情報が入力されないので、入力文字列「Cha
n Wan」と一致する地域名は単語辞書6の中には無
いという判定を表示するコードを出力する。
【0018】以上の(1),(2)での説明でわかるよ
うに、文字入力部2から入力された文字列「Yuan
Long」、「Chan Wan」はいずれも、単語辞
書6に記憶された文字列「Yuen Long」、「C
hai Wan」と1文字違いの文字列であるが、文字
列「Yuan Long」については地域名の検索が成
功し、正しい地域名「Yuen Long」を表示する
コードが単語判定部8から出力される。しかし、人名の
文字列「Chan Wan」については地域名として検
索されないというコードが単語判定部8から出力され
る。
うに、文字入力部2から入力された文字列「Yuan
Long」、「Chan Wan」はいずれも、単語辞
書6に記憶された文字列「Yuen Long」、「C
hai Wan」と1文字違いの文字列であるが、文字
列「Yuan Long」については地域名の検索が成
功し、正しい地域名「Yuen Long」を表示する
コードが単語判定部8から出力される。しかし、人名の
文字列「Chan Wan」については地域名として検
索されないというコードが単語判定部8から出力され
る。
【0019】このようにして、同程度の類似度を有する
異なる入力文字列に対して、異なる条件で判定を行わせ
て検索精度を向上させることができる。
異なる入力文字列に対して、異なる条件で判定を行わせ
て検索精度を向上させることができる。
【0020】
【発明の効果】以上説明したように本発明によれば、単
語辞書内に記憶された単語レコード内にその単語固有の
検索条件を付与しておき、この検索条件を満足する単語
レコードの照合結果のみを単語判定部へ転送することに
よって、単語の特徴に応じた固有の検索処理が可能とな
り、検索精度を向上できる。
語辞書内に記憶された単語レコード内にその単語固有の
検索条件を付与しておき、この検索条件を満足する単語
レコードの照合結果のみを単語判定部へ転送することに
よって、単語の特徴に応じた固有の検索処理が可能とな
り、検索精度を向上できる。
【図1】本発明の実施例のブロック図。
【図2】従来装置のブロック図。
1 文字読取装置 2 文字入力部 3 文字コード変換部 4 単語照合部 5 読出制御部 6 単語辞書 7 検索条件照合部 8 単語判定部 9 区分機 10 単語辞書照合装置
Claims (1)
- 【特許請求の範囲】 【請求項1】 文字入力手段から入力された文字列に応
じて登録されている単語のうちから前記入力文字列と最
大一致する単語を検索照合する単語辞書照合装置におい
て、前記単語辞書に登録される単語レコード内に該単語
固有の検索条件を付与したフィールドを設けて該単語と
共に該検索条件を予め記憶させた単語辞書と、該単語辞
書および前記文字入力手段から入力された文字列を照合
し単語照合結果と単語レコード内の前記検索条件とに応
じて該検索条件を満足した単語レコードに対応する照合
結果のみを出力する単語判定手段とを備えていることを
特徴とする単語辞書照合装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3181444A JPH0528132A (ja) | 1991-07-23 | 1991-07-23 | 単語辞書照合装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3181444A JPH0528132A (ja) | 1991-07-23 | 1991-07-23 | 単語辞書照合装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0528132A true JPH0528132A (ja) | 1993-02-05 |
Family
ID=16100879
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3181444A Pending JPH0528132A (ja) | 1991-07-23 | 1991-07-23 | 単語辞書照合装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0528132A (ja) |
-
1991
- 1991-07-23 JP JP3181444A patent/JPH0528132A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0528132A (ja) | 単語辞書照合装置 | |
| JP4054453B2 (ja) | 文字認識装置およびプログラム記録媒体 | |
| JPH0441388B2 (ja) | ||
| JPS646499B2 (ja) | ||
| JP2874199B2 (ja) | 単語辞書照合装置 | |
| JP2570784B2 (ja) | 文書リーダ後処理装置 | |
| JPH0256086A (ja) | 文字認識の後処理方法 | |
| JP2560959B2 (ja) | 文字認識後処理方式 | |
| JPS60225273A (ja) | 単語検索方式 | |
| JPS6121581A (ja) | 文字認識装置 | |
| JPH0546814A (ja) | 文字読み取り装置 | |
| JP2827066B2 (ja) | 数字列混在文書の文字認識の後処理方法 | |
| JPS63268082A (ja) | パタ−ン認識装置 | |
| JPH02148174A (ja) | Ocrによる住所データベース検索装置 | |
| JPH06274701A (ja) | 単語照合装置 | |
| JP3007697B2 (ja) | 単語照合装置及び単語照合方法 | |
| JPH076212A (ja) | 光学文字読取装置の知識処理装置 | |
| JPH04280394A (ja) | 文字認識装置及び認識文字確定方法 | |
| JPS6355624A (ja) | 住所辞書照合装置 | |
| JPH0863487A (ja) | 文書検索方法及び文書検索装置 | |
| JPH04365166A (ja) | 文章検査装置 | |
| JPS5930176A (ja) | 文字判定処理方式 | |
| JPH0646423B2 (ja) | 単語辞書照合装置 | |
| JPH04215183A (ja) | キーワード検索方法 | |
| JPH05342251A (ja) | 辞書検索装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 19991124 |