JPH09237272A - 単漢字検索装置 - Google Patents
単漢字検索装置Info
- Publication number
- JPH09237272A JPH09237272A JP8071479A JP7147996A JPH09237272A JP H09237272 A JPH09237272 A JP H09237272A JP 8071479 A JP8071479 A JP 8071479A JP 7147996 A JP7147996 A JP 7147996A JP H09237272 A JPH09237272 A JP H09237272A
- Authority
- JP
- Japan
- Prior art keywords
- kanji
- search
- dictionary
- information
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 ユーザの知識を使用して所定の方式で既知の
漢字並びに構成を指定することで所望の漢字を得ること
ができ、辞書容量,計算量共に小さく効率的で、且つ柔
軟で頑強な漢字検索装置を提供する。 【解決手段】 入力部1と出力部4、漢字辞書3(漢
字、JISコード、漢字構成情報から成る。)と検索手
段2(ユーザが入力した検索式を漢字辞書の構成情報と
照合し、漢字辞書の構成情報に検索式の内容を含むもの
があれば、その漢字またはJISコードを解として返
す。)とから成る。辞書3における漢字構成情報または
検索式において、上下または左右または中外という相対
的位置情報を表現する手段を有し、ユーザの保有する知
識で得たい漢字の特徴を数個の英字,記号を使って表現
するだけで、所望の漢字またはそのJISコードが得ら
れる。
漢字並びに構成を指定することで所望の漢字を得ること
ができ、辞書容量,計算量共に小さく効率的で、且つ柔
軟で頑強な漢字検索装置を提供する。 【解決手段】 入力部1と出力部4、漢字辞書3(漢
字、JISコード、漢字構成情報から成る。)と検索手
段2(ユーザが入力した検索式を漢字辞書の構成情報と
照合し、漢字辞書の構成情報に検索式の内容を含むもの
があれば、その漢字またはJISコードを解として返
す。)とから成る。辞書3における漢字構成情報または
検索式において、上下または左右または中外という相対
的位置情報を表現する手段を有し、ユーザの保有する知
識で得たい漢字の特徴を数個の英字,記号を使って表現
するだけで、所望の漢字またはそのJISコードが得ら
れる。
Description
【0001】
【発明の属する技術分野】本発明は、単漢字検索装置に
係り、例えば、ワープロ,フロントエンド,文書作成支
援装置,漢字辞書検索等に適用して好適なものである。
係り、例えば、ワープロ,フロントエンド,文書作成支
援装置,漢字辞書検索等に適用して好適なものである。
【0002】
【従来の技術】WS(ワークステーション)上などにお
ける日本語文書作成において不便に感じている事柄の一
つに、所望の漢字が得られないということがある。仮名
漢字変換用辞書には単漢字も登録されているが、数は限
られている。仮名漢字変換で所望の漢字が得られない場
合、JIS(区点)コードなどで検索し漢字を得ること
になるが、JIS漢字は第一,第二を合わせると600
0文字以上になるため、コードをひく手間がこれまた大
変である。通常、読みや画数などをキーにコード本(書
籍)をひきコードを得て仮名漢字変換のJIS(区点)
コード入力モードで変換するか、部首検索モードがある
場合はそれを利用しているようである。
ける日本語文書作成において不便に感じている事柄の一
つに、所望の漢字が得られないということがある。仮名
漢字変換用辞書には単漢字も登録されているが、数は限
られている。仮名漢字変換で所望の漢字が得られない場
合、JIS(区点)コードなどで検索し漢字を得ること
になるが、JIS漢字は第一,第二を合わせると600
0文字以上になるため、コードをひく手間がこれまた大
変である。通常、読みや画数などをキーにコード本(書
籍)をひきコードを得て仮名漢字変換のJIS(区点)
コード入力モードで変換するか、部首検索モードがある
場合はそれを利用しているようである。
【0003】漢字検索に関する従来技術には下記のよう
なものがある。 ・部首検索モード及びその類 部首コードは214もあるため(JIS X0208)、部首一覧
表を提示されてもユーザにとってこの中から探す作業は
負担である。また部首によっては該当漢字を200〜3
00字くらい有するものもあり効率がよいとはいえな
い。また、漢字によっては複数の部首に属するものもあ
るし、どの部首に属するかを直観的に当てること自体も
難しかったりする。下記の出願公開公報に記載された発
明は、部首を直接入力しないで、ある漢字Xを入力する
と同じ部首を持つものが出力されるため、表をひく手間
が省けるというメリットがあるが、結果として、該当す
るものが沢山でてしまうという問題がある。
なものがある。 ・部首検索モード及びその類 部首コードは214もあるため(JIS X0208)、部首一覧
表を提示されてもユーザにとってこの中から探す作業は
負担である。また部首によっては該当漢字を200〜3
00字くらい有するものもあり効率がよいとはいえな
い。また、漢字によっては複数の部首に属するものもあ
るし、どの部首に属するかを直観的に当てること自体も
難しかったりする。下記の出願公開公報に記載された発
明は、部首を直接入力しないで、ある漢字Xを入力する
と同じ部首を持つものが出力されるため、表をひく手間
が省けるというメリットがあるが、結果として、該当す
るものが沢山でてしまうという問題がある。
【0004】特開平2−255934号公報(部首別漢
字入力装置):部首一覧に限らず、システム側から提示
された内容から所望の情報を選択するというやり方は多
かれ少なかれユーザにとって負担になってしまうという
問題がある。 ・画数検索 画数は本出願人の手持ちデータ(JIS漢字1,2)では、画
数4〜21まで、ずっと該当漢字が3桁で存在する。絞
り込み能力が弱いためあまり有効な検索手段とはいえな
い。また、画数を得るために、一旦エディテイング作業
を中断する必要がある。
字入力装置):部首一覧に限らず、システム側から提示
された内容から所望の情報を選択するというやり方は多
かれ少なかれユーザにとって負担になってしまうという
問題がある。 ・画数検索 画数は本出願人の手持ちデータ(JIS漢字1,2)では、画
数4〜21まで、ずっと該当漢字が3桁で存在する。絞
り込み能力が弱いためあまり有効な検索手段とはいえな
い。また、画数を得るために、一旦エディテイング作業
を中断する必要がある。
【0005】画数検索で、入力画数の近傍画数を自動検
索するという内容で公開公報に記載された発明が、下記
になされているが、本出願人の手持のデータでは、画数
11を指定してその近傍+−1即ち、画数10〜12と
すると1500字以上も該当してしまい絞り込み能力に
かけると思われる。
索するという内容で公開公報に記載された発明が、下記
になされているが、本出願人の手持のデータでは、画数
11を指定してその近傍+−1即ち、画数10〜12と
すると1500字以上も該当してしまい絞り込み能力に
かけると思われる。
【0006】特開昭61−180362号公報(漢字処
理装置): ・画数及び部首検索 本出願人の手持ちデータ(JIS漢字1,2)では、画数と部
首を組あわせれば、かなりの絞り込みが期待できるが、
部首表を検索する、画数を調べるという作業が、一旦エ
ディテイング作業を中断させ負担になってしまうという
問題は残る。
理装置): ・画数及び部首検索 本出願人の手持ちデータ(JIS漢字1,2)では、画数と部
首を組あわせれば、かなりの絞り込みが期待できるが、
部首表を検索する、画数を調べるという作業が、一旦エ
ディテイング作業を中断させ負担になってしまうという
問題は残る。
【0007】・その他 その他の検索方法としては、漢字の構成部分(部首では
なく)を取り上げて、それをキーとして検索するもので
ある。例えば、特願平3−140887号に記載の発明
は、ユーザの知識を使用して所定の方式(検索式)で既
知の漢字で所望漢字の構成を指定することで所望漢字を
得るというものであり、読み,画数は一切使用せず、ま
た部首表の提示,キーリストの提示,パターンテーブル
の提示などもせず、ユーザの知識を所定の検索式の形態
で表現してもらうだけで、所望の漢字を検索する漢字検
索装置を提示するという点で、本発明に最も類似してい
る。
なく)を取り上げて、それをキーとして検索するもので
ある。例えば、特願平3−140887号に記載の発明
は、ユーザの知識を使用して所定の方式(検索式)で既
知の漢字で所望漢字の構成を指定することで所望漢字を
得るというものであり、読み,画数は一切使用せず、ま
た部首表の提示,キーリストの提示,パターンテーブル
の提示などもせず、ユーザの知識を所定の検索式の形態
で表現してもらうだけで、所望の漢字を検索する漢字検
索装置を提示するという点で、本発明に最も類似してい
る。
【0008】
【発明が解決しようとする課題】特願平3−14088
7号(漢字入力装置)の漢字入力装置の実現手段は、下
記の問題点を含んでいる。 A.情報量が膨大である漢字構成辞書を有する。特願平
3−140887号の漢字構成辞書は、差分辞書で記さ
れた構成部分ごとに漢字集合を作ったものである。例え
ば、“諮”について考える。差分辞書において下記のよ
うに記されるとすると、 〈差分辞書における“諮”の記述〉 諮,言,次,口 そして更に、漢字構成辞書において下記のように記され
ることになる。 〈漢字構成辞書の記述〉 言 記,語,諮… 次 姿,諮… 口 吹,咽,告,諮… 諮 諮… 即ち、“諮”は差分辞書において、構成情報として3エ
ントリ有し、さらに、漢字構成辞書において、4回出現
する。すべての漢字について同様のことをすると本来の
漢字数の何倍もの情報量になってしまう。また、それに
伴って、計算量もふえ効率をさげてしまう。
7号(漢字入力装置)の漢字入力装置の実現手段は、下
記の問題点を含んでいる。 A.情報量が膨大である漢字構成辞書を有する。特願平
3−140887号の漢字構成辞書は、差分辞書で記さ
れた構成部分ごとに漢字集合を作ったものである。例え
ば、“諮”について考える。差分辞書において下記のよ
うに記されるとすると、 〈差分辞書における“諮”の記述〉 諮,言,次,口 そして更に、漢字構成辞書において下記のように記され
ることになる。 〈漢字構成辞書の記述〉 言 記,語,諮… 次 姿,諮… 口 吹,咽,告,諮… 諮 諮… 即ち、“諮”は差分辞書において、構成情報として3エ
ントリ有し、さらに、漢字構成辞書において、4回出現
する。すべての漢字について同様のことをすると本来の
漢字数の何倍もの情報量になってしまう。また、それに
伴って、計算量もふえ効率をさげてしまう。
【0009】B.相対的位置情報を用いていないためヒ
ット精度が落ちる。特願平3−140887号では、相
対的位置情報を用いていないため木へんのものを探す場
合でも検索式に“…木+…”と記述することになる。同
検索手段では、“木”がどこの位置にあるかということ
は考慮されないので、漢字構成部分に“木”を含むもの
全部を探してくる。例えば、構成部分に“木”を含む漢
字集合例:案,杏,椅,楽,禁,襟,困,梱,床,湘,
槻,嘛,噤,婪,嫻,孀,恷…となり、これは数百を下
らない件数になり部首入力などで、木へんのものを得た
方が効率がいいことになってしまう。
ット精度が落ちる。特願平3−140887号では、相
対的位置情報を用いていないため木へんのものを探す場
合でも検索式に“…木+…”と記述することになる。同
検索手段では、“木”がどこの位置にあるかということ
は考慮されないので、漢字構成部分に“木”を含むもの
全部を探してくる。例えば、構成部分に“木”を含む漢
字集合例:案,杏,椅,楽,禁,襟,困,梱,床,湘,
槻,嘛,噤,婪,嫻,孀,恷…となり、これは数百を下
らない件数になり部首入力などで、木へんのものを得た
方が効率がいいことになってしまう。
【0010】C.遡って検索するという手段がないた
め、特願平3−140887号の差分生成辞書において
は、情報量が膨大,繁雑になってしまう。特願平3−1
40887号の記述方式では、例えば、吾、梧、聒を例
にとれば、 吾:五,口 梧:木,五,口,吾 聒:耳,千,口,舌 となり、想定されるものを全部記述しなくてはならな
い。そのため、記述量も多く、位置情報や漢字構成部ご
とのまとまりに関する情報もないため繁雑になってしま
うおそれがある。
め、特願平3−140887号の差分生成辞書において
は、情報量が膨大,繁雑になってしまう。特願平3−1
40887号の記述方式では、例えば、吾、梧、聒を例
にとれば、 吾:五,口 梧:木,五,口,吾 聒:耳,千,口,舌 となり、想定されるものを全部記述しなくてはならな
い。そのため、記述量も多く、位置情報や漢字構成部ご
とのまとまりに関する情報もないため繁雑になってしま
うおそれがある。
【0011】D.また、ある漢字Xの一部分を指定する
ことができないため実際には検索できないものがでてし
まう。所望漢字が、仮にXZという構成をしていて、ユ
ーザがXWという漢字を知っていた場合に、平3−14
0887号のアルゴリズムではXW−W+Zという指定
の仕方をとる。しかし、漢字の構成要素がすべて登録さ
れていることはまずない。JIS漢字には偏や旁に相当
する字が含まれているがそれもほんの一部である。従っ
て、差を示すべく入力するWやZに相当するものが入力
できない場合があるという問題点がある。例えば、JI
S漢字には部首である“辷/邇/逶”の下部共通部分
(しんにゅうの一種)や“病/癌/痕”の上部共通部分
(やまいだれ)すらも対応するコードがないため、JI
S内漢字環境で対応しようと思うとそもそも検索式を作
ることができないということになる。
ことができないため実際には検索できないものがでてし
まう。所望漢字が、仮にXZという構成をしていて、ユ
ーザがXWという漢字を知っていた場合に、平3−14
0887号のアルゴリズムではXW−W+Zという指定
の仕方をとる。しかし、漢字の構成要素がすべて登録さ
れていることはまずない。JIS漢字には偏や旁に相当
する字が含まれているがそれもほんの一部である。従っ
て、差を示すべく入力するWやZに相当するものが入力
できない場合があるという問題点がある。例えば、JI
S漢字には部首である“辷/邇/逶”の下部共通部分
(しんにゅうの一種)や“病/癌/痕”の上部共通部分
(やまいだれ)すらも対応するコードがないため、JI
S内漢字環境で対応しようと思うとそもそも検索式を作
ることができないということになる。
【0012】本発明は、以上のような問題点に鑑みてな
されたもので、ユーザの知識を使用して所定の方式で既
知の漢字並びに構成を指定することで所望の漢字を得る
というものであり、読み,画数は一切使用せず、また部
首表の提示,キーリストの提示,パターンテーブルの提
示などもせず、ユーザの知識を所定の検索式の形態で表
現してもらうだけで、所望の漢字を検索する漢字検索装
置で、且つ特願平3−140887号よりも辞書容量,
計算量共に小さく効率的で、且つ柔軟で頑強な漢字検索
装置の提供を目的とする。
されたもので、ユーザの知識を使用して所定の方式で既
知の漢字並びに構成を指定することで所望の漢字を得る
というものであり、読み,画数は一切使用せず、また部
首表の提示,キーリストの提示,パターンテーブルの提
示などもせず、ユーザの知識を所定の検索式の形態で表
現してもらうだけで、所望の漢字を検索する漢字検索装
置で、且つ特願平3−140887号よりも辞書容量,
計算量共に小さく効率的で、且つ柔軟で頑強な漢字検索
装置の提供を目的とする。
【0013】
【課題を解決するための手段】請求項1の発明は、入力
部と出力部とを有し、読みが不明の場合の単漢字検索装
置において、下記の漢字辞書と検索手段とから成り、辞
書における漢字構成情報または検索式において、上下ま
たは左右または中外という相対的位置情報を表現する手
段を有し、ユーザの保有する知識で得たい漢字の特徴を
数個の英字,記号を使って表現する(以下、検索式と呼
ぶ)だけで、所望の漢字またはそのJISコードが得ら
れるようにしたものである。 漢字辞典:下記(a)〜(c)から成る。 (a)漢字 (b)JISコード (c)漢字構成情報 検索手段:下記の検索機能を有する。 (d)ユーザが入力した検索式を漢字辞書の構成情報と
照合し、漢字辞書の構成情報に検索式の内容を含むもの
があれば、その漢字またはJISコードを解として返
す。
部と出力部とを有し、読みが不明の場合の単漢字検索装
置において、下記の漢字辞書と検索手段とから成り、辞
書における漢字構成情報または検索式において、上下ま
たは左右または中外という相対的位置情報を表現する手
段を有し、ユーザの保有する知識で得たい漢字の特徴を
数個の英字,記号を使って表現する(以下、検索式と呼
ぶ)だけで、所望の漢字またはそのJISコードが得ら
れるようにしたものである。 漢字辞典:下記(a)〜(c)から成る。 (a)漢字 (b)JISコード (c)漢字構成情報 検索手段:下記の検索機能を有する。 (d)ユーザが入力した検索式を漢字辞書の構成情報と
照合し、漢字辞書の構成情報に検索式の内容を含むもの
があれば、その漢字またはJISコードを解として返
す。
【0014】請求項2の発明は、請求項1に記載の単漢
字検索装置において、漢字構成情報として、上下左右中
外という相対的位置情報に加え、これら相対的位置情報
に更に、例えば、“左部分は上が漢字Tで下が漢字Dで
ある”といったように相対位置情報を組み合わせて表現
する手段を有し、検索機能として、検索式そのままでは
漢字辞書の漢字構成情報(c)にマッチしなかった場
合、検索式中の各構成部分について検索を行ない、得ら
れた結果を使用して再検索を行なう機能を有するように
したものである。
字検索装置において、漢字構成情報として、上下左右中
外という相対的位置情報に加え、これら相対的位置情報
に更に、例えば、“左部分は上が漢字Tで下が漢字Dで
ある”といったように相対位置情報を組み合わせて表現
する手段を有し、検索機能として、検索式そのままでは
漢字辞書の漢字構成情報(c)にマッチしなかった場
合、検索式中の各構成部分について検索を行ない、得ら
れた結果を使用して再検索を行なう機能を有するように
したものである。
【0015】請求項3の発明は、請求項1または2に記
載の単漢字検索装置において、ある漢字Yを表現する表
現手段として、ある漢字Xの一部分を指定する手段を有
するようにしたものである。
載の単漢字検索装置において、ある漢字Yを表現する表
現手段として、ある漢字Xの一部分を指定する手段を有
するようにしたものである。
【0016】請求項4の発明は、請求項3に記載の単漢
字検索装置において、ある漢字Yを表現する表現手段と
して、ある漢字Xの一部分を指定するときに、上下また
は左右または中外という相対的位置情報を表現する手段
を有するようにしたものである。
字検索装置において、ある漢字Yを表現する表現手段と
して、ある漢字Xの一部分を指定するときに、上下また
は左右または中外という相対的位置情報を表現する手段
を有するようにしたものである。
【0017】請求項5の発明は、請求項1ないし4のい
ずれかに記載の単漢字検索装置において、漢字辞書に読
み情報を有し、得たい漢字の読みをも得ることができる
ようにしたものである。
ずれかに記載の単漢字検索装置において、漢字辞書に読
み情報を有し、得たい漢字の読みをも得ることができる
ようにしたものである。
【0018】
【発明の実施の形態】図1は、本発明の全体の構成図で
あり、図中、1は入力部で、入力には音声認識入力,キ
ーボード入力などが考えられる。2は検索部、3は辞書
部で、辞書には単漢字とその構成情報が最低限搭載され
る。また、4は出力部で、出力装置には、ディスプレイ
を想定しているが、音声合成なども可能である。
あり、図中、1は入力部で、入力には音声認識入力,キ
ーボード入力などが考えられる。2は検索部、3は辞書
部で、辞書には単漢字とその構成情報が最低限搭載され
る。また、4は出力部で、出力装置には、ディスプレイ
を想定しているが、音声合成なども可能である。
【0019】本発明では、“ある漢字を入力したいのだ
が、読みがわからない、また、知っている読みでは仮名
漢字変換できない。”という場合を想定している。これ
は、例えば、名刺などに記載されている人名・地名をイ
ンプットしたい時などにおこることが想定される。例え
ば、“林 惇猷(あつみち)”という名前をインプット
したい時など読みではまず変換されない。
が、読みがわからない、また、知っている読みでは仮名
漢字変換できない。”という場合を想定している。これ
は、例えば、名刺などに記載されている人名・地名をイ
ンプットしたい時などにおこることが想定される。例え
ば、“林 惇猷(あつみち)”という名前をインプット
したい時など読みではまず変換されない。
【0020】(請求項1の発明)今、記号“+”を使用
し、“A+B”と表現したら、AとBから構成されると
いう意味を表し、また、記号“,”を使用し、“A,
B”と表現したら構成部分として、AまたはBが存在す
る、という意味を表すとする。また、“上,下,左,
右,中,外”といった相対的位置情報をアルファベット
“T,D,L,R,I,O”でそれぞれ表し、これらの
記号を使用して辞書の構成情報にもこの位置情報を付与
することで実現できる。
し、“A+B”と表現したら、AとBから構成されると
いう意味を表し、また、記号“,”を使用し、“A,
B”と表現したら構成部分として、AまたはBが存在す
る、という意味を表すとする。また、“上,下,左,
右,中,外”といった相対的位置情報をアルファベット
“T,D,L,R,I,O”でそれぞれ表し、これらの
記号を使用して辞書の構成情報にもこの位置情報を付与
することで実現できる。
【0021】例えば、辞書に“櫁”に対して、“L木+
R蜜”という構成情報を付与していたとすると、ユーザ
が入れた検索式が「L木+R蜜」であれば、検索式に含
まれる構成情報と辞書に搭載されている構成情報を照合
した結果“櫁”という所望の漢字を得ることができる。
なお、木へんを有するもののみを得たければユーザは
「L木」をいれればよい。また、“木,蜜”という式を
与えたら“木”または“蜜”を構成要素として含むもの
を検索する。検索では、検索式に含まれる構成情報が辞
書の構成情報に含まれるものを検索させる。従って、複
数の候補がでることもある。検索を、検索式と辞書の構
成情報が同内容の場合のみ成功させることにしてもかま
わない。その場合は、ワイルドカードを設定するなどの
必要がある。例えば、“*”を0個以上の要素を表すワ
イルドカードと想定すると、木へんを有するもののみを
得たければユーザは「L木+*」を指示することにな
る。
R蜜”という構成情報を付与していたとすると、ユーザ
が入れた検索式が「L木+R蜜」であれば、検索式に含
まれる構成情報と辞書に搭載されている構成情報を照合
した結果“櫁”という所望の漢字を得ることができる。
なお、木へんを有するもののみを得たければユーザは
「L木」をいれればよい。また、“木,蜜”という式を
与えたら“木”または“蜜”を構成要素として含むもの
を検索する。検索では、検索式に含まれる構成情報が辞
書の構成情報に含まれるものを検索させる。従って、複
数の候補がでることもある。検索を、検索式と辞書の構
成情報が同内容の場合のみ成功させることにしてもかま
わない。その場合は、ワイルドカードを設定するなどの
必要がある。例えば、“*”を0個以上の要素を表すワ
イルドカードと想定すると、木へんを有するもののみを
得たければユーザは「L木+*」を指示することにな
る。
【0022】他にも、「O門+I馬」で「闖」を得るこ
とができる。 《辞書例》 漢字:JIS:構成情報 .... 椨:5c2d:L木+R府 椌:5b7d:L木+R空 檸:5d26:L木+R寧 檳:5d27:L木+R賓 樒:5c69:L木+R密 棕:5c23:L木+R宗 榕:5c57:L木+R容 樒:5c6a:L木+R密 ←検索式:「L木+R密」
がマッチ。 榁:5c43:L木+R室....
とができる。 《辞書例》 漢字:JIS:構成情報 .... 椨:5c2d:L木+R府 椌:5b7d:L木+R空 檸:5d26:L木+R寧 檳:5d27:L木+R賓 樒:5c69:L木+R密 棕:5c23:L木+R宗 榕:5c57:L木+R容 樒:5c6a:L木+R密 ←検索式:「L木+R密」
がマッチ。 榁:5c43:L木+R室....
【0023】《検索方法》検索方法は簡単である。検索
式の“+”は“and”で解釈し、“,”は“or”で
解釈して検索式中の条件と辞書中の構成情報とを照合す
ればよい。また、検索式中の構成情報にアルファベット
が含まれていない場合は、どの位置にきてもいいものと
解釈して検索する。
式の“+”は“and”で解釈し、“,”は“or”で
解釈して検索式中の条件と辞書中の構成情報とを照合す
ればよい。また、検索式中の構成情報にアルファベット
が含まれていない場合は、どの位置にきてもいいものと
解釈して検索する。
【0024】(請求項2の発明)例えば、“梍”を入力
するのに「左部分は“木”で右部分は上が“白”で下が
“七”」と表現したとすると丸括弧(,)を使用して下
記のように表現することができる。 ex.「左部分は“木”で右部分は上が“白”で下が
“七”」−→「L木+R(T白+D七)」 また、例えば、“梧”を検索する場合は、下記のどちら
の検索式でも検索可能である。 検索式1:「L木+R吾」 検索式2:「L木+R(T五+D口)」
するのに「左部分は“木”で右部分は上が“白”で下が
“七”」と表現したとすると丸括弧(,)を使用して下
記のように表現することができる。 ex.「左部分は“木”で右部分は上が“白”で下が
“七”」−→「L木+R(T白+D七)」 また、例えば、“梧”を検索する場合は、下記のどちら
の検索式でも検索可能である。 検索式1:「L木+R吾」 検索式2:「L木+R(T五+D口)」
【0025】辞書構成について説明する。“梍”のよう
に、右構成部分が、一文字として独立しない場合は、辞
書の構成情報も、検索式と同様「R(T白+D七)」の
ように記す。“梧”のように、右構成部分が、一文字と
して独立可能な場合は、辞書の構成情報は、独立した文
字の方で表現する(下記辞書例参照)。無論、“R吾”
と共に“T五+D口”の情報を“梧”に与えていてもよ
いが、メモリをとられたり、辞書情報や検索が繁雑にな
る恐れがあるのでここでは、“R吾”のみを記述する方
式で以下説明する。
に、右構成部分が、一文字として独立しない場合は、辞
書の構成情報も、検索式と同様「R(T白+D七)」の
ように記す。“梧”のように、右構成部分が、一文字と
して独立可能な場合は、辞書の構成情報は、独立した文
字の方で表現する(下記辞書例参照)。無論、“R吾”
と共に“T五+D口”の情報を“梧”に与えていてもよ
いが、メモリをとられたり、辞書情報や検索が繁雑にな
る恐れがあるのでここでは、“R吾”のみを記述する方
式で以下説明する。
【0026】《辞書例》 漢字:JIS:構成情報 .... 吾:3863:T五+D口 ←検索式2はまずこれにマ
ッチし、“R吾”という情報を得てから“梧”にマッチ
する。 .... .... 梧:3868:L木+R吾 ←上記検索式1,2共にマ
ッチ。 .... 樒:5c6a:L木+R密 榁:5c43:L木+R室 梍:5b74:L木+R(T白+D七)←検索式「L木+
R(T白+D七)」がマッチ。 ....
ッチし、“R吾”という情報を得てから“梧”にマッチ
する。 .... .... 梧:3868:L木+R吾 ←上記検索式1,2共にマ
ッチ。 .... 樒:5c6a:L木+R密 榁:5c43:L木+R室 梍:5b74:L木+R(T白+D七)←検索式「L木+
R(T白+D七)」がマッチ。 ....
【0027】《検索方法》検索式1の場合は、問題な
い。検索式2は、まず最初は、「L木+R(T五+D
口)」という内容で辞書をスキャンする。しかし、該当
するものが得られないので、丸括弧の内容「T五+D
口」で検索する。これで、“吾”を得ることができるの
で、検索式の丸括弧部分を“吾”に置き換え、今度は、
「L木+R(T五+D口)」で再び辞書をスキャンし
“梧”を得る。他にも、「L波1+R(O門+I王)」
で「潤」を得ることができる。
い。検索式2は、まず最初は、「L木+R(T五+D
口)」という内容で辞書をスキャンする。しかし、該当
するものが得られないので、丸括弧の内容「T五+D
口」で検索する。これで、“吾”を得ることができるの
で、検索式の丸括弧部分を“吾”に置き換え、今度は、
「L木+R(T五+D口)」で再び辞書をスキャンし
“梧”を得る。他にも、「L波1+R(O門+I王)」
で「潤」を得ることができる。
【0028】(請求項3及び4の発明)例えば、“猷”
を求めるのに、請求項1の方式で表現すると「L酋+R
犬」となり、請求項2の方式で表現すると「L(Tソ+
D酉)+R犬」という検索式になるが、もっと簡単に
「“楢”の字の右側に、犬」という表現がしたいことが
ある。この場合、例えば、位置情報の“上,下,左,
右,中,外”を“t,d,l,r,i,o”で表現し、
当該漢字の右側に記すことにしたとする。そうすると、
「L楢r+R犬」のように表現することができる。これ
は、得たい漢字の左構成部分には、“楢”の字の右部分
がきて、得たい漢字の右構成部分には、“犬”がくると
いうことを指示している。 検索式「L楢r+R犬」→“猷”
を求めるのに、請求項1の方式で表現すると「L酋+R
犬」となり、請求項2の方式で表現すると「L(Tソ+
D酉)+R犬」という検索式になるが、もっと簡単に
「“楢”の字の右側に、犬」という表現がしたいことが
ある。この場合、例えば、位置情報の“上,下,左,
右,中,外”を“t,d,l,r,i,o”で表現し、
当該漢字の右側に記すことにしたとする。そうすると、
「L楢r+R犬」のように表現することができる。これ
は、得たい漢字の左構成部分には、“楢”の字の右部分
がきて、得たい漢字の右構成部分には、“犬”がくると
いうことを指示している。 検索式「L楢r+R犬」→“猷”
【0029】辞書構成について説明する。検索式で使用
している右側の添字による指示方法は、辞書記述におい
ては極力使用しないようにする。そのため基本的に請求
項1,2と同じである。 《辞書例》 漢字:JIS:構成情報 .... 楢:466a:L木+R酋 .... 猷:4d32:L酋+R犬 ....
している右側の添字による指示方法は、辞書記述におい
ては極力使用しないようにする。そのため基本的に請求
項1,2と同じである。 《辞書例》 漢字:JIS:構成情報 .... 楢:466a:L木+R酋 .... 猷:4d32:L酋+R犬 ....
【0030】《検索方法》まず、右側の添字の解釈を行
なう。“楢”の辞書記述は“楢:466a:L木+R
酋”となっているので、この右構成要素“酋”を得る。
そして、今度は「L酋+R犬」で検索を行ない、結果と
して“猷”を得る。他にも、「O区o+I王」で「匡」
を、「L惰+R閲i」で「悦」を得ることができる。
なう。“楢”の辞書記述は“楢:466a:L木+R
酋”となっているので、この右構成要素“酋”を得る。
そして、今度は「L酋+R犬」で検索を行ない、結果と
して“猷”を得る。他にも、「O区o+I王」で「匡」
を、「L惰+R閲i」で「悦」を得ることができる。
【0031】(請求項5の発明)上記請求項で使用して
いる漢字辞書に読み情報を付与し、検索結果として読み
情報も得られるようにすればよい。
いる漢字辞書に読み情報を付与し、検索結果として読み
情報も得られるようにすればよい。
【0032】
【発明の効果】本発明によれば、ユーザが通常人に口頭
で伝えている表現を数個の記号で表現するだけで、所望
の漢字が得られるので、部首表の類をひいたり、画数を
カウントしたりしなくてよく、また柔軟な表現が可能で
あるため、ユーザの負担が非常に少なくて済むので、エ
ディティング作業の効率をアップすることができる。
で伝えている表現を数個の記号で表現するだけで、所望
の漢字が得られるので、部首表の類をひいたり、画数を
カウントしたりしなくてよく、また柔軟な表現が可能で
あるため、ユーザの負担が非常に少なくて済むので、エ
ディティング作業の効率をアップすることができる。
【0033】請求項1の発明によれば、得たい漢字の形
が明確にわかっているときには、絞り込みの精度が高い
ので効率よく検索ができる。また、あいまいな場合でも
検索でき、且つ、得たい漢字の形が明確にわかっている
ときには、絞り込みの精度が高い検索ができる。請求項
2乃至4の発明によれば、より柔軟な検索が可能である
ので、人が通常行なっている直観的な表現に近い検索が
行なえる。請求項5の発明によれば、漢字だけでなく、
その読みも得ることができる。
が明確にわかっているときには、絞り込みの精度が高い
ので効率よく検索ができる。また、あいまいな場合でも
検索でき、且つ、得たい漢字の形が明確にわかっている
ときには、絞り込みの精度が高い検索ができる。請求項
2乃至4の発明によれば、より柔軟な検索が可能である
ので、人が通常行なっている直観的な表現に近い検索が
行なえる。請求項5の発明によれば、漢字だけでなく、
その読みも得ることができる。
【0034】更に、本発明と前記特願平3−14088
7号の発明に対比してみると、 A:本発明では、特願平3−140887号の差分生成
辞書に相当するもののみで済む。 B:本発明では、相対的位置情報を使用するので、木へ
んのものだということが予めわかっていれば、“L木”
(←左側に“木”がくるという意味)という指定がで
き、“案,杏,楽,禁,襟,困…”などは最初から候補
にあがらないため、検索効率,ヒット精度がよく、候補
が絞られるため、後に続く計算量も少なくてすむ。 C:本発明の記述 特願平3−140887号
の記述方式 吾:T五+D口 吾:五,口 梧:L木+R吾 梧:木,五,口,吾 聒:L耳+R舌 聒:耳,千,口,舌 となり、本発明では、検索式1:「L木+R吾」,検索
式2:「L木+R(T五+D口)」のどちらでも検索可
能であるが、辞書では“梧”に「L木+R吾」の方の構
成情報のみを登録しておくだけで済む。本発明では、入
力された検索式でみつからなかった場合、丸括弧の内容
「T五+D口」で検索し、“吾”を得てから再度検索す
ることができるので、検索式2を入力されても結局、検
索式1を得ることができるからである。D:本発明で
は、ある漢字Xの一部分を指定することができるため、
例えば、“辷d”で、“辷/邇/逶”の下部共通部分
を、“病t”で“病/癌/痕”の上部共通部分を指定す
ることができる。
7号の発明に対比してみると、 A:本発明では、特願平3−140887号の差分生成
辞書に相当するもののみで済む。 B:本発明では、相対的位置情報を使用するので、木へ
んのものだということが予めわかっていれば、“L木”
(←左側に“木”がくるという意味)という指定がで
き、“案,杏,楽,禁,襟,困…”などは最初から候補
にあがらないため、検索効率,ヒット精度がよく、候補
が絞られるため、後に続く計算量も少なくてすむ。 C:本発明の記述 特願平3−140887号
の記述方式 吾:T五+D口 吾:五,口 梧:L木+R吾 梧:木,五,口,吾 聒:L耳+R舌 聒:耳,千,口,舌 となり、本発明では、検索式1:「L木+R吾」,検索
式2:「L木+R(T五+D口)」のどちらでも検索可
能であるが、辞書では“梧”に「L木+R吾」の方の構
成情報のみを登録しておくだけで済む。本発明では、入
力された検索式でみつからなかった場合、丸括弧の内容
「T五+D口」で検索し、“吾”を得てから再度検索す
ることができるので、検索式2を入力されても結局、検
索式1を得ることができるからである。D:本発明で
は、ある漢字Xの一部分を指定することができるため、
例えば、“辷d”で、“辷/邇/逶”の下部共通部分
を、“病t”で“病/癌/痕”の上部共通部分を指定す
ることができる。
【図1】 本発明の実施例を説明するための全体構成図
である。
である。
1…入力部、2…検索部、3…辞書部、4…出力部。
Claims (5)
- 【請求項1】 入力部と出力部とを有し、読みが不明の
場合の単漢字検索装置において、下記の漢字辞書と検索
手段とから成り、辞書における漢字構成情報または検索
式において、上下または左右または中外という相対的位
置情報を表現する手段を有し、ユーザの保有する知識で
得たい漢字の特徴を数個の英字,記号を使って表現する
(以下、検索式と呼ぶ)だけで、所望の漢字またはその
JISコードが得られることを特徴とする単漢字検索装
置。 漢字辞典:下記(a)〜(c)から成る。 (a)漢字 (b)JISコード (c)漢字構成情報 検索手段:下記の検索機能を有する。 (d)ユーザが入力した検索式を漢字辞書の構成情報と
照合し、漢字辞書の構成情報に検索式の内容を含むもの
があれば、その漢字またはJISコードを解として返
す。 - 【請求項2】 請求項1において、漢字構成情報とし
て、前記上下、左右、中外という相対的位置情報に加
え、これら各相対位置情報に更に相対位置情報を組み合
わせて表現する手段を有し、検索機能として、検索式そ
のままでは漢字辞書の前記漢字構成情報(c)にマッチ
しなかった場合、検索式中の各構成部分について検索を
行ない、得られた結果を使用して再検索を行なう機能を
有することを特徴とする単漢字検索装置。 - 【請求項3】 請求項1または2において、ある漢字Y
を表現する表現手段として、ある漢字Xの一部分を指定
する手段を有することを特徴とする単漢字検索装置。 - 【請求項4】 請求項3において、ある漢字Yを表現す
る表現手段として、ある漢字Xの一部分を指定するとき
に、上下または左右または中外という相対的位置情報を
表現する手段を有することを特徴とする単漢字検索装
置。 - 【請求項5】 請求項1ないし4のいずれかにおいて、
漢字辞書に読み情報を有し、得たい漢字の読みをも得る
ことができることを特徴とする単漢字検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP07147996A JP3552842B2 (ja) | 1996-02-29 | 1996-02-29 | 単漢字検索装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP07147996A JP3552842B2 (ja) | 1996-02-29 | 1996-02-29 | 単漢字検索装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH09237272A true JPH09237272A (ja) | 1997-09-09 |
| JP3552842B2 JP3552842B2 (ja) | 2004-08-11 |
Family
ID=13461821
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP07147996A Expired - Fee Related JP3552842B2 (ja) | 1996-02-29 | 1996-02-29 | 単漢字検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3552842B2 (ja) |
-
1996
- 1996-02-29 JP JP07147996A patent/JP3552842B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP3552842B2 (ja) | 2004-08-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2003162687A (ja) | 手書き文字入力装置、手書き文字認識プログラム | |
| JP3727995B2 (ja) | 文書処理方法及び装置 | |
| US8335680B2 (en) | Electronic apparatus with dictionary function background | |
| JPH09237272A (ja) | 単漢字検索装置 | |
| JP2005165533A (ja) | 電子機器および電子辞書装置 | |
| JP3266755B2 (ja) | 中国語情報処理装置 | |
| JP3036005B2 (ja) | かな漢字変換装置 | |
| JPH0944521A (ja) | インデックス作成装置および文書検索装置 | |
| JPS60147868A (ja) | 辞書作成装置 | |
| JPH01307865A (ja) | 文字列検索方式 | |
| JPH07191986A (ja) | 文章入力装置 | |
| JP3498635B2 (ja) | 情報検索方法及びその装置並びにコンピュータ可読記録媒体 | |
| JPH01287774A (ja) | 和文データ入力処理装置 | |
| JPH01214963A (ja) | 辞書引き装置 | |
| JPH09218868A (ja) | 漢字指定方法及び装置 | |
| JPS595335A (ja) | 日本語入力装置 | |
| JPH06251203A (ja) | 手書き文字認識装置と手書き入力文字のかな漢字変換方法 | |
| JP3273778B2 (ja) | 仮名漢字変換装置及び仮名漢字変換方法 | |
| JPH02244380A (ja) | データベースシステム | |
| JPH0435785B2 (ja) | ||
| JPH02177726A (ja) | 漢字入力装置 | |
| JPH03154152A (ja) | 用例表示装置 | |
| JPH04270450A (ja) | 文書作成装置 | |
| JPH07319864A (ja) | かな漢字変換装置 | |
| JPH06266768A (ja) | 電子ブックおよび電子ブックプレーヤにおける検索方式 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040427 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040427 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |