JPH0830626A - 日本語電子化辞書検索装置 - Google Patents
日本語電子化辞書検索装置Info
- Publication number
- JPH0830626A JPH0830626A JP6167185A JP16718594A JPH0830626A JP H0830626 A JPH0830626 A JP H0830626A JP 6167185 A JP6167185 A JP 6167185A JP 16718594 A JP16718594 A JP 16718594A JP H0830626 A JPH0830626 A JP H0830626A
- Authority
- JP
- Japan
- Prior art keywords
- japanese
- dictionary
- search
- notation
- reading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 同じ情報の二重保持を解消し、辞書容量を小
さくし得る電子化辞書検索装置を提供する。 【構成】 日本語電子化辞書検索装置は、日本語読み検
索辞書手段としての日本語読み検索辞書62と、日本語
表記検索辞書手段としての日本語表記検索辞書63と、
日本語の読みからその日本語の表記を日本語読み検索辞
書62に基づき検索すると共に、日本語の表記から日本
語表記検索辞書63の読み検索辞書番号部分に格納する
辞書番号に基づき日本語読み検索辞書手段を用いて日本
語の読みを検索する辞書検索手段としての辞書検索部6
1とを具備している。
さくし得る電子化辞書検索装置を提供する。 【構成】 日本語電子化辞書検索装置は、日本語読み検
索辞書手段としての日本語読み検索辞書62と、日本語
表記検索辞書手段としての日本語表記検索辞書63と、
日本語の読みからその日本語の表記を日本語読み検索辞
書62に基づき検索すると共に、日本語の表記から日本
語表記検索辞書63の読み検索辞書番号部分に格納する
辞書番号に基づき日本語読み検索辞書手段を用いて日本
語の読みを検索する辞書検索手段としての辞書検索部6
1とを具備している。
Description
【0001】
【産業上の利用分野】本発明は、ワードプロセッサ、翻
訳装置など、自然言語処理装置に用いられる日本語電子
化辞書検索装置に関するものである。
訳装置など、自然言語処理装置に用いられる日本語電子
化辞書検索装置に関するものである。
【0002】
【従来の技術】一般に、機械翻訳や音声合成システムな
どの自然言語処理装置では、入力された日本語文章を単
語ごとに分割し、それぞれの読みや品詞等を求める日本
語形態素解析処理が行われる。この処理の元となる電子
化辞書検索装置は、日本語の表記から検索する辞書を有
している。
どの自然言語処理装置では、入力された日本語文章を単
語ごとに分割し、それぞれの読みや品詞等を求める日本
語形態素解析処理が行われる。この処理の元となる電子
化辞書検索装置は、日本語の表記から検索する辞書を有
している。
【0003】一方、ワープロ等で一般的に用いられてい
る日本語入力方式として仮名漢字変換方式がある。この
方式を実現する装置では、日本語の読みから各単語を検
索できる日本語読み検索装置が必要であり、その中に日
本語読み検索辞書を持っている。
る日本語入力方式として仮名漢字変換方式がある。この
方式を実現する装置では、日本語の読みから各単語を検
索できる日本語読み検索装置が必要であり、その中に日
本語読み検索辞書を持っている。
【0004】このような二つの電子化辞書検索装置は、
従来、図1のように独立して構成されていた。ここで、
日本語読み検索装置13は日本語読み検索辞書検索部1
1と日本語読み検索辞書12とから構成され、日本語の
読みからの検索を実施する。日本語表記検索装置16は
日本語表記検索辞書検索部14と日本語表記検索辞書1
5とから構成され、日本語の表記からの検索を実施す
る。図2a及び図2bは、それぞれ日本語読み検索辞書
検索部11及び日本語表記検索辞書検索部14の構成を
示す。図2aに示すように日本語読み検索辞書検索部1
1は、検索コントロール部20、読み情報比較部21、
読み検索辞書番号からのインデックスアクセス部22、
読み情報取り出し部23、表記、品詞情報等取り出し部
24、読み検索辞書アクセス部25から構成されてい
る。また、図2bに示すように日本語表記検索辞書検索
部14は、検索コントロール部26、表記情報比較部2
7、表記検索辞書番号からのインデックスアクセス部2
8、表記情報取り出し部29、読み、品詞情報等取り出
し部30、表記検索辞書アクセス部31から構成されて
いる。図3a及び図3bは、それぞれ日本語読み検索辞
書12及び日本語表記検索辞書15の構成を示す。
従来、図1のように独立して構成されていた。ここで、
日本語読み検索装置13は日本語読み検索辞書検索部1
1と日本語読み検索辞書12とから構成され、日本語の
読みからの検索を実施する。日本語表記検索装置16は
日本語表記検索辞書検索部14と日本語表記検索辞書1
5とから構成され、日本語の表記からの検索を実施す
る。図2a及び図2bは、それぞれ日本語読み検索辞書
検索部11及び日本語表記検索辞書検索部14の構成を
示す。図2aに示すように日本語読み検索辞書検索部1
1は、検索コントロール部20、読み情報比較部21、
読み検索辞書番号からのインデックスアクセス部22、
読み情報取り出し部23、表記、品詞情報等取り出し部
24、読み検索辞書アクセス部25から構成されてい
る。また、図2bに示すように日本語表記検索辞書検索
部14は、検索コントロール部26、表記情報比較部2
7、表記検索辞書番号からのインデックスアクセス部2
8、表記情報取り出し部29、読み、品詞情報等取り出
し部30、表記検索辞書アクセス部31から構成されて
いる。図3a及び図3bは、それぞれ日本語読み検索辞
書12及び日本語表記検索辞書15の構成を示す。
【0005】次に、本従来例の動作について図1に基づ
いて説明する。
いて説明する。
【0006】読みから日本語の表記を検索する場合、日
本語読み検索装置13の日本語読み検索辞書検索部11
により日本語読み検索辞書12に基づき読みに対応する
日本語の表記が検索される。表記から日本語の読みを検
索する場合、日本語表記検索装置16の日本語表記検索
辞書検索部14により日本語表記検索辞書15に基づき
表記に対応する日本語の読みが検索される。
本語読み検索装置13の日本語読み検索辞書検索部11
により日本語読み検索辞書12に基づき読みに対応する
日本語の表記が検索される。表記から日本語の読みを検
索する場合、日本語表記検索装置16の日本語表記検索
辞書検索部14により日本語表記検索辞書15に基づき
表記に対応する日本語の読みが検索される。
【0007】また、特開平5−204962号公報に
は、日本語表記検索装置内の辞書をインデックスと本体
とに分け、本体のエントリ長を可変にして、本体内にコ
ード順に並べる必要を無くすと共に容量を削減し得る電
子化辞書検索装置が開示されている。
は、日本語表記検索装置内の辞書をインデックスと本体
とに分け、本体のエントリ長を可変にして、本体内にコ
ード順に並べる必要を無くすと共に容量を削減し得る電
子化辞書検索装置が開示されている。
【0008】特開平5−165877号公報には、揺ら
ぎを持つ単語の検索を行い、辞書容量を低減する方法と
して、表記辞書と実体辞書に分割して、発音記号や品詞
などの情報を単一化した辞書を具備する検索装置が開示
されている。
ぎを持つ単語の検索を行い、辞書容量を低減する方法と
して、表記辞書と実体辞書に分割して、発音記号や品詞
などの情報を単一化した辞書を具備する検索装置が開示
されている。
【0009】
【発明が解決しようとする課題】以上のように、日本語
読み検索装置内で使用される日本語読み検索辞書と、日
本語表記検索装置内で使用されている日本語表記検索辞
書とは、その中に含まれている情報の重複部分が多いに
もかかわらず、別々に設けられている。すなわち、日本
語読み検索装置内では、単語の読みから辞書を検索する
必要があるため、日本語読み検索辞書は読み順に並んで
いる。他方、日本語表記検索装置内では、単語は漢字仮
名混じりの表記から検索を行う必要があるので、日本語
表記検索辞書は表記順に並んでいる必要がある。その並
び方の違いにより、両辞書は独立して構成されている。
そのため、両辞書の保有している情報は、表記、品詞情
報など、共通する部分が多いにもかかわらず各エントリ
の並び順の異なった辞書を二つ持つこととなり、ほとん
ど同じ情報を二重に持っているため、辞書の総容量が大
きくなってしまい、メモリ容量の効率化が図られていな
い。また、日本語表記には、辞書に出ているような漢字
表記のものだけではなく、送りがなの使用方法が異なっ
ていたり、一部または全部をひらがな表記にする文章も
あり、そのような日本語を精度よく解析するためには、
それら全部を登録しておく必要があり、辞書容量が大き
くなってしまう。
読み検索装置内で使用される日本語読み検索辞書と、日
本語表記検索装置内で使用されている日本語表記検索辞
書とは、その中に含まれている情報の重複部分が多いに
もかかわらず、別々に設けられている。すなわち、日本
語読み検索装置内では、単語の読みから辞書を検索する
必要があるため、日本語読み検索辞書は読み順に並んで
いる。他方、日本語表記検索装置内では、単語は漢字仮
名混じりの表記から検索を行う必要があるので、日本語
表記検索辞書は表記順に並んでいる必要がある。その並
び方の違いにより、両辞書は独立して構成されている。
そのため、両辞書の保有している情報は、表記、品詞情
報など、共通する部分が多いにもかかわらず各エントリ
の並び順の異なった辞書を二つ持つこととなり、ほとん
ど同じ情報を二重に持っているため、辞書の総容量が大
きくなってしまい、メモリ容量の効率化が図られていな
い。また、日本語表記には、辞書に出ているような漢字
表記のものだけではなく、送りがなの使用方法が異なっ
ていたり、一部または全部をひらがな表記にする文章も
あり、そのような日本語を精度よく解析するためには、
それら全部を登録しておく必要があり、辞書容量が大き
くなってしまう。
【0010】また、特開平5−204962号公報に開
示されている電子化辞書検索装置では、検索要求から表
記を検索する場合しか述べられておらず、読みから表記
又は表記から読みを検索するためには、日本語読み検索
辞書と、日本語表記検索辞書とを必要とし、辞書容量が
大きくなってしまう。
示されている電子化辞書検索装置では、検索要求から表
記を検索する場合しか述べられておらず、読みから表記
又は表記から読みを検索するためには、日本語読み検索
辞書と、日本語表記検索辞書とを必要とし、辞書容量が
大きくなってしまう。
【0011】特開平5−165877号公報に開示され
ている電子化辞書検索装置では、日本語表記検索辞書と
日本語読み検索辞書との統合は考慮されておらず、辞書
容量が大きくなってしまう。
ている電子化辞書検索装置では、日本語表記検索辞書と
日本語読み検索辞書との統合は考慮されておらず、辞書
容量が大きくなってしまう。
【0012】本発明は、上記のような課題を解決するた
めになされたもので、同じ情報の二重保持を解消し、辞
書容量を小さくし得る電子化辞書検索装置を提供するこ
とを目的としている。
めになされたもので、同じ情報の二重保持を解消し、辞
書容量を小さくし得る電子化辞書検索装置を提供するこ
とを目的としている。
【0013】
【課題を解決するための手段】本発明によれば、前述の
目的は、日本語の読みを格納する読み部分と日本語の表
記を格納する表記部分と品詞等の付随する情報を保持す
る情報保持部分とを有する日本語読み検索辞書手段と、
前記日本語読み検索辞書手段の読み部分に格納されてい
るそれぞれの日本語の読みに対して付けられた辞書番号
を格納する読み検索辞書番号部分を有する日本語表記検
索辞書手段と、日本語の読みからその日本語の表記を日
本語読み検索辞書手段に基づき検索すると共に、日本語
の表記から日本語表記検索辞書手段の読み検索辞書番号
部分に格納する辞書番号に基づき日本語読み検索辞書手
段を用いて日本語の読みを検索する辞書検索手段とを具
備する請求項1の日本語電子化辞書検索装置によって達
成される。
目的は、日本語の読みを格納する読み部分と日本語の表
記を格納する表記部分と品詞等の付随する情報を保持す
る情報保持部分とを有する日本語読み検索辞書手段と、
前記日本語読み検索辞書手段の読み部分に格納されてい
るそれぞれの日本語の読みに対して付けられた辞書番号
を格納する読み検索辞書番号部分を有する日本語表記検
索辞書手段と、日本語の読みからその日本語の表記を日
本語読み検索辞書手段に基づき検索すると共に、日本語
の表記から日本語表記検索辞書手段の読み検索辞書番号
部分に格納する辞書番号に基づき日本語読み検索辞書手
段を用いて日本語の読みを検索する辞書検索手段とを具
備する請求項1の日本語電子化辞書検索装置によって達
成される。
【0014】請求項2の日本語表記検索辞書手段は、一
つのエントリで読みに対して複数の表記がある場合に、
どの表記に対応するかを示すと共に前記辞書番号に付加
される揺らぎ情報を格納する送りがな揺らぎ部分を有す
るものである。
つのエントリで読みに対して複数の表記がある場合に、
どの表記に対応するかを示すと共に前記辞書番号に付加
される揺らぎ情報を格納する送りがな揺らぎ部分を有す
るものである。
【0015】請求項3の日本語表記検索辞書手段は、ひ
らがな交じりの文章の検索を行う場合に、前記日本語読
み検索辞書手段に登録されている表記には無いひらがな
書き用のひらがな表記揺らぎ情報を格納するひらがな表
記揺らぎ部分を有するものである。
らがな交じりの文章の検索を行う場合に、前記日本語読
み検索辞書手段に登録されている表記には無いひらがな
書き用のひらがな表記揺らぎ情報を格納するひらがな表
記揺らぎ部分を有するものである。
【0016】
【作用】請求項1の日本語電子化辞書検索装置において
は、日本語読み検索辞書手段の読み部分に日本語の読み
が格納され、表記部分に日本語の表記が格納され、情報
保持部分に品詞等の付随する情報が保持され、日本語表
記検索辞書手段の読み検索辞書番号部分に日本語読み検
索辞書手段の読み部分に格納されているそれぞれの日本
語の読みに対して付けられた辞書番号が格納され、日本
語の読みからその日本語の表記を日本語読み検索辞書手
段に基づき検索すると共に、日本語の表記からその日本
語の読みを検索する場合、辞書検索手段により日本語の
表記から日本語表記検索辞書手段の読み検索辞書番号部
分に格納する辞書番号に基づき日本語読み検索辞書手段
を用いて日本語の読みが検索される。日本語読み検索辞
書手段と日本語表記検索辞書手段とを統合したことによ
り、辞書の容量を少なくすることができると共に、単語
の統一的な管理が行える。これにより辞書番号が共通に
なり、解析プログラム中での管理が容易になる。新しい
単語の追加の動作も一度ですみ、操作性が向上する。
は、日本語読み検索辞書手段の読み部分に日本語の読み
が格納され、表記部分に日本語の表記が格納され、情報
保持部分に品詞等の付随する情報が保持され、日本語表
記検索辞書手段の読み検索辞書番号部分に日本語読み検
索辞書手段の読み部分に格納されているそれぞれの日本
語の読みに対して付けられた辞書番号が格納され、日本
語の読みからその日本語の表記を日本語読み検索辞書手
段に基づき検索すると共に、日本語の表記からその日本
語の読みを検索する場合、辞書検索手段により日本語の
表記から日本語表記検索辞書手段の読み検索辞書番号部
分に格納する辞書番号に基づき日本語読み検索辞書手段
を用いて日本語の読みが検索される。日本語読み検索辞
書手段と日本語表記検索辞書手段とを統合したことによ
り、辞書の容量を少なくすることができると共に、単語
の統一的な管理が行える。これにより辞書番号が共通に
なり、解析プログラム中での管理が容易になる。新しい
単語の追加の動作も一度ですみ、操作性が向上する。
【0017】請求項2の日本語電子化辞書検索装置にお
いては、一つのエントリが送りがな表記揺らぎのため、
複数の表記を保持している日本語読み検索辞書手段を使
用する場合には、日本語表記検索辞書手段の中の送りが
な揺らぎ情報を使用して、表記の特定が行われる。
いては、一つのエントリが送りがな表記揺らぎのため、
複数の表記を保持している日本語読み検索辞書手段を使
用する場合には、日本語表記検索辞書手段の中の送りが
な揺らぎ情報を使用して、表記の特定が行われる。
【0018】請求項3の日本語電子化辞書検索装置にお
いては、読み部分と表記部分との対応が取れている日本
語読み検索辞書手段を使用する場合は、ひらがな書きの
表記揺らぎテーブルを使用することにより、読み検索辞
書手段に登録されている以外の表記も日本語表記検索辞
書手段に登録でき、これにより単語の一部や全部をひら
がな書きした日本語も検索でき、形態素解析等の精度が
向上する。日本語表記検索辞書手段の1エントリは、日
本語読み検索辞書手段の辞書番号、送りがな揺らぎ、ひ
らがな表記揺らぎの各テーブルを保持しておくだけでよ
く、辞書の容量を少なくすることができる。
いては、読み部分と表記部分との対応が取れている日本
語読み検索辞書手段を使用する場合は、ひらがな書きの
表記揺らぎテーブルを使用することにより、読み検索辞
書手段に登録されている以外の表記も日本語表記検索辞
書手段に登録でき、これにより単語の一部や全部をひら
がな書きした日本語も検索でき、形態素解析等の精度が
向上する。日本語表記検索辞書手段の1エントリは、日
本語読み検索辞書手段の辞書番号、送りがな揺らぎ、ひ
らがな表記揺らぎの各テーブルを保持しておくだけでよ
く、辞書の容量を少なくすることができる。
【0019】
【実施例】本発明の実施例について、図5から図7に基
づいて説明する。
づいて説明する。
【0020】図5は本発明の一実施例における辞書検索
装置の構成を示す。図5において、62は日本語読み検
索辞書で、読み、表記、品詞等の情報が、読みからの検
索のために読み順に並べられている。63は日本語表記
検索辞書で、対応する日本語読み検索辞書の辞書番号、
送りがな揺らぎ情報、平仮名表記情報が、形態素解析の
日本語表記からの検索のために表記順に並べられてい
る。61は辞書検索部で、日本語の読みや、漢字カナ交
じりの日本語表記を入力とし、日本語読み検索の場合に
は日本語読み検索辞書62を検索し、日本語表記検索の
場合は日本語表記検索辞書63を検索する。日本語表記
検索の際には、表記や品詞等を得るために日本語読み検
索辞書62も使用する。
装置の構成を示す。図5において、62は日本語読み検
索辞書で、読み、表記、品詞等の情報が、読みからの検
索のために読み順に並べられている。63は日本語表記
検索辞書で、対応する日本語読み検索辞書の辞書番号、
送りがな揺らぎ情報、平仮名表記情報が、形態素解析の
日本語表記からの検索のために表記順に並べられてい
る。61は辞書検索部で、日本語の読みや、漢字カナ交
じりの日本語表記を入力とし、日本語読み検索の場合に
は日本語読み検索辞書62を検索し、日本語表記検索の
場合は日本語表記検索辞書63を検索する。日本語表記
検索の際には、表記や品詞等を得るために日本語読み検
索辞書62も使用する。
【0021】また、図6は、辞書検索部61の構成を示
す。本検索部は、読み検索コントロール部71、読み情
報比較部72、読み検索辞書番号からのインデックスア
クセス部73、読み情報取り出し部74、品詞情報等取
り出し部75、表記情報取り出し部76、読み辞書アク
セス部77、表記検索コントロール部78、表記情報比
較部79、表記情報復元部80、ひらがな揺らぎ変換部
81、ひらがな揺らぎ情報取り出し部82、送りがな揺ら
ぎ選択部83、送りがな揺らぎ情報取り出し部84、読
み検索辞書番号取り出し部85、表記辞書アクセス部8
6から構成される。
す。本検索部は、読み検索コントロール部71、読み情
報比較部72、読み検索辞書番号からのインデックスア
クセス部73、読み情報取り出し部74、品詞情報等取
り出し部75、表記情報取り出し部76、読み辞書アク
セス部77、表記検索コントロール部78、表記情報比
較部79、表記情報復元部80、ひらがな揺らぎ変換部
81、ひらがな揺らぎ情報取り出し部82、送りがな揺ら
ぎ選択部83、送りがな揺らぎ情報取り出し部84、読
み検索辞書番号取り出し部85、表記辞書アクセス部8
6から構成される。
【0022】また、図7は、日本語読み検索辞書62と
日本語表記検索辞書63の構成を示す。本辞書は、日本
語読み検索辞書本体97、読み検索辞書番号からのイン
デックス98、日本語表記検索辞書本体99から構成さ
れる。更に、日本語読み検索辞書本体97の各エントリ
は、読み部分91、表記部分92、品詞等の付随する情
報を保持する情報保持部分93から構成されている。ま
た、各エントリの長さは可変長である。一方、日本語表
記検索辞書本体99の各エントリは、読み検索辞書番号
部分94、送りがな揺らぎ部分95、ひらがな表記揺ら
ぎ部分96から構成されている。この辞書の各エントリ
の長さは固定長である。
日本語表記検索辞書63の構成を示す。本辞書は、日本
語読み検索辞書本体97、読み検索辞書番号からのイン
デックス98、日本語表記検索辞書本体99から構成さ
れる。更に、日本語読み検索辞書本体97の各エントリ
は、読み部分91、表記部分92、品詞等の付随する情
報を保持する情報保持部分93から構成されている。ま
た、各エントリの長さは可変長である。一方、日本語表
記検索辞書本体99の各エントリは、読み検索辞書番号
部分94、送りがな揺らぎ部分95、ひらがな表記揺ら
ぎ部分96から構成されている。この辞書の各エントリ
の長さは固定長である。
【0023】以上のような日本語電子化辞書検索装置に
おいて、読みおよび表記から辞書を検索する方法につい
て図6及び図7に基づいて説明する。まず、読みから辞
書を検索する方法について説明する。読み検索の場合
は、読み検索コントロール部71が検索のコントロール
を行なう。検索の方法については各種の方法があるが、
ここでは、シーケンシャルサーチ方法について述べる。
この方法は、辞書の最初から順番に検索を行なっていく
方法である。例えば、「ときには」という読みが入って
きた場合、読み検索コントロール部71は、日本語読み
検索辞書を前から順番に検索するために、0番目のエン
トリから調べていく。具体的には、読み検索辞書番号か
らのインデックスアクセス部73に、0番目のエントリ
場所を調べる要求を出す。その要求を受けとった読み検
索辞書番号からのインデックスアクセス部73は、0番
目のエントリが日本語読み検索辞書本体97のどの場所
にあるかを調べるために、読み辞書アクセス部77を介
して読み検索辞書番号からのインデックス98を調べ
る。そうして、アドレス0に0番目のエントリがあるこ
とがわかる。このような情報を受けとった読み検索コン
トロール部71は、次に、読み情報取り出し部74に、
そのエントリの読み情報を求めるように要求する。その
要求を受けとった読み情報取り出し部74は、読み辞書
アクセス部を介して日本語読み検索辞書本体97のアド
レス0からのエントリの読み部分91「あき」を読みと
る。次に、その情報を受けとった読み情報を受けとった
読み検索コントロール部71は、読み方法比較部72を
用いて、検索すべき読み「ときには」と「あき」の比較
を行ない、入力された方がコード比較で大きいので、次
の1のエントリに進む。同様にして、エントリ2、3、
4と比較して、4の「わたしたち」の部分では、入力の
「ときには」より大きくなってしまったので、一つ前の
エントリ3に戻り、「とき」と「ときには」は、最初2
文字が一致するので、この部分一致が、検索している辞
書で最長の一致であると判断し、このエントリの品詞情
報や表記情報などを、品詞情報等取り出し部75、表記
情報取り出し部76を用いて取り出し、検索結果として
返す。
おいて、読みおよび表記から辞書を検索する方法につい
て図6及び図7に基づいて説明する。まず、読みから辞
書を検索する方法について説明する。読み検索の場合
は、読み検索コントロール部71が検索のコントロール
を行なう。検索の方法については各種の方法があるが、
ここでは、シーケンシャルサーチ方法について述べる。
この方法は、辞書の最初から順番に検索を行なっていく
方法である。例えば、「ときには」という読みが入って
きた場合、読み検索コントロール部71は、日本語読み
検索辞書を前から順番に検索するために、0番目のエン
トリから調べていく。具体的には、読み検索辞書番号か
らのインデックスアクセス部73に、0番目のエントリ
場所を調べる要求を出す。その要求を受けとった読み検
索辞書番号からのインデックスアクセス部73は、0番
目のエントリが日本語読み検索辞書本体97のどの場所
にあるかを調べるために、読み辞書アクセス部77を介
して読み検索辞書番号からのインデックス98を調べ
る。そうして、アドレス0に0番目のエントリがあるこ
とがわかる。このような情報を受けとった読み検索コン
トロール部71は、次に、読み情報取り出し部74に、
そのエントリの読み情報を求めるように要求する。その
要求を受けとった読み情報取り出し部74は、読み辞書
アクセス部を介して日本語読み検索辞書本体97のアド
レス0からのエントリの読み部分91「あき」を読みと
る。次に、その情報を受けとった読み情報を受けとった
読み検索コントロール部71は、読み方法比較部72を
用いて、検索すべき読み「ときには」と「あき」の比較
を行ない、入力された方がコード比較で大きいので、次
の1のエントリに進む。同様にして、エントリ2、3、
4と比較して、4の「わたしたち」の部分では、入力の
「ときには」より大きくなってしまったので、一つ前の
エントリ3に戻り、「とき」と「ときには」は、最初2
文字が一致するので、この部分一致が、検索している辞
書で最長の一致であると判断し、このエントリの品詞情
報や表記情報などを、品詞情報等取り出し部75、表記
情報取り出し部76を用いて取り出し、検索結果として
返す。
【0024】以上の方法では、単純なシーケンシャルサ
ーチ方法について述べたが、二分探索方法などのその他
の検索方法を用いても構わない。
ーチ方法について述べたが、二分探索方法などのその他
の検索方法を用いても構わない。
【0025】次に、表記から検索を行なう方法について
図6及び図7に基づいて説明する。表記検索の場合に
は、表記検索コントロール部78が検索のコントロール
を行なう。また、本発明に関しては、日本語表記検索辞
書本体99の読み検索辞書番号部分94、送りがな揺ら
ぎ部分95、ひらがな表記揺らぎ部分96の各情報を用
いてそのエントリが示す表記を求める装置である表記情
報復元部80が重要な部分であるので、まず、この動作
について説明する。
図6及び図7に基づいて説明する。表記検索の場合に
は、表記検索コントロール部78が検索のコントロール
を行なう。また、本発明に関しては、日本語表記検索辞
書本体99の読み検索辞書番号部分94、送りがな揺ら
ぎ部分95、ひらがな表記揺らぎ部分96の各情報を用
いてそのエントリが示す表記を求める装置である表記情
報復元部80が重要な部分であるので、まず、この動作
について説明する。
【0026】表記情報復元部80は、表記検索コントロ
ール部78からエントリの指定を受け、そのエントリが
示している表記の情報を求める。具体的動作は、以下の
通りである。表記情報復元部80は、まず、読み検索辞
書番号取り出し部85、表記辞書アクセス部96を用い
て、日本語表記検索辞書本体99から、対応するエント
リの読み検索辞書番号部分94を取り出す。日本語表記
検索辞書本体99は各エントリは固定長であるので、各
部分のエントリの情報を取り出すのは、単純なアドレス
計算の作業で行なうことができる。表記からの検索手順
については、具体例に基づいて後で説明する。次に、求
めた読み検索辞書番号を用いて、対応する日本語読み検
索辞書本体の読み情報、表記情報を求める。具体的に
は、読み検索辞書番号からのインデックスアクセス部7
3を用いて、日本語読み検索辞書本体97の対応するエ
ントリのアドレスを求め、次に、読み情報取り出し部7
4を用いて読み情報を、また、表記情報取り出し部76
を用いて表記情報を取り出す。
ール部78からエントリの指定を受け、そのエントリが
示している表記の情報を求める。具体的動作は、以下の
通りである。表記情報復元部80は、まず、読み検索辞
書番号取り出し部85、表記辞書アクセス部96を用い
て、日本語表記検索辞書本体99から、対応するエント
リの読み検索辞書番号部分94を取り出す。日本語表記
検索辞書本体99は各エントリは固定長であるので、各
部分のエントリの情報を取り出すのは、単純なアドレス
計算の作業で行なうことができる。表記からの検索手順
については、具体例に基づいて後で説明する。次に、求
めた読み検索辞書番号を用いて、対応する日本語読み検
索辞書本体の読み情報、表記情報を求める。具体的に
は、読み検索辞書番号からのインデックスアクセス部7
3を用いて、日本語読み検索辞書本体97の対応するエ
ントリのアドレスを求め、次に、読み情報取り出し部7
4を用いて読み情報を、また、表記情報取り出し部76
を用いて表記情報を取り出す。
【0027】この実施例において、図7で示しているよ
うに、日本語読み検索辞書本体97には、一つの読みの
エントリに対して複数の表記が入っている。図7の例で
は、辞書番号2の「うちあわせ」という読みに対して
「打ち合せ」「打合せ」「打ち合わせ」「打合」という
4つの送りがなの変化した表記が入っている。また、読
み部分と表記部分との対応についても、その情報が入っ
ている。同様に、辞書番号2「うちあわせ」という読み
では、「うち」という読みに対して、それぞれの表記で
「打ち」、「打」、「打ち」、「打」という表記が対応
しており、「あわせ」という読みには、「合せ」、「合
せ」、「合わせ」、「合」という表記が対応するという
情報を含んだ辞書の内容になっている例を示している。
これらの情報は、図で示すようなテキストがそのまま記
憶されていてもいいし、文字コードを表す上で使用され
ていないビットのON/OFFを用いて区切りを区別す
る方法や、対応する文字の長さで区切りを表現していて
もよい。
うに、日本語読み検索辞書本体97には、一つの読みの
エントリに対して複数の表記が入っている。図7の例で
は、辞書番号2の「うちあわせ」という読みに対して
「打ち合せ」「打合せ」「打ち合わせ」「打合」という
4つの送りがなの変化した表記が入っている。また、読
み部分と表記部分との対応についても、その情報が入っ
ている。同様に、辞書番号2「うちあわせ」という読み
では、「うち」という読みに対して、それぞれの表記で
「打ち」、「打」、「打ち」、「打」という表記が対応
しており、「あわせ」という読みには、「合せ」、「合
せ」、「合わせ」、「合」という表記が対応するという
情報を含んだ辞書の内容になっている例を示している。
これらの情報は、図で示すようなテキストがそのまま記
憶されていてもいいし、文字コードを表す上で使用され
ていないビットのON/OFFを用いて区切りを区別す
る方法や、対応する文字の長さで区切りを表現していて
もよい。
【0028】このような情報を持つ表記と読みを受けと
った表記情報復元部80は、次に、日本語表記検索辞書
本体99の送りがな揺らぎ部分95とひらがな揺らぎ部
分96の情報を用いて、表記の各種バリエーションの中
から、実際に表されている表記を求める。具体的には、
まず、送りがな揺らぎ選択部83を用いて、送りがな揺
らぎ情報取り出し部84から送りがな揺らぎ部分95の
情報を取り出す。この情報は、このエントリが表記部分
92の何番目の表記を示しているかを0を最初として表
している。例えば、日本語表記検索辞書本体99の9番
目のエントリは、送りがな揺らぎ部分95が3であるの
で、読み検索辞書番号部分94が2であることから、対
応する日本語読み検索辞書本体97の辞書番号2の「う
ちあわせ」の、最初を0と数えて2番目の表記である
「打合」に対応していることを表している。このように
して、送りがな揺らぎ選択部は、複数の表記から、一つ
を選択する。
った表記情報復元部80は、次に、日本語表記検索辞書
本体99の送りがな揺らぎ部分95とひらがな揺らぎ部
分96の情報を用いて、表記の各種バリエーションの中
から、実際に表されている表記を求める。具体的には、
まず、送りがな揺らぎ選択部83を用いて、送りがな揺
らぎ情報取り出し部84から送りがな揺らぎ部分95の
情報を取り出す。この情報は、このエントリが表記部分
92の何番目の表記を示しているかを0を最初として表
している。例えば、日本語表記検索辞書本体99の9番
目のエントリは、送りがな揺らぎ部分95が3であるの
で、読み検索辞書番号部分94が2であることから、対
応する日本語読み検索辞書本体97の辞書番号2の「う
ちあわせ」の、最初を0と数えて2番目の表記である
「打合」に対応していることを表している。このように
して、送りがな揺らぎ選択部は、複数の表記から、一つ
を選択する。
【0029】次に、ひらがな揺らぎ変換部81を用い
て、ひらがな表記揺らぎ部分96の情報を表記に反映さ
せる。この部分は、表記の一部または全部をひらがな書
きにした表記を表す部分である。例えば、日本語読み検
索辞書本体97に、「私達」といった表記しか登録され
ていない場合であっても、「私たち」、「わたし達」、
「わたしたち」といった表記の登録を行なうことがで
き、多くの表記について検索を行なうことができるよう
になる。ひらがな表記揺らぎ部分96は、読み部分91
と表記部分92の対応関係について、先頭から、そのま
まの表記でいいか、ひらがな表記にするかを示している
情報であり、0の場合はそのまま、1の場合はひらがな
表記に変換することを示している。ひらがな揺らぎ変換
部81の具体的動作は、まず、ひらがな揺らぎ情報取り
出し部を用いて、対応するエントリのひらがな表記揺ら
ぎ部分96を取り出してくる。例として、日本語表記検
索辞書本体の5番目のエントリについて作業を行なうと
すると、この部分の情報は、0100であることがわか
る。また、表記情報復元部を通じて、読みが「わたし/
たち」、表記が「私/達」であることも知っている。こ
れらの情報を用いて、実際の表記を復元する。まず、ひ
らがな表記揺らぎ部分の最初の数字を見る。これは、0
であるので、最初の部分は、表記そのままであることが
わかる。つまり、「私」そのままである。次に、2番目
の数字をみると、1であるので、ここは、ひらがな表記
であることがわかる。つまり、表記の「達」の部分は実
際は「たち」というひらがな表記である。これらのよう
な動作を行なって、ひらがな揺らぎ変換部は、5番目の
エントリの表記が「私たち」であると表記情報復元部
「80」に伝える。
て、ひらがな表記揺らぎ部分96の情報を表記に反映さ
せる。この部分は、表記の一部または全部をひらがな書
きにした表記を表す部分である。例えば、日本語読み検
索辞書本体97に、「私達」といった表記しか登録され
ていない場合であっても、「私たち」、「わたし達」、
「わたしたち」といった表記の登録を行なうことがで
き、多くの表記について検索を行なうことができるよう
になる。ひらがな表記揺らぎ部分96は、読み部分91
と表記部分92の対応関係について、先頭から、そのま
まの表記でいいか、ひらがな表記にするかを示している
情報であり、0の場合はそのまま、1の場合はひらがな
表記に変換することを示している。ひらがな揺らぎ変換
部81の具体的動作は、まず、ひらがな揺らぎ情報取り
出し部を用いて、対応するエントリのひらがな表記揺ら
ぎ部分96を取り出してくる。例として、日本語表記検
索辞書本体の5番目のエントリについて作業を行なうと
すると、この部分の情報は、0100であることがわか
る。また、表記情報復元部を通じて、読みが「わたし/
たち」、表記が「私/達」であることも知っている。こ
れらの情報を用いて、実際の表記を復元する。まず、ひ
らがな表記揺らぎ部分の最初の数字を見る。これは、0
であるので、最初の部分は、表記そのままであることが
わかる。つまり、「私」そのままである。次に、2番目
の数字をみると、1であるので、ここは、ひらがな表記
であることがわかる。つまり、表記の「達」の部分は実
際は「たち」というひらがな表記である。これらのよう
な動作を行なって、ひらがな揺らぎ変換部は、5番目の
エントリの表記が「私たち」であると表記情報復元部
「80」に伝える。
【0030】表記情報復元部80は、以上のような手続
きを行ない、各エントリの実際の表記を求める。以上の
例では、送りがな揺らぎとひらがな表記揺らぎが単独で
存在していたが、これらが両方指定されている場合にお
いても同様な処理で復元することができる。
きを行ない、各エントリの実際の表記を求める。以上の
例では、送りがな揺らぎとひらがな表記揺らぎが単独で
存在していたが、これらが両方指定されている場合にお
いても同様な処理で復元することができる。
【0031】次に、表記からの検索手順について、具体
例に基づいて動作の説明を行なう。検索の方法について
は各種の方法があるが、ここでは、二分探索方法につい
て述べる。
例に基づいて動作の説明を行なう。検索の方法について
は各種の方法があるが、ここでは、二分探索方法につい
て述べる。
【0032】初めに、検索入出力部から表記検索コント
ロール部78に対して「わたし達」という単語を検索し
なさいという検索要求を行なったとする。これに対し
て、表記検索コントロール部78は、二分探索方法を用
いて検索を始める。この方法は、日本語表記検索辞書本
体が表記のJIS順に並んでおり、さらに、エントリ長
が固定のため、任意のエントリをダイレクトに参照でき
るため可能になる。最初は全体を対象に検索を行なうの
で、(1)〜(10)の範囲が検索対象になる。この区
間の中間点である(6)について、表記情報復元部80
を用いて、このエントリの示す表記を求める。表記情報
復元部80は、先に述べた方法で、表記「私達」を求
め、表記検索コントロール部78に求めた表記を返す。
次に、表記検索コントロール部78は、表記情報比較部
79を用いて検索要求された「わたし達」と「私達」を
比較する。そうすると、検索要求の文字列の方がJIS
コード順で小さいことがわかり、(6)より前を検索す
る必要があることがわかる。そこで、次は(1)〜
(5)の範囲が検索対象になる。同様の動作を繰り返し
て、中間点の(3)について「わたし達」の表記を求
め、これが表記情報比較部79で一致することがわか
り、これが、求めるエントリであることがわかる。その
結果、対応する日本語読み検索辞書本体97のエントリ
も既にわかっているので、品詞情報等取り出し部75を
用いて品詞情報などを得、その情報を検索結果として返
す。以上の動作により、日本語の表記から辞書検索を行
なうことができる。
ロール部78に対して「わたし達」という単語を検索し
なさいという検索要求を行なったとする。これに対し
て、表記検索コントロール部78は、二分探索方法を用
いて検索を始める。この方法は、日本語表記検索辞書本
体が表記のJIS順に並んでおり、さらに、エントリ長
が固定のため、任意のエントリをダイレクトに参照でき
るため可能になる。最初は全体を対象に検索を行なうの
で、(1)〜(10)の範囲が検索対象になる。この区
間の中間点である(6)について、表記情報復元部80
を用いて、このエントリの示す表記を求める。表記情報
復元部80は、先に述べた方法で、表記「私達」を求
め、表記検索コントロール部78に求めた表記を返す。
次に、表記検索コントロール部78は、表記情報比較部
79を用いて検索要求された「わたし達」と「私達」を
比較する。そうすると、検索要求の文字列の方がJIS
コード順で小さいことがわかり、(6)より前を検索す
る必要があることがわかる。そこで、次は(1)〜
(5)の範囲が検索対象になる。同様の動作を繰り返し
て、中間点の(3)について「わたし達」の表記を求
め、これが表記情報比較部79で一致することがわか
り、これが、求めるエントリであることがわかる。その
結果、対応する日本語読み検索辞書本体97のエントリ
も既にわかっているので、品詞情報等取り出し部75を
用いて品詞情報などを得、その情報を検索結果として返
す。以上の動作により、日本語の表記から辞書検索を行
なうことができる。
【0033】上述の実施例では、検索手段として二分探
索方法を使用したが、検索範囲を狭めるためなどの目的
で、一文字インデックス等の補助情報を用いた検索方法
を採用してもかまわない。
索方法を使用したが、検索範囲を狭めるためなどの目的
で、一文字インデックス等の補助情報を用いた検索方法
を採用してもかまわない。
【0034】上述の実施例では、日本語読み検索辞書本
体97が複数の表記を持っている例について説明をした
が、表記が単一であるような日本語読み検索辞書を持つ
検索装置の場合は、日本語表記検索辞書本体99の送り
がな揺らぎ部分95は省略でき、また、検索部の送りが
な揺らぎ選択部83や送りがな揺らぎ情報取り出し部8
4も省略できる。
体97が複数の表記を持っている例について説明をした
が、表記が単一であるような日本語読み検索辞書を持つ
検索装置の場合は、日本語表記検索辞書本体99の送り
がな揺らぎ部分95は省略でき、また、検索部の送りが
な揺らぎ選択部83や送りがな揺らぎ情報取り出し部8
4も省略できる。
【0035】また、さらに、ひらがな表記も考慮しなく
てよい検索装置の場合は、ひらがな表記揺らぎ部分96
が不必要であり、このような場合は、日本語表記検索辞
書本体は読み検索辞書番号部分94のみになり、非常に
簡単になる。また、ひらがな揺らぎ変換部81とひらが
な揺らぎ情報取り出し部も不要である。
てよい検索装置の場合は、ひらがな表記揺らぎ部分96
が不必要であり、このような場合は、日本語表記検索辞
書本体は読み検索辞書番号部分94のみになり、非常に
簡単になる。また、ひらがな揺らぎ変換部81とひらが
な揺らぎ情報取り出し部も不要である。
【0036】また、日本語読み検索辞書62において、
特開平5−204962号公報で示されているような可
変長のエントリを持つ日本語読み検索辞書本体97と、
読み検索辞書番号からのインデックス98を用いた構成
で検索を行なっていたが、本体が固定長であっても、ま
た、他の方法による辞書圧縮を行なっている辞書であっ
ても、関係なく、日本語表記検索辞書は同様に容量が削
減でき、本発明の効果が発揮される。
特開平5−204962号公報で示されているような可
変長のエントリを持つ日本語読み検索辞書本体97と、
読み検索辞書番号からのインデックス98を用いた構成
で検索を行なっていたが、本体が固定長であっても、ま
た、他の方法による辞書圧縮を行なっている辞書であっ
ても、関係なく、日本語表記検索辞書は同様に容量が削
減でき、本発明の効果が発揮される。
【0037】また、日本語読み検索辞書本体97におい
て、読みの部分と表記の部分との対応がなく、それぞれ
の漢字についてひらがなに復元できないような辞書にお
いても、ひらがな表記揺らぎ部分を、全体が表記そのま
まかひらがなに変換するかの指定に使用することによ
り、全部ひらがなの表記の登録が可能である。
て、読みの部分と表記の部分との対応がなく、それぞれ
の漢字についてひらがなに復元できないような辞書にお
いても、ひらがな表記揺らぎ部分を、全体が表記そのま
まかひらがなに変換するかの指定に使用することによ
り、全部ひらがなの表記の登録が可能である。
【0038】さらに、日本語表記順にソートされた日本
語表記検索辞書のみならず、他の要因によってもソート
することができる。例えば、並べる順番をJISコード
順ではなく辞書順にして検索などを行ないたい場合、日
本語表記検索辞書99と同様の構造を持つ辞書を追加す
ることにより、実現できる。このような追加による辞書
容量の増加はわずかであり、簡単に複数キーで検索でき
る検索装置が構築できる。
語表記検索辞書のみならず、他の要因によってもソート
することができる。例えば、並べる順番をJISコード
順ではなく辞書順にして検索などを行ないたい場合、日
本語表記検索辞書99と同様の構造を持つ辞書を追加す
ることにより、実現できる。このような追加による辞書
容量の増加はわずかであり、簡単に複数キーで検索でき
る検索装置が構築できる。
【0039】さらに、今回の発明は、日本語表記検索装
置のみにとどまらず、構文解析、意味解析等の各種言語
処理の辞書検索装置にも応用でき、さらには、各種の辞
書やデータベースの検索装置に対しても適応できる。
置のみにとどまらず、構文解析、意味解析等の各種言語
処理の辞書検索装置にも応用でき、さらには、各種の辞
書やデータベースの検索装置に対しても適応できる。
【0040】
【発明の効果】請求項1の日本語電子化辞書検索装置に
よれば、日本語読み検索辞書と日本語表記検索辞書とを
統合してデータを共有するように構成したので、表記や
品詞等のデータを2重に持つ必要がなくなり、辞書のメ
モリ容量を大幅に削減できる。請求項2の日本語電子化
辞書検索装置によれば、日本語読み検索辞書の一つのエ
ントリに対して複数の表記が対応している場合でも、全
ての表記に対して検索を行うことができる。
よれば、日本語読み検索辞書と日本語表記検索辞書とを
統合してデータを共有するように構成したので、表記や
品詞等のデータを2重に持つ必要がなくなり、辞書のメ
モリ容量を大幅に削減できる。請求項2の日本語電子化
辞書検索装置によれば、日本語読み検索辞書の一つのエ
ントリに対して複数の表記が対応している場合でも、全
ての表記に対して検索を行うことができる。
【0041】請求項3の日本語電子化辞書検索装置によ
れば、単語の一部または全部がひらがな書きであるよう
な表記を含んでいても、検索を行うことができる。
れば、単語の一部または全部がひらがな書きであるよう
な表記を含んでいても、検索を行うことができる。
【図1】従来例の日本語電子化辞書検索装置の構成を示
すブロック図である。
すブロック図である。
【図2a】従来例の日本語読み検索辞書検索部の構成を
示す図である。
示す図である。
【図2b】従来例の日本語表記検索辞書検索部の構成を
示す図である。
示す図である。
【図3a】従来例の日本語読み検索辞書の構成を示す図
である。
である。
【図3b】従来例の日本語表記検索辞書の構成を示す図
である。
である。
【図4】従来例の表記検索の辞書で表記揺らぎのある場
合に品詞情報等の重複を避けた場合の辞書構造を示す図
である。
合に品詞情報等の重複を避けた場合の辞書構造を示す図
である。
【図5】本発明の日本語電子化辞書検索装置の構成を示
すブロック図である。
すブロック図である。
【図6】本発明の日本語辞書検索部の構成を示す図であ
る。
る。
【図7】本発明の日本語読み検索辞書及び日本語表記検
索辞書の構成を示す図である。
索辞書の構成を示す図である。
61 辞書検索部 62 日本語読み検索辞書 63 日本語表記検索辞書 91 読み部分 92 表記部分 93 情報保持部分 94 読み検索辞書番号部分 95 送りがな揺らぎ部分 96 ひらがな表記揺らぎ部分
Claims (3)
- 【請求項1】 日本語の読みを格納する読み部分と日本
語の表記を格納する表記部分と品詞等の付随する情報を
保持する情報保持部分とを有する日本語読み検索辞書手
段と、前記日本語読み検索辞書手段の読み部分に格納さ
れているそれぞれの日本語の読みに対して付けられた辞
書番号を格納する読み検索辞書番号部分を有する日本語
表記検索辞書手段と、日本語の読みからその日本語の表
記を日本語読み検索辞書手段に基づき検索すると共に、
日本語の表記から日本語表記検索辞書手段の読み検索辞
書番号部分に格納する辞書番号に基づき日本語読み検索
辞書手段を用いて日本語の読みを検索する辞書検索手段
とを具備する日本語電子化辞書検索装置。 - 【請求項2】 前記日本語表記検索辞書手段は、一つの
エントリで読みに対して複数の表記がある場合に、どの
表記に対応するかを示すと共に前記辞書番号に付加され
る揺らぎ情報を格納する送りがな揺らぎ部分を有してい
る請求項1に記載の日本語電子化辞書検索装置。 - 【請求項3】 前記日本語表記検索辞書手段は、ひらが
な交じりの文章の検索を行う場合に、前記日本語読み検
索辞書手段に登録されている表記には無いひらがな書き
用のひらがな表記揺らぎ情報を格納するひらがな表記揺
らぎ部分を有している請求項1又は請求項2に記載の日
本語電子化辞書検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6167185A JPH0830626A (ja) | 1994-07-19 | 1994-07-19 | 日本語電子化辞書検索装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6167185A JPH0830626A (ja) | 1994-07-19 | 1994-07-19 | 日本語電子化辞書検索装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0830626A true JPH0830626A (ja) | 1996-02-02 |
Family
ID=15845008
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6167185A Pending JPH0830626A (ja) | 1994-07-19 | 1994-07-19 | 日本語電子化辞書検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0830626A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2008018287A1 (en) * | 2006-08-07 | 2008-02-14 | Sharp Kabushiki Kaisha | Search device and search database generation device |
-
1994
- 1994-07-19 JP JP6167185A patent/JPH0830626A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2008018287A1 (en) * | 2006-08-07 | 2008-02-14 | Sharp Kabushiki Kaisha | Search device and search database generation device |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5099426A (en) | Method for use of morphological information to cross reference keywords used for information retrieval | |
| US4775956A (en) | Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes | |
| JP3196868B2 (ja) | テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ | |
| US20070179932A1 (en) | Method for finding data, research engine and microprocessor therefor | |
| KR20210105626A (ko) | 기술문서 번역 지원 시스템 | |
| JPH0830626A (ja) | 日本語電子化辞書検索装置 | |
| JPS60176169A (ja) | 文章処理装置 | |
| JPH07182333A (ja) | 日本語処理装置 | |
| JPH0827803B2 (ja) | テキストベース検索方法 | |
| JPH05250416A (ja) | データベースの登録・検索装置 | |
| JP7839543B2 (ja) | 日本語入力システムの漢字仮名変換 | |
| JPH0561902A (ja) | 機械翻訳システム | |
| JPS6246029B2 (ja) | ||
| JP3187671B2 (ja) | 電子辞書表示装置 | |
| JP3873305B2 (ja) | 仮名漢字変換装置および仮名漢字変換方法 | |
| JP3847801B2 (ja) | 文字処理装置及びその処理方法 | |
| JPS6175952A (ja) | 文書入力処理方式 | |
| JPH0785040A (ja) | 表記不統一検出方法およびかな漢字変換方法 | |
| JPH0320866A (ja) | テキストベース検索方式 | |
| JPS6172361A (ja) | かな漢字変換装置 | |
| JPH06223055A (ja) | 文章入力装置 | |
| JPS6198475A (ja) | 日本語文章入力装置 | |
| JPS59221731A (ja) | カナ漢字変換処理装置 | |
| JPH0877160A (ja) | かな漢字変換方法及び装置 | |
| JPH02115974A (ja) | 言語検索装置 |