JP2579976B2 - 電子辞書の検索方式 - Google Patents
電子辞書の検索方式Info
- Publication number
- JP2579976B2 JP2579976B2 JP62304031A JP30403187A JP2579976B2 JP 2579976 B2 JP2579976 B2 JP 2579976B2 JP 62304031 A JP62304031 A JP 62304031A JP 30403187 A JP30403187 A JP 30403187A JP 2579976 B2 JP2579976 B2 JP 2579976B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- unit
- text
- heading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の詳細な説明】 〔概要〕 対話形式の日本語学習システムや日本語文書処理シス
テムなどに用いられる電子辞書の検索方式に関し, 電子辞書の検索操作回数を減少させることを目的と
し, テキストを表示するテキスト表示部と,テキスト中の
任意の文字位置を指示する文字位置指示部と,指示され
た文字位置から1文字ずつ遡って先頭文字位置を決定す
るとともに,遡る最大文字数をしきい値により制限する
先頭文字位置設定部と,先頭文字位置から指示された文
字位置までの文字列で始まるテキスト中の文字列を抽出
する後続文字列抽出部と,抽出された文字列が辞書の見
出し項目として存在するか否かを判定する見出しチェッ
ク部と,見出し項目として存在する文字列を候補文字列
として呈示する候補文字列出力部と,呈示された候補文
字列の中から任意の文字列を選択する文字列選択部と,
選択された文字列の検索を行う文字列検索部 とを設けた構成とする。
テムなどに用いられる電子辞書の検索方式に関し, 電子辞書の検索操作回数を減少させることを目的と
し, テキストを表示するテキスト表示部と,テキスト中の
任意の文字位置を指示する文字位置指示部と,指示され
た文字位置から1文字ずつ遡って先頭文字位置を決定す
るとともに,遡る最大文字数をしきい値により制限する
先頭文字位置設定部と,先頭文字位置から指示された文
字位置までの文字列で始まるテキスト中の文字列を抽出
する後続文字列抽出部と,抽出された文字列が辞書の見
出し項目として存在するか否かを判定する見出しチェッ
ク部と,見出し項目として存在する文字列を候補文字列
として呈示する候補文字列出力部と,呈示された候補文
字列の中から任意の文字列を選択する文字列選択部と,
選択された文字列の検索を行う文字列検索部 とを設けた構成とする。
本発明は,対話形式の日本語学習システムや日本語文
書処理システムなどに用いられる電子辞書の検索方式に
関する。
書処理システムなどに用いられる電子辞書の検索方式に
関する。
特に,本発明は,システム中で意味解釈不明な個所が
ある場合にその個所の一文字を指示することにより,指
示された文字を含むテキスト中の複数の文字列のうち意
味ある語句を呈示するようにした辞書の検索方式に関す
るものである。
ある場合にその個所の一文字を指示することにより,指
示された文字を含むテキスト中の複数の文字列のうち意
味ある語句を呈示するようにした辞書の検索方式に関す
るものである。
日本語学習システムでは,たとえば読解学習の場合,
学習者がシステムの画面に日本語テキストを表示し,学
習者との間で対話形式により学習が進められる。学習者
が,表示されている日本語テキスト中に意味不明の語句
を見出したときには,その語句の意味検索をシステムに
指示することにより,システム内にそなえられている電
子化された辞書(以後,電子辞書という)が検索され,
検索結果が表示されて,必要な意味を知ることが可能に
されている。
学習者がシステムの画面に日本語テキストを表示し,学
習者との間で対話形式により学習が進められる。学習者
が,表示されている日本語テキスト中に意味不明の語句
を見出したときには,その語句の意味検索をシステムに
指示することにより,システム内にそなえられている電
子化された辞書(以後,電子辞書という)が検索され,
検索結果が表示されて,必要な意味を知ることが可能に
されている。
しかしながら,通常において日本語は分かち書きされ
ておらず,このため,学習者にとってはどの文字からど
の文字までが一つの語句であるかということが不明な場
合も生ずる。
ておらず,このため,学習者にとってはどの文字からど
の文字までが一つの語句であるかということが不明な場
合も生ずる。
この問題に対処する従来の方式として,画面上に表示
されたテキスト中の一文字を指示すると,指示された文
字で始まる,テキスト中で引き続く文字列のうち意味あ
る文字列を使用者に知らせる方式がある。
されたテキスト中の一文字を指示すると,指示された文
字で始まる,テキスト中で引き続く文字列のうち意味あ
る文字列を使用者に知らせる方式がある。
この方式によれば,語の始まりが判断できないとき
は,使用者が近辺の各文字の指示を繰り返し,妥当な文
字列を得るという試行錯誤を行わなければならなかっ
た。
は,使用者が近辺の各文字の指示を繰り返し,妥当な文
字列を得るという試行錯誤を行わなければならなかっ
た。
第4図に従来の検査方式の構成を示す。
図中,1はテキストを表示するテキスト表示部,2は検索
語句の先頭文字位置を指示する先頭文字位置指示部,3は
指示された先頭文字で始まるテキスト中の文字列を抽出
する後続文字列抽出部,4はテキスト情報を格納するテキ
スト情報格納部,5は検索語句として可能性のある複数の
候補文字列を呈示する候補文字列出力部,6はテキスト中
の文字列で辞書の見出しとなっているものを調べる見出
しチェック部,7は辞書のインデクスすなわち見出し語句
と辞書情報を格納位置とを対応づけたインデクス情報を
格納するインデクス情報格納部,8は呈示された文字列か
ら検索対象文字列を指定する文字列選択部,9は指定され
た文字列の検索処理を行う文字列検索部,10は意味や文
法などの辞書情報を格納する辞書情報格納部,11は検索
結果を表示する検索結果表示部である。
語句の先頭文字位置を指示する先頭文字位置指示部,3は
指示された先頭文字で始まるテキスト中の文字列を抽出
する後続文字列抽出部,4はテキスト情報を格納するテキ
スト情報格納部,5は検索語句として可能性のある複数の
候補文字列を呈示する候補文字列出力部,6はテキスト中
の文字列で辞書の見出しとなっているものを調べる見出
しチェック部,7は辞書のインデクスすなわち見出し語句
と辞書情報を格納位置とを対応づけたインデクス情報を
格納するインデクス情報格納部,8は呈示された文字列か
ら検索対象文字列を指定する文字列選択部,9は指定され
た文字列の検索処理を行う文字列検索部,10は意味や文
法などの辞書情報を格納する辞書情報格納部,11は検索
結果を表示する検索結果表示部である。
ここで,インデクス情報格納部7および辞書情報格納
部10が電子辞書を構成する。
部10が電子辞書を構成する。
第5図は,第4図に示す従来の検索方式の処理流れ図
であり,以下に第4図を参照しつつ第5図の処理流れ
を,手順ないしにしたがって簡単に説明する。
であり,以下に第4図を参照しつつ第5図の処理流れ
を,手順ないしにしたがって簡単に説明する。
:テキスト情報格納部4に格納されているテキスト表
示部1へ読み出し,画面に表示する。
示部1へ読み出し,画面に表示する。
:学習者は,画面に表示されたテキスト中で意味を知
りたい文字列の先頭文字位置を,先頭文字位置指示部2
により表示する。先頭文字位置指示部2には,カーソル
あるいはライトペン等のポインティング手段が利用でき
る。
りたい文字列の先頭文字位置を,先頭文字位置指示部2
により表示する。先頭文字位置指示部2には,カーソル
あるいはライトペン等のポインティング手段が利用でき
る。
:後続文字列抽出部3は,指示された先頭文字位置の
文字を,テキスト情報格納部4のテキストから抽出する
(最初は,指示された先頭文字位置の文字だけであ
る)。
文字を,テキスト情報格納部4のテキストから抽出する
(最初は,指示された先頭文字位置の文字だけであ
る)。
:見出しチェック部6は,抽出された文字列を対象と
してインデクス情報格納部7の見出し(インデクス)情
報を検索する。
してインデクス情報格納部7の見出し(インデクス)情
報を検索する。
そして対象文字列で始まる見出し(該当見出しとい
う)があるかどうかを調べ,ある場合(YES)はを実
行し,ない場合(NO)はを実行する。
う)があるかどうかを調べ,ある場合(YES)はを実
行し,ない場合(NO)はを実行する。
:見出しチェック部6は,さらに該当見出しが対象文
字列のみの見出しであるかどうかを調べ,対象文字列の
みの見出しである場合(YES)はを実行し,その他の
場合(NO)はを実行する。
字列のみの見出しであるかどうかを調べ,対象文字列の
みの見出しである場合(YES)はを実行し,その他の
場合(NO)はを実行する。
:で得られた該当見出しを候補文字列とし,候補文
字列群のメンバに加える。
字列群のメンバに加える。
:で該当見出しが対象文字列のみの見出しでなかっ
た場合,すなわち対象文字列を先頭にして後続文字列を
含む見出しであった場合には,後続文字列抽出部3によ
り,テキスト情報格納部4から後続文字を一文字だけ取
り出して,対象文字列につなぎ,に戻り,以後の手順
を繰り返す。
た場合,すなわち対象文字列を先頭にして後続文字列を
含む見出しであった場合には,後続文字列抽出部3によ
り,テキスト情報格納部4から後続文字を一文字だけ取
り出して,対象文字列につなぎ,に戻り,以後の手順
を繰り返す。
:で見出しチェック部6が対象文字列で始まる見出
しをインデクス情報中に検出できなかった場合には,そ
れまでに得られた候補文字列群を,候補文字列出力部5
へ出力し,表示する。
しをインデクス情報中に検出できなかった場合には,そ
れまでに得られた候補文字列群を,候補文字列出力部5
へ出力し,表示する。
:学習者は,表示された候補文字列群の中から,検索
対象とする1つの文字列を選択し,文字列選択部8から
指示する。
対象とする1つの文字列を選択し,文字列選択部8から
指示する。
:文字列検索部9は,選択された文字列を見出しとす
る辞書情報(その格納位置はインデクス情報格納部7か
ら得られる)を,辞書情報格納部10で検索する。
る辞書情報(その格納位置はインデクス情報格納部7か
ら得られる)を,辞書情報格納部10で検索する。
:の検索結果を検索結果表示部11へ出力し,表示す
る。
る。
以上のような操作および処理が,意味不明な語句ごと
に実行される。
に実行される。
このように従来方式では,指示された文字で始まる文
字列をテキスト中で長さ1から長さ2,3,4……のように
順に抽出し,それらが辞書の見出しとして存在するかど
うかをチェックする。そして存在するものをすべて表示
してその中から検索すべき文字列を選択させる。
字列をテキスト中で長さ1から長さ2,3,4……のように
順に抽出し,それらが辞書の見出しとして存在するかど
うかをチェックする。そして存在するものをすべて表示
してその中から検索すべき文字列を選択させる。
従来の方式では,テキスト中に意味不明の語句がある
場合,その先頭文字位置を指定していたが,先頭文字の
位置自体が不明である場合があり,そのような場合,先
頭文字位置を仮指定し,それに基づいて得られた候補文
字列や検索結果を見て,適切なものがなければさらに先
頭文字位置の指定をやり直す必要があった。そのため,
学習者の指示操作回数が増大して,学習能率が低下する
という問題が生じた。
場合,その先頭文字位置を指定していたが,先頭文字の
位置自体が不明である場合があり,そのような場合,先
頭文字位置を仮指定し,それに基づいて得られた候補文
字列や検索結果を見て,適切なものがなければさらに先
頭文字位置の指定をやり直す必要があった。そのため,
学習者の指示操作回数が増大して,学習能率が低下する
という問題が生じた。
本発明は,テキスト中に意味不明の語句があった場
合,その中の任意の1つの文字を指定することによっ
て,その文字を任意の位置に含む複数の文字列を検索対
象とすることによって,電子辞書の検索操作回数を減少
させることを目的とする。
合,その中の任意の1つの文字を指定することによっ
て,その文字を任意の位置に含む複数の文字列を検索対
象とすることによって,電子辞書の検索操作回数を減少
させることを目的とする。
このため,本発明では,あらかじめ用意されたしきい
値を記憶するしきい値格納手段と,指示された文字から
1文字ずつしきい値数分の文字まで遡った各文字を先頭
文字とする先頭文字設定手段と,各先頭文字から指示さ
れた文字までの文字列で始まるテキスト中の文字列を抽
出する後続文字列抽出手段とを付加することによって,
従来方式における問題の解決を図っている。
値を記憶するしきい値格納手段と,指示された文字から
1文字ずつしきい値数分の文字まで遡った各文字を先頭
文字とする先頭文字設定手段と,各先頭文字から指示さ
れた文字までの文字列で始まるテキスト中の文字列を抽
出する後続文字列抽出手段とを付加することによって,
従来方式における問題の解決を図っている。
第1図は本発明の原理的構成図である。
図中,1はテキスト表示部,4はテキスト情報格納部,5は
検索語として可能性のある複数の候補文字列を出力する
候補文字列出力部,6はテキスト中の文字列で辞書の見出
しとなっているものを調べる見出しチェック部,7は辞書
の見出しと辞書情報の位置を対応づけたインデクス情報
を格納するインデクス情報格納部,8は呈示された文字列
から検索対象を指定する文字列選択部,9は指定された文
字列について検索処理を行う文字列検索部,10は辞書情
報格納部,11は検索結果表示部であり,これらは第4図
に示した従来方式と同じものである。
検索語として可能性のある複数の候補文字列を出力する
候補文字列出力部,6はテキスト中の文字列で辞書の見出
しとなっているものを調べる見出しチェック部,7は辞書
の見出しと辞書情報の位置を対応づけたインデクス情報
を格納するインデクス情報格納部,8は呈示された文字列
から検索対象を指定する文字列選択部,9は指定された文
字列について検索処理を行う文字列検索部,10は辞書情
報格納部,11は検索結果表示部であり,これらは第4図
に示した従来方式と同じものである。
次に12は指示された文字から遡って先頭文字の位置を
決める先頭文字位置設定部,13は先頭文字から始まり指
示された文字まで含むテキスト中の文字列を抽出する後
続文字列抽出部,14は意味不明語句近辺の文字を指示す
る文字位置指示部,15はあらかじめ設定したしきい値を
記憶するしきい値格納部であり,これらは第4図の従来
方式の構成に対して新たに追加した,もしくは従来方式
の構成の一部を修正したものである。
決める先頭文字位置設定部,13は先頭文字から始まり指
示された文字まで含むテキスト中の文字列を抽出する後
続文字列抽出部,14は意味不明語句近辺の文字を指示す
る文字位置指示部,15はあらかじめ設定したしきい値を
記憶するしきい値格納部であり,これらは第4図の従来
方式の構成に対して新たに追加した,もしくは従来方式
の構成の一部を修正したものである。
第4図に示された従来方式においては,指示された文
字を語句の先頭文字と解釈されるのに対し,本発明の方
式では,語句を構成する一文字と解釈する。このため,
指示された文字の前方のの一定範囲内にある各文字を語
句の開始文字として,以後第5図で説明したような従来
方式の処理を自動的に繰り返し適用するものである。
字を語句の先頭文字と解釈されるのに対し,本発明の方
式では,語句を構成する一文字と解釈する。このため,
指示された文字の前方のの一定範囲内にある各文字を語
句の開始文字として,以後第5図で説明したような従来
方式の処理を自動的に繰り返し適用するものである。
このため,指示された文字より後ろの文字を先頭とす
ることはなく,また指示された文字より前の文字を先頭
とするときは必ず指示された文字までを少なくとも含む
ようにする。
ることはなく,また指示された文字より前の文字を先頭
とするときは必ず指示された文字までを少なくとも含む
ようにする。
第1図において,テキスト情報処理部4のテキストは
テキスト表示部1に読み出され画面表示される。
テキスト表示部1に読み出され画面表示される。
ここでたとえば学習者が,文字位置指示部14から,意
味不明の語句中に含まれる適当な1つの文字の位置を指
示すると,先頭文字位置設定部12は,しきい値格納部15
にあらかじめ設定してあるしきい値の範囲内で,指示さ
れた文字位置の前方にある1つの文字位置を順次選択し
て,先頭文字位置として設定し,後続文字列抽出部13に
通知する。
味不明の語句中に含まれる適当な1つの文字の位置を指
示すると,先頭文字位置設定部12は,しきい値格納部15
にあらかじめ設定してあるしきい値の範囲内で,指示さ
れた文字位置の前方にある1つの文字位置を順次選択し
て,先頭文字位置として設定し,後続文字列抽出部13に
通知する。
後続文字列抽出部13は,設定された各先頭文字位置か
ら,文字位置指示部14で指示された文字位置までを少な
くとも含む後続文字列の長さをそれぞれ設定し,それら
に対応する文字列をテキスト情報格納部4から抽出す
る。
ら,文字位置指示部14で指示された文字位置までを少な
くとも含む後続文字列の長さをそれぞれ設定し,それら
に対応する文字列をテキスト情報格納部4から抽出す
る。
見出しチェック部6は,抽出された各文字列について
インデクス情報格納部7のインデクス情報を検索し,該
当する見出しをもつインデクス情報があるとき,その見
出しすなわち検索文字列を候補文字列として候補文字列
出力部5へ出力し,画面表示させる。
インデクス情報格納部7のインデクス情報を検索し,該
当する見出しをもつインデクス情報があるとき,その見
出しすなわち検索文字列を候補文字列として候補文字列
出力部5へ出力し,画面表示させる。
学習者は文字列選択部8により,候補文字列を1つ選
択し,文字列検索部9に通知する。
択し,文字列検索部9に通知する。
文字列検索部9は,通知された1つの候補文字列につ
いて対応するインデクス情報を用いて辞書情報格納部10
の辞書情報を検索し,検索結果の辞書情報すなわち,意
味や文法等の情報を検索結果表示部11へ出力し,表示さ
せる。
いて対応するインデクス情報を用いて辞書情報格納部10
の辞書情報を検索し,検索結果の辞書情報すなわち,意
味や文法等の情報を検索結果表示部11へ出力し,表示さ
せる。
学習者は検索結果の辞書情報の内容が満足できないも
のであるとき,他の候補文字列を選択して再検索を行わ
せることができ,また文字位置の表示をやり直して他の
文字位置を表示し,それについて異なる候補文字列の生
成と辞書情報の検索とを繰り返すことができる。
のであるとき,他の候補文字列を選択して再検索を行わ
せることができ,また文字位置の表示をやり直して他の
文字位置を表示し,それについて異なる候補文字列の生
成と辞書情報の検索とを繰り返すことができる。
第2図に本発明の一実施例を示す。
図中,1はテキストの表示部,4はテキスト情報格納部,5
は候補文字列出力部,6は見出しチェック部,7はインデク
ス情報格納部,8は文字列選択部,9は文字列検索部,10は
辞書情報格納部,11は検索結果表示部,12は先頭文字位置
設定部,13は後続文字列抽出部,14は文字位置指示部,15
は文字コードごとに,指示された文字位置から遡ること
ができる最大の戻り文字数をしきい値として格納したし
きい値格納部であり,これらの構成要素は第1図の原理
的構成図と同じであるが,テキスト情報格納部から先頭
文字位置設定部12に対して情報を送るルートがある点で
第1図の構成とは異なっている。
は候補文字列出力部,6は見出しチェック部,7はインデク
ス情報格納部,8は文字列選択部,9は文字列検索部,10は
辞書情報格納部,11は検索結果表示部,12は先頭文字位置
設定部,13は後続文字列抽出部,14は文字位置指示部,15
は文字コードごとに,指示された文字位置から遡ること
ができる最大の戻り文字数をしきい値として格納したし
きい値格納部であり,これらの構成要素は第1図の原理
的構成図と同じであるが,テキスト情報格納部から先頭
文字位置設定部12に対して情報を送るルートがある点で
第1図の構成とは異なっている。
例として,テキスト文章中に ……ABCDEFGHIJKLMN…… という文字列があるとする。
文字位置指示部14で『H』が指示されたとすると,先
頭文字位置設定部12はまずこの『H』の位置を先頭文字
位置とする。
頭文字位置設定部12はまずこの『H』の位置を先頭文字
位置とする。
後続文字列抽出部13は,これを受けてまず長さ1の文
字列『H』を抽出する。
字列『H』を抽出する。
見出しチェック部6は,この文字列『H』て始まる見
出しがあるかどうかチェックし,文字列『H』が完結し
た見出しであれば,候補文字列出力部5に文字列『H』
を送る。
出しがあるかどうかチェックし,文字列『H』が完結し
た見出しであれば,候補文字列出力部5に文字列『H』
を送る。
文字列『H』で始まる見出しがある場合には,後続文
字列抽出部13が,テキスト中で『H』に続く文字『I』
を見つけ,文字列『HI』を抽出する。
字列抽出部13が,テキスト中で『H』に続く文字『I』
を見つけ,文字列『HI』を抽出する。
見出しチェック部6は,今度は文字列『HI』で始まる
見出しがあるかどうかをチェックし,文字列『HI』が完
結した見出しであれば候補文字列出力部5に文字列『H
I』を送る。
見出しがあるかどうかをチェックし,文字列『HI』が完
結した見出しであれば候補文字列出力部5に文字列『H
I』を送る。
これを繰り返し,後続文字列抽出部13が次々に伸ばし
ていくが,ある時点で後続文字列抽出部13の抽出した文
字列(たとえば『HIJK』)で始まる見出しが存在しない
時に,これらの処理が終了する。
ていくが,ある時点で後続文字列抽出部13の抽出した文
字列(たとえば『HIJK』)で始まる見出しが存在しない
時に,これらの処理が終了する。
次に,先頭文字位置設定部12が先程設定した先頭文字
位置を一文字分遡らせて,『G』の位置を先頭文字位置
とする。このとき,先頭文字位置設定部12は,先に指示
された文字位置の文字『H』に対応するしきい値を,し
きい値格納部15から取り出し,戻り文字数がしきい値内
にあることを確認する。
位置を一文字分遡らせて,『G』の位置を先頭文字位置
とする。このとき,先頭文字位置設定部12は,先に指示
された文字位置の文字『H』に対応するしきい値を,し
きい値格納部15から取り出し,戻り文字数がしきい値内
にあることを確認する。
後続文字列抽出部13は,これを受けてまず長さ2の文
字列『GH』を抽出する。
字列『GH』を抽出する。
ここからまた,上記の手順が繰り返され『GH』『GH
I』『GHIJ』……で始まる見出しがあるかどうかチェッ
クされ,ない時点でここの処理が終了する。
I』『GHIJ』……で始まる見出しがあるかどうかチェッ
クされ,ない時点でここの処理が終了する。
再び先頭文字位置設定部12が先程設定した先頭文字位
置を一文字分遡らせて『F』の位置を先頭文字位置と
し,後続文字列抽出部13が,まず長さ3の文字列『FG
H』を抽出する。ここからまた上の手順が繰り返され
る。
置を一文字分遡らせて『F』の位置を先頭文字位置と
し,後続文字列抽出部13が,まず長さ3の文字列『FG
H』を抽出する。ここからまた上の手順が繰り返され
る。
なお先頭文字位置説底部12がどこまで遡って先頭文字
を設定するかということについては,前述したようにし
きい値を調べて,その範囲内に設定される。
を設定するかということについては,前述したようにし
きい値を調べて,その範囲内に設定される。
このしきい値は,最初に指示された位置の文字『H』
に依存している。あらかじめ,全ての文字について見出
し中の何文字目に出現しているかが調査されており,そ
の最大文字数をもとにしきい値が決められる。例えば,
前もって辞書のすべての見出しについて文字『H』が出
現するか否か調べ,出現する場合にはその見出しの先頭
から何文字目に出現するかを調べておく。仮にその最大
値が4文字目であったとすれば,文字『H』に関して遡
るべき文字数のしきい値は3となり,したがって,先頭
文字位置設定部12は文字『E』の位置まで遡るが,そこ
までで処理が終了し,文字『D』の位置までは遡らな
い。
に依存している。あらかじめ,全ての文字について見出
し中の何文字目に出現しているかが調査されており,そ
の最大文字数をもとにしきい値が決められる。例えば,
前もって辞書のすべての見出しについて文字『H』が出
現するか否か調べ,出現する場合にはその見出しの先頭
から何文字目に出現するかを調べておく。仮にその最大
値が4文字目であったとすれば,文字『H』に関して遡
るべき文字数のしきい値は3となり,したがって,先頭
文字位置設定部12は文字『E』の位置まで遡るが,そこ
までで処理が終了し,文字『D』の位置までは遡らな
い。
次に,以上の処理の結果,どういう文字列が該当文字
列として抽出されるかということを説明する。
列として抽出されるかということを説明する。
テキスト文章中に, ……には日本国有鉄道の…… という文字列が出現するとする。
指示された文字が『日』であった場合には,『日』
『日本』『日本国』『日本国有鉄道』の4つの文字列が
抽出される。
『日本』『日本国』『日本国有鉄道』の4つの文字列が
抽出される。
同様に『本』が指示された場合には,『本』『本国』
『日本』『日本国』『日本国有鉄道』の5文字列が抽出
される。
『日本』『日本国』『日本国有鉄道』の5文字列が抽出
される。
『国』が指示された場合には,『国』『国有』『国有
鉄道』『本国』『日本国』『日本国有鉄道』の6つの文
字列が抽出される。
鉄道』『本国』『日本国』『日本国有鉄道』の6つの文
字列が抽出される。
『有』が指示された場合には,『有』『国有』『国有
鉄道』『日本国有鉄道』の4つの文字列が抽出される。
鉄道』『日本国有鉄道』の4つの文字列が抽出される。
『鉄』が指示された場合には,『鉄』『鉄道』『国有
鉄道』『日本国有鉄道』の4つの文字列が抽出される。
鉄道』『日本国有鉄道』の4つの文字列が抽出される。
『道』が指示された場合には,『道』『鉄道』『国有
鉄道』『日本国有鉄道』の4つの文字列が抽出される。
すなわち,以下に示すようになる。
鉄道』『日本国有鉄道』の4つの文字列が抽出される。
すなわち,以下に示すようになる。
このように,見出しに「日本国有鉄道」という文字列
が存在し,テキスト文章中に「日本国有鉄道」という文
字列が出現している場合,この6文字のいずれを指示し
ても,「日本国有鉄道」という文字列が利用者に呈示さ
れる。
が存在し,テキスト文章中に「日本国有鉄道」という文
字列が出現している場合,この6文字のいずれを指示し
ても,「日本国有鉄道」という文字列が利用者に呈示さ
れる。
なお,文字列の抽出順序は上記説明の通りであるが,
通常の場合,見出しとして存在する最長の文字列が文章
中でも意味をなすことが多いので,抽出された文字列を
長さでソーティングし,長いものから順に利用者に呈示
する。
通常の場合,見出しとして存在する最長の文字列が文章
中でも意味をなすことが多いので,抽出された文字列を
長さでソーティングし,長いものから順に利用者に呈示
する。
第3図は,第2図に示された実施例の処理流れ図であ
る。以下に,第2図を参照して,第3図の処理流れの概
要を,手順ないしにしたがって説明する。
る。以下に,第2図を参照して,第3図の処理流れの概
要を,手順ないしにしたがって説明する。
:テキスト表示部1により,テキスト情報格納部4に
あるテキストを表示する。
あるテキストを表示する。
:学習者が,文字位置指示部14により,意味不明の語
句中に含まれる適当な1つの文字の位置を指示する(以
後,指示文字位置という)。
句中に含まれる適当な1つの文字の位置を指示する(以
後,指示文字位置という)。
:先頭文字位置設定部12は,先頭文字位置を与えるた
めの,指示文字位置から前方への戻り文字数を最初は
“0"とし,後続文字列抽出部13に通知する。
めの,指示文字位置から前方への戻り文字数を最初は
“0"とし,後続文字列抽出部13に通知する。
:後続文字列抽出部13は,指示文字位置から戻り文字
数(最初は“0")分だけ遡った位置を先頭文字位置とし
て設定する。
数(最初は“0")分だけ遡った位置を先頭文字位置とし
て設定する。
:後続文字列抽出部13は,次に,先頭文字位置から指
示文字位置までの文字列を検索すべき対象の文字列(以
後,対象文字列という)として,テキスト情報格納部4
のテキストから抽出する。
示文字位置までの文字列を検索すべき対象の文字列(以
後,対象文字列という)として,テキスト情報格納部4
のテキストから抽出する。
:見出しチェック部6は,インデクス情報格納部7の
見出しを,対象文字列で検索し,対象文字列で始まる見
出しがあるかどうかを調べる。ある場合(YES)はを
実行し,ない場合(NO)はを実行する。
見出しを,対象文字列で検索し,対象文字列で始まる見
出しがあるかどうかを調べる。ある場合(YES)はを
実行し,ない場合(NO)はを実行する。
:見出しチェック部6は,さらにその見出しが対象文
字列と同じ長さの見出しであるかどうかを調べる。同じ
長さであれば(YES)を実行し,その他の場合(NO)
はを実行する。
字列と同じ長さの見出しであるかどうかを調べる。同じ
長さであれば(YES)を実行し,その他の場合(NO)
はを実行する。
:その対象文字列を候補文字列群のメンバに加える。
:その対象文字列に後続文字を1つつなぎ,対象文字
列を更新してに戻る。
列を更新してに戻る。
:で,見出しチェック部6が,対象文字列で始まる
見出しを検出できなかったとき,先頭文字位置設定部12
は戻り文字数を1だけ増やす。
見出しを検出できなかったとき,先頭文字位置設定部12
は戻り文字数を1だけ増やす。
:先頭文字位置設定部12は,次に,更新された戻り文
字数がしきい値より大きいかどうかを調べる。大きい場
合(YES)はを実行し,その他の場合(NO)はへ戻
る。
字数がしきい値より大きいかどうかを調べる。大きい場
合(YES)はを実行し,その他の場合(NO)はへ戻
る。
:候補文字列出力部5は,それまでに検出された候補
文字列群をソーティングする。
文字列群をソーティングする。
:ソーティングした候補文字列群を表示する。
:学習者は,文字列選択部8を介して,表示された候
補文字列群の中から1つの検索文字列を選択する。
補文字列群の中から1つの検索文字列を選択する。
:文字列検索部9は,その検索文字列に対応するイン
デクス情報から該当辞書情報の格納位置を求め,辞書情
報格納部10の辞書情報を検索する。
デクス情報から該当辞書情報の格納位置を求め,辞書情
報格納部10の辞書情報を検索する。
:検索結果を検索結果表示部11へ出力し,表示させ
る。
る。
本発明によれば,利用者は意味不明の語句の始まりさ
えわかならない場合でも,その辺りの文字を適当に指示
するだけで,妥当な語句の候補を容易に知ることがで
き,たとえば日本語学習システムの場合には,必要とす
る操作回数の削減により,学習能率の向上が図られる。
えわかならない場合でも,その辺りの文字を適当に指示
するだけで,妥当な語句の候補を容易に知ることがで
き,たとえば日本語学習システムの場合には,必要とす
る操作回数の削減により,学習能率の向上が図られる。
第1図は本発明の原理的構成図,第2図は本発明の1実
施例の構成図,第3図は第2図に示す実施例の処理フロ
ー図,第4図は従来方式の構成図,第5図は第4図に示
す従来方式の処理フロー図である。 第1図中, 1:テキスト表示部 5:候補文字列出力部 6:見出しチェック部 7:インデクス情報格納部 8:文字列選択部 9:文字列検索部 10:辞書情報格納部 11:検索結果表示部 12:先頭文字位置設定部 14:文字位置指示部 15:しきい値格納部
施例の構成図,第3図は第2図に示す実施例の処理フロ
ー図,第4図は従来方式の構成図,第5図は第4図に示
す従来方式の処理フロー図である。 第1図中, 1:テキスト表示部 5:候補文字列出力部 6:見出しチェック部 7:インデクス情報格納部 8:文字列選択部 9:文字列検索部 10:辞書情報格納部 11:検索結果表示部 12:先頭文字位置設定部 14:文字位置指示部 15:しきい値格納部
Claims (3)
- 【請求項1】テキストを表示するテキスト表示部(1)
と,テキスト中の任意の文字位置を指示する文字位置指
示部(14)と, 指示された文字位置から1文字ずつ遡って先頭文字位置
を決定するとともに,遡る最大文字数をしきい値により
制限する先頭文字位置設定部(12)と, 先頭文字位置から指示された文字位置までの文字列で始
まるテキスト中の文字列を抽出する後続文字列抽出部
(13)と, 抽出された文字列が辞書の見出し項目として存在するか
否かを判定する見出しチェック部(6)と, 見出し項目として存在する文字列を候補文字列として呈
示する候補文字列出力部(5)と, 呈示された候補文字列の中から任意の文字列を選択する
文字列選択部(8)と, 選択された文字列の検索を行う文字列検索部(9)とを
設けたことを特徴とする電子辞書の検索方式。 - 【請求項2】遡る文字数のしきい値を,指示された文字
位置の文字によって異なるものとし,この文字があらゆ
る見出し語句中で最後位に出現する際の文字位置によっ
て決定することを特徴とする特許請求の範囲第1項に記
載の電子辞書の検索方式。 - 【請求項3】呈示する文字列を候補文字列長の長いもの
から順に呈示する機能を設けたことを特徴とする特許請
求の範囲第1項に記載の電子辞書の検索方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62304031A JP2579976B2 (ja) | 1987-12-01 | 1987-12-01 | 電子辞書の検索方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62304031A JP2579976B2 (ja) | 1987-12-01 | 1987-12-01 | 電子辞書の検索方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH01145773A JPH01145773A (ja) | 1989-06-07 |
| JP2579976B2 true JP2579976B2 (ja) | 1997-02-12 |
Family
ID=17928227
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62304031A Expired - Fee Related JP2579976B2 (ja) | 1987-12-01 | 1987-12-01 | 電子辞書の検索方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2579976B2 (ja) |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS62221027A (ja) * | 1986-03-20 | 1987-09-29 | Fujitsu Ltd | 単語分割装置における単語候補検索方式 |
-
1987
- 1987-12-01 JP JP62304031A patent/JP2579976B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH01145773A (ja) | 1989-06-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5745745A (en) | Text search method and apparatus for structured documents | |
| US4677585A (en) | Method for obtaining common mode information and common field attribute information for a plurality of card images | |
| KR960018993A (ko) | 정보 검색 방법 및 시스템 | |
| EP0120977A1 (en) | Card image data processing system | |
| JP2579976B2 (ja) | 電子辞書の検索方式 | |
| JPH0773197A (ja) | 異表記語辞書作成支援装置 | |
| JPH08180066A (ja) | インデックス作成方法、文書検索方法及び文書検索装置 | |
| JP2701350B2 (ja) | 文書読取装置 | |
| JP2922365B2 (ja) | Ocr処理システムにおける漢字住所データ処理方法 | |
| JP2005050175A (ja) | イメージデータ文書検索システム | |
| JPS63293674A (ja) | 文章を検索・表示する方法 | |
| JPS61265633A (ja) | 発音記号による辞書検索処理方式 | |
| JPH08190560A (ja) | 構造テスト装置 | |
| JP2838972B2 (ja) | 自動索引作成装置 | |
| JPH09223136A (ja) | 文字検査方法および検査文字出力装置 | |
| JPS63184864A (ja) | 文章作成装置 | |
| JPH05233714A (ja) | 関連語情報作成支援方式 | |
| JPH06290298A (ja) | 誤字の修正方法 | |
| JPH0630100B2 (ja) | 仮名漢字変換方式 | |
| JPH0827819B2 (ja) | 手書き文字認識の侯補文字表示方法及びそれを用いた手書き文字認識装置 | |
| JPH0746357B2 (ja) | 文書作成装置 | |
| JPH03105667A (ja) | 索引ページデータ自動作成処理方式 | |
| JPH0778137A (ja) | コメント付与方法及び文書処理装置 | |
| JPH02158864A (ja) | 文書作成装置 | |
| JPH05101117A (ja) | 画像データベース検索方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |