JP2579976B2

JP2579976B2 - 電子辞書の検索方式

Info

Publication number: JP2579976B2
Application number: JP62304031A
Authority: JP
Inventors: 裕二木島
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1987-12-01
Filing date: 1987-12-01
Publication date: 1997-02-12
Anticipated expiration: 2012-02-12
Also published as: JPH01145773A

Description

【発明の詳細な説明】〔概要〕対話形式の日本語学習システムや日本語文書処理シス
テムなどに用いられる電子辞書の検索方式に関し，電子辞書の検索操作回数を減少させることを目的と
し，テキストを表示するテキスト表示部と，テキスト中の
任意の文字位置を指示する文字位置指示部と，指示され
た文字位置から１文字ずつ遡って先頭文字位置を決定す
るとともに，遡る最大文字数をしきい値により制限する
先頭文字位置設定部と，先頭文字位置から指示された文
字位置までの文字列で始まるテキスト中の文字列を抽出
する後続文字列抽出部と，抽出された文字列が辞書の見
出し項目として存在するか否かを判定する見出しチェッ
ク部と，見出し項目として存在する文字列を候補文字列
として呈示する候補文字列出力部と，呈示された候補文
字列の中から任意の文字列を選択する文字列選択部と，
選択された文字列の検索を行う文字列検索部とを設けた構成とする。

〔産業上の利用分野〕

本発明は，対話形式の日本語学習システムや日本語文
書処理システムなどに用いられる電子辞書の検索方式に
関する。

特に，本発明は，システム中で意味解釈不明な個所が
ある場合にその個所の一文字を指示することにより，指
示された文字を含むテキスト中の複数の文字列のうち意
味ある語句を呈示するようにした辞書の検索方式に関す
るものである。

〔従来の技術〕

日本語学習システムでは，たとえば読解学習の場合，
学習者がシステムの画面に日本語テキストを表示し，学
習者との間で対話形式により学習が進められる。学習者
が，表示されている日本語テキスト中に意味不明の語句
を見出したときには，その語句の意味検索をシステムに
指示することにより，システム内にそなえられている電
子化された辞書（以後，電子辞書という）が検索され，
検索結果が表示されて，必要な意味を知ることが可能に
されている。

しかしながら，通常において日本語は分かち書きされ
ておらず，このため，学習者にとってはどの文字からど
の文字までが一つの語句であるかということが不明な場
合も生ずる。

この問題に対処する従来の方式として，画面上に表示
されたテキスト中の一文字を指示すると，指示された文
字で始まる，テキスト中で引き続く文字列のうち意味あ
る文字列を使用者に知らせる方式がある。

この方式によれば，語の始まりが判断できないとき
は，使用者が近辺の各文字の指示を繰り返し，妥当な文
字列を得るという試行錯誤を行わなければならなかっ
た。

第４図に従来の検査方式の構成を示す。

図中,1はテキストを表示するテキスト表示部,2は検索
語句の先頭文字位置を指示する先頭文字位置指示部,3は
指示された先頭文字で始まるテキスト中の文字列を抽出
する後続文字列抽出部,4はテキスト情報を格納するテキ
スト情報格納部,5は検索語句として可能性のある複数の
候補文字列を呈示する候補文字列出力部,6はテキスト中
の文字列で辞書の見出しとなっているものを調べる見出
しチェック部,7は辞書のインデクスすなわち見出し語句
と辞書情報を格納位置とを対応づけたインデクス情報を
格納するインデクス情報格納部,8は呈示された文字列か
ら検索対象文字列を指定する文字列選択部,9は指定され
た文字列の検索処理を行う文字列検索部,10は意味や文
法などの辞書情報を格納する辞書情報格納部,11は検索
結果を表示する検索結果表示部である。

ここで，インデクス情報格納部７および辞書情報格納
部10が電子辞書を構成する。

第５図は，第４図に示す従来の検索方式の処理流れ図
であり，以下に第４図を参照しつつ第５図の処理流れ
を，手順ないしにしたがって簡単に説明する。

：テキスト情報格納部４に格納されているテキスト表
示部１へ読み出し，画面に表示する。

：学習者は，画面に表示されたテキスト中で意味を知
りたい文字列の先頭文字位置を，先頭文字位置指示部２
により表示する。先頭文字位置指示部２には，カーソル
あるいはライトペン等のポインティング手段が利用でき
る。

：後続文字列抽出部３は，指示された先頭文字位置の
文字を，テキスト情報格納部４のテキストから抽出する
（最初は，指示された先頭文字位置の文字だけであ
る）。

：見出しチェック部６は，抽出された文字列を対象と
してインデクス情報格納部７の見出し（インデクス）情
報を検索する。

そして対象文字列で始まる見出し（該当見出しとい
う）があるかどうかを調べ，ある場合（YES）はを実
行し，ない場合（NO）はを実行する。

：見出しチェック部６は，さらに該当見出しが対象文
字列のみの見出しであるかどうかを調べ，対象文字列の
みの見出しである場合（YES）はを実行し，その他の
場合（NO）はを実行する。

：で得られた該当見出しを候補文字列とし，候補文
字列群のメンバに加える。

：で該当見出しが対象文字列のみの見出しでなかっ
た場合，すなわち対象文字列を先頭にして後続文字列を
含む見出しであった場合には，後続文字列抽出部３によ
り，テキスト情報格納部４から後続文字を一文字だけ取
り出して，対象文字列につなぎ，に戻り，以後の手順
を繰り返す。

：で見出しチェック部６が対象文字列で始まる見出
しをインデクス情報中に検出できなかった場合には，そ
れまでに得られた候補文字列群を，候補文字列出力部５
へ出力し，表示する。

：学習者は，表示された候補文字列群の中から，検索
対象とする１つの文字列を選択し，文字列選択部８から
指示する。

：文字列検索部９は，選択された文字列を見出しとす
る辞書情報（その格納位置はインデクス情報格納部７か
ら得られる）を，辞書情報格納部10で検索する。

：の検索結果を検索結果表示部11へ出力し，表示す
る。

以上のような操作および処理が，意味不明な語句ごと
に実行される。

このように従来方式では，指示された文字で始まる文
字列をテキスト中で長さ１から長さ2,3,4……のように
順に抽出し，それらが辞書の見出しとして存在するかど
うかをチェックする。そして存在するものをすべて表示
してその中から検索すべき文字列を選択させる。

〔発明が解決しようとする問題点〕

従来の方式では，テキスト中に意味不明の語句がある
場合，その先頭文字位置を指定していたが，先頭文字の
位置自体が不明である場合があり，そのような場合，先
頭文字位置を仮指定し，それに基づいて得られた候補文
字列や検索結果を見て，適切なものがなければさらに先
頭文字位置の指定をやり直す必要があった。そのため，
学習者の指示操作回数が増大して，学習能率が低下する
という問題が生じた。

本発明は，テキスト中に意味不明の語句があった場
合，その中の任意の１つの文字を指定することによっ
て，その文字を任意の位置に含む複数の文字列を検索対
象とすることによって，電子辞書の検索操作回数を減少
させることを目的とする。

〔問題点を解決するための手段〕

このため，本発明では，あらかじめ用意されたしきい
値を記憶するしきい値格納手段と，指示された文字から
１文字ずつしきい値数分の文字まで遡った各文字を先頭
文字とする先頭文字設定手段と，各先頭文字から指示さ
れた文字までの文字列で始まるテキスト中の文字列を抽
出する後続文字列抽出手段とを付加することによって，
従来方式における問題の解決を図っている。

第１図は本発明の原理的構成図である。

図中,1はテキスト表示部,4はテキスト情報格納部,5は
検索語として可能性のある複数の候補文字列を出力する
候補文字列出力部,6はテキスト中の文字列で辞書の見出
しとなっているものを調べる見出しチェック部,7は辞書
の見出しと辞書情報の位置を対応づけたインデクス情報
を格納するインデクス情報格納部,8は呈示された文字列
から検索対象を指定する文字列選択部,9は指定された文
字列について検索処理を行う文字列検索部,10は辞書情
報格納部,11は検索結果表示部であり，これらは第４図
に示した従来方式と同じものである。

次に12は指示された文字から遡って先頭文字の位置を
決める先頭文字位置設定部,13は先頭文字から始まり指
示された文字まで含むテキスト中の文字列を抽出する後
続文字列抽出部,14は意味不明語句近辺の文字を指示す
る文字位置指示部,15はあらかじめ設定したしきい値を
記憶するしきい値格納部であり，これらは第４図の従来
方式の構成に対して新たに追加した，もしくは従来方式
の構成の一部を修正したものである。

〔作用〕

第４図に示された従来方式においては，指示された文
字を語句の先頭文字と解釈されるのに対し，本発明の方
式では，語句を構成する一文字と解釈する。このため，
指示された文字の前方のの一定範囲内にある各文字を語
句の開始文字として，以後第５図で説明したような従来
方式の処理を自動的に繰り返し適用するものである。

このため，指示された文字より後ろの文字を先頭とす
ることはなく，また指示された文字より前の文字を先頭
とするときは必ず指示された文字までを少なくとも含む
ようにする。

第１図において，テキスト情報処理部４のテキストは
テキスト表示部１に読み出され画面表示される。

ここでたとえば学習者が，文字位置指示部14から，意
味不明の語句中に含まれる適当な１つの文字の位置を指
示すると，先頭文字位置設定部12は，しきい値格納部15
にあらかじめ設定してあるしきい値の範囲内で，指示さ
れた文字位置の前方にある１つの文字位置を順次選択し
て，先頭文字位置として設定し，後続文字列抽出部13に
通知する。

後続文字列抽出部13は，設定された各先頭文字位置か
ら，文字位置指示部14で指示された文字位置までを少な
くとも含む後続文字列の長さをそれぞれ設定し，それら
に対応する文字列をテキスト情報格納部４から抽出す
る。

見出しチェック部６は，抽出された各文字列について
インデクス情報格納部７のインデクス情報を検索し，該
当する見出しをもつインデクス情報があるとき，その見
出しすなわち検索文字列を候補文字列として候補文字列
出力部５へ出力し，画面表示させる。

学習者は文字列選択部８により，候補文字列を１つ選
択し，文字列検索部９に通知する。

文字列検索部９は，通知された１つの候補文字列につ
いて対応するインデクス情報を用いて辞書情報格納部10
の辞書情報を検索し，検索結果の辞書情報すなわち，意
味や文法等の情報を検索結果表示部11へ出力し，表示さ
せる。

学習者は検索結果の辞書情報の内容が満足できないも
のであるとき，他の候補文字列を選択して再検索を行わ
せることができ，また文字位置の表示をやり直して他の
文字位置を表示し，それについて異なる候補文字列の生
成と辞書情報の検索とを繰り返すことができる。

〔実施例〕

第２図に本発明の一実施例を示す。

図中,1はテキストの表示部,4はテキスト情報格納部,5
は候補文字列出力部,6は見出しチェック部,7はインデク
ス情報格納部,8は文字列選択部,9は文字列検索部,10は
辞書情報格納部,11は検索結果表示部,12は先頭文字位置
設定部,13は後続文字列抽出部,14は文字位置指示部,15
は文字コードごとに，指示された文字位置から遡ること
ができる最大の戻り文字数をしきい値として格納したし
きい値格納部であり，これらの構成要素は第１図の原理
的構成図と同じであるが，テキスト情報格納部から先頭
文字位置設定部12に対して情報を送るルートがある点で
第１図の構成とは異なっている。

例として，テキスト文章中に ……ABCDEFGHIJKLMN…… という文字列があるとする。

文字位置指示部14で『Ｈ』が指示されたとすると，先
頭文字位置設定部12はまずこの『Ｈ』の位置を先頭文字
位置とする。

後続文字列抽出部13は，これを受けてまず長さ１の文
字列『Ｈ』を抽出する。

見出しチェック部６は，この文字列『Ｈ』て始まる見
出しがあるかどうかチェックし，文字列『Ｈ』が完結し
た見出しであれば，候補文字列出力部５に文字列『Ｈ』
を送る。

文字列『Ｈ』で始まる見出しがある場合には，後続文
字列抽出部13が，テキスト中で『Ｈ』に続く文字『Ｉ』
を見つけ，文字列『HI』を抽出する。

見出しチェック部６は，今度は文字列『HI』で始まる
見出しがあるかどうかをチェックし，文字列『HI』が完
結した見出しであれば候補文字列出力部５に文字列『H
I』を送る。

これを繰り返し，後続文字列抽出部13が次々に伸ばし
ていくが，ある時点で後続文字列抽出部13の抽出した文
字列（たとえば『HIJK』）で始まる見出しが存在しない
時に，これらの処理が終了する。

次に，先頭文字位置設定部12が先程設定した先頭文字
位置を一文字分遡らせて，『Ｇ』の位置を先頭文字位置
とする。このとき，先頭文字位置設定部12は，先に指示
された文字位置の文字『Ｈ』に対応するしきい値を，し
きい値格納部15から取り出し，戻り文字数がしきい値内
にあることを確認する。

後続文字列抽出部13は，これを受けてまず長さ２の文
字列『GH』を抽出する。

ここからまた，上記の手順が繰り返され『GH』『GH
I』『GHIJ』……で始まる見出しがあるかどうかチェッ
クされ，ない時点でここの処理が終了する。

再び先頭文字位置設定部12が先程設定した先頭文字位
置を一文字分遡らせて『Ｆ』の位置を先頭文字位置と
し，後続文字列抽出部13が，まず長さ３の文字列『FG
H』を抽出する。ここからまた上の手順が繰り返され
る。

なお先頭文字位置説底部12がどこまで遡って先頭文字
を設定するかということについては，前述したようにし
きい値を調べて，その範囲内に設定される。

このしきい値は，最初に指示された位置の文字『Ｈ』
に依存している。あらかじめ，全ての文字について見出
し中の何文字目に出現しているかが調査されており，そ
の最大文字数をもとにしきい値が決められる。例えば，
前もって辞書のすべての見出しについて文字『Ｈ』が出
現するか否か調べ，出現する場合にはその見出しの先頭
から何文字目に出現するかを調べておく。仮にその最大
値が４文字目であったとすれば，文字『Ｈ』に関して遡
るべき文字数のしきい値は３となり，したがって，先頭
文字位置設定部12は文字『Ｅ』の位置まで遡るが，そこ
までで処理が終了し，文字『Ｄ』の位置までは遡らな
い。

次に，以上の処理の結果，どういう文字列が該当文字
列として抽出されるかということを説明する。

テキスト文章中に， ……には日本国有鉄道の…… という文字列が出現するとする。

指示された文字が『日』であった場合には，『日』
『日本』『日本国』『日本国有鉄道』の４つの文字列が
抽出される。

同様に『本』が指示された場合には，『本』『本国』
『日本』『日本国』『日本国有鉄道』の５文字列が抽出
される。

『国』が指示された場合には，『国』『国有』『国有
鉄道』『本国』『日本国』『日本国有鉄道』の６つの文
字列が抽出される。

『有』が指示された場合には，『有』『国有』『国有
鉄道』『日本国有鉄道』の４つの文字列が抽出される。

『鉄』が指示された場合には，『鉄』『鉄道』『国有
鉄道』『日本国有鉄道』の４つの文字列が抽出される。

『道』が指示された場合には，『道』『鉄道』『国有
鉄道』『日本国有鉄道』の４つの文字列が抽出される。
すなわち，以下に示すようになる。

このように，見出しに「日本国有鉄道」という文字列
が存在し，テキスト文章中に「日本国有鉄道」という文
字列が出現している場合，この６文字のいずれを指示し
ても，「日本国有鉄道」という文字列が利用者に呈示さ
れる。

なお，文字列の抽出順序は上記説明の通りであるが，
通常の場合，見出しとして存在する最長の文字列が文章
中でも意味をなすことが多いので，抽出された文字列を
長さでソーティングし，長いものから順に利用者に呈示
する。

第３図は，第２図に示された実施例の処理流れ図であ
る。以下に，第２図を参照して，第３図の処理流れの概
要を，手順ないしにしたがって説明する。

：テキスト表示部１により，テキスト情報格納部４に
あるテキストを表示する。

：学習者が，文字位置指示部14により，意味不明の語
句中に含まれる適当な１つの文字の位置を指示する（以
後，指示文字位置という）。

：先頭文字位置設定部12は，先頭文字位置を与えるた
めの，指示文字位置から前方への戻り文字数を最初は
“0"とし，後続文字列抽出部13に通知する。

：後続文字列抽出部13は，指示文字位置から戻り文字
数（最初は“0"）分だけ遡った位置を先頭文字位置とし
て設定する。

：後続文字列抽出部13は，次に，先頭文字位置から指
示文字位置までの文字列を検索すべき対象の文字列（以
後，対象文字列という）として，テキスト情報格納部４
のテキストから抽出する。

：見出しチェック部６は，インデクス情報格納部７の
見出しを，対象文字列で検索し，対象文字列で始まる見
出しがあるかどうかを調べる。ある場合（YES）はを
実行し，ない場合（NO）はを実行する。

：見出しチェック部６は，さらにその見出しが対象文
字列と同じ長さの見出しであるかどうかを調べる。同じ
長さであれば（YES）を実行し，その他の場合（NO）
はを実行する。

：その対象文字列を候補文字列群のメンバに加える。

：その対象文字列に後続文字を１つつなぎ，対象文字
列を更新してに戻る。

：で，見出しチェック部６が，対象文字列で始まる
見出しを検出できなかったとき，先頭文字位置設定部12
は戻り文字数を１だけ増やす。

：先頭文字位置設定部12は，次に，更新された戻り文
字数がしきい値より大きいかどうかを調べる。大きい場
合（YES）はを実行し，その他の場合（NO）はへ戻
る。

：候補文字列出力部５は，それまでに検出された候補
文字列群をソーティングする。

：ソーティングした候補文字列群を表示する。

：学習者は，文字列選択部８を介して，表示された候
補文字列群の中から１つの検索文字列を選択する。

：文字列検索部９は，その検索文字列に対応するイン
デクス情報から該当辞書情報の格納位置を求め，辞書情
報格納部10の辞書情報を検索する。

：検索結果を検索結果表示部11へ出力し，表示させ
る。

〔発明の効果〕

本発明によれば，利用者は意味不明の語句の始まりさ
えわかならない場合でも，その辺りの文字を適当に指示
するだけで，妥当な語句の候補を容易に知ることがで
き，たとえば日本語学習システムの場合には，必要とす
る操作回数の削減により，学習能率の向上が図られる。

【図面の簡単な説明】

第１図は本発明の原理的構成図，第２図は本発明の１実
施例の構成図，第３図は第２図に示す実施例の処理フロ
ー図，第４図は従来方式の構成図，第５図は第４図に示
す従来方式の処理フロー図である。第１図中， 1:テキスト表示部 5:候補文字列出力部 6:見出しチェック部 7:インデクス情報格納部 8:文字列選択部 9:文字列検索部 10:辞書情報格納部 11:検索結果表示部 12:先頭文字位置設定部 14:文字位置指示部 15:しきい値格納部

Claims

(57)【特許請求の範囲】

【請求項１】テキストを表示するテキスト表示部（１）
と，テキスト中の任意の文字位置を指示する文字位置指
示部（14）と，指示された文字位置から１文字ずつ遡って先頭文字位置
を決定するとともに，遡る最大文字数をしきい値により
制限する先頭文字位置設定部（12）と，先頭文字位置から指示された文字位置までの文字列で始
まるテキスト中の文字列を抽出する後続文字列抽出部
（13）と，抽出された文字列が辞書の見出し項目として存在するか
否かを判定する見出しチェック部（６）と，見出し項目として存在する文字列を候補文字列として呈
示する候補文字列出力部（５）と，呈示された候補文字列の中から任意の文字列を選択する
文字列選択部（８）と，選択された文字列の検索を行う文字列検索部（９）とを
設けたことを特徴とする電子辞書の検索方式。
【請求項２】遡る文字数のしきい値を，指示された文字
位置の文字によって異なるものとし，この文字があらゆ
る見出し語句中で最後位に出現する際の文字位置によっ
て決定することを特徴とする特許請求の範囲第１項に記
載の電子辞書の検索方式。
【請求項３】呈示する文字列を候補文字列長の長いもの
から順に呈示する機能を設けたことを特徴とする特許請
求の範囲第１項に記載の電子辞書の検索方式。