JPH06290219A

JPH06290219A - 文字検索機能付き文書処理装置

Info

Publication number: JPH06290219A
Application number: JP5074321A
Authority: JP
Inventors: Yukio Shimizu; 裕紀夫清水
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1993-03-31
Filing date: 1993-03-31
Publication date: 1994-10-18

Abstract

(57)【要約】【目的】文節単位での部分一致検索を可能とすること
で、検索効率を向上させる。【構成】キーボードと、メモリと、ＣＰＵを備え、Ｃ
ＰＵにより、入力された読み情報を複数の文節からなる
漢字仮名交じり文に変換し、そのとき、漢字仮名交じり
文に文節の区切り情報を付加し、メモリに記憶する。そ
して、検索時には、漢字仮名交じり文に付加された文節
の区切り情報を参照することにより、漢字仮名交じり文
の複数の文節の内の、いずれか一つ又はそれ以上の文節
の漢字仮名交じり文と一致する漢字仮名交じり文をメモ
リから検索し、その結果を出力する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、日本語による文書作
成が可能な、ワードプロセッサやパーソナルコンピュー
タのような文書処理装置に関し、特に、指定した文字列
を文書の中から検索することが可能な文字検索機能付き
文書処理装置に関する。

【０００２】

【従来の技術】従来、この種の文書処理装置において
は、図７に示すように、文書内の特定の文字列を検索す
る場合、指定された文字列との完全一致をその条件とす
る手法と、指定文字列の一部のみの一致を認める部分一
致を条件とする手法がある。

【０００３】完全一致を条件とする手法は、図７の
（ａ）に示すように、指定の文字列をＭ字とすると、一
致したと判断する条件として、１〜Ｍ字目の全ての位置
において文字が一致した時のみ、一致したと判断する。
すなわち、一致条件は指定文字列そのものである。

【０００４】一方、部分一致を条件とする手法は、図７
の（ｂ）に示すように、指定文字列をＭ字とすると、一
致したと判断する条件として、１〜Ｍ字目のいずれかの
位置において文字が一致したとき、一致したと判断す
る。すなわち、１〜Ｍ字目のいずれかの単数あるいは複
数の位置の文字の不一致を無視することにより、条件を
緩和する方法である。

【０００５】

【発明が解決しようとする課題】しかしながら、このよ
うな従来の完全一致を条件とする方法は、あくまでも指
定文字列と完全に一致する文字列を検索するため、操作
者の記憶があいまいで、検索するべき文字列を間違って
入力した場合には、全く一致する文字列が見つからない
か、あるいは期待しない文字列を検索する場合が発生す
る。これは、長文あるいは長期にわたって作成される文
書において特に発生しやすい。

【０００６】一方、従来の部分一致を条件とする方法
は、指定された文字列をそのまま条件として使うだけで
なく、緩和した条件を自動的に生成するため、完全一致
を条件とする方法の短所であった操作者の記憶のミス、
あるいは入力のミスを吸収できる。しかし、指定された
文字列は、あくまでも１文字の集まった集合として認識
するため、文字は全て同格、即ち１文字１文字が独立し
たものとして条件が自動生成される。したがって、存在
する確率が極めて低い意味の通らない条件も生成するた
め、無意味な検索作業が発生する。また、１文字１文字
の文字が独立したものとして条件の緩和が行われると、
一致と判断される条件が多数発生し、数多くの期待しな
い文字列を抽出する。

【０００７】以上の短所により、従来の完全一致による
方法では、操作者の記憶／入力の正確性が要求され、ま
た、部分一致による方法では、作業に必要とする時間が
要求される。

【０００８】この発明は、このような事情を考慮してな
されたもので、複数の文節からなる文字列を検索する場
合に、文節単位での部分一致検索を可能とすることによ
り、検索効率を向上させるようにした文字検索機能付き
文書処理装置を提供するものである。

【０００９】

【課題を解決するための手段】図１はこの発明の構成を
示すブロック図であり、図に示すように、この発明は、
単語の読み情報を複数の文節にわたって入力する入力手
段１０１と、仮名漢字変換辞書を有し、その辞書を参照
することにより、入力された読み情報を複数の文節から
なる漢字仮名交じり文に変換する変換手段１０２と、入
力された読み情報が漢字仮名交じり文に変換されると
き、その漢字仮名交じり文に文節の区切り情報を付加す
る文節情報付加手段１０３と、文節の区切り情報の付加
された多数の漢字仮名交じり文を含む文書を記憶した文
書記憶手段１０４と、漢字仮名交じり文に付加された文
節の区切り情報を参照することにより、変換手段１０２
によって変換された漢字仮名交じり文の複数の文節の内
の、いずれか一つ又はそれ以上の文節の漢字仮名交じり
文と一致する漢字仮名交じり文を、文書記憶手段１０４
に記憶された文書の中から検索する検索手段１０５と、
検索手段１０５による検索結果を出力する出力手段１０
６を備えてなる文字検索機能付き文書処理装置を提供す
る。

【００１０】なお、この発明の入力手段１０１として
は、キーボード装置やタブレット装置などの入力装置が
用いられる。

【００１１】変換手段１０２、文節情報付加手段１０
３、及び検索手段１０５としては、ＣＰＵ，ＲＯＭ，Ｒ
ＡＭ，インターフェースからなるマイクロコンピュータ
システムを用いるのが便利であり、文書記憶手段１０４
としては、通常、その中のＲＡＭが用いられる。

【００１２】出力手段１０６としては、ＣＲＴディスプ
レイ装置やＬＣＤ（液晶ディスプレイ装置）のような表
示装置や、各種のプリンタが用いられる。

【００１３】

【作用】この発明によれば、入力手段１０１によって入
力された読み情報が、変換手段１０２によって漢字仮名
交じり文に変換されるときには、文節情報付加手段１０
３により、漢字仮名交じり文に文節の区切り情報が付加
される。そして、検索手段１０５によって検索が行われ
るときには、その漢字仮名交じり文の複数の文節の内
の、いずれか一つ又はそれ以上の文節の漢字仮名交じり
文と一致する漢字仮名交じり分が、文書記憶手段１０４
に記憶された文書の中から検索される。

【００１４】したがって、文節単位での部分一致検索を
行うため、無意味な検索条件の生成が無くなり、これに
より無駄な検索作業の発生が抑制され、検索作業の簡略
化、効率化が図られる。

【００１５】

【実施例】以下、図面に示す実施例に基づいてこの発明
を詳述する。なお、これによってこの発明が限定される
ものではない。

【００１６】図２は本発明を日本語ワードプロセッサに
適用した一実施例の構成を示すブロック図である。この
図に示すように、本発明の日本語ワードプロセッサは、
プログラムを実行しシステム全体を制御し統括するＣＰ
Ｕ（中央処理装置）１と、文書データを記憶するＲＡＭ
２と、ＣＰＵ１で実行される制御プログラム及び仮名漢
字変換用の辞書データを記憶したＲＯＭ３と、印字手段
としてのプリンタ５と、プリンタ５を制御するプリンタ
コントローラ４と、ＣＲＴあるいは液晶ディスプレイな
どからなる表示装置７と、表示装置７を制御して表示装
置７にデータを表示させる表示コントローラ６と、入力
手段としてのキーボード９と、キーボード９のインター
フェースとなるキーインターフェイス８と、データおよ
びプログラムなどを記憶する手段としてのＦＤ（フロッ
ピーディスク装置）１１及びＩＣカード１３と、ＦＤ１
１及びＩＣカード１３を制御するＦＤコントローラ１０
及びＩＣカードインターフェース１２と、システムデー
タ記憶用ＥＥＰＲＯＭ１５とを備えている。

【００１７】上記ＲＡＭ２、ＲＯＭ３、プリンタコント
ローラ４、表示コントローラ６、キーインターフェース
８、ＦＤコントローラ１０、ＩＣカードインターフェー
ス１２、及びシステムデータ記憶用ＥＥＰＲＯＭ１５
は、アドレスバス・データバス１４を介してＣＰＵ１と
接続されている。

【００１８】キーボード９からは、単語の読み情報が複
数の文節にわたって入力される。ＣＰＵ１は、ＲＯＭ３
に記憶した仮名漢字変換辞書を参照することにより、入
力された読み情報を複数の文節からなる漢字仮名交じり
文に変換する。また、その変換時には、その漢字仮名交
じり文に、文節の区切り情報を付加して、それら文節の
区切り情報を付加した多数の漢字仮名交じり文を含む文
書をＲＡＭ２に記憶する。

【００１９】そして、キーボード９から、複数の文節か
らなる検索文字列が指定されたときには、漢字仮名交じ
り文に付加した文節の区切り情報を参照することによ
り、検索文字列の複数の文節の内の、いずれか一つ又は
それ以上の文節の検索文字列に一致する文字列を、ＲＡ
Ｍ２に記憶された文書の中から検索し、その検索結果を
表示装置７に表示する。

【００２０】文節の区切り情報の付加については、以下
のようにして行う。すなわち、ＣＰＵ１は、仮名漢字変
換時には、仮名漢字変換辞書を参照し、入力文字列の文
節の区切りを自動的に認識しながら、漢字仮名交じり文
へ変換する（いわゆる連文節変換）。この変換確定時
に、文節の区切りを指定文字列に区切り情報として付加
して、ＲＡＭ２に記憶する。

【００２１】この情報を付加する方法としては以下のよ
うな方法がある。・文字コードとは独立した特殊コードを付加する（図３
の（ａ）参照）。・文字コードに特殊フラグとして埋め込む（図３の
（ｂ）参照）。・区切り情報をコードあるいはフラグとして設けるので
はなく、指定の文字列を文節の区切りごとに記憶する
（図３の（ｃ）参照）。

【００２２】次に、この区切りをどのように検索条件の
緩和に用いるかを、図４を用いて説明する。最初に指定
したＭ字の文字列が文節Ａ、文節Ｂ、文節Ｃ（１つの文
節は一字以上の文字列である）に区切られているとする
と、部分一致は文節ごとに行われる。完全一致とは、文
節Ａ、文節Ｂ、文節Ｃが全て一致することであり、部分
一致とは、文節Ａ、文節Ｂ、文節Ｃのいずれか一つ又は
それ以上の文節が一致することである。

【００２３】最初の緩和として、どれか一つの文節を一
致条件から外す。例えば、文節Ａと文節Ｂが一致する場
合、文節Ａと文節Ｃが一致する場合、文節Ｂと文節Ｃが
一致する場合の三つを条件とする。こうして、一致条件
から外す文節の数を一つずつ増やすことで、一致条件の
緩和を実現する。この緩和は一致条件が文節一つになる
までとし（図中の例では、文節Ａのみ、文節Ｂのみ、文
節Ｃのみの一致となるまでとし）、これを限度とする。
なお、図中、“＊”は任意の文字とする。

【００２４】このような構成における処理動作の内容
を、図５に示すフローチャートに基づいて説明する。ま
ず、ステップＳ１で検索処理が操作者により起動され、
ステップＳ２で操作者が文書内の検索したい文字列をキ
ーボード９から入力する（図６の画面１参照）。次に、
入力された文字列をステップＳ３で漢字仮名交じり文へ
変換する（図６の画面２参照）。すなわち、ＲＯＭ３に
格納された仮名漢字変換プログラムにより、ＣＰＵ１
は、入力された文字列を、ＲＯＭ３に格納された仮名漢
字変換辞書を参照しながら、単数及び複数の文節に自動
的に区切り、各文節単位に漢字に変換し、漢字仮名交じ
り文に変換する。ここで、単数及び複数の文字で構成さ
れる入力文字列は、Ｎ個の文節１〜文節Ｎに切り分けら
れる。次に、ステップＳ４で変換された文字列が確定さ
れ、ステップＳ５で変換の区切り情報を付加し、指定文
字列が記憶される。そして、完全一致による検索モード
で作業を開始する。

【００２５】ステップＳ６で、比較位置Ｑをセットす
る。初期値として、文書の先頭（１文字目：Ｑ＝１）が
セットされる。次に、ステップＳ７で、その比較位置Ｑ
で文書データと指定文字列を比較し、指定文字列の全て
が一致した場合は、ステップＳ８からＳ１１に進み、そ
の一致文字列がある周辺の文書データを表示し（図６の
画面３参照）、ステップＳ１２へ進む。

【００２６】ステップＳ８において一致しなかった場合
は、ステップＳ９へと進み、検索位置を調べて文末に達
していない場合、すなわち検索対象となる文書データが
あれば、ステップＳ１０へと進み、比較位置を１つを進
める（Ｑ＝Ｑ＋１）。もし、文末であれば、ステップＳ
１３へ進む。

【００２７】ステップＳ１２では、検索作業の継続／中
止の選択（図６の画面４参照）となり、検索作業の中止
を選択した場合は処理を終了する。一方、検索作業の継
続を選択した場合は、ステップＳ１２からステップＳ９
へと進み、検索作業を継続する。

【００２８】ここまでの検索は、完全一致による検索モ
ードである。完全一致モードで一致する文字列がない場
合、または継続して文末に達した場合は、ステップＳ９
から、ステップＳ１３へと進み、自動的に部分一致の検
索モードとなる。

【００２９】部分一致モードでは、まずステップＳ１３
で完全一致で調べた文字列がＫ個の文節で構成されてい
るとすると、一致と判断する基準ＬをＫとする。そし
て、ステップＳ１４で基準Ｌから１を減じ、ステップＳ
１５でＬを調べる。Ｌは一致と判断する一致文節数の基
準であるから、Ｌ＜１であれば、緩和不可能として、作
業を終了する（図６の画面７参照）。即ち、当初の条件
として入力された文字列が一つの文節から構成される場
合は、部分一致による検索作業は行わない。

【００３０】Ｌが１以上、即ち、条件文字列が２つ以上
の文節で構成されていれば、緩和可能と判断し、ステッ
プＳ１５からステップＳ１６へと進む。ステップＳ１６
では、先頭からの字数を表すサーチ位置値Ｐを１とす
る。そして、ステップＳ１７で、何番目の文節をサーチ
しているかを示すＭの初期値を１、文節一致数Ｎ＝０、
補助ポインタＲ＝０とする。

【００３１】そして、ステップＳ１８で、位置（Ｐ＋
Ｒ）において、先頭からＭ番目の文節の文字列と、その
位置にある文書データ内の文字列が一致するか否かを調
べる。つまり、Ｍ番目の文節の１〜Ｈ文字のそれぞれと
文書データの先頭から（Ｐ＋Ｒ＋１−１）〜（Ｐ＋Ｒ＋
Ｈ−１）のそれぞれの文字が全て一致すれば、ステップ
Ｓ１９からステップ２０へ進む。ステップＳ１９で文字
が１つでも一致しなかった場合は、ステップＳ２１に進
む。

【００３２】ステップＳ２０では、文節一致数Ｎに１を
加算し、継続して次の文節の一致を調べるために、補助
ポインタＲに現在比較中の文節Ｍの文字数を足す。ステ
ップＳ２１で不一致文節数（Ｍ−Ｎ）と不一致判断基準
文節数（Ｋ−Ｌ）とを比較し、（Ｍ−Ｎ）の値が（Ｋ−
Ｌ）の値以下であれば、ステップＳ２２に進み、Ｍと全
文節数Ｋを比較して、一致した場合はステップＳ２５に
進む。ステップＳ２１で、（Ｍ−Ｎ）の値が（Ｋ−Ｌ）
の値より大きければ、不一致とし、ステップＳ２３へ進
む。一方、Ｍと総文節数Ｎとを比較し、一致しなければ
ステップＳ２４へ進んでＭに１を加算し、ステップＳ１
８へと進み、次の文節の比較を行う。

【００３３】ステップＳ２２で、ＭとＫが等しければ、
全ての文節を比較し終わったので、ステップＳ２５へと
進み、部分一致成立として、その付近の文書データの表
示を行う（図６の画面５参照）。結果を確認後、ステッ
プＳ２６で処理の継続／中止を選び（図６の画面６参
照）、中止ならば、処理を終了する（図６の画面７参
照）。

【００３４】一方、続行する場合は、ステップＳ２３へ
進み、一つサーチする位置を進める。そしてＳ２７に進
み、検索する文書データがあるか否かを調べる。もしＰ
＝文末の場合は、ステップＳ２８に進み、一致と見なす
基準であるＬから１を減じることで、一致条件の緩和を
行う。そして、ステップＳ１５へと進み、条件を緩和し
て、再び文書の最初から部分一致による検索を行う。一
方、文末に達していない場合は、ステップＳ１７へ進
み、現在の条件で、比較位置を進めて作業を継続する。

【００３５】以上の処理を大きく分けると、以下のよう
になる。・ステップＳ１〜Ｓ５：検索文字列入力（仮名漢字変
換）作業・ステップＳ６〜Ｓ１２：完全一致による検索作業・ステップＳ１３〜Ｓ２８：部分一致による検索作業

【００３６】実際の入力例を図６の画面の表示例に基づ
いて説明すると、ステップＳ１で処理を起動して、ステ
ップＳ２で図６の画面１のように、キーボード９から検
索文字列「かんぜんいっちけんさく」を入力し、ステッ
プＳ３で仮名漢字変換して、図６の画面２のように、
「完全一致検索」と変換する。この仮名漢字変換で、
「完全」「一致」「検索」のように自動的に３つの文節
に分けて変換されたとする。

【００３７】そして、ステップＳ４で確定すると、文節
の区切り情報を検索文字列「完全一致検索」に埋め込
み、記憶する。そして、完全一致による検索を開始す
る。まず、ここでは文書の先頭（１文字目）から調べる
ためのポインタをセットし、ステップＳ７で１文字目と
「完」、２文字目と「全」、３文字目と「一」、……、
５文字目と「検」、６文字目と「索」を比較し、全てが
一致した場合、ステップＳ８からステップＳ１１で、そ
の部分を図６の画面３のように表示し、ステップＳ１２
へ進み、図６の画面４のように表示し、処理の継続を尋
ね、操作者が継続を選択すると、ステップＳ９からステ
ップＳ１０へと進み、ポインタを進め比較する。こうし
て、次の一致文字列が見つかるか、あるいは文末に達す
るまで、ステップＳ７，Ｓ８，Ｓ９，Ｓ１０を繰り返
す。一方、ステップＳ９で文末であった場合は、ステッ
プＳ１３へと進み、部分一致による検索モードに入る。

【００３８】部分一致による検索モードでは、まず、
「完全一致検索」の文節数３をＬに代入し（ステップＳ
１３）、さらにＬ−１＝２のため（ステップＳ１４）、
ステップＳ１５からステップＳ１６に進む。次に、ポイ
ンタを１とし、比較する位置をまず先頭にセットする。
そして、ステップＳ１７で必要な数値を設定した後、ス
テップＳ１８で、ポインタの示す文書データの位置に、
例えば「部分一致検索では」という文字列が存在したと
すると、まず、「部分」と「完全」を比較して、不一致
であるので、ステップＳ２１に進み、（Ｍ−Ｎ）＝１と
（Ｋ−Ｌ）＝１を比較し、等しいので、ステップＳ２２
へと進み、Ｍ＝１、Ｋ＝３なのでステップＳ２４、Ｓ１
８へと進む。ここで、文節「一致」と「部分」を比較し
た結果、不一致であり、（Ｍ−Ｎ）＝２、（Ｋ−Ｌ）＝
１と一致基準を下回るので、その位置での比較を中止
し、ステップＳ２３へと進み、比較位置ポインタＰを進
める。このとき、文末であるのか否かのチェックもステ
ップＳ２７で行い、今度は文書データの文字列「分一致
検索で」と比較する。この場合も不一致となり、更に比
較位置ポインタＰが進められて、文書データの文字列
「一致検索では」と比較する。

【００３９】まず、文節「完全」と「一致」を比較し
て、不一致となるので、次に「一致」と「一致」を比較
し、一致するので、Ｎ＝１とし、補助ポインタＲに文節
「一致」の文字数２を足し（ステップＳ２０）、次に、
文書データの文字列「一致検索では」の（Ｐ＋２）文字
目、つまり「検索」と文節「検索」を比較する（ステッ
プＳ１８）。これは一致するので、Ｎ＝２とし、補助ポ
インタＲ＝４とする（ステップＳ２０）。次に、ステッ
プＳ２１で（Ｍ−Ｎ）＝（３−２）＝１、（Ｋ−Ｌ）＝
（３−２）＝１となって、（Ｍ−Ｎ）と（Ｋ−Ｌ）とが
等しくなる。

【００４０】３つの文節を全て比較し終わったところで
（ステップＳ２２）、部分一致成立となり、ステップＳ
２５へと進み、その部分を図６の画面５のように表示す
る。次に、継続するかどうかを選択し（ステップＳ２
６）、継続しなければ作業終了とし、継続する場合は、
同様の処理を、一致文字列があるか、あるいは比較位置
が文末となるまで繰り返し行う。

【００４１】実際の条件の緩和は、一致と見なす基準Ｌ
を１ずつ減じて行う。また、Ｌが０となった場合は、緩
和不可として、処理を終了する。

【００４２】このようにして、特定の文字列に部分一致
する文字列を検索する場合に、漢字仮名交じり文への変
換作業時の文節の区切り情報を利用することにより、文
節単位での部分一致検索を行うことが可能となり、検索
作業の効率化を図ることができる。

【００４３】

【発明の効果】この発明によれば、以下のような効果を
奏する。すなわち、指定検索文字列の中の文字と文字と
の関係が明確化されるので、操作者の期待しない条件の
自動生成を抑制することができる。また、無駄な作業、
すなわち操作者の期待しない条件の生成と検索作業が減
り、作業の効率化および作業時間の短縮化を図ることが
できる。さらに、無意味な条件の生成が抑制されること
により、不必要な文字列の抽出が無くなり、作業の有効
性が向上する。そして、変換時に用いられる文節の区切
りは、内部辞書データを参照するため、同じ辞書データ
を用いて変換を行う装置では、効率的な検索が可能とな
る。

【図面の簡単な説明】

【図１】この発明の構成を示すブロック図である。

【図２】この発明の一実施例の構成を示すブロック図で
ある。

【図３】文節区切り情報の埋め込み方法を示す説明図で
ある。

【図４】区切り情報の利用方法を示す説明図である。

【図５】実施例の動作を示すフローチャートである。

【図６】画面の表示例を示す説明図である。

【図７】従来技術による一致の判定を示す説明図であ
る。

【符号の説明】

１ＣＰＵ２ＲＡＭ３ＲＯＭ４プリンタコントローラ５プリンタ６表示コントローラ７表示装置８キーインターフェース９キーボード１０ＦＤコントローラ１１ＦＤ１２ＩＣカードインターフェース１３ＩＣカード１４アドレスバス・データバス１５システムデータ記憶用ＥＥＰＲＯＭ

Claims

【特許請求の範囲】

【請求項１】単語の読み情報を複数の文節にわたって
入力する入力手段と、仮名漢字変換辞書を有し、その辞書を参照することによ
り、入力された読み情報を複数の文節からなる漢字仮名
交じり文に変換する変換手段と、入力された読み情報が漢字仮名交じり文に変換されると
き、その漢字仮名交じり文に文節の区切り情報を付加す
る文節情報付加手段と、文節の区切り情報の付加された多数の漢字仮名交じり文
を含む文書を記憶した文書記憶手段と、漢字仮名交じり文に付加された文節の区切り情報を参照
することにより、変換手段によって変換された漢字仮名
交じり文の複数の文節の内の、いずれか一つ又はそれ以
上の文節の漢字仮名交じり文と一致する漢字仮名交じり
文を、文書記憶手段に記憶された文書の中から検索する
検索手段と、検索手段による検索結果を出力する出力手段を備えてな
る文字検索機能付き文書処理装置。