JPH06290219A - 文字検索機能付き文書処理装置 - Google Patents
文字検索機能付き文書処理装置Info
- Publication number
- JPH06290219A JPH06290219A JP5074321A JP7432193A JPH06290219A JP H06290219 A JPH06290219 A JP H06290219A JP 5074321 A JP5074321 A JP 5074321A JP 7432193 A JP7432193 A JP 7432193A JP H06290219 A JPH06290219 A JP H06290219A
- Authority
- JP
- Japan
- Prior art keywords
- kanji
- kana
- sentence
- search
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】 文節単位での部分一致検索を可能とすること
で、検索効率を向上させる。 【構成】 キーボードと、メモリと、CPUを備え、C
PUにより、入力された読み情報を複数の文節からなる
漢字仮名交じり文に変換し、そのとき、漢字仮名交じり
文に文節の区切り情報を付加し、メモリに記憶する。そ
して、検索時には、漢字仮名交じり文に付加された文節
の区切り情報を参照することにより、漢字仮名交じり文
の複数の文節の内の、いずれか一つ又はそれ以上の文節
の漢字仮名交じり文と一致する漢字仮名交じり文をメモ
リから検索し、その結果を出力する。
で、検索効率を向上させる。 【構成】 キーボードと、メモリと、CPUを備え、C
PUにより、入力された読み情報を複数の文節からなる
漢字仮名交じり文に変換し、そのとき、漢字仮名交じり
文に文節の区切り情報を付加し、メモリに記憶する。そ
して、検索時には、漢字仮名交じり文に付加された文節
の区切り情報を参照することにより、漢字仮名交じり文
の複数の文節の内の、いずれか一つ又はそれ以上の文節
の漢字仮名交じり文と一致する漢字仮名交じり文をメモ
リから検索し、その結果を出力する。
Description
【0001】
【産業上の利用分野】この発明は、日本語による文書作
成が可能な、ワードプロセッサやパーソナルコンピュー
タのような文書処理装置に関し、特に、指定した文字列
を文書の中から検索することが可能な文字検索機能付き
文書処理装置に関する。
成が可能な、ワードプロセッサやパーソナルコンピュー
タのような文書処理装置に関し、特に、指定した文字列
を文書の中から検索することが可能な文字検索機能付き
文書処理装置に関する。
【0002】
【従来の技術】従来、この種の文書処理装置において
は、図7に示すように、文書内の特定の文字列を検索す
る場合、指定された文字列との完全一致をその条件とす
る手法と、指定文字列の一部のみの一致を認める部分一
致を条件とする手法がある。
は、図7に示すように、文書内の特定の文字列を検索す
る場合、指定された文字列との完全一致をその条件とす
る手法と、指定文字列の一部のみの一致を認める部分一
致を条件とする手法がある。
【0003】完全一致を条件とする手法は、図7の
(a)に示すように、指定の文字列をM字とすると、一
致したと判断する条件として、1〜M字目の全ての位置
において文字が一致した時のみ、一致したと判断する。
すなわち、一致条件は指定文字列そのものである。
(a)に示すように、指定の文字列をM字とすると、一
致したと判断する条件として、1〜M字目の全ての位置
において文字が一致した時のみ、一致したと判断する。
すなわち、一致条件は指定文字列そのものである。
【0004】一方、部分一致を条件とする手法は、図7
の(b)に示すように、指定文字列をM字とすると、一
致したと判断する条件として、1〜M字目のいずれかの
位置において文字が一致したとき、一致したと判断す
る。すなわち、1〜M字目のいずれかの単数あるいは複
数の位置の文字の不一致を無視することにより、条件を
緩和する方法である。
の(b)に示すように、指定文字列をM字とすると、一
致したと判断する条件として、1〜M字目のいずれかの
位置において文字が一致したとき、一致したと判断す
る。すなわち、1〜M字目のいずれかの単数あるいは複
数の位置の文字の不一致を無視することにより、条件を
緩和する方法である。
【0005】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の完全一致を条件とする方法は、あくまでも指
定文字列と完全に一致する文字列を検索するため、操作
者の記憶があいまいで、検索するべき文字列を間違って
入力した場合には、全く一致する文字列が見つからない
か、あるいは期待しない文字列を検索する場合が発生す
る。これは、長文あるいは長期にわたって作成される文
書において特に発生しやすい。
うな従来の完全一致を条件とする方法は、あくまでも指
定文字列と完全に一致する文字列を検索するため、操作
者の記憶があいまいで、検索するべき文字列を間違って
入力した場合には、全く一致する文字列が見つからない
か、あるいは期待しない文字列を検索する場合が発生す
る。これは、長文あるいは長期にわたって作成される文
書において特に発生しやすい。
【0006】一方、従来の部分一致を条件とする方法
は、指定された文字列をそのまま条件として使うだけで
なく、緩和した条件を自動的に生成するため、完全一致
を条件とする方法の短所であった操作者の記憶のミス、
あるいは入力のミスを吸収できる。しかし、指定された
文字列は、あくまでも1文字の集まった集合として認識
するため、文字は全て同格、即ち1文字1文字が独立し
たものとして条件が自動生成される。したがって、存在
する確率が極めて低い意味の通らない条件も生成するた
め、無意味な検索作業が発生する。また、1文字1文字
の文字が独立したものとして条件の緩和が行われると、
一致と判断される条件が多数発生し、数多くの期待しな
い文字列を抽出する。
は、指定された文字列をそのまま条件として使うだけで
なく、緩和した条件を自動的に生成するため、完全一致
を条件とする方法の短所であった操作者の記憶のミス、
あるいは入力のミスを吸収できる。しかし、指定された
文字列は、あくまでも1文字の集まった集合として認識
するため、文字は全て同格、即ち1文字1文字が独立し
たものとして条件が自動生成される。したがって、存在
する確率が極めて低い意味の通らない条件も生成するた
め、無意味な検索作業が発生する。また、1文字1文字
の文字が独立したものとして条件の緩和が行われると、
一致と判断される条件が多数発生し、数多くの期待しな
い文字列を抽出する。
【0007】以上の短所により、従来の完全一致による
方法では、操作者の記憶/入力の正確性が要求され、ま
た、部分一致による方法では、作業に必要とする時間が
要求される。
方法では、操作者の記憶/入力の正確性が要求され、ま
た、部分一致による方法では、作業に必要とする時間が
要求される。
【0008】この発明は、このような事情を考慮してな
されたもので、複数の文節からなる文字列を検索する場
合に、文節単位での部分一致検索を可能とすることによ
り、検索効率を向上させるようにした文字検索機能付き
文書処理装置を提供するものである。
されたもので、複数の文節からなる文字列を検索する場
合に、文節単位での部分一致検索を可能とすることによ
り、検索効率を向上させるようにした文字検索機能付き
文書処理装置を提供するものである。
【0009】
【課題を解決するための手段】図1はこの発明の構成を
示すブロック図であり、図に示すように、この発明は、
単語の読み情報を複数の文節にわたって入力する入力手
段101と、仮名漢字変換辞書を有し、その辞書を参照
することにより、入力された読み情報を複数の文節から
なる漢字仮名交じり文に変換する変換手段102と、入
力された読み情報が漢字仮名交じり文に変換されると
き、その漢字仮名交じり文に文節の区切り情報を付加す
る文節情報付加手段103と、文節の区切り情報の付加
された多数の漢字仮名交じり文を含む文書を記憶した文
書記憶手段104と、漢字仮名交じり文に付加された文
節の区切り情報を参照することにより、変換手段102
によって変換された漢字仮名交じり文の複数の文節の内
の、いずれか一つ又はそれ以上の文節の漢字仮名交じり
文と一致する漢字仮名交じり文を、文書記憶手段104
に記憶された文書の中から検索する検索手段105と、
検索手段105による検索結果を出力する出力手段10
6を備えてなる文字検索機能付き文書処理装置を提供す
る。
示すブロック図であり、図に示すように、この発明は、
単語の読み情報を複数の文節にわたって入力する入力手
段101と、仮名漢字変換辞書を有し、その辞書を参照
することにより、入力された読み情報を複数の文節から
なる漢字仮名交じり文に変換する変換手段102と、入
力された読み情報が漢字仮名交じり文に変換されると
き、その漢字仮名交じり文に文節の区切り情報を付加す
る文節情報付加手段103と、文節の区切り情報の付加
された多数の漢字仮名交じり文を含む文書を記憶した文
書記憶手段104と、漢字仮名交じり文に付加された文
節の区切り情報を参照することにより、変換手段102
によって変換された漢字仮名交じり文の複数の文節の内
の、いずれか一つ又はそれ以上の文節の漢字仮名交じり
文と一致する漢字仮名交じり文を、文書記憶手段104
に記憶された文書の中から検索する検索手段105と、
検索手段105による検索結果を出力する出力手段10
6を備えてなる文字検索機能付き文書処理装置を提供す
る。
【0010】なお、この発明の入力手段101として
は、キーボード装置やタブレット装置などの入力装置が
用いられる。
は、キーボード装置やタブレット装置などの入力装置が
用いられる。
【0011】変換手段102、文節情報付加手段10
3、及び検索手段105としては、CPU,ROM,R
AM,インターフェースからなるマイクロコンピュータ
システムを用いるのが便利であり、文書記憶手段104
としては、通常、その中のRAMが用いられる。
3、及び検索手段105としては、CPU,ROM,R
AM,インターフェースからなるマイクロコンピュータ
システムを用いるのが便利であり、文書記憶手段104
としては、通常、その中のRAMが用いられる。
【0012】出力手段106としては、CRTディスプ
レイ装置やLCD(液晶ディスプレイ装置)のような表
示装置や、各種のプリンタが用いられる。
レイ装置やLCD(液晶ディスプレイ装置)のような表
示装置や、各種のプリンタが用いられる。
【0013】
【作用】この発明によれば、入力手段101によって入
力された読み情報が、変換手段102によって漢字仮名
交じり文に変換されるときには、文節情報付加手段10
3により、漢字仮名交じり文に文節の区切り情報が付加
される。そして、検索手段105によって検索が行われ
るときには、その漢字仮名交じり文の複数の文節の内
の、いずれか一つ又はそれ以上の文節の漢字仮名交じり
文と一致する漢字仮名交じり分が、文書記憶手段104
に記憶された文書の中から検索される。
力された読み情報が、変換手段102によって漢字仮名
交じり文に変換されるときには、文節情報付加手段10
3により、漢字仮名交じり文に文節の区切り情報が付加
される。そして、検索手段105によって検索が行われ
るときには、その漢字仮名交じり文の複数の文節の内
の、いずれか一つ又はそれ以上の文節の漢字仮名交じり
文と一致する漢字仮名交じり分が、文書記憶手段104
に記憶された文書の中から検索される。
【0014】したがって、文節単位での部分一致検索を
行うため、無意味な検索条件の生成が無くなり、これに
より無駄な検索作業の発生が抑制され、検索作業の簡略
化、効率化が図られる。
行うため、無意味な検索条件の生成が無くなり、これに
より無駄な検索作業の発生が抑制され、検索作業の簡略
化、効率化が図られる。
【0015】
【実施例】以下、図面に示す実施例に基づいてこの発明
を詳述する。なお、これによってこの発明が限定される
ものではない。
を詳述する。なお、これによってこの発明が限定される
ものではない。
【0016】図2は本発明を日本語ワードプロセッサに
適用した一実施例の構成を示すブロック図である。この
図に示すように、本発明の日本語ワードプロセッサは、
プログラムを実行しシステム全体を制御し統括するCP
U(中央処理装置)1と、文書データを記憶するRAM
2と、CPU1で実行される制御プログラム及び仮名漢
字変換用の辞書データを記憶したROM3と、印字手段
としてのプリンタ5と、プリンタ5を制御するプリンタ
コントローラ4と、CRTあるいは液晶ディスプレイな
どからなる表示装置7と、表示装置7を制御して表示装
置7にデータを表示させる表示コントローラ6と、入力
手段としてのキーボード9と、キーボード9のインター
フェースとなるキーインターフェイス8と、データおよ
びプログラムなどを記憶する手段としてのFD(フロッ
ピーディスク装置)11及びICカード13と、FD1
1及びICカード13を制御するFDコントローラ10
及びICカードインターフェース12と、システムデー
タ記憶用EEPROM15とを備えている。
適用した一実施例の構成を示すブロック図である。この
図に示すように、本発明の日本語ワードプロセッサは、
プログラムを実行しシステム全体を制御し統括するCP
U(中央処理装置)1と、文書データを記憶するRAM
2と、CPU1で実行される制御プログラム及び仮名漢
字変換用の辞書データを記憶したROM3と、印字手段
としてのプリンタ5と、プリンタ5を制御するプリンタ
コントローラ4と、CRTあるいは液晶ディスプレイな
どからなる表示装置7と、表示装置7を制御して表示装
置7にデータを表示させる表示コントローラ6と、入力
手段としてのキーボード9と、キーボード9のインター
フェースとなるキーインターフェイス8と、データおよ
びプログラムなどを記憶する手段としてのFD(フロッ
ピーディスク装置)11及びICカード13と、FD1
1及びICカード13を制御するFDコントローラ10
及びICカードインターフェース12と、システムデー
タ記憶用EEPROM15とを備えている。
【0017】上記RAM2、ROM3、プリンタコント
ローラ4、表示コントローラ6、キーインターフェース
8、FDコントローラ10、ICカードインターフェー
ス12、及びシステムデータ記憶用EEPROM15
は、アドレスバス・データバス14を介してCPU1と
接続されている。
ローラ4、表示コントローラ6、キーインターフェース
8、FDコントローラ10、ICカードインターフェー
ス12、及びシステムデータ記憶用EEPROM15
は、アドレスバス・データバス14を介してCPU1と
接続されている。
【0018】キーボード9からは、単語の読み情報が複
数の文節にわたって入力される。CPU1は、ROM3
に記憶した仮名漢字変換辞書を参照することにより、入
力された読み情報を複数の文節からなる漢字仮名交じり
文に変換する。また、その変換時には、その漢字仮名交
じり文に、文節の区切り情報を付加して、それら文節の
区切り情報を付加した多数の漢字仮名交じり文を含む文
書をRAM2に記憶する。
数の文節にわたって入力される。CPU1は、ROM3
に記憶した仮名漢字変換辞書を参照することにより、入
力された読み情報を複数の文節からなる漢字仮名交じり
文に変換する。また、その変換時には、その漢字仮名交
じり文に、文節の区切り情報を付加して、それら文節の
区切り情報を付加した多数の漢字仮名交じり文を含む文
書をRAM2に記憶する。
【0019】そして、キーボード9から、複数の文節か
らなる検索文字列が指定されたときには、漢字仮名交じ
り文に付加した文節の区切り情報を参照することによ
り、検索文字列の複数の文節の内の、いずれか一つ又は
それ以上の文節の検索文字列に一致する文字列を、RA
M2に記憶された文書の中から検索し、その検索結果を
表示装置7に表示する。
らなる検索文字列が指定されたときには、漢字仮名交じ
り文に付加した文節の区切り情報を参照することによ
り、検索文字列の複数の文節の内の、いずれか一つ又は
それ以上の文節の検索文字列に一致する文字列を、RA
M2に記憶された文書の中から検索し、その検索結果を
表示装置7に表示する。
【0020】文節の区切り情報の付加については、以下
のようにして行う。すなわち、CPU1は、仮名漢字変
換時には、仮名漢字変換辞書を参照し、入力文字列の文
節の区切りを自動的に認識しながら、漢字仮名交じり文
へ変換する(いわゆる連文節変換)。この変換確定時
に、文節の区切りを指定文字列に区切り情報として付加
して、RAM2に記憶する。
のようにして行う。すなわち、CPU1は、仮名漢字変
換時には、仮名漢字変換辞書を参照し、入力文字列の文
節の区切りを自動的に認識しながら、漢字仮名交じり文
へ変換する(いわゆる連文節変換)。この変換確定時
に、文節の区切りを指定文字列に区切り情報として付加
して、RAM2に記憶する。
【0021】この情報を付加する方法としては以下のよ
うな方法がある。 ・文字コードとは独立した特殊コードを付加する(図3
の(a)参照)。 ・文字コードに特殊フラグとして埋め込む(図3の
(b)参照)。 ・区切り情報をコードあるいはフラグとして設けるので
はなく、指定の文字列を文節の区切りごとに記憶する
(図3の(c)参照)。
うな方法がある。 ・文字コードとは独立した特殊コードを付加する(図3
の(a)参照)。 ・文字コードに特殊フラグとして埋め込む(図3の
(b)参照)。 ・区切り情報をコードあるいはフラグとして設けるので
はなく、指定の文字列を文節の区切りごとに記憶する
(図3の(c)参照)。
【0022】次に、この区切りをどのように検索条件の
緩和に用いるかを、図4を用いて説明する。最初に指定
したM字の文字列が文節A、文節B、文節C(1つの文
節は一字以上の文字列である)に区切られているとする
と、部分一致は文節ごとに行われる。完全一致とは、文
節A、文節B、文節Cが全て一致することであり、部分
一致とは、文節A、文節B、文節Cのいずれか一つ又は
それ以上の文節が一致することである。
緩和に用いるかを、図4を用いて説明する。最初に指定
したM字の文字列が文節A、文節B、文節C(1つの文
節は一字以上の文字列である)に区切られているとする
と、部分一致は文節ごとに行われる。完全一致とは、文
節A、文節B、文節Cが全て一致することであり、部分
一致とは、文節A、文節B、文節Cのいずれか一つ又は
それ以上の文節が一致することである。
【0023】最初の緩和として、どれか一つの文節を一
致条件から外す。例えば、文節Aと文節Bが一致する場
合、文節Aと文節Cが一致する場合、文節Bと文節Cが
一致する場合の三つを条件とする。こうして、一致条件
から外す文節の数を一つずつ増やすことで、一致条件の
緩和を実現する。この緩和は一致条件が文節一つになる
までとし(図中の例では、文節Aのみ、文節Bのみ、文
節Cのみの一致となるまでとし)、これを限度とする。
なお、図中、“*”は任意の文字とする。
致条件から外す。例えば、文節Aと文節Bが一致する場
合、文節Aと文節Cが一致する場合、文節Bと文節Cが
一致する場合の三つを条件とする。こうして、一致条件
から外す文節の数を一つずつ増やすことで、一致条件の
緩和を実現する。この緩和は一致条件が文節一つになる
までとし(図中の例では、文節Aのみ、文節Bのみ、文
節Cのみの一致となるまでとし)、これを限度とする。
なお、図中、“*”は任意の文字とする。
【0024】このような構成における処理動作の内容
を、図5に示すフローチャートに基づいて説明する。ま
ず、ステップS1で検索処理が操作者により起動され、
ステップS2で操作者が文書内の検索したい文字列をキ
ーボード9から入力する(図6の画面1参照)。次に、
入力された文字列をステップS3で漢字仮名交じり文へ
変換する(図6の画面2参照)。すなわち、ROM3に
格納された仮名漢字変換プログラムにより、CPU1
は、入力された文字列を、ROM3に格納された仮名漢
字変換辞書を参照しながら、単数及び複数の文節に自動
的に区切り、各文節単位に漢字に変換し、漢字仮名交じ
り文に変換する。ここで、単数及び複数の文字で構成さ
れる入力文字列は、N個の文節1〜文節Nに切り分けら
れる。次に、ステップS4で変換された文字列が確定さ
れ、ステップS5で変換の区切り情報を付加し、指定文
字列が記憶される。そして、完全一致による検索モード
で作業を開始する。
を、図5に示すフローチャートに基づいて説明する。ま
ず、ステップS1で検索処理が操作者により起動され、
ステップS2で操作者が文書内の検索したい文字列をキ
ーボード9から入力する(図6の画面1参照)。次に、
入力された文字列をステップS3で漢字仮名交じり文へ
変換する(図6の画面2参照)。すなわち、ROM3に
格納された仮名漢字変換プログラムにより、CPU1
は、入力された文字列を、ROM3に格納された仮名漢
字変換辞書を参照しながら、単数及び複数の文節に自動
的に区切り、各文節単位に漢字に変換し、漢字仮名交じ
り文に変換する。ここで、単数及び複数の文字で構成さ
れる入力文字列は、N個の文節1〜文節Nに切り分けら
れる。次に、ステップS4で変換された文字列が確定さ
れ、ステップS5で変換の区切り情報を付加し、指定文
字列が記憶される。そして、完全一致による検索モード
で作業を開始する。
【0025】ステップS6で、比較位置Qをセットす
る。初期値として、文書の先頭(1文字目:Q=1)が
セットされる。次に、ステップS7で、その比較位置Q
で文書データと指定文字列を比較し、指定文字列の全て
が一致した場合は、ステップS8からS11に進み、そ
の一致文字列がある周辺の文書データを表示し(図6の
画面3参照)、ステップS12へ進む。
る。初期値として、文書の先頭(1文字目:Q=1)が
セットされる。次に、ステップS7で、その比較位置Q
で文書データと指定文字列を比較し、指定文字列の全て
が一致した場合は、ステップS8からS11に進み、そ
の一致文字列がある周辺の文書データを表示し(図6の
画面3参照)、ステップS12へ進む。
【0026】ステップS8において一致しなかった場合
は、ステップS9へと進み、検索位置を調べて文末に達
していない場合、すなわち検索対象となる文書データが
あれば、ステップS10へと進み、比較位置を1つを進
める(Q=Q+1)。もし、文末であれば、ステップS
13へ進む。
は、ステップS9へと進み、検索位置を調べて文末に達
していない場合、すなわち検索対象となる文書データが
あれば、ステップS10へと進み、比較位置を1つを進
める(Q=Q+1)。もし、文末であれば、ステップS
13へ進む。
【0027】ステップS12では、検索作業の継続/中
止の選択(図6の画面4参照)となり、検索作業の中止
を選択した場合は処理を終了する。一方、検索作業の継
続を選択した場合は、ステップS12からステップS9
へと進み、検索作業を継続する。
止の選択(図6の画面4参照)となり、検索作業の中止
を選択した場合は処理を終了する。一方、検索作業の継
続を選択した場合は、ステップS12からステップS9
へと進み、検索作業を継続する。
【0028】ここまでの検索は、完全一致による検索モ
ードである。完全一致モードで一致する文字列がない場
合、または継続して文末に達した場合は、ステップS9
から、ステップS13へと進み、自動的に部分一致の検
索モードとなる。
ードである。完全一致モードで一致する文字列がない場
合、または継続して文末に達した場合は、ステップS9
から、ステップS13へと進み、自動的に部分一致の検
索モードとなる。
【0029】部分一致モードでは、まずステップS13
で完全一致で調べた文字列がK個の文節で構成されてい
るとすると、一致と判断する基準LをKとする。そし
て、ステップS14で基準Lから1を減じ、ステップS
15でLを調べる。Lは一致と判断する一致文節数の基
準であるから、L<1であれば、緩和不可能として、作
業を終了する(図6の画面7参照)。即ち、当初の条件
として入力された文字列が一つの文節から構成される場
合は、部分一致による検索作業は行わない。
で完全一致で調べた文字列がK個の文節で構成されてい
るとすると、一致と判断する基準LをKとする。そし
て、ステップS14で基準Lから1を減じ、ステップS
15でLを調べる。Lは一致と判断する一致文節数の基
準であるから、L<1であれば、緩和不可能として、作
業を終了する(図6の画面7参照)。即ち、当初の条件
として入力された文字列が一つの文節から構成される場
合は、部分一致による検索作業は行わない。
【0030】Lが1以上、即ち、条件文字列が2つ以上
の文節で構成されていれば、緩和可能と判断し、ステッ
プS15からステップS16へと進む。ステップS16
では、先頭からの字数を表すサーチ位置値Pを1とす
る。そして、ステップS17で、何番目の文節をサーチ
しているかを示すMの初期値を1、文節一致数N=0、
補助ポインタR=0とする。
の文節で構成されていれば、緩和可能と判断し、ステッ
プS15からステップS16へと進む。ステップS16
では、先頭からの字数を表すサーチ位置値Pを1とす
る。そして、ステップS17で、何番目の文節をサーチ
しているかを示すMの初期値を1、文節一致数N=0、
補助ポインタR=0とする。
【0031】そして、ステップS18で、位置(P+
R)において、先頭からM番目の文節の文字列と、その
位置にある文書データ内の文字列が一致するか否かを調
べる。つまり、M番目の文節の1〜H文字のそれぞれと
文書データの先頭から(P+R+1−1)〜(P+R+
H−1)のそれぞれの文字が全て一致すれば、ステップ
S19からステップ20へ進む。ステップS19で文字
が1つでも一致しなかった場合は、ステップS21に進
む。
R)において、先頭からM番目の文節の文字列と、その
位置にある文書データ内の文字列が一致するか否かを調
べる。つまり、M番目の文節の1〜H文字のそれぞれと
文書データの先頭から(P+R+1−1)〜(P+R+
H−1)のそれぞれの文字が全て一致すれば、ステップ
S19からステップ20へ進む。ステップS19で文字
が1つでも一致しなかった場合は、ステップS21に進
む。
【0032】ステップS20では、文節一致数Nに1を
加算し、継続して次の文節の一致を調べるために、補助
ポインタRに現在比較中の文節Mの文字数を足す。ステ
ップS21で不一致文節数(M−N)と不一致判断基準
文節数(K−L)とを比較し、(M−N)の値が(K−
L)の値以下であれば、ステップS22に進み、Mと全
文節数Kを比較して、一致した場合はステップS25に
進む。ステップS21で、(M−N)の値が(K−L)
の値より大きければ、不一致とし、ステップS23へ進
む。一方、Mと総文節数Nとを比較し、一致しなければ
ステップS24へ進んでMに1を加算し、ステップS1
8へと進み、次の文節の比較を行う。
加算し、継続して次の文節の一致を調べるために、補助
ポインタRに現在比較中の文節Mの文字数を足す。ステ
ップS21で不一致文節数(M−N)と不一致判断基準
文節数(K−L)とを比較し、(M−N)の値が(K−
L)の値以下であれば、ステップS22に進み、Mと全
文節数Kを比較して、一致した場合はステップS25に
進む。ステップS21で、(M−N)の値が(K−L)
の値より大きければ、不一致とし、ステップS23へ進
む。一方、Mと総文節数Nとを比較し、一致しなければ
ステップS24へ進んでMに1を加算し、ステップS1
8へと進み、次の文節の比較を行う。
【0033】ステップS22で、MとKが等しければ、
全ての文節を比較し終わったので、ステップS25へと
進み、部分一致成立として、その付近の文書データの表
示を行う(図6の画面5参照)。結果を確認後、ステッ
プS26で処理の継続/中止を選び(図6の画面6参
照)、中止ならば、処理を終了する(図6の画面7参
照)。
全ての文節を比較し終わったので、ステップS25へと
進み、部分一致成立として、その付近の文書データの表
示を行う(図6の画面5参照)。結果を確認後、ステッ
プS26で処理の継続/中止を選び(図6の画面6参
照)、中止ならば、処理を終了する(図6の画面7参
照)。
【0034】一方、続行する場合は、ステップS23へ
進み、一つサーチする位置を進める。そしてS27に進
み、検索する文書データがあるか否かを調べる。もしP
=文末の場合は、ステップS28に進み、一致と見なす
基準であるLから1を減じることで、一致条件の緩和を
行う。そして、ステップS15へと進み、条件を緩和し
て、再び文書の最初から部分一致による検索を行う。一
方、文末に達していない場合は、ステップS17へ進
み、現在の条件で、比較位置を進めて作業を継続する。
進み、一つサーチする位置を進める。そしてS27に進
み、検索する文書データがあるか否かを調べる。もしP
=文末の場合は、ステップS28に進み、一致と見なす
基準であるLから1を減じることで、一致条件の緩和を
行う。そして、ステップS15へと進み、条件を緩和し
て、再び文書の最初から部分一致による検索を行う。一
方、文末に達していない場合は、ステップS17へ進
み、現在の条件で、比較位置を進めて作業を継続する。
【0035】以上の処理を大きく分けると、以下のよう
になる。 ・ステップS1〜S5:検索文字列入力(仮名漢字変
換)作業 ・ステップS6〜S12:完全一致による検索作業 ・ステップS13〜S28:部分一致による検索作業
になる。 ・ステップS1〜S5:検索文字列入力(仮名漢字変
換)作業 ・ステップS6〜S12:完全一致による検索作業 ・ステップS13〜S28:部分一致による検索作業
【0036】実際の入力例を図6の画面の表示例に基づ
いて説明すると、ステップS1で処理を起動して、ステ
ップS2で図6の画面1のように、キーボード9から検
索文字列「かんぜんいっちけんさく」を入力し、ステッ
プS3で仮名漢字変換して、図6の画面2のように、
「完全一致検索」と変換する。この仮名漢字変換で、
「完全」「一致」「検索」のように自動的に3つの文節
に分けて変換されたとする。
いて説明すると、ステップS1で処理を起動して、ステ
ップS2で図6の画面1のように、キーボード9から検
索文字列「かんぜんいっちけんさく」を入力し、ステッ
プS3で仮名漢字変換して、図6の画面2のように、
「完全一致検索」と変換する。この仮名漢字変換で、
「完全」「一致」「検索」のように自動的に3つの文節
に分けて変換されたとする。
【0037】そして、ステップS4で確定すると、文節
の区切り情報を検索文字列「完全一致検索」に埋め込
み、記憶する。そして、完全一致による検索を開始す
る。まず、ここでは文書の先頭(1文字目)から調べる
ためのポインタをセットし、ステップS7で1文字目と
「完」、2文字目と「全」、3文字目と「一」、……、
5文字目と「検」、6文字目と「索」を比較し、全てが
一致した場合、ステップS8からステップS11で、そ
の部分を図6の画面3のように表示し、ステップS12
へ進み、図6の画面4のように表示し、処理の継続を尋
ね、操作者が継続を選択すると、ステップS9からステ
ップS10へと進み、ポインタを進め比較する。こうし
て、次の一致文字列が見つかるか、あるいは文末に達す
るまで、ステップS7,S8,S9,S10を繰り返
す。一方、ステップS9で文末であった場合は、ステッ
プS13へと進み、部分一致による検索モードに入る。
の区切り情報を検索文字列「完全一致検索」に埋め込
み、記憶する。そして、完全一致による検索を開始す
る。まず、ここでは文書の先頭(1文字目)から調べる
ためのポインタをセットし、ステップS7で1文字目と
「完」、2文字目と「全」、3文字目と「一」、……、
5文字目と「検」、6文字目と「索」を比較し、全てが
一致した場合、ステップS8からステップS11で、そ
の部分を図6の画面3のように表示し、ステップS12
へ進み、図6の画面4のように表示し、処理の継続を尋
ね、操作者が継続を選択すると、ステップS9からステ
ップS10へと進み、ポインタを進め比較する。こうし
て、次の一致文字列が見つかるか、あるいは文末に達す
るまで、ステップS7,S8,S9,S10を繰り返
す。一方、ステップS9で文末であった場合は、ステッ
プS13へと進み、部分一致による検索モードに入る。
【0038】部分一致による検索モードでは、まず、
「完全一致検索」の文節数3をLに代入し(ステップS
13)、さらにL−1=2のため(ステップS14)、
ステップS15からステップS16に進む。次に、ポイ
ンタを1とし、比較する位置をまず先頭にセットする。
そして、ステップS17で必要な数値を設定した後、ス
テップS18で、ポインタの示す文書データの位置に、
例えば「部分一致検索では」という文字列が存在したと
すると、まず、「部分」と「完全」を比較して、不一致
であるので、ステップS21に進み、(M−N)=1と
(K−L)=1を比較し、等しいので、ステップS22
へと進み、M=1、K=3なのでステップS24、S1
8へと進む。ここで、文節「一致」と「部分」を比較し
た結果、不一致であり、(M−N)=2、(K−L)=
1と一致基準を下回るので、その位置での比較を中止
し、ステップS23へと進み、比較位置ポインタPを進
める。このとき、文末であるのか否かのチェックもステ
ップS27で行い、今度は文書データの文字列「分一致
検索で」と比較する。この場合も不一致となり、更に比
較位置ポインタPが進められて、文書データの文字列
「一致検索では」と比較する。
「完全一致検索」の文節数3をLに代入し(ステップS
13)、さらにL−1=2のため(ステップS14)、
ステップS15からステップS16に進む。次に、ポイ
ンタを1とし、比較する位置をまず先頭にセットする。
そして、ステップS17で必要な数値を設定した後、ス
テップS18で、ポインタの示す文書データの位置に、
例えば「部分一致検索では」という文字列が存在したと
すると、まず、「部分」と「完全」を比較して、不一致
であるので、ステップS21に進み、(M−N)=1と
(K−L)=1を比較し、等しいので、ステップS22
へと進み、M=1、K=3なのでステップS24、S1
8へと進む。ここで、文節「一致」と「部分」を比較し
た結果、不一致であり、(M−N)=2、(K−L)=
1と一致基準を下回るので、その位置での比較を中止
し、ステップS23へと進み、比較位置ポインタPを進
める。このとき、文末であるのか否かのチェックもステ
ップS27で行い、今度は文書データの文字列「分一致
検索で」と比較する。この場合も不一致となり、更に比
較位置ポインタPが進められて、文書データの文字列
「一致検索では」と比較する。
【0039】まず、文節「完全」と「一致」を比較し
て、不一致となるので、次に「一致」と「一致」を比較
し、一致するので、N=1とし、補助ポインタRに文節
「一致」の文字数2を足し(ステップS20)、次に、
文書データの文字列「一致検索では」の(P+2)文字
目、つまり「検索」と文節「検索」を比較する(ステッ
プS18)。これは一致するので、N=2とし、補助ポ
インタR=4とする(ステップS20)。次に、ステッ
プS21で(M−N)=(3−2)=1、(K−L)=
(3−2)=1となって、(M−N)と(K−L)とが
等しくなる。
て、不一致となるので、次に「一致」と「一致」を比較
し、一致するので、N=1とし、補助ポインタRに文節
「一致」の文字数2を足し(ステップS20)、次に、
文書データの文字列「一致検索では」の(P+2)文字
目、つまり「検索」と文節「検索」を比較する(ステッ
プS18)。これは一致するので、N=2とし、補助ポ
インタR=4とする(ステップS20)。次に、ステッ
プS21で(M−N)=(3−2)=1、(K−L)=
(3−2)=1となって、(M−N)と(K−L)とが
等しくなる。
【0040】3つの文節を全て比較し終わったところで
(ステップS22)、部分一致成立となり、ステップS
25へと進み、その部分を図6の画面5のように表示す
る。次に、継続するかどうかを選択し(ステップS2
6)、継続しなければ作業終了とし、継続する場合は、
同様の処理を、一致文字列があるか、あるいは比較位置
が文末となるまで繰り返し行う。
(ステップS22)、部分一致成立となり、ステップS
25へと進み、その部分を図6の画面5のように表示す
る。次に、継続するかどうかを選択し(ステップS2
6)、継続しなければ作業終了とし、継続する場合は、
同様の処理を、一致文字列があるか、あるいは比較位置
が文末となるまで繰り返し行う。
【0041】実際の条件の緩和は、一致と見なす基準L
を1ずつ減じて行う。また、Lが0となった場合は、緩
和不可として、処理を終了する。
を1ずつ減じて行う。また、Lが0となった場合は、緩
和不可として、処理を終了する。
【0042】このようにして、特定の文字列に部分一致
する文字列を検索する場合に、漢字仮名交じり文への変
換作業時の文節の区切り情報を利用することにより、文
節単位での部分一致検索を行うことが可能となり、検索
作業の効率化を図ることができる。
する文字列を検索する場合に、漢字仮名交じり文への変
換作業時の文節の区切り情報を利用することにより、文
節単位での部分一致検索を行うことが可能となり、検索
作業の効率化を図ることができる。
【0043】
【発明の効果】この発明によれば、以下のような効果を
奏する。すなわち、指定検索文字列の中の文字と文字と
の関係が明確化されるので、操作者の期待しない条件の
自動生成を抑制することができる。また、無駄な作業、
すなわち操作者の期待しない条件の生成と検索作業が減
り、作業の効率化および作業時間の短縮化を図ることが
できる。さらに、無意味な条件の生成が抑制されること
により、不必要な文字列の抽出が無くなり、作業の有効
性が向上する。そして、変換時に用いられる文節の区切
りは、内部辞書データを参照するため、同じ辞書データ
を用いて変換を行う装置では、効率的な検索が可能とな
る。
奏する。すなわち、指定検索文字列の中の文字と文字と
の関係が明確化されるので、操作者の期待しない条件の
自動生成を抑制することができる。また、無駄な作業、
すなわち操作者の期待しない条件の生成と検索作業が減
り、作業の効率化および作業時間の短縮化を図ることが
できる。さらに、無意味な条件の生成が抑制されること
により、不必要な文字列の抽出が無くなり、作業の有効
性が向上する。そして、変換時に用いられる文節の区切
りは、内部辞書データを参照するため、同じ辞書データ
を用いて変換を行う装置では、効率的な検索が可能とな
る。
【図1】この発明の構成を示すブロック図である。
【図2】この発明の一実施例の構成を示すブロック図で
ある。
ある。
【図3】文節区切り情報の埋め込み方法を示す説明図で
ある。
ある。
【図4】区切り情報の利用方法を示す説明図である。
【図5】実施例の動作を示すフローチャートである。
【図6】画面の表示例を示す説明図である。
【図7】従来技術による一致の判定を示す説明図であ
る。
る。
1 CPU 2 RAM 3 ROM 4 プリンタコントローラ 5 プリンタ 6 表示コントローラ 7 表示装置 8 キーインターフェース 9 キーボード 10 FDコントローラ 11 FD 12 ICカードインターフェース 13 ICカード 14 アドレスバス・データバス 15 システムデータ記憶用EEPROM
Claims (1)
- 【請求項1】 単語の読み情報を複数の文節にわたって
入力する入力手段と、 仮名漢字変換辞書を有し、その辞書を参照することによ
り、入力された読み情報を複数の文節からなる漢字仮名
交じり文に変換する変換手段と、 入力された読み情報が漢字仮名交じり文に変換されると
き、その漢字仮名交じり文に文節の区切り情報を付加す
る文節情報付加手段と、 文節の区切り情報の付加された多数の漢字仮名交じり文
を含む文書を記憶した文書記憶手段と、 漢字仮名交じり文に付加された文節の区切り情報を参照
することにより、変換手段によって変換された漢字仮名
交じり文の複数の文節の内の、いずれか一つ又はそれ以
上の文節の漢字仮名交じり文と一致する漢字仮名交じり
文を、文書記憶手段に記憶された文書の中から検索する
検索手段と、 検索手段による検索結果を出力する出力手段を備えてな
る文字検索機能付き文書処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5074321A JPH06290219A (ja) | 1993-03-31 | 1993-03-31 | 文字検索機能付き文書処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5074321A JPH06290219A (ja) | 1993-03-31 | 1993-03-31 | 文字検索機能付き文書処理装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH06290219A true JPH06290219A (ja) | 1994-10-18 |
Family
ID=13543744
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5074321A Pending JPH06290219A (ja) | 1993-03-31 | 1993-03-31 | 文字検索機能付き文書処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH06290219A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10228484A (ja) * | 1997-02-17 | 1998-08-25 | Nippon Telegr & Teleph Corp <Ntt> | データベース検索装置および方法 |
| JP2008134772A (ja) * | 2006-11-28 | 2008-06-12 | National Institute Of Information & Communication Technology | 文書処理装置、文書の製造方法、およびプログラム |
-
1993
- 1993-03-31 JP JP5074321A patent/JPH06290219A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10228484A (ja) * | 1997-02-17 | 1998-08-25 | Nippon Telegr & Teleph Corp <Ntt> | データベース検索装置および方法 |
| JP2008134772A (ja) * | 2006-11-28 | 2008-06-12 | National Institute Of Information & Communication Technology | 文書処理装置、文書の製造方法、およびプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4777600A (en) | Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms | |
| US5890103A (en) | Method and apparatus for improved tokenization of natural language text | |
| WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
| JPH06290219A (ja) | 文字検索機能付き文書処理装置 | |
| JP2595934B2 (ja) | 仮名漢字変換処理装置 | |
| JPH08212216A (ja) | 自然言語処理装置および自然言語処理方法 | |
| JP2621999B2 (ja) | 文書処理装置 | |
| JPS59100941A (ja) | 仮名漢字変換装置 | |
| JPS6175952A (ja) | 文書入力処理方式 | |
| JP3204517B2 (ja) | 未知語認定方法 | |
| JPS6172361A (ja) | かな漢字変換装置 | |
| JP3137329B2 (ja) | 文書編集装置 | |
| JP3884001B2 (ja) | 言語解析システムおよび方法 | |
| JP3273778B2 (ja) | 仮名漢字変換装置及び仮名漢字変換方法 | |
| JPH0683807A (ja) | 文書作成装置 | |
| JPH05108703A (ja) | 機械翻訳機 | |
| JPS60112175A (ja) | 仮名漢字変換装置における略称語変換方式 | |
| JPH1091627A (ja) | 漢字よみがな自動変換方法およびシステム | |
| JPH05225232A (ja) | テキスト自動前編集装置 | |
| JPH0131229B2 (ja) | ||
| JPH0567076A (ja) | かな漢字変換装置 | |
| JPH08241315A (ja) | 文書処理装置の単語登録機構 | |
| JPH0683806A (ja) | 文書作成装置 | |
| JPH0619974A (ja) | 情報検索装置 | |
| JPS63136264A (ja) | 機械翻訳装置 |