JPS58115529A

JPS58115529A - 辞書検索方式

Info

Publication number: JPS58115529A
Application number: JP56213630A
Authority: JP
Inventors: Takiko Fuji; 富士　多喜子; Kiyoshi Oi; 大井　清
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1981-12-29
Filing date: 1981-12-29
Publication date: 1983-07-09

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の分野〕本発明は日本記ワードプロセッサに用いられるカナ漢字
変換に関し、特にそのための辞書の構成及び検索の方式
に関する。

〔従来技術とその間四点〕

従来、カナ漢字変換において単語辞書を検索する際には
、キーと々る入力カナ文字列と見出しが完全に一致する
場合に、有効が単語データとして取り■していた。この
ため、入力文字列の一部分が変化すると、同じデータを
得ることは不可症であった。つまり、一つの即飴で読み
方のいろいろあるものは、その読み方それぞれの見出し
を持つ必要があった。例えば、「東京」は「トウキ！つ
」「トウキ、−Ｊ、ｒトーキ、−」のように例通りかの
読み方が存在するため、それぞれの読みに対応した見出
しが必要である。しかし、このような単語すべてについ
て、読み方の変化をすべて揃えるということは、困難で
あり、現実には−通りの見出しのみ存在するものがほと
んどである。従って、辞書に存在する読み方以外の読み
方で検索すると、正しいデータを得ることができなかっ
た。

〔発明の目的〕

本発明は、このように読み方に多少の変化が許される単
語について、見出しの数を増やすことなく、どの読み方
で検索しても正しいデータを得ることを目的とするもの
である。

〔発明の構成〕

本発明の第１の実施例においては単語辞１１ＶＣおいて
見出しｔ−構成する文字列の中で他の文字に変化しても
全体としては同じ単語を表わすような文字に印を付加す
る（例「ト簀ウキ、簀つ」）。検索の際はまず最初に従
来通り、入力文字列と完全に一致する単語をサーチする
。このとき候補単語が見つかれば、検索は終了し、見つ
からなかった場合は、印の付いた文字を比較しない方法
でサーチを行う。

また本発明のＭ２の実施例においては皐飴辞曹において
見出しを構成する文字列の中で他の文字に変化する可能
性のある文字を、記号に置きかえて別に、変化する候補
文字のテーブルを持つ。検索の際に、入力文字列と見出
しを比較すると色は、まず上記記号の部分を除いて検索
し、その結果一致した見出しの中に記号が含まれている
場合は、上記テーブルをお照し、その記号に対応する文
字の中に入力文字列の該当文字と一致するものがあるか
どうかを調べ、あれば、文字が一致したものと同じに扱
う。

〔発明の実施例〕

第】図は本発明の第１の実施例を示すプロ、り図であり
、ＫＢは入力キーボード、ＤＩＣＴは辞書、データパ、
７ア、ＤＰＬＹはディスプレイ出力部である。辞書ＤＩ
ＣＴの内容は第１表に示す如くカナ見出しにおいて変化
する可能性のあるカナ文字には印（＊）が付されている
。

第１図において、例えばＫＢから「トーキ、−」という
キーの文字列を入力したとする。５ＲＣＨＦｉまずＤＩ
ＣＴの見出しの中から「トーキ、−」を探すが、これは
存在していないのでＦＦがセットされ、２回目の検索に
入る。２回目の検索ではｒ）ＩＣＴの見出しのうち＊印
の付いている文字は比較対象から外しく又は強制的に一
致しているものとみなし）、他の部分のみを比較する。

この例でｒｉｌト＊ウキ冒＊つ」という見出しと「ト、
キ、町が一致するので、そ、ｈ−に対応する漢字コード
１東京」が候補としてＤＰＬＹに表示される。

一方、入力キー文字列として「トッキ冒」を与えたとす
ると、「特許」が該当するので、これを第１候補として
ＤＰＬＹに表示する。

また候補文字を複数出力できるシステムにおいては、１
回目の検索でずばり該当するものが有ってもさらに第２
検索で＊印の文字を無視して検索をするようにしてもよ
い。但し、第１検紫で見付けた漢字を第】候補、第２検
索で見付けた漢字を第２候補とするようＰＲＴＹで優先
順位を制叔する。

上記の例「トッキ、」では「特許」と「東京」とが表示
される。

第２図は本発明の第２の実施例を示すプロ、り図であり
、第１図と同一の記号は同一のものを示す。第２図の辞
書ＤＩＣＴ’は第２表に示す如く見出しが記入されてい
る。即ち質化し得るカナ文字位置は＠、＊、＃等の符号
に置換されている。

またテーブルＴＢＬには第３表に示す如く上記各符号が
とり得るカナ文字が定義されている。

第２表記３表第３表において、ＮＵＬは文字が無いことを童味する。

例えば入力キー文字列として「トウキ目つ」を与えた場
合、５ＲＣＩ（’はまずＤＩＣＴの各見出し中、牢印の
部分は比較対象から外して検索する０すると「ト＊キ、
＊」が＊印を除くと一致することに彦る。そこでＴＢＬ
中の＊印の項を引くと＊とじては「つ」と「−」があり
得ることになり、入力キー文字列においてはいずれの＊
該当位置も「つ」であるから、「東京」が正解であるこ
とが判る。同様に入力キー文字列として「トーキ、−」
。

「トウキ、−」Ｘは「トーキ、つ」を与えた場合にも「
東京」が得られる。

一方、入力キー文字列として「トッキ曹」を与えた場合
、符号文字を除外した検索では「ト＊キョ＊」と「ト＃
キ冒」の双方が該当する。しかしＴＢＬを引いてみると
、＊の項には「ツ」も「Ｎ　Ｕ　Ｌｊも存在ｔ７ていな
いので、「ト＊キ、＊」は該当しかいことが判る。一方
ＴＢＬの＃の項には「ツ」が存在するので、この場合は
「ト＃キ、」即ち１％許」が正ｔ’ｌ：とじて得られる
。

同様にして、「コンピュータ」、「コンピュータア」、
「コンピューター」のいずれの入カキ−に対しても「コ
ンピュータ」が出力される。

伺、本発明でいう漢字コードは狭し１意味の漢字ばかり
でなく、広く「単語」の意に解してよい。

〔発明の効果〕

以上のような方式を用いると、辞書の見出し通りの入力
を行った場合には、従来通りに単語を得ることができ、
多少変化した形の入力を行った場合には、印の付いた文
字を比較しないサーチで候補単語を得ることができる。

また、本発明の第１実施例は従来通りの辞書形式を使用
し、見出しに印を付加するだけで、比較的簡単に実覗す
ることができる。

また本発明の第２実施例はＴＢＬを用いることにより、
より正確な検索が可能となる。

【図面の簡単な説明】

鯖１　（＞’Ｉは本発明の第１実施例、第２図は同第２
実施例のブロック図であり、ＫＢは人力キーボード部、
ＤＩＣＴ、１）ＩＣＴ’は辞書、５ＲＣＨ，５ＲＣＨ’
は見出し比ｔ＞部、ＤＢＵＦはデータノくツファ。ＤＰＬＹはディスプレイ田力部、１’ＢＬは符号テーブ
ルである。代理人　弁理士　松　岡　宏盟部−殆２．□−１Ｖ刀

Claims

【特許請求の範囲】

（１）　　カナの見出しと、その見出しに対応した漢字
コードを持つカナ漢字変換用の辞書の検索において見出
しを構成する文字の中で必ずしも一致しなくてもよい文
字に印を付加しておき、検索入力カナ文字列と完全に一
致する漢字コードがない場合は、印を付加したカナ文字
の比較を行わないで検案することを特９とする辞書検案
方式。
（２）　　カナの見出しと、その見出しに対応した漢字
コードを持つカナ漢字変換用の辞書の検索において、該
辞書の見出しを構成する文字の中で変化の可能性のある
文字を、特殊な符号に置き換えるとともに、ｔｉｅかえ
九特殊符号に対応する候補文字を記憶したテーブルを設
は上記辞書を用いて上記特殊符号部分を除外した見出し
で検索し、該当する見出しについてはその特殊符号を上
記テーブルにより検索して入力文字との対応を確認する
ととを特徴とする辞書検索方式。