JPH03164859A - かな漢字変換装置 - Google Patents
かな漢字変換装置Info
- Publication number
- JPH03164859A JPH03164859A JP1304159A JP30415989A JPH03164859A JP H03164859 A JPH03164859 A JP H03164859A JP 1304159 A JP1304159 A JP 1304159A JP 30415989 A JP30415989 A JP 30415989A JP H03164859 A JPH03164859 A JP H03164859A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- data
- word
- kanji
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、かなの状態で入力された文字列をかな漢字混
じ9列に変換するかな漢字変換装置に関するものである
。
じ9列に変換するかな漢字変換装置に関するものである
。
従来の技術
近年かな漢字変換装置は日本語を入力するために用いら
れる装置として、日本語ワード・プロセッサを初めとし
て各種の日本語処理装置に広く用いられている。かな漢
字変換装置は、入力されたかな列をかな漢字混じり列に
変換するために用いられる。例えば、次のかな列 きようのてんきははれてず。
れる装置として、日本語ワード・プロセッサを初めとし
て各種の日本語処理装置に広く用いられている。かな漢
字変換装置は、入力されたかな列をかな漢字混じり列に
変換するために用いられる。例えば、次のかな列 きようのてんきははれてず。
を入力すると、
今日の天気は晴れです。
と変換を行うことができる。また、最近のかな漢字変換
装置には、頻繁に使用される複合語も自立語辞書に登録
することにより、変換の効率を上げることができるもの
も出てきた。例えば、次のかな列 しょうききかんのはったつにより、 を入力し、変換を行なうとする。自立語辞書には「しよ
うききかん」という読みで、「蒸気機関」という語が登
録されているので、 蒸気機関の発達により、 と変換を行うことができる。
装置には、頻繁に使用される複合語も自立語辞書に登録
することにより、変換の効率を上げることができるもの
も出てきた。例えば、次のかな列 しょうききかんのはったつにより、 を入力し、変換を行なうとする。自立語辞書には「しよ
うききかん」という読みで、「蒸気機関」という語が登
録されているので、 蒸気機関の発達により、 と変換を行うことができる。
発明の解決しようとする課題
しかしながら、以上説明した従来のかな漢字変換装置は
、複合語であっても、一つの自立語として扱うため、 しょうききかんにちんしやくにんからもうじでかあった
ばあい、 を入力すると、 蒸気機関に賃借人から申し出があった場合。
、複合語であっても、一つの自立語として扱うため、 しょうききかんにちんしやくにんからもうじでかあった
ばあい、 を入力すると、 蒸気機関に賃借人から申し出があった場合。
となってしまい、誤った変換結果を得ることになる。こ
のように、2つの語の連続(以下、連語と呼ぶ)が複1
合語と同じ読みになってしまう(以下読みの衝突と呼ぶ
)場合、ユーザはまず、「蒸気機関に」という文節にカ
ーソルを当てて、文節縮小キー等で文節を「蒸気」、「
機関に」のように切り直し、さらに、「蒸気」、「機関
に」のそれぞれの文節に対して、再変換を行なって、「
上記」「期間に」という候補を得なければならなかった
。
のように、2つの語の連続(以下、連語と呼ぶ)が複1
合語と同じ読みになってしまう(以下読みの衝突と呼ぶ
)場合、ユーザはまず、「蒸気機関に」という文節にカ
ーソルを当てて、文節縮小キー等で文節を「蒸気」、「
機関に」のように切り直し、さらに、「蒸気」、「機関
に」のそれぞれの文節に対して、再変換を行なって、「
上記」「期間に」という候補を得なければならなかった
。
また、辞書に「上記期間」を登録するといった方法も考
えられるが、複合語との読みの衝突が考えられる単語の
組合せは膨大な数になり、全てを登録するのは辞書のサ
イズの増大による検索スピードの劣化を招き実用的では
ない。
えられるが、複合語との読みの衝突が考えられる単語の
組合せは膨大な数になり、全てを登録するのは辞書のサ
イズの増大による検索スピードの劣化を招き実用的では
ない。
課題を解決するための手段
この課題を解決するために本発明は一つの自立語或いは
複数の自立語が結合した複合語の読みデータとその漢字
データと複合語の区切れを示すデータとで構成される単
語データを複数個記憶した辞書を設け、辞書から読み出
した漢字データが複合語の場合、辞書に記憶された区切
れを示すデータに従って読み出された漢字データを区切
り、該区切れ毎の自立語に対応する漢字データを辞書か
ら読み出す手段で構成される。
複数の自立語が結合した複合語の読みデータとその漢字
データと複合語の区切れを示すデータとで構成される単
語データを複数個記憶した辞書を設け、辞書から読み出
した漢字データが複合語の場合、辞書に記憶された区切
れを示すデータに従って読み出された漢字データを区切
り、該区切れ毎の自立語に対応する漢字データを辞書か
ら読み出す手段で構成される。
作 用
複合語を変換結果として読み出した場合、辞書に記憶さ
れたその複合語の区切れを示すデータに従って区切れ毎
での辞書検索が可能になる。
れたその複合語の区切れを示すデータに従って区切れ毎
での辞書検索が可能になる。
実施例
以下、本発明の一実施例におけるかな漢字変換装置につ
いて説明する。
いて説明する。
第1図は本実施例のかな漢字変換装置の機能ブロック図
である。ここで1はかなデータを入力するためのかなキ
ーや、入力したかなデータの漢字データへの変換指示キ
ー及び再変換キーを備えたキーボードで構成された入力
手段である。2は入力手段1よシ入力されたかなデータ
を記憶する入力かな列記境部である。3は単語の読みデ
ータと漢字データと品詞情報と、さらに該単語が複合語
の場合には読みと漢字表記のそれぞれに対する文節の区
切シ位置とを一組の単語データとして記憶している単語
辞書である。7は単語辞書3を検索して入力されたかな
列記境部2に記憶されたかな列を漢字かな混じ9列に変
換し、変換結果が複数の自立語を含むような複合語であ
った場合には。
である。ここで1はかなデータを入力するためのかなキ
ーや、入力したかなデータの漢字データへの変換指示キ
ー及び再変換キーを備えたキーボードで構成された入力
手段である。2は入力手段1よシ入力されたかなデータ
を記憶する入力かな列記境部である。3は単語の読みデ
ータと漢字データと品詞情報と、さらに該単語が複合語
の場合には読みと漢字表記のそれぞれに対する文節の区
切シ位置とを一組の単語データとして記憶している単語
辞書である。7は単語辞書3を検索して入力されたかな
列記境部2に記憶されたかな列を漢字かな混じ9列に変
換し、変換結果が複数の自立語を含むような複合語であ
った場合には。
複合語を構成語で分離し、複数の文節とし、それらの文
節に対する候補の全ての表記を出力するかな漢字変換制
御部である。8はかな漢字変換制御部7から出力された
漢字かな混じり列を記憶する出力文字列記憶部である。
節に対する候補の全ての表記を出力するかな漢字変換制
御部である。8はかな漢字変換制御部7から出力された
漢字かな混じり列を記憶する出力文字列記憶部である。
9は出力文字列記憶部8に記憶された漢字かな混じり列
及び入力かな列記境部2に格納されたかなテ°−夕を表
示する表示手段である。
及び入力かな列記境部2に格納されたかなテ°−夕を表
示する表示手段である。
第2図は本実施例のかな漢字変換装置の回路ブロック図
であり、1oはキーボード、11は中央処理装置(以下
、CPUと略称する)、12は陰極線管ディヌプレイ、
(−以下、CRTデイスプレィと略称する。)、13は
す〒ドオンリーメモリ(以下、ROMと略称する。)、
14はランダムアクセスメモリ(以下、RAMと略称す
る。)である。
であり、1oはキーボード、11は中央処理装置(以下
、CPUと略称する)、12は陰極線管ディヌプレイ、
(−以下、CRTデイスプレィと略称する。)、13は
す〒ドオンリーメモリ(以下、ROMと略称する。)、
14はランダムアクセスメモリ(以下、RAMと略称す
る。)である。
第1図に示した入力手段1はキーボード1oにより、入
力かな列記境部2、出力文字列記憶部8はRAM14に
より、単語辞書3はROM1sにより、かな漢字変換制
御部7はCPU11がROM13およびRAM14とデ
ータのやりと9を行いながらROM13に記憶されたプ
ログツムを実行することにより、表示手段9はCRTデ
イスプレィ12によシ実現されている。
力かな列記境部2、出力文字列記憶部8はRAM14に
より、単語辞書3はROM1sにより、かな漢字変換制
御部7はCPU11がROM13およびRAM14とデ
ータのやりと9を行いながらROM13に記憶されたプ
ログツムを実行することにより、表示手段9はCRTデ
イスプレィ12によシ実現されている。
上記のように構成された本実施例のかな漢字変換装置に
ついて、以下この動作を第3図のフローチャートにもと
づき説明する。
ついて、以下この動作を第3図のフローチャートにもと
づき説明する。
まず、ステップ(イ)で入力手段1からかな列が入力さ
れると、その内容は入力かな列゛記憶部2に格納される
。たとえば、次のかな烈 しょうききかんにちんしゃくにんのもうじでかあったば
あい、 を入力手段1より入力すると、入力かな列記憶部2に格
納される。さらに入力手段1よシ変換キーが入力される
と、ステップ(切に進み、かな漢字変換制御部7は単語
辞書3を検索しながら次の文節区切シを決定する。
れると、その内容は入力かな列゛記憶部2に格納される
。たとえば、次のかな烈 しょうききかんにちんしゃくにんのもうじでかあったば
あい、 を入力手段1より入力すると、入力かな列記憶部2に格
納される。さらに入力手段1よシ変換キーが入力される
と、ステップ(切に進み、かな漢字変換制御部7は単語
辞書3を検索しながら次の文節区切シを決定する。
第4図は一実施例の単語辞書の内容を示す図である。区
切シ位置に書かれている数字は先頭から数えて何文字目
から後ろの構成語が始まるかを示している。ただし、0
が書かれている単語は複合語ではなく区切りが存在しな
いことを示している。
切シ位置に書かれている数字は先頭から数えて何文字目
から後ろの構成語が始まるかを示している。ただし、0
が書かれている単語は複合語ではなく区切りが存在しな
いことを示している。
例文の場合では、かな漢字変換制御部7によって、まず
「しょうききかんに」が文節として切り出される。次に
ステップ(ハ)でいま決定した文節の中に複合語が含ま
れるかどうかを調べる。上の例では「しょうき・きかん
」という複合語が含まれるので、ステップに)に進む。
「しょうききかんに」が文節として切り出される。次に
ステップ(ハ)でいま決定した文節の中に複合語が含ま
れるかどうかを調べる。上の例では「しょうき・きかん
」という複合語が含まれるので、ステップに)に進む。
ステップに)では文節に含まれる複合語を構成語の単位
で分割し、ステップ(へ)に進む。以下、通常の文節を
大文節、複合語の区切υによって分割されたできた文節
を小文節と呼ぶ。
で分割し、ステップ(へ)に進む。以下、通常の文節を
大文節、複合語の区切υによって分割されたできた文節
を小文節と呼ぶ。
また、ステップ(ハ)で複合語がないと判断された場合
には、ステップ(ホ)に進み、ステップ(ホ)では、大
文節を小文節とみなしてステップ(へ)に進む。
には、ステップ(ホ)に進み、ステップ(ホ)では、大
文節を小文節とみなしてステップ(へ)に進む。
ステップ(へ)では、かな漢字変換制御部7は単語辞書
3を検索し、小文節に対する表記の候補を出力記憶部に
格納する。上の例では「しょうききかんに」という大文
節が「しょうき」と「きかんに」という2つの小文節に
分割され、その候補とじて「蒸気」、「上記」、「上気
」、「常軌」、「条規」および「機関」、「期間」、「
基幹」、[帰還]が出力記憶部に格納される。そして、
再変換キ、−の操作によって、これらが表示される。次
にステップ(ト)では、全ての入力文について変換が終
ったかを調べ、終っていればステップ(イ)に進む。終
っていなければステップ(に)からの動作を行なう。変
換結果は出力文字列記憶部8に記憶される。つぎにステ
ップ(イ)に進み、表示手段9に第9図のように変換結
果が得られる。
3を検索し、小文節に対する表記の候補を出力記憶部に
格納する。上の例では「しょうききかんに」という大文
節が「しょうき」と「きかんに」という2つの小文節に
分割され、その候補とじて「蒸気」、「上記」、「上気
」、「常軌」、「条規」および「機関」、「期間」、「
基幹」、[帰還]が出力記憶部に格納される。そして、
再変換キ、−の操作によって、これらが表示される。次
にステップ(ト)では、全ての入力文について変換が終
ったかを調べ、終っていればステップ(イ)に進む。終
っていなければステップ(に)からの動作を行なう。変
換結果は出力文字列記憶部8に記憶される。つぎにステ
ップ(イ)に進み、表示手段9に第9図のように変換結
果が得られる。
発明の効果
以上のように本発明は、複数の自立語からなる複合語も
記憶した辞書の複合語を構成する自立語毎の区切れを示
すデータも記憶させ、変換結果として読み出されたデー
タが複合語の場合、その区切れを示すデータに従って区
切り、その区切り毎の自立語に対応する漢字データを読
み出すようにしたので、複合語の一部である自立語に対
して再変換を行いたい場合に、文節の縮小を行うような
指示操作を行う必要がなくなる。
記憶した辞書の複合語を構成する自立語毎の区切れを示
すデータも記憶させ、変換結果として読み出されたデー
タが複合語の場合、その区切れを示すデータに従って区
切り、その区切り毎の自立語に対応する漢字データを読
み出すようにしたので、複合語の一部である自立語に対
して再変換を行いたい場合に、文節の縮小を行うような
指示操作を行う必要がなくなる。
第1図は本発明の一実施例におけるかな漢字変換装置の
機能ブロック図、第2図は同装置回路ブロック図、第3
図は同処理フローチャート、第4図は単語辞書の内容を
示す図である。
機能ブロック図、第2図は同装置回路ブロック図、第3
図は同処理フローチャート、第4図は単語辞書の内容を
示す図である。
Claims (1)
- 【特許請求の範囲】 かなデータを入力する入力手段と、前記入力手段から入
力されたかなデータを記憶する記憶手段と、 一つの自立語或いは複数の自立語が結合した複合語の読
みデータとその漢字データと複合語の区切れを示すデー
タとで構成される単語データを複数個記憶した辞書と、 前記辞書を参照して前記記憶手段に記憶されたかなデー
タを読みとする漢字データを読み出す辞書検索手段と、 前記辞書検索手段によって読み出された漢字データが複
合語である場合指示に応答して前記辞書に記憶された区
切れを示すデータに従って前記記憶手段に記憶されたか
なデータを区切り、該区切れ毎の自立語に対応する漢字
データを読み出す制御手段と、 を有することを特徴とするかな漢字変換装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1304159A JPH03164859A (ja) | 1989-11-22 | 1989-11-22 | かな漢字変換装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1304159A JPH03164859A (ja) | 1989-11-22 | 1989-11-22 | かな漢字変換装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03164859A true JPH03164859A (ja) | 1991-07-16 |
Family
ID=17929769
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1304159A Pending JPH03164859A (ja) | 1989-11-22 | 1989-11-22 | かな漢字変換装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH03164859A (ja) |
-
1989
- 1989-11-22 JP JP1304159A patent/JPH03164859A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5337232A (en) | Morpheme analysis device | |
| JPS59165179A (ja) | 辞書引方式 | |
| JPH0412866B2 (ja) | ||
| JPH03164859A (ja) | かな漢字変換装置 | |
| JP2792147B2 (ja) | 文字処理方法およびその装置 | |
| JPS6210763A (ja) | 仮名漢字変換処理装置 | |
| JPH0578058B2 (ja) | ||
| JPS62197864A (ja) | 言語情報提供装置 | |
| JP2621999B2 (ja) | 文書処理装置 | |
| JP3847801B2 (ja) | 文字処理装置及びその処理方法 | |
| KR20010067827A (ko) | 다국어 한자 데이터 베이스 구조 | |
| JP2862236B2 (ja) | 文字処理装置 | |
| JPS613267A (ja) | 仮名漢字変換処理装置 | |
| JPS63316162A (ja) | 文書作成装置 | |
| JPH0785040A (ja) | 表記不統一検出方法およびかな漢字変換方法 | |
| JPH0350668A (ja) | 文字処理装置 | |
| JPH03118661A (ja) | 単語検索装置 | |
| JPS6162970A (ja) | 仮名漢字変換装置 | |
| JPH0468466A (ja) | かな漢字変換装置 | |
| JPH0695330B2 (ja) | 文書作成装置 | |
| JP2002117025A (ja) | かな漢字変換装置およびかな漢字変換方法 | |
| JPH0727526B2 (ja) | かな漢字変換装置 | |
| JPH03208162A (ja) | 入力装置 | |
| JPS63174165A (ja) | ワ−ドプロセツサ | |
| JPH0610804B2 (ja) | かな漢字変換装置 |