JPH07146859A - 仮名漢字変換装置 - Google Patents

仮名漢字変換装置

Info

Publication number
JPH07146859A
JPH07146859A JP6152766A JP15276694A JPH07146859A JP H07146859 A JPH07146859 A JP H07146859A JP 6152766 A JP6152766 A JP 6152766A JP 15276694 A JP15276694 A JP 15276694A JP H07146859 A JPH07146859 A JP H07146859A
Authority
JP
Japan
Prior art keywords
phrase
segmentation
kana
bunsetsu
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6152766A
Other languages
English (en)
Inventor
Yasuo Koyama
泰男 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP6152766A priority Critical patent/JPH07146859A/ja
Publication of JPH07146859A publication Critical patent/JPH07146859A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 入力された文字列を、より適正な文節分かち
書き処理をし、迅速に仮名漢字変換をする。 【構成】 文節分かち書き部10は、入力された文字列
を単語辞書11と文節区切り学習辞書12とに基づいて
文節分かち書きする。分かち書きされた文節が所望の文
節でないときには、文節長変更部4により所望の文節長
に変更し、文節再解析部13を介して文節分かち書き部
10で再度文節分かち書きをする。文節候補確定部6に
より文節長が変更された文節が確定されると、文節候補
学習部18は、文節長が変更された文節と次の文節を連
接させて文節区切り学習辞書12に記憶する。この結
果、隣接した文節間の関係に基づいた文節分かち書きが
可能となる。また、単語辞書11と文節区切り学習辞書
12とを別体としたので、単語辞書11に基づく仮名漢
字変換の効率を高く維持することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語文章を入力する
ために入力された仮名文字列を、仮名漢字混じり文章に
変換する仮名漢字変換装置に関する。
【0002】
【従来の技術】従来の仮名漢字変換装置においては、文
節長を変更した文節と文節長を変更しない文節の両者を
混在させて、文節そのものを1つの単語として、単語辞
書とは別の学習文節辞書に文節区切りに関する情報とし
て登録していた。
【0003】例えば、「きょうははながさいた。」の入
力に対して、「今日は/花が/最多。」と変換されたと
する。ここで「最多」という文節に対して、複数の文節
候補(「最多」「咲いた」「裂いた」「財田」等)から
「咲いた」を選択すれば、学習文節辞書には「咲いた」
が記憶される。この結果、次回の解析、例えば、「きの
うもはながさいた」の入力に対して、「昨日も/花が/
咲いた。」と学習された内容により正しく変換すること
ができる。
【0004】
【発明が解決しようとする課題】しかしながら、文節そ
のものを1つの単語として学習文節辞書に登録する仮名
漢字変換装置では次のような問題があった。
【0005】この装置では、例えば、「ここではきもの
をぬぐ」の入力に対して「ここで/履物を/脱ぐ。」と
変換されたとき、「ここでは/着物を/脱ぐ。」とする
ために「ここで」という3文字の文節の長さを「ここで
は」という4文字の文節の長さに伸ばして変換すれば、
「ここでは」が学習文節辞書に登録される。このため、
次に同一の入力を行ない変換を行なった場合には、「こ
こではきものをぬぐ。」の入力に対して「ここでは/着
物を/脱ぐ。」と変換できるが、「ここではものをと
ぐ」の入力に対して「ここでは」が優先されて「ここで
/刃物を/研ぐ。」と変換されず、「ここでは/物を/
研ぐ。」と変換されてしまう。すなわち、「ここでは/
着物を」の学習の効果が、「ここで/刃物を」と変換し
たいところを「ここでは/物を」と変換し、本来2文節
間の関係により文節区切りを行うべき文節分かち書き処
理に不要な情報を与えて、余計な解析を行ってしまう。
【0006】また、この装置では、例えば、「しょどう
かをたずねる。」の入力に対して「書道かを/訪ね
る。」と変換されたときに「書道/家を/訪ねる。」と
文節長を変更すると、学習文節辞書には「書道」が登録
される。しかし、次に同一の入力を行って変換しても、
文節数が最小になるように文節分かち書き処理されるの
で、3文節の「書道/家を/訪ねる。」と変換されず、
2文節の「書道かを/訪ねる。」と変換されてしまう。
【0007】本発明の仮名漢字変換装置は、こうした問
題を解決し、入力された文字列を、より適正な文節分か
ち書き処理をし、迅速に仮名漢字変換をすることを目的
とし、次の構成を採った。
【0008】
【課題を解決するための手段】本発明の仮名漢字変換装
置は、文字列を文節分かち書き処理するのに必要な文法
情報と仮名みだしと該仮名みだしに対応する複数の漢字
候補とを記憶する単語辞書と、該単語辞書を参照して文
字列を文節分かち書き処理する文節分かち書き処理手段
と、該文節分かち書き処理された文字列を前記単語辞書
を参照して文節単位に仮名漢字変換する変換手段とを備
え、入力された仮名の文字列を仮名漢字変換する仮名漢
字変換装置であって、文節分かち書き処理において文節
長が変更されて確定されたとき、該文節と該文節の次の
文節とを連接してなる2文節を文節情報として記憶する
文節情報記憶手段を、前記単語辞書と別体に設け、前記
入力された文字列を、前記文節分かち書き処理手段によ
る文節分かち書き処理と異なるタイミングで、前記文節
情報記憶手段に記憶された文節情報に基づいて文節分か
ち書き処理を行なう文節処理手段を設けてなることを要
旨とする。
【0009】
【作用】以上のように構成された本発明の仮名漢字変換
装置は、文節分かち書き処理手段が、入力された仮名の
文字列を文節分かち書き処理するのに必要な文法情報と
仮名みだしと該仮名みだしに対応する複数の漢字候補と
を記憶する単語辞書を参照して文字列を文節分かち書き
処理し、変換手段が、この文節分かち書き処理された文
字列を前記単語辞書を参照して文節単位に仮名漢字変換
する。単語辞書と別体に設けられた文節情報記憶手段
は、文節分かち書き処理において文節長が変更されて確
定されたとき、該文節と該文節の次の文節とを連接して
なる2文節を文節情報として記憶する。文節処理手段
は、入力された文字列を、文節分かち書き処理手段によ
る文節分かち書き処理と異なるタイミングで、文節情報
記憶手段に記憶された文節情報に基づいて文節分かち書
き処理を行なう。文節情報記憶手段は単語辞書と別体と
されるから、文節情報記憶手段に記憶される文節情報量
の多少が単語辞書を参照してなされる仮名漢字変換の効
率に影響を与えることがない。
【0010】
【実施例】以上説明した本発明の構成・作用を一層明ら
かにするために、以下本発明の好適な実施例について説
明する。図1は、本発明の一実施例としての仮名漢字変
換装置のハードウエア構成の概略を例示するブロック図
である。図示するように、仮名漢字変換装置は、CPU
1を中心にバス31により相互に接続された次の各部を
備える。CPU1とバス31により相互に接続された各
部について、簡単に説明する。
【0011】ROM22:仮名漢字変換プログラム等を
記憶するマスクメモリ RAM23:主記憶を構成する読み出し・書き込み可能
メモリ キーボードインタフェース25:キーボード24からの
キー入力を司るインタフェース CRTC27:カラーで表示可能なCRT26への信号
出力を制御するCRTコントローラ プリンタインタフェース29:プリンタ28へのデータ
の出力を制御するインタフェース また、これらの各部の他、バス31には将来の拡張に備
えて、拡張用スロット30が接続されている。
【0012】こうして構成されたハードウエアにより、
仮名文字列が入力,仮名漢字変換,編集,表示,印刷な
どがなされる。すなわち、キーボード24から入力され
た仮名文字列は、CPU1により所定の処理がなされ、
RAM23の所定領域に格納され、CRTC27を介し
てCRT26の画面上に表示される。
【0013】次に、こうして構成されたハードウエアに
より実行される機能を図2ないし図4を用いて説明す
る。図2は実施例の仮名漢字変換装置の機能を例示する
ブロック図である。
【0014】図2に示すように、入力部2で入力された
仮名文字列は、仮名漢字変換装置8に送られて仮名漢字
変換が行われ、文節候補を文節候補表示部3により表示
しながら、文節候補選択部5により文節単位に文節候補
を表示選択し、文節候補確定部6により所望の文節候補
を確定し、仮名漢字文字列は文章として、文章格納部7
に格納される。
【0015】仮名漢字変換装置8内では、仮名文字獲得
部9によって受け取られた仮名文字を、文節分かち書き
部10が、単語辞書11および文節区切り学習辞書12
に基づいて文法解析を行ない、文節分かち書き処理を行
う。分かち書きの結果、文節区切り学習辞書に登録され
た2文節(後述する連接された2つの文節)が1文節の
候補となった場合は、その2文節中に含まれる区切りマ
ークに基づき2つの文節に分解し、当該2つの文節の同
音異語文節を単語辞書11を検索して作成し、文節候補
格納部16に格納する。
【0016】ここで分かち書き表示部14は、文節候補
格納部16より各々の文節の第1候補を読み出して文節
候補表示部3に表示する。その後、文節候補選択部5
は、文節候補出力部15が文節候補格納部16から文節
単位に次々と候補を読み出して文節候補表示部3に表示
する候補の中から所望の候補を選択する。
【0017】そして文節分かち書きに誤りがある場合
は、文節長変更部4により文節を伸び縮みさせて文節再
解析部13に当該文節以降を再解析するように指示す
る。文節再解析部13は、さらに限定された部分の解析
を文節分かち書き部10に指示し、解析結果を文節候補
格納部16に文節長変更があった旨の文節長変更文節デ
ータと共に格納する。分かち書き表示部14は文節長変
更された文節以降の仮名漢字文字列を書き換える。
【0018】以上の操作により所望の仮名漢字文字列が
得られると、文節候補確定部6によって確定され結果が
文章格納部7に格納されると共に、確定文節情報受取部
17に送られる。
【0019】確定文節情報受取部17に送られた情報に
基づき文節候補学習部18は、文節長が変更されていな
い文節に対して、選択され表示されている文節の自立語
部分が他の文節候補中の自立語部分より小さくない場合
は、当該自立語の同音異語集団に対して当該自立語が先
頭となるように単語辞書11を書き換え、選択され表示
されている文節の自立語部分が他の文節候補中の自立語
部部より小さい場合は、最長の自立語の長さより小さく
ない単位で自立語に付属語を結合した状態で単語辞書1
1に登録する。また文節候補学習部18は、文節長が変
更された文節に対し、文節長変更を行った文節と次の文
節を連接させ文節区切りマークを付けた状態で文節区切
り学習辞書12に登録する。ただし、文節区切り学習辞
書12に同一の見出しが存在する場合は、これを削除し
た後に当該文節区切りデータを登録する。
【0020】次に実施例の仮名漢字変換装置における文
節分かち書き処理について図3に基づき説明する。図3
は、実施例の仮名漢字変換装置における文節分かち書き
処理を例示するフローチャートである。
【0021】図示するように、実施例の仮名漢字変換装
置は、〈201〉で仮名文字列を受け取り、仮名解析位
置の初期設定を行う。また、〈202〉により所定の仮
名解析位置より単語辞書11と文節区切り学習辞書12
を検索して単語候補を取り出す。これを基に〈203〉
により文節分かち書きを行なう。
【0022】そして、〈204〉により分かち書きされ
た文節内に学習辞書文節が存在した場合は、〈205〉
により、これらの文節を区切りマークに従い2文節に分
解すると共に、1文節単位に単語辞書11を検索して各
文節の同音異語候補を作成する。全文節候補が出揃う
と、〈206〉により文節区切りを確定し、〈207〉
により分かち書き表示する。
【0023】図4は、実施例の仮名漢字変換装置におけ
る文節学習の処理を例示するフローチャートである。図
示するように、実施例の仮名漢字変換装置の文節候補学
習は〈301〉で確定文節情報を受け取り、解析位置を
まず先頭文節とする。
【0024】そして〈302〉により解析位置の文節
が、文節区切り変更文節であるならば〈303〉により
文節長変更を行った文節と次の文節を連接させ文節区切
りマークを付けた状態で、文節区切り学習辞書12に登
録する。ただし、文節区切り学習辞書に、同一の見出し
が存在した場合は、これを削除した後当該文節区切りデ
ータを登録する。(図示せず)。
【0025】さらに〈304〉により確定された文節の
自立語部分が他の文節候補中の自立語部分より小さくな
い場合は、〈305〉により当該自立語の同音異語集団
に対して当該自立語が先頭となるように単語辞書11を
書き換える。また選択され表示されている文節の自立語
部分が他の文節候補中の自立語部分より小さい場合は、
〈306〉により最長の自立語の長さより小さくない単
位で自立語に付属語を結合した状態で単語辞書11に新
たに登録する。
【0026】これらの処理が終了すると〈307〉によ
り、処理中の文節が最終文節であるか確認し、最終文節
でなければ、処理文節を次文節に移し(図示せず)〈3
02〉よりの処理を繰り返して行う。なお当該文節が最
終文節であれば、これで処理を終了する。
【0027】以上の処理により、「ここではきものをぬ
ぐ。」の入力に対して「ここで/履物を/脱ぐ。」と変
換されたものを「ここでは/着物を/脱ぐ。」と文節長
を変更して確定すると、文節長の変更された文節「ここ
では」とその次の文節「着物を」が連接されて「ここで
は/着物を」が文節区切り学習辞書12に登録される
(第3図<303>)。この後に「ここではものをと
ぐ。」と入力した場合、「ここでは」が学習されている
のではなく「ここでは/着物を」が学習されているの
で、「ここでは/物を/研ぐ。」と変換されることはな
く、「ここで/刃物を/研ぐ。」と正しく変換される。
【0028】以上説明した本実施例の仮名漢字変換装置
によれば、文節区切り学習辞書12と単語辞書11とに
基づいて入力された文字列を文法解析して文節分かち書
きを行なうので、隣接する文節間の関係に基づいた文節
分かち書きをすることができる。また、文節区切り学習
辞書12と単語辞書11とを別体としたので、文節分か
ち書きの学習に伴って単語辞書11の記憶量が増加する
ことがなく、単語辞書11における仮名漢字変換の効率
を高く維持することができる。さらに、文節長変更部4
によって文節長が変更された文節とその次の文節とを連
接させた2つ文節を文節区切り学習辞書12に記憶する
ので、学習効果による適正な文節分かち書きが可能とな
り、より適正な仮名漢字変換をすることができる。もと
より、単語辞書11も確定された文節に基づいて同音異
義語の優先順位を変更する学習機能を備えるので、より
適正な仮名漢字変換が可能である。
【0029】以上本発明の実施例について説明したが、
本発明はこうした実施例に何等限定されるものではな
く、本発明の要旨を逸脱しない範囲内において、種々な
る態様で実施し得ることは勿論である。
【0030】
【発明の効果】以上説明した本発明の仮名漢字変換装置
によれば、入力された文字列を単語辞書を参照してなさ
れる文節分かち書き処理と異なるタイミングで文節情報
記憶手段に記憶された文節情報に基づいて文節分かち書
き処理が行なわれるので、隣接する文節間の関係に基づ
いて、より適切に仮名漢字変換を行なうことができる。
また、文節情報記憶手段を単語辞書と別体としたので、
文節情報記憶手段に記憶される文節情報量の多少によっ
て単語辞書を参照してなされる仮名漢字変換に影響を与
えることがない。したがって、変換効率を高く維持する
ことができる。
【図面の簡単な説明】
【図1】本発明の一実施例としての仮名漢字変換装置の
ハードウエア構成の概略を例示するブロック図である。
【図2】実施例の仮名漢字変換装置の機能を例示するブ
ロック図である。
【図3】実施例の仮名漢字変換装置における文節分かち
書き処理を例示するフローチャートである。
【図4】実施例の仮名漢字変換装置における文節学習の
処理を例示するフローチャートである。
【符号の説明】
1…CPU 22…ROM 23…RAM 24…キーボード 25…キーボードインタフェース 26…CRT 27…CRTC 28…プリンタ 29…プリンタインタフェース 30…拡張用スロット 31…バス
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成6年7月11日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】請求項1
【補正方法】変更
【補正内容】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正内容】
【0008】
【課題を解決するための手段】本発明の仮名漢字変換装
置は、文字列を文節分かち書き処理するのに必要な文法
情報と仮名みだしと該仮名みだしに対応する複数の漢字
候補とを記憶する単語辞書と、該単語辞書を参照して文
字列を文節分かち書き処理する文節分かち書き処理手段
と、該文節分かち書き処理された文字列を前記単語辞書
を参照して文節単位に仮名漢字変換する変換手段とを備
え、入力された仮名の文字列を仮名漢字変換する仮名漢
字変換装置であって、文節分かち書き処理において文節
長が変更されて確定されたとき、該文節と該文節の次の
文節とを連接してなる2文節を文節情報として記憶する
文節情報記憶手段と、前記入力された文字列を、前記文
節分かち書き処理手段による文節分かち書き処理と異な
るタイミングで、前記文節情報記憶手段に記憶された文
節情報に基づいて文節分かち書き処理を行なう文節処理
手段とを設けてなることを要旨とする。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0009
【補正方法】変更
【補正内容】
【0009】
【作用】以上のように構成された本発明の仮名漢字変換
装置は、文節分かち書き処理手段が、入力された仮名の
文字列を文節分かち書き処理するのに必要な文法情報と
仮名みだしと該仮名みだしに対応する複数の漢字候補と
を記憶する単語辞書を参照して文字列を文節分かち書き
処理し、変換手段が、この文節分かち書き処理された文
字列を前記単語辞書を参照して文節単位に仮名漢字変換
する。文節情報記憶手段は、文節分かち書き処理におい
て文節長が変更されて確定されたとき、該文節と該文節
の次の文節とを連接してなる2文節を文節情報として記
憶する。文節処理手段は、入力された文字列を、文節分
かち書き処理手段による文節分かち書き処理と異なるタ
イミングで、文節情報記憶手段に記憶された文節情報に
基づいて文節分かち書き処理を行なう。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0022
【補正方法】変更
【補正内容】
【0022】そして、〈204〉により分かち書きされ
た文節内に学習辞書文節が存在した場合は、〈205〉
により、これらの文節を区切りマークに従い2文節に分
解すると共に、1文節単位に単語辞書11を検索して各
文節の同音異語候補を作成する。全文節候補が出揃う
と、〈206〉により文節区切りを確定し、〈207〉
により分かち書き表示する。このように、本実施例で
は、文節分かち書きの処理を<203>と<205>と
で、異なるタイミングで2度行なっている。前者は、単
語辞書を参照する通常の文節分かち書きの処理であり、
後者は文節学習に伴いなされる分かち書きの処理であ
る。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0030
【補正方法】変更
【補正内容】
【0030】
【発明の効果】以上説明した本発明の仮名漢字変換装置
によれば、入力された文字列に対して単語辞書を参照し
てなされる文節分かち書き処理と異なるタイミングで、
節情報記憶手段に記憶された文節情報に基づく文節分
かち書き処理が行なわれるので、隣接する文節間の関係
に基づいて、より適切に仮名漢字変換を行なうことがで
き、変換効率を高く維持することができる

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文字列を文節分かち書き処理するのに必
    要な文法情報と仮名みだしと該仮名みだしに対応する複
    数の漢字候補とを記憶する単語辞書と、該単語辞書を参
    照して文字列を文節分かち書き処理する文節分かち書き
    処理手段と、該文節分かち書き処理された文字列を前記
    単語辞書を参照して文節単位に仮名漢字変換する変換手
    段とを備え、入力された仮名の文字列を仮名漢字変換す
    る仮名漢字変換装置であって、 文節分かち書き処理において文節長が変更されて確定さ
    れたとき、該文節と該文節の次の文節とを連接してなる
    2文節を文節情報として記憶する文節情報記憶手段を、
    前記単語辞書と別体に設け、 前記入力された文字列を、前記文節分かち書き処理手段
    による文節分かち書き処理と異なるタイミングで、前記
    文節情報記憶手段に記憶された文節情報に基づいて文節
    分かち書き処理を行なう文節処理手段を設けてなる仮名
    漢字変換装置。
JP6152766A 1994-06-10 1994-06-10 仮名漢字変換装置 Pending JPH07146859A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6152766A JPH07146859A (ja) 1994-06-10 1994-06-10 仮名漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6152766A JPH07146859A (ja) 1994-06-10 1994-06-10 仮名漢字変換装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP62144862A Division JPS63308665A (ja) 1987-06-10 1987-06-10 仮名漢字変換装置

Publications (1)

Publication Number Publication Date
JPH07146859A true JPH07146859A (ja) 1995-06-06

Family

ID=15547688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6152766A Pending JPH07146859A (ja) 1994-06-10 1994-06-10 仮名漢字変換装置

Country Status (1)

Country Link
JP (1) JPH07146859A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS567173A (en) * 1979-06-29 1981-01-24 Sharp Corp Sentence processor
JPS5819933A (ja) * 1981-07-29 1983-02-05 Toshiba Corp かな漢字変換装置
JPS60235271A (ja) * 1984-05-08 1985-11-21 Toshiba Corp かな漢字変換装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS567173A (en) * 1979-06-29 1981-01-24 Sharp Corp Sentence processor
JPS5819933A (ja) * 1981-07-29 1983-02-05 Toshiba Corp かな漢字変換装置
JPS60235271A (ja) * 1984-05-08 1985-11-21 Toshiba Corp かな漢字変換装置

Similar Documents

Publication Publication Date Title
JPH0250478B2 (ja)
JPH07146859A (ja) 仮名漢字変換装置
JPH0412866B2 (ja)
JP3329476B2 (ja) かな漢字変換装置
JP3847801B2 (ja) 文字処理装置及びその処理方法
JP2819612B2 (ja) 文字変換装置
JPS59100941A (ja) 仮名漢字変換装置
JP2786260B2 (ja) かな漢字変換装置
JPS63308665A (ja) 仮名漢字変換装置
JPH0721189A (ja) 翻訳支援装置
JPH1049528A (ja) 自動ルビ設定方法およびシステム
JPH08339365A (ja) 文書作成装置及び文書作成方法
JPH0981555A (ja) 文書処理装置及びその方法
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JPH07182344A (ja) 機械翻訳装置
JPH10187705A (ja) 文書処理方法及びその装置
JPH10187700A (ja) 文書処理装置
JPH10187706A (ja) 文書処理方法及びその装置
JPH10177573A (ja) 文書処理方法および装置
JPS6364162A (ja) 文書処理装置
JPH086950A (ja) キーワード翻訳機能付き機械翻訳装置
JPH07249035A (ja) 仮名漢字変換装置及び方法
JPH086951A (ja) 電子辞書引き装置
JPH09282316A (ja) 漢字仮名変換装置
JPH1049534A (ja) 機械翻訳支援装置及び方法