JPH04264960A - 日本語入力方法およびその装置 - Google Patents
日本語入力方法およびその装置Info
- Publication number
- JPH04264960A JPH04264960A JP3026119A JP2611991A JPH04264960A JP H04264960 A JPH04264960 A JP H04264960A JP 3026119 A JP3026119 A JP 3026119A JP 2611991 A JP2611991 A JP 2611991A JP H04264960 A JPH04264960 A JP H04264960A
- Authority
- JP
- Japan
- Prior art keywords
- learning dictionary
- unit
- section
- word
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はワード・プロセッサ等に
有用な日本語入力方法およびその装置に関する。 【0
002】 【従来の技術】近年、日本語の読み列を入力し、漢字か
な交じり文に変換する日本語入力装置が広く利用されて
いる。日本語の特徴として、一つの読みに対して複数の
表記が存在する点が挙げられる。日本語入力装置では入
力した読みに対する複数の同音語の中から、望む一つの
単語を選択する、同音語選択が問題となる。効率の良い
選択を行うために、同音語は使用頻度の高い順、または
使用履歴の新しい順に出力するなどの工夫がなされてい
る。このため、日本語入力装置は使用された単語の読み
と表記を自動的に登録する同音語学習機能をもつ。従来
例として、例えば特願昭60―275327号が挙げら
れる。 【0003】第4図は従来の日本語入力装置の構成図で
ある。図中、401は入力部で、日本語の読み列を入力
する。402は基本辞書部で、単語の読みと表記があら
かじめ登録されている。403は学習辞書部で、同音語
の使用順序情報と使用頻度情報を持つ。404はかな漢
字変換部で、前記入力部401で入力された日本語の読
み列に対し、前記学習辞書部403と前記基本辞書部4
02を順に検索し、漢字かな交じり文に変換する。同音
語が存在する場合、学習辞書部403が持つ使用順序情
報と使用頻度情報を用いて優先順位を決定する。405
は出力部で、前記かな漢字変換部404で変換された漢
字かな交じり文を出力する。406は同音語選択部で、
前記出力部405で出力した文内の単語に対し、複数の
同音語候補から一つを選択する。408は学習辞書登録
部で、前記同音語選択部405で選択された単語が第一
候補でない場合、前記学習辞書部403内に使用順序情
報と使用頻度情報を登録する。409は学習辞書更新部
で、前記同音語選択部406により選択された単語が第
一候補でありかつ、前記学習辞書部403から得られた
ものである場合、前記学習辞書部403内の該当する使
用順序情報を更新する。 【0004】前述のように構成された従来の日本語入力
装置の動作を図6の流れ図を用いて以下に説明する。 [501] オペレータは入力部401に対して、漢字
読み列を入力する。 [502] かな漢字変換部404は入力部401で入
力された漢字読み列に対して、学習辞書部403と基本
辞書部402とを用いて漢字かな交じり文に変換する。 同音語が存在する場合、学習辞書部403が持つ使用順
序情報と使用頻度情報を用いて優先順位を決定する。 [503] 表示部405はかな漢字変換部404で変
換された漢字かな交じり文を表示する。 [504] 同音語選択部406で、出力部405で出
力された文中の単語に対し、オペレータの望む単語であ
る場合、出力された単語を選択し、また、オペレータの
望む単語でない場合、同音語の優先順位に従って表示さ
れる候補の中から望む一つの単語を選択する。 [505―1] 学習辞書登録部408は、まず、選ば
れた単語が第一候補であるかをチェックする。もし、第
一候補である場合、[506―1]に進む。もし、第一
候補でない場合、[505―2]に進む。 [505―2] 学習辞書登録部408は、学習辞書部
403に使用順序情報と使用頻度情報を登録する。 [506―1] 学習辞書更新部409は、まず、選ば
れた単語が第一候補であるかをチェックする。もし、第
一候補である場合、[506―2]に進む。もし、第一
候補でない場合、処理を終了する。 [506―2] 学習辞書更新部409は、次に、選ば
れた単語が学習辞書部403から得られた単語であるか
をチェックする。もし、学習辞書部403から得られた
単語である場合、[506―3]に進む。もし、学習辞
書部403から得られた単語でない場合、処理を終了す
る。 [506―3] 学習辞書更新部409は、学習辞書部
403内の該当する使用順序情報を更新する。処理を終
了する。 【0005】(おわり) 以上のように動作する従来のかな漢字変換装置における
具体的な動作を次に説明する。図7、図8は従来例の日
本語入力装置により、同音語を学習する過程の一例を示
す摸式図である。例に用いる学習辞書部401は先入れ
先出し機能を持ち、頻度情報は学習辞書部に登録された
単語の個数で実現され順序情報は学習辞書部内の記録さ
れた位置関係で実現されているとする。また、同音語の
使用順序情報の更新は、学習辞書部内の該当する単語の
中で最も古いものをまず削除し、新たに単語を登録する
ことにより行われるものとする。また、学習辞書部の容
量が一杯で新たに記録できない場合、最も古い情報を削
除して記録する機能を持つとする。かな漢字変換部の同
音語の優先順位決定は、学習辞書部の使用順序情報と使
用頻度情報を用いて行う。使用頻度の高い単語を優先し
、もし、同じ頻度である場合は使用順序の新しい単語を
優先するものとする。例文として、 『汽車が走る』 『記者が走る』 を用いる。 【0006】ここで、基本辞書部402には、[きしゃ
/汽車][きしゃ/記者][はしる/奔る][はしる/
走る] が登録されている。 【0007】学習辞書部403には、初期状態では何も
単語が登録されていないとする。図7は基本辞書部、学
習辞書部の単語の記録の状態を表したものである。まず
第1回目の変換として、オペレータが文 ”記者が走る
”と変換したいとする。 [1] オペレータは入力部401に読み列”きしゃが
はしる”を入力する。 [2] かな漢字変換部402は入力文を解析し、学習
辞書部403と基本辞書部402を検索して学習辞書部
: *情報なし* 基本辞書部:[きしゃ | 汽車]、[きしゃ | 記
者]、[はしる | 奔る]、[はしる | 走る]
の情報を得る。 【0008】読み:きしゃ の第一候補は、表記:汽車
であり、第二候補は表記:記者 である。 【0009】読み:はしる の第一候補は、表記:奔る
であり、第二候補は表記:走る である。 【0010】かな漢字交じり文 ”汽車が奔る”を作成
する。 [3] 出力部404は、変換文:”汽車が奔る”を表
示する。 [4] 表示された単語:汽車、奔る は望むものでは
なかったのでオペレータは同音語選択部405で、第二
候補の単語:記者、走る を選ぶ。 [5] 学習辞書登録部408は、単語:記者、走る
が第一候補以外の単語なので、学習辞書部403に[き
しゃ|記者]と[はしる|走る]を登録する。 [6] 学習辞書更新部409は、条件に合う単語が存
在しないので、何も更新を行わない。 (おわり) この結果、学習辞書部403は図8(b)の状態となる
。 次に、オペレータは”汽車が走る”と変換したいとする
。 [1] オペレータは入力部401に読み列”きしゃが
はしる”を入力する。 [2] かな漢字変換部402は入力文を解析し、学習
辞書部403と基本辞書部402を検索して学習辞書部
:[きしゃ | 記者]、[はしる | 走る] 基本
辞書部:[きしゃ | 汽車]、[きしゃ | 記者]
、[はしる | 奔る]、[はしる | 走る] の情
報を得る。 【0011】読み:きしゃ の第一候補は、表記:記者
であり、第二候補は表記:汽車 である。 【0012】読み:はしる の第一候補は、表記:走る
であり、第二候補は表記:奔る である。 【0013】かな漢字交じり文 ”記者が走る”を作成
する。 [3] 出力部404は、変換文:”記者が走る”を表
示する。 [4] 表示された単語:記者 は望むものではなかっ
たのでオペレータは同音語選択部405で、第二候補の
単語:汽車 を選ぶ。 [5] 学習辞書登録部408は、単語:汽車 が第一
候補以外なので[きしゃ|汽車]を学習辞書部403に
登録する。 [6] 学習辞書更新部409は、単語:走る が第一
候補であり、かつ、学習辞書部403から得られた単語
であるので学習辞書部403上にある[はしる|走る]
と同じ情報を削除し、新たに学習辞書部403に登録す
る。 【0014】(おわり) この操作により、学習辞書部403はまず図7(c2)
となり、削除された結果は(c2’)となる。 図8(d)は、文:『汽車が走る』『記者が走る』を
それぞれ10回変換した結果である。学習辞書部403
内の、[はしる|走る]は常に更新されており、学習辞
書部403内でも、新しい情報として存在する。第一候
補以外で選ばれている単語”汽車”と”記者”に対して
、学習辞書部403に[きしゃ|汽車][きしゃ|記者
]の情報が常にそれぞれ10回登録されている。このよ
うに、同音語の単語が変換され続けた場合学習辞書部に
は、同じ単語が制限無く記録されてしまう 【0015】。 【発明が解決しようとする課題】従来の同音語学習方法
及び装置においては、第一候補以外で選ばれた単語すべ
てを登録しているため、比較的早期に学習辞書部が一杯
になってしまう。同音語が用いられる場合、学習辞書部
には同じ単語の記録が使用回数記録されてしまい、以前
に学習した情報が短期間で消去され、変換率が低下する
問題点があった。 【0016】本発明は、従来の学習方法及び装置が有し
ていた前述の問題点に鑑み、限られた容量の学習辞書部
を有効に利用する日本語入力方法およびその装置を提供
することを目的とするものである。 【0017】 【課題を解決するための手段】本発明は前記の目的を達
成するために、日本語の読み列を入力する入力部と、単
語の読みと表記を持つ基本辞書部と、同音語の使用順序
情報と使用頻度情報を持つ学習辞書部と、前記入力部で
得られた日本語の読み列から学習辞書部と基本辞書部を
検索し、漢字かな交じり文に変換するかな漢字変換部と
、前記かな漢字変換部で変換された漢字かな交じり文を
出力する出力部と、複数の同音語候補から、一つを選択
する同音語選択部と、前記同音語選択部で選択された単
語に該当する学習辞書部内の使用頻度情報が、あらかじ
め決められた限度数以下であるかを判定する学習辞書判
定部と、前記同音語選択部で選択された単語が第一候補
以外でありかつ、前記学習辞書判定部で使用頻度情報が
限度数以下であると判定されたときに、前記学習辞書部
に使用順序情報と使用頻度情報を登録する学習辞書登録
部と、前記同音語選択部で選択された単語が第一候補で
ありかつ、前記学習辞書部から得られたときか、または
、第一候補以外でありかつ、前記学習辞書判定部で使用
頻度情報が限度数に達していると判定されたときに、前
記学習辞書部内の使用順序情報を更新する学習辞書更新
部とを備えたことを特徴とする日本語入力装置を構成す
る。 【0018】 【作用】本発明の日本語入力装置は前記した構成により
、入力部で入力された日本語読み列に対して、かな漢字
変換部で学習辞書部と基本辞書部を検索して漢字かな交
じり文を作成し、出力部で漢字かな交じり文を出力し、
同音語選択部で、望む単語が選ばれた後、学習辞書判定
部で前記同音語選択部で選ばれた単語に該当する前記学
習辞書部内の使用頻度情報が、あらかじめ決められた限
度数以下であるかを判定し、学習辞書登録部で、前記同
音語選択部で選択された単語が第一候補以外でありかつ
、前記学習辞書判定部で使用頻度情報が限度数以下であ
ると判定されたときに、前記学習辞書部に使用順序情報
と使用頻度情報を登録し、学習辞書更新部で、前記同音
語選択部で選択された単語が第一候補でありかつ、前記
学習辞書部から得られたときか、または、第一候補以外
でありかつ、前記学習辞書判定部で使用頻度情報が限度
数に達していると判定されたときに、前記学習辞書部内
の該当する使用順序情報を更新することで、学習辞書部
内の重複する記録の低減を可能とするものである。 【0019】 【実施例】以下、本発明の日本語入力装置の一実施例を
図面を用いて説明する。図1は本発明の一実施例におけ
る日本語入力装置の構成図である。図中、101は入力
部で、日本語の読み列を入力する。102は基本辞書部
で単語の読みと表記があらかじめ登録されている。10
3は先入れ先出し機能を有する学習辞書部で、同音語の
使用順序情報と使用頻度情報を持つ。104はかな漢字
変換部で、入力された読み列を解析して得られた読みを
もとに、前記学習辞書部103と前記基本辞書部102
を検索して、漢字かな交じり文に変換する。同音語が存
在する場合、学習辞書部103が持つ使用順序情報と使
用頻度情報を用いて各単語の優先順位を決定する。10
5は出力部で、前記かな漢字変換部104で得られた変
換結果を出力する。106は同音語選択部で、前記出力
部105で出力した文中の単語に対し、望む単語である
場合、出力した単語を選択し、また、望む単語でない場
合、同音語の優先順位に従って、表示される候補の中か
ら、一つの単語を選択する。107は学習辞書判定部で
、前記同音語選択部106で選ばれた単語に該当する前
記学習辞書部103内の使用頻度情報があらかじめ決め
られた限度数以下であるかを判定する。108は学習辞
書登録部で、前記同音語選択部106で選択された単語
の中で、第一候補以外で、かつ、前記学習辞書判定部1
07で限度数以下であると判定された単語に対し、前記
学習辞書部103に使用順序情報と使用頻度情報を登録
する。109は学習辞書更新部で、前記同音語選択部1
06で選択された単語の中で、第一候補でありかつ、前
記学習辞書部103から得られた単語に対し、前記学習
辞書部103内の該当する使用順序情報を更新し、また
、前記同音語選択部106で選択された単語の中で、第
一候補以外でありかつ、前記学習辞書判定部107で限
度数に達していると判定された単語に対し、前記学習辞
書部103内の該当する使用順序情報を更新する。前述
のように構成された日本語入力装置の動作を図2の流れ
図を用いて以下に説明する。 [201] オペレータは入力部101に対して、日本
語読み列を入力する。 [202] かな漢字変換部104は入力部101で入
力された読み列に対して、基本辞書部102と学習辞書
部103を用いて漢字かな交じり文に変換する。単語の
検索は学習辞書部103、基本辞書部102の 順で行
い、学習辞書部103の検索は登録した順序と逆の順序
で行う。同音語がある場合、学習辞書部103が持つ使
用順序情報と使用頻度情報を用いて各単語の優先順位を
決定する。 [203] 出力部105は前記かな漢字変換部104
で得られた変換結果を出力する。 [204] 同音語選択部106で、前記出力部105
で出力された文中の単語に対し、オペレータの望む単語
である場合、出力された単語を選択し、また、オペレー
タの望む単語でない場合、同音語の優先順位に従って、
表示される候補の中から、望む一つの単語を選択する。 [205] 学習辞書判定部107で、前記同音語選択
部106で選ばれた単語に該当する学習辞書部103内
の使用頻度情報があらかじめ決められた限度数以下であ
るかを判定する。 [206―1] 選ばれた各単語に対し、第一候補であ
るかをチェックする。もし、第一候補である場合、[2
07―1]に進む。もし、第一候補以外である場合、[
206―2]に進む。 [206―2] 前記学習辞書判定部107で、限度数
以下であると判断されたかをチェックする。 【0020】もし、限度数であると判断された場合、[
207―1]に進む。もし、限度数以下であると判断さ
れた場合、[206―3]に進む。 [206―3] 学習辞書部103に使用順序情報と使
用頻度情報を登録して、[207―1]に進む。 [207―1] 選ばれた各単語に対し、第一候補であ
るかをチェックする。 【0021】もし、第一候補である場合、[207―2
]に進む。もし、第一候補以外である場合、[207―
3]に進む。 [207―2] 学習辞書部103から得られた単語で
あるかをチェックする。 【0022】もし、学習辞書部103から得られた単語
である場合、[207―4]に進む。もし、学習辞書部
103から得られた単語でない場合、処理を終了する。 [207―3] 前記学習辞書判定部107で、限度数
であると判断されたかをチェックする。 【0023】もし、限度数であると判断された場合、[
207―4]に進む。もし、限度数以下であると判断さ
れた場合、処理を終了する。 [207―4] 学習辞書部103内の該当する使用順
序情報を更新して、処理を終了する。 (流れ図 おわり) 以上のように動作する本実施例の日本語入力装置におけ
る具体的な動作を次に説明する。図3、図4は本実施例
の日本語入力装置により、同音語を学習する過程の一例
を示す摸式図である。例に用いる学習辞書部は先入れ先
出し機能を持ち、頻度情報は学習辞書部に登録された単
語の個数で実現され同音語の使用順序情報は学習辞書部
に連続的に記録される単語の記録位置で実現されている
とする。また、使用順情報の更新は、学習辞書部内の該
当する単語の中で最も古いものをまず削除し、新たに登
録することにより行われるものとする。また、学習辞書
部の容量が一杯で新たに記録できない場合、最も古い情
報を削除して記録する機能を持つとする。かな漢字変換
部の同音語の優先順位決定は、学習辞書部の使用順序情
報と使用頻度情報を用いて行う。使用頻度の高い単語を
優先し、もし、同じ頻度である場合は使用順序の新しい
単語を優先するものとする。例文として、『汽車が走る
』 『記者が走る』 を用いる。 【0024】ここで、基本辞書部には、[きしゃ/記者
][きしゃ/汽車][はしる/走る][はしる/奔る] が登録されている。 【0025】学習辞書部は、初期状態では何も記録され
ていない。基本辞書部102、学習辞書部103は、図
3(a)の状態である。学習辞書部内の、同じ単語の限
度数は一例として5であるとする。まず第1回目の変換
として、オペレータが文 ”記者が走る”と変換したい
とする。 [1] オペレータは入力部101に読み列”きしゃが
はしる”を入力する。 [2] かな漢字変換部102は入力文を解析し、基本
辞書部102と学習辞書部103を検索して学習辞書部
: *記録なし* 基本辞書部:[きしゃ | 汽車]、[きしゃ | 記
者]、[はしる | 奔る]、[はしる | 走る]
の情報を得る。 【0026】読み:きしゃ の第一候補は、表記:汽車
であり、第二候補は表記:記者 である。 【0027】読み:はしる の第一候補は、表記:奔る
である、第二候補は表記:走る である。 【0028】かな漢字交じり文 ”汽車が奔る”を作成
する。 [3] 出力部104は、変換文:汽車が奔る”を表示
する。 [4] 表示された単語:汽車、奔る は望むものでは
なかったのでオペレータは同音語選択部105で、第二
候補の単語:記者、走る を選ぶ。 [5] 学習辞書判定部106は各単語に対し、学習辞
書部103の使用頻度情報は限度数5以下存在すると判
定する。 [6] 学習辞書登録部107は、単語:記者、走る
が限度数以下であり、かつ、第一候補以外で選ばれた単
語なので、学習辞書部103に[きしゃ | 記者]、
[はしる | 走る]登録する。 [7] 学習辞書更新部108は、条件を満たし更新対
象となる単語がないので、なにも処理しない。 (おわり) この操作により、学習辞書部103は図3(b)となる
。 第2回目の変換として、オペレータが文 ”記者が走る
”と変換したいとする。 [1] オペレータは入力部101に読み列”きしゃが
はしる”を入力する。 [2] かな漢字変換部102は入力文を解析し、基本
辞書部102と学習辞書部103を検索して学習辞書部
:[はしる | 走る]、[きしゃ | 記者]基本辞
書部:[きしゃ | 汽車]、[きしゃ | 記者]、
[はしる | 奔る]、[はしる | 走る] の情報
を得る。 【0029】読み:きしゃ の第一候補は、表記:記者
であり、第二候補は表記:汽車 である。 【0030】読み:はしる の第一候補は、表記:走る
であり、第二候補は表記:奔る である。 【0031】かな漢字交じり文 ”記者が走る”を作成
する。 [3] 出力部104は、変換文:記者が走る”を表示
する。 [4] 表示された単語:記者は望むものではなかった
のでオペレータは同音語選択部105で、第二候補の単
語:汽車を選ぶ。 [5] 学習辞書判定部106は、学習辞書部103上
の該当する記録、[きしゃ|汽車]、[はしる|走る]
に対し、どちらも使用頻度情報は限度数5以下であると
判定する。 [6] 学習辞書登録部107は、単語:記者 が限度
数以下であり、かつ、第一候補以外で選ばれた単語なの
で、[きしゃ|記者]を学習辞書部103に登録する。 [7] 学習辞書更新部108は、単語:走る が第一
候補でありかつ、学習辞書部から得られた情報であるの
で、[はしる|走る]と同じ情報のうち最も古いものを
削除し、新たに[はしる|走る]を学習辞書部103に
登録する。 (おわり) この操作により、学習辞書部103はまず図3(c2)
となり、削除された結果(c2’)となる。 次に第6回目の変換として、オペレータが文 ”記者が
走る”と変換したいとする。図4(d)は、文:『汽車
が走る』『記者が走る』をそれぞれ5回変換した学習辞
書部の内容である。学習辞書部103内の[はしる|走
る]は常に更新されており、学習辞書部103内でも、
新しい登録として存在する。[きしゃ|汽車][きしゃ
|記者]の登録はまだ、制限値まで達していないので、
それぞれ5回登録されている。 [1] オペレータは入力部101に読み列”きしゃが
はしる”を入力する。 [2] かな漢字変換部102は入力文を解析し、基本
辞書部102と学習辞書部103検索して学習辞書部:
[はしる | 走る]、[きしゃ | 汽車]、...
. 、[きしゃ | 汽車]、[きしゃ| 記者]基本
辞書部:[きしゃ | 記者]、[きしゃ | 汽車]
、[はしる | 奔る]、[はしる | 走る]の情報
を得る。 【0032】読み:きしゃ の第一候補は、表記:汽車
であり、第二候補は表記:記者 である。 【0033】読み:はしる の第一候補は、表記:走る
であり、第二候補は表記:奔る である。 【0034】かな漢字交じり文 ”記者が走る”を作成
する。 [3] 出力部104は、変換文:記者が走る”を表示
する。 [4] 表示された表記:記者は望むものではなかった
のでオペレータは同音語選択部105で、第二候補の単
語:汽車 を選ぶ。 [5] 学習辞書判定部106は、学習辞書部103上
の該当する記録、[きしゃ|汽車] に対して、使用頻
度情報が限度数の5に達していると判定する。次に、[
はしる|走る]に対して、使用頻度情報は限度数の5以
下であると判定する。 [6] 学習辞書登録部107は、登録すべき条件に合
う単語がないので、なにも処理しない。 [7] 学習辞書更新部108は、単語:汽車 が、第
一候補以外であり、かつ、判定部で限度数に達している
と判定したので、学習辞書部103上にある、最も古い
[きしゃ|汽車]を削除し、新たに[きしゃ|汽車]を
登録する。また、単語:走る が、第一候補でかつ、学
習辞書部103から得られた単語であるので、学習辞書
部103上にある最も古い[はしる|走る]の情報を削
除し、新たに学習辞書部103に[はしる|走る]登録
する。 (おわり) この操作により、学習辞書部103はまず図4(e2)
となり、削除された結果 (e2’) となる。 図4(f)は、文:『汽車が走る』『記者が走る』をそ
れぞれ10回変換した結果である。学習辞書部103中
、[はしる|走る]は常に更新されており、新しく記録
された単語として存在する。第二候補で選ばれている単
語 ”汽車”と”記者”に対して、学習辞書部103に
記録される[きしゃ|汽車]、[きしゃ|記者]の各個
数が上限数5に達した後は、登録されず、更新のみが行
われている。 【0035】上述のように本実施例の日本語入力装置に
よれば、学習辞書部上に重複して記録される単語の限度
数を定め、限度数を越える場合は、登録を行わずに記録
の更新のみを行うことにより、第一候補以外で選ばれ続
ける単語が学習辞書部に無制限に登録されるのを防ぎ、
学習辞書部が早期に一杯になることを防ぐことが可能と
なる。 【0036】なお、実施例では限度数として5を設定し
たが、学習辞書部のサイズに応じて変更することが可能
である。また、学習辞書登録部、学習辞書更新部の順に
処理の流れを説明したが、これらの処理の順序はどちら
が先でも同じ結果が得られる。また、同音語の優先順位
の決定は使用頻度情報を優先して行ったが、この他にも
、使用順序情報を優先する方法、使用順序情報と使用頻
度情報を共に用いる方法がある。 【0037】 【発明の効果】上述のように本実施例の日本語入力装置
において、学習辞書部に重複して登録される個数に限度
数を設定し、限度数に達した場合登録を行わず更新のみ
を行うことにより、比較的早期に学習辞書部が一杯にな
ることを防ぎ、限られた容量の学習辞書部を有効に利用
できる。よって、従来と比較して記憶した単語がより長
期にわたり学習辞書部に保存されるため、一度到達した
高い変換率を長期にわたり維持することが可能となり、
その実用的効果は大きい。
有用な日本語入力方法およびその装置に関する。 【0
002】 【従来の技術】近年、日本語の読み列を入力し、漢字か
な交じり文に変換する日本語入力装置が広く利用されて
いる。日本語の特徴として、一つの読みに対して複数の
表記が存在する点が挙げられる。日本語入力装置では入
力した読みに対する複数の同音語の中から、望む一つの
単語を選択する、同音語選択が問題となる。効率の良い
選択を行うために、同音語は使用頻度の高い順、または
使用履歴の新しい順に出力するなどの工夫がなされてい
る。このため、日本語入力装置は使用された単語の読み
と表記を自動的に登録する同音語学習機能をもつ。従来
例として、例えば特願昭60―275327号が挙げら
れる。 【0003】第4図は従来の日本語入力装置の構成図で
ある。図中、401は入力部で、日本語の読み列を入力
する。402は基本辞書部で、単語の読みと表記があら
かじめ登録されている。403は学習辞書部で、同音語
の使用順序情報と使用頻度情報を持つ。404はかな漢
字変換部で、前記入力部401で入力された日本語の読
み列に対し、前記学習辞書部403と前記基本辞書部4
02を順に検索し、漢字かな交じり文に変換する。同音
語が存在する場合、学習辞書部403が持つ使用順序情
報と使用頻度情報を用いて優先順位を決定する。405
は出力部で、前記かな漢字変換部404で変換された漢
字かな交じり文を出力する。406は同音語選択部で、
前記出力部405で出力した文内の単語に対し、複数の
同音語候補から一つを選択する。408は学習辞書登録
部で、前記同音語選択部405で選択された単語が第一
候補でない場合、前記学習辞書部403内に使用順序情
報と使用頻度情報を登録する。409は学習辞書更新部
で、前記同音語選択部406により選択された単語が第
一候補でありかつ、前記学習辞書部403から得られた
ものである場合、前記学習辞書部403内の該当する使
用順序情報を更新する。 【0004】前述のように構成された従来の日本語入力
装置の動作を図6の流れ図を用いて以下に説明する。 [501] オペレータは入力部401に対して、漢字
読み列を入力する。 [502] かな漢字変換部404は入力部401で入
力された漢字読み列に対して、学習辞書部403と基本
辞書部402とを用いて漢字かな交じり文に変換する。 同音語が存在する場合、学習辞書部403が持つ使用順
序情報と使用頻度情報を用いて優先順位を決定する。 [503] 表示部405はかな漢字変換部404で変
換された漢字かな交じり文を表示する。 [504] 同音語選択部406で、出力部405で出
力された文中の単語に対し、オペレータの望む単語であ
る場合、出力された単語を選択し、また、オペレータの
望む単語でない場合、同音語の優先順位に従って表示さ
れる候補の中から望む一つの単語を選択する。 [505―1] 学習辞書登録部408は、まず、選ば
れた単語が第一候補であるかをチェックする。もし、第
一候補である場合、[506―1]に進む。もし、第一
候補でない場合、[505―2]に進む。 [505―2] 学習辞書登録部408は、学習辞書部
403に使用順序情報と使用頻度情報を登録する。 [506―1] 学習辞書更新部409は、まず、選ば
れた単語が第一候補であるかをチェックする。もし、第
一候補である場合、[506―2]に進む。もし、第一
候補でない場合、処理を終了する。 [506―2] 学習辞書更新部409は、次に、選ば
れた単語が学習辞書部403から得られた単語であるか
をチェックする。もし、学習辞書部403から得られた
単語である場合、[506―3]に進む。もし、学習辞
書部403から得られた単語でない場合、処理を終了す
る。 [506―3] 学習辞書更新部409は、学習辞書部
403内の該当する使用順序情報を更新する。処理を終
了する。 【0005】(おわり) 以上のように動作する従来のかな漢字変換装置における
具体的な動作を次に説明する。図7、図8は従来例の日
本語入力装置により、同音語を学習する過程の一例を示
す摸式図である。例に用いる学習辞書部401は先入れ
先出し機能を持ち、頻度情報は学習辞書部に登録された
単語の個数で実現され順序情報は学習辞書部内の記録さ
れた位置関係で実現されているとする。また、同音語の
使用順序情報の更新は、学習辞書部内の該当する単語の
中で最も古いものをまず削除し、新たに単語を登録する
ことにより行われるものとする。また、学習辞書部の容
量が一杯で新たに記録できない場合、最も古い情報を削
除して記録する機能を持つとする。かな漢字変換部の同
音語の優先順位決定は、学習辞書部の使用順序情報と使
用頻度情報を用いて行う。使用頻度の高い単語を優先し
、もし、同じ頻度である場合は使用順序の新しい単語を
優先するものとする。例文として、 『汽車が走る』 『記者が走る』 を用いる。 【0006】ここで、基本辞書部402には、[きしゃ
/汽車][きしゃ/記者][はしる/奔る][はしる/
走る] が登録されている。 【0007】学習辞書部403には、初期状態では何も
単語が登録されていないとする。図7は基本辞書部、学
習辞書部の単語の記録の状態を表したものである。まず
第1回目の変換として、オペレータが文 ”記者が走る
”と変換したいとする。 [1] オペレータは入力部401に読み列”きしゃが
はしる”を入力する。 [2] かな漢字変換部402は入力文を解析し、学習
辞書部403と基本辞書部402を検索して学習辞書部
: *情報なし* 基本辞書部:[きしゃ | 汽車]、[きしゃ | 記
者]、[はしる | 奔る]、[はしる | 走る]
の情報を得る。 【0008】読み:きしゃ の第一候補は、表記:汽車
であり、第二候補は表記:記者 である。 【0009】読み:はしる の第一候補は、表記:奔る
であり、第二候補は表記:走る である。 【0010】かな漢字交じり文 ”汽車が奔る”を作成
する。 [3] 出力部404は、変換文:”汽車が奔る”を表
示する。 [4] 表示された単語:汽車、奔る は望むものでは
なかったのでオペレータは同音語選択部405で、第二
候補の単語:記者、走る を選ぶ。 [5] 学習辞書登録部408は、単語:記者、走る
が第一候補以外の単語なので、学習辞書部403に[き
しゃ|記者]と[はしる|走る]を登録する。 [6] 学習辞書更新部409は、条件に合う単語が存
在しないので、何も更新を行わない。 (おわり) この結果、学習辞書部403は図8(b)の状態となる
。 次に、オペレータは”汽車が走る”と変換したいとする
。 [1] オペレータは入力部401に読み列”きしゃが
はしる”を入力する。 [2] かな漢字変換部402は入力文を解析し、学習
辞書部403と基本辞書部402を検索して学習辞書部
:[きしゃ | 記者]、[はしる | 走る] 基本
辞書部:[きしゃ | 汽車]、[きしゃ | 記者]
、[はしる | 奔る]、[はしる | 走る] の情
報を得る。 【0011】読み:きしゃ の第一候補は、表記:記者
であり、第二候補は表記:汽車 である。 【0012】読み:はしる の第一候補は、表記:走る
であり、第二候補は表記:奔る である。 【0013】かな漢字交じり文 ”記者が走る”を作成
する。 [3] 出力部404は、変換文:”記者が走る”を表
示する。 [4] 表示された単語:記者 は望むものではなかっ
たのでオペレータは同音語選択部405で、第二候補の
単語:汽車 を選ぶ。 [5] 学習辞書登録部408は、単語:汽車 が第一
候補以外なので[きしゃ|汽車]を学習辞書部403に
登録する。 [6] 学習辞書更新部409は、単語:走る が第一
候補であり、かつ、学習辞書部403から得られた単語
であるので学習辞書部403上にある[はしる|走る]
と同じ情報を削除し、新たに学習辞書部403に登録す
る。 【0014】(おわり) この操作により、学習辞書部403はまず図7(c2)
となり、削除された結果は(c2’)となる。 図8(d)は、文:『汽車が走る』『記者が走る』を
それぞれ10回変換した結果である。学習辞書部403
内の、[はしる|走る]は常に更新されており、学習辞
書部403内でも、新しい情報として存在する。第一候
補以外で選ばれている単語”汽車”と”記者”に対して
、学習辞書部403に[きしゃ|汽車][きしゃ|記者
]の情報が常にそれぞれ10回登録されている。このよ
うに、同音語の単語が変換され続けた場合学習辞書部に
は、同じ単語が制限無く記録されてしまう 【0015】。 【発明が解決しようとする課題】従来の同音語学習方法
及び装置においては、第一候補以外で選ばれた単語すべ
てを登録しているため、比較的早期に学習辞書部が一杯
になってしまう。同音語が用いられる場合、学習辞書部
には同じ単語の記録が使用回数記録されてしまい、以前
に学習した情報が短期間で消去され、変換率が低下する
問題点があった。 【0016】本発明は、従来の学習方法及び装置が有し
ていた前述の問題点に鑑み、限られた容量の学習辞書部
を有効に利用する日本語入力方法およびその装置を提供
することを目的とするものである。 【0017】 【課題を解決するための手段】本発明は前記の目的を達
成するために、日本語の読み列を入力する入力部と、単
語の読みと表記を持つ基本辞書部と、同音語の使用順序
情報と使用頻度情報を持つ学習辞書部と、前記入力部で
得られた日本語の読み列から学習辞書部と基本辞書部を
検索し、漢字かな交じり文に変換するかな漢字変換部と
、前記かな漢字変換部で変換された漢字かな交じり文を
出力する出力部と、複数の同音語候補から、一つを選択
する同音語選択部と、前記同音語選択部で選択された単
語に該当する学習辞書部内の使用頻度情報が、あらかじ
め決められた限度数以下であるかを判定する学習辞書判
定部と、前記同音語選択部で選択された単語が第一候補
以外でありかつ、前記学習辞書判定部で使用頻度情報が
限度数以下であると判定されたときに、前記学習辞書部
に使用順序情報と使用頻度情報を登録する学習辞書登録
部と、前記同音語選択部で選択された単語が第一候補で
ありかつ、前記学習辞書部から得られたときか、または
、第一候補以外でありかつ、前記学習辞書判定部で使用
頻度情報が限度数に達していると判定されたときに、前
記学習辞書部内の使用順序情報を更新する学習辞書更新
部とを備えたことを特徴とする日本語入力装置を構成す
る。 【0018】 【作用】本発明の日本語入力装置は前記した構成により
、入力部で入力された日本語読み列に対して、かな漢字
変換部で学習辞書部と基本辞書部を検索して漢字かな交
じり文を作成し、出力部で漢字かな交じり文を出力し、
同音語選択部で、望む単語が選ばれた後、学習辞書判定
部で前記同音語選択部で選ばれた単語に該当する前記学
習辞書部内の使用頻度情報が、あらかじめ決められた限
度数以下であるかを判定し、学習辞書登録部で、前記同
音語選択部で選択された単語が第一候補以外でありかつ
、前記学習辞書判定部で使用頻度情報が限度数以下であ
ると判定されたときに、前記学習辞書部に使用順序情報
と使用頻度情報を登録し、学習辞書更新部で、前記同音
語選択部で選択された単語が第一候補でありかつ、前記
学習辞書部から得られたときか、または、第一候補以外
でありかつ、前記学習辞書判定部で使用頻度情報が限度
数に達していると判定されたときに、前記学習辞書部内
の該当する使用順序情報を更新することで、学習辞書部
内の重複する記録の低減を可能とするものである。 【0019】 【実施例】以下、本発明の日本語入力装置の一実施例を
図面を用いて説明する。図1は本発明の一実施例におけ
る日本語入力装置の構成図である。図中、101は入力
部で、日本語の読み列を入力する。102は基本辞書部
で単語の読みと表記があらかじめ登録されている。10
3は先入れ先出し機能を有する学習辞書部で、同音語の
使用順序情報と使用頻度情報を持つ。104はかな漢字
変換部で、入力された読み列を解析して得られた読みを
もとに、前記学習辞書部103と前記基本辞書部102
を検索して、漢字かな交じり文に変換する。同音語が存
在する場合、学習辞書部103が持つ使用順序情報と使
用頻度情報を用いて各単語の優先順位を決定する。10
5は出力部で、前記かな漢字変換部104で得られた変
換結果を出力する。106は同音語選択部で、前記出力
部105で出力した文中の単語に対し、望む単語である
場合、出力した単語を選択し、また、望む単語でない場
合、同音語の優先順位に従って、表示される候補の中か
ら、一つの単語を選択する。107は学習辞書判定部で
、前記同音語選択部106で選ばれた単語に該当する前
記学習辞書部103内の使用頻度情報があらかじめ決め
られた限度数以下であるかを判定する。108は学習辞
書登録部で、前記同音語選択部106で選択された単語
の中で、第一候補以外で、かつ、前記学習辞書判定部1
07で限度数以下であると判定された単語に対し、前記
学習辞書部103に使用順序情報と使用頻度情報を登録
する。109は学習辞書更新部で、前記同音語選択部1
06で選択された単語の中で、第一候補でありかつ、前
記学習辞書部103から得られた単語に対し、前記学習
辞書部103内の該当する使用順序情報を更新し、また
、前記同音語選択部106で選択された単語の中で、第
一候補以外でありかつ、前記学習辞書判定部107で限
度数に達していると判定された単語に対し、前記学習辞
書部103内の該当する使用順序情報を更新する。前述
のように構成された日本語入力装置の動作を図2の流れ
図を用いて以下に説明する。 [201] オペレータは入力部101に対して、日本
語読み列を入力する。 [202] かな漢字変換部104は入力部101で入
力された読み列に対して、基本辞書部102と学習辞書
部103を用いて漢字かな交じり文に変換する。単語の
検索は学習辞書部103、基本辞書部102の 順で行
い、学習辞書部103の検索は登録した順序と逆の順序
で行う。同音語がある場合、学習辞書部103が持つ使
用順序情報と使用頻度情報を用いて各単語の優先順位を
決定する。 [203] 出力部105は前記かな漢字変換部104
で得られた変換結果を出力する。 [204] 同音語選択部106で、前記出力部105
で出力された文中の単語に対し、オペレータの望む単語
である場合、出力された単語を選択し、また、オペレー
タの望む単語でない場合、同音語の優先順位に従って、
表示される候補の中から、望む一つの単語を選択する。 [205] 学習辞書判定部107で、前記同音語選択
部106で選ばれた単語に該当する学習辞書部103内
の使用頻度情報があらかじめ決められた限度数以下であ
るかを判定する。 [206―1] 選ばれた各単語に対し、第一候補であ
るかをチェックする。もし、第一候補である場合、[2
07―1]に進む。もし、第一候補以外である場合、[
206―2]に進む。 [206―2] 前記学習辞書判定部107で、限度数
以下であると判断されたかをチェックする。 【0020】もし、限度数であると判断された場合、[
207―1]に進む。もし、限度数以下であると判断さ
れた場合、[206―3]に進む。 [206―3] 学習辞書部103に使用順序情報と使
用頻度情報を登録して、[207―1]に進む。 [207―1] 選ばれた各単語に対し、第一候補であ
るかをチェックする。 【0021】もし、第一候補である場合、[207―2
]に進む。もし、第一候補以外である場合、[207―
3]に進む。 [207―2] 学習辞書部103から得られた単語で
あるかをチェックする。 【0022】もし、学習辞書部103から得られた単語
である場合、[207―4]に進む。もし、学習辞書部
103から得られた単語でない場合、処理を終了する。 [207―3] 前記学習辞書判定部107で、限度数
であると判断されたかをチェックする。 【0023】もし、限度数であると判断された場合、[
207―4]に進む。もし、限度数以下であると判断さ
れた場合、処理を終了する。 [207―4] 学習辞書部103内の該当する使用順
序情報を更新して、処理を終了する。 (流れ図 おわり) 以上のように動作する本実施例の日本語入力装置におけ
る具体的な動作を次に説明する。図3、図4は本実施例
の日本語入力装置により、同音語を学習する過程の一例
を示す摸式図である。例に用いる学習辞書部は先入れ先
出し機能を持ち、頻度情報は学習辞書部に登録された単
語の個数で実現され同音語の使用順序情報は学習辞書部
に連続的に記録される単語の記録位置で実現されている
とする。また、使用順情報の更新は、学習辞書部内の該
当する単語の中で最も古いものをまず削除し、新たに登
録することにより行われるものとする。また、学習辞書
部の容量が一杯で新たに記録できない場合、最も古い情
報を削除して記録する機能を持つとする。かな漢字変換
部の同音語の優先順位決定は、学習辞書部の使用順序情
報と使用頻度情報を用いて行う。使用頻度の高い単語を
優先し、もし、同じ頻度である場合は使用順序の新しい
単語を優先するものとする。例文として、『汽車が走る
』 『記者が走る』 を用いる。 【0024】ここで、基本辞書部には、[きしゃ/記者
][きしゃ/汽車][はしる/走る][はしる/奔る] が登録されている。 【0025】学習辞書部は、初期状態では何も記録され
ていない。基本辞書部102、学習辞書部103は、図
3(a)の状態である。学習辞書部内の、同じ単語の限
度数は一例として5であるとする。まず第1回目の変換
として、オペレータが文 ”記者が走る”と変換したい
とする。 [1] オペレータは入力部101に読み列”きしゃが
はしる”を入力する。 [2] かな漢字変換部102は入力文を解析し、基本
辞書部102と学習辞書部103を検索して学習辞書部
: *記録なし* 基本辞書部:[きしゃ | 汽車]、[きしゃ | 記
者]、[はしる | 奔る]、[はしる | 走る]
の情報を得る。 【0026】読み:きしゃ の第一候補は、表記:汽車
であり、第二候補は表記:記者 である。 【0027】読み:はしる の第一候補は、表記:奔る
である、第二候補は表記:走る である。 【0028】かな漢字交じり文 ”汽車が奔る”を作成
する。 [3] 出力部104は、変換文:汽車が奔る”を表示
する。 [4] 表示された単語:汽車、奔る は望むものでは
なかったのでオペレータは同音語選択部105で、第二
候補の単語:記者、走る を選ぶ。 [5] 学習辞書判定部106は各単語に対し、学習辞
書部103の使用頻度情報は限度数5以下存在すると判
定する。 [6] 学習辞書登録部107は、単語:記者、走る
が限度数以下であり、かつ、第一候補以外で選ばれた単
語なので、学習辞書部103に[きしゃ | 記者]、
[はしる | 走る]登録する。 [7] 学習辞書更新部108は、条件を満たし更新対
象となる単語がないので、なにも処理しない。 (おわり) この操作により、学習辞書部103は図3(b)となる
。 第2回目の変換として、オペレータが文 ”記者が走る
”と変換したいとする。 [1] オペレータは入力部101に読み列”きしゃが
はしる”を入力する。 [2] かな漢字変換部102は入力文を解析し、基本
辞書部102と学習辞書部103を検索して学習辞書部
:[はしる | 走る]、[きしゃ | 記者]基本辞
書部:[きしゃ | 汽車]、[きしゃ | 記者]、
[はしる | 奔る]、[はしる | 走る] の情報
を得る。 【0029】読み:きしゃ の第一候補は、表記:記者
であり、第二候補は表記:汽車 である。 【0030】読み:はしる の第一候補は、表記:走る
であり、第二候補は表記:奔る である。 【0031】かな漢字交じり文 ”記者が走る”を作成
する。 [3] 出力部104は、変換文:記者が走る”を表示
する。 [4] 表示された単語:記者は望むものではなかった
のでオペレータは同音語選択部105で、第二候補の単
語:汽車を選ぶ。 [5] 学習辞書判定部106は、学習辞書部103上
の該当する記録、[きしゃ|汽車]、[はしる|走る]
に対し、どちらも使用頻度情報は限度数5以下であると
判定する。 [6] 学習辞書登録部107は、単語:記者 が限度
数以下であり、かつ、第一候補以外で選ばれた単語なの
で、[きしゃ|記者]を学習辞書部103に登録する。 [7] 学習辞書更新部108は、単語:走る が第一
候補でありかつ、学習辞書部から得られた情報であるの
で、[はしる|走る]と同じ情報のうち最も古いものを
削除し、新たに[はしる|走る]を学習辞書部103に
登録する。 (おわり) この操作により、学習辞書部103はまず図3(c2)
となり、削除された結果(c2’)となる。 次に第6回目の変換として、オペレータが文 ”記者が
走る”と変換したいとする。図4(d)は、文:『汽車
が走る』『記者が走る』をそれぞれ5回変換した学習辞
書部の内容である。学習辞書部103内の[はしる|走
る]は常に更新されており、学習辞書部103内でも、
新しい登録として存在する。[きしゃ|汽車][きしゃ
|記者]の登録はまだ、制限値まで達していないので、
それぞれ5回登録されている。 [1] オペレータは入力部101に読み列”きしゃが
はしる”を入力する。 [2] かな漢字変換部102は入力文を解析し、基本
辞書部102と学習辞書部103検索して学習辞書部:
[はしる | 走る]、[きしゃ | 汽車]、...
. 、[きしゃ | 汽車]、[きしゃ| 記者]基本
辞書部:[きしゃ | 記者]、[きしゃ | 汽車]
、[はしる | 奔る]、[はしる | 走る]の情報
を得る。 【0032】読み:きしゃ の第一候補は、表記:汽車
であり、第二候補は表記:記者 である。 【0033】読み:はしる の第一候補は、表記:走る
であり、第二候補は表記:奔る である。 【0034】かな漢字交じり文 ”記者が走る”を作成
する。 [3] 出力部104は、変換文:記者が走る”を表示
する。 [4] 表示された表記:記者は望むものではなかった
のでオペレータは同音語選択部105で、第二候補の単
語:汽車 を選ぶ。 [5] 学習辞書判定部106は、学習辞書部103上
の該当する記録、[きしゃ|汽車] に対して、使用頻
度情報が限度数の5に達していると判定する。次に、[
はしる|走る]に対して、使用頻度情報は限度数の5以
下であると判定する。 [6] 学習辞書登録部107は、登録すべき条件に合
う単語がないので、なにも処理しない。 [7] 学習辞書更新部108は、単語:汽車 が、第
一候補以外であり、かつ、判定部で限度数に達している
と判定したので、学習辞書部103上にある、最も古い
[きしゃ|汽車]を削除し、新たに[きしゃ|汽車]を
登録する。また、単語:走る が、第一候補でかつ、学
習辞書部103から得られた単語であるので、学習辞書
部103上にある最も古い[はしる|走る]の情報を削
除し、新たに学習辞書部103に[はしる|走る]登録
する。 (おわり) この操作により、学習辞書部103はまず図4(e2)
となり、削除された結果 (e2’) となる。 図4(f)は、文:『汽車が走る』『記者が走る』をそ
れぞれ10回変換した結果である。学習辞書部103中
、[はしる|走る]は常に更新されており、新しく記録
された単語として存在する。第二候補で選ばれている単
語 ”汽車”と”記者”に対して、学習辞書部103に
記録される[きしゃ|汽車]、[きしゃ|記者]の各個
数が上限数5に達した後は、登録されず、更新のみが行
われている。 【0035】上述のように本実施例の日本語入力装置に
よれば、学習辞書部上に重複して記録される単語の限度
数を定め、限度数を越える場合は、登録を行わずに記録
の更新のみを行うことにより、第一候補以外で選ばれ続
ける単語が学習辞書部に無制限に登録されるのを防ぎ、
学習辞書部が早期に一杯になることを防ぐことが可能と
なる。 【0036】なお、実施例では限度数として5を設定し
たが、学習辞書部のサイズに応じて変更することが可能
である。また、学習辞書登録部、学習辞書更新部の順に
処理の流れを説明したが、これらの処理の順序はどちら
が先でも同じ結果が得られる。また、同音語の優先順位
の決定は使用頻度情報を優先して行ったが、この他にも
、使用順序情報を優先する方法、使用順序情報と使用頻
度情報を共に用いる方法がある。 【0037】 【発明の効果】上述のように本実施例の日本語入力装置
において、学習辞書部に重複して登録される個数に限度
数を設定し、限度数に達した場合登録を行わず更新のみ
を行うことにより、比較的早期に学習辞書部が一杯にな
ることを防ぎ、限られた容量の学習辞書部を有効に利用
できる。よって、従来と比較して記憶した単語がより長
期にわたり学習辞書部に保存されるため、一度到達した
高い変換率を長期にわたり維持することが可能となり、
その実用的効果は大きい。
【図1】本発明の一実施例の日本語入力装置の構成図
【
図2】本発明の一実施例の日本語入力装置により日本語
入力と変換を行う過程の一例を示す流れ図
図2】本発明の一実施例の日本語入力装置により日本語
入力と変換を行う過程の一例を示す流れ図
【図3】本発
明の一実施例の日本語入力装置により同音語学習を行う
時の学習辞書部の変化を示す模式図
明の一実施例の日本語入力装置により同音語学習を行う
時の学習辞書部の変化を示す模式図
【図4】本発明の一
実施例の日本語入力装置により同音語学習を行う時の学
習辞書部の変化を示す模式図
実施例の日本語入力装置により同音語学習を行う時の学
習辞書部の変化を示す模式図
【図5】来の日本語入力装
置の構成図
置の構成図
【図6】従来の日本語入力装置により日本語入力と変換
を行う過程を示す流れ図
を行う過程を示す流れ図
【図7】従来の日本語入力装置により同音語学習を行う
時の学習辞書の変化を示す模式図
時の学習辞書の変化を示す模式図
【図8】従来の日本語入力装置により同音語学習を行う
時の学習辞書の変化を示す模式図
時の学習辞書の変化を示す模式図
101 入力部
102 基本辞書部
103 学習辞書部
104 かな漢字変換部
105 出力部
106 同音語選択部
107 学習辞書判定部
108 学習辞書登録部
109 学習辞書更新部
Claims (2)
- 【請求項1】日本語の読み列を入力する入力ステップと
、前記入力ステップで得られた読み列に対し、同音語の
使用順序情報と使用頻度情報を持つ学習辞書と単語の読
みと表記を持つ基本辞書とを検索して、漢字かな交じり
文に変換するかな漢字変換ステップと、前記かな漢字変
換ステップで変換された漢字かな交じり文を出力する出
力ステップと、複数の同音語候補から一つを選択する同
音語選択ステップと、前記同音語選択ステップで選択さ
れた単語に該当する学習辞書内の使用頻度情報が、あら
かじめ決められた限度数以下であるかを判定する学習辞
書判定ステップと、前記同音語選択ステップで選択され
た単語が第一候補以外でありかつ、前記学習辞書判定ス
テップで使用頻度情報が限度数以下であると判定された
ときに、学習辞書に使用順序情報と使用頻度情報を登録
する学習辞書登録ステップと、前記同音語選択ステップ
で選択された単語が第一候補でありかつ、学習辞書から
得られたときか、または、第一候補以外でありかつ、前
記学習辞書判定ステップで使用頻度情報が限度数に達し
ていると判定されたときに、学習辞書内の使用順序情報
を更新する学習辞書更新ステップとを実行することを特
徴とする日本語入力方法。 - 【請求項2】日本語の読み列を入力する入力部と、単語
の読みと表記を持つ基本辞書部と、同音語の使用順序情
報と使用頻度情報を持つ学習辞書部と、前記入力部で得
られた日本語の読み列から前記学習辞書部と前記基本辞
書部を検索し、漢字かな交じり文に変換するかな漢字変
換部と、前記かな漢字変換部で変換された漢字かな交じ
り文を出力する出力部と、複数の同音語候補から一つを
選択する同音語選択部と、前記同音語選択部で選択され
た単語に該当する前記学習辞書部内の使用頻度情報が、
あらかじめ決められた限度数以下であるかを判定する学
習辞書判定部と、前記同音語選択部で選択された単語が
第一候補以外でありかつ、前記学習辞書判定部で使用頻
度情報が限度数以下であると判定されたときに、前記学
習辞書部に使用順序情報と使用頻度情報を登録する学習
辞書登録部と、前記同音語選択部で選択された単語が第
一候補でありかつ、前記学習辞書部から得られたときか
、または、第一候補以外でありかつ、前記学習辞書判定
部で使用頻度情報が限度数に達していると判定されたと
きに、前記学習辞書部内の使用順序情報を更新する学習
辞書更新部とを備えたことを特徴とする日本語入力装置
。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3026119A JPH04264960A (ja) | 1991-02-20 | 1991-02-20 | 日本語入力方法およびその装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3026119A JPH04264960A (ja) | 1991-02-20 | 1991-02-20 | 日本語入力方法およびその装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04264960A true JPH04264960A (ja) | 1992-09-21 |
Family
ID=12184689
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3026119A Pending JPH04264960A (ja) | 1991-02-20 | 1991-02-20 | 日本語入力方法およびその装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04264960A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007004635A (ja) * | 2005-06-24 | 2007-01-11 | Microsoft Corp | 文字列変換結果記録方法、システム、およびプログラム |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5916041A (ja) * | 1983-06-28 | 1984-01-27 | Canon Inc | 文字変換装置 |
-
1991
- 1991-02-20 JP JP3026119A patent/JPH04264960A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5916041A (ja) * | 1983-06-28 | 1984-01-27 | Canon Inc | 文字変換装置 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007004635A (ja) * | 2005-06-24 | 2007-01-11 | Microsoft Corp | 文字列変換結果記録方法、システム、およびプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH04264960A (ja) | 日本語入力方法およびその装置 | |
| JP2595934B2 (ja) | 仮名漢字変換処理装置 | |
| JPH0452500B2 (ja) | ||
| JPS6211385B2 (ja) | ||
| JP2819612B2 (ja) | 文字変換装置 | |
| JPS63106070A (ja) | 中文入力方式 | |
| JPS5951015B2 (ja) | 文書作成装置 | |
| JPS63308665A (ja) | 仮名漢字変換装置 | |
| JP2638777B2 (ja) | かな漢字変換装置 | |
| JPS646498B2 (ja) | ||
| JP2000194389A (ja) | 情報処理装置 | |
| JPH09218868A (ja) | 漢字指定方法及び装置 | |
| JPS6128159A (ja) | 複合語の学習機能を持つかな漢字変換装置 | |
| JPH07129568A (ja) | 文字処理方法及び装置 | |
| JPS60251461A (ja) | 仮名漢字変換装置 | |
| JPH0625990B2 (ja) | 中文自動区切入力方式 | |
| JPS5922130A (ja) | カナ漢字変換装置 | |
| JPH0546593A (ja) | 文字入力装置 | |
| JPH07122874B2 (ja) | 同音語学習装置 | |
| JPS5868145A (ja) | 日本語入力装置 | |
| JPH0695330B2 (ja) | 文書作成装置 | |
| JPH05282290A (ja) | 文章作成支援装置 | |
| JPS63313266A (ja) | かな漢字変換装置 | |
| JPH1091623A (ja) | 文字変換装置 | |
| JPH0443308B2 (ja) |