JPH0430247A - かな漢字変換における自動未知語登録方式 - Google Patents

かな漢字変換における自動未知語登録方式

Info

Publication number
JPH0430247A
JPH0430247A JP2135438A JP13543890A JPH0430247A JP H0430247 A JPH0430247 A JP H0430247A JP 2135438 A JP2135438 A JP 2135438A JP 13543890 A JP13543890 A JP 13543890A JP H0430247 A JPH0430247 A JP H0430247A
Authority
JP
Japan
Prior art keywords
unknown word
unknown
dictionary
kana
yomi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2135438A
Other languages
English (en)
Inventor
Minoru Arisawa
有沢 穰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2135438A priority Critical patent/JPH0430247A/ja
Publication of JPH0430247A publication Critical patent/JPH0430247A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的コ (産業上の利用分野) この発明は、かな漢字変換により日本語入力を行うワー
ドプロセッサ、パーソナルコンピュタ等に採用して好適
な、かな漢字変換における自動未知語登録方式に関する
(従来の技術) 従来、かな漢字変換を用いて文章を作成する場合、ユー
ザは頻繁に人力する単語や短文を、あらかしめ単語登録
または短文登録により、辞書に登録しておかなければな
らない。こうすることにより、その単語(または短文)
の「読み」を全て入力しなくても、単語(または短文)
を呼び出すことができるようになっている。この方式に
より、従来のかな漢字変換は、文章作成の効率化をはか
っている。
(発明が解決しようとする課題) 上述したように従来例に従えば、単語機能または短文機
能を使用する場合は、単語登録または短文登録のための
操作を行う必要があった。また、種々の文章を作成する
場合、どのような単語(または短文)が頻繁に現れるか
を予測して、あらかじめ単語登録(または短文登録)し
ておくことは困難である。更に、文章を作成しながらの
単語登録(または短文登録)も可能であるが、該当する
単語(または短文)や「読み」を指定する必要があり、
文章の作成作業を中断しなければならない。
本発明は上記事情に鑑みてなされたものであり、文章の
作成作業を中断することなく、辞書に登録されていない
単語や短文、いわゆる未知語を自動的に登録できるよう
にしたかな漢字変換における自動未知語登録方式を提供
することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、「読み」とそれに該当する単語かあらかじめ
登録された一般辞書と、ユーザ指定の「読み」とそれに
該当する単語または短文が登録されるユーザ辞書と、「
読み」とそれに該当する未知語が登録される未知語辞書
と、この未知語辞書を対象とする未知語の登録、削除、
およびこの未知語辞書からの未知語呼び出しを行う未知
語処理手段と、入力した「読み」に関し上記一般辞書お
よびユーザ辞書をアクセスすることにより漢字等に変換
し、変換した結果をかな漢字変換出力バッファに格納し
、変換結果が確定した場合それか未知語であれば、「読
み」と変換結果を上記未知語処理手段に渡し、変換不可
な未知語の「読み」が人力された場合にはその「読み」
を上記未知語処理手段に渡して呼び出し要求をがけるか
な漢字変換処理本体とを具備し、かな漢字変換処理で未
知語が確定された場合、その未知語と変換結果を未知語
処理手段により自動的に未知語辞書に登録し、次回から
は、その未知語の読みの先頭からのn文字(nは予め定
められている値)を入力するだけで、先に確定した結果
に、未知語処理手段によって変換できるようにしたこと
を特徴とする。
(作用) 上述したように本発明によれば、「読み」とそれに該当
する未知語が登録される未知語辞書と、この未知語辞書
を対象とする未知語の登録、削除、およびこの未知語辞
書からの未知語呼び出しを行う未知語処理手段を設け、
かな漢字変換処理本体におけるかな漢字変換処理で未知
語(単語または短文の未知語)が確定された場合には、
その「読み」と変換結果を未知語処理手段に渡すことで
、確定した未知語を自動的に単語または短文として未知
語辞書に登録することが可能となり、また、通常の辞書
(一般辞書およびユーザ辞1!F)検索では変換不可な
未知語の「読みヨが入力された場合に、その「読み」を
未知語処理手段に渡して呼び出し要求をかけることで、
その「読み」の先頭からのn文字(その「読み」自身か
本来の読みの先頭からのn文字であってもよい)をもと
に未知語辞書から該当する未知語を取り出して候補語を
得ることが可能となる。
このことにより、頻繁に使用することが予測される単語
や短文を、あらかしめ登録しておく必要がなくなり、使
用する単語や短文、または使用した単語や短文を文書作
成の途中に作業を中断して登録する必要もなくなり、従
って入力時におけるユーザの負担を軽減させることがで
きる。更に、「読み」の先頭n文字を入力するだけで、
未知語辞書に登録されている単語または短文を呼び出す
ことができるので、文章作成の効率が向上する。
(実施例) 以下、図面を使用して本発明実施例について説明する。
第1図は本発明の実施例を示すブロック図である。図に
おいて、符号11はかな漢字変換処理本体であり、入力
された「読み」を、一般辞書15およびユーザ辞書16
をアクセスすることにより、漢字やカタカナに変換する
。変換した結果は、かな漢字変換出力バッファ14に格
納される。本体11は、変換結果を確定した場合は、そ
れが未知語であれば、「読み」と変換結果を未知語処理
部13に渡す。また、漢字への変換への際、未知語の「
読み」が入力された場合は、本体11は未知語処理部1
3に呼び出し要求をかけ候補文字を得る。符号12は単
語/短文処理部あり、ユーザ辞書16をアクセスし単語
/短文の登録や呼び出し等を行なう。この単語/短文処
理部12は、通常は「読み」と単語をもとに登録処理等
を行なうが、未知語処理部13を介して未知語辞書17
内の未知語をユーザ辞書16に登録することもできるよ
うになっている。符号13は未知語処理部であり、かな
漢字変換処理本体11から受は取ったデータをもとに、
未知語辞書17への未知入力された「読み」に対する変
換候補文字が格納される。符号15は一般辞書、16は
ユーザ辞書であり、「読み」とそれに該当する単語や短
文などが格納される。ユーザ辞1F16は、単語/短文
処理部12により、単語/短文の登録、削除等が行なわ
れる。符号17は未知語辞書であり、「読み」とそれに
該当する未知語が格納される。
未知語辞書17は、未知語処理部13による未知語の登
録、削除等に用いられる。
第2図は第1図に示した未知語辞書17の内部構造を示
す図である。図において、符号21は未知語辞書情報テ
ーブルであり、辞書サイズ、未知語登録語数、使用ブロ
ック数等、未知語の登録管理に必要な情報が設定される
。符号22は未知語読みディレクトリであり、符号Bl
で示すように、未知語ヘッダ、未知語の登録ブロックを
示す未知語ブロック番号、呼び出し回数および未知語の
「読み」を持つレコード(「読みレコード」と呼ぶ)か
ら成る。読みレコード(Bl )は、未知語読みディレ
クトリ22に50音順に設定される。
同じ「読み」の場合は、最近呼び出されて使用されたも
のか先方となる。未知語ブロック番号には、次に述べる
未知語登録部空きマツプテーブル23と対応した値か入
る。呼び出し回数とは、その「読み」に対応した未知語
が呼び出されて使用された回数を表す。未知語読みディ
レクトリ22の大きさは固定、読みレコードの大きさは
可変である。
符号23は未知語登録部空きマツプテーブルであり、図
中01で示す構成を持ち、次に述べる未知語登録部24
の使用状況をビットで表す。新たに未知語が登録された
場合は、確保した未知語登録部24のブロックに対応す
るビットをオンにする。逆に登録済みの未知語を削除し
た場合は、対応したブロックのビットをオフにする。テ
ーブル23の大きさは、未知語登録部24の大きさに応
じた固定サイズになる。なお、未知語登録部24に登録
される未知語レコードの大きさが可変であるため、当然
ブロック数も可変となる。このため、未使用ブロックの
ビットは全て1にする。
符号24は未知語登録部であり、図中のDlで示す構成
のレコード(「未知語レコード」と呼ぶ)から成る。未
知語登録部24の大きさは固定、未知語レコードの大き
さは可変である。
第3図は本発明実施例の動作を示すフローチャートであ
り、未知語処理部13による処理手順が示されている。
図中、符号aは未知語辞書17を初期化するステップで
あり、必要なテーブルの初期化等を行なう。符号すはか
な漢字変換処理本体11から受は取った「読み」と未知
語を未知語辞書17に登録するステップである。このス
テップbでは、まず未知語辞書17がアクセスされ、未
知語登録部24の空きブロックが求められる。
空きブロックがあったならば、そのブロックが確保され
、未知語が登録される。また、読みディレクトリ22の
規則に従い、「読み」と未知語ブロック番号も登録され
る。
符号Cは登録済みの未知語を呼び出すステップであり、
かな漢字変換処理本体11から受は取った「読み」をも
とに、その「読み」に対応した登録済みの未知語を捜し
て、かな漢字変換処理本体11に返す。符号dは未知語
辞書17から登録済みの未知語を削除するステップであ
り、指定の使用頻度以下の未知語を未知語辞書17から
削除する。
以下、本発明実施例の動作について説明する。
まず、未知語辞書17への未知語登録動作から説明する
。かな漢字変換処理本体11は、ユーザからの選択操作
等によって確定した単語/短文(単語または短文)が一
般辞書15およびユーザ辞書16のいずれにも登録され
ていない未知語であった場合、その「読み」と単語/短
文を未知語処理部13に渡す。この処理は確定文字列単
位で行なわれる。なお、未知語(を構成する文字列)を
コード入力や漢字1文字車位の入力(単漢字入力)の繰
り返しにより入力できることはよく知られている。
未知語処理部13は、かな漢字変換処理本体11から受
は取った「読み」の長さをチエツクし、規定値nより短
い場合は、かな漢字変換処理本体11にエラーコードを
返す。一方、上記骨は取った「読み」の長さが規定値n
以上である場合には、未知語処理部13は、未知語辞書
17の未知語登録部空きマツプテーブル23を先頭ビッ
トから順に参照し、オフ状態にあるビ・ソトを捜す。こ
こでは、捜したオフビットのビット位置の番号(先頭ビ
ットのビット位置を0とした場合のビット位置番号)か
、求める空きブロックの番号(abno)となる。未知
語登録部空きマツプテーブル23の全てのビットがオン
の場合は、空きブロックかないため、未知語登録せずに
かな漢字変換処理本体11にエラーコードを返す。なお
、空きプロ・ツクの確保は、第3図に示すステップdの
処理により指定の使用頻度以下の未知語を未知語辞書]
7から削除することにより行なわれる。
次に未知語処理部13は、未知語辞書17の読みディレ
クトリ22の更新を行なう。即ち未知語処理部13は、
まず読みディレクトリ22を調べ、登録すべき未知語の
読みレコードの挿入すべき位置を求める。読みレコード
は、50音順に格納される。「読み」が同じ場合は、同
じ「読み」の先方に挿入される。未知語処理部13は、
求めた位置以降の読みレコードを登録レコードサイズ分
後送りし、登録すべき未知語の読みレコードを格納する
。この読みレコードの先頭には、1バイトの未知語ヘッ
ダ(OXFF)か付加される。そして未知語処理部13
は、未知語辞書17の未知語登録部24内で未知語を登
録すべき空きブロックを捜す。この空きブロックは、未
知語登録部24内の未知語ヘッダの数が、先に求めた空
きブロック番号で示される数に一致する上述したabn
o目となる未知語登録部24内の位置となる。
未知語処理部13は、上記のように未知語登録部24内
で空きブロックを捜すと、読みディレクトリ22の更新
と同様にして、同ブロック内に未知語(単語/短文)を
登録する。この際、未知語処理部13は、登録する未知
語の先頭にも1バイトの未知語ヘッダ(OXFF)を付
加し、しかる後にかな漢字変換処理本体11に正常終了
コードを返して処理を終了する。
次に呼び出しの動作について説明する。まず、かな漢字
変換処理本体]1は、入力された「読み」に対応する単
語/短文が一般辞書15およびユーザ辞書16のいずれ
にも登録されていない未知語であった場合、その「読み
」を未知語処理部13に渡す。未知語処理部13は、未
知語辞書17の読みディレクトリ22をアクセスし、か
な漢字変換処理本体11から受は取った「読み」の先頭
からのn文字(nはあらかしめ定められた値であり、例
えば3)と一致するものかあるか否かを調べる。
なお、「読み」の文字数がnの場合には、かな漢字変換
処理本体11から受は取った「読み」と−致するものが
あるか否かが調べられる。もし、致するものがあった場
合は、候補番号に対応する部分を取り出す。候補番号と
は、同じ「読み」の中から何番目の文字を取り出すかを
意味する。
致するものがなかった場合は、かな漢字変換処理本体1
1にその旨を示すコードを返して処理を終了する。
さて未知語処理部13は、かな漢字変換処理本体11か
ら受は取った「読み」の先頭からのn文字と一致するも
のかあった場合、未知語登録部24から次のようにして
対応する未知語を取り出し、かな漢字変換処理本体11
に返す。即ち未知語処理部13は、上記により求めた読
みレコードから未知語ブロック番号を取り出し、登録時
と同様にして未知語登録部24内の位置を求める。そし
て未知語処理部13は、候補番号に対する未知語登録部
24の該当ブロックをアクセスして、指定の未知語を取
り出す。
以上の未知語登録により、例えば「パーソナルコンピュ
ータ」という未知の単語を確定して未知語辞書17に登
録した場合であれば、この次からは、「は−そ」と入力
し変換すれば(n−3の場合)、「パーソナルコンピュ
ータ」という単語が出てくるようになる。同様に、例え
ば「毎度御厚情を賜りありがとうございます」という未
知の短文を確定して未知語辞書17に登録した場合であ
れば、この次からは「まいど」と入力し変換すれば、「
毎度御厚情を賜りありがとうございます」という短文が
出てくるようになる。なお、上記の例で、単語「パーソ
ナルコンピュータ」が辞書登録されていることを知らす
に「ば−そなるこんびゅ−た」と人力した場合には、先
頭の3文字「ば−そjによって未知語辞書17が検索さ
れて「パーソナルコンピュータ」と変換されるが、この
変換結果の読みが入力された読みと一致している場合に
は、残りの読み「なるこんぴゅ−た」は無視される。
[発明の効果コ 以上説明のように本発明によれば、使いそうな単語/短
文を、あらかじめ登録しておく必要がないし、文章作成
の途中に作業を中断し、使用する単語/短文を登録する
必要もないので、ユーザーの負担を軽減させることがで
きる。また、「読み」の先頭n文字を入力するだけで、
未知語辞書に登録されている単語/短文を呼び出すこと
ができるので、文章作成の効率が向上する。
【図面の簡単な説明】
第1図は本発明の実施例を示すブロック図、第2図は第
1図に示す未知語辞書の内部構造を示す図、第3図は未
知語処理部による処理手順をフローチャートで示した図
である。 11・・かな漢字変換処理本体、12−単語/短文処理
部、13・・未知語処理部、15・・・一般辞書、16
・・・ユニサ辞書、17・・・未知語辞書。

Claims (1)

    【特許請求の範囲】
  1. 「読み」とそれに該当する単語があらかじめ登録された
    一般辞書と、ユーザ指定の「読み」とそれに該当する単
    語または短文が登録されるユーザ辞書と、「読み」とそ
    れに該当する未知語が登録される未知語辞書と、この未
    知語辞書を対象とする未知語の登録、削除、およびこの
    未知語辞書からの未知語呼び出しを行う未知語処理手段
    と、入力した「読み」に関し上記一般辞書およびユーザ
    辞書をアクセスすることにより漢字等に変換し、変換し
    た結果をかな漢字変換出力バッファに格納し、変換結果
    が確定した場合それが未知語であれば、「読み」と変換
    結果を上記未知語処理手段に渡し、変換不可な未知語の
    「読み」が入力された場合にはその「読み」を上記未知
    語処理手段に渡して呼び出し要求をかけるかな漢字変換
    処理本体とを具備し、上記未知語処理手段は、上記かな
    漢字変換処理本体から「読み」と変換結果が渡された場
    合には、上記未知語辞書への未知語登録処理を行い、上
    記かな漢字変換処理本体から未知語の「読み」が渡され
    て呼び出しが要求された場合には、その「読み」の先頭
    からのn文字(nは予め定められている値)をもとに上
    記未知語辞書をアクセスして該当する未知語を得て上記
    「読み」に対する候補文字として上記かな漢字変換処理
    本体に渡すことを特徴とするかな漢字変換における自動
    未知語登録方式。
JP2135438A 1990-05-28 1990-05-28 かな漢字変換における自動未知語登録方式 Pending JPH0430247A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2135438A JPH0430247A (ja) 1990-05-28 1990-05-28 かな漢字変換における自動未知語登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2135438A JPH0430247A (ja) 1990-05-28 1990-05-28 かな漢字変換における自動未知語登録方式

Publications (1)

Publication Number Publication Date
JPH0430247A true JPH0430247A (ja) 1992-02-03

Family

ID=15151726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2135438A Pending JPH0430247A (ja) 1990-05-28 1990-05-28 かな漢字変換における自動未知語登録方式

Country Status (1)

Country Link
JP (1) JPH0430247A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7392771B2 (en) 2003-01-28 2008-07-01 Honda Motor Co., Ltd. Cylinder block and cylinder sleeve, method of producing cylinder block and cylinder sleeve by friction stir welding, and friction stir welding method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7392771B2 (en) 2003-01-28 2008-07-01 Honda Motor Co., Ltd. Cylinder block and cylinder sleeve, method of producing cylinder block and cylinder sleeve by friction stir welding, and friction stir welding method

Similar Documents

Publication Publication Date Title
JPH0525138B2 (ja)
JP3022539B1 (ja) 文書検索装置
JPS6170660A (ja) 機械翻訳システムにおける多義表示・選択方法
JPH08147311A (ja) 構造化文書検索方法及び装置
JPH0430247A (ja) かな漢字変換における自動未知語登録方式
JPH07287716A (ja) 辞書検索装置
JP2000076254A (ja) キーワード抽出装置、このキーワード抽出装置を用いた類似文献検索装置、キーワード抽出方法及び記録媒体
JPH0635971A (ja) 文書検索装置
JP3187671B2 (ja) 電子辞書表示装置
JPH05307541A (ja) かな漢字変換システム
JPS646499B2 (ja)
JPH0668159A (ja) 検索装置
JPS6246029B2 (ja)
TW541472B (en) Word/vocabulary searching method for electronic dictionary
JPS6198475A (ja) 日本語文章入力装置
JPH08339365A (ja) 文書作成装置及び文書作成方法
JPH10269231A (ja) 日英混在文書における文書検索方法
JPH04243477A (ja) 自然言語処理システムによる索引語抽出方法
JPH038070A (ja) キーワード抽出方式
JPH04253262A (ja) フリガナ付加方式
JP2002049616A (ja) かな漢字変換装置及びかな漢字変換方法
JPH0567080A (ja) かな漢字変換装置
JPH1069478A (ja) ワードプロセッサ
JPS60122463A (ja) 文字処理装置
JPH11272661A (ja) 日本語辞書自動登録システム及び方法