JPH0330047A

JPH0330047A - 仮名漢字変換装置

Info

Publication number: JPH0330047A
Application number: JP1165879A
Authority: JP
Inventors: Tadashi Aramaki; 荒巻　正
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1989-06-28
Filing date: 1989-06-28
Publication date: 1991-02-08

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は、仮名の状態で入力された文字列を仮名漢字混
じり文に変換する仮名漢字変換装置に関するものである
。

従来の技術近年、仮名漢字変換装置は日本語を入力する最も一般的
な手段として、日本語ワードブロセッザを始めとする各
種の日本語処理装置に広く利用されている。

仮名漢字変換装置の機能は、初期の漢字単位または熟語
単位の変換から、文法処理を付加した文節単位の変換へ
と発展し、今日では連文節変換や文書一括変換等と呼ば
れる複数の文節をまとめて変換することが可能な、より
高度な仮名漢字変換装置が開発されている。

日本語では、一つの文字列に対して複数の仮名庚字混じ
り文が対応することがある。例えば、゜文字列「かれは
はしる」に対する仮名漢字混じり文の例として、「彼は
走る」と「枯葉は知る」の二通りが考えられる。単語の
読みの一部が別の単語の読みと一致するとき、これをエ
ンベディッドな関係という。ここで、「彼（かれ）」は
「枯葉（かれは）」のエンベディッドで、「知る（しる
）」は「走る（はしる）」のエンベディッドである。

従来の仮名漢字変換装置では、入力仮名列中に文字列「
かれ」と文字列「かれは」とが存在するにもかかわらず
、文字列「かれははしる」に対する仮名漢字変換の結果
は、仮名漢字混じり文のどちらか一方が選ばれる。

発明が解決しようとする課題従来の技術で説明したように日本語には単語をエンベデ
ィッドする単語が存在する。このような単語を含む仮名
列を仮名漢字変換するとき、ユーザーが求める仮名漢字
まじり文が得られない場合がある。この場合ユーザーは
自分の求める単語に再変換するための時間が必要となり
、迅速な文書の作或ができないという問題を有していた
。

課題を解決するための手段この課題を解決するために本発明は、仮名データ記憶手
段に記憶された仮名データのうちある自立語と助詞との
結合或は他の一つの自立語と決定する可能性のある非確
定仮名データの出現頻度である第１頻度と前記非確定仮
名データに含まれるある自立語の出現頻度である第２頻
度とを計数する出現頻度計数手段と、非確定仮名データ
を漢字データに変換する際、出現頻度計数手段に計数さ
れた第１頻度と第２頻度とを比較し、第２頻度の方が第
１頻度より多い場合は非確定仮名データはある自立語と
助詞との結合として漢字データに変換する構成でなる。

作　　用この構戒において、ある語に含まれる語の出現頻度が多
い場合、ある語がある単語単独で自立語を構威する可能
性が小さいので、変換結果の正解率が高くなる。

実施例以下、本発明の一実施例を図面を参照して説明する。

第１図は、本発明の一実施例における仮名漢字変換装置
の機能ブロック図である。図において、１は仮名列を入
力するための入力装置である。２は入力装置１から入力
された仮名列を記憶する入力仮名列記憶部である。３は
入力仮名列中に複数回出現する２文字以上の語を構成す
る文字列を切り出す文字列切り出し部である。４は文字
列切り出し部３で切り出された切り出し文字列とその出
現頻度を記憶する切り出し文字列記憶部である。

５は単語の読みと表記と品詞情報を記憶している辞書で
ある。６は切り出し文字列記憶部４に記憶された切り出
し文字列とその出現頻度を参照しながら単語の読み情報
を用いて辞書５を検索し単語の表記情報と品詞情報を取
り出す辞書検索部である。７は辞書検索部６の検索結果
を参照しながら入力仮名列記憶部２に記憶された入力仮
名列を仮名漢字混じり文に仮名漢字変換する仮名漢字変
換ＩＩＩｎ部である。８は仮名漢字変換制御部７より出
力された仮名漢字混じり文を記憶する出力文字列記憶部
である。９は出力文字列記憶部８に記憶された仮名漢字
混しり文を出力する出力装置である。

第２図は、本実施例の仮名漢字変換装置の装置ブロック
図である。図において、１０は陰極線管を有する表示装
置（以下ＣＲＴと略称する。）、ｌ１はキーボード（以
下ＫＥＹと略称する。〉、１２は中央処理装置（以下Ｃ
ＰＵと略称する。〉、ｌ３はリードオンリーメモリ（以
下ＲＯＭと略称する。）、１４はリードライトメモリ（
以下ＲＷＭと略称する。）である。第１図の入力装置ｌ
はＫＥＹＩＩにより、入力仮名列記憶部２と切り出し文
字列記憶部４と出力文字列記憶部８はＲＷＭ１４により
、辞書５はＲＯＭ１３により、出力装置９はＣＲＴＩＯ
により、文字列切り出し部３と辞書検索部６と仮名漢字
変換制御部７はＣＰＵＩ２がＲＯＭ１３とＲＷＭ１４の
データのやりとりを行いながらＲＯＭ１３に記憶されて
いるプログラムを実行することにより、それぞれ実現さ
れている。

上記のように構威された仮名漢字変換装置について、以
下その動作を第１０図のフローチャートに沿って説明す
る。まずステップＡで入力装置１から仮名列が入力され
、入力仮名列記憶部２に記憶される。次に、ステップＢ
で文字列切り出し部３が入力仮名列中に複数回出現する
文字列を切り出し、切り出し文字列記憶部４に文字列切
り出し部３で切り出された切り出し文字列とその出現頻
度を記憶する。次に、ステップＣで変換キーが押された
かのチェックを行う。変換キーが押されていなければス
テップＣを繰り返し、変換キーが押されていればステッ
プＤに進む。ステップＤで、仮名漢字変換制御部７は、
辞書検索部６に切り出し文字列記憶部４の参照を指示し
、仮名異字変換の対象仮名文字を切り出す。

詳しく述べるならば、入力仮名列記憶部２に記憶された
文字のうち、切り出し文字列記憶部４に文字が切り出さ
れた語で、ある語とある語を含んだ語とが存在する場合
に、それらの出現頻度を比較し、ある語の出現頻度の方
が多い場合、ある語を含んだ語をある語と他の語、例え
ば自立後と付属語との合成語として、仮名漢字変換対象
の仮名文字を扱う。その結果を用いて入力仮名列記憶部
２から文字列を切り出す。ステップＥで、仮名漢字変換
制御部７は、辞書検索部６に辞書５の検索を指示する。

ステップＦでは、ステップＥの結果を用いて文字列を仮
名漢字変換する。ステップＧでは、ステップＦで変換さ
れた結果を出力文字列記憶部８に記憶し、出力装置９に
出力する。ステップＨでは、全ての仮名列が変換された
かのチェックを行なう。変換されていない仮名列が残っ
ていれば、ステップＤに戻り、全ての仮名列が変換され
ていれば、実行を終了する。

切り出し文字列記憶部４に記憶された切り出し文字列と
その出現頻度を参照しながら単語の読み情報を用いて仮
名漢字変換する様子を第３図、第４図、第５図、第６図
、第７図、第８図、第９図を用いて説明する。第３図、
第４図は入力される仮名列の例を示す。入力装置１から
入力されて入力仮名列記憶部２に記憶された入力仮名列
から、文字列切り出し部３は複数回出現する文字列を切
り出し、切り出し文字列記憶部４に記憶する。第５図と
第６図はそれぞれ、第３図、第４図の仮名列を入力した
ときの切り出し文字列記憶部の状態を示す。図において
、１５は切り出された文字列を記憶する切り出し文字列
記憶エリアである。１６は切り出された文字列が入力仮
名列中に出現する頻度を記憶する出現頻度記憶エリアで
ある。第９図は、辞書の構造図を示す。図において、１
７は単語の読み情報を記憶する読み情報記憶エリアであ
る。１８は単語の表記情報を記憶する表記情報記憶エリ
アである。１９は単語の品詞情報を記憶する品詞情報記
憶エリアである。第５図に示されるように、第３図の入
力仮名列中の「かれ」の出現頻度は８回、「かれは」の
出現頻度は４回なで「かれ」の出現頻度の方が多いので
、文字列「かれは」は、自立語「かれ」と付属語「は」
に分けて処理を進める。このため、入力仮名列中に含ま
れる文字列「かれははしる」を仮名漢字変換した結果は
、「彼は走る」となる。このように仮名漢字変換された
結果を第７図に示す。

しかし第６図に示されるように、第４図の入力仮名列中
の「かれ」の出現頻度は８回、「かれは」の出現頻度は
８回なので、文字列「かれは」は、自立語「かれは」で
あると判断して処理を進める。

このため、入力仮名列中に含まれる文字列「かれははし
る」を仮名漢字変換した結果は、「枯葉は知る」となる
。このように仮名順字変換された結果を第８図に示す。

発明の効果本発明はユーザーが入力した仮名列中に複数回出現する
文字列を切り出す文字列切り出し部と、文字列切り出し
部で切り出された切り出し文字列とその出現頻度を記憶
する切り出し文字列記憶部と、切り出し文字列記憶部に
記憶された切り出し文字列とその出現頻度を参照しなが
ら単語の読み情報を用いて辞書を検索し単語の表記情報
と品詞情報を取り出す辞書検索部を備えたものであり、
単語をエンベディッドする単語を含む文字列を仮名漢字
変換する場合、単語が入力仮名列に出現する頻度から、
ユーザーが求める単語を得ることができ、迅速な文書の
作戒を行なうことができる。

【図面の簡単な説明】

第１図は本発明の一実施例における仮名漢字変換装置の
機能ブロック図、第２図は同装置の装置ブロック図、第
３図及び第４図は入力文字列の例を示す図、第５図と第
６図は同装置の切り出し文字列記憶部の構造図、第７図
及び第８図は第３図及び第４図に示した入力文字列を仮
名漢字変換した結果を示す図、第９図は同装置の辞書の
構造図、第１０図は同装置の動作を示すフローチャート
である。第１図１１・・・入力装置、２・・・入力仮名列記憶部、３・・
・文字列切り出し部、４・・・切り出し文字列記憶部、
５・・・辞書、６・・・辞書検索部、７・・・仮名漢字
変換制御部、８・・・出力文字列記憶部、９・・・出力
装置、１０・・・ＣＲＴ，１１・・・ＫＥＹ，１２・・
・ＣＰＵ，１３・・・ＲＯＭ１１４・・・ＲＷＭ，１５
・・・切り出し文字列記憶エリア、１６・・・出現頻度
記憶エリア、１７・・・読み情報記憶エリア、１８・・
・表記情報記憶エリア、１９・・・品詞情報記憶エリア第２閃第９図ｌ７−一一舖み慣ｖｆｉ記墳エリアＩ８−一一寝記情′＠記情エリアｌ９−−一品詞惰？＆Ｒｔ！！エリア１７ｌ８１９！！ｂ周〕臥日餡ピ侶周」七羽翠：′磨日羽

Claims

【特許請求の範囲】　仮名データを入力する入力手段と、前記入力手段から入力された仮名データを記憶する仮名
データ記憶手段と、前記仮名データ記憶手段に記憶された仮名データのうち
ある自立語と助詞との結合或は他の一つの自立語と決定
する可能性のある非確定仮名データの出現頻度である第
１頻度と前記非確定仮名データに含まれるある自立語の
出現頻度である第２頻度とを計数する出現頻度計数手段
と、前記非確定仮名データを漢字データに変換する際、前記
出現頻度計数手段に計数された第１頻度と第２頻度とを
比較し、前記第２頻度の方が前記第１頻度より多い場合
は該非確定仮名データはある自立語と助詞との結合とし
て漢字データに変換する変換手段と、を有することを特徴とする仮名漢字変換装置。