JPH0330047A - 仮名漢字変換装置 - Google Patents
仮名漢字変換装置Info
- Publication number
- JPH0330047A JPH0330047A JP1165879A JP16587989A JPH0330047A JP H0330047 A JPH0330047 A JP H0330047A JP 1165879 A JP1165879 A JP 1165879A JP 16587989 A JP16587989 A JP 16587989A JP H0330047 A JPH0330047 A JP H0330047A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- string
- frequency
- kanji
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、仮名の状態で入力された文字列を仮名漢字混
じり文に変換する仮名漢字変換装置に関するものである
。
じり文に変換する仮名漢字変換装置に関するものである
。
従来の技術
近年、仮名漢字変換装置は日本語を入力する最も一般的
な手段として、日本語ワードブロセッザを始めとする各
種の日本語処理装置に広く利用されている。
な手段として、日本語ワードブロセッザを始めとする各
種の日本語処理装置に広く利用されている。
仮名漢字変換装置の機能は、初期の漢字単位または熟語
単位の変換から、文法処理を付加した文節単位の変換へ
と発展し、今日では連文節変換や文書一括変換等と呼ば
れる複数の文節をまとめて変換することが可能な、より
高度な仮名漢字変換装置が開発されている。
単位の変換から、文法処理を付加した文節単位の変換へ
と発展し、今日では連文節変換や文書一括変換等と呼ば
れる複数の文節をまとめて変換することが可能な、より
高度な仮名漢字変換装置が開発されている。
日本語では、一つの文字列に対して複数の仮名庚字混じ
り文が対応することがある。例えば、゜文字列「かれは
はしる」に対する仮名漢字混じり文の例として、「彼は
走る」と「枯葉は知る」の二通りが考えられる。単語の
読みの一部が別の単語の読みと一致するとき、これをエ
ンベディッドな関係という。ここで、「彼(かれ)」は
「枯葉(かれは)」のエンベディッドで、「知る(しる
)」は「走る(はしる)」のエンベディッドである。
り文が対応することがある。例えば、゜文字列「かれは
はしる」に対する仮名漢字混じり文の例として、「彼は
走る」と「枯葉は知る」の二通りが考えられる。単語の
読みの一部が別の単語の読みと一致するとき、これをエ
ンベディッドな関係という。ここで、「彼(かれ)」は
「枯葉(かれは)」のエンベディッドで、「知る(しる
)」は「走る(はしる)」のエンベディッドである。
従来の仮名漢字変換装置では、入力仮名列中に文字列「
かれ」と文字列「かれは」とが存在するにもかかわらず
、文字列「かれははしる」に対する仮名漢字変換の結果
は、仮名漢字混じり文のどちらか一方が選ばれる。
かれ」と文字列「かれは」とが存在するにもかかわらず
、文字列「かれははしる」に対する仮名漢字変換の結果
は、仮名漢字混じり文のどちらか一方が選ばれる。
発明が解決しようとする課題
従来の技術で説明したように日本語には単語をエンベデ
ィッドする単語が存在する。このような単語を含む仮名
列を仮名漢字変換するとき、ユーザーが求める仮名漢字
まじり文が得られない場合がある。この場合ユーザーは
自分の求める単語に再変換するための時間が必要となり
、迅速な文書の作或ができないという問題を有していた
。
ィッドする単語が存在する。このような単語を含む仮名
列を仮名漢字変換するとき、ユーザーが求める仮名漢字
まじり文が得られない場合がある。この場合ユーザーは
自分の求める単語に再変換するための時間が必要となり
、迅速な文書の作或ができないという問題を有していた
。
課題を解決するための手段
この課題を解決するために本発明は、仮名データ記憶手
段に記憶された仮名データのうちある自立語と助詞との
結合或は他の一つの自立語と決定する可能性のある非確
定仮名データの出現頻度である第1頻度と前記非確定仮
名データに含まれるある自立語の出現頻度である第2頻
度とを計数する出現頻度計数手段と、非確定仮名データ
を漢字データに変換する際、出現頻度計数手段に計数さ
れた第1頻度と第2頻度とを比較し、第2頻度の方が第
1頻度より多い場合は非確定仮名データはある自立語と
助詞との結合として漢字データに変換する構成でなる。
段に記憶された仮名データのうちある自立語と助詞との
結合或は他の一つの自立語と決定する可能性のある非確
定仮名データの出現頻度である第1頻度と前記非確定仮
名データに含まれるある自立語の出現頻度である第2頻
度とを計数する出現頻度計数手段と、非確定仮名データ
を漢字データに変換する際、出現頻度計数手段に計数さ
れた第1頻度と第2頻度とを比較し、第2頻度の方が第
1頻度より多い場合は非確定仮名データはある自立語と
助詞との結合として漢字データに変換する構成でなる。
作 用
この構戒において、ある語に含まれる語の出現頻度が多
い場合、ある語がある単語単独で自立語を構威する可能
性が小さいので、変換結果の正解率が高くなる。
い場合、ある語がある単語単独で自立語を構威する可能
性が小さいので、変換結果の正解率が高くなる。
実施例
以下、本発明の一実施例を図面を参照して説明する。
第1図は、本発明の一実施例における仮名漢字変換装置
の機能ブロック図である。図において、1は仮名列を入
力するための入力装置である。2は入力装置1から入力
された仮名列を記憶する入力仮名列記憶部である。3は
入力仮名列中に複数回出現する2文字以上の語を構成す
る文字列を切り出す文字列切り出し部である。4は文字
列切り出し部3で切り出された切り出し文字列とその出
現頻度を記憶する切り出し文字列記憶部である。
の機能ブロック図である。図において、1は仮名列を入
力するための入力装置である。2は入力装置1から入力
された仮名列を記憶する入力仮名列記憶部である。3は
入力仮名列中に複数回出現する2文字以上の語を構成す
る文字列を切り出す文字列切り出し部である。4は文字
列切り出し部3で切り出された切り出し文字列とその出
現頻度を記憶する切り出し文字列記憶部である。
5は単語の読みと表記と品詞情報を記憶している辞書で
ある。6は切り出し文字列記憶部4に記憶された切り出
し文字列とその出現頻度を参照しながら単語の読み情報
を用いて辞書5を検索し単語の表記情報と品詞情報を取
り出す辞書検索部である。7は辞書検索部6の検索結果
を参照しながら入力仮名列記憶部2に記憶された入力仮
名列を仮名漢字混じり文に仮名漢字変換する仮名漢字変
換IIIn部である。8は仮名漢字変換制御部7より出
力された仮名漢字混じり文を記憶する出力文字列記憶部
である。9は出力文字列記憶部8に記憶された仮名漢字
混しり文を出力する出力装置である。
ある。6は切り出し文字列記憶部4に記憶された切り出
し文字列とその出現頻度を参照しながら単語の読み情報
を用いて辞書5を検索し単語の表記情報と品詞情報を取
り出す辞書検索部である。7は辞書検索部6の検索結果
を参照しながら入力仮名列記憶部2に記憶された入力仮
名列を仮名漢字混じり文に仮名漢字変換する仮名漢字変
換IIIn部である。8は仮名漢字変換制御部7より出
力された仮名漢字混じり文を記憶する出力文字列記憶部
である。9は出力文字列記憶部8に記憶された仮名漢字
混しり文を出力する出力装置である。
第2図は、本実施例の仮名漢字変換装置の装置ブロック
図である。図において、10は陰極線管を有する表示装
置(以下CRTと略称する。)、l1はキーボード(以
下KEYと略称する。〉、12は中央処理装置(以下C
PUと略称する。〉、l3はリードオンリーメモリ(以
下ROMと略称する。)、14はリードライトメモリ(
以下RWMと略称する。)である。第1図の入力装置l
はKEYIIにより、入力仮名列記憶部2と切り出し文
字列記憶部4と出力文字列記憶部8はRWM14により
、辞書5はROM13により、出力装置9はCRTIO
により、文字列切り出し部3と辞書検索部6と仮名漢字
変換制御部7はCPUI2がROM13とRWM14の
データのやりとりを行いながらROM13に記憶されて
いるプログラムを実行することにより、それぞれ実現さ
れている。
図である。図において、10は陰極線管を有する表示装
置(以下CRTと略称する。)、l1はキーボード(以
下KEYと略称する。〉、12は中央処理装置(以下C
PUと略称する。〉、l3はリードオンリーメモリ(以
下ROMと略称する。)、14はリードライトメモリ(
以下RWMと略称する。)である。第1図の入力装置l
はKEYIIにより、入力仮名列記憶部2と切り出し文
字列記憶部4と出力文字列記憶部8はRWM14により
、辞書5はROM13により、出力装置9はCRTIO
により、文字列切り出し部3と辞書検索部6と仮名漢字
変換制御部7はCPUI2がROM13とRWM14の
データのやりとりを行いながらROM13に記憶されて
いるプログラムを実行することにより、それぞれ実現さ
れている。
上記のように構威された仮名漢字変換装置について、以
下その動作を第10図のフローチャートに沿って説明す
る。まずステップAで入力装置1から仮名列が入力され
、入力仮名列記憶部2に記憶される。次に、ステップB
で文字列切り出し部3が入力仮名列中に複数回出現する
文字列を切り出し、切り出し文字列記憶部4に文字列切
り出し部3で切り出された切り出し文字列とその出現頻
度を記憶する。次に、ステップCで変換キーが押された
かのチェックを行う。変換キーが押されていなければス
テップCを繰り返し、変換キーが押されていればステッ
プDに進む。ステップDで、仮名漢字変換制御部7は、
辞書検索部6に切り出し文字列記憶部4の参照を指示し
、仮名異字変換の対象仮名文字を切り出す。
下その動作を第10図のフローチャートに沿って説明す
る。まずステップAで入力装置1から仮名列が入力され
、入力仮名列記憶部2に記憶される。次に、ステップB
で文字列切り出し部3が入力仮名列中に複数回出現する
文字列を切り出し、切り出し文字列記憶部4に文字列切
り出し部3で切り出された切り出し文字列とその出現頻
度を記憶する。次に、ステップCで変換キーが押された
かのチェックを行う。変換キーが押されていなければス
テップCを繰り返し、変換キーが押されていればステッ
プDに進む。ステップDで、仮名漢字変換制御部7は、
辞書検索部6に切り出し文字列記憶部4の参照を指示し
、仮名異字変換の対象仮名文字を切り出す。
詳しく述べるならば、入力仮名列記憶部2に記憶された
文字のうち、切り出し文字列記憶部4に文字が切り出さ
れた語で、ある語とある語を含んだ語とが存在する場合
に、それらの出現頻度を比較し、ある語の出現頻度の方
が多い場合、ある語を含んだ語をある語と他の語、例え
ば自立後と付属語との合成語として、仮名漢字変換対象
の仮名文字を扱う。その結果を用いて入力仮名列記憶部
2から文字列を切り出す。ステップEで、仮名漢字変換
制御部7は、辞書検索部6に辞書5の検索を指示する。
文字のうち、切り出し文字列記憶部4に文字が切り出さ
れた語で、ある語とある語を含んだ語とが存在する場合
に、それらの出現頻度を比較し、ある語の出現頻度の方
が多い場合、ある語を含んだ語をある語と他の語、例え
ば自立後と付属語との合成語として、仮名漢字変換対象
の仮名文字を扱う。その結果を用いて入力仮名列記憶部
2から文字列を切り出す。ステップEで、仮名漢字変換
制御部7は、辞書検索部6に辞書5の検索を指示する。
ステップFでは、ステップEの結果を用いて文字列を仮
名漢字変換する。ステップGでは、ステップFで変換さ
れた結果を出力文字列記憶部8に記憶し、出力装置9に
出力する。ステップHでは、全ての仮名列が変換された
かのチェックを行なう。変換されていない仮名列が残っ
ていれば、ステップDに戻り、全ての仮名列が変換され
ていれば、実行を終了する。
名漢字変換する。ステップGでは、ステップFで変換さ
れた結果を出力文字列記憶部8に記憶し、出力装置9に
出力する。ステップHでは、全ての仮名列が変換された
かのチェックを行なう。変換されていない仮名列が残っ
ていれば、ステップDに戻り、全ての仮名列が変換され
ていれば、実行を終了する。
切り出し文字列記憶部4に記憶された切り出し文字列と
その出現頻度を参照しながら単語の読み情報を用いて仮
名漢字変換する様子を第3図、第4図、第5図、第6図
、第7図、第8図、第9図を用いて説明する。第3図、
第4図は入力される仮名列の例を示す。入力装置1から
入力されて入力仮名列記憶部2に記憶された入力仮名列
から、文字列切り出し部3は複数回出現する文字列を切
り出し、切り出し文字列記憶部4に記憶する。第5図と
第6図はそれぞれ、第3図、第4図の仮名列を入力した
ときの切り出し文字列記憶部の状態を示す。図において
、15は切り出された文字列を記憶する切り出し文字列
記憶エリアである。16は切り出された文字列が入力仮
名列中に出現する頻度を記憶する出現頻度記憶エリアで
ある。第9図は、辞書の構造図を示す。図において、1
7は単語の読み情報を記憶する読み情報記憶エリアであ
る。18は単語の表記情報を記憶する表記情報記憶エリ
アである。19は単語の品詞情報を記憶する品詞情報記
憶エリアである。第5図に示されるように、第3図の入
力仮名列中の「かれ」の出現頻度は8回、「かれは」の
出現頻度は4回なで「かれ」の出現頻度の方が多いので
、文字列「かれは」は、自立語「かれ」と付属語「は」
に分けて処理を進める。このため、入力仮名列中に含ま
れる文字列「かれははしる」を仮名漢字変換した結果は
、「彼は走る」となる。このように仮名漢字変換された
結果を第7図に示す。
その出現頻度を参照しながら単語の読み情報を用いて仮
名漢字変換する様子を第3図、第4図、第5図、第6図
、第7図、第8図、第9図を用いて説明する。第3図、
第4図は入力される仮名列の例を示す。入力装置1から
入力されて入力仮名列記憶部2に記憶された入力仮名列
から、文字列切り出し部3は複数回出現する文字列を切
り出し、切り出し文字列記憶部4に記憶する。第5図と
第6図はそれぞれ、第3図、第4図の仮名列を入力した
ときの切り出し文字列記憶部の状態を示す。図において
、15は切り出された文字列を記憶する切り出し文字列
記憶エリアである。16は切り出された文字列が入力仮
名列中に出現する頻度を記憶する出現頻度記憶エリアで
ある。第9図は、辞書の構造図を示す。図において、1
7は単語の読み情報を記憶する読み情報記憶エリアであ
る。18は単語の表記情報を記憶する表記情報記憶エリ
アである。19は単語の品詞情報を記憶する品詞情報記
憶エリアである。第5図に示されるように、第3図の入
力仮名列中の「かれ」の出現頻度は8回、「かれは」の
出現頻度は4回なで「かれ」の出現頻度の方が多いので
、文字列「かれは」は、自立語「かれ」と付属語「は」
に分けて処理を進める。このため、入力仮名列中に含ま
れる文字列「かれははしる」を仮名漢字変換した結果は
、「彼は走る」となる。このように仮名漢字変換された
結果を第7図に示す。
しかし第6図に示されるように、第4図の入力仮名列中
の「かれ」の出現頻度は8回、「かれは」の出現頻度は
8回なので、文字列「かれは」は、自立語「かれは」で
あると判断して処理を進める。
の「かれ」の出現頻度は8回、「かれは」の出現頻度は
8回なので、文字列「かれは」は、自立語「かれは」で
あると判断して処理を進める。
このため、入力仮名列中に含まれる文字列「かれははし
る」を仮名漢字変換した結果は、「枯葉は知る」となる
。このように仮名順字変換された結果を第8図に示す。
る」を仮名漢字変換した結果は、「枯葉は知る」となる
。このように仮名順字変換された結果を第8図に示す。
発明の効果
本発明はユーザーが入力した仮名列中に複数回出現する
文字列を切り出す文字列切り出し部と、文字列切り出し
部で切り出された切り出し文字列とその出現頻度を記憶
する切り出し文字列記憶部と、切り出し文字列記憶部に
記憶された切り出し文字列とその出現頻度を参照しなが
ら単語の読み情報を用いて辞書を検索し単語の表記情報
と品詞情報を取り出す辞書検索部を備えたものであり、
単語をエンベディッドする単語を含む文字列を仮名漢字
変換する場合、単語が入力仮名列に出現する頻度から、
ユーザーが求める単語を得ることができ、迅速な文書の
作戒を行なうことができる。
文字列を切り出す文字列切り出し部と、文字列切り出し
部で切り出された切り出し文字列とその出現頻度を記憶
する切り出し文字列記憶部と、切り出し文字列記憶部に
記憶された切り出し文字列とその出現頻度を参照しなが
ら単語の読み情報を用いて辞書を検索し単語の表記情報
と品詞情報を取り出す辞書検索部を備えたものであり、
単語をエンベディッドする単語を含む文字列を仮名漢字
変換する場合、単語が入力仮名列に出現する頻度から、
ユーザーが求める単語を得ることができ、迅速な文書の
作戒を行なうことができる。
第1図は本発明の一実施例における仮名漢字変換装置の
機能ブロック図、第2図は同装置の装置ブロック図、第
3図及び第4図は入力文字列の例を示す図、第5図と第
6図は同装置の切り出し文字列記憶部の構造図、第7図
及び第8図は第3図及び第4図に示した入力文字列を仮
名漢字変換した結果を示す図、第9図は同装置の辞書の
構造図、第10図は同装置の動作を示すフローチャート
である。 第 1 図 1 1・・・入力装置、2・・・入力仮名列記憶部、3・・
・文字列切り出し部、4・・・切り出し文字列記憶部、
5・・・辞書、6・・・辞書検索部、7・・・仮名漢字
変換制御部、8・・・出力文字列記憶部、9・・・出力
装置、10・・・CRT,11・・・KEY,12・・
・CPU,13・・・ROM114・・・RWM,15
・・・切り出し文字列記憶エリア、16・・・出現頻度
記憶エリア、17・・・読み情報記憶エリア、18・・
・表記情報記憶エリア、19・・・品詞情報記憶エリア 第 2 閃 第 9 図 l7−一一舖み慣vfi記墳エリア I8−一一寝記情′@記情エリア l9−−一品詞惰?&Rt!!エリア 17 l8 19 !!b 周〕 臥日 餡ピ 侶周 」七 羽翠 :′磨 日羽
機能ブロック図、第2図は同装置の装置ブロック図、第
3図及び第4図は入力文字列の例を示す図、第5図と第
6図は同装置の切り出し文字列記憶部の構造図、第7図
及び第8図は第3図及び第4図に示した入力文字列を仮
名漢字変換した結果を示す図、第9図は同装置の辞書の
構造図、第10図は同装置の動作を示すフローチャート
である。 第 1 図 1 1・・・入力装置、2・・・入力仮名列記憶部、3・・
・文字列切り出し部、4・・・切り出し文字列記憶部、
5・・・辞書、6・・・辞書検索部、7・・・仮名漢字
変換制御部、8・・・出力文字列記憶部、9・・・出力
装置、10・・・CRT,11・・・KEY,12・・
・CPU,13・・・ROM114・・・RWM,15
・・・切り出し文字列記憶エリア、16・・・出現頻度
記憶エリア、17・・・読み情報記憶エリア、18・・
・表記情報記憶エリア、19・・・品詞情報記憶エリア 第 2 閃 第 9 図 l7−一一舖み慣vfi記墳エリア I8−一一寝記情′@記情エリア l9−−一品詞惰?&Rt!!エリア 17 l8 19 !!b 周〕 臥日 餡ピ 侶周 」七 羽翠 :′磨 日羽
Claims (1)
- 【特許請求の範囲】 仮名データを入力する入力手段と、 前記入力手段から入力された仮名データを記憶する仮名
データ記憶手段と、 前記仮名データ記憶手段に記憶された仮名データのうち
ある自立語と助詞との結合或は他の一つの自立語と決定
する可能性のある非確定仮名データの出現頻度である第
1頻度と前記非確定仮名データに含まれるある自立語の
出現頻度である第2頻度とを計数する出現頻度計数手段
と、 前記非確定仮名データを漢字データに変換する際、前記
出現頻度計数手段に計数された第1頻度と第2頻度とを
比較し、前記第2頻度の方が前記第1頻度より多い場合
は該非確定仮名データはある自立語と助詞との結合とし
て漢字データに変換する変換手段と、 を有することを特徴とする仮名漢字変換装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1165879A JPH0330047A (ja) | 1989-06-28 | 1989-06-28 | 仮名漢字変換装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1165879A JPH0330047A (ja) | 1989-06-28 | 1989-06-28 | 仮名漢字変換装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0330047A true JPH0330047A (ja) | 1991-02-08 |
Family
ID=15820717
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1165879A Pending JPH0330047A (ja) | 1989-06-28 | 1989-06-28 | 仮名漢字変換装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0330047A (ja) |
-
1989
- 1989-06-28 JP JP1165879A patent/JPH0330047A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7136803B2 (en) | Japanese virtual dictionary | |
| JPH11238051A (ja) | 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体 | |
| JPH0330047A (ja) | 仮名漢字変換装置 | |
| JPS58123129A (ja) | 仮名漢字変換装置 | |
| JP2621999B2 (ja) | 文書処理装置 | |
| JPH0130173B2 (ja) | ||
| JP2715419B2 (ja) | 翻訳装置 | |
| JPS6151265A (ja) | 日本語ワ−ドプロセツサ | |
| JPH1063651A (ja) | 中国語入力装置 | |
| JPH0410052A (ja) | 外国語電子辞書検索方法及び装置 | |
| JPS6172361A (ja) | かな漢字変換装置 | |
| JPH08272780A (ja) | 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法 | |
| JPS595335A (ja) | 日本語入力装置 | |
| JPS5998236A (ja) | 日本文入力装置 | |
| JP3048793B2 (ja) | 文字変換装置 | |
| JP3253311B2 (ja) | 言語処理装置および言語処理方法 | |
| JP2634596B2 (ja) | かな漢字変換装置 | |
| JPH07210571A (ja) | 単語検索処理装置及び単語検索処理方法 | |
| JPH0414168A (ja) | 文書作成装置 | |
| JPS60112175A (ja) | 仮名漢字変換装置における略称語変換方式 | |
| JPS60122429A (ja) | 単音節音声入力方式 | |
| JPH0610804B2 (ja) | かな漢字変換装置 | |
| JPS61223977A (ja) | 翻訳処理装置 | |
| JPH03296163A (ja) | 文書処理装置 | |
| JPH0546612A (ja) | 文章誤り検出装置 |