JPH0640328B2 - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH0640328B2
JPH0640328B2 JP1311115A JP31111589A JPH0640328B2 JP H0640328 B2 JPH0640328 B2 JP H0640328B2 JP 1311115 A JP1311115 A JP 1311115A JP 31111589 A JP31111589 A JP 31111589A JP H0640328 B2 JPH0640328 B2 JP H0640328B2
Authority
JP
Japan
Prior art keywords
candidate
priority
word
likelihood
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1311115A
Other languages
English (en)
Other versions
JPH03168864A (ja
Inventor
英一朗 戸島
雄二 小林
和世 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1311115A priority Critical patent/JPH0640328B2/ja
Publication of JPH03168864A publication Critical patent/JPH03168864A/ja
Publication of JPH0640328B2 publication Critical patent/JPH0640328B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は仮名漢字変換により漢字仮名混り文を入力する
文字処理装置に関する。
[従来の技術] 現在、日本ワードプロセッサなど文字処理装置は漢字仮
名混り文の入力を仮名漢字変換を使って行なうことが一
般的である。
仮名漢字変換は辞書を参照することにより、入力された
読み列を漢字に変換するものである。辞書においては各
単語に対して名詞、サ変名詞、副詞、形容詞、形容動詞
等の品詞情報が記述されており、仮名漢字変換は読み列
を解析して可能な文節候補を作成し、それらを組み合わ
せて変換候補を決定し、尤もらしい順に提示する。提示
された変換候補の中からオペレータが望む候補を選択す
る。
例えば、読み列「ぎゅうにゅうをぼくじょうでかう」に
対しては「牛乳を」「牛」「入を」「牧場で」「僕」
「上で」「情で」「上」「情」「出」「飼う」「買う」
「課」「蚊」「卯」などの文節候補が作成され、これら
を組み合わせた「牛乳を牧場で飼う」「牛乳を牧場で買
う」が変換候補として出力表示される。「買う」「飼
う」の中では、どちらの頻度が高いとは言えないので
「牛乳を牧場で買う」が第1候補としては変換されると
は限らない。
そこで、変換率を高めるために用例変換という手法が提
案されている。用例変換は、共起する単語のペア(用
例)を予め用例辞書中に登録しておき、変換時に用例辞
書を参照し、第1候補を用例辞書中の用例に従って変更
する手法である。例えば、「牛乳を/買う」というパタ
ーンを用例辞書に記憶しておき、「ぎゅうにゅうをかっ
た」という入力に対しては「牛乳を買った」が第1候補
として変換される様にする。
上記の例は単語と単語の関係を記述した個別用例の例で
あるが、意味分類との関係を記述した意味用例というも
のも提案されている。例えば、「〜にいった」という文
脈においては「〜」が場所を表わすときには「行った」
という表記が尤もらしく、「〜」が人間を表わすときに
は「言った」という表記が尤もらしい。この変換を正し
く行なうために「《人間》に/言う」「《場所》に/行
く」という意味用例を用例辞書にあらかじめ登録してお
くのである。なお、《人間》《場所》などは意味分類で
あり、辞書中の全ての単語には《人間》であるか《場
所》であるかそうでないかが記述されている。この仕組
みにより「市長に言った」「市役所に行った」などを正
しく変換することができる。
[発明が解決しようとしている課題] ところが、従来の用例変換の技術は、複数の用例が適用
可能なとき、すなわち、用例が競合するとき、どの用例
を優先すれば良いかは特に指定していなかった。わずか
に個別用例と意味用例が競合したときは個別用例を優先
するという指針が示されているぐらいであり、その他の
状況においてはどの用例を優先して良いかが分からなか
った。そのため、適当な用例を採用して、適当に第1候
補が決めていたため、微妙な状況での変換率が芳しくな
かった。
[課題を解決するための手段(及び作用)] 本発明の文字処理装置は、仮名文字列を入力するための
入力手段と、単語の読みと、表記及び意味分類とを対応
づけて記憶した単語辞書手段と、単語の表記と、当該単
語と併用される単語の表記もしくは意味分類とを対応づ
けて用例として、各用例に用例の優先度を付して記憶す
る用例辞書手段と、前記単語辞書手段を参照して、前記
入力手段より入力された仮名文字列を読みとする表記の
候補を作成する候補作成手段と、前記候補作成手段によ
り作成された同じ読みに対する表記候補に関して、該表
記候補と併用される単語の意味分類が該当する用例があ
る場合に、該用例の優先度と、該用例に該当する単語の
それぞれを含む文節間の文節数とを用いた演算により、
該用例の尤度を求め、該尤度に基づいて、前記表記候補
の表示優先度を決定する表示優先度決定手段と、該表示
優先度決定手段によって決定された表示優先度に基づい
て、前記候補作成手段により作成された表記候補を表示
する候補表示手段とを具えることにより、複数の用例が
競合したときには、用例自体の優先度と、その用例に該
当する単語のそれぞれを含む文節間の文節数とを用いた
演算により、表記候補の優先度を決定するようにしたも
のである。
[実施例] 以下図面を参照しながら本発明を詳細に説明する。
第1図は本発明の全体構成の一例である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送す
る。コントロールバスCBはマイクロプロセッサCPU
の制御の対象とする各構成要素のコントロール信号を転
送して印加する。データバスDBは各構成機器相互間の
データの転送を行なう。
つぎにROMは、読出し専用の固定メモリであり、第1
2図〜第19図につき後述するマイクロプロセッサCP
Uによる制御の手順を記憶させておく。
また、RAMは、1ワード16ビットの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。IBUFはキー入力
されたキーデータを記憶する入力バッファであり、OB
UFは仮名漢字変換された結果を一時的に記憶する出力
バッファである。DICは仮名漢字変換を行なうための
辞書である。YDICは単語ある違背未分類間の共起関
係を記述した用例辞書である。BCTBLは変換途中の
文節候補を記憶する文節候補テーブルである。TBUF
はテキストバッファであり、入力編集中のテキストデー
タが記憶される。DOBUFは同音語バッファであり、
テキストバッファTBUFに記憶される文字に同音語候
補が存在するときはその候補が記憶される。
KBはキーボードであって、アルファベットキー、ひら
かなキー、カタカナキー等の文字記号入力キー、及び、
変換キー、次候補キー、選択キー等の本文字処理装置に
対する各種機能を指示するための各種のファンクション
キーを備えている。
DISKは文書データを記憶するための外部記憶部であ
り、テキストバッファTBUF上に作成された文書の保
管を行ない、保管された文書はキーボードの指示によ
り、必要な時呼び出される。
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。後述するCRTコ
ントローラCRTCは、ここに蓄えられたアドレスに対
応する表示装置CRT上の位置にカーソルを表示する。
DBUFは表示用バッファメモリで、表示すべきデータ
のパターンを蓄える。テキストの内容を表示するときは
テキストバッファTBUFの内容に応じて表示パターン
がDBUFに作成されることにより、表示されることに
なる。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担
う。
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドット構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラプト信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶してある各種の制御信号を読出し、それらの制御
信号に従って各種の制御が行なわれる。
第2図は本発明装置による変換例を示した図である。図
中「」はそこで変換キーを打鍵するという意味であ
る。
「ぼくじょうでかう」と入力した場合は、第1候補とし
て「牧場で飼う」と変換される。これは用例辞書に「牧
場で/飼う」という用例が登録されているからである。
この様な用例変換の仕組みがないと、「かう」について
は「飼う」「買う」「交う」などの同音語があるので、
正しく変換されるとは限らなくなってしまう。
次の例は「ぎゅうにゅうをかう」と入力した場合であ
る。第1の例と同様に、用例辞書に「牛乳を/買う」と
いう用例が登録されているので、正しく「牛乳を買う」
と変換される。
第3の例は「ぎゅうにゅうをぼくじょうでかう」と入力
した場合の変換である。この場合「牧場で飼う」「牛乳
を買う」の2つの用例が適用可能であり、「かう」の部
分についてそれぞれが矛盾する変換を要求している。す
なわち、どちらの用例を信じるかによって「かう」の変
換結果が変わってしまう。本発明はこの様な場合のため
に、各用例に優先度情報を持っており、優先度の高い用
例に基づいて変換している。この場合、「牧場で/飼
う」という用例より「牛乳を/買う」という用例の優先
度が高く設定されており、より優先度の高い「牛乳を/
買う」用例が適用され、「牛乳を牧場で買う」と変換さ
れている。
第3図は本発明装置による用例の学習の例を示した図で
ある。3−1はまず初期画面を示したものである。3−
2は読み列「うしをぼくじょうでかう」を入力した時の
画面を示している。カーソルは入力読み列の次に表示さ
れている。ここで変換キーを打鍵すると3−3の画面に
なる。3−3では読み列「うしをぼくじょうでかう」が
「牛を牧場で飼う」と変換されている。この状況では
「牛を/飼う」「牧場で/飼う」「牛を/買う」という
用例が存在するが、最も優先度の高い「牛を/飼う」が
適用されて変換されている。オペレータは「牛を/買
う」という変換を望んだとして、次候補キーを打鍵する
と3−4の画面になる。ここで「かう」の変換候補が表
示される。第1候補は「飼う」であり、第2候補は「買
う」である。現在の候補は第2候補の「買う」であり、
2が反転表示している。ここで選択キーを打鍵すると、
3−5の画面になる。第2候補の「買う」が確定してテ
キストデータの中に格納され、同時に用例「牛を/買
う」が学習され、優先度が向上する。もう一度「うしを
ぼくじょうでかう」と入力すると3−6の画面になる。
更に変換キーを打鍵すると3−7の画面になり、今度は
用例「牛を/買う」が学習されているので、優先的に適
用され、第1候補として「牛を牧場で買う」が表示され
ている。
第4図は入力バッファIBUF、出力バッファOBUF
の構成を示した図である。
IBUF、OBUFともに同じ構成である。最初の2バ
イトは各バッファのサイズ情報であり、バッファに格納
されている文字数から1を減じたものを2倍した数値が
入る。入力バッファの末尾にある「」はそこで変換キ
ーが打鍵されたことを意味する。各文字は1文字2バイ
トで構成され、JIS X 0208コード等で格納される。
第5図は辞書DICの構成を示した図である。
「読み」「表記」「品詞」「単語尤度」「意味分類」の
フィールドから構成される。
「読み」には単語の読み、「表記」には単語の表記、
「品詞」には単語の品詞が格納される。
「単語尤度」は頻度情報等のその単語自体の尤もらしさ
を示す情報が1〜5の値で格納される。尤度値5は最も
尤もらしいという意味であり、値が小さくなるにつれ疑
わしいと解釈される。尤度値0は全く考えられないとい
うことを意味するので単語尤度の値としては存在しな
い。
「意味分類」にはその単語の意味分類が、《場所》《動
物》《食物》などと、一般には複数個記述される。ただ
し、意味分類はその単語が名詞の場合のみ記述される。
第6図は用例辞書YDICの構成を示した図である。
「第1単語」「第2単語」「助詞」「優先度」のフィー
ルドから構成される。
「第1単語」「第2単語」には共起する単語のペアを記
述する。もし、個別用例ではなくて意味用例であるとき
は単語の代わりに意味分類が記述される。
「助詞」には単語のペアを結び付ける助詞を記述する。
「優先度」にはその用例の尤もらしさを示す情報が1〜
5の値で格納される。尤度値5は最も尤もらしいという
意味であり、値が小さくなるにつれ疑わしいと解釈され
る。尤度値0は全く考えられないということを意味する
ので優先度の値としては存在しない。
すなわち、図中に示される用例は「牧場で/飼う」(優
先度4)「牛乳を/買う」(優先度5)「牛を/飼う」
(優先度5)「牛を/買う」(優先度4)「《動物》を
/飼う」(優先度2)となる。
なお、3番目の用例は意味用例であるので優先度が低く
押えてある。こうすることにより、「個別用例は意味用
例に優先する」という原則が自然と成り立つことにな
る。
第7図は文節候補テーブルBCTBLの概念を示した図
である。文節候補テーブルは入力読みの解析の結果、考
えられる文節候補をバイナリートリーで表現したもので
ある。図中、横線は子ポインタを意味し、縦線は弟ポイ
ンタを意味する。弟ポインタはある読み位置から始まる
他の文節候補(通常はより短い候補)をリンクし、子ポ
インタはその文節に引き続く文節候補をリンクする。
入力読み列「ぎゅうにゅうをぼくじょうでかう」の先頭
部分は「牛乳を」「牛」などの解釈が存在し、これらは
順に弟ポインタ(縦線)でリンクされている。
「牛乳を」に引き続く文節は「牧場で」が考えられ、子
ポインタでリンクされている。
この様な文節候補テーブルができ上がると、「牛乳を牧
場で買う」「牛乳を牧場で飼う」「牛乳を僕情で買う」
「牛入を牧場で飼う」「牛入を僕情出買う」などと文節
候補列を作成することは容易である。
第8図は文節候補テーブルBCTBLの具体的構成を示
した図である。
「自立語」は文節候補の自立語が存在する辞書上の先頭
位置へポインタを格納する。
「付属語列」は2バイトで構成され、文節候補の自立語
に引き続く付属語列を特定する領域である。先頭1バイ
トが入力バッファ上の付属語列先頭文字をインデックス
し、次の1バイトが入力バッファ上の付属語列の末尾文
字をインデックスする。例えば、第4図に示す入力バッ
ファのとき、「を」を表現するには第1バイトに12、
第2バイトに12を設定する。付属語列が存在しないと
きは図中で「φ」で示している。
「弟リンク」はその文節候補と同じ読み位置から始まる
別の文節候補をリンクする。
「子リンク」はその文節候補に引き続く文節候補をリン
クする。
なお、リンクは値0のときに終端することを意味する。
例えば、文節候補0(牛乳を)の弟リンクは50であ
り、文節候補50(牛)をリンクする。文節候補0(牛
乳を)の子リンクは100であり、文節候補100(牧
場で)をリンクする。文節候補100の子リンクは40
0であり、文節候補400(買う)をリンクする。文節
候補400の子リンクは0であり、そこで入力読みが終
端していることが分かる。
第9図はテキストバッファTBUFの構成を示した図で
ある。
テキストバッファは文字の羅列から構成され、各文字は
2バイトで構成される。各文字のMSBは同音語フラグ
であり、0は通常文字、1が同音語を意味する。残りの
15ビットは通常文字のときは文字コードを表現し、同
音語のときは同音語番号を表現する。文字コードは例え
ば、JIS X 0208コードを使用する。同音語番号は第10
図に示す同音語バッファDOBUF上のどの同音語であ
るかを示す番号である。
第10図は同音語バッファDOBUFの構成を示した図
である。各同音語には同音語番号が付いており、それに
よって識別される。
各同音語は「読み」「候補総数」「現候補番号」「第i
候補情報」からなる。
「読み」はその同音語の読みを格納する。
「候補総数」はその同音に含まれる候補の総数を格納す
る。
「現候補番号」はその同音語の現在表示されている候補
番号が格納される。変換直後初値に第1候補が表示され
るから「1」が格納される。
「第i候補情報」は各候補の表記、及び、その候補に対
して適用された用例の番号が格納される。通常、その候
補に適用される用例は複数個存在するので、適用用例番
号には複数個の番号が入る。
第11図は文尤度の計算例を示した図である。文尤度は
文節候補列である文の尤もらしさを表現するものであ
り、値が大きいほど尤もらしいことを意味する。
文尤度は、文節尤度の和、文節間尤度の和、用例尤度の
和を全て加算することにより計算される。
文節尤度は各文節候補の尤もらしさを表現するものであ
り、値が大きいほど尤もらしいことを意味する。文節尤
度はその文節の自立語の辞書DICに記載されている単
語尤度が使用される。
文節間尤度は隣接する文節候補間の接続の尤もらしさを
表現するものであり、本実施例では値−20で固定とす
る。その文がn文節で構成されていたとすると、文節間
は(n−1)あるので、文節間尤度の和は必ず−20
(n−1)となる。
用例尤度は各文節間に適用されている、用例の一つ一つ
について文尤度に加算される。用例尤度は各用例に記述
されている優先度の4倍から、その用例を適用する際に
飛び越す文節の数の2倍を減じたものとなる。
第11図によると、「牛乳を/牧場で/飼う」の文尤度
は−18であり、「牛乳を/牧場で/買う」の文尤度は
−16であるので、文尤度の値の大きい例2の「牛乳を
/牧場で/買う」が第1位に変換されることが分かる。
この様に正しく変換される理由は、例1に適用される用
例「牧場で/飼う」の優先度は4であるのに対し、例2
に適用される用例「牛乳を/買う」の優先度は5であ
り、優先度の高い用例が適用された文ほど有利に変換さ
れるからからである。
上述の実施例の動作をフローに従って説明する。
第12図はキー入力を取り込み、処理を行なう部分のフ
ローチャートである。
ステップ12−1はキーボードからのデータを取り込む
処理である。ステップ12−2で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。
変換キーであったときはステップ12−3に分岐し、ス
テップ12−3において第13図に詳述するように仮名
漢字変換の変換処理が行なわれる。次候補キーであった
ときはステップ12−4において第18図に詳述する次
候補処理を行なう。選択キーであったときはステップ1
2−5において第19図に詳述する選択処理を行なう。
その他のキーのときはステップ12−6に分岐し、挿
入、削除等の通常の文字処理装置において行なわれるそ
の他の処理が行なわれる。その後ステップ12−1に分
岐する。
第13図はステップ12−3の「変換処理」を詳細化し
たフローチャートである。
ステップ13−1において、第14図に詳述する文節候
補作成処理を行ない、文節候補テーブルBCTBLを作
成する。
ステップ13−2において、第15図に詳述する第1候
補決定処理を行なう。
ステップ13−3において、決定された第1候補に基づ
いて変換結果を作成し、出力する。
第14図はステップ13−1の「文節候補作成処理」を
詳細化したフローチャートである。
ステップ14−1において、入力バッファインデックス
i、文節候補テーブルインデックスjを0に初期設定す
る。
ステップ14−2においてiの示す入力バッファ中の読
みに基づき、辞書をサーチし、単語候補を求める。
ステップ14−3において、見つかった単語候補に対し
て接続する付属語列を解析する形態素解析処理を行な
う。この結果、文節候補が得られる。
ステップ14−4において得られた文節候補を文節候補
テーブルに格納する。格納する時はj+1番目のエント
リーに格納する。また、必要な情報を設定する。例え
ば、この文節候補を子、あるいは弟とする文節候補につ
いては、子リンク、弟リンクを設定する。格納後jの値
をカウントアップする。
ステップ14−5において文節候補テーブルからターミ
ネートしていない文節候補、すなわち、子リンクがまだ
決まっていない文節候補を見つけその次の読み位置をi
に代入する。
ステップ14−6において、全ての文節候補の子リンク
が決定しているかどうかを判定し、決定していないもの
があればステップ14−2に分岐する。そうでなければ
リターンする。
第15図はステップ13−2の「第1候補決定処理」を
詳細化したフローチャートである。
ステップ15−1において、最尤文尤度を処理上許され
る最小値、例えば、−32767に初期設定する。
ステップ15−2において文節候補テーブルより文節候
補列を1つ取り出す。
ステップ15−3において、第16図に詳述するように
その取り出された文節候補列に適用可能な用例を検索
し、用例尤度の和である「用例尤度和」を算出する。
ステップ15−4において、文節候補列の文尤度を第1
1図に示す様に算出する。
ステップ15−5において、算出された文尤度が最尤文
尤度より尤もらしいか、具体的には大きいかを判定し、
大きいときはステップ15−6において最尤文尤度を算
出された文尤度に更新する。また、ステップ15−7に
おいて現在の文節候補列を最尤文尤度に対応した文節候
補列として記憶する。
ステップ15−8において文節候補テーブルから別の文
節候補列が取り出せるかどうかを判定し、取り出せると
きはステップ15−2に分岐する。そうでないときはリ
ターンする。
これにより、最尤文尤度を算出するもとになった文節候
補列が第1候補として決定される。
第16図はステップ15−3の「用例尤度和の算出」を
詳細化したフローチャートである。
ステップ16−1において、用例尤度和をまず0に初期
設定する。
ステップ16−2において、文節候補列から1文節を着
目文節として取り出す。以下の処理ではこの着目文節に
関係する用例の尤度を求めることになる。
ステップ16−3において最尤用例尤度を0に初期設定
する。
ステップ16−4において、着目文節とペアになる文節
を文節候補列から取り出す。
ステップ16−5において、着目文節のペア文節を取り
出すことができなかったときは、それ以上の着目文節の
処理を諦め、ステップ16−8に分岐する。
ステップ16−6において、第17図に詳述するよう
に、着目文節とペア文節の間の用例が適用されているか
どうかを調べ、その適用状況に応じて用例尤度を設定す
る。
ステップ16−7において、求まった用例尤度が最尤用
例尤度より尤もらしい(すなわち大きいか)かどうかを
調べ、尤もらしければ(すなわち大きければ)、用例尤
度の値を最尤用例尤度に代入する。その後ステップ16
−4に分岐し、別のペアについて用例尤度を求める。
ステップ16−8において、着目文節の処理が終ったの
で、次の着目文節の処理に移るが、未処理の文節が残っ
ているかどうか判定する。残っていないときはそのまま
リターンするが、残っているときはステップ16−9に
分岐し、前回求まった最尤用例尤度を用例尤度和に加算
する。その後、ステップ16−2に分岐し、次の着目文
節を取り出す。
第17図はステップ16−6の「用例尤度の値設定」を
詳細化したフローチャートである。
ステップ17−1において、着目文節とペア文節の2文
節間に適用される用例があるかどうかを判断する。
適用用例がないときはステップ17−2に分岐し、用例
尤度に0を代入し、リターンする。
適用用例が存在するときはステップ17−3に分岐し、
用例尤度としてその用例の優先度に4を乗じたものを代
入する。
ステップ17−4において2文節間の距離、すなわち、
飛び越す文節の数を求め、その値に2を乗じて用例尤度
から減算する。もし、隣接する2文節であれば、飛び越
す文節は0であるので、用例尤度から0を減じることに
なる。
ステップ17−5において上記計算された用例尤度の値
が負になっていないかどうか判定し、負のときはステッ
プ17−6において0になるように補正し、リターンす
る。負でないときは値をいじらずにそのままリターンす
る。
第18図はステップ12−4の「次候補処理」を詳細化
したフローチャートである。
ステップ18−1において、次候補を見るべき同音語の
同音語番号をテキストバッファTBUFより求める。
ステップ18−2において、同音語番号から同音語バッ
ファの位置を求めて、現候補番号をカウントアップす
る。
ステップ18−3において、候補一覧を表示する。
第19図はステップ12−5の「選択処理」を詳細化し
たフローチャートである。
ステップ19−1において、選択すべき同音語の同音語
番号をテキストバッファTBUFより求める。
ステップ19−2において、同音語番号から同音語バッ
ファの位置を求めて、現候補番号の示す候補情報から表
記を取り出し、テキストバッファTBUFに確定文字と
して設定する。
ステップ19−3において、同様に、現候補番号の示す
候補情報から適用用例番号を求めその用例の優先度をカ
ウントアップする。
ステップ19−4において、同様に、第1候補の示す候
補情報から適用用例番号を求めその用例の優先度をカウ
ントダウンする。
[他の実施例] 以上の説明において、用例辞書は共起する2単語(ある
いは分類)のペアであるとして説明したが、3つ組ある
いは更に一般的にn個組であっても同様に処理すること
ができる。
また、尤度の計算は単に例を示しただけであり、用例に
付与された優先度を尤度計算の過程で考慮する様に構成
すれば、別の計算方法であっても特に本発明の趣旨を損
なうものではない。
また、用例の学習の仕組みは各用例に記述された優先度
を直接操作するように構成している。しかし、この方式
以外に、各用例に対応した学習ビットを持ち、学習ビッ
トを操作するように処理しても、特に本発明の趣旨を損
なうものではない。
[発明の効果] 以上説明したように、本発明によれば、表記候補の決定
において、複数の意味用例が適用可能な場合に、意味用
例自体の優先度と、用例間に存在する文節数とを用いた
演算により用例の尤度を求め、この尤度に基づいて、表
記候補の優先度を決定するようにしたので、より適切な
候補へ優先的に変換を行うことができるという効果があ
る。
また、意味分類の優先度情報を学習により変更すること
ができるので、単語を特殊な意味に使用するオペレータ
にとっても、自分の好みの変換に改良することができ
る。
これにより変換率の高い、快適な文字処理装置を実現す
ることができる。
【図面の簡単な説明】
第1図は本発明の全体構成のブロック図、 第2図は本発明における仮名漢字変換の変換例を示した
図、 第3図は本発明における用例の優先度の学習効果を示し
た図、 第4図は本発明における入力バッファIBUFと出力バ
ッファOBUFの構成を示した図、 第5図は本発明における仮名漢字変換用辞書DICの構
成を示した図、 第6図は本発明における用例辞書YDICの構成を示し
た図、 第7図は本発明における文節候補テーブルBCTBLの
記憶内容を概念的に示した図、 第8図は本発明における文節候補テーブルBCTBLの
構成を示した図、 第9図は本発明におけるテキストバッファTBUFの構
成を示した図、 第10図は本発明における同音語バッファDOBUFの
構成を示した図、 第11図は本発明における尤度計算の方式を示した図、 第12図〜第19図は本発明文字処理装置の動作を示す
フローチャート。 DISK……外部記憶部 CPU……マイクロプロセッサ ROM……読出し専用メモリ RAM……ランダムアクセスメモリ IBUF……入力バッファ OBUF……出力バッファ DIC……仮名漢字変換用辞書 YDIC……用例辞書 BCTBL……文節候補テーブル TBUF……テキストバッファ DOBUF……同音語バッファ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】仮名文字列を入力するための入力手段と、 単語の読みと、表記及び意味分類とを対応づけて記憶し
    た単語辞書手段と、 単語の表記と、当該単語と併用される単語の表記もしく
    は意味分類とを対応づけて用例として、各用例に用例の
    優先度を付して記憶する用例辞書手段と、 前記単語辞書手段を参照して、前記入力手段より入力さ
    れた仮名文字列を読みとする表記の候補を作成する候補
    作成手段と、 前記候補作成手段により作成された同じ読みに対する表
    記候補に関して、該表記候補と併用される単語の意味分
    類が該当する用例がある場合に、該用例の優先度と、該
    用例に該当する単語のそれぞれを含む文節間の文節数と
    を用いた演算により、該用例の尤度を求め、該尤度に基
    づいて、前記表記候補の表示優先度を決定する表示優先
    度決定手段と、 該表示優先度決定手段によって決定された表示優先度に
    基づいて、前記候補作成手段により作成された表記候補
    を表示する候補表示手段とを有することを特徴とする文
    字処理装置。
  2. 【請求項2】前記候補表示手段により表示される候補の
    1つを選択する選択手段と、 該選択手段により、前記候補表示手段が最優先に表示し
    た候補以外の候補を選択したときに、該選択した候補ま
    たは前記最優先に表示した候補に係わる用例に関して、
    前記用例辞書手段に記憶された用例の優先度を更新する
    優先度更新手段とを有することを特徴とする請求項1記
    載の文字処理装置。
JP1311115A 1989-11-29 1989-11-29 文字処理装置 Expired - Lifetime JPH0640328B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1311115A JPH0640328B2 (ja) 1989-11-29 1989-11-29 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1311115A JPH0640328B2 (ja) 1989-11-29 1989-11-29 文字処理装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP13053395A Division JP3236190B2 (ja) 1995-05-29 1995-05-29 文字処理装置及びその方法

Publications (2)

Publication Number Publication Date
JPH03168864A JPH03168864A (ja) 1991-07-22
JPH0640328B2 true JPH0640328B2 (ja) 1994-05-25

Family

ID=18013324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1311115A Expired - Lifetime JPH0640328B2 (ja) 1989-11-29 1989-11-29 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0640328B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0614377B2 (ja) * 1989-12-05 1994-02-23 株式会社エイ・ティ・アール自動翻訳電話研究所 文節候補選択装置
JP2837010B2 (ja) * 1991-12-26 1998-12-14 シャープ株式会社 仮名漢字変換処理装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0769914B2 (ja) * 1987-03-09 1995-07-31 日本電信電話株式会社 日本語文節間係り受け解析装置
JPH07104861B2 (ja) * 1987-12-17 1995-11-13 三洋電機株式会社 かな漢字変換装置及びその方法
JPH01228058A (ja) * 1988-03-08 1989-09-12 Ricoh Co Ltd かな漢字変換装置

Also Published As

Publication number Publication date
JPH03168864A (ja) 1991-07-22

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
CN100593167C (zh) 语言输入用户界面
CN100492350C (zh) 以无模式输入将一种文本形式转换成另一种文本形式的语言输入体系结构
US20030040900A1 (en) Automatic or semiautomatic translation system and method with post-editing for the correction of errors
JPH096787A (ja) 訳振り機械翻訳装置
KR900000608B1 (ko) 번역 표시 장치
JPH0640328B2 (ja) 文字処理装置
JP3236190B2 (ja) 文字処理装置及びその方法
KR900008402B1 (ko) 기계번역장치
JP2698458B2 (ja) 文字処理装置
JPH0638260B2 (ja) 文字処理装置及びその方法
JP2714238B2 (ja) 文字処理装置
JP2675912B2 (ja) 文字処理装置
JPH0628057B2 (ja) 文字処理装置
JPH0697454B2 (ja) 文字処理装置
JPH07105217A (ja) 入力文字自動補正装置
JP2714239B2 (ja) 文字処理装置
JP2899087B2 (ja) 文字処理装置
JP3278148B2 (ja) 文字処理装置及びその方法
JPH08161335A (ja) 機械翻訳装置
JPH01204174A (ja) 文字処理装置
JPH0414381B2 (ja)
JPS6172359A (ja) べた書きかな漢字変換における文字修正方式
JPH0442350A (ja) 文字処理装置
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090525

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100525

Year of fee payment: 16

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100525

Year of fee payment: 16