JPH0628057B2 - 文字処理装置 - Google Patents
文字処理装置Info
- Publication number
- JPH0628057B2 JPH0628057B2 JP1320185A JP32018589A JPH0628057B2 JP H0628057 B2 JPH0628057 B2 JP H0628057B2 JP 1320185 A JP1320185 A JP 1320185A JP 32018589 A JP32018589 A JP 32018589A JP H0628057 B2 JPH0628057 B2 JP H0628057B2
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- word
- likelihood
- phrase
- notation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】 [産業上の利用分野] 本発明は仮名漢字変換により漢字仮名混り文を入力する
文字処理装置に関する。
文字処理装置に関する。
[従来の技術] 現在、日本ワードプロセッサなどの文字処理装置は漢字
仮名混り文の入力を仮名漢字変換を使って行なうことが
一般的である。
仮名混り文の入力を仮名漢字変換を使って行なうことが
一般的である。
仮名漢字変換は辞書を参照することにより、入力された
読み列を漢字に変換するものである。辞書においては各
単語に対して名詞、サ変名詞、副詞、形容詞、形容動詞
等の品詞情報が記述されており、仮名漢字変換は読み列
を解析して可能な文節候補を作成し、それらを組み合わ
せて変換候補を決定し、尤もらしい順に提示する。提示
された変換候補の中からオペレータが望む候補を選択す
る。
読み列を漢字に変換するものである。辞書においては各
単語に対して名詞、サ変名詞、副詞、形容詞、形容動詞
等の品詞情報が記述されており、仮名漢字変換は読み列
を解析して可能な文節候補を作成し、それらを組み合わ
せて変換候補を決定し、尤もらしい順に提示する。提示
された変換候補の中からオペレータが望む候補を選択す
る。
例えば、読み列「いいんかいにはかった」に対しては
「胃」「委員」「委員会」「委員会に」「印」「印か」
「引火」「課」「会」「会に」「胃」「胃に」「胃に
は」「二」「二は」「葉」「計った」「図った」「諮っ
た」「買った」などの文節候補が作成され、これらを組
み合わせた「委員会に計った」「委員会に図った」「委
員会に諮った」がこの順で変換候補として出力表示され
る。「計る」「図る」「諮る」の中では、一般に「計
る」「図る」の方が「諮る」よりも頻度が高いので「委
員会に諮った」はまず第1候補としては変換されない。
「胃」「委員」「委員会」「委員会に」「印」「印か」
「引火」「課」「会」「会に」「胃」「胃に」「胃に
は」「二」「二は」「葉」「計った」「図った」「諮っ
た」「買った」などの文節候補が作成され、これらを組
み合わせた「委員会に計った」「委員会に図った」「委
員会に諮った」がこの順で変換候補として出力表示され
る。「計る」「図る」「諮る」の中では、一般に「計
る」「図る」の方が「諮る」よりも頻度が高いので「委
員会に諮った」はまず第1候補としては変換されない。
そこで、変換率を高めるために用例変換という手法が提
案されている。用例変換は、共起する単語のペア(用
例)を予め用例辞書中に登録しておき、変換時に用例辞
書を参照し、第1候補を用例辞書中の用例に従って変更
する手法である。例えば、「委員会に/諮る」というパ
ターンを用例辞書に記憶しておき、「いいんかいにはか
った」という入力に対しては「委員会に諮った」が第1
候補として変換される様にする。
案されている。用例変換は、共起する単語のペア(用
例)を予め用例辞書中に登録しておき、変換時に用例辞
書を参照し、第1候補を用例辞書中の用例に従って変更
する手法である。例えば、「委員会に/諮る」というパ
ターンを用例辞書に記憶しておき、「いいんかいにはか
った」という入力に対しては「委員会に諮った」が第1
候補として変換される様にする。
上記の例は単語と単語の関係を記述した個別用例の例で
あるが、意味分類との関係を記述した意味用例というも
のも提案されている。例えば、「〜にいった」という文
脈においては「〜」が場所を表わすときには「行った」
という表記が尤もらしく、「〜」が人間を表わすときに
は「言った」という表記が尤もらしい。この変換を正し
く行なうために「《人間》に/言う」「《場所》に/行
く」という意味用例を用例辞書にあらかじめ登録してお
くのである。なお、《人間》《場所》などは意味分類で
あり、辞書中の全ての単語には《人間》であるか《場
所》であるかそうでないかが記述されている。この仕組
みにより「市長に言った」「市役所に行った」などを正
しく変換することができる。
あるが、意味分類との関係を記述した意味用例というも
のも提案されている。例えば、「〜にいった」という文
脈においては「〜」が場所を表わすときには「行った」
という表記が尤もらしく、「〜」が人間を表わすときに
は「言った」という表記が尤もらしい。この変換を正し
く行なうために「《人間》に/言う」「《場所》に/行
く」という意味用例を用例辞書にあらかじめ登録してお
くのである。なお、《人間》《場所》などは意味分類で
あり、辞書中の全ての単語には《人間》であるか《場
所》であるかそうでないかが記述されている。この仕組
みにより「市長に言った」「市役所に行った」などを正
しく変換することができる。
[発明が解決しようとしている課題] ところが、従来の用例変換の技術は、複数の用例が適用
可能なとき、すなわち、用例が競合するとき、どちらの
用例を優先すれば良いかは特に指定していなかった。わ
ずかに個別用例と意味用例が競合したときは個別用例を
優先するという指針が示されているぐらいであり、その
他の状況においてはどの用例を優先して良いかが分から
なかった。そのため、適当な用例を採用して、適当に第
1候補が決めていたため、微妙な状況での変換率が芳し
くなかった。
可能なとき、すなわち、用例が競合するとき、どちらの
用例を優先すれば良いかは特に指定していなかった。わ
ずかに個別用例と意味用例が競合したときは個別用例を
優先するという指針が示されているぐらいであり、その
他の状況においてはどの用例を優先して良いかが分から
なかった。そのため、適当な用例を採用して、適当に第
1候補が決めていたため、微妙な状況での変換率が芳し
くなかった。
[課題を解決するための手段(及び作用)] 上記課題を解決するために、本発明の文字処理装置は、
仮名文字列を入力するための入力手段と、単語の読み
と、表記及び意味分類とを対応づけて記憶した単語辞書
手段と、単語の表記と、当該単語と併用される単語の表
記もしくは意味分類とを対応づけて用例として記憶する
用例辞書手段と、前記単語辞書手段を参照して、前記入
力手段より入力された仮名文字列を読みとする表記の候
補を作成する候補作成手段と、前記候補作成手段により
作成された同じ読みに対する表記の候補について、前記
用例辞書手段に記憶された用例に、併用される単語とと
もに該当する候補を優先し、該当する候補が複数存在す
るときには、当該候補と前記併用される単語との距離が
文中で近い用例に該当する候補を優先するようにして、
表記の候補の表示優先度を決定する表示優先度決定手段
と、該表示優先度決定手段によって決定された表示優先
度に基づいて、前記候補作成手段により作成された表記
の候補を表示する候補表示手段とを具える。
仮名文字列を入力するための入力手段と、単語の読み
と、表記及び意味分類とを対応づけて記憶した単語辞書
手段と、単語の表記と、当該単語と併用される単語の表
記もしくは意味分類とを対応づけて用例として記憶する
用例辞書手段と、前記単語辞書手段を参照して、前記入
力手段より入力された仮名文字列を読みとする表記の候
補を作成する候補作成手段と、前記候補作成手段により
作成された同じ読みに対する表記の候補について、前記
用例辞書手段に記憶された用例に、併用される単語とと
もに該当する候補を優先し、該当する候補が複数存在す
るときには、当該候補と前記併用される単語との距離が
文中で近い用例に該当する候補を優先するようにして、
表記の候補の表示優先度を決定する表示優先度決定手段
と、該表示優先度決定手段によって決定された表示優先
度に基づいて、前記候補作成手段により作成された表記
の候補を表示する候補表示手段とを具える。
[実施例] 以下図面を参照しながら本発明を詳細に説明する。
第1図は本発明の全体構成の一例である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送す
る。コントロールバスCBはマイクロプロセッサCPU
の制御の対象とする各構成要素のコントロール信号を転
送して印加する。データバスDBは各構成機器相互間の
データの転送を行なう。
対象とする構成要素を指示するアドレス信号を転送す
る。コントロールバスCBはマイクロプロセッサCPU
の制御の対象とする各構成要素のコントロール信号を転
送して印加する。データバスDBは各構成機器相互間の
データの転送を行なう。
つぎにROMは、読出し専用の固定メモリであり、第1
0図〜第15図につき後述するマイクロプロセッサCP
Uによる制御の手順を記憶させておく。
0図〜第15図につき後述するマイクロプロセッサCP
Uによる制御の手順を記憶させておく。
また、RAMは、1ワード16ビットの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。IBUFはキー入力
されたキーデータを記憶する入力バッファであり、OB
UFは仮名漢字変換された結果を一時的に記憶する出力
バッファである。DICは仮名漢字変換を行なうための
辞書である。YDICは単語ある違背未分類間の共起関
係を記述した用例辞書である。PRTBLは意味分類間
の優先関係を記述した意味分類優先度テーブルである。
BCTBLは変換途中の文節候補を記憶する文節候補テ
ーブルである。
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。IBUFはキー入力
されたキーデータを記憶する入力バッファであり、OB
UFは仮名漢字変換された結果を一時的に記憶する出力
バッファである。DICは仮名漢字変換を行なうための
辞書である。YDICは単語ある違背未分類間の共起関
係を記述した用例辞書である。PRTBLは意味分類間
の優先関係を記述した意味分類優先度テーブルである。
BCTBLは変換途中の文節候補を記憶する文節候補テ
ーブルである。
KBはキーボードであって、アルファベットキー、ひら
かなキー、カタカナキー等の文字記号入力キー、及び、
変換キー等の本文字処理装置に対する各種機能を指示す
るための各種のファンクションキーを備えている。
かなキー、カタカナキー等の文字記号入力キー、及び、
変換キー等の本文字処理装置に対する各種機能を指示す
るための各種のファンクションキーを備えている。
DISKは文書データを記憶するための外部記憶部であ
り、テキストバッファ上に作成された文書の保管を行な
い、保管された文書はキーボードの指示により、必要な
時呼び出される。
り、テキストバッファ上に作成された文書の保管を行な
い、保管された文書はキーボードの指示により、必要な
時呼び出される。
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。後述するCRTコ
ントローラCRTCは、ここに蓄えられたアドレスに対
応する表示装置CRT上の位置にカーソルを表示する。
ルレジスタの内容を読み書きできる。後述するCRTコ
ントローラCRTCは、ここに蓄えられたアドレスに対
応する表示装置CRT上の位置にカーソルを表示する。
DBUFは表示用バッファメモリで、表示すべきデータ
を蓄える。
を蓄える。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担
う。
に蓄えられた内容を表示器CRTに表示する役割を担
う。
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドット構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。
表示装置CRTにおけるドット構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。
装置CRTに表示する文字、記号のパターンを記憶する
ものである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラプト信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶してある各種の制御信号を読出し、それらの制御
信号に従って各種の制御が行なわれる。
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラプト信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶してある各種の制御信号を読出し、それらの制御
信号に従って各種の制御が行なわれる。
第2図は本発明装置による変換例を示した図である。図
中「」はそこで変換キーを打鍵するという意味であ
る。
中「」はそこで変換キーを打鍵するという意味であ
る。
「いいんかいにはかる」と入力した場合は、第1候補と
して「委員会に諮る」と変換される。これは用例辞書に
「委員会に/諮る」という用例が登録されているからで
ある。この様な用例変換の仕組みがないと、「はかる」
については「計る」「図る」「謀る」などの同音語があ
るので、正しく変換されるとは限らなくなってしまう。
して「委員会に諮る」と変換される。これは用例辞書に
「委員会に/諮る」という用例が登録されているからで
ある。この様な用例変換の仕組みがないと、「はかる」
については「計る」「図る」「謀る」などの同音語があ
るので、正しく変換されるとは限らなくなってしまう。
次の例は「かいけつをはかる」と入力した場合である。
第1の例と同様に、用例辞書に「解決を/図る」という
用例が登録されているので、正しく「解決を図る」と変
換される。
第1の例と同様に、用例辞書に「解決を/図る」という
用例が登録されているので、正しく「解決を図る」と変
換される。
第3の例は「いいんかいにかいけつをはかるようによう
せいした」と入力した場合の変換である。この場合「委
員会に諮る」「解決を図る」の2つの用例が適用可能で
あり、「はかる」の部分についてそれぞれが矛盾する変
換を要求している。すなわち、どちらの用例を信じるか
によって「はかる」の変換結果が変わってしまう。本発
明はこの様な場合、文節間の距離の短い方の用例に基づ
いて変換している。すなわち、「委員会に/諮る」とい
う用例は「解決を」という1文節をまたいで適用される
が、「解決を/図る」の用例は連続する2文節間に適用
できる。従って、より距離の短い「解決を/図る」の用
例を採用し、「委員会に解決を図るように要請した」と
変換される。
せいした」と入力した場合の変換である。この場合「委
員会に諮る」「解決を図る」の2つの用例が適用可能で
あり、「はかる」の部分についてそれぞれが矛盾する変
換を要求している。すなわち、どちらの用例を信じるか
によって「はかる」の変換結果が変わってしまう。本発
明はこの様な場合、文節間の距離の短い方の用例に基づ
いて変換している。すなわち、「委員会に/諮る」とい
う用例は「解決を」という1文節をまたいで適用される
が、「解決を/図る」の用例は連続する2文節間に適用
できる。従って、より距離の短い「解決を/図る」の用
例を採用し、「委員会に解決を図るように要請した」と
変換される。
第3図は入力バッファIBUF、出力バッファOBUF
の構成を示した図である。
の構成を示した図である。
IBUF、OBUFともに同じ構成である。最初の2バ
イトは各バッファのサイズ情報であり、バッファに格納
されている文字数から1を減じたものを2倍した数値が
入る。入力バッファの末尾にある「」はそこで変換キ
ーが打鍵されたことを意味する。各文字は1文字2バイ
トで構成され、JIS X 0208コード等で格納される。
イトは各バッファのサイズ情報であり、バッファに格納
されている文字数から1を減じたものを2倍した数値が
入る。入力バッファの末尾にある「」はそこで変換キ
ーが打鍵されたことを意味する。各文字は1文字2バイ
トで構成され、JIS X 0208コード等で格納される。
第4図は辞書DICの構成を示した図である。「読み」
「表記」「品詞」「単語尤度」「意味分類」のフィール
ドから構成される。
「表記」「品詞」「単語尤度」「意味分類」のフィール
ドから構成される。
「読み」には単語の読み、「表記」には単語の表記、
「品詞」には単語の品詞が格納される。
「品詞」には単語の品詞が格納される。
「単語尤度」は頻度情報等のその単語自体の尤もらしさ
を示す情報が1〜5の値で格納される。尤度値5は最も
尤もらしいという意味であり、値が小さくなるにつれ疑
わしいと解釈される。尤度値0は全く考えられないとい
うことを意味するので単語尤度の値としては存在しな
い。
を示す情報が1〜5の値で格納される。尤度値5は最も
尤もらしいという意味であり、値が小さくなるにつれ疑
わしいと解釈される。尤度値0は全く考えられないとい
うことを意味するので単語尤度の値としては存在しな
い。
「意味分類」にはその単語の意味分類が《組織》《動
物》《食物》などと、一般には複数個記述される。ただ
し、意味分類はその単語が名詞の場合のみ記述される。
物》《食物》などと、一般には複数個記述される。ただ
し、意味分類はその単語が名詞の場合のみ記述される。
第5図は用例辞書YDICの構成を示した図である。
「第1単語」「第2単語」「助詞」のフィールドから構
成される。
「第1単語」「第2単語」「助詞」のフィールドから構
成される。
「第1単語」「第2単語」には共起する単語のペアを記
述する。もし、個別用例ではなくて意味用例であるとき
は単語の代わりに意味分類が記述される。
述する。もし、個別用例ではなくて意味用例であるとき
は単語の代わりに意味分類が記述される。
「助詞」には単語のペアを結付ける助詞を記述する。
すなわち、図中に示される用例は「委員会に/諮る」
「解決を/図る」「《動物》を/飼う」「《食物》を/
買う」となる。
「解決を/図る」「《動物》を/飼う」「《食物》を/
買う」となる。
第6図は意味分類間の優先関係を記述した意味分類優先
度の構成を示した図である。「意味分類」「優先度」の
フィールドから構成される。
度の構成を示した図である。「意味分類」「優先度」の
フィールドから構成される。
「意味分類」には意味分類コードが格納され、「優先
度」には意味分類に対する優先度が格納される。優先度
はその意味分類の尤もらしさを示す情報が1〜5の値で
格納される。尤度値5は最も尤もらしいという意味であ
り、値が小さくなるにつれ疑わしいと解釈される。
度」には意味分類に対する優先度が格納される。優先度
はその意味分類の尤もらしさを示す情報が1〜5の値で
格納される。尤度値5は最も尤もらしいという意味であ
り、値が小さくなるにつれ疑わしいと解釈される。
第7図は文節候補テーブルBCTBLの概念を示した図
である。文節候補テーブルは入力読みの解析の結果、考
えられる文節候補をバイナリートリーで表現したもので
ある。図中、横線は子ポインタを意味し、縦線は弟ポイ
ンタを意味する。弟ポインタはある読み位置から始まる
他の文節候補(通常はより短い候補)をリンクし、子ポ
インタはその文節に引き続く文節候補をリンクする。
である。文節候補テーブルは入力読みの解析の結果、考
えられる文節候補をバイナリートリーで表現したもので
ある。図中、横線は子ポインタを意味し、縦線は弟ポイ
ンタを意味する。弟ポインタはある読み位置から始まる
他の文節候補(通常はより短い候補)をリンクし、子ポ
インタはその文節に引き続く文節候補をリンクする。
入力読み列「いいんかいにかいけつをはかるようによう
せいした」の先頭部分は「委員会に」「委員会」「委
員」などの解釈が存在し、これらは順に弟ポインタ(縦
線)でリンクされている。
せいした」の先頭部分は「委員会に」「委員会」「委
員」などの解釈が存在し、これらは順に弟ポインタ(縦
線)でリンクされている。
「委員会に」に引き続く文節は「解決を」が考えられ、
子ポインタでリンクされている。
子ポインタでリンクされている。
この様な文節候補テーブルができ上がると、「委員会に
解決を図るように要請した」「委員会に解決を諮るよう
に要請した」「委員会に解決を図る用に要請した」「委
員会二価胃決を図るように要請した」などと文節候補列
を作成することは容易である。
解決を図るように要請した」「委員会に解決を諮るよう
に要請した」「委員会に解決を図る用に要請した」「委
員会二価胃決を図るように要請した」などと文節候補列
を作成することは容易である。
第8図は文節候補テーブルBCTBLの具体的構成を示
した図である。
した図である。
「自立語」は文節候補の自立語が存在する辞書上の先頭
位置へポインタを格納する。
位置へポインタを格納する。
「付属語列」は2バイトで構成され、文節候補の自立語
に引き続く付属語列を特定する領域である。先頭1バイ
トが入力バッファ上の付属語列先頭文字をインデックス
し、次の1バイトが入力バッファ上の付属語列の末尾文
字をインデックスする。例えば、第3図に示す入力バッ
ファのとき、「るように」を表現するには第1バイトに
26、第2バイトに32を設定する。付属語列が存在し
ないときは図中で「φ」で示している。
に引き続く付属語列を特定する領域である。先頭1バイ
トが入力バッファ上の付属語列先頭文字をインデックス
し、次の1バイトが入力バッファ上の付属語列の末尾文
字をインデックスする。例えば、第3図に示す入力バッ
ファのとき、「るように」を表現するには第1バイトに
26、第2バイトに32を設定する。付属語列が存在し
ないときは図中で「φ」で示している。
「弟リンク」はその文節候補と同じ読み位置から始まる
別の文節候補をリンクする。
別の文節候補をリンクする。
「子リンク」はその文節候補に引き続く文節候補をリン
クする。
クする。
なお、リンクは値0のときに終端することを意味する。
例えば、文節候補0(委員会に)の弟リンクは50であ
り、文節候補50(委員会)をリンクする。文節候補0
(委員会に)の子リンクは500であり、文節候補50
0(解決を)をリンクする。文節候補500の子リンク
は800であり、文節候補800(図るように)をリン
クする。文節候補800の子リンクは1000であり、
文節候補1000(要請した)をリンクする。更に、文
節候補1000の子リンクは0であり、そこで入力読み
が終端していることが分かる。
り、文節候補50(委員会)をリンクする。文節候補0
(委員会に)の子リンクは500であり、文節候補50
0(解決を)をリンクする。文節候補500の子リンク
は800であり、文節候補800(図るように)をリン
クする。文節候補800の子リンクは1000であり、
文節候補1000(要請した)をリンクする。更に、文
節候補1000の子リンクは0であり、そこで入力読み
が終端していることが分かる。
第9図は文尤度の計算例を示した図である。文尤度は文
節候補列である文の尤もらしさを表現するものであり、
値が大きいほど尤もらしいことを意味する。
節候補列である文の尤もらしさを表現するものであり、
値が大きいほど尤もらしいことを意味する。
文尤度は、文節尤度の和、文節間尤度の和、用例尤度の
和を全て加算することにより計算される。
和を全て加算することにより計算される。
文節尤度は各文節候補の尤もらしさを表現するものであ
り、値が大きいほど尤もらしいことを意味する。文節尤
度はその文節の自立語の辞書DICに記載されている単
語尤度が使用される。
り、値が大きいほど尤もらしいことを意味する。文節尤
度はその文節の自立語の辞書DICに記載されている単
語尤度が使用される。
文節間尤度は隣接する文節候補間の接続の尤もらしさを
表現するものであり、本実施例では値−20で固定とす
る。その文がn文節で構成されていたとすると、文節間
は(n−1)あるので、文節間尤度の和は必ず−20
(n−1)となる。
表現するものであり、本実施例では値−20で固定とす
る。その文がn文節で構成されていたとすると、文節間
は(n−1)あるので、文節間尤度の和は必ず−20
(n−1)となる。
用例尤度は各文節間に適用されている、用例の一つ一つ
について文尤度に加算される。用例尤度は個別用例の場
合と、意味用例の場合で計算式が異なる。意味用例が適
用されているとき、用例尤度は、使われている意味分類
の優先度の値から、その用例を適用する際に飛び越す文
節の数の5倍を減じたものとなる。個別用例が適用され
ているとき、用例尤度は、値20から、その用例を適用
する際に飛び越す文節の数の5倍を減じたものとなる。
について文尤度に加算される。用例尤度は個別用例の場
合と、意味用例の場合で計算式が異なる。意味用例が適
用されているとき、用例尤度は、使われている意味分類
の優先度の値から、その用例を適用する際に飛び越す文
節の数の5倍を減じたものとなる。個別用例が適用され
ているとき、用例尤度は、値20から、その用例を適用
する際に飛び越す文節の数の5倍を減じたものとなる。
第9図によると、「委員会に/解決を/諮るように/要
請した」の文尤度は−35であり、「委員会に/解決を
/図るように/要請した」の文尤度は−30であるの
で、文尤度の値の大きい例2の「委員会に/解決を/図
るように/要請した」が第1位に変換されることが分か
る。
請した」の文尤度は−35であり、「委員会に/解決を
/図るように/要請した」の文尤度は−30であるの
で、文尤度の値の大きい例2の「委員会に/解決を/図
るように/要請した」が第1位に変換されることが分か
る。
この様に正しく変換される理由は、例1に適用される用
例「委員会に/諮る」は文節「解決を」を1つ飛び越す
のに対し、例2に適用される用例「解決を/図る」は、
他の文節を飛び越さず、適用される距離が短いからであ
る。
例「委員会に/諮る」は文節「解決を」を1つ飛び越す
のに対し、例2に適用される用例「解決を/図る」は、
他の文節を飛び越さず、適用される距離が短いからであ
る。
上述の実施例の動作をフローに従って説明する。
第10図はキー入力を取り込み、処理を行なう部分のフ
ローチャートである。
ローチャートである。
ステップ10−1はキーボードからのデータを取り込む
処理である。ステップ10−2で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。
処理である。ステップ10−2で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。
変換キーであったときはステップ10−3に分岐し、ス
テップ10−3において第11図に詳述するように仮名
漢字変換の変換処理が行なわれる。その他のキーのとき
はステップ10−4に分岐し、挿入、削除等の通常の文
字処理装置において行なわれるその他の処理が行なわれ
る。その後ステップ10−1に分岐する。
テップ10−3において第11図に詳述するように仮名
漢字変換の変換処理が行なわれる。その他のキーのとき
はステップ10−4に分岐し、挿入、削除等の通常の文
字処理装置において行なわれるその他の処理が行なわれ
る。その後ステップ10−1に分岐する。
第11図はステップ10−3の「変換処理」を詳細化し
たフローチャートである。
たフローチャートである。
ステップ11−1において、第12図に詳述する文節候
補作成処理を行ない、文節候補テーブルBCTBLを作
成する。
補作成処理を行ない、文節候補テーブルBCTBLを作
成する。
ステップ11−2において、第13図に詳述する第1候
補決定処理を行なう。
補決定処理を行なう。
ステップ11−3において、決定された第1候補に基づ
いて変換結果を作成し、出力する。
いて変換結果を作成し、出力する。
第12図はステップ11−1の「文節候補作成処理」を
詳細化したフローチャートである。
詳細化したフローチャートである。
ステップ12−1において、入力バッファインデックス
i、部分候補テーブルインデックスjを0に初期設定す
る。
i、部分候補テーブルインデックスjを0に初期設定す
る。
ステップ12−2においてiの示す入力バッファ中の読
みに基づき、辞書をサーチし、単語候補を求める。
みに基づき、辞書をサーチし、単語候補を求める。
ステップ12−3において、見つかった単語候補に対し
て接続する付属語列を解析する形態素解析処理を行な
う。この結果、文節候補が得られる。
て接続する付属語列を解析する形態素解析処理を行な
う。この結果、文節候補が得られる。
ステップ12−4において得られた文節候補を文節候補
テーブルに格納する。格納する時はj+1番目のエント
リーに格納する。また、必要な情報を設定する。例え
ば、この文節候補を子、あるいは弟とする文節候補につ
いては、子リンク、弟リンクを設定する。格納後jの値
をカウントアップする。
テーブルに格納する。格納する時はj+1番目のエント
リーに格納する。また、必要な情報を設定する。例え
ば、この文節候補を子、あるいは弟とする文節候補につ
いては、子リンク、弟リンクを設定する。格納後jの値
をカウントアップする。
ステップ12−5において文節候補テーブルからターミ
ネートしていない文節候補、すなわち、子リンクがまだ
決まっていない文節候補を見つけてその次の読み位置を
iに代入する。
ネートしていない文節候補、すなわち、子リンクがまだ
決まっていない文節候補を見つけてその次の読み位置を
iに代入する。
ステップ12−6において、全ての文節候補の子リンク
が決定しているかどうか判定し、決定していないものが
あればステップ12−2に分岐する。そうでなければリ
ターンする。
が決定しているかどうか判定し、決定していないものが
あればステップ12−2に分岐する。そうでなければリ
ターンする。
第13図はステップ11−2の「第1候補決定処理」を
詳細化したフローチャートである。
詳細化したフローチャートである。
ステップ13−1において、最尤文尤度を処理上許され
る最小値、例えば、−32767に初期設定する。
る最小値、例えば、−32767に初期設定する。
ステップ13−2において文節候補テーブルより文節候
補列を1つ取り出す。
補列を1つ取り出す。
ステップ13−3において、第14図に詳述するように
その取り出された文節候補列に適用可能な用例を検索
し、用例尤度の和である「用例尤度和」を算出する。
その取り出された文節候補列に適用可能な用例を検索
し、用例尤度の和である「用例尤度和」を算出する。
ステップ13−4において、文節候補列の文尤度を第9
図に示す様に算出する。
図に示す様に算出する。
ステップ13−5において、算出された文尤度が最尤文
尤度より尤もらしいか、具体的には大きいかを判定し、
大きいときはステップ13−6において最尤文尤度を算
出された文尤度に更新する。また、ステップ13−7に
おいて現在の文節候補列を最尤文尤度に対応した文節候
補列として記憶する。
尤度より尤もらしいか、具体的には大きいかを判定し、
大きいときはステップ13−6において最尤文尤度を算
出された文尤度に更新する。また、ステップ13−7に
おいて現在の文節候補列を最尤文尤度に対応した文節候
補列として記憶する。
ステップ13−8において文節候補テーブルから別の文
節候補列が取り出せるかどうかを判定し、取り出せると
きはステップ13−2に分岐する。そうでないときはリ
ターンする。
節候補列が取り出せるかどうかを判定し、取り出せると
きはステップ13−2に分岐する。そうでないときはリ
ターンする。
これにより、最尤文尤度を算出するもとになった文節候
補列が第1候補として決定される。
補列が第1候補として決定される。
第14図はステップ13−3の「用例尤度和の算出」を
詳細化したフローチャートである。
詳細化したフローチャートである。
ステップ14−1において、用例尤度和をまず0に初期
設定する。
設定する。
ステップ14−2において、文節候補列から1文節を着
目文節として取り出す。以下の処理ではこの着目文節に
関係する用例の尤度を求めることになる。
目文節として取り出す。以下の処理ではこの着目文節に
関係する用例の尤度を求めることになる。
ステップ14−3において最尤用例尤度を0に初期設定
する。
する。
ステップ14−4において、着目文節とペアになる文節
を文節候補列から取り出す。
を文節候補列から取り出す。
ステップ14−5において、着目文節のペア文節を取り
出すことができなかったときは、それ以上の着目文節の
処理を諦め、ステップ14−8に分岐する。
出すことができなかったときは、それ以上の着目文節の
処理を諦め、ステップ14−8に分岐する。
ステップ14−6において、第15図に詳述するよう
に、着目文節とペア文節の間の用例が適用されているか
どうかを調べ、その適用状況に応じて用例尤度を設定す
る。
に、着目文節とペア文節の間の用例が適用されているか
どうかを調べ、その適用状況に応じて用例尤度を設定す
る。
ステップ14−7において、求まった用例尤度が最尤用
例尤度より尤もらしい(すなわち大きいか)かどうかを
調べ、尤もらしければ(すなわち大きければ)、用例尤
度の値を最尤用例尤度に代入する。その後ステップ14
−4に分岐し、別のペアについて用例尤度を求める。
例尤度より尤もらしい(すなわち大きいか)かどうかを
調べ、尤もらしければ(すなわち大きければ)、用例尤
度の値を最尤用例尤度に代入する。その後ステップ14
−4に分岐し、別のペアについて用例尤度を求める。
ステップ14−8において、着目文節の処理が終ったの
で、次の着目文節の処理に移るが、未処理の文節が残っ
ているかどうか判定する。残っていないときはそのまま
リターンするが、残っているときはステップ14−9に
分岐し、前回求まった最尤用例尤度を用例尤度輪に加算
する。その後、ステップ14−2に分岐し、次の着目文
節を取り出す。
で、次の着目文節の処理に移るが、未処理の文節が残っ
ているかどうか判定する。残っていないときはそのまま
リターンするが、残っているときはステップ14−9に
分岐し、前回求まった最尤用例尤度を用例尤度輪に加算
する。その後、ステップ14−2に分岐し、次の着目文
節を取り出す。
第15図はステップ14−6の「用例尤度の値設定」を
詳細化したフローチャートである。
詳細化したフローチャートである。
ステップ15−1において、着目文節とペア文節の2文
節感に適用される用例があるかどうか、あるとすれば、
それは個別用例か、意味用例かを判断する。
節感に適用される用例があるかどうか、あるとすれば、
それは個別用例か、意味用例かを判断する。
適用用例がないときはステップ15−2に分岐し、用例
尤度に0を代入し、リターンする。
尤度に0を代入し、リターンする。
個別用例が適用できるときはステップ15−3に分岐
し、ステップ15−3において用例尤度に20を代入す
る。その後ステップ15−5に分岐する。
し、ステップ15−3において用例尤度に20を代入す
る。その後ステップ15−5に分岐する。
意味用例が適用できるときはステップ15−4に分岐
し、用例尤度としてその意味用例に使われている意味分
類の優先度を代入する。その後ステップ15−5に分岐
する。
し、用例尤度としてその意味用例に使われている意味分
類の優先度を代入する。その後ステップ15−5に分岐
する。
ステップ15−5において2文節間の距離、すなわち、
飛び越す文節の数を求め、その値に5を乗じて用例尤度
に加算する。もし、隣接する2文節であれば、飛び越す
文節は0であるので、用例尤度に0を加算することにな
る。
飛び越す文節の数を求め、その値に5を乗じて用例尤度
に加算する。もし、隣接する2文節であれば、飛び越す
文節は0であるので、用例尤度に0を加算することにな
る。
ステップ15−6において上記計算された用例尤度の値
が負になっていないかどうか判定し、負のときはステッ
プ15−7において0になるように補正し、リターンす
る。負でないときは値をいじらずにそのままリターンす
る。
が負になっていないかどうか判定し、負のときはステッ
プ15−7において0になるように補正し、リターンす
る。負でないときは値をいじらずにそのままリターンす
る。
[他の実施例] 以上の説明において、用例辞書は共起する2単語(ある
いは分類)のペアであるとして説明したが、3つ組ある
いは更に一般的にn個組であっても同様に処理すること
ができる。
いは分類)のペアであるとして説明したが、3つ組ある
いは更に一般的にn個組であっても同様に処理すること
ができる。
また、尤度の計算は単に例を示しただけであり、用例の
適用される複数文節間の距離を尤度計算の過程で考慮す
る様に構成すれば、別の計算方法であっても特に本発明
の趣旨を損なうものではない。
適用される複数文節間の距離を尤度計算の過程で考慮す
る様に構成すれば、別の計算方法であっても特に本発明
の趣旨を損なうものではない。
[発明の効果] 以上の説明から明らかなように本発明によれば、オペレ
ータの入力した読み列について複数の用例が適用可能な
場合、その用例が適用される2文節の距離(飛び越す文
節数)に従ってどの用例を適用すれば良いかを判断する
ので、より適切な変換を行なうことができる。これによ
り変換率の高い、快適な文字処理装置を実現することが
できる。
ータの入力した読み列について複数の用例が適用可能な
場合、その用例が適用される2文節の距離(飛び越す文
節数)に従ってどの用例を適用すれば良いかを判断する
ので、より適切な変換を行なうことができる。これによ
り変換率の高い、快適な文字処理装置を実現することが
できる。
第1図は本発明の全体構成のブロック図、 第2図は本発明における仮名漢字変換の変換例を示した
図、 第3図は本発明における入力バッファIBUFと出力バ
ッファOBUFの構成を示した図、 第4図は本発明における仮名漢字変換用辞書DICの構
成を示した図、 第5図は本発明における用例辞書YDICの構成を示し
た図、 第6図は本発明における意味分類の優先関係を記述した
意味分類優先度テーブルPRTBLの構成を示した図、 第7図は本発明における文節候補テーブルBCTBLの
記憶内容を概念的に示した図、 第8図は本発明における文節候補テーブルBCTBLの
構成を示した図、 第9図は本発明における尤度計算の方式を示した図、 第10図〜第15図は本発明文字処理装置の動作を示す
フローチャート。 DISK…外部記憶部 CPU…マイクロプロセッサ ROM…読出し専用メモリ RAM…ランダムアクセスメモリ IBUF…入力バッファ OBUF…出力バッファ DIC…仮名漢字変換用辞書 YDIC…用例辞書 PRTBL…意味分類優先度テーブル BCTBL…文節候補テーブル
図、 第3図は本発明における入力バッファIBUFと出力バ
ッファOBUFの構成を示した図、 第4図は本発明における仮名漢字変換用辞書DICの構
成を示した図、 第5図は本発明における用例辞書YDICの構成を示し
た図、 第6図は本発明における意味分類の優先関係を記述した
意味分類優先度テーブルPRTBLの構成を示した図、 第7図は本発明における文節候補テーブルBCTBLの
記憶内容を概念的に示した図、 第8図は本発明における文節候補テーブルBCTBLの
構成を示した図、 第9図は本発明における尤度計算の方式を示した図、 第10図〜第15図は本発明文字処理装置の動作を示す
フローチャート。 DISK…外部記憶部 CPU…マイクロプロセッサ ROM…読出し専用メモリ RAM…ランダムアクセスメモリ IBUF…入力バッファ OBUF…出力バッファ DIC…仮名漢字変換用辞書 YDIC…用例辞書 PRTBL…意味分類優先度テーブル BCTBL…文節候補テーブル
Claims (1)
- 【請求項1】仮名文字列を入力するための入力手段と、 単語の読みと、表記及び意味分類とを対応づけて記憶し
た単語辞書手段と、 単語の表記と、当該単語と併用される単語の表記もしく
は意味分類とを対応づけて用例として記憶する用例辞書
手段と、 前記単語辞書手段を参照して、前記入力手段より入力さ
れた仮名文字列を読みとする表記の候補を作成する候補
作成手段と、 前記候補作成手段により作成された同じ読みに対する表
記の候補について、前記用例辞書手段に記憶された用例
に、併用される単語とともに該当する候補を優先し、該
当する候補が複数存在するときには、当該候補と前記併
用される単語との距離が文中で近い用例に該当する候補
を優先するようにして、表記の候補の表示優先度を決定
する表示優先度決定手段と、 該表示優先度決定手段によって決定された表示優先度に
基づいて、前記候補作成手段により作成された表記の候
補を表示する候補表示手段とを有することを特徴とする
文字処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1320185A JPH0628057B2 (ja) | 1989-12-07 | 1989-12-07 | 文字処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1320185A JPH0628057B2 (ja) | 1989-12-07 | 1989-12-07 | 文字処理装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03179551A JPH03179551A (ja) | 1991-08-05 |
| JPH0628057B2 true JPH0628057B2 (ja) | 1994-04-13 |
Family
ID=18118650
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1320185A Expired - Lifetime JPH0628057B2 (ja) | 1989-12-07 | 1989-12-07 | 文字処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0628057B2 (ja) |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH077399B2 (ja) * | 1986-11-19 | 1995-01-30 | 日本放送協会 | 言語処理法 |
| JPS6386073A (ja) * | 1986-09-30 | 1988-04-16 | Ricoh Co Ltd | 日本語修飾関係解析装置 |
| JPH0769914B2 (ja) * | 1987-03-09 | 1995-07-31 | 日本電信電話株式会社 | 日本語文節間係り受け解析装置 |
| JP2960936B2 (ja) * | 1987-07-13 | 1999-10-12 | 日本電信電話株式会社 | 係り受け解析装置 |
| JP2951956B2 (ja) * | 1988-03-09 | 1999-09-20 | キヤノン株式会社 | 文字処理装置及びその方法 |
-
1989
- 1989-12-07 JP JP1320185A patent/JPH0628057B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH03179551A (ja) | 1991-08-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3161942B2 (ja) | 訳振り機械翻訳装置 | |
| JPH0628057B2 (ja) | 文字処理装置 | |
| JPH0640328B2 (ja) | 文字処理装置 | |
| JP3029109B2 (ja) | 文字処理装置及びその方法 | |
| JP2698458B2 (ja) | 文字処理装置 | |
| JP3236190B2 (ja) | 文字処理装置及びその方法 | |
| JPH0638260B2 (ja) | 文字処理装置及びその方法 | |
| JP2714238B2 (ja) | 文字処理装置 | |
| JPH0638261B2 (ja) | 文字処理装置及びその方法 | |
| JP2675912B2 (ja) | 文字処理装置 | |
| JP2714239B2 (ja) | 文字処理装置 | |
| JPH0576064B2 (ja) | ||
| JP3278148B2 (ja) | 文字処理装置及びその方法 | |
| JPH01229369A (ja) | 文字処理装置 | |
| JP2899087B2 (ja) | 文字処理装置 | |
| JP3010946B2 (ja) | 文章入力方法 | |
| JPH0697454B2 (ja) | 文字処理装置 | |
| JPH04256159A (ja) | かな漢字変換装置 | |
| JPH08241315A (ja) | 文書処理装置の単語登録機構 | |
| JPS6379175A (ja) | 電子辞書 | |
| JPS63167956A (ja) | 敬語表現への変換装置 | |
| JPH01204174A (ja) | 文字処理装置 | |
| JPH0887506A (ja) | パターン照合併用型翻訳処理装置 | |
| JPH0468466A (ja) | かな漢字変換装置 | |
| JPH10187706A (ja) | 文書処理方法及びその装置 |