JPH0442352A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH0442352A
JPH0442352A JP2150126A JP15012690A JPH0442352A JP H0442352 A JPH0442352 A JP H0442352A JP 2150126 A JP2150126 A JP 2150126A JP 15012690 A JP15012690 A JP 15012690A JP H0442352 A JPH0442352 A JP H0442352A
Authority
JP
Japan
Prior art keywords
field
document
candidate
word
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2150126A
Other languages
English (en)
Inventor
Eiichiro Toshima
英一朗 戸島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2150126A priority Critical patent/JPH0442352A/ja
Publication of JPH0442352A publication Critical patent/JPH0442352A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は仮名漢字変換により漢字仮名混り文を作成し、
入力する文字処理装置に関する。
[従来の技術] 現在、日本ワードプロセッサなどの文字処理装置は漢字
仮名混り文の入力を仮名漢字変換を使って行なうことが
一般的である。
仮名漢字変換は辞書を参照することにより、入力された
読み列を漢字に変換するものである。
般に言って、辞書の単語数が少ないとオペレータの望む
単語は変換できないので変換率が低くなり、単語数が多
いとオペレータの望む単語が変換される可能性が高くな
るので変換率が高くなる。
ところが、逆に単語数が増えすぎて特殊な分野の単語ま
で辞書に登録される様になると、オペレータの全(望ま
ない単語が変換され、変換率が悪くなる場合もある。
例えば、読み列「どうきょうきかい」に対しては通常は
「東京機械」と変換してほしいわけである。ところが、
地名「東京」と地名「官界」が登録されていれば、地名
十地名のパターンは住所の入力などで使われるために優
先して変換され、「東京官界」と変換されることがある
。この場合、住所入力を全く考えていないオペレータに
とっては、地名が豊富に登録されていることにより、逆
に変換率が下がってしまったことになる。
そこで、−11Q的な文書の変換率を高めるために分野
別辞書という手法が提案されている。分野別辞書とは、
主な分野ごとにその分野の単語を格納した辞書のことで
あり、オペレータは自分の目的にあった分野別辞書を選
択し変換することで最適な変換をすることができる。上
記の例では住所人力を目的とするオペレータは地名分野
別辞書を指定して変換し、住所入力を考えていないオペ
レータは標準辞書を指定して変換するのである。この様
にすることで、一般のオペレータは標準辞書を利用する
ので「どうきようきかいJと入力しても正常に「東京機
械」と変換されることになる。また、住所入力を行なう
オペレータは地名分野別辞書を利用するので「東京機械
」の変換は失敗するが、その代わり住所を人力したとき
の変換率は高くなる。
この分野別辞書の実現方法には2種類の手法が存在する
第1の方法は特定の分野に属さない普遍的な単語を格納
した標準辞書を設定し、他方、特殊分野の単語のみを格
納した分野別辞書を用意し、ある分野が指定された場合
、標準辞書と指定された分野の分野別辞書の両方をサー
チして変換することで実現する方法である。
第2の方法は上記の標準辞書の内容と特定の分野別辞書
の内容を予めマージした辞書を用意するという方法であ
る。この方式では変換の際には1つの辞書のみをサーチ
すれば良い。
ところが、分野別辞書を実現する上述の第1の方法、第
2の方法はいずれも深刻な問題を抱えている。
第1の方法に従うと変換時の処理時間に負担がかかる。
すなわち、標準辞書の変換のみであれば1つの辞書のみ
をサーチすれば良いところを、分野が指定されていると
更に別の辞書もサーチしなければならず、余分なサーチ
処理の分だけ変換時間がかかってしまう。
第2の方法に従うと、こちらは辞書を1回サーチするだ
けなので変換時間には負担はかからないが、分野の種類
が増えてしまうと分野別辞書の種類が飛躍的に増えてし
まう。例えば、「地名」 「歴史」 「建築」 「医学
」の4分野があるだけで「標準辞書」 「地名分野別辞
書」 「歴史分野別辞書」 「建築分野別辞書」 「医
学分野別辞書」 「地名+歴史分野別辞書」 「地名十
建築分野別辞書」 「「地名十医学分野別辞書」 「歴
史十建築分野別辞し」等の16種類もの分野別辞書を用
意しなければならない。
この問題を解決するために、分野別辞書を何種類も用意
するのではな(,1つの辞書のみを用意し、その辞書中
の各単語に分野情報を記述して変換時に分野を判断する
ことにより、分野別変換を実現するという方法が考えら
れる。
[発明が解決しようとしている課題] このとき、使用する分野情報をオペレータが指定するこ
とになる。ところで、同じオペレータであっても、作成
する文書によって、使用する単語の分野が異なることが
ある。このとき、作成編集する文書ごとに分野を設定し
直すのは、面倒な操作である。更に、複数の分野を組み
合わせて使用しなければいけない場合、文書ごとにどの
様な分野構成であるかを記憶しておかなければならず、
操作が苦痛ですらある。
[課題を解決するための手段(及び作用)]本発明は、
文書ごとに一度設定した分野情報を、文書データと対応
付けて外部記憶装置に保存し、必要なときに外部記憶か
ら呼びだす手段を提供することにより、分野設定の作業
を簡便化し、操作性の高い分野別変換を実現するもので
ある。
[実施例] 以下図面を参照しながら本発明の詳細な説明する。
第1図は本発明の全体構成の一例である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセッサCPUの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスDBは各構成機器相互間のデ
ータの転送を行なう。
つぎにROMぽ、読出し専用の固定メモリであり、第1
5図〜第23図につき後述するマイクロプロセッサCP
Uによる制御の手順を記憶させておく。
また、R,AMは、lワード16ビツトの構成の書込み
可能のランダムアクセスメモリであって、各構成要素か
らの各種データの一時記憶に用いる。IBUFはキー人
力されたキーデータを記憶する大力バッファであり、0
BUFは仮名漢字変換された結果を一時的に記憶する出
力バッファである。DECは仮名漢字変換を行なうため
の辞書である。BCTBLは変換途中の文節候補を記憶
する文節候補テーブルである。TBTJFはテキストバ
ッファであり、入力編集中のテキストデータが記憶され
る。DOBUFは同音語バッファであり、テキストバッ
ファTBUFに記憶される文字に同音語候補が存在する
ときはその候補が記憶される。5BUNFはシステム分
野フラグであり、仮名漢字変換するとき、標準分野以外
に変換すべき単語の分野を指定したフラグが記憶される
KBはキーボードであって、アルファベットキ、ひらか
なキー、カタカナキー等の文字記号人カキ−1及び、変
換キー、次候補キー、選択キー、分野設定キー、文書保
存キー、文書呼出キー実行キー、解除キー等の本文字処
理装置に対する各種機能を指示するための各種のファン
クションキーな備えている。
DISKは文書データ、イラストデータ、図形データ等
を記憶するための外部記憶部である。テキストバッファ
TBUF上に作成された文書、システム分野フラグなど
はこの外部記憶部に保管される。保管されたデータはキ
ーボードの指示により、必要な時呼び出される。
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。
後述するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対応する表示装置CRT上の位置にカー
ソルを表示する。
DBUFは表示用バッファメモリで、表示すべきデータ
のパターンを蓄える。テキストの内容を表示するときは
テキストバッファTBUFの内容に応じて表示パターン
がDBUFに作成されることにより、表示されることに
なる。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担う
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドツト構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の人力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラブド信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶しである各種の制御信号を読出し、それらの制御
信号に従って各種の制御が行なわれる。
第2図は本発明装置による各分野ごとの変換例を示した
図である。図中r/Jはそこで変換キーを打鍵するとい
う意味である。各変換例は全て入力読み列として「はび
きのしこんだにあるおうじんてんのうりよう」を与えた
場合のものである。
2−1は標準分野での変換例を示した図である。入力に
対して第1候補は「羽曳野仕込んだ荷ある追う陣天皇寮
」と変換される。これは(地名) (歴史)の分野が設
定されていないので地名「音用」人名「応神」名詞「陵
」が存在しないために誤変換しているからである。
2−2は標準分野+地名分野での変換例を示した図であ
る。入力に対して第1候補は「羽曳野市誉田にある追う
陣天皇寮」と変換される。これは(歴史)の分野が設定
されていないので人名「応神」、名詞「陵]が存在しな
いために誤変換しているからである。2−1に比べて(
地名)の分野が設定されているので地名「音用」は変換
できる様になっている。
2−3は標準分野+歴史分野での変換例を示した図であ
る。入力に対して第1候補は「羽曳野仕込んだ荷ある応
神天皇陵]と変換される。これは(地名)の分野が設定
されていないので地名「音用」が存在しないために誤変
換しているからである。2−1に比べて(歴史)の分野
が設定されているので人名「応神」名詞「陵」は変換で
きる様になっている。
2−4は標準分野+地名分野+歴史分野での変換例を示
した図である。入力に対して第1候補は[羽曳野市誉田
にある応神天皇陵」と正しく変換されている。
第3図は分野の設定・保存操作の例を示した図である。
3−1は初期画面を示したものである。
通常の文書作成編集はこの画面で行なう。アングライン
はカーソルの存在する位置を示している。
3−2は分野設定キーを打鍵した時の画面を示している
。カーソルは最初の設定項目「地名分野」のところにい
る。各分野それぞれについてIr0J]はその分野の単
語を変換しないことを意味し、「1」はその分野の単語
を変換することを意味している。3−2の画面において
は全分野「O]が設定されているので、どの分野の単語
も変換されることはなく、標準分野の単語のみが変換さ
れることを意味している。ここでキーFIJIを打鍵す
ると3−3の画面になる。3−3では地名分野の設定項
目がtri、jとなっているので地名分野の単語が変換
可能になったことを意味している。カーソルは次の設定
項目である歴史分野のところに移動している。ここでも
う−度、キー1rlJlを打鍵すると3−4の画面にな
る。ここで歴史分野の設定項目も「IJIとなり、更に
歴史分野の単語も変換可能になったことを意味している
。カーソルは更に次の設定項目である建築分野のところ
に移動している。ここで実行キーを打鍵すると分野情報
が更新され、分野設定画面は消え、3−5の様に元の文
書編集画面に戻る。
第4図は文書の呼出操作の例を示した図である。4−1
は通常の文書作成編集の初期画面である。この状態で文
書呼出キーを打鍵すると、DISK中に存在する文書の
目録が呼び出され、例えば、4−2の画面の様になる。
この例はDISK中に4つの文書「古墳の説明」 「次
期製品概略仕様」 「三角縁神獣鏡の特徴」「貌晋朝短
里説への反論」が保存されていたことを示している。現
在のカーソルは先頭の文書にあるので、文書lの文書名
にはアングラインが付いている。実行キーな打鍵すると
、カーソルのある文書、この例では文書1「古墳の説明
」が文書データに呼び出され、4−3の様に表示される
。このとき、その文書に付随していた分野情報も呼び出
される。
文書作成中に文書保存キーを打鍵すると4−4に示す様
に文書保存画面が表示される。この状態で、文書名を変
更することも可能である。更に実行キーを打鍵すると、
実際に文書データが外部記憶部DISKに保存される。
そのとき、設定されているシステム分野フラグの内容も
同時に文書に付随して保存される。
第5図は仮名漢字変換の操作の例を示した図である。5
−1は文書作成編集を行なう初期画面である。読み列「
はびきのしこんだ」を入力すると5−2の画面になる。
5−2ではカーソルは入力読み列の次に表示されている
。ここで変換キーを打鍵すると5−3の画面になる。5
−3では読み列「はびきのしこんだ」が「羽曳野市誉田
」と変換されている。オペレータは「羽曳野市金円」と
いう変換を望んだとして、次候補キーを打鍵すると5−
4の画面になる。ここで「こんだ」の変換候補が表示さ
れる。第1候補は「書出」であり、第2候補は「今田」
である。現在の候補は第2候補の「今田」であり、2が
反転表示している。ここで選択キーを打鍵すると、5−
5の画面になる。第2候補の1今田」が確定してテキス
トデータの中に格納され、同時に「今田」が学習され、
単語尤度が向上する。
第6図は入力バッファIBUF、出ノjバッファ0BU
Fの構成を示した図である。
IBUF、0BUFともに同じ構成である。最初の2バ
イトは各バッファのサイズ情報であり、バッファに格納
されている文字数から1を減じたものを2倍した数値が
入る。入力バッファの末尾にある「/」はそこで変換キ
ーが打鍵されたことを意味する。各文字は1文字2バイ
トで構成され、JIS X 020Bコードで格納され
る。
第7図は仮名漢字変換用辞書DICの記憶内容を概念的
に示した図である。各単語は「読み」 「表記」 「品
詞」 「単語尤度」 「分野情報」のフィールドから構
成される。
「読み」には単語の読み、「表記」には単語の表記、「
品詞」には単語の品詞が格納される。
「単語尤度」は頻度情報等のその単語自体の尤もらしさ
を示す情報が1〜5の値で格納される。
尤度値5は最も尤もらしいという意味であり、値が小さ
(なるにつれ疑わしいと解釈される。尤度値0は全(考
えられないということを意味するので単語尤度の値とし
ては存在しない。
「分野情報」にはその単語の使用される分野が、(地名
) (歴史)(建築) (医学)などと、船釣には複数
個記述される。特定の分野に属さない単語に対しては分
野情報は記述されない。
第8図は仮名漢字変換用辞書DICの具体的構成を示し
た図である。
8−1は標準分野以外の単語の格納構成を示している。
読みはJIS X 020gコードの下位バイトを使用
して1文字1バイトで可変長で構成される。
JIS X 020gコードの下位バイトであるから各
バイトのMSBはOFFとなっている。分野は1バイト
で構成され、図に示す様にビット対応で単語の分野が設
定される。単語がその分野に属するときは対応するビッ
トに1が格納され、属さないときはOが格納される。M
SBはONとなる。従って、分野の値の範囲は0x80
〜0x8fとなる。表記はJIS X 0208コード
を使用して1文字2バイトで可変長で格納される。ただ
し、各バイト(7)MSBをONとする。JIS X 
0.208:]−ドの各バイトは0x21〜0x7eの
値となるので、表記の各バイトはQxal〜0xfeの
範囲に入る。
品詞は1バイトで構成され、その単語の品詞コードが格
納される。MSBはOFFされる。頻度もやはり1バイ
トで構成され、その単語の頻度が格納されるMSBはO
FFされる。
8−2は標準分野の単語の格納形式を示している。標準
分野以外の単語の格納形式と大体同じであるが、違いは
分野が含まれていないという点である。なお、分野の値
の範囲(Ox21〜0x7e)と表記の値の範囲(Ox
21〜0x7e)は異なるので、値をチエツクすること
で読みの後に分野があるのか表記があるのかが分かる仕
掛けとなっている。
第9図は文節候補テーブルBCTBLの記憶内容を概念
的に示した図である。文節候補テーブルは入力読みの解
析の結果、考えられる文節候補をバイナリ−トリーで表
現したものである。図中、横線は子ポインタを意味し、
縦線は第ポインタを意味する。第ポインタはある読み位
置から始まる他の文節候補(通常はより短い候補)をリ
ンクし、子ポインタはその文節に引き続く文節候補をリ
ンクする。
入力読み列「はびきのしこんだ」の先頭部分は「羽曳野
j 「歯」 「葉jなどの解釈が存在し、これらは順に
第ポインタ(縦線)でリンクされている。
「羽曳野」に引き続く文節は「仕込んだ」が考えられ、
子ポインタでリンクされている。
この様な文節候補テーブルができ上がると、「羽曳野仕
込んだ」 「羽曳野重書出」 「歯引きの仕込んだ」 
「歯引きのし書出」などと文節候補列を作成することは
容易である。
第1O図は文節候補テーブルBCTBLの具体的構成を
示した図である。
「自立語」は文節候補の自立語が存在する辞書上の先頭
位置へポインタを格納する。
「付属語列」は2バイトで構成され、文節候補の自立語
に引き続く付属語列を特定する領域である。先頭1バイ
トが入力バッファ上の付属語列先頭文字をインデックス
し、次の1バイトが大力バッファ上の付属語列の末尾文
字をインデックスする。例えば、第6図に示す人力バッ
ファのとき、「んだ」を表現するには第1バイトに12
、第2バイトに14を設定する。付属語列が存在しない
ときは図中で「φ」で示している。
「第リンク」はその文節候補と同じ読み位置から始まる
別の文節候補をリンクする。
「子リンク」はその文節候補に引き続く文節候補をリン
クする。
なお、リンクは値Oのときに終端することを意味する。
例えば、文節候補O(羽曳野)の第リンクは50であり
、文節候補50(歯)をリンクする。文節候補O(羽曳
野)の子リンクは100であり、文節候補100(仕込
んだ)をリンクする。文節候補100の子リンクはOで
あり、そこで入力読みが終端していることが分かる。
第11図はテキストバッファTBUFの構成を示した図
である。
テキストバッファは文字の羅列から構成され、各文字は
2バイトで構成される。各文字のMSBは同音語フラグ
であり、Oは通常文字、■が同音語を意味する。残りの
15ビツトは通常文字のときは文字コードを表現し、同
音語のときは同音語番号を表現する。文字コードは、J
IS X 0208コードを使用する。同音語番号は第
12図に示す同音語バッファDOBUF上のどの同音語
であるかを示す番号である。
第12図は同音語バッファDOBUFの構成を示した図
である。各同音語には同音語番号が付いており、それに
よって識別される。
各同音語は「読み」 「候補総数」 「現候補番号」 
「第i候補情報」からなる。
「読み」はその同音語の読みを格納する。
「候補総数jはその同音に含まれる候補の総数を格納す
る。
「現候補番号」はその同音語の現在表示されている候補
番号が格納される。変換直後初値に第1候補が表示され
るから「1」が格納される。
「第i候補情報」は各候補の「表記」 「単語アドレス
」が格納される。
「表記」にはその候補の表記が格納される。
「単語アドレス」には、その単語の存在アドレスを格納
する。
第13図はシステム分野フラグ5BUNFの構成を示し
た図である。
辞書DIC内の各単語の分野情報とほぼ同一の構成をし
ており、変換すべき単語の分野を指定する。もし、標準
分野の単語のみを変換すれば良いのであれば、全部の分
野のビットをOFFすれば良い。辞書DIC内の各単語
の分野情報と異なる点はMSBがOFFになっていると
いう点である。
第14図は外部記憶部DISKの構成を示した図である
14−1に示す様に、DISKの中は格納されるデータ
に応じて複数のエリアに区分されている。例えば、文書
データTBUFがDISKに保存されるときは文書デー
タ格納エリアに保存される。
14−2は文書データ格納エリアの更なる詳細構成を示
している。文書データ格納エリアにはシステム分野フラ
グと文書データがペアになって格納され、上記のペアが
複数個記憶される。図中システム分野フラグiと文書デ
ータiはペアになっていることを示している。
上述の実施例の動作を第15図以下のフローにチャート
に従って説明する。
第15図はキー人力を取り込み、処理を行なう部分のフ
ローチャートである。
ステップ15−1はキーボードからのデータを取り込む
処理である。ステップ15−2で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。
変換キーであったときはステップ15−3に分岐し、ス
テップ15−3において第16図に詳述するように仮名
漢字変換の変換処理が行なわれる。次候補キーであった
ときはステップ15−4において第19図に詳述する次
候補処理を行なう。
選択キーであったときはステップ15−5において第2
0図に詳述する選択処理を行なう。
分野設定キーであったときはステップ15−6において
第21図に詳述する分野設定処理を行なう。
文書保存キーであったときはステップ15−7において
第22図に詳述する文書保存処理を行なう。
文書呼出キーであったときはステップ15−8において
第23図に詳述する文書呼出処理を行なう。
その他のキーのときはステップ15−9に分岐し、挿入
、削除等の通常の文字処理装置において行なわれるその
他の処理が行なわれる。
各キーの処理が終了すると、ステップ15−1に分岐す
る。
第16図はステップ15−3の「変換処理」を詳細化し
たフローチャートである。
ステップ16−1において、第17図に詳述する文節候
補作成処理を行ない、文節候補テーブルBCTBLを作
成する。
ステップ16−2において、作成された文節候補から最
も尤もらしい変換候補を決定する第1候補決定処理を行
なう。
ステップ16−3において、決定された第1候補に基づ
いて変換結果を作成し、出力する。
第17図はステップ16−1の「文節候補作成処理」を
詳細化したフローチャートである。
ステップ17−1において、大力バッファインデックス
i、文節候補テーブルインデックスjを0に初期設定す
る。
ステップ17−2においてiの示す大力バッファ中の読
みに基づき、辞書をサーチし、単語候補のリストを作成
する。
ステップ17−3において、第18図に詳述する様に、
作成された単語候補がシステム分野フラグの指定から見
て適切であるかどうかチエツクし、適切でないものをオ
ミットする「分野チエツク処理」を行なう。
ステップ17−4において、リストされている単語候補
に対して接続する付属語列を解析する形態素解析処理を
行なう。この結果、文節候補が得られる。
ステップ17−5において得られた文節候補を文節候補
テーブルに格納する。格納する時はj+1番目のエント
リーに格納する。また、必要な情報を設定する。例えば
、この文節候補を子、あるいは第とする文節候補につい
ては、子リンク、第リンクを設定する。格納後jの値を
カウントアツプする。
ステップ17−6において文節候補テーブルからターミ
ネートしていない文節候補、すなわち、子リンクがまだ
決まっていない文節候補を見つけその次の読み位置をi
に代入する。
ステップ17−7において、全ての文節候補の子リンク
が決定しているかどうか判定し、決定していないものが
あればステップ17−2に分岐する。そうでなければリ
ターンする。
第18図はステップ17−3の「分野チエツク処理」を
詳細化したフローチャートである。
ステップ18−1において、単語候補にリストから候補
を1つとりだす。
ステップ18−2において全ての単語候補についてチエ
ツクが終了したかどうかを判定し、終了しているときは
リターンする。終了していないときはステップ18−3
に進む。
ステップ18−3において、その単語候補に分野が記述
されているかどうか(標準分野の単語であるかどうか)
を判定し、分野が記述されていないときは標準分野の単
語であるのでステップ187にスキップする。分野が記
述されているときはステップ18−4に進む。
ステップ18−4において、システム分野フラグ5BU
NF、単語候補の分野情報、0xOfの全てのAND 
(論理積)をとり、単語候補が変換すべき分野の単語で
あるかどうかを調べる。
ステップ18−5において上記の値の判定を行ない、0
のときは変換すべき単語ではないからステップ18−6
において単語候補のリストから除外する。0でないとき
はステップ18−7に分岐し、その単語候補をリストに
残す。
その後ステップ18−1にループし、次の単語候補を処
理する。
第19図はステップ15−4の「次候補処理」を詳細化
したフローチャートである。
ステップ19−1において、次候補を見るべき同音語の
同音語番号をテキストバッファTBUFより求める。
ステップ19−2において、同音語番号から同音語バッ
ファの位置を求めて、現候補番号をカウントアツプする
ステップ19−3において、候補−覧を表示する。
第20図はステップ15−5の「選択処理」を詳細化し
たフローチャートである。
ステップ20−1において、選択すべき同音語の同音語
番号をテキストバッファTBUFより求める。
ステップ20−2において、同音語番号から同音語バッ
ファの位置を求めて、現候補番号の示す候補情報から表
記を取り出し、テキストバッファTBUFに確定文字と
して設定する。
ステップ20−3において、同様に、現候補番号の示す
候補情報から単語アドレスを求め、その示された単語の
単語尤度をカウントアツプする。
ただし、単語尤度が既に5になっているときはカウント
アツプは行なわない。
ステップ20−4において、同様に、第1候補の示す候
補情報から単語アドレスを求め、その示された単語の単
語尤度をカウントダウンする。ただし、単語尤度が既に
1のときはカウントダウンは行なわない。
第21図はステップ15−6の「分野設定処理」を詳細
化したフローチャートである。
ステップ21−1において、元の画面状態を退避し、分
野設定画面を表示する。
ステップ21−2において、現在のシステム分野フラグ
5BUNFの値を退避する。
ステップ21−3において、キーボードからのデータを
取り込む。
ステップ21−4において、取り込まれたキーの種別を
判定し、各キーの処理ルーチンに分岐する。
キー1rlJlが打鍵されたときはステップ21−5に
分岐し、システム分野フラグ5BUNFの対応する分野
のビットを1にセットする。また、カーソルを次の設定
項目に移動させる。
キー「0」が打鍵されたときはステップ21−6に分岐
し、システム分野フラグ5BUNFの対応する分野のビ
ットをOにリセットする。また、カーソルを次の設定項
目に移動させる。
画面関係のキー(カーソル移動キーなど)が打鍵された
ときはステップ21−7に分岐し、カーソル移動等の画
面制御処理を行なう。
ステップ21−5.21−6.21−7の各処理が終了
すると、ステップ15−1に分岐し、次のキー人力を待
つ。
解除キーが打鍵されたときはステップ21−8に分岐し
、システム分野フラグの値を退避されたいた値に復旧す
る。その後、ステップ21−9に分岐する。
実行キーが打鍵されたときはステップ21−9に分岐し
、画面を分野設定キーが打鍵される以前の状態に復旧し
、リターンする。
第22図はステップ15−7の「文書保存処理」を詳細
化したフローチャートである。
ステップ22−1において文書保存画面を表示する。そ
の後、キー人力を受付け、文書名の変更などの制御処理
を行なう。実行キーの打鍵を検出すると文書保存処理の
実行に移るためにステップ22−2に進む。
ステップ22−2において、まず文書データTBUFの
内容を外部記憶部DISKの文書データ格納エリア中の
然るべき位置に保存する。
ステップ22−3において、次にシステム分野フラグ5
BUNFの内容を同じく外部記憶部DISKの文書デー
タ格納エリア中の然るべき位置に、文書データと対応付
けて保存する。
保存が終了するとリターンする。
第23図はステップ15−8の「文書呼出処理」を詳細
化したフローチャートである。
ステップ23−1において現在の外部記憶部DISK中
に保管されている文書名の一覧を文書目録が面として表
示する。その後、キー人力を受付け、カーソル移動等の
画面制御処理を行なう。実行キーの打鍵を検出すると、
文書呼出の処理を実行するためにステップ23−2に進
む。
ステップ23−2において、外部記憶部DISKから現
在のカーソル位置に対応する文書データを取り出す。
ステップ23−3において、上記取り出された文書デー
タなTBUFにロードする。
ステップ23−4において、外部記憶部DISKから現
在のカーソル位置の文書に対応したシステム分野フラグ
の値を取り出す。
ステップ23−5において、上記取り出された値を5B
UNFに代入する。
ステップ23−6において、呼び出された文書の表示を
行ない、文書吐出処理を終了してリターンする。
[発明の効果] 以上の説明から明らかなように、本発明によれば、辞書
中に分野情報を持っているので、複数の分野別辞書を用
意する必要がなく、また、1つの辞書のみをザーチすれ
ば良いので、高速の分野別仮名漢字変換が実現できる。
これにより、オペレータは自分の希望しない分野の単語
が存在することによる誤変換に遭遇することがないので
変換率の高い、快適な文字処理装置を実現することがで
きる。
更に、オペレータの設定した分野情報が文書デ−タと対
応付けて外部記憶に保存され、必要なときに呼び出すこ
とができるので、厄介な分野設定処理を文書呼出ごとに
毎回行なう必要がなく、操作性の高い分野別変換を実現
することができる。
【図面の簡単な説明】
第1図は本発明に係る文字処理装置の全体構成のブロッ
ク図、 第2図は本発明における仮名漢字変換の変換例を示した
図、 第3図は本発明における分野の設定・保存操作の例を示
した図、 第4図は本発明における分野の呼出操作の例を示した図
、 第5図は本発明における仮名漢字変換の操作の例を示し
た図、 第6図は本発明における大力バッファI BUFと出力
バッファ0BUFの構成を示した図、第7図は本発明に
おける仮名漢字変換用辞書DICの記憶内容を概念的に
示した図、 第8図は本発明における仮名漢字変換用辞書DICの具
体的構成を示した図、 第9図は本発明における文節候補テーブルBCTBLの
記憶内容を概念的に示した図、第10図は本発明におけ
る文節候補テーブルBCTBLの具体的構成を示した図
、 第11図は本発明におけるテキストバッファTBUFの
構成を示した図、 第12図は本発明における同音語バッファDOBUFの
構成を示した図、 第13図は本発明におけるシステム分野フラグ5BUN
Fの構成を示した図、 第14図は本発明における外部記憶部DISKの構成を
示した図、 第15図〜第23図は本発明の文字処理装置の動作を示
すフローチャートである。 DISK   ・・・外部記憶部 CPU    ・・・マイクロプロセッサROM   
 ・・・読出し専用メモリRAM    ・・・ランダ
ムアクセスメモリIBUF   ・・・入カバッファ 0BUF DIC CTBL BUF 0BUF BUNF ・・・出力バッファ ・・・仮名漢字変換用辞書 ・・・文節候補テーブル ・・・テキストバッファ ・・・同音語バッファ ・・・システム分野フラグ 図 ■)標準分野での変換 はびきのしこんだにあるおうじんでんのうりょう7→羽
曳野仕込んだ荷ある追う陣天皇寮 2)標準分野+地名分野での変換 はびきのしこんだにあるおうしんでんのうりょう7→羽
曳野市誉田にある追う陣天皇寮 3)標準分野十歴史分野での変換 はびきのしこんだにあるおうしんでんのうりょう7→羽
曳野仕込んだ荷ある応神天皇陵 4)標準分野+地名分野+歴史分野での変換はびきのし
こんだにあるおうしんでんのうりょうl→羽曳野市重書
出ある応神天皇陵 ↓ 分野設定キー ↓ 「1」 ↓ 「1」 ↓ 実行キー 図 ↓ 実行キー ↓ 文書呼出キー ↓ 文書保存キー 図 ↓ 読み入力 ↓ 次候補キー ↓ 変換キー ↓ 選択キー 第 図 す外部記憶部DISKの構成 2)システムフラグ格納エリアの構成

Claims (1)

  1. 【特許請求の範囲】 1、読み列を入力する入力手段と、 読み、表記、分野を対応づけて記憶した辞書手段と、 どの分野の単語を変換すべきかを指定する分野情報を記
    憶する分野情報記憶手段と、 分野情報を前記分野情報記憶手段に設定する分野設定手
    段と、 前記辞書手段に基づき入力読み列を表記に変換する変換
    手段と、 前記分野情報を外部記憶装置に文書と対応づけて保存す
    る分野情報保存手段と、 前記分野情報を外部記憶装置から文書と共に呼び出す分
    野情報呼出手段とを具備し、 前記変換手段は分野情報の記述に従って変換に利用する
    単語を異にし、前記分野情報を必要なときに文書と共に
    外部記憶装置から呼び出すことができることを特徴とす
    る文字処理装置。
JP2150126A 1990-06-08 1990-06-08 文字処理装置 Pending JPH0442352A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2150126A JPH0442352A (ja) 1990-06-08 1990-06-08 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2150126A JPH0442352A (ja) 1990-06-08 1990-06-08 文字処理装置

Publications (1)

Publication Number Publication Date
JPH0442352A true JPH0442352A (ja) 1992-02-12

Family

ID=15490052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2150126A Pending JPH0442352A (ja) 1990-06-08 1990-06-08 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0442352A (ja)

Similar Documents

Publication Publication Date Title
US20010052900A1 (en) Apparatus and method for inputting chinese characters
JPH0442352A (ja) 文字処理装置
JPH0442348A (ja) 文字処理装置
JPH0442350A (ja) 文字処理装置
JPH0442347A (ja) 文字処理装置
JPH0442349A (ja) 文字処理装置
JPS628259A (ja) かな漢字変換方式
JPH0442351A (ja) 文字処理装置
JPS59100941A (ja) 仮名漢字変換装置
JPS60201467A (ja) 日本語処理装置
JP2713942B2 (ja) かな漢字変換装置
JPH03116363A (ja) 文字処理装置
JPH0447451A (ja) 文字処理装置
JPS62119665A (ja) ワ−ドプロセツサ
JPH03116371A (ja) 文字処理装置
JPH02255936A (ja) 文書作成編集装置
JPS5971534A (ja) 仮名漢字変換装置
JPS62190551A (ja) ワ−ドプロセツサ
JPH06187371A (ja) 圧縮地名データの格納方法及び読み出し方法
JPS61250772A (ja) かな漢字変換装置
JPH01204174A (ja) 文字処理装置
JPS60225975A (ja) 文節変換装置
JPH0447446A (ja) 文字処理装置
JPH03176759A (ja) 文字処理装置及びその方法
JPS5932032A (ja) 日本語情報処理装置