JPH07200569A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH07200569A
JPH07200569A JP5350241A JP35024193A JPH07200569A JP H07200569 A JPH07200569 A JP H07200569A JP 5350241 A JP5350241 A JP 5350241A JP 35024193 A JP35024193 A JP 35024193A JP H07200569 A JPH07200569 A JP H07200569A
Authority
JP
Japan
Prior art keywords
dictionary
field
word
character
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5350241A
Other languages
English (en)
Inventor
Chika Ogusu
千佳 小楠
Yuji Kobayashi
雄二 小林
Hiroki Suzuki
大記 鈴木
Atsushi Sakakibara
厚志 榊原
Hideyasu Suzuki
秀恭 鈴木
Shuichi Morisawa
秀一 森澤
Eiichiro Toshima
英一朗 戸島
Mayumi Morita
麻友美 森田
Hitoshi Yururi
仁志 緩利
Mariko Akiba
麻里子 秋葉
Risa Nakakoshi
里砂 中越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5350241A priority Critical patent/JPH07200569A/ja
Publication of JPH07200569A publication Critical patent/JPH07200569A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 文書の文脈に沿った文字列に変換する。 【構成】 CRT9に数式または化学式が出力された場
合、当該数式または化学式の分野をマイクロプロセッサ
1により判別し、判別された分野の文字列をROM2の
辞書を参照してマイクロプロセッサ1により優先的に変
換する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された文字列を単
語の表記に変換し変換結果を出力する文字処理装置に関
するものである。
【0002】
【従来の技術】日本文を入力する文字処理装置において
は、かな漢字変換を用いて文字を入力するのが普通であ
る。
【0003】(1) 従来は、数式や化学式が入力されたか
らといって、その後の変換が影響を受けることはなく、
辞書に予め与えてある頻度情報、またはそれに属する情
報等により文字列の出現頻度が決められている。
【0004】(2) また、従来は、分野を決定するある単
語が入力された場合のみ、かな漢字辞書に格納されてい
る分野情報を用いて、分野情報が付与されている単語を
優先して変換させることにより、入力者の入力している
文章で話題にしている分野を判断し、その文脈に沿った
かな漢字変換を可能にさせている。
【0005】
【発明が解決しようとする課題】しかしながら、上記
(1) の場合、文脈に沿った変換ができないという問題点
があった。例えば、化学式 2H2 + O2 = 2H2Oが入力され
た場合、化学分野が話題になっている可能性が高いはず
である。ここで、例えば、読み「じっけん」が入力され
たとする。従来ならば、辞書に予め与えてある頻度情報
等により、文脈とはなんら関係のない「実権」が第1候
補に変換されていた。
【0006】上記(2) の場合、ある1つの意味を示す単
語のまとまり(句)では、分野を決定することができな
いという問題点があった。そのため、例えば、「犬も歩
けば棒に当たる」という単語のまとまり(句)が入力さ
れた場合、「ことわざ」分野としたいときは、まず、
「いぬ」、「歩く」、「棒」、「当たる」に、それぞ
れ、「ことわざ」分野情報を付与する方法が考えられ
る。しかし、それぞれの単語は、その単語自体の使用頻
度が高く、その単語が使用されたからといって「ことわ
ざ」分野と判断してしまうことは、非常に危険なことで
あり、誤変換の元である。また、各単語に「ことわざ」
分野情報を付与した場合は、辞書の容量の点からいって
も無駄である。
【0007】また、上記従来の技術では、入力された文
字の書体によって、分野を決定することができないとい
う問題点があった。そのため、例えば、手紙でよく用い
られる毛筆書体で文字が入力されていても、手紙文でよ
く用いられる単語が優先的に変換されるようなことはな
かった。
【0008】また、上記従来の技術では、入力された文
字種によって、分野を決定できないといった問題点があ
った。そのため、例えば、カタカナ語が多用されている
ような文章でも、外来語が優先的に変換されるようなこ
とはなかった。
【0009】また、上記従来の技術では、ある分野を示
す特徴的なイラストが入力された後でも、その分野を決
定できないといった問題があった。そのため、例えば
「〒」が入力されても、その後の変換において住所地名
が優先されて変換されるようなことはなかった。
【0010】本発明の第1の目的は、数式や化学式が入
力されたら、それ以降の変換においては、その入力され
た数式や化学式が属する分野と同一分野に属する単語を
優先して変換させることができる文字処理装置を提供す
ることにある。
【0011】本発明の第2の目的は、ある書体によって
文字が入力されたら、それ以降の変換においては、その
入力された書体が属する分野と同一分野に属する単語を
優先して変換させることができる文字処理装置を提供す
ることにある。
【0012】本発明の第3の目的は、入力された文字種
によって、それ以降の変換においては、その文字種が属
する分野と同一分野に属する単語を優先して変換させる
ことができる文字処理装置を提供することにある。
【0013】本発明の第4の目的は、ある意味を示す単
語のまとまり(句)が入力された時、それ以降の変換に
おいて、その入力された単語のまとまり(句)と同一分
野に属する単語を優先して変換させることができる文字
処理装置を提供することにある。
【0014】本発明の第5の目的は、あるイラストが入
力されたら、それ以降の変換においては、その入力され
たイラストが属する分野と同一の分野に属する単語を優
先して変換させることができる文字処理装置を提供する
ことにある。
【0015】
【課題を解決するための手段】本発明は、単語の読みと
表記と分野属性とを予め対応させた辞書を記憶した第1
辞書記憶手段と、入力された文字列から単語の表記への
変換結果を出力する出力手段と、出力手段により数式ま
たは化学式が出力された場合に当該数式または化学式の
分野を判別する第1判別手段と、第1判別手段により判
別された分野の文字列を第1辞書記憶手段の辞書を参照
して優先的に変換する第1変換手段とを具備したことを
特徴とする。
【0016】本発明は、単語の読みと表記と分野属性と
を予め対応させた辞書を記憶した第1辞書記憶手段と、
入力された文字列から単語の表記への変換結果を出力す
る出力手段と、出力手段により書体が出力された場合に
当該書体の分野を判別する第2判別手段と、第2判別手
段により判別された分野の文字列を第1辞書記憶手段の
辞書を参照して優先的に変換する第2変換手段とを具備
したことを特徴とする。
【0017】本発明は、単語の読みと表記と分野属性と
を予め対応させた辞書を記憶した第1辞書記憶手段と、
入力された文字列から単語の表記への変換結果を出力す
る出力手段と、出力手段により文字種が出力された場合
に当該文字種の分野を判別する第3判別手段と、第3判
別手段により判別された分野の文字列を第1辞書記憶手
段の辞書を参照して優先的に変換する第3変換手段とを
具備したことを特徴とする。
【0018】本発明は、入力された文字列を単語の表記
に変換し変換結果を出力する文字処理装置において、単
語のまとまりとその単語のまとまりが属する分野とを予
め対応付けた辞書を記憶した第2辞書記憶手段と、出力
された単語のまとまりが第2辞書記憶手段の辞書にある
分野に該当するか否かを判定する第4判定手段と、第4
判定手段により肯定判定された場合に当該分野の文字列
をそれ以後に優先的に変換する第4変換手段とを具備し
たことを特徴とする。
【0019】本発明は、入力された文字列を単語の表記
に変換し変換結果を出力する文字処理装置において、記
号またはイラストと該記号またはイラストが属する分野
を予め対応付けた辞書を記憶した第3辞書記憶手段と、
出力された記号またはイラストが第3辞書記憶手段の辞
書にある分野に該当するか否かを判定する第5判定手段
と、第5判定手段により肯定判定された場合に当該分野
の文字列をそれ以後に優先的に変換する第5変換手段と
を具備したことを特徴とする。
【0020】
【作用】本発明では、出力手段により数式または化学式
が出力された場合に当該数式または化学式の分野を第1
判別手段により判別し、判別された分野の文字列を第1
辞書記憶手段の辞書を参照して第1変換手段により優先
的に変換する。
【0021】本発明では、出力手段により書体が出力さ
れた場合に当該書体の分野を第2判別手段により判別
し、判別された分野の文字列を第1辞書記憶手段の辞書
を参照して第2変換手段により優先的に変換する。
【0022】本発明では、出力手段により文字種が出力
された場合に当該文字種の分野を第3判別手段により判
別し、判別された分野の文字列を第1辞書記憶手段の辞
書を参照して第3変換手段により優先的に変換する。
【0023】本発明では、出力された単語のまとまりが
第2辞書記憶手段の辞書にある分野に該当するか否かを
第4判定手段により判定し、肯定判定された場合に、そ
れ以後、当該分野の文字列を第4変換手段により優先的
に変換する。
【0024】本発明では、出力された記号またはイラス
トが第3辞書記憶手段の辞書にある分野に該当するか否
かを第5判定手段により判定し、肯定判定された場合
に、それ以後、当該分野の文字列を第5変換手段により
優先的に変換する。
【0025】
【実施例】以下、本発明の実施例を図面を参照して詳細
に説明する。
【0026】<第1実施例>図1は本発明の第1実施例
を示す。図1において、1はマイクロプロセッサであ
り、文字処理のための演算、論理判断等を行い、アドレ
スバス(AB)、コントロールバス(CB)、データバス(DB)に
接続された各構成要素を制御するものである。
【0027】アドレスバス(AB)はマイクロプロセッサ1
の制御の対象とする構成要素を指示するアドレス信号を
転送するためのものである。コントロールバス(CB)はマ
イクロプロセッサ1の制御の対象とする各構成要素のコ
ントロール信号を転送して印加するものである。データ
バス(DB)は各構成要素間のデータの転送を行うものであ
る。キーボード1からの入力が供給されると、まず、イ
ンタラプト信号がマイクロプロセッサ1に送られ、その
マイクロプロセッサ1がROM(read only memory)2に
記憶してある各種の制御信号を読み出し、それらの制御
信号にしたがって、各種の制御を行う。
【0028】2はROMであり、図4ないし図6を参照
して後述するマイクロプロセッサ1による制御手順と、
単語辞書を記憶させてある。単語辞書は「読み」、「表
記」、「文法情報」、どの分野に属する単語かの「分野
情報」を対応させて記憶させてあり、かな漢字変換等で
参照される。
【0029】3は1ワード16ビットの構成のRAM(r
andom access memory)であり、各構成要素からの各種デ
ータの一時記憶に用いられる。エリアTBUFはテキストバ
ッファであり、図3を参照して後述する、作成編集され
る文書データを記憶するためのものである。エリアDBIN
D は同音語バッファエリアの索引を格納するためのもの
である。エリアDBBDY は図5を参照して後述する同音語
バッファエリアの本体部である。エリアKBBUF は入力さ
れた読み列を蓄えるためのキーボードバッファである。
【0030】4はキーボードであり、アルファベットキ
ー、ひらがなキー、かたかなキー等の文字記号入力キ
ー、および変換キー等の本文字処理装置に対する各種機
能を指示するための各種のファンクションキーを備えて
いる。
【0031】5は外部記憶装置であり、テキストバッフ
ァTBUF上に作成された文書の保管を行い、保管された文
書はキーボードの指示により、必要なときに呼び出され
る。
【0032】6はカーソルレジスタであり、マイクロプ
ロセッサ1によりその内容の読み書きがされる。後述す
るCRT コントローラ8はカーソルレジスタ6に蓄えられ
たアドレスに対するCRT上9の位置にカーソルを表示
する。
【0033】7は表示用バッファメモリであり、表示す
べきデータのパターンを蓄えるものである。文書データ
の内容を表示するときは、テキストバッファTBUF上のデ
ータに基づいてデータバッファDBUFにパターン展開する
ことにより行われる。
【0034】8はCRT コントローラであり、カーソルレ
ジスタ6およびデータバッファDBUFに蓄えられている内
容を表示するため、CRT9を駆動制御するものであ
る。
【0035】9はCRTであり、ドット構成のパターン
およびカーソルの表示をCRT コントローラにより制御さ
れる。
【0036】10はキャラクタジェネレータであり、C
RT9に表示する文字、記号のパターンを記憶するため
のものである。
【0037】図2は辞書の一例を示す。単語は単語の読
み列である「読み」(20文字)と、その「読み」の表
記である「表記」(20文字)と、その単語の持つ文法
情報を示す「文法情報」(10文字)と、単語の属する
分野を示す「分野情報」の4つの情報を固定長の辞書上
に持つ。「分野情報」には、「技術分野」に属する場
合、「技術」という情報が与えられ、「数学分野」に属
する場合は「数学」という情報が与えられる。例えば、
「化学分野」に属する「実験」は、読み「じっけん」、
表記「実験」、文法情報「サ変名詞」、分野情報「化
学」という情報を辞書上に持つ。また、「化学」に属さ
ない「実権」は、「分野情報」には何も持たない。
【0038】図3は作成編集中の文書データの内容を格
納するテキストバッファTBUFの全体構成を示す。
【0039】文書は、図3(a)に示すように、文字の
羅列として記憶されている。
【0040】各文字の構成は、図3(b)に示すように
なっており、1文字は2バイトで構成される。MSB (2
14ビット)は同音語フラグであり、残りの部分(214〜
20ット)はコード部である。同音語フラグはその文字
が同音語であるか、通常文字であるかを指示し、0の場
合、通常文字であり、1の場合、同音語である。通常文
字の場合は、コード部に文字コードがJIS X 0208コード
で記憶される。同音語の場合は、コード部に同音語番号
が格納される。同音語番号は同音語バッファエリアの索
引部かインデックスとなり、特定の同音語バッファを指
定する。
【0041】図4はキー入力を取り込み、処理を行う手
順を示すフローチャートである。
【0042】ステップ401にて、キーボード4からの
データをキーボードバッファKBBUF取り込み、ステップ
402にて、キーボードバッファKBBUF に存在するキー
の種類を判別する。かな漢字変換キーのデータが含まれ
ている場合は、ステップ403に移行し、ステップ40
3にて、かな漢字変換を行い、ステップ405にて、変
換結果である「表記」を表示する。
【0043】他方、キーボードバッファKBBUF にその他
のキーのデータが含まれている場合は、ステップ404
に移行し、ステップ404にて、カーソルの移動、挿
入、削除等の一般の文字処理装置でみられるその他の処
理を行い、ステップ405にて、その他の処理の結果を
表示する。
【0044】図5はかな漢字変換処理手順の一例を示す
フローチャートである。
【0045】ステップ501にて、入力された「読み」
を、単語辞書、文法辞書等を参照して形態素解析、構文
解析等を行い文節に分割し、ステップ502にて、「化
学式」または「数式」が入力されたか否かを判定する。
否定判定された場合は、ステップ503にて、通常のか
な漢字変換を行い、ステップ507にて、変換結果の表
示を行う。
【0046】他方、ステップ502にて肯定判定された
場合は、ステップ504に移行し、ステップ504に
て、かな漢字変換を行い、入力された読みを解析し、変
換候補を作成し、されらの変換候補のうちどれがもっと
もらしいかを判断し、最ももっともらしい語を第1候補
として決定する。ステップ505にて、決定された第1
候補に基づいて同音語を作成する。ステップ505にて
判定した結果、同音語を持っている場合は、ステップ5
06に移行し、ステップ506にて、辞書内の「分野情
報」を参照し、「化学式」が入力されていた場合は、
「分野属性」が「化学」の単語の中から最ももっともら
しい語を第1候補として決定し、「数式」が入力されて
いた場合は、「分野属性」が「数式」の単語の中から最
ももっともらしい語を第1候補として決定する。そし
て、ステップ507にて、第1候補の単語を表示する。
【0047】次に、図6を参照してかな漢字変換を説明
する。図6において、CRT は表示画面である。CMはカー
ソルであり、づきにキー入力を行ったとき文字が入って
いく位置を示す。TSはテキスト画面であり、テキストバ
ッファTBUF(図1)に記憶されている文書の内容が表示
される。MSはモニタラインであり、入力されるキーデー
タが逐一表示されるエリアである。かな漢字変換等を行
う場合は、一旦、モニタラインMSに読み列が表示され、
変換後、変換結果がテキスト画面TS上に転送される。
【0048】図6(a)を参照して通常のかな漢字変換
を説明する。通常のかな漢字変換の場合は、操作者はテ
キストバッファTBUFに化学式「2H2 + O2 = 2H2O 」を入
力し、ついで、かな漢字変換しようとして、読み「じっ
けん」をキー入力し、かな漢字変換キー「/」を入力す
る。「じっけん/」がかな漢字変換され、予め持ってい
る文法情報の中の頻度情報により「じっけん」となり、
テキスト画面に入っていく。
【0049】図6(b)を参照して本発明に係るかな漢
字変換を説明する。このかな漢字変換の場合は、操作者
はテキストバッファTBUFに化学式「2H2 + O2 = 2H2O 」
を入力し、ついで、かな漢字変換しようとして、読み
「じっけん」をキー入力し、かな漢字変換キー「/」を
入力する。「じっけん/」がかな漢字変換されるが、こ
のとき、辞書の「分野情報」が参照され、分野属性が
「化学」である「実験」とかな漢字変換され、テキスト
画面に入っていく。
【0050】本実施例では、辞書を固定長で持つ例を説
明したが、辞書を可変長で持つこともできる。固定長の
辞書は、単語の読み列である「読み」、その「読み」の
表記である「表記」、その「表記」の持つ文法情報を示
す「文法情報」、単語の属する分野名を示す「分野情
報」の4つの情報を持つが、各データの終りにそれぞれ
データの終りを示すコードを入れることにより辞書を可
変長のものにすることができる。
【0051】本実施例では、「化学式」や「数式」の例
を説明したが、「書体」、例えば、「毛筆書体」で文章
が入力された場合は、予め定めた「手紙分野」に属する
単語を優先して変換させるようにしても良い。
【0052】また、分野を特定する文字種、例えば、カ
タカナ語が多用されている文章を入力している場合は、
外来語の頻度を、そうでない単語の頻度より高くするこ
とにより、変換効率をより高くすることができる。
【0053】<第2実施例>図7は本発明の第2実施例
を示す。図7において、1,4〜10は図1と同一部分
を示す。72はROMであり、図12ないし図14を参
照して後述するマイクロプロセッサ1による制御手順、
単語辞書、および単語のまとまり(句)と、分野情報を
対応させた分野処理辞書を有する。73は1ワード16
ビット構成のRAMであり、テキストバッファTBUFと、
分野情報バッファBBUFと、キーボードバッファKBBUF を
有し、各構成要素からの各種データの一時記憶に用いら
れる。テキストバッファTBUFは図10を参照して後述す
るように作成編成される文書データを記憶するエリアで
ある。分野情報バッファBBUFは後述するように単語のま
とまり(句)と分野情報を対応付けた辞書にある「分野
情報」を格納するためのエリアである。キーボードバッ
ファKBBUF は入力された読み列を蓄えるためのエリアで
ある。
【0054】ROM72に格納される分野処理辞書の構
成を図8に示す。単語は、単語のまとまり(句)の読み
列である「読み」(30文字)と、その「読み」の表記
である「表記」(30文字)と、その単語のまとまり
(句)の属する分野情報を示す「分野情報」(2文字)
を示す3つの情報を固定長の辞書上に持つ。「分野情
報」には、手紙分野に属する場合には「1」が与えら
れ、諺分野に属する場合には「2」という情報が与えら
れる。例えば、手紙分野に属する句「ますますご清祥の
ことと存じます」は、読み「ますますごせいしょうのこ
ととぞんじます」、表記「ますますご清祥のことと存じ
ます」、手紙分野の単語であるという情報を示す「1」
を辞書上に持つ。
【0055】図9は「分野」情報を格納したかな漢字変
換用の単語辞書である。単語は単語の読み列である「読
み」(20文字)、その「読み」の表記であるところの
「表記」(20文字)、その単語の品詞情報を示す「品
詞情報」(10文字)、その単語の属する分野情報を示
す「分野情報」(2文字)を示す4つの情報を固定長の
辞書上に持つ。「分野情報」には、手紙分野に属する場
合には、「1」という情報が与えられ、医学分野に属す
る場合には「3」という情報が与えられる。例えば、
「手紙分野」に属する単語「盛夏」は、よみ「せい
か」、表記「盛夏」、文法情報「手紙」料理分野の単語
であるという情報を示す「1」を辞書上に持つ。どの
「分野」にも属さない「成果」には、「分野情報」が付
与されない。
【0056】図10(a)は図7に示すテキストバッフ
ァTBUFの全体の構成を示す図である。文書は文字の羅列
として記憶されている。
【0057】図10(b)は各文字の構成を示す図であ
る。1文字は2バイトで構成される。MSB (215ビッ
ト)は同音語フラグであり、残りの部分(214〜20 ビ
ット)はコード部である。同音語フラグはその文字が同
音語であるか、通常文字であるかを指示し、0のときは
通常文字であり、1のときは同音語である。通常文字の
ときはコード部に文字コードがJIS X 0208コードで記憶
される。同音語の時は、コード部に同音語番号が格納さ
れる。同音語番号は同音語バッファエリアの索引部かイ
ンデックスとなり、特定の同音語バッファを指定する。
【0058】図11は図7に示す分野情報バッファBBUF
の構成を示す。入力された文字列が単語のまとまり
(句)と「分野情報」を対応付けた辞書に存在した場
合、入力された単語のまとまり(句)に付与されている
「分野情報」を格納しておくエリアであり、かな漢字変
換用辞書においてどの分野に所属する単語を変換すれば
良いかを示す。
【0059】図12はかな漢字変換が何も行われていな
い状態でキー入力を取り込み、処理を行う手順を示すフ
ローチャートである。
【0060】ステップ1201にて、キーボード4から
のデータをキーボードバッファKBBUF に取り込み、ステ
ップ1201にて、キーボードバッファKBBUF 内にかな
漢字変換キーのデータが含まれているか否かを判定す
る。
【0061】かな漢字変換キーのデータが含まれている
場合は、ステップ1203に移行し、ステップ1203
にて、かな漢字変換を行う。そして、ステップ1205
にて、変換された単語列に「単語のまとまり(句)と分
野情報を対応付けた辞書」に存在するデータか否かを判
断する。肯定判断された場合は、ステップ1206に移
行し、ステップ1206にて、分野情報を格納し、ステ
ップ1207にて、変換結果である「表記」を表示す
る。他方、ステップ1205にて否定判定された場合
は、ステップ1207にて、ステップ1203のかな漢
字変換結果を表示する。
【0062】他方、ステップ1202にて否定判定され
た場合は、ステップ1204に移行し、ステップ120
4にて、その他の処理、すなわち、カーソルの移動、挿
入、削除等の一般の文字処理装置において見られるその
他の処理を行い、ステップ1207にて、その他の処理
結果を表示する。
【0063】図13は「単語のまとまり(句)と分野情
報を対応付けた辞書」に存在するデータである場合の変
換手順を示すフローチャートであり、変換が行われた後
のキー入力を取り込み、処理を行うフローチャートであ
る。
【0064】ステップ1301にて、キーボード4から
のデータをキーボードバッファKBBUF に取り込み、ステ
ップ1302にて、キーの種類を判定する。
【0065】キーボードバッファKBBUF 内にかな漢字変
換キーのデータが含まれている場合は、ステップ130
3に移行し、ステップ1303にて、かな漢字変換を行
う。そして、ステップ1305にて、変換しようとする
単語に分野情報を持っているか否かを判定する。肯定判
定された場合はステップ1306に移行し、ステップ1
306にて、既に格納されている分野情報が同一である
か否かを判定する。肯定判定された場合は、ステップ1
307に移行し、ステップ1307にて、同一分野に属
する単語を変換し、ステップ1308にて「表記」を表
示する。他方、ステップ1306にて否定判定された場
合は、ステップ1308にて、ステップ1303で変換
された変換結果である「表記」を表示する。
【0066】他方、ステップ1305にて否定判定され
た場合は、ステップ1308に移行し、ステップ130
8にて変換結果を示す。
【0067】ステップ1302にて判定した結果、キー
ボードバッファKBBUF 内にその他のキーのデータが含ま
れている場合は、カーソルの移動、挿入、削除等の一般
の文字処理装置において見られるその他の処理を行う。
【0068】本実施例では、辞書を固定長で持つ例を説
明したが、可変長でもつこともできる。「読み」固定長
の辞書は、単語の読み列である「読み」、その「読み」
の表記である「表記」、その「表記」の持つ文法情報を
示す「文法情報」、単語の属する分野名を示す「分野情
報」の4つの情報を持つが、各データの終りにそれぞれ
データの終りを示すコードを入れることにより辞書を可
変長のものにすることができる。
【0069】図14を参照して本発明に係る文字処理装
置の操作例を示す。
【0070】まず、図14(a)を参照してかな漢字変
換を説明する。「手紙分野」を示す特徴的な単語のまと
まり(句)の読み「じかますますごせいしょうのことと
ぞんじます」を入力し(S1401)、入力された文を
「時下ますますご清祥のことと存じます」と変換する
(S1402)。「時下ますますご清祥のことと存じま
す」が選択された以降でも、従来のかな漢字変換と同様
にして、辞書に予め与えてある情報や変換情報に従って
漢字変換が行われ(S1403)、読み「せいか」に対
し、表記「成果」が変換される(S1401)。
【0071】図14(b)を参照して、本発明に係るか
な漢字変換を説明する。従来ならば、辞書に予め与えて
ある情報や変換情報に従って漢字変換が行われる(S1
403)が、「時下ますますご清祥のことと存じます」
が変換されたことにより、入力しようとしている文章の
話題が「手紙分野」であると判定され、「せいか」が入
力されると(S1411)、同じ「手紙分野」に属する
「盛夏」が変換される(S1412)。
【0072】本実施例で用いられた単語のまとまり
(句)とその単語のまとまり(句)が属する分野とを対
応付けて記憶した分野処理辞書は、単語のまとまり
(句)の「読み」と「表記」の属する「分野情報」を持
っていたが、その「読み」と「分野情報」だけの組み合
わせ、「表記」と「分野情報」だけの組み合わせとして
も良い。例えば、「読み」「あけましておめでとうござ
います」だけでも「手紙分野」と判定したり、「表記」
「明けましておめでとうございます」と変換されただけ
でも「手紙分野」と判定されたりする。
【0073】本実施例では、分野情報を保有することが
できるものは、単語のまとまり(句)として述べてきた
がそれだれでなく、記号でも、イラストでも可とする。
例えば、記号「〒」に「住所分野」情報を付与し、地名
が優先されて変換するようにしたり、イラスト
【0074】
【外1】
【0075】に「観光地分野」情報を付与し、観光地名
が優先されて変換するようにする。
【0076】
【発明の効果】以上の説明から明らかなように本発明に
よれば、まず「化学式」と「数式」などが入力された以
降の変換においては、数式や化学式と同じ分野属性を持
つ単語の出現頻度を、同じ分野属性を持たない単語の出
現頻度より高くさせることにより、入力者の入力する文
書の文脈に沿ったかな漢字変換を可能にさせ、また、入
力文中の誤表記を防ぐことにより、非常に操作性の高い
文字処理装置を実現することができる。
【0077】また、本発明によれば、ある書体で入力さ
れたら、それ以降の変換においてはその書体と同じ分野
属性を持つ単語の出現頻度を、同じ分野属性を持たない
単語の出現頻度より高くさせることにより、入力者の入
力する文書の文脈に沿ったかな漢字変換を可能にさせ、
また、入力文中の誤表記を防ぐことにより、非常に操作
性の高い文字処理装置を実現することができる。
【0078】また、本発明によれば、ある文字種によっ
て入力されたら、それ以降の変換においては、その文字
種と同じ分野属性を持つ単語の出現頻度を、同じ分野属
性を持たない単語の出現頻度より高くさせることによ
り、入力者の入力する文書の文脈に沿ったかな漢字変換
を可能にさせ、また、入力文中の誤表記を防ぐことによ
り、非常に操作性の高い文字処理装置を実現することが
できる。
【0079】また、本発明によれば、ある意味を示す単
語のまとまり(句)が入力された時、それ以降の変換に
おいてはその意味を示す単語のまとまり(句)と同じ分
野属性を持つ単語の出現頻度を、同じ分野属性を持たな
い単語の出現頻度より高くさせることにより、入力者の
入力する文書の文脈に沿ったかな漢字変換を可能にさ
せ、また、入力文中の誤表記を防ぐことにより、非常に
操作性の高い文字処理装置を実現することができる。
【0080】また、本発明によれば、あるイラストが入
力されたら、それ以降の変換においてはそのイラストと
同じ分野属性を持つ単語の出現頻度を、同じ分野属性を
持たない単語の出現頻度より高くさせることにより、入
力者の入力する文書の文脈に沿ったかな漢字変換を可能
にさせ、また、入力文中の誤表記を防ぐことにより、非
常に操作性の高い文字処理装置を実現することができ
る。
【図面の簡単な説明】
【図1】本発明の第1実施例を示すブロック図である。
【図2】第1実施例に係る辞書の構成を示す図である。
【図3】文章の構成を示す図である。
【図4】キー入力を取り込み、処理を行う手順を示すフ
ローチャートである。
【図5】かな漢字変換処理手順の一例を示すフローチャ
ートである。
【図6】操作例を説明するための説明図である。
【図7】本発明の第2実施例を示すブロック図である。
【図8】単語のまとまり(句)と分野情報を対応付けた
辞書の一例を示す図である。
【図9】かな漢字変換用辞書の構成を示す図である。
【図10】文書の構成例を示す図である。
【図11】分野情報バッファの較正令を示す図である。
【図12】かな漢字変換が何も行われていない状態でキ
ー入力を取り込み、処理を行う手順を示すフローチャー
トである。
【図13】「単語のまとまり(句)と分野情報を対応付
けた辞書」に存在するデータである場合の変換手順を示
すフローチャートであり、変換が行われた後のキー入力
を取り込み、処理を行うフローチャートである。
【図14】操作例を説明するための説明図である。
【符号の説明】
1 マイクロプロセッサ 2,72 ROM 3,73 RAM 4 キーボード 5 外部記憶装置 6 カーソルレジスタ 7 表示用バッファメモリ 8 CRT コントローラ 9 CRT 10 キャラクタジェネレータ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 榊原 厚志 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 鈴木 秀恭 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 森澤 秀一 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 戸島 英一朗 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 森田 麻友美 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 緩利 仁志 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 秋葉 麻里子 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 中越 里砂 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 単語の読みと表記と分野属性とを予め対
    応させた辞書を記憶した第1辞書記憶手段と、 入力された文字列から単語の表記への変換結果を出力す
    る出力手段と、 該出力手段により数式または化学式が出力された場合に
    当該数式または化学式の分野を判別する第1判別手段
    と、 該第1判別手段により判別された分野の文字列を前記第
    1辞書記憶手段の辞書を参照して優先的に変換する第1
    変換手段とを具備したことを特徴とする文字処理装置。
  2. 【請求項2】 単語の読みと表記と分野属性とを予め対
    応させた辞書を記憶した第1辞書記憶手段と、 入力された文字列から単語の表記への変換結果を出力す
    る出力手段と、 該出力手段により書体が出力された場合に当該書体の分
    野を判別する第2判別手段と、 該第2判別手段により判別された分野の文字列を前記第
    1辞書記憶手段の辞書を参照して優先的に変換する第2
    変換手段とを具備したことを特徴とする文字処理装置。
  3. 【請求項3】 単語の読みと表記と分野属性とを予め対
    応させた辞書を記憶した第1辞書記憶手段と、 入力された文字列から単語の表記への変換結果を出力す
    る出力手段と、該出力手段により文字種が出力された場
    合に当該文字種の分野を判別する第3判別手段と、 該第3判別手段により判別された分野の文字列を前記第
    1辞書記憶手段の辞書を参照して優先的に変換する第3
    変換手段とを具備したことを特徴とする文字処理装置。
  4. 【請求項4】 入力された文字列を単語の表記に変換し
    変換結果を出力する文字処理装置において、 単語のまとまりとその単語のまとまりが属する分野とを
    予め対応付けた辞書を記憶した第2辞書記憶手段と、 出力された単語のまとまりが前記第2辞書記憶手段の辞
    書にある分野に該当するか否かを判定する第4判定手段
    と、 該第4判定手段により肯定判定された場合に当該分野の
    文字列をそれ以後に優先的に変換する第4変換手段とを
    具備したことを特徴とする文字処理装置。
  5. 【請求項5】 入力された文字列を単語の表記に変換し
    変換結果を出力する文字処理装置において、 記号またはイラストと該記号またはイラストが属する分
    野を予め対応付けた辞書を記憶した第3辞書記憶手段
    と、 出力された記号またはイラストが前記第3辞書記憶手段
    の辞書にある分野に該当するか否かを判定する第5判定
    手段と、 該第5判定手段により肯定判定された場合に当該分野の
    文字列をそれ以後に優先的に変換する第5変換手段とを
    具備したことを特徴とする文字処理装置。
JP5350241A 1993-12-29 1993-12-29 文字処理装置 Pending JPH07200569A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5350241A JPH07200569A (ja) 1993-12-29 1993-12-29 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5350241A JPH07200569A (ja) 1993-12-29 1993-12-29 文字処理装置

Publications (1)

Publication Number Publication Date
JPH07200569A true JPH07200569A (ja) 1995-08-04

Family

ID=18409180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5350241A Pending JPH07200569A (ja) 1993-12-29 1993-12-29 文字処理装置

Country Status (1)

Country Link
JP (1) JPH07200569A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023805A (ja) * 2004-07-06 2006-01-26 Mitsubishi Electric Corp 携帯機器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023805A (ja) * 2004-07-06 2006-01-26 Mitsubishi Electric Corp 携帯機器

Similar Documents

Publication Publication Date Title
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
EP0370774A2 (en) Machine translation system
JPS6355085B2 (ja)
JPH05303590A (ja) 自動翻訳装置
JPH07200569A (ja) 文字処理装置
JP2862236B2 (ja) 文字処理装置
JPS60207948A (ja) カナ漢字変換処理装置
JPS5998236A (ja) 日本文入力装置
JPH0731679B2 (ja) 文字処理装置
JPH0728800A (ja) 文字処理方法および文字処理装置
JPH0895972A (ja) 文字処理装置及びその処理方法
JPH04160668A (ja) 文字処理装置
JPH0442350A (ja) 文字処理装置
JPS5840650A (ja) 日本文入力方式
JPH08194701A (ja) 文字処理装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPS608922A (ja) 日本語処理装置
JPH01204174A (ja) 文字処理装置
JPH0798702A (ja) 文書作成装置
JPH0628062B2 (ja) 文字処理装置及びその方法
JPS60136863A (ja) カナ漢字変換装置における短縮変換方式
JPH0736188B2 (ja) 文字処理装置
JPH0731680B2 (ja) 文字処理装置
JPH0816569A (ja) 文書処理装置
JPH0623974B2 (ja) 文字処理装置