JPH0497477A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH0497477A
JPH0497477A JP2214983A JP21498390A JPH0497477A JP H0497477 A JPH0497477 A JP H0497477A JP 2214983 A JP2214983 A JP 2214983A JP 21498390 A JP21498390 A JP 21498390A JP H0497477 A JPH0497477 A JP H0497477A
Authority
JP
Japan
Prior art keywords
word
notation
character
character string
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2214983A
Other languages
English (en)
Inventor
Naomi Suzuki
直美 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2214983A priority Critical patent/JPH0497477A/ja
Publication of JPH0497477A publication Critical patent/JPH0497477A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文書処理装置に関し、特に、例えば、文書作成
及び編集を行う文書処理装置に関する。
[従来の技術] 従来、かな漢字変換処理を行なう文書処理装置において
、入力したかな文字列を、かな漢字変換し複数の異なる
文字が変換結果とじてか得られる(いわゆる同音異義語
)場合、これを出力する順序は、変換処理に利用する単
語辞書にあらかじめ登録されている単語使用頻度及び文
書処理装置利用者の単語使用頻度などの情報を利用して
決定されていた。また、1つの単語に複数の文字種によ
る表記法がある場合、利用者が複数の表記の中から望む
表記を選択する作業を単語ごとに行っていた。
[発明が解決しようとする課題] しかしながら上記従来例では、1つの単語を2種類以上
の文字種で表わすことができる場合(例えば、虎は°゛
とら”、“トラ”、゛虎゛°と表記できる。)、かな漢
字変換結果の出力順の決定において、単語の意味分類(
例えば、゛虎°゛という単語は“動物°°という意味分
類に分類される。)を考慮しないため、同じ意味分類の
単語表記をすべて1種類の表記法に統一するためには、
利用者自身が該当する単語1つ1つを望む表記にするた
めの選択作業をしなければならなかった。特に、利用者
が、あらかじめ、ある意味分類に属する単語をどのよう
な表記にするかを考慮していたにもかかわらず、文書量
が多く、利用者にとって望ましくない表記が頻繁に出力
された場合、表記選択作業をやり直さなければならず、
また、それは操作ミスをまねき利用者にとって大きな負
担となっているという欠点があった。
本発明は上記従来例に鑑みてなされたもので、読みに対
応する表記が複数存在する場合、単語の意味分類を考慮
し、意味分類ごとに統一した表記文字種を優先候補とし
て出力できる文書処理装置を提供することを目的とする
[課題を解決するための手段] 上記目的を達成するために本発明の文書処理装置は以下
の様な構成からなる。即ち、 入力された文字列をかな漢字変換処理したのち出力する
文書処理装置において、前記文字列の読みと、前記読み
に対応する表記と、前記読みと表記が表す単語の範疇を
格納する第1記憶手段と、前記範疇と前記範疇に属する
単語を表記すべき文字種別を格納する第2記憶手段と、
前記文字列の読みに基づいて、前記第1記憶手段から対
応する表記を検索する検索手段と、前記検索手段によっ
て出力された表記を、前記第2記憶手段に格納された文
字種別と比較し、前記計略に対応した表記を出力するよ
う制御する制御手段とを有することを特徴とする文書処
理装置を備える。
[作用] 以上の構成により本発明は、入力された文字列と一致す
る読みを持つ単語の意味を調べ、意味に応じた表記を優
先して出力するよう動作する。
[実施例コ 以下添付図面を参照して本発明の好適な実施例を詳細に
説明する。
第1図は本発明の代表的な実施例である文書処理装置の
構成を示すブロック図である。第1図において、文書処
理装置は、CPUl0、コントロールバス(CB)20
、データバス(DB)30、アドレスバス(AB)40
.ROM50、RAM60、キーボード(KB)70、
カーソルレジスタ(CR)80、表示データバッファ(
DBUF)90、CRT制御部(CRTC)100、C
RTI 10、キャラクタジェネレータ(CG)120
及びディスク(DISK)130とから構成されている
このような文書処理装置で、CPLIIOは、文字処理
のための演算及び論理判断等を行ない各種バスを介して
、それらのバスに接続された構成要素を制御する。ここ
で各種バスの内、アドレスバス(AB)40は、CPU
l0の制御対象となる構成要素を指示するアドレス信号
を転送する。また、コントロールバス(CB)20はC
PUl0の制御対象とする各構成要素のコントロール信
号を転送する。さらに、データバス(DB)30は各構
成機器相互間のデータの転送を行なう。
ROM50内には、かな漢字変換処理にための単語辞書
(以後、これをDICTという。)が格納されている。
第3図にDICTの構造を示す。
DICTには、単語各々について、単語の読み、その表
記及び意味分類とが辞書情報として単語の読みコード順
に昇順にソーティングされて登録されている。また、R
OM50内にはDICT以外に、後述の入出力制御プロ
グラムがCN T Lとラベルされた領域に、同様に後
述の同じ意味分類に属する単語を同一の文字種に変換す
る変換処理プログラムがCNVTとラベルされた領域に
格納される。
一方、RAM60は、各構成要素からの各種データの一
時記憶に用いられる。RAM60内には、意味分類とそ
れに対する優先して出力すべき文字種を対にして格納し
た表記規則集(以後、RLと呼ぶ。)を格納する領域、
入力文字列を保存する領域(以後、YBと呼ぶ。)、入
力文字列を変換した結果を表示するために一時的に保存
する領域(以後、TBと呼ぶ。)、入力文字列と読みが
一致する単語の表記データを格納する領域(以後、HB
と呼ぶ。)及びHBに格納される表記データの意味分類
を格納する領域(以後、IBと呼ぶ。)が確保される。
第4図にRLの構造を示す。
CRT制御部(CRTC)100は、CR80及びDB
UF90に蓄えられたデータ内容をドツトパターンとし
てCRTIIOに表示するための制御及びCRTllo
上にカーソル表示するための制御を行う。
CG120は、CRTIIOに表示する文字及び記号の
ドツトパターンを記憶するキャラクタジェネレータであ
る。
また、DISK130は、文書記憶装置であり、作成さ
れた文書の保管がなされ、これら保管文書は、必要な時
に呼び出され、更新される。
上述の構成要素からなる文書処理装置における文字処理
は、KB70からのかな文字入力を契機として開始され
る。まず、KB70からの入力に基づき、インクラブド
信号がCPU 10に送られ、インタラブド信号受信後
、CPUl0がROM50内に格納されているDICT
とRAM60に格納されているRLを参照しながら、か
な漢字変換を実行する。その後、変換処理の結果得られ
た読みコードに基づきCG120がCRTC100の制
御のもと文字ドツトパターンを発生しCRTlloに表
示する。
次に、第5図と第6図に示すフローチャートを用いなが
ら、本実施例におけるかな漢字変換処理について説明す
る。かな漢字変換処理は、人出力制御プログラムによる
キーボード入力制御及びかな漢字変換結果のCRT表示
制御などを行う入出力制御処理と、変換処理プログラム
によるキーボード入力された文字列を用いた単語辞書検
索、表記規則参照及び同じ意味分類に属する単語を同一
の文字種に変換などを行う変換処理から成り立っている
文書処理装置が電tAONの状態になると、かな漢字変
換処理の内、ROM50から入出力制御プログラムが読
み出され起動される。入出力制御プログラム、まず、ス
テップSt 10にて入力文字列を一時的に格納するバ
ッファであるYBをスペースクリアする初期化処理を行
なう。
初期化終了後、処理はステップ5115に進み文書処理
装置はKB70からの入力受付待ち状態となる(S 1
15)。次に、文字列入力を受は付けると処理は、ステ
ップ5120に進み、入力文字列は一時格納バツファY
Bに格納される。そして、入力された文字列が変換処理
を起動する文字コードに対応する文字列であるかどうか
を判定する(S125)。ここで、変換処理(詳細は後
述)を起動する文字コードである場合、ステップ313
0に進み、第6図のフローチャートに示す変換処理を起
動する。一方、入力された文字列が変換処理を起動する
ものではない場合、ステップ5115の入力受付待ち状
態に戻る。変換処理が終了すると、ステップ5135で
入出力制御プログラムに制御が戻り、変換処理の結果得
られた内容でYBに一時的に格納されている文字列を更
新し、その更新結果をTBに出力する。最後に、その更
新結果を表示用バッファDBUF90に転送し、CRT
Clooの制御のもと更新結果に対応する文字ドツトパ
ターンを発生し、CRTIIOに表示する(S140)
。また、ステップ5145では、入出力制御を続行する
か否かを判別し、続行するなら処理はステップ5115
に戻り、入力受付待ち状態となる。一方、続行しないな
ら入出力制御を終了する。
次に、変換処理について説明をする。
本実施例では、動物名はカタカナの文字種で表記するこ
とを前提とし、動物の意味分類に属する単語は、カタカ
ナの表記が優先して変換されるようにする。(例えば「
いぬとさる」という入力があったときには、「犬とサル
」、「大と猿」などと変換されることは決してなく、「
イヌとサル」と変換される。)ここでは、「いぬjとい
う文字列が既に入力されているとして説明する。
変換処理が起動されると、ステップ8200において、
単語辞書から入力文字列の読みと一致する単語を検索す
るためのアドレスカウンタ(n)を0に、また、入力文
字列と読みが一致する単語の数をカウントするカウンタ
(C)をOに初期化する。
次に、処理はステップ5205に進み、YBに格納され
ている入力文字列の読みコードとアドレスカウンタ(n
)が指す単語辞書(D、ICT)のアドレスに格納され
ている単語の読みコード(m)が比較される。本実施例
においては、入力文字列rいぬ」の読みコード(m)は
、第2図に示すように“5”である。このとき、読みコ
ードの値が一致するなら、該当する単語の表記をHB内
のカウンタ(C)の値が示すアドレスに、その単語の意
味分類をIB内のカウンタ(c)の値が示すアドレスに
格納し、カウンタ(C)の値を+1する(S210)。
続いて、単語辞書(DICT)の次のアドレスの単語の
読みコード(m)と比較するためアドレスカウンタ(n
)の値を十IL(S215)、処理はステップ5205
に戻る。これに対して、アドレスカウンタ(n)の値で
アドレスされた読みコード(m)の値が小さいなら、ス
テップ5210はスキップし、処理はステップ5215
に進み、DICTの次のアドレスの単語の読みと比較す
るためアドレスカウンタ(n)の値を+1のみし、ステ
ップ5205に戻る。また、アドレスカウンタ(n)の
値でアドレスされた読みコード(m)の値が大きいなら
、単語辞書(D I CT)の検索処理を終了したと判
断し、処理は意味分類照会のため、ステップ5225へ
と進む。
ステップ5225では意味分類照会のため、単語辞書か
ら検索された単語の表記の意味分類を表記規則集(RL
)に照会する準備として、意味分類照会する単語数をカ
ウントするカウンタ(i)と、表記規則集(RL)のア
ドレス(j)を1に初期化する。ここで、カウンタ(i
)の最大値はカウンタ(C)の値である、アドレス(j
)の最大値はRLに格納された表記規則の数(J)であ
る。
ステップ3230では文字の表記が異なる2種類以上の
単語があるかどうかを調べる。ここで、文字表記がただ
1種類の場合は、表記規則集(RL)を調べる必要はな
いので、処理はステップ5270に進み、単語辞書から
検索された文字をそのまま変換処理の結果とする。これ
に対して、2種類以上の表記がある場合(例えば、本実
施例の入力文字列である「いぬj)、処理は5235に
進む。ステップ5235では、HBのi番目のアドレス
に格納された表記に対応するIB内i番目のアドレスの
意味分類(以下、単語の意味分類という)を調べ、表記
規則集(RL)のj番目のアドレスにある意味分類を比
較する。本実施例の場合、rいぬ」という文字列に対し
て“いぬ” (ひらがな)、“イヌ” (カタカナ)、
“犬” (漢字)の3つの表記が得られる。
単語の意味分類と表記規則集(RL)の意味分類が一致
した場合、処理はステップ5240に進み、j番目の表
記規則が指定する表記文字種(例えば、単語の意味分類
が動物の場合、表記文字種はカタカナ゛である)と、i
番目のHBに格納されている表記文字種を比較する。こ
れに対して、単語の意味分類と表記規則集(RL)の意
味分類が不一致の場合、処理はステップ5245に進み
、アドレス(j)を+1する。ステップ5240の比較
において一致した場合、処理はステップ5270に進み
、一致した単語の表記を変換処理の結果としてTBに転
送する。これに対して、ステップ5240での比較で表
記文字種が一致しない場合、処理はステップ5242に
進み、カウンタ(i)を+1する。さらに、ステップ5
243でカウンタ(i)の値が、意味分類照会する単語
数(C)を超えたか否かをチエツクし、超えていないな
ら処理はステップ5240に戻り、意味分類照会する次
の単語と比較する。これに対して、カウンタ(i)の値
が、意味分類照会する単語数(c)を超えたなら、変換
処理に矛盾があるとして、処理はステップ8265に進
み、強制的に表示する単語を辞書から検索された最初の
単語とする。
次にステップ5250ではアドレス(j)の値と、表記
規則集(RL)の規則の数を比較し、規則の数より大き
くなった場合、処理をステップ5255に進め、アドレ
ス(j)の値が表記規則集(RL)の規則の数以下の場
合は、処理はステップ5235に戻る。ステップ525
5ではカウンタ(i)を+1し、アドレス(j)を1に
初期化する。続いて、ステップ8260ではカウンタ(
i)の値と、意味分類照会する単語数(c)を比較し、
カウンタ(i)の値が意味分類照会する単語数(c)よ
り大きくなった場合、処理をステップ8265に進め、
そうでないなら処理はステップ5235に戻る。
ステップ8265では表記規則集(RL)の意味分類と
一致する意味分類を持つ単語がないとき(いわゆる同音
異義語とみなされるもの)の処理として、表示する単語
を辞書から検索された最初の単語とするために、カウン
タ(i)の値を1とし、このアドレスに格納されたHB
内の表記を変換処理の結果とする。このような処理の結
果、本実施例では、「いぬJという文字列に関して、°
いぬ” (ひらがな)、“イヌ” (カタカナ)、“犬
” (漢字)の3つの表記の内、“イヌ”が選択され表
示されるように指示される。
従って、本実施例に従えば、入力した文字列に対するか
な漢字変換を、単語の意味分類を考慮しながら統一した
表記で出力されるので、利用者にとって分かり易い文書
が得られ、文書作成作業に資することができる。
なお本実施例では、キーボードから入力された文字列が
逐次的に、かな漢字変換される処理にって説明したが、
本発明はこれに限定されるものではない。例えば、文字
列が既に入力されているファイルを一括してかな漢字変
換を施す場合でも、本発明を適用することができる。
[発明の効果] 以上説明したように本発明によれば、同じ範疇に属する
語が統一された文字種で出力されるという効果がある。
従って、利用者が、文書作成作業の負荷が軽減されると
いう利点も有する。
【図面の簡単な説明】
第1図は本発明の代表的な実施例である文書処理装置の
構成を示すブロック図、 第2図は単語辞書データの構成を示す図、第3図は表記
規則データの構成を示す説明図、第4図は入出力制御処
理の処理手順を示すフローチャート、そして、 第5図は変換処理の処理手順を示すフローチャートであ
る。 図中、10・・・CPU、20・・・コントロールバス
、30・・・データバス、40・・・アドレスバス、5
0・・・ROM、60・・・RAM、70・・・キーボ
ード、80・・・カーソルレジスタ、90・・・表示用
バッファメモリ、100・・・CRT、110・・・C
RT制御部、120・・・キャラクタジェネレータ、1
30・・・ディスクである。 第2図 第3図

Claims (1)

  1. 【特許請求の範囲】 入力された文字列をかな漢字変換処理したのち出力する
    文書処理装置において、 前記文字列の読みと、前記読みに対応する表記と、前記
    読みと前記表記が表す単語の範疇を格納する第1記憶手
    段と、 前記範疇と前記範疇に属する単語を表記すべき文字種別
    を格納する第2記憶手段と、 前記文字列の読みに基づいて、前記第1記憶手段から対
    応する表記を検索する検索手段と、前記検索手段によつ
    て出力された表記を、前記第2記憶手段に格納された文
    字種別と比較し、前記範疇に対応した表記を出力するよ
    う制御する制御手段とを有することを特徴とする文書処
    理装置。
JP2214983A 1990-08-16 1990-08-16 文書処理装置 Pending JPH0497477A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2214983A JPH0497477A (ja) 1990-08-16 1990-08-16 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2214983A JPH0497477A (ja) 1990-08-16 1990-08-16 文書処理装置

Publications (1)

Publication Number Publication Date
JPH0497477A true JPH0497477A (ja) 1992-03-30

Family

ID=16664769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2214983A Pending JPH0497477A (ja) 1990-08-16 1990-08-16 文書処理装置

Country Status (1)

Country Link
JP (1) JPH0497477A (ja)

Similar Documents

Publication Publication Date Title
US5992737A (en) Information search method and apparatus, and medium for storing information searching program
JPH0497477A (ja) 文書処理装置
JPH0612548B2 (ja) 文書処理装置
JPS6246029B2 (ja)
JPS628259A (ja) かな漢字変換方式
JPH01214963A (ja) 辞書引き装置
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPS646499B2 (ja)
JPH0785058A (ja) 情報検索装置
JPH04120656A (ja) 文書処理装置
JPH0721174A (ja) かな漢字変換装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
CA1257705A (en) Textual database system using skeletonization and phonetic replacement to retrieve words matching or similar to query words
JP3070761B2 (ja) 漢字入力装置
JPH03137768A (ja) 文書処理装置
JPS60207948A (ja) カナ漢字変換処理装置
JPH0567076A (ja) かな漢字変換装置
JPH0830626A (ja) 日本語電子化辞書検索装置
JPH05274298A (ja) 日本語入力装置
JPH0731675B2 (ja) 仮名漢字相互変換装置
JPS62168263A (ja) 仮名漢字相互変換装置
JPH0468466A (ja) かな漢字変換装置
JPH07325844A (ja) 電子化辞書検索装置
JPH08287062A (ja) 文字処理装置及びその方法
JPH08241315A (ja) 文書処理装置の単語登録機構