JPH01114973A - 文書作成・校正支援装置 - Google Patents

文書作成・校正支援装置

Info

Publication number
JPH01114973A
JPH01114973A JP62274157A JP27415787A JPH01114973A JP H01114973 A JPH01114973 A JP H01114973A JP 62274157 A JP62274157 A JP 62274157A JP 27415787 A JP27415787 A JP 27415787A JP H01114973 A JPH01114973 A JP H01114973A
Authority
JP
Japan
Prior art keywords
dictionary
information
character string
specified
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62274157A
Other languages
English (en)
Inventor
Shigeki Kuga
空閑 茂起
Taro Matsushita
太朗 松下
Masahiro Wada
和田 正寛
Hiroyuki Kanza
浩幸 勘座
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP62274157A priority Critical patent/JPH01114973A/ja
Publication of JPH01114973A publication Critical patent/JPH01114973A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は、日本語文章の中から、誤りや不適当な表現の
部分を抽出したり、ガイダンスや修正情報を提示したり
、文書作成時に必要な給量やその他の情報を搗供するこ
とにより、文書を作成する文書作成・校正支援装置に関
するものである。また、かな浅学交じり文を言語解析し
、かな文字列を得、その結果を利用して音声合成を行う
、音声読みあげ装置としての利用も可能である。
く従来の技術〉 現在、日本語ワードプロセッサ(以下、ワープロと略す
る)が実用化されており、それに関連した、日本語の入
出力、編集、かな漢字変換アルゴリズム、辞書の技術な
どの基本技術が確立している。
かな漢字変換方式のワープロは、変換用の辞書が必要で
あり、ユーザが独自に単語を追加できるユーザ辞書の技
術が確立している。
また、日本語処理技術では、形態素解析、構文解析、意
味解析などの基本的な技術が知られでいる。
また、文章解析の−っの手段として、学習と呼ばれる技
術が確立しでいる。現在知られている学習のアルゴリズ
ムとしてワープロなどで実用化されている方法は、LI
FOの概念に基づくもので、同−単語について最後に使
用した結果を最優先する方法である。
欧米ではワープロが早(から普及したため関連技術が進
んでおり、スペルのチエツク、コレクトの機能を持った
装置が実用化されている。
欧米の言葉が単語単位に句切られて記述されるのに比べ
、日本語は句切りのない滉字仮名交り文で記述されるの
が通常であり、更に、正書法が徹底していないことも加
わって、解析が難しく校正を自動化する装置は実用化さ
れていない。
従来、正確な日本語を扱うことが要求される場合、複数
の人が対になり読み合わせをして問題のある部分を抽出
したり、あるいは校正の専門的な知識を持った人が逐次
照合を加え、校正する方法などが用いられでいる。
最近、このような校正作業を支援するための装置が開発
されつつある。それらの装置は、大きく分けると次の2
つの方式に分類できる。
一つは、前者に対するものであり、漢字仮名交りの文章
を解析して音声に変換し、機械との間で、音声を介した
読み合わせを行うことのできる校正装置である6本装置
の基盤になる技術として、かな文字列を入力すると、音
声に変換して出力する音声合成の技術が確立している。
今一つは、後者に対するもので、校正の自動化あるいは
校正の専門化の支援を行うことを目的としたものである
。この装置は前者の装置に比べ、より高度の技術が要求
されるため、概念の提案があるのみで該xiを構成する
手段、校正の具体的な手段の報告は少ない0本発明に係
わる装置は後者に属するものである。
以上、tF!処理を中心とした従来技術について述べた
が、該技術以外では、ワークステージ房ンに関連した技
術が確立しており、作業の効率を上げるためのマルチウ
ィンドウを用いた装置が実用化されでいる。
〈発明が解決しようとする問題点〉 近年日本野のワープロが普及し、該i置で作成した文書
が多くなっている。ワープロでは、入力の簡便な、かな
漢字変換方式(以下時に断りがない場合、ローマ字漢字
変換方式を含む)を採用した機種が多くなっている。
かな漢字変換のアルゴリズムは、かなを漢字に変換する
過程で単語辞書、文法などの言語的な情報、単語の出現
頻度などの確率的な情報を利用するのが一般的である。
かな漢字変換は、入力が、かな文字列であり、出力がか
な漢字交りの文字列である。出力された文字列は、纒集
を伴うことはありうるが、基本的には最終利、用の形態
である。
文書作成・校正支援システムは、漢字かな交り文を入力
とし、該文字列を辞書、規則などを用いて解析し、その
結果を利用して各種の処理を行う構造が一般的である6
通常、校正の場所と校正の候補を表わす以外の解析結果
の情報は最終の出力形態と異なるため、何等かの付加的
な処理を必要とる。これを−因として、該Millは、
通常処理で、解析結果をユーザに知らせるようになって
いない。
ところが、このような構造の装置では、次のような問題
が発生する。
まず、校正箇所として抽出されねばならない箇所が抽出
されていないとか、また、逆に抽出されてはならない箇
所が抽出されているなど、装置が正常に動作していない
とき、解析結果が表示されていないと、正確な原因の把
握が不可能である。
また、仮に該装置が、文書作成・校正の処理に影響を与
えないような誤った解析をした場合でも、どのように解
析されたかが不明であると、ユーザは不安であるという
間違が生じる。
特に、同字異音語が存在する場合は、結果のいかんがそ
の後の処理に影響を与えることもあり、間違った作業を
行ったり、作業を無駄にすることにつながりかねないと
いう問題があった。
また、解析結果を利用した類義語提示の機能の場合には
、該111は間違りた類義語を提示する可能性があり、
その原因は不明であるという欠点も有しでいる。
これらの問題を解消するため、かな漢字変換方式のよう
に、解析された結果を逐一表示する方式では、ユーザが
必要としない情報に画面を割かれるという欠点が発生す
る。
また、ユーザから見れば、不要な情報を見ることになり
、疲労、精神的な負担が増加するという欠点もある。
あるいは、上述した方法によらず、辞書の内容を紙など
の媒体に記述し、それを参照する方法も考えられるが、
この方法は、時間がかかるという開運を有している。
本発明は、ユーザが希望するときに、ユーザが指定した
文字列を内部の辞書と照合し、同字異音語の情報も含め
て表示することにより、かかる欠点を解消しようとする
ものである。
〈問題、αを解決するための手段〉 本発明は、日本語を入力・Ii集する手段と、該入力さ
れた日本語を記憶する手段と、辞書を記憶する手段と、
文法を記憶する手段と、該入力されたかな文字列を漢字
交じり文に変換したり、編集したりするマイクロプロセ
ッサなどの制御手段と、文字・記号列などを表示する手
段と、校正すべき文字・記号列がある場合に該文字列を
修正する手段から構成される。
〈作用〉 入力手段により計算機などに入力された日本語のかな文
字列を辞書や規則などで解析し、文言の作成校正に利用
する場合、解析結果は最終の利用形態と異なるため表示
されないのが普通である。
本発明では、ユーザが指定したかな文字列を、内蔵した
辞書の見出しと照合し、同字異音語の情報も含めユーザ
に提示するように作用する。
ユーザはこの作用により提示された情報をもとに、解析
結果の?!断を行い、ユーザ辞書の見出し、規則を増加
させたり、辞書、規則の内容を修正を行なったりするこ
とができ、文書作成・校正のための正しい解析ができる
ように作用する。
〈実施例〉 以下図に基づいて本発明の詳細な説明する。第1図は本
発明に係わる文書作成・校正支援装置のブロック構成図
である。
図においで1は日本語の文字列を入力・Ii集するキー
ボードなどの手段である。この中には、現在では周知の
事実になっているかなを漢字に変えるかな漢字変換機能
、ある文字列を指定する機能も含まれる。
2は該入力手段により入力された日本語の文字列を記憶
する手段である。入力手段は通常キーボードが用いられ
るが遂次的に入力を行なわないで、たとえば70ツピー
デイスク、磁気テープなどのように入力した日本語の文
字列を記憶する外部記憶手段で代用することも可能であ
る。即ち、1の入力手段が省略された構成も存在しうる
3は上記2にW積された日本語の文字・記号列を解析す
るための辞書を記憶する手段であり、この中にはユーザ
が定義でき、登録、消去のできるユーザ辞書を記憶する
手段も含まれている。
4は文法、その他の文章を解析するための規則類を記憶
する手段である。
5は2に蓄えられた文字列の巾の一部分を抽出したり、
途中結果を記憶したり、表示の司令などを行ったりする
制御手段である。該制御手段には制御によって得られる
結果を記憶する手段を含む。
6は入力された文字列、照合の途中結果、校正すべき文
字列、KWICなどを表示するCRTなどの表示の手段
である。
7は6によって表示された校正すべき部分に対し修正を
加えた結果を原文中に正しく反映するための校正手段で
ある。
本発明は、文書作成・校正支援装置に関するものである
が、作成・校正の機能には直接関係がないのでブロック
構成図の説明だけに止どめる。
第2図は本発明に関する構成装置を表した図である。
8は本発明の起動をかける手段であり、たとえば、辞書
モードに移るなどの処理を行うものである。
9は本発明を停止するための手段であり、たとえば、辞
書モードから抜は出すなどの処理を行うものである。
10は文字列を指定するための手段であり、11は指定
された文字列と辞書の見出しとの照合を開始させるため
の手段である。10には、文字列を指定せず、直接該当
する文字列を入力する場合も含まれる。
12は同字異音語の見出しが複数個存在し、1回の両面
表示で表示しきれないとき、前画面、次画面の候補を表
示するための手段である。 以上、8から12までの手
段は、独立した構造を有してもよいが、通常、入力ai
i手段2の一部を用いて実現できるものである。また、
8から12の手段の並びは、本発明に影響を与えないの
で、第2図の並びの順序によらない構造が考えられる。
第3図は、表示手段を表わした図の一例であり、13は
文章を表示する領域、14は〃イグンスを表示する領域
、15は辞書の内容や文書作成・校正に必要な作業情報
を表示する領域であることを示したものである。13か
ら15の配置も本発明に影響しない、また、表面上は1
3がら15の領域が区別されず、必要に応じて領域を確
保するマルチウィンドウを使った場合も、本発明で説明
できる。
第4図は、$3図の各該当領域に、値が入った状態を表
わした図であり、16は15に表示された文章の例であ
り、17は16の中の指定された文字列の表示例である
18は該装置の処理モードの表示の例であり、いまの例
では、辞書の検索を〈辞書モード〉で、行なっているこ
とを示している。
19.20.21は辞書の内容を表示するための枠を表
示した例であり、19は見出しの漢字情報を、20は読
み仮名の情報を、21は品詞などの情報(以後項に品詞
情報と略す)を表わす■域であることを示したものであ
る1通宝、これらの領域には、人間が見て分かる指標が
あり、22.23.24はそれぞれ19.20121に
対応する指標の表示の例を示したものである 第5図は文字列指定の別の実現例であり、25は指定文
字列の入力を促すプロンプトの例であり、26は指定す
る文字列の例である。比較のため、17と同一の文字列
を表わしている。26は該装置に内蔵されたかな漢字変
換の手段などで入力できる。
第6図は該装置で用いる内部辞書の構造を表した図で、
27は辞書のID番号、28は見出しの漢字表記を表す
情報、29は見出しの読みを表す情報、30は見出しの
品詞などの情報を表している。27は辞書の格納された
位置の順序から逆算されるため、これを、省略した構造
もありうる。
本図では、見出しの表記を同一にし、その他の情報の一
部が異なる同字異音語の例を、「一方」と「工夫」につ
いて上げている。
$7図は本発明の該略70−図である。第4図に表示さ
れた文章「一方通行規制を実行するに当たり彼には一方
ならぬお世話になった。」を用いて、説明していく。
まず、該装置の文章表示領域に指定された文章を表示す
る。初めて文章を作るときのように、指定された文章が
ない場合は、文章を入力できる状態にし、目的とする文
章を入力する。このような状態を経で、第4図の16の
ような文章が表示される。この文章表示の処理ブロック
を31とする。
次に、表示された文章の一部を指定する。2二では、「
一方通行」の場所で、「一方」を指定しようとしている
状況を考える。
ここで、「一方」を指定する方法は、カーソルなどのポ
インティング手段で「一方」の「−」を指し、次に10
を操作して指定文字列の始まりの部分を決め、次に指定
文字列の終わりの文字「方)を指定してから再度10を
振作し、文字列の指定を行う、この文字列指定の処理ブ
ロックを32とする。
手段11を操作し、指定された文字列「一方」を内部辞
書の見出しの漢字表記情報と照合する。
辞書の検索の順序は各種の提案がなされているが、本発
明の範囲でないので、ここでは辞書の並び順に検索をし
ていく。−例として、第6図の上から順に照合する。
まず、「一方」と「愛」の照合が行われ、失敗する6次
に、辞書の次の見出しの検索を行い、品詞が「名詞」で
読みが「いっぽう」の見出しとの照合に成功する。この
辞書照合の処理ブロックを33とする。
照合の成否の結果、及び、照合に成功したときの辞書の
情報は制御装置の中のスタックにIF積される。この結
果をスタックする処理ブロックを34とする。
次に、更に辞書の見出しを一つ進め、今度は、接続詞の
「一方」と照合に成功する。この処理を繰り返し、照合
に失敗する見出し「工夫」まで進み、辞書の検索を停止
する。辞書照合に成功した場合は、辞書の内容をスタッ
クに記憶する1本処理の、同字異音語の見出しを決定す
る処理ブロックを35とし、辞書内容をスタックに記憶
する処理ブロックを36とする。
次に、内部辞書の情報をPt54図の該当する情報の場
所に表示する。第6図では内部情報を人間が見で分かる
ように表わしたが、一般に、辞書の中は、圧縮や記号で
表されているため、通常判別かで島ない、従って内部情
報復元の処理を伴うことが多い、また、内部辞書と第4
図の辞書内容表示頭載で、対応項目のサイズなどが異な
る場合は、編集の処理が必要である。これらの詳細の処
理は本発明の範囲を越えるため詳m説明は省略する。
情報復元の処理ブロックを37とし、対応情報扁簗処理
のブロックを38とする。また、辞書内容の表示処理ブ
ロックを39とする。
表示後はユーザの判断で、次の文字列の辞書検索、ある
いは、終了などの別作業へ移る。40は終了処理ブロッ
クである。
なお、該装置がLIFOに基づく学習を行っていれば、
2番目の「一方」である「一方ならぬ」の場所でも「い
っぽうならぬ」と解析される可能性が高く、この表示に
より、間違いの解析の可能性を確認することができる。
〈発明の効果〉 本発明の効果は、知りたい情報をユーザ〃簡単な操作で
指定できるという点で効果がある。
また、指定した文字列の同字異音語の情報も合わせて辞
書から検索し表示することにより、装置が正常に動作し
ない場合の原因把握の一部になる情報をつかむことがで
きる点で効果がある。
また、仮に該装置が、文書作成・校正の処理に影響を与
えないような誤った解析をした場合でも、解析の範囲を
知ることができ、未知のために生じるユーザ不安を軽減
できるという効果がある。
特に、指定した文字列に同字異音語が存在する場合は、
解析結果のいかんがその後の処理に影響を与えることも
あり、間違った作業や無駄な作業を未然に防ぐ点で効果
ある。
更には、紙などの媒体に記述された辞書を引き、確認す
る方法と比較し、短時間で内容の検索ができるという点
で効果がある。
【図面の簡単な説明】
第1図は本発明装置の構成ブロック図、第2図は入力・
編集手段の一部を詳細に説明した図、第3図は第1図の
表示手段の領域の概略の機能分類を行った図、第4図は
第3図の各領域に値を入れた場合の表示例を示す図、第
5図は第4図の文字列領域指定の別の表示例を示す図、
第6図は内部辞書の構造を示す図、第7図は本発明の概
略フロー図である。 第1図 tA     2      図 第   3   図 第4図 第5図 第6図

Claims (1)

    【特許請求の範囲】
  1. 日本語を入力・編集する手段と、該入力された日本語を
    記憶する手段と、辞書を記憶する手段と、文法を記憶す
    る手段と、該入力された日本語の中から校正すべき文字
    ・記号列を抽出する手段と、文章及び該候補文字・記号
    列などを表示する手段と、校正すべき文字・記号列があ
    る場合に該文字を修正する手段を有する文書処理システ
    ムにおいて、指定された文字列の辞書の内容を表示する
    ときに、同字異音語の情報を含めて表示することを特徴
    とする文書作成・校正支援装置。
JP62274157A 1987-10-28 1987-10-28 文書作成・校正支援装置 Pending JPH01114973A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62274157A JPH01114973A (ja) 1987-10-28 1987-10-28 文書作成・校正支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62274157A JPH01114973A (ja) 1987-10-28 1987-10-28 文書作成・校正支援装置

Publications (1)

Publication Number Publication Date
JPH01114973A true JPH01114973A (ja) 1989-05-08

Family

ID=17537825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62274157A Pending JPH01114973A (ja) 1987-10-28 1987-10-28 文書作成・校正支援装置

Country Status (1)

Country Link
JP (1) JPH01114973A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009289052A (ja) * 2008-05-29 2009-12-10 Internatl Business Mach Corp <Ibm> 姓名候補を生成する情報処理装置、情報処理方法、およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009289052A (ja) * 2008-05-29 2009-12-10 Internatl Business Mach Corp <Ibm> 姓名候補を生成する情報処理装置、情報処理方法、およびプログラム

Similar Documents

Publication Publication Date Title
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
KR19990078364A (ko) 문서처리장치 및 그의 방법
US5079701A (en) System for registering new words by using linguistically comparable reference words
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JPH01114973A (ja) 文書作成・校正支援装置
JP2621999B2 (ja) 文書処理装置
JP4043176B2 (ja) 自然言語処理装置
JPS63163956A (ja) 文書作成・校正支援装置
JPS63118868A (ja) 日本語文章校正装置
JP2000330984A (ja) 文書処理装置及び方法
JP2737160B2 (ja) 文章処理装置
JPH0380363A (ja) 文書処理装置
JPH06103457B2 (ja) 音声タイプライタ
JPH0264859A (ja) 文章処理装置
JPS63115264A (ja) 文書処理装置
JPH0350668A (ja) 文字処理装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP2002117025A (ja) かな漢字変換装置およびかな漢字変換方法
JPH0682367B2 (ja) 文書作成・校正支援装置
JPH0414168A (ja) 文書作成装置
JPS62209663A (ja) 日本語文章校正装置
JPH04365166A (ja) 文章検査装置
JPH0546612A (ja) 文章誤り検出装置
JPH0991278A (ja) 文書作成装置