JPH01207868A - 日本語文章処理方式 - Google Patents

日本語文章処理方式

Info

Publication number
JPH01207868A
JPH01207868A JP63033401A JP3340188A JPH01207868A JP H01207868 A JPH01207868 A JP H01207868A JP 63033401 A JP63033401 A JP 63033401A JP 3340188 A JP3340188 A JP 3340188A JP H01207868 A JPH01207868 A JP H01207868A
Authority
JP
Japan
Prior art keywords
kanji
japanese
morpheme
information
elaboration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63033401A
Other languages
English (en)
Inventor
Masami Hozumi
穂積 真美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63033401A priority Critical patent/JPH01207868A/ja
Publication of JPH01207868A publication Critical patent/JPH01207868A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 日本語文の推敲方式に関し。
常用漢字表で認められている音訓とそうでないものとを
識別し、自動的に修正することを目的とし。
常用漢字表外の漢字である旨の情報並びに常用漢字表外
の音訓である旨の情報およびその場合の正しい用法に関
する情報を有する日本語辞書と。
日本語辞書を検索して入力文を形態素に解析する形態素
解析部と、推敲部とをそなえ、推敲部は。
形態素解析部が日本語辞書を検索して解析した形態素の
うち、常用漢字表外の漢字はひらがなに修正し、常用漢
字表外の音訓は正しい用法に修正する処理を行うように
構成する。
〔産業上の利用分野〕
本発明は1日本語文章処理方式、特に日本語文の推敲方
式に関する。
〔従来の技術〕
日本語で文章を作成する機会は非常に多いが。
適切な文章を作成することば難しい。そのために。
推敲支援システムが開発されている。推敲支援システム
は1日本語辞書1日本語文法辞書、推敲知識などから構
成されており2作成された文章を推敲して誤字などを自
動的に修正するものである。
以下に推敲支援システムによる不適切文の自動修正の例
を示す。
例  −自動修正 ・誤字    除々に −徐々に ・不適切用語  裏日本 −日本海側 ・句読点    昨日具た。映画 −昨日具た映画 ・冗長     3cm以上から5 cmまで −3c
mから5 cmまで ・括弧対応   この木(9月発売〕を読んだ・文体 
    昨日休みましたので、遅れた→ ・・・・・・
 遅れました ・重複     馬から落馬した ・足なし文   私は、この論文は正しい・ようにの否
定 彼のように仕事しない・長文字列   まことにあ
りがとうございました ・曖昧     損傷等があれば ・文語     好むと好まさるとにかかわらず−好ま
ない 二重否定   間に合わないわけではない −間に合う ・誤用     効果が見れる −効果が見られる ・長文     彼は・・・・・・し、・・・・・・し
、・・・・・・した− 彼は・・・・・・した。そして ・連用中止   東京へ行き、調査する −東京へ行っ
てから調査する ・連語     機械翻訳する −機械で翻訳する ・未登録語   Eu油田を見学した ・省略     ATLASで翻訳する呼応     
明日具た映画 ・共起     翻訳率が大きくなる −高くなる 〔発明が解決しようとする課題〕 従来の推敲支援システムでは、「常用漢字表」(昭和5
6年内閣告示)で認められていない漢字が使用された場
合、それを指摘して自動修正することばできるが、[常
用漢字表Jでその音訓が認められていない漢字が使用さ
れた時に2それを指摘することができないという問題が
生じていた。
本発明は、常用漢字表で認められている音訓とそうでな
いものとを識別し、常用漢字表で認められていない音訓
を正しい用法に自動修正することのできる2日本語文の
推敲を行う日本語文章処理方式を提供することを目的と
している。
〔課題を解決するだめの手段〕
本発明は、常用漢字表外の漢字である旨の情報並びに常
用漢字表外の音訓である旨の情報およびその場合の正し
い用法に関する情報を有する日本語辞書と1日本語辞書
を検索して入力文を形態素に解析する形態素解析部と、
推敲部とをそなえ。
推敲部は、形態素解析部が日本語辞書を検索して解析し
た形態素のうち、常用漢字表外の漢字はひらがなに修正
し、常用漢字表外の音訓は正しい用法に修正する処理を
行うように構成することにより、常用漢字表で認められ
ている音訓とそうでないものとを識別し、常用漢字表で
認められていない音訓を正しい用法に自動修正すること
のできる。
日本語文の推敲を行う日本語文章処理方式を提供するも
のである。
第1図は1本発明の原理説明図である。
第1図において、■は日本語辞書、2は形態素解析部、
3は推敲部である。
日本語辞書1は、意味属性9文法属性などの属性情報の
ほかに当該漢字が常用漢字表外の漢字である旨の情報、
当該漢字が常用漢字表で認められている音訓とそうでな
いという旨の情報、そして常用漢字表で認められていな
い時にはその正しい用法に関する情報を格納している。
形態素解析部2は、入力された文を日本語辞書1を検索
することにより、形態素に解析する。
推敲部3は、各形態素の属性乏調べ、属性中に常用漢字
表外の漢字である旨の情報がある場合には、当該漢字を
ひらがなに修正し、また、属性中に常用漢字表で認めら
れていない音訓である旨の情報がある場合には、当該漢
字を、その属性中に格納されている正しい用法にしたが
って修正する。
〔作用〕     ゛ 具体例を用いて本発明の詳細な説明する。
まず、「容器を水で充たす」という文が入力されたもの
とする。
入力文は、形態素解析部2において1日本語辞書1を検
索することにより、形態素に解析される。
すなわち、「容器」 「を」 「水」 「で」 「充た
」「ず」というように解析される。各形態素「容器]、
「をl  I水1  rで」、「充た」および「す」に
は2日本語辞書1に格納されている意味属性1文法属性
なとの属性情報が持たされる。
次いで、推敲部3において、各形態素の属性情報が調べ
られる。その結果、常用漢字表外の漢字である旨の情報
がある場合には、当該漢字はひらがなに修正される。ま
た、常用漢字表外の音訓である旨の情報(第1図では、
Z、JGで示されている)がある場合には、属性中に格
納されている正しい用法(第1図では、&REP (満
た)で示されている)に修正される。すなわち、「充た
」は、「満だ」に修正される。
推敲部3において修正された結果は。
「充たす」は誤りです。「満たす」に修正しまず。
容器を水で満たず。
のように、修正する旨のメツセージと共に修正文が出力
される。
以上の説明では1例しか示さなかったが、以下に常用漢
字表外の漢字の例および常用漢字表外の音訓の例を示す
1)常用漢字表外の漢字の例 玩  (玩具) 鶴  (千羽鶴、紅鶴) 亀  (海亀) 尻  (尻取り) 拭  (尻拭い) 翠  (翠玉) 撥  (撥音便) 嬉   (嬉々) 2)常用漢字表外の音訓の例 (例)=(正しい用法) 肢   −・ 足1脚 未た  − いまだ 墜ちる −落ちる 較べる −比べる 恐い  −怖い 亡びる → 滅びる 充たす → 満たず 〔実施例〕 第2図は9本発明の1実施例構成図である。
第2図において、21は入出力装置、22は入力ファイ
ル、23は推敲制御部123aは機能選択部、23bは
推敲制御機能、23Cは修正制御機能、24は推敲処理
部、24aは推敲エンジン。
24bは形態素解析部、24Cは構文解析部、24dは
推敲知識蓄積部、25は日本語辞書、26は日本語文法
辞書、27は出力ファイル、28は推敲結果処理部であ
る。
入出力装置21は、推敲を行うべき日本語文章を入力し
、推敲結果を取り出す装置である。−括型装置や対話型
装置、あるいは、その双方から構成されてもよい。
入力ファイル22にば2推敲を行うべき日本語文章が格
納されている。
推敲制御部23は推敲あるいは修正に関するコマンドの
解析と対応する処理部の制御を行い1機能選択部23a
、推敲制御機能23bおよび修正制御機能23cを含む
機能選択部23aは、入出力装置21からの指示に従っ
て、推敲か修正かという機能を選択する。
推敲制御機能23bは、推敲制御コマンドに従って、推
敲処理部24を起動する。
修正制御機能23cは、()ト正制御コマンドに従って
、推敲結果処理部28を起動する。
推敲処理部24は、推敲エンジン24a、形態素解析部
24b、構文解析部24Cおよび推敲知識蓄積部24d
からなる。
推敲エンジン24aは、形態素解析部24bおよび構文
解析部24Cを制御すると共に推敲知識蓄積部24. 
dに蓄えられている推敲知識に基づいて、入力された日
本語文章の推敲を行う。
形態素解析部24bは9日本語辞書25を検索して、入
力文を形態素に解析する。
構文解析部24. cは、形態素解析部24bにおいて
解析された形態素によって得られた情報を基に2日本語
文法辞書26を検索して入力文の構造を求める。
推敲知識蓄積部24dは、入力文の推敲に必要な知識が
蓄積されている。
日本語辞書25は、単語(形態素)とその属性情報とを
登録した辞書であり、特に本発明に基づき、常用漢字表
外の漢字である旨の情報並びに常用漢字表外の音訓であ
る旨の情報およびその場合の正しい用法に関する情報を
含んでいる。
日本語文法辞書26には2日本語の文法、すなわち構文
−にの規則が格納されている。
出力ファイル27には、推敲処理部24において推敲さ
れた入力文の推敲結果が出力される。
推敲結果処理部28は、修正側<In機能23cからの
指示により2出カフアイル27に格納されている推敲結
果データを基にして入力文を修正し。
その結果を推敲制御部23を通して、入出力装置21へ
出力する。
以下1本実施例の動作を説明する。
対話型推敲の場合、入出力装置21ばキーボードおよび
デイスプレィからなり、推敲すべき日本語文はキーボー
ドから1文づつ入力し、推敲結果はデイスプレィ画面上
に表示される。また、−括推敲の場合には、入出力装置
21はキーボードおよびプリンタからなり、推敲すべき
日本語文は文章として入力ファイル22に格納しておき
、推敲結果はプリンタにより印刷される。
対話型推敲および一括推敲のいずれの場合でも。
推敲すべき文を入力した後1人出力装置21から推敲制
御部23の機能選択部23aに指示を与えて、まず、推
敲制御機能23bを起動する。
推敲制御機能23bは、入力文データを推敲処理部24
の推敲エンジン24 aに転送する。
推敲エンジン24aは、形態素解析部24bを起動する
と共に入力文データを転送する。
形態素解析部24bは2日本語辞書25を検索して入力
文を形態素に解析する。この時、解析された形態素が常
用漢字表外の漢字である場合には。
その形態素には常用漢字表外の漢字である旨の情報が持
たされ、また、解析された形態素が常用漢字表外の音訓
である場合には、その形態素には常用漢字表外の音訓で
ある旨の情報およびその正しい用法に関する情報が持た
される。
形態素解析が終了すると、推敲エンジン24aは、構文
解析部24 Cを起動する。
構文解析部24Cは、形態素解析部24bにより解析さ
れた形態素を基にして日本語文法辞書26を検索するこ
とにより、入力文の構造を求める。
構文解析が終了すると、推敲エンジン24aは。
推敲知識蓄積部24dに蓄えられている推敲知識に基づ
いて、入力文を推敲する。推敲した結果のデータは、出
力ファイル27に出力される。また。
入出力装置21へも出力される。
次いで5人出力装置21から推敲制御部23の機能選択
部23aを介して修正制御機能23cを起動する。
修正制御機能23cは、推敲結果処理部28を起動して
、出力ファイル27に格納されている推敲結果データを
修正する。例えば、入力文中に常用漢字表外の漢字が存
在すれば、それをひらがなに修正し、入力文中に常用漢
字表外の音訓が存在すれば、それを正しい用法に修正す
る。
推敲結果処理部28の処理結果は、推敲制御部23を通
して入出力装置21へ出力される。
〔発明の効果〕 本発明によれば、常用漢字表で認められている音訓とそ
うでないものとを識別することができるので、誤った用
法を指摘することができると共に正しい用法に自動修正
することができる。
【図面の簡単な説明】
第1図は本発明の原理説明図、第2図は本発明の1実施
例構成図である。 第1図において 1:日本語辞書 2:形態素解析部 3:推敲部

Claims (1)

  1. 【特許請求の範囲】 常用漢字表外の漢字である旨の情報並びに常用漢字表外
    の音訓である旨の情報およびその場合の正しい用法に関
    する情報を有する日本語辞書(1)と、日本語辞書(1
    )を検索して入力文を形態素に解析する形態素解析部(
    2)と、推敲部(3)とをそなえ、 推敲部(3)は、形態素解析部(2)が日本語辞書(1
    )を検索して解析した形態素のうち、常用漢字表外の漢
    字はひらがなに修正し、常用漢字表外の音訓は正しい用
    法に修正する処理を行うことを特徴とする日本語文章処
    理方式。
JP63033401A 1988-02-16 1988-02-16 日本語文章処理方式 Pending JPH01207868A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63033401A JPH01207868A (ja) 1988-02-16 1988-02-16 日本語文章処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63033401A JPH01207868A (ja) 1988-02-16 1988-02-16 日本語文章処理方式

Publications (1)

Publication Number Publication Date
JPH01207868A true JPH01207868A (ja) 1989-08-21

Family

ID=12385574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63033401A Pending JPH01207868A (ja) 1988-02-16 1988-02-16 日本語文章処理方式

Country Status (1)

Country Link
JP (1) JPH01207868A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58178442A (ja) * 1982-04-14 1983-10-19 Fujitsu Ltd 日本語ワ−ドプロセツサ
JPS6097425A (ja) * 1983-10-31 1985-05-31 Ricoh Co Ltd 文書作成装置
JPS6162165A (ja) * 1984-09-03 1986-03-31 Toshiba Corp 字体変換方法
JPS61114366A (ja) * 1984-11-07 1986-06-02 Fujitsu Ltd 日本語テキストデ−タの校正処理方式
JPS6277669A (ja) * 1985-09-25 1987-04-09 Fujitsu Ltd 入力文章の自動校正方式

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58178442A (ja) * 1982-04-14 1983-10-19 Fujitsu Ltd 日本語ワ−ドプロセツサ
JPS6097425A (ja) * 1983-10-31 1985-05-31 Ricoh Co Ltd 文書作成装置
JPS6162165A (ja) * 1984-09-03 1986-03-31 Toshiba Corp 字体変換方法
JPS61114366A (ja) * 1984-11-07 1986-06-02 Fujitsu Ltd 日本語テキストデ−タの校正処理方式
JPS6277669A (ja) * 1985-09-25 1987-04-09 Fujitsu Ltd 入力文章の自動校正方式

Similar Documents

Publication Publication Date Title
RU2136038C1 (ru) Компьютерная система и способ подготовки текста на исходном языке и перевода на иностранные языки
JP2654001B2 (ja) 機械翻訳方法
KR900009120B1 (ko) 기계번역장치
JPS62163173A (ja) 機械翻訳方法
JPH01207868A (ja) 日本語文章処理方式
JP2626722B2 (ja) 日本語生成装置
JPS60193074A (ja) 日本語解析装置
JPH01231164A (ja) 日本語文章処理方式
JP2521435B2 (ja) 日本語生成装置
JP2915225B2 (ja) 文書作成装置
JP3389313B2 (ja) 機械翻訳装置
JP2938897B2 (ja) 文書作成処理装置
JPH01231167A (ja) 日本語文章処理方式
JP2859882B2 (ja) 機械翻訳装置
JP3233800B2 (ja) 機械翻訳装置
JP3353873B2 (ja) 機械翻訳装置
JP2819766B2 (ja) 外国語電子辞書検索方式
JPS62272357A (ja) 機械翻訳システムにおける入力文のエラ−表示方式
JPS61260367A (ja) 機械翻訳システム
JP2752025B2 (ja) 機械翻訳装置
JPH0550778B2 (ja)
JPH0719254B2 (ja) カナ漢字変換装置
JPH01231166A (ja) 日本語文章処理方式
JPH01245358A (ja) 機械翻訳装置
Felshin A Multilingual System for Conversation-Based Language Learning