JPH0585057B2 - - Google Patents
Info
- Publication number
- JPH0585057B2 JPH0585057B2 JP63016194A JP1619488A JPH0585057B2 JP H0585057 B2 JPH0585057 B2 JP H0585057B2 JP 63016194 A JP63016194 A JP 63016194A JP 1619488 A JP1619488 A JP 1619488A JP H0585057 B2 JPH0585057 B2 JP H0585057B2
- Authority
- JP
- Japan
- Prior art keywords
- expression
- storage means
- stylistic
- condition
- style
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、入力された文章から誤り箇所または
不適切箇所を検出する文章検査装置に関する。
不適切箇所を検出する文章検査装置に関する。
(従来の技術)
日本語文章の文体は、常体(だ・である体)と
敬体(です・ます体、であります体、ございます
体)とに分けることができる。例えば、次の(1),
(2)の文は常体の文であり、(3),(4)の文は敬体の文
である。
敬体(です・ます体、であります体、ございます
体)とに分けることができる。例えば、次の(1),
(2)の文は常体の文であり、(3),(4)の文は敬体の文
である。
次の通りだ。 …(1)
次の通りである。 …(2)
次の通りです。 …(3)
次の通りでございます。 …(4)
一般に、ひとつの文章中で、常体の文と敬体の
文とが混在することは好ましくない。
文とが混在することは好ましくない。
そのような混在の検査は、従来、『日本語文章
作成支援システムCOMET』(福島・他、電子通
信学会技術研究報告OS86−21、1986年)、およ
び、特開昭61−229155号公報『日本語ワード・プ
ロセツシング方式』などで述べられている。その
方式は、文体(常体/敬体)を特徴付ける表現を
記憶する文体表現記憶手段を用意し、文章中から
この文体表現記憶手段に記憶された表現を検出す
ると同時に、検出された表現の数を常体と敬体と
に分けてカウントするというものである。常体と
敬体の数がともに1以上であれば、常体と敬体と
が混在していることになる。
作成支援システムCOMET』(福島・他、電子通
信学会技術研究報告OS86−21、1986年)、およ
び、特開昭61−229155号公報『日本語ワード・プ
ロセツシング方式』などで述べられている。その
方式は、文体(常体/敬体)を特徴付ける表現を
記憶する文体表現記憶手段を用意し、文章中から
この文体表現記憶手段に記憶された表現を検出す
ると同時に、検出された表現の数を常体と敬体と
に分けてカウントするというものである。常体と
敬体の数がともに1以上であれば、常体と敬体と
が混在していることになる。
(発明が解決しようとする課題)
文体に関する検査としては、従来の常体と敬体
との混在に関する検査だけでなく、敬体や常体が
使用されている位置に関する検査が必要である。
との混在に関する検査だけでなく、敬体や常体が
使用されている位置に関する検査が必要である。
この敬体や常体が使用されている位置に関する
検査を、例をあげて説明する。
検査を、例をあげて説明する。
次の(5)は常体の文であり、(6),(7),(8)はともに
(5)に対する敬体の文である。しかし、同じ敬体の
文であつても、(6),(7),(8)では、文の途中の敬体
の使用されている位置・回数が異なる(下線部分
が敬体を特徴付ける表現である)。その結果、(5)
<(6)<(7)<(8)の順に丁寧さが増している。
(5)に対する敬体の文である。しかし、同じ敬体の
文であつても、(6),(7),(8)では、文の途中の敬体
の使用されている位置・回数が異なる(下線部分
が敬体を特徴付ける表現である)。その結果、(5)
<(6)<(7)<(8)の順に丁寧さが増している。
データは次に示した通りだが、安易に結論は出
せない。 …(5) データは次に示した通りだが、安易に結論は出
せません。 …(6) データは次に示した通りですが、安易に結論は
出せません。 …(7) データは次に示しました通りですが、安易に結
論は出せません。 …(8) 常体の文と敬体の文という区別だけでなく、敬
体の文に関する様々な形が日本語では許される
が、作成する文章の種類によつては、好ましくな
い形が存在する。例えば、社内文書を考えた場
合、(8)は過度に丁寧であり、、避けたい形である。
せない。 …(5) データは次に示した通りだが、安易に結論は出
せません。 …(6) データは次に示した通りですが、安易に結論は
出せません。 …(7) データは次に示しました通りですが、安易に結
論は出せません。 …(8) 常体の文と敬体の文という区別だけでなく、敬
体の文に関する様々な形が日本語では許される
が、作成する文章の種類によつては、好ましくな
い形が存在する。例えば、社内文書を考えた場
合、(8)は過度に丁寧であり、、避けたい形である。
また、ひとつの文章中では、常体の文または敬
体の文に統一されているだけでなく、敬体の文の
場合の敬体の使用法も統一されているべきであ
る。例えば、次の(9)のような文章は、敬体の使用
法が不規則で、日本語として不自然である(下線
部分が敬体を特徴付ける表現である)。
体の文に統一されているだけでなく、敬体の文の
場合の敬体の使用法も統一されているべきであ
る。例えば、次の(9)のような文章は、敬体の使用
法が不規則で、日本語として不自然である(下線
部分が敬体を特徴付ける表現である)。
超新星から届いたと考えられます素粒子のデー
タを収集しました。そのデータは、次に示した
通りだが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(9) 上記のような問題は、敬体や常体を使用する位
置に関する検査を行えば解決することができる。
例えば、文末(句点の直前)と接続助詞「が」の
直前では敬体を使用し、他の位置では常体を使用
するという条件を定めて検査するならば、(5)〜(8)
については(5),(6),(8)は不適切で(7)が適切である
と判定される。同様に、(9)は不適切であり、それ
に対して、次の(10)のような文章は適切であると判
定されることになる(下線部分が敬体を特徴付け
る表現である)。
タを収集しました。そのデータは、次に示した
通りだが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(9) 上記のような問題は、敬体や常体を使用する位
置に関する検査を行えば解決することができる。
例えば、文末(句点の直前)と接続助詞「が」の
直前では敬体を使用し、他の位置では常体を使用
するという条件を定めて検査するならば、(5)〜(8)
については(5),(6),(8)は不適切で(7)が適切である
と判定される。同様に、(9)は不適切であり、それ
に対して、次の(10)のような文章は適切であると判
定されることになる(下線部分が敬体を特徴付け
る表現である)。
超新星から届いたと考えられる素粒子のデータ
を収集しました。そのデータは、次に示した通
りですが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(10) 従来、このような敬体や常体の使用されている
位置に関する検査は、人間が行うしか方法がなか
つた。
を収集しました。そのデータは、次に示した通
りですが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(10) 従来、このような敬体や常体の使用されている
位置に関する検査は、人間が行うしか方法がなか
つた。
本発明の目的は、敬体や常体の使用されている
位置に関する検査を行うことのできる文章検査装
置を提供することである。
位置に関する検査を行うことのできる文章検査装
置を提供することである。
(課題を解決するための手段)
本発明は、入力された日本語文章から誤り箇所
または不適切箇所を検出する文章検査装置であつ
て、文体を特徴付ける表現を記憶する文体表現記
憶手段と、前記入力された日本語文章から前記文
体表現記憶手段に記憶された表現を検出する文体
表現検出手段と、前記文体を特徴付ける表現を使
用する位置の条件を設定する位置条件設定手段
と、前記位置条件設定手段によつて設定された条
件を記憶する位置条件記憶手段と、前記文体表現
検出手段によつて検出された表現の位置が前記位
置条件記憶手段に記憶された条件を満たすか否か
を判定する位置条件判定手段とを備えることを特
徴とする文章検査装置である。
または不適切箇所を検出する文章検査装置であつ
て、文体を特徴付ける表現を記憶する文体表現記
憶手段と、前記入力された日本語文章から前記文
体表現記憶手段に記憶された表現を検出する文体
表現検出手段と、前記文体を特徴付ける表現を使
用する位置の条件を設定する位置条件設定手段
と、前記位置条件設定手段によつて設定された条
件を記憶する位置条件記憶手段と、前記文体表現
検出手段によつて検出された表現の位置が前記位
置条件記憶手段に記憶された条件を満たすか否か
を判定する位置条件判定手段とを備えることを特
徴とする文章検査装置である。
(実施例)
図面を参照して、本発明の構成・作用を説明す
る。
る。
第1図は、本発明の文章検査装置の第一の実施
例の構成を示すブロツク図である。
例の構成を示すブロツク図である。
第1図において、文章入力手段1は、日本語文
章を入力する手段である。かな漢字変換入力装
置、ペンタツチ・キーボード、文字認識装置など
が用いられる。
章を入力する手段である。かな漢字変換入力装
置、ペンタツチ・キーボード、文字認識装置など
が用いられる。
文章記憶手段2は、文章入力手段1によつて入
力された日本語文章を、文字コード列として記憶
する手段である。ICメモリ、磁気デイスク装置、
磁気テープ装置、光デイスク装置などが用いられ
る。
力された日本語文章を、文字コード列として記憶
する手段である。ICメモリ、磁気デイスク装置、
磁気テープ装置、光デイスク装置などが用いられ
る。
文体表現記憶手段3は、文体(常体/敬体)を
特徴付ける表現を記憶する手段である。ICメモ
リ、磁気デイスク装置、磁気テープ装置、光デイ
スク装置などが用いられる。第2図および第3図
は、文体表現記憶手段3の内容の例である。第2
図では、常体を特徴付ける表現の文字列と、敬体
を特徴付ける文字列の両方が、文体表現30の文
字コード順に並べて記憶されている。そして、各
表現には、常体と敬体のいずれかを識別する情報
である文章識別31が付加されている。第3図で
は、常体を特徴付ける表現が(a)、敬体を特徴付け
る表現が(b)に、分けて登録される。従つて、第3
図では、文体識別31に相当する情報は各々の表
現には付与されていない。
特徴付ける表現を記憶する手段である。ICメモ
リ、磁気デイスク装置、磁気テープ装置、光デイ
スク装置などが用いられる。第2図および第3図
は、文体表現記憶手段3の内容の例である。第2
図では、常体を特徴付ける表現の文字列と、敬体
を特徴付ける文字列の両方が、文体表現30の文
字コード順に並べて記憶されている。そして、各
表現には、常体と敬体のいずれかを識別する情報
である文章識別31が付加されている。第3図で
は、常体を特徴付ける表現が(a)、敬体を特徴付け
る表現が(b)に、分けて登録される。従つて、第3
図では、文体識別31に相当する情報は各々の表
現には付与されていない。
文体表現検出手段4は、文章記憶手段2に記憶
された日本語文章から、文体表現記憶手段3に記
憶された表現を検出する手段である。コンピユー
タのCPUなどが用いられる。この文体表現検出
手段4では、文章記憶手段2に記憶された日本語
文章と、、文体表現記憶手段3に記憶された表現
とを比較・照合する処理を行えばよく、文体表現
検出手段4は、当業者には容易に実現可能な手段
である。なお、文体表現検出手段4は、検出され
た表現の文章中の位置と文体識別31の内容と
を、位置条件判定手段6へ送る。
された日本語文章から、文体表現記憶手段3に記
憶された表現を検出する手段である。コンピユー
タのCPUなどが用いられる。この文体表現検出
手段4では、文章記憶手段2に記憶された日本語
文章と、、文体表現記憶手段3に記憶された表現
とを比較・照合する処理を行えばよく、文体表現
検出手段4は、当業者には容易に実現可能な手段
である。なお、文体表現検出手段4は、検出され
た表現の文章中の位置と文体識別31の内容と
を、位置条件判定手段6へ送る。
位置条件記憶手段5は、文体(常体/敬体)を
特徴付ける表現を使用する位置に関する条件を記
憶する手段である。記憶する条件は、位置条件設
定手段9によつて書き込まれる。ICメモリ、磁
気デイスク装置、磁気テープ装置、光デイスク装
置などが用いられる。第4図および第5図は、位
置条件記憶手段5の内容の例である。第4図の位
置条件記憶手段5は、敬体を特徴付ける表現の直
後に接続する表現の文字列を登録する形で、条件
を表している。すなわち、第4図の位置条件記憶
手段5では、敬体を特徴付ける表現の直後は、
「。」「が、」「ので、」のいずれかであり、常体を特
徴付ける表現の直後は、「。」「が、」「ので、」以外
であるという条件を表している。第5図の位置条
件記憶手段5は、文体識別50と条件種別51と
接続表現52から成つている。文体識別50は、
常体を特徴付ける表現の位置に関する条件なの
か、敬体を特徴付ける表現の位置に関する条件な
のかを示す。条件種別51が「+」の場合は、そ
の文体表現の直後に接続する表現として、接続表
現52の部分の文字列を許すということを表し、
条件種別51が「−」の場合は、その文体表現の
直後に接続する表現として、接続表現52の部分
の文字列を禁止するということを表す。この第5
図は、第4図と同様の条件を表したものである。
特徴付ける表現を使用する位置に関する条件を記
憶する手段である。記憶する条件は、位置条件設
定手段9によつて書き込まれる。ICメモリ、磁
気デイスク装置、磁気テープ装置、光デイスク装
置などが用いられる。第4図および第5図は、位
置条件記憶手段5の内容の例である。第4図の位
置条件記憶手段5は、敬体を特徴付ける表現の直
後に接続する表現の文字列を登録する形で、条件
を表している。すなわち、第4図の位置条件記憶
手段5では、敬体を特徴付ける表現の直後は、
「。」「が、」「ので、」のいずれかであり、常体を特
徴付ける表現の直後は、「。」「が、」「ので、」以外
であるという条件を表している。第5図の位置条
件記憶手段5は、文体識別50と条件種別51と
接続表現52から成つている。文体識別50は、
常体を特徴付ける表現の位置に関する条件なの
か、敬体を特徴付ける表現の位置に関する条件な
のかを示す。条件種別51が「+」の場合は、そ
の文体表現の直後に接続する表現として、接続表
現52の部分の文字列を許すということを表し、
条件種別51が「−」の場合は、その文体表現の
直後に接続する表現として、接続表現52の部分
の文字列を禁止するということを表す。この第5
図は、第4図と同様の条件を表したものである。
位置条件設定手段9は、文体(常体/敬体)を
特徴付ける表現を使用する位置に関する条件を設
定する手段である。位置条件設定手段9は、設定
された条件を位置条件記憶手段5に書き込む。こ
の位置条件設定手段9の実現形態としては、ま
ず、キーボードを用いて、キーボードから入力さ
れた文字列を、そのまま、条件として位置条件設
定手段5に書き込むものが考えられる。従つて、
第4図のような条件を表す文字列や、第5図のよ
うな条件を表す文字列を、キーボードから、直
接、ユーザに入力してもらうことになる。また、
別な実現形態としては、キーボード、デイスプレ
イ、メモリを用いて第12図のように、予めメモ
リに記憶しておいた敬体に接続する表現群をデイ
スプレイに表示し、キーボードからそれらを選択
するようにし、選択されたものを位置条件記憶手
段5に書き込むものも考えられる。
特徴付ける表現を使用する位置に関する条件を設
定する手段である。位置条件設定手段9は、設定
された条件を位置条件記憶手段5に書き込む。こ
の位置条件設定手段9の実現形態としては、ま
ず、キーボードを用いて、キーボードから入力さ
れた文字列を、そのまま、条件として位置条件設
定手段5に書き込むものが考えられる。従つて、
第4図のような条件を表す文字列や、第5図のよ
うな条件を表す文字列を、キーボードから、直
接、ユーザに入力してもらうことになる。また、
別な実現形態としては、キーボード、デイスプレ
イ、メモリを用いて第12図のように、予めメモ
リに記憶しておいた敬体に接続する表現群をデイ
スプレイに表示し、キーボードからそれらを選択
するようにし、選択されたものを位置条件記憶手
段5に書き込むものも考えられる。
位置条件判定手段6は、文体表現検出手段4に
よつて検出された表現の位置が、位置条件記憶手
段5に記憶された条件を満たすか否かを判定する
手段である。コンピユータのCPUなどが用いら
れる。この位置条件判定手段6は、まず、文体表
現検出手段4より、文体(常体/敬体)を特徴付
ける表現の検出された位置を受け取る。そして、
次に、その文体に関する条件を、位置条件記憶手
段5から読み込み、検出された表現の位置が、そ
の条件を満たすか否かを、文章記憶手段2に記憶
された日本語文章を検索して判定する。この判定
処理の内容は、位置条件記憶手段5における条件
の記述方法によつて異なるものになるが、第4図
に示したような位置条件記憶手段5の場合は、第
6図のフローチヤートのような判定処理となる。
なお、位置条件判定手段6は、検出された表現の
位置と、判定結果とを出力する。
よつて検出された表現の位置が、位置条件記憶手
段5に記憶された条件を満たすか否かを判定する
手段である。コンピユータのCPUなどが用いら
れる。この位置条件判定手段6は、まず、文体表
現検出手段4より、文体(常体/敬体)を特徴付
ける表現の検出された位置を受け取る。そして、
次に、その文体に関する条件を、位置条件記憶手
段5から読み込み、検出された表現の位置が、そ
の条件を満たすか否かを、文章記憶手段2に記憶
された日本語文章を検索して判定する。この判定
処理の内容は、位置条件記憶手段5における条件
の記述方法によつて異なるものになるが、第4図
に示したような位置条件記憶手段5の場合は、第
6図のフローチヤートのような判定処理となる。
なお、位置条件判定手段6は、検出された表現の
位置と、判定結果とを出力する。
また、文体表現検出手段4と位置条件判定手段
6の動作タイミングの制御方法としては、文体表
現検出手段4が文体を特徴付ける表現をひとつ検
出するごとに、それに対する位置条件判定手段6
の判定処理を行う方法と、文体表現検出手段4が
文体を特徴付ける表現を全て検出した後で、位置
条件判定手段6の判定処理をまとめて行う方法が
ある。
6の動作タイミングの制御方法としては、文体表
現検出手段4が文体を特徴付ける表現をひとつ検
出するごとに、それに対する位置条件判定手段6
の判定処理を行う方法と、文体表現検出手段4が
文体を特徴付ける表現を全て検出した後で、位置
条件判定手段6の判定処理をまとめて行う方法が
ある。
次にこの実施例の動作を例を用いて説明する。
この例では、文章入力手段1から前に示した(9)
の例文が入力され、文章記憶手段に記憶されてい
るものとする。また、文体表現記憶手段3の内容
は第2図の例を用いる。動作タイミングについて
は、文体表現検出手段4が文体を特徴付ける表現
を全て検出した後で、位置条件判定手段6の判定
処理をまとめて行う形で説明を行う。
の例文が入力され、文章記憶手段に記憶されてい
るものとする。また、文体表現記憶手段3の内容
は第2図の例を用いる。動作タイミングについて
は、文体表現検出手段4が文体を特徴付ける表現
を全て検出した後で、位置条件判定手段6の判定
処理をまとめて行う形で説明を行う。
まず、文体を特徴付ける表現を使用する位置に
関する条件の設定を行う。ここでは、位置条件設
定手段9から、第4図のような条件を入力し、位
置条件記憶手段5に記憶させたものとする。
関する条件の設定を行う。ここでは、位置条件設
定手段9から、第4図のような条件を入力し、位
置条件記憶手段5に記憶させたものとする。
条件が設定されたならば、文体表現検出手段4
は、文章記憶手段2に記憶された(9)の文章と、文
体表現記憶手段3に記憶された文字列とを照合
し、次のような文字列を、文体を特徴付ける表現
として検出する。[ ]内は検出された表現の位
置(文章の先頭からの文字数)と、対応する文体
識別31の内容である。
は、文章記憶手段2に記憶された(9)の文章と、文
体表現記憶手段3に記憶された文字列とを照合
し、次のような文字列を、文体を特徴付ける表現
として検出する。[ ]内は検出された表現の位
置(文章の先頭からの文字数)と、対応する文体
識別31の内容である。
いた [7〜8、常体]
られます [12〜15、敬体]
しました [26〜29、敬体]
した [41〜42、常体]
だ [45〜45、常体]
せません [55〜58、敬体]
います [75〜77、敬体]
です [92〜93、敬体]
そして、[ ]内の情報が、文体表現検出手段
4から位置条件判定手段6へ送られる。次に、位
置条件判定手段6は、文体表現検出手段4によつ
て検出された表現の直後の文字列と、位置条件記
憶手段5に記憶された文字列との比較を行い、第
6図のフローチヤートに従つた判定を行う。
4から位置条件判定手段6へ送られる。次に、位
置条件判定手段6は、文体表現検出手段4によつ
て検出された表現の直後の文字列と、位置条件記
憶手段5に記憶された文字列との比較を行い、第
6図のフローチヤートに従つた判定を行う。
具体的に説明すると、[7〜8、常体]に対し
ては、文章の9文字目からの文字列「と考え…」
は、位置条件記憶手段5に記憶された。「。」
「が、」「ので、」とは一致しない。そして、文体識
別31の内容は常体なので、条件を満たすと判定
される。[12〜15、敬体]に対しては、文章の16
文字目からの文字列「素粒子の…」は、位置条件
記憶手段5に記憶された「。」「が、」「ので、」と
は一致しない。そして、文体識別31の内容は敬
体なので、条件を満たさないと判定される。[26
〜29、敬体]に対しては、文章の30文字目からの
文字列「。その…」は、位置条件記憶手段5に記
憶された「。」とは一致する。そして、文体識別
31の内容は敬体なので、条件を満たすと判定さ
れる。以下同様である。
ては、文章の9文字目からの文字列「と考え…」
は、位置条件記憶手段5に記憶された。「。」
「が、」「ので、」とは一致しない。そして、文体識
別31の内容は常体なので、条件を満たすと判定
される。[12〜15、敬体]に対しては、文章の16
文字目からの文字列「素粒子の…」は、位置条件
記憶手段5に記憶された「。」「が、」「ので、」と
は一致しない。そして、文体識別31の内容は敬
体なので、条件を満たさないと判定される。[26
〜29、敬体]に対しては、文章の30文字目からの
文字列「。その…」は、位置条件記憶手段5に記
憶された「。」とは一致する。そして、文体識別
31の内容は敬体なので、条件を満たすと判定さ
れる。以下同様である。
その結果、位置条件判定手段6からは、次のよ
うな情報が出力される。
うな情報が出力される。
[7〜8、条件を満たす]
[12〜15、条件を満たさない]
[26〜29、条件を満たす]
[41〜42、条件を満たす]
[45〜45、条件を満たさない]
[55〜58、条件を満たす]
[75〜77、条件を満たす]
[92〜93、条件を満たす]
すなわち、(9)の文章に対して、次に(11)の下線で
示した部分の文体がおかしいという結果が得ら
れ、常体や敬体の使用されている位置に関する検
査が行われた。
示した部分の文体がおかしいという結果が得ら
れ、常体や敬体の使用されている位置に関する検
査が行われた。
超新星から届いたと考えられます素粒子のデー
タを収集しました。そのデータは、次に示した
通りだが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(11) 第1の下線の部分は「られる」となるべきで
あり、敬体が過剰な箇所が検出されている。第
2の下線の部分は「です」となるべきであり、
敬体が不足している部分が検出されている。
タを収集しました。そのデータは、次に示した
通りだが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(11) 第1の下線の部分は「られる」となるべきで
あり、敬体が過剰な箇所が検出されている。第
2の下線の部分は「です」となるべきであり、
敬体が不足している部分が検出されている。
ここで、上記の第一の実施例において、文体
表現記憶手段3に記憶しておく内容を制限して
おくことも考えられる。
表現記憶手段3に記憶しておく内容を制限して
おくことも考えられる。
例えば、文体表現記憶手段3に記憶しておく
内容を、第3図aのように、常体を特徴付ける
表現のみとすることもできる。その場合には、
(11)の第2の下線部分のような、敬体が不足して
いる箇所のみが検出される(敬体が過剰な箇所
は検出されない)。逆に、文体表現記憶手段3
に記憶しておく内容を第3図bのように、敬体
を特徴付ける表現のみとした場合には、(11)の第
1の下線部分のような、敬体が過剰な箇所のみ
が検出される(敬体が不足している箇所は検出
されない)。
内容を、第3図aのように、常体を特徴付ける
表現のみとすることもできる。その場合には、
(11)の第2の下線部分のような、敬体が不足して
いる箇所のみが検出される(敬体が過剰な箇所
は検出されない)。逆に、文体表現記憶手段3
に記憶しておく内容を第3図bのように、敬体
を特徴付ける表現のみとした場合には、(11)の第
1の下線部分のような、敬体が過剰な箇所のみ
が検出される(敬体が不足している箇所は検出
されない)。
また、文体表現記憶手段3に記憶しておく表
現の文体識別31について、常体/敬体の2分
類だけでなく、3つ以上の分類を用いることも
可能である。第7図は常体/敬体1/敬体2の
3種類の文体識別31を用いた文体表現記憶手
段3の内容の例である。第7図における文体識
別31が敬体2のものは「ございます体」とい
われるものである。そして、文体識別31の種
類に応じて、条件を細分化することも可能であ
る。第8図は、第7図のような文体識別31の
種類に対応した、位置条件記憶手段5の内容の
例である。
現の文体識別31について、常体/敬体の2分
類だけでなく、3つ以上の分類を用いることも
可能である。第7図は常体/敬体1/敬体2の
3種類の文体識別31を用いた文体表現記憶手
段3の内容の例である。第7図における文体識
別31が敬体2のものは「ございます体」とい
われるものである。そして、文体識別31の種
類に応じて、条件を細分化することも可能であ
る。第8図は、第7図のような文体識別31の
種類に対応した、位置条件記憶手段5の内容の
例である。
第9図は、本発明の文章検査装置の第二の実
施例の構成を示すブロツク図である。
施例の構成を示すブロツク図である。
この第二の実施例は、第一の実施例に対し
て、単語辞書記憶手段7と文章解析手段8を加
えたものである。
て、単語辞書記憶手段7と文章解析手段8を加
えたものである。
第9図における単語辞書検索手段7は、日本
語の単語について少なくとも表記と品詞とを登
録した単語辞書を記憶する手段である。ICメ
モリ、磁気デイスク装置、磁気テープ装置、光
デイスク装置などが用いられる。文章解析手段
8は文章記憶手段2に記憶された文章の解析を
行う手段である。コンピユータのCPUなどが
用いられる。文章の解析は、単語辞書記憶手段
7に記憶された単語辞書を参照して行い、その
結果としては、文節・単語の単位や単語の品詞
などが得られる。この文章解析手段8と単語辞
書記憶手段7は、公知の手段であり、例えば
『国語辞書の記憶と日本語文の自動分割』(長
尾・他、「情報処理」第19巻第6号、1978)の
ようにして実現できる。文章解析手段8は、文
章記憶手段2に記憶された文章の解析結果を、
再び文章記憶手段2に書き込むので、文章記憶
手段2には、文章の文字コード列だけでなく、
文節単語の単位や単語の品詞の情報も記憶され
ることになる。例えば、文章解析の結果とし
て、(6)に対しては、次の(12)のような内容が記憶
されることになる。[ ]内は単語の品詞、/
は文節の境界を表す。
語の単語について少なくとも表記と品詞とを登
録した単語辞書を記憶する手段である。ICメ
モリ、磁気デイスク装置、磁気テープ装置、光
デイスク装置などが用いられる。文章解析手段
8は文章記憶手段2に記憶された文章の解析を
行う手段である。コンピユータのCPUなどが
用いられる。文章の解析は、単語辞書記憶手段
7に記憶された単語辞書を参照して行い、その
結果としては、文節・単語の単位や単語の品詞
などが得られる。この文章解析手段8と単語辞
書記憶手段7は、公知の手段であり、例えば
『国語辞書の記憶と日本語文の自動分割』(長
尾・他、「情報処理」第19巻第6号、1978)の
ようにして実現できる。文章解析手段8は、文
章記憶手段2に記憶された文章の解析結果を、
再び文章記憶手段2に書き込むので、文章記憶
手段2には、文章の文字コード列だけでなく、
文節単語の単位や単語の品詞の情報も記憶され
ることになる。例えば、文章解析の結果とし
て、(6)に対しては、次の(12)のような内容が記憶
されることになる。[ ]内は単語の品詞、/
は文節の境界を表す。
データ[名詞]は[格助詞]/次[名詞]に
[格助詞]/示[動詞語幹]し[五段語尾連用
形]た[助動詞「た」連体形]/通り[名詞]
だ[助動詞「だ」終止形]が[接続助詞
「が」]、[読点]/安易[形容動詞語幹]に[形
容動詞語尾連用形]/結論[名詞]は[格助
詞]/出[動詞語幹]せ[下一段語尾連用形]
ませ[助動詞]「ます」未然形]ん[助動詞
「ん」終止形]。[句点] …(12) この第二の実施例では、文体表現記憶手段3や
位置条件記憶手段5に記憶されている表現につい
て、その表現の文字列だけでなく、その表現を構
成する単語の品詞情報もあわせて持つ。第10図
は、第二の実施例における文体表現記憶手段3の
内容の例を示す図であり、第11図は、第二の実
施例における位置条件記憶手段5の内容の例を示
す図である。
[格助詞]/示[動詞語幹]し[五段語尾連用
形]た[助動詞「た」連体形]/通り[名詞]
だ[助動詞「だ」終止形]が[接続助詞
「が」]、[読点]/安易[形容動詞語幹]に[形
容動詞語尾連用形]/結論[名詞]は[格助
詞]/出[動詞語幹]せ[下一段語尾連用形]
ませ[助動詞]「ます」未然形]ん[助動詞
「ん」終止形]。[句点] …(12) この第二の実施例では、文体表現記憶手段3や
位置条件記憶手段5に記憶されている表現につい
て、その表現の文字列だけでなく、その表現を構
成する単語の品詞情報もあわせて持つ。第10図
は、第二の実施例における文体表現記憶手段3の
内容の例を示す図であり、第11図は、第二の実
施例における位置条件記憶手段5の内容の例を示
す図である。
文体表現検出手段4や、位置条件判定手段6に
ついては、第一の実施例で説明した処理におい
て、文字列の照合を行う際に、文字列の照合だけ
でなく、単語の品詞の照合も行うようにする。ま
た、位置条件設定手段9は、条件を単語の品詞も
含めて設定することを可能にする。その結果、第
二の実施例では、第一の実施例に比べて、文体表
現検出手段4の文体を特徴付ける表現の検出誤り
や、位置条件判定手段6の条件の判定誤りがなく
なり、文章検査装置の性能が向上する。
ついては、第一の実施例で説明した処理におい
て、文字列の照合を行う際に、文字列の照合だけ
でなく、単語の品詞の照合も行うようにする。ま
た、位置条件設定手段9は、条件を単語の品詞も
含めて設定することを可能にする。その結果、第
二の実施例では、第一の実施例に比べて、文体表
現検出手段4の文体を特徴付ける表現の検出誤り
や、位置条件判定手段6の条件の判定誤りがなく
なり、文章検査装置の性能が向上する。
(発明の効果)
以上説明したように、本発明によれば、敬体や
常体の使用されている位置に関する検査を行うこ
とが可能となる。すなわち日本語文章の文体につ
いて、従来のように、常体と敬体の混在を検査す
るだけでなく、敬体の使い方も検査することがで
きるので、より自然な日本語文章を作成すること
に役立つ。
常体の使用されている位置に関する検査を行うこ
とが可能となる。すなわち日本語文章の文体につ
いて、従来のように、常体と敬体の混在を検査す
るだけでなく、敬体の使い方も検査することがで
きるので、より自然な日本語文章を作成すること
に役立つ。
また、本発明の文章検査装置では、敬体や常体
を使用する位置の条件を、ユーザが設置すること
ができるので、ユーザの好みに応じて、あるい
は、作成する文章に応じて、条件を変更して文体
の検査を行うことが可能である。第一の実施例に
関して、位置条件設定手段9によつて設定し、位
置条件記憶手段5に書き込む条件を、「。」と「の
で、」のみにするならば、文体がおかしいと検出
される箇所は、次の(13)のようになり、〓とは異な
る結果が得られる。
を使用する位置の条件を、ユーザが設置すること
ができるので、ユーザの好みに応じて、あるい
は、作成する文章に応じて、条件を変更して文体
の検査を行うことが可能である。第一の実施例に
関して、位置条件設定手段9によつて設定し、位
置条件記憶手段5に書き込む条件を、「。」と「の
で、」のみにするならば、文体がおかしいと検出
される箇所は、次の(13)のようになり、〓とは異な
る結果が得られる。
超新星から届いたと考えられます素粒子のデー
タを収集しました。そのデータは、次に示した
通りだが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(13) また、同様に、敬体の直後に使用する表現を、
位置条件記憶手段5に書き込まなければ、次の(14)
のような検出結果となる。これは、全てを常体に
統一しようとする検査の場合になる。
タを収集しました。そのデータは、次に示した
通りだが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(13) また、同様に、敬体の直後に使用する表現を、
位置条件記憶手段5に書き込まなければ、次の(14)
のような検出結果となる。これは、全てを常体に
統一しようとする検査の場合になる。
超新星から届いたと考えられます素粒子のデー
タを収集しました。そのデータは、次に示した
通りだが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(14) このように条件をユーザが設定できる結果、ユ
ーザの好みや、作成する文章に応じた文体の検査
を行える柔軟性が高く、操作性の良い文章検査装
置が得られる。
タを収集しました。そのデータは、次に示した
通りだが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(14) このように条件をユーザが設定できる結果、ユ
ーザの好みや、作成する文章に応じた文体の検査
を行える柔軟性が高く、操作性の良い文章検査装
置が得られる。
第1図および第9図は本発明の第一および第二
の実施例の構成をそれぞれ示すブロツク図であ
り、第2図、第3図、第7図および第10図は文
体表現記憶手段3の内容の例を示す図であり、第
4図、第5図、第8図、第11図および第12図
は位置条件記憶手段5の内容の例を示す図であ
り、第6図は位置条件判定手段6における判定処
理のフローチヤートである。 1…文章入力手段、2…文章記憶手段、3…文
体表現記憶手段、4…文体表現検出手段、5…位
置条件記憶手段、6…位置条件判定手段、7…単
語辞書記憶手段、8…文章解析手段、9…位置条
件設定手段。
の実施例の構成をそれぞれ示すブロツク図であ
り、第2図、第3図、第7図および第10図は文
体表現記憶手段3の内容の例を示す図であり、第
4図、第5図、第8図、第11図および第12図
は位置条件記憶手段5の内容の例を示す図であ
り、第6図は位置条件判定手段6における判定処
理のフローチヤートである。 1…文章入力手段、2…文章記憶手段、3…文
体表現記憶手段、4…文体表現検出手段、5…位
置条件記憶手段、6…位置条件判定手段、7…単
語辞書記憶手段、8…文章解析手段、9…位置条
件設定手段。
Claims (1)
- 1 入力された日本語文章から誤り箇所または不
適切箇所を検出する文章検査装置において、文体
を特徴付ける表現を記憶する文体表現記憶手段
と、前記入力された日本語文章から前記文体表現
記憶手段に記憶された表現を検出する文体表現検
出手段と、前記文体を特徴付ける表現を使用する
位置の条件を設定する位置条件設定手段と、前記
位置条件設定手段によつて設定された条件を記憶
する位置条件記憶手段と、前記文体表現検出手段
によつて検出された表現の位置が前記位置条件記
憶手段に記憶された条件を満たすか否かを判定す
る位置条件判定手段とを備えることを特徴とする
文章検査装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63016194A JPH01191259A (ja) | 1988-01-26 | 1988-01-26 | 文章検査装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63016194A JPH01191259A (ja) | 1988-01-26 | 1988-01-26 | 文章検査装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH01191259A JPH01191259A (ja) | 1989-08-01 |
| JPH0585057B2 true JPH0585057B2 (ja) | 1993-12-06 |
Family
ID=11909699
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63016194A Granted JPH01191259A (ja) | 1988-01-26 | 1988-01-26 | 文章検査装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01191259A (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04280364A (ja) * | 1991-03-08 | 1992-10-06 | Nec Corp | 文章検査装置 |
-
1988
- 1988-01-26 JP JP63016194A patent/JPH01191259A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPH01191259A (ja) | 1989-08-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4024861B2 (ja) | 辞書に基づく品詞確率による自然言語パーザ | |
| US6424983B1 (en) | Spelling and grammar checking system | |
| JP2002215617A (ja) | 品詞タグ付けをする方法 | |
| JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
| US20020152246A1 (en) | Method for predicting the readings of japanese ideographs | |
| JP2002117027A (ja) | 感情情報抽出方法および感情情報抽出プログラムの記録媒体 | |
| US6731802B1 (en) | Lattice and method for identifying and normalizing orthographic variations in Japanese text | |
| JPH0585057B2 (ja) | ||
| JPH0658667B2 (ja) | 文章検査装置 | |
| JPH077417B2 (ja) | 文章検査装置 | |
| JPH04280364A (ja) | 文章検査装置 | |
| JP3873305B2 (ja) | 仮名漢字変換装置および仮名漢字変換方法 | |
| JPH0916597A (ja) | 文章推敲装置及び方法 | |
| JP4119979B2 (ja) | 個人環境言語変換装置及び個人環境差分強調装置及びプログラム | |
| JP3061855B2 (ja) | かな漢字変換装置及びかな漢字変換方法 | |
| JP3783053B2 (ja) | 負の例予測処理方法、処理プログラムおよび処理装置、負の例予測処理を用いた日本語表記誤り検出処理プログラムおよび処理装置、ならびに負の例予測処理を用いた外の関係検出処理プログラムおよび処理装置 | |
| JP3873299B2 (ja) | 仮名漢字変換装置および仮名漢字変換方法 | |
| JP2007122660A (ja) | 文書データ処理装置および文書データ処理プログラム | |
| Ganituen et al. | Case Studies on Error Checking for Tagalog and Bikol Language | |
| JP3300492B2 (ja) | 辞書検査装置 | |
| JPH1139347A (ja) | テキスト検索システム,インデックス作成装置,テキスト検索装置及びコンピュータ読み取り可能な記録媒体 | |
| JPH1115846A (ja) | 情報検索装置および記録媒体 | |
| JPH03233669A (ja) | 文書作成装置 | |
| JP2895137B2 (ja) | 日本文誤り自動検出および訂正装置 | |
| JPH06149791A (ja) | 漢字文章入力装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071206 Year of fee payment: 14 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081206 Year of fee payment: 15 |
|
| EXPY | Cancellation because of completion of term | ||
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081206 Year of fee payment: 15 |