JPH0585057B2

JPH0585057B2 -

Info

Publication number: JPH0585057B2
Application number: JP63016194A
Authority: JP
Inventors: Shunichi Fukushima
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1988-01-26
Filing date: 1988-01-26
Publication date: 1993-12-06
Also published as: JPH01191259A

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、入力された文章から誤り箇所または
不適切箇所を検出する文章検査装置に関する。

（従来の技術）日本語文章の文体は、常体（だ・である体）と
敬体（です・ます体、であります体、ございます
体）とに分けることができる。例えば、次の(1)，
(2)の文は常体の文であり、(3)，(4)の文は敬体の文
である。

次の通りだ。 …(1) 次の通りである。 …(2) 次の通りです。 …(3) 次の通りでございます。 …(4) 一般に、ひとつの文章中で、常体の文と敬体の
文とが混在することは好ましくない。

そのような混在の検査は、従来、『日本語文章
作成支援システムCOMET』（福島・他、電子通
信学会技術研究報告OS86−21、1986年）、およ
び、特開昭61−229155号公報『日本語ワード・プ
ロセツシング方式』などで述べられている。その
方式は、文体（常体／敬体）を特徴付ける表現を
記憶する文体表現記憶手段を用意し、文章中から
この文体表現記憶手段に記憶された表現を検出す
ると同時に、検出された表現の数を常体と敬体と
に分けてカウントするというものである。常体と
敬体の数がともに１以上であれば、常体と敬体と
が混在していることになる。

（発明が解決しようとする課題）文体に関する検査としては、従来の常体と敬体
との混在に関する検査だけでなく、敬体や常体が
使用されている位置に関する検査が必要である。

この敬体や常体が使用されている位置に関する
検査を、例をあげて説明する。

次の(5)は常体の文であり、(6)，(7)，(8)はともに
(5)に対する敬体の文である。しかし、同じ敬体の
文であつても、(6)，(7)，(8)では、文の途中の敬体
の使用されている位置・回数が異なる（下線部分
が敬体を特徴付ける表現である）。その結果、(5)
＜(6)＜(7)＜(8)の順に丁寧さが増している。

データは次に示した通りだが、安易に結論は出
せない。 …(5) データは次に示した通りだが、安易に結論は出
せません。 …(6) データは次に示した通りですが、安易に結論は
出せません。 …(7) データは次に示しました通りですが、安易に結
論は出せません。 …(8) 常体の文と敬体の文という区別だけでなく、敬
体の文に関する様々な形が日本語では許される
が、作成する文章の種類によつては、好ましくな
い形が存在する。例えば、社内文書を考えた場
合、(8)は過度に丁寧であり、、避けたい形である。

また、ひとつの文章中では、常体の文または敬
体の文に統一されているだけでなく、敬体の文の
場合の敬体の使用法も統一されているべきであ
る。例えば、次の(9)のような文章は、敬体の使用
法が不規則で、日本語として不自然である（下線
部分が敬体を特徴付ける表現である）。

超新星から届いたと考えられます素粒子のデー
タを収集しました。そのデータは、次に示した
通りだが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(9) 上記のような問題は、敬体や常体を使用する位
置に関する検査を行えば解決することができる。
例えば、文末（句点の直前）と接続助詞「が」の
直前では敬体を使用し、他の位置では常体を使用
するという条件を定めて検査するならば、(5)〜(8)
については(5)，(6)，(8)は不適切で(7)が適切である
と判定される。同様に、(9)は不適切であり、それ
に対して、次の(10)のような文章は適切であると判
定されることになる（下線部分が敬体を特徴付け
る表現である）。

超新星から届いたと考えられる素粒子のデータ
を収集しました。そのデータは、次に示した通
りですが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(10) 従来、このような敬体や常体の使用されている
位置に関する検査は、人間が行うしか方法がなか
つた。

本発明の目的は、敬体や常体の使用されている
位置に関する検査を行うことのできる文章検査装
置を提供することである。

（課題を解決するための手段）本発明は、入力された日本語文章から誤り箇所
または不適切箇所を検出する文章検査装置であつ
て、文体を特徴付ける表現を記憶する文体表現記
憶手段と、前記入力された日本語文章から前記文
体表現記憶手段に記憶された表現を検出する文体
表現検出手段と、前記文体を特徴付ける表現を使
用する位置の条件を設定する位置条件設定手段
と、前記位置条件設定手段によつて設定された条
件を記憶する位置条件記憶手段と、前記文体表現
検出手段によつて検出された表現の位置が前記位
置条件記憶手段に記憶された条件を満たすか否か
を判定する位置条件判定手段とを備えることを特
徴とする文章検査装置である。

（実施例）図面を参照して、本発明の構成・作用を説明す
る。

第１図は、本発明の文章検査装置の第一の実施
例の構成を示すブロツク図である。

第１図において、文章入力手段１は、日本語文
章を入力する手段である。かな漢字変換入力装
置、ペンタツチ・キーボード、文字認識装置など
が用いられる。

文章記憶手段２は、文章入力手段１によつて入
力された日本語文章を、文字コード列として記憶
する手段である。ICメモリ、磁気デイスク装置、
磁気テープ装置、光デイスク装置などが用いられ
る。

文体表現記憶手段３は、文体（常体／敬体）を
特徴付ける表現を記憶する手段である。ICメモ
リ、磁気デイスク装置、磁気テープ装置、光デイ
スク装置などが用いられる。第２図および第３図
は、文体表現記憶手段３の内容の例である。第２
図では、常体を特徴付ける表現の文字列と、敬体
を特徴付ける文字列の両方が、文体表現３０の文
字コード順に並べて記憶されている。そして、各
表現には、常体と敬体のいずれかを識別する情報
である文章識別３１が付加されている。第３図で
は、常体を特徴付ける表現が(a)、敬体を特徴付け
る表現が(b)に、分けて登録される。従つて、第３
図では、文体識別３１に相当する情報は各々の表
現には付与されていない。

文体表現検出手段４は、文章記憶手段２に記憶
された日本語文章から、文体表現記憶手段３に記
憶された表現を検出する手段である。コンピユー
タのCPUなどが用いられる。この文体表現検出
手段４では、文章記憶手段２に記憶された日本語
文章と、、文体表現記憶手段３に記憶された表現
とを比較・照合する処理を行えばよく、文体表現
検出手段４は、当業者には容易に実現可能な手段
である。なお、文体表現検出手段４は、検出され
た表現の文章中の位置と文体識別３１の内容と
を、位置条件判定手段６へ送る。

位置条件記憶手段５は、文体（常体／敬体）を
特徴付ける表現を使用する位置に関する条件を記
憶する手段である。記憶する条件は、位置条件設
定手段９によつて書き込まれる。ICメモリ、磁
気デイスク装置、磁気テープ装置、光デイスク装
置などが用いられる。第４図および第５図は、位
置条件記憶手段５の内容の例である。第４図の位
置条件記憶手段５は、敬体を特徴付ける表現の直
後に接続する表現の文字列を登録する形で、条件
を表している。すなわち、第４図の位置条件記憶
手段５では、敬体を特徴付ける表現の直後は、
「。」「が、」「ので、」のいずれかであり、常体を特
徴付ける表現の直後は、「。」「が、」「ので、」以外
であるという条件を表している。第５図の位置条
件記憶手段５は、文体識別５０と条件種別５１と
接続表現５２から成つている。文体識別５０は、
常体を特徴付ける表現の位置に関する条件なの
か、敬体を特徴付ける表現の位置に関する条件な
のかを示す。条件種別５１が「＋」の場合は、そ
の文体表現の直後に接続する表現として、接続表
現５２の部分の文字列を許すということを表し、
条件種別５１が「−」の場合は、その文体表現の
直後に接続する表現として、接続表現５２の部分
の文字列を禁止するということを表す。この第５
図は、第４図と同様の条件を表したものである。

位置条件設定手段９は、文体（常体／敬体）を
特徴付ける表現を使用する位置に関する条件を設
定する手段である。位置条件設定手段９は、設定
された条件を位置条件記憶手段５に書き込む。こ
の位置条件設定手段９の実現形態としては、ま
ず、キーボードを用いて、キーボードから入力さ
れた文字列を、そのまま、条件として位置条件設
定手段５に書き込むものが考えられる。従つて、
第４図のような条件を表す文字列や、第５図のよ
うな条件を表す文字列を、キーボードから、直
接、ユーザに入力してもらうことになる。また、
別な実現形態としては、キーボード、デイスプレ
イ、メモリを用いて第１２図のように、予めメモ
リに記憶しておいた敬体に接続する表現群をデイ
スプレイに表示し、キーボードからそれらを選択
するようにし、選択されたものを位置条件記憶手
段５に書き込むものも考えられる。

位置条件判定手段６は、文体表現検出手段４に
よつて検出された表現の位置が、位置条件記憶手
段５に記憶された条件を満たすか否かを判定する
手段である。コンピユータのCPUなどが用いら
れる。この位置条件判定手段６は、まず、文体表
現検出手段４より、文体（常体／敬体）を特徴付
ける表現の検出された位置を受け取る。そして、
次に、その文体に関する条件を、位置条件記憶手
段５から読み込み、検出された表現の位置が、そ
の条件を満たすか否かを、文章記憶手段２に記憶
された日本語文章を検索して判定する。この判定
処理の内容は、位置条件記憶手段５における条件
の記述方法によつて異なるものになるが、第４図
に示したような位置条件記憶手段５の場合は、第
６図のフローチヤートのような判定処理となる。
なお、位置条件判定手段６は、検出された表現の
位置と、判定結果とを出力する。

また、文体表現検出手段４と位置条件判定手段
６の動作タイミングの制御方法としては、文体表
現検出手段４が文体を特徴付ける表現をひとつ検
出するごとに、それに対する位置条件判定手段６
の判定処理を行う方法と、文体表現検出手段４が
文体を特徴付ける表現を全て検出した後で、位置
条件判定手段６の判定処理をまとめて行う方法が
ある。

次にこの実施例の動作を例を用いて説明する。

この例では、文章入力手段１から前に示した(9)
の例文が入力され、文章記憶手段に記憶されてい
るものとする。また、文体表現記憶手段３の内容
は第２図の例を用いる。動作タイミングについて
は、文体表現検出手段４が文体を特徴付ける表現
を全て検出した後で、位置条件判定手段６の判定
処理をまとめて行う形で説明を行う。

まず、文体を特徴付ける表現を使用する位置に
関する条件の設定を行う。ここでは、位置条件設
定手段９から、第４図のような条件を入力し、位
置条件記憶手段５に記憶させたものとする。

条件が設定されたならば、文体表現検出手段４
は、文章記憶手段２に記憶された(9)の文章と、文
体表現記憶手段３に記憶された文字列とを照合
し、次のような文字列を、文体を特徴付ける表現
として検出する。［］内は検出された表現の位
置（文章の先頭からの文字数）と、対応する文体
識別３１の内容である。

いた［７〜８、常体］られます［12〜15、敬体］しました［26〜29、敬体］した［41〜42、常体］だ［45〜45、常体］せません［55〜58、敬体］います［75〜77、敬体］です［92〜93、敬体］そして、［］内の情報が、文体表現検出手段
４から位置条件判定手段６へ送られる。次に、位
置条件判定手段６は、文体表現検出手段４によつ
て検出された表現の直後の文字列と、位置条件記
憶手段５に記憶された文字列との比較を行い、第
６図のフローチヤートに従つた判定を行う。

具体的に説明すると、［７〜８、常体］に対し
ては、文章の９文字目からの文字列「と考え…」
は、位置条件記憶手段５に記憶された。「。」
「が、」「ので、」とは一致しない。そして、文体識
別３１の内容は常体なので、条件を満たすと判定
される。［12〜15、敬体］に対しては、文章の16
文字目からの文字列「素粒子の…」は、位置条件
記憶手段５に記憶された「。」「が、」「ので、」と
は一致しない。そして、文体識別３１の内容は敬
体なので、条件を満たさないと判定される。［26
〜29、敬体］に対しては、文章の30文字目からの
文字列「。その…」は、位置条件記憶手段５に記
憶された「。」とは一致する。そして、文体識別
３１の内容は敬体なので、条件を満たすと判定さ
れる。以下同様である。

その結果、位置条件判定手段６からは、次のよ
うな情報が出力される。

［７〜８、条件を満たす］［12〜15、条件を満たさない］［26〜29、条件を満たす］［41〜42、条件を満たす］［45〜45、条件を満たさない］［55〜58、条件を満たす］［75〜77、条件を満たす］［92〜93、条件を満たす］すなわち、(9)の文章に対して、次に(11)の下線で
示した部分の文体がおかしいという結果が得ら
れ、常体や敬体の使用されている位置に関する検
査が行われた。

超新星から届いたと考えられます素粒子のデー
タを収集しました。そのデータは、次に示した
通りだが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(11) 第１の下線の部分は「られる」となるべきで
あり、敬体が過剰な箇所が検出されている。第
２の下線の部分は「です」となるべきであり、
敬体が不足している部分が検出されている。

ここで、上記の第一の実施例において、文体
表現記憶手段３に記憶しておく内容を制限して
おくことも考えられる。

例えば、文体表現記憶手段３に記憶しておく
内容を、第３図ａのように、常体を特徴付ける
表現のみとすることもできる。その場合には、
(11)の第２の下線部分のような、敬体が不足して
いる箇所のみが検出される（敬体が過剰な箇所
は検出されない）。逆に、文体表現記憶手段３
に記憶しておく内容を第３図ｂのように、敬体
を特徴付ける表現のみとした場合には、(11)の第
１の下線部分のような、敬体が過剰な箇所のみ
が検出される（敬体が不足している箇所は検出
されない）。

また、文体表現記憶手段３に記憶しておく表
現の文体識別３１について、常体／敬体の２分
類だけでなく、３つ以上の分類を用いることも
可能である。第７図は常体／敬体１／敬体２の
３種類の文体識別３１を用いた文体表現記憶手
段３の内容の例である。第７図における文体識
別３１が敬体２のものは「ございます体」とい
われるものである。そして、文体識別３１の種
類に応じて、条件を細分化することも可能であ
る。第８図は、第７図のような文体識別３１の
種類に対応した、位置条件記憶手段５の内容の
例である。

第９図は、本発明の文章検査装置の第二の実
施例の構成を示すブロツク図である。

この第二の実施例は、第一の実施例に対し
て、単語辞書記憶手段７と文章解析手段８を加
えたものである。

第９図における単語辞書検索手段７は、日本
語の単語について少なくとも表記と品詞とを登
録した単語辞書を記憶する手段である。ICメ
モリ、磁気デイスク装置、磁気テープ装置、光
デイスク装置などが用いられる。文章解析手段
８は文章記憶手段２に記憶された文章の解析を
行う手段である。コンピユータのCPUなどが
用いられる。文章の解析は、単語辞書記憶手段
７に記憶された単語辞書を参照して行い、その
結果としては、文節・単語の単位や単語の品詞
などが得られる。この文章解析手段８と単語辞
書記憶手段７は、公知の手段であり、例えば
『国語辞書の記憶と日本語文の自動分割』（長
尾・他、「情報処理」第19巻第６号、1978）の
ようにして実現できる。文章解析手段８は、文
章記憶手段２に記憶された文章の解析結果を、
再び文章記憶手段２に書き込むので、文章記憶
手段２には、文章の文字コード列だけでなく、
文節単語の単位や単語の品詞の情報も記憶され
ることになる。例えば、文章解析の結果とし
て、(6)に対しては、次の(12)のような内容が記憶
されることになる。［］内は単語の品詞、／
は文節の境界を表す。

データ［名詞］は［格助詞］／次［名詞］に
［格助詞］／示［動詞語幹］し［五段語尾連用
形］た［助動詞「た」連体形］／通り［名詞］
だ［助動詞「だ」終止形］が［接続助詞
「が」］、［読点］／安易［形容動詞語幹］に［形
容動詞語尾連用形］／結論［名詞］は［格助
詞］／出［動詞語幹］せ［下一段語尾連用形］
ませ［助動詞］「ます」未然形］ん［助動詞
「ん」終止形］。［句点］ …(12) この第二の実施例では、文体表現記憶手段３や
位置条件記憶手段５に記憶されている表現につい
て、その表現の文字列だけでなく、その表現を構
成する単語の品詞情報もあわせて持つ。第１０図
は、第二の実施例における文体表現記憶手段３の
内容の例を示す図であり、第１１図は、第二の実
施例における位置条件記憶手段５の内容の例を示
す図である。

文体表現検出手段４や、位置条件判定手段６に
ついては、第一の実施例で説明した処理におい
て、文字列の照合を行う際に、文字列の照合だけ
でなく、単語の品詞の照合も行うようにする。ま
た、位置条件設定手段９は、条件を単語の品詞も
含めて設定することを可能にする。その結果、第
二の実施例では、第一の実施例に比べて、文体表
現検出手段４の文体を特徴付ける表現の検出誤り
や、位置条件判定手段６の条件の判定誤りがなく
なり、文章検査装置の性能が向上する。

（発明の効果）以上説明したように、本発明によれば、敬体や
常体の使用されている位置に関する検査を行うこ
とが可能となる。すなわち日本語文章の文体につ
いて、従来のように、常体と敬体の混在を検査す
るだけでなく、敬体の使い方も検査することがで
きるので、より自然な日本語文章を作成すること
に役立つ。

また、本発明の文章検査装置では、敬体や常体
を使用する位置の条件を、ユーザが設置すること
ができるので、ユーザの好みに応じて、あるい
は、作成する文章に応じて、条件を変更して文体
の検査を行うことが可能である。第一の実施例に
関して、位置条件設定手段９によつて設定し、位
置条件記憶手段５に書き込む条件を、「。」と「の
で、」のみにするならば、文体がおかしいと検出
される箇所は、次の(13)のようになり、〓とは異な
る結果が得られる。

超新星から届いたと考えられます素粒子のデー
タを収集しました。そのデータは、次に示した
通りだが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(13) また、同様に、敬体の直後に使用する表現を、
位置条件記憶手段５に書き込まなければ、次の(14)
のような検出結果となる。これは、全てを常体に
統一しようとする検査の場合になる。

超新星から届いたと考えられます素粒子のデー
タを収集しました。そのデータは、次に示した
通りだが、安易に結論は出せません。他のグル
ープもデータを収集していますが、そのデータ
との比較が必要です。 …(14) このように条件をユーザが設定できる結果、ユ
ーザの好みや、作成する文章に応じた文体の検査
を行える柔軟性が高く、操作性の良い文章検査装
置が得られる。

【図面の簡単な説明】

第１図および第９図は本発明の第一および第二
の実施例の構成をそれぞれ示すブロツク図であ
り、第２図、第３図、第７図および第１０図は文
体表現記憶手段３の内容の例を示す図であり、第
４図、第５図、第８図、第１１図および第１２図
は位置条件記憶手段５の内容の例を示す図であ
り、第６図は位置条件判定手段６における判定処
理のフローチヤートである。１…文章入力手段、２…文章記憶手段、３…文
体表現記憶手段、４…文体表現検出手段、５…位
置条件記憶手段、６…位置条件判定手段、７…単
語辞書記憶手段、８…文章解析手段、９…位置条
件設定手段。

Claims

【特許請求の範囲】

１入力された日本語文章から誤り箇所または不
適切箇所を検出する文章検査装置において、文体
を特徴付ける表現を記憶する文体表現記憶手段
と、前記入力された日本語文章から前記文体表現
記憶手段に記憶された表現を検出する文体表現検
出手段と、前記文体を特徴付ける表現を使用する
位置の条件を設定する位置条件設定手段と、前記
位置条件設定手段によつて設定された条件を記憶
する位置条件記憶手段と、前記文体表現検出手段
によつて検出された表現の位置が前記位置条件記
憶手段に記憶された条件を満たすか否かを判定す
る位置条件判定手段とを備えることを特徴とする
文章検査装置。