JPH03148759A - 日本語処理装置 - Google Patents

日本語処理装置

Info

Publication number
JPH03148759A
JPH03148759A JP1287500A JP28750089A JPH03148759A JP H03148759 A JPH03148759 A JP H03148759A JP 1287500 A JP1287500 A JP 1287500A JP 28750089 A JP28750089 A JP 28750089A JP H03148759 A JPH03148759 A JP H03148759A
Authority
JP
Japan
Prior art keywords
sentence
analysis
morphemes
information
morphological analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1287500A
Other languages
English (en)
Inventor
Masato Yajima
真人 矢島
Hiromi Saito
裕美 斎藤
Noriko Koyama
小山 紀子
Kenichiro Kobayashi
賢一郎 小林
Kazuo Koyama
小山 和雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Toshiba AVE Co Ltd
Original Assignee
Toshiba Corp
Toshiba Audio Video Engineering Co Ltd
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Audio Video Engineering Co Ltd, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP1287500A priority Critical patent/JPH03148759A/ja
Publication of JPH03148759A publication Critical patent/JPH03148759A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は日本語処理装置において適切な形態素解析が
行われているかを確認可能な日本語処理装置に関するも
のである。
(従来の技術) 今日、情報処理の分野は目覚しい発展をとげ、これに対
応して日本語処理技術が発達し、様々な日本語処理装置
が開発されている。そして、日本語処理装置の一種であ
る日本語ワードプロセッサの普及により、仮名・漢字混
じりの日本語文章を作成することは日常化してきている
。更に、その応用分野として、作成した日本語文章を形
態・構文の点から解析し、文章内の誤りを指摘するスペ
リングチェック機能や日本語文章を他の様々な言語に翻
訳する機械翻訳装置等も実用化されている。
ここで、日本語文章は単語ごとに間隔を空けて記載され
るのではなく、いわゆる「べた書き」されるものである
から文章を意味の最少単位である形態素に分割する形態
素解析という技術が有効である。この形態素解析は解析
辞書を用いて可能性のある形態素に分割することにより
行われるため、通常の文章を解析した場合でも複数の解
析結果が得られることが少なくなく、複数の結果が得ら
れると解析装置において最適と思われる解析結果を自動
的に選択するようにしている。
しかしながら上記のように複数の解析結果のうち最適な
ものを自動的に選択する日本語処理装置によると、誤っ
た解析結果を最適なものとして選択すると後の処理に重
大な影響を及ぼし、最終的にスペリングチェックや機械
翻訳処理などの精度を低下させることになった。
従って、日本語文章の形態素解析を行った後に、どのよ
うな形態素への分割を行ったかをオペレータに知らせる
ことで処理の精度向上を図ることが求められていた。
(発明が解決しようとする課題〉 上記のように従来の日本語処理装置によると形態素解析
の結果が複数であるとき複数の解析結果のうち最適なも
のを自動的に選択していたため、誤った選択により処理
精度の低下を棺く間顕点があり、日本語文章をどのよう
な形態素I\分割を行ったかをオペレータに知らせる手
段を備えた日本語処理装置が求められていた。
本発明はこのような従来の日本語処理装置への要望に応
えてなされたもので、その目的は、形態素解析を実行し
た後、各形態素間にスペース、スラッシュ等の区切り記
号を挿入して表示することによりオペレータに容易に形
態素解析の結果を確認させ得る日本語処理装置を提供す
ることである。
[発明の構成] (課題を解決するための手段) そこで本発明では、単語を見出しとして各単語の品詞に
関する情報が格納された解析辞書と、与えられる文章を
前記解析辞書内の情報に基づき意味の最少単位である形
態素に分割する形態素解析手段と、 この形態素解析手段が解析した文章の形態素間に区切り
記号を付加して送出する区切り記号付加手段と、 この区切り記号付加手段から送出された区切り記号の付
加された文章情報を可視表示する表示手段とを備えさせ
て日本語処理装置を構成した。
上記構成によると、与えられる文章が形態素解析手段に
より形態素に分割されるが、その際分割された形態素間
に区切り記号が付加されて表示されること(こなり、こ
れをオペレータが確認して正しい分割を有効とするなど
の手だてをとることができる。
1実施例) 以下、添付図面を参照して本発明の一実施例を説明する
。第1図は本発明の一実施例に係る日本語処理装置を示
す。同図において、1はキーボードやタブレット、マウ
スまたはマイクロフォン等からなる入力装置であり、文
字音声・座標等の情報のほか制御コードも入力できるも
のである。
2は装置全体を制御する制御装置を示し、例えば、マイ
クロコンピュータ等から成る。3は磁気ディスク、メモ
リカード、ROM等からなる外部記憶装置を示し、作成
された文章情報等を格納する場合に用いられる。4は入
力された文章を表示する場合などに用いられる表示装置
を示し、CRTディスプレイ装置や液晶ディスプレイ装
置などから成る。
制御装置2には入出力部201が設けられ、入力装置1
と外部記憶装置3とに接続されている。入出力部201
は入力装置1から入力された文字情報や制御コードを取
込み制御部202へ与えるとともに、制御部202から
送出された文章情報を外部記憶装置3へ転送して格納し
、逆に格納されている情報を制御部202へ転送する。
制御部202は処理要求の制御コードが入力装置1から
入力されたことを検出すると、文章編集部206、文抽
出部207などを起動する。次に、文字列の文字情報を
受は収ると制御部202はこれを文章データメモり20
3へ格納する。表示制御部204は制御部202により
起動され、文章データメモり203から文章情報を読出
し表示データとして表示装置4へ送出し、入力に係る文
章を可視表示させる。制御部202は入力装置1から入
力された仮名コードからなる文字列の情報を仮名漢字変
換部205へ与え、複数の文節を含む文字列の情報を仮
名漢字混じりの文字列の情報へ変換させ、この変換後の
文字情報を文章データメモり203へ格納させる。文章
編集部206は入力装置1から下線や倍角等の制御コー
ドが入力されたとき、制御部202からこの制御コード
を受取り、対応の文字列に下線を付し、または、倍角制
御するなどの編集処理を行い、また、編集指示の制御コ
ードを受取ると文章データメモり203内の文章情報の
対応部分に対し文字の訂正、削除、挿入等の処理を行う
。以上述べた各部は、文書作成装置の基本的な処理機能
として一般的に備えられているものである。
そして、本実施例においては、文章データメモり203
内に格納された文章に対して形態素解析を行う際の対象
となる一文を抽出する文抽出部207が設けられている
。この文抽出部207は入力装置1から形態素解析要求
の制御コードが入力されると、制御部202により起動
され、例えば、スペース、改行、改頁、句読点、コンマ
、ピリオド等を一文の区切りをなす判断基準情報として
、文章データメモり203から一文をなしている文字列
の文字情報を抽出し、該文字情報の文章データメモり2
03におけるアドレスをバッファ20Bへ格納する。
この一文の抽出が行われる毎に、文抽出部207は形態
素解析部209を起動する。形態素解析部209は、第
2図に示されるように単語を見出し語とし、これに対応
の形態品詞が対応付けられたメモリである解析辞書21
0を参照して形態素解析を実行する。解析結果はバッフ
ァ208に格納され、解析結果が複数ある場合にはそれ
らが順次にバッファ208へ格納される。バッファ20
8に格納された解析結果は形態素解析部206によって
文章データメモり203へ転送され、かつ各形態素間に
スラッシュ等の区切り記号が付加される。入力装置1か
ら次候補要求の制御コードが入力されると、形態素解析
部209はこれを入出力部201及び制御部202を介
して受取り、バッファ208内の複数ある他の解析結果
に基づいて文章データメモり203内の解析結果に対し
て、形態素間の区切り記号の位置を変更する。なお、次
候補要求に対して新たな次候補がなくなると最初の解析
結果に戻って上記動作を実行する。このような解析結果
は形態素間の区切り記号が付加されて文章データメモり
203に格納され、表示制御部204が制御部202の
指示で該当領域のデータを読出し表示装置4へ与えて表
示させているから、オペレータはこれをみることができ
、入力装W1から「次候補要求Jまたは「確定」の入力
を行う。確定の入力があると、これを受取った形態素解
析部209は「終了」を文抽出部207へ通知する。文
抽出部207はこれによって文章データメモり203内
の文字列の情報から次の一文を抽出してバッファ20B
へ格納し、形態素解析部209を再起動して、当該一文
について形態素解析を行わせる。
以上のような処理が繰り返され、、文章データメモり2
03内の文章が次々に解析され、文抽出部207が抽出
すべき文が無くなったとき、制御部202へ制御が戻さ
れる。
上記のように構成された日本語処理装置の処理手続きの
流れが第3図のフローチャートに示されている。つまり
、入力装置1からキー人力がなさ  れたとき(401
) 、外部記憶装置3からの文章読込み要求か否か調べ
(402) 、文章読込み要求であればファイル名人力
(403)がなされるから、対応の文章を外部記憶装置
3から読込んで文章データメモり203へ転送し格納す
る(404)。
一方、外部記憶装置3からの読込み要求でなければ、形
態素解析要求か(405) 、文章編集要求か(406
) 、制御コード(下線などについての制御コード)の
入力か(407)を調べる。ここでYESとなると、対
応の情報(コード)を文章データメモり203の対応箇
所へ格納する。また、文章の訂正、削除、挿入などの文
章編集要求が出されると(406)文章編集部206が
対応する編集を文章データメモり203内において行う
(409,410)。また、ステップ407で仮名・漢
字混じり文への変換前の文字列の入力であることが検出
されるとステップ407でNOへ分岐し、仮名漢字変換
部205が文章データメモり203内の文章の仮名漢字
変換を行う(408゜410)。
このようにして漢字への変換がなされ、次に、形態素解
析要求が出された場合には、ステップ405からYES
へ分岐し、文抽出部207による文抽出がなされ(/1
11) 、抽出できると(412)形態素解析部209
による形態素解析が行われ、解析結果がバッファ208
から文章データメモり203へ転送され、形態素間に区
切り記号が挿入される(414)。
そして、入力装置1からの次候補の要求の検出を行って
(415) 、当該要求であれば次候補を選択して文章
データメモり203内の区切り記号の位置を変更する(
416.414 )。一方、解析結果が正しくて「確認
」 (決定)されると次の一文についての抽出へ戻る(
415.411)。
上記一文抽出及び形態素解析が行われているとき、表示
制御部204が表示制御を行うが、この表示例を第4図
に示す。ここでは、仮名漢字変換された文字列から、「
再編集において操作性を向上させた。」という一文が抽
出された場合を例とすると、第4図(a)のように表示
がなされ、次に形態素解析が行われてその一つの解析結
果について形態素間に区切り記号である「スラッシュ」
が挿入された第4図(b)のような表示が表示装置4に
てなされる。この解析結果がオペレータの意図せぬもの
であれば、キー人力による次候補要求により形態素解析
部209がバッファ208内の他の解析結果を用いて区
切り記号の位置を文章データメモり203の中で変える
ことにより、第4図(C)のようにスラッシュの位置が
変わり異なる解析結果が示される。このような表示を見
て、正しければ「確認」の入力をオペレータが行うこと
で、第3図のフローチャートではステップ415からス
テップ411へ進むことになる。
次に、解析結果をオペレータが見て必要な文字を挿入し
、再度形態素解析を実行させたときの表示例を示す。文
章データメモり203の仮名漢字変換された文字列から
、「ワークステーション用いた新しいプログラミング環
境を提供した。」という一文が抽出された場合を例とす
ると、第5図(a)に示されるように表示がなされ、次
に形態素解析が行われて、その一つの解析結果について
形態素間に区切り記号である「スラッシュ」が挿入され
た第5図(b)のような表示が表示装置4にて行われる
。ここでオペレータが、「ワークステーションJと「用
いた」との間に「を」が抜けていることに気づくと、文
章編集要求をキー人力し、「をJを入力する。これによ
り、第3図のフローチャートではステップ412からス
テップ401へ戻り、更に、ステップ406 、409
が実行され、第5図(C)に示すように「を」の入った
文章が表示される。ここで、オペレータが再度「形態素
解析要求」のキー人力を行うことによリーステップ40
5゜411 、412で当該表示に係る文章についての
抽出がなされ、形態素解析が再度なされて(413) 
、第5図(d)に示すように正しい形態素間にスラッシ
ュが挿入された表示が得られる。
なお、第3図のステップ410においては、表示制御部
204は当該ページ(領域)の文字を文章データメモり
203から取出して表示しているが、形態素解析となる
と、形態素解析部209が転送してきたデータの領域か
ら文字を取出して表示するものであり、文章データメモ
り203はこれに必要な容量を有するものである。
上記の実施例において用いた「スラッシュJは区切り記
号に過ぎず、この目的さえ達するのであれば、スペース
など、日本語文中には用いられない他の記号を用いても
よい。また、形態素解析の結果が1通りしかない場合に
は、「確認」のキー人力がなくても、次の一文の抽出へ
進むようにしてもよい。
[発明の効果] 以上説明したように本発明によれば、形態素解析を実行
した後、解析結果に関し形態素間に区切り記号が付加さ
れた文が表示されるため、オペレータは解析の対象とな
っている文がどのような形態素に分割されたか確認でき
る。このため、オペレータは解析結果が誤っているかど
うか判断し、訂正等の対応をとることができ、日本語処
理作業の能率向上及び精度向上を図り得るものである。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は解析
酵書のメモリマツプを示す図、第3図は本発明の一実施
例の動作を説明するためのフロ−チャート、第4図、第
5図は本発明の一実施例による表示例を示す図である。 1・・・入力装置   2・・・制御装置3・・・外部
記憶装W 4・・・表示装置201・・・入出力部  
202・・・制御部203・・・文章データメモリ 204・・・表示制御部 205・・・仮名漢字変換部
206・・・文章編集部 207・・・文抽出部20&
・・・バッファ  209・・・形態素解析部210・
・・解析辞書

Claims (1)

  1. 【特許請求の範囲】 単語を見出しとして各単語の品詞に関する情報が格納さ
    れた解析辞書と、 与えられる文章を前記解析辞書内の情報に基づき意味の
    最少単位である形態素に分割する形態素解析手段と、 この形態素解析手段が解析した文章の形態素間に区切り
    記号を付加して送出する区切り記号付加手段と、 この区切り記号付加手段から送出された区切り記号の付
    加された文章情報を可視表示する表示手段とを備えたこ
    とを特徴とする日本語処理装置。
JP1287500A 1989-11-06 1989-11-06 日本語処理装置 Pending JPH03148759A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1287500A JPH03148759A (ja) 1989-11-06 1989-11-06 日本語処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1287500A JPH03148759A (ja) 1989-11-06 1989-11-06 日本語処理装置

Publications (1)

Publication Number Publication Date
JPH03148759A true JPH03148759A (ja) 1991-06-25

Family

ID=17718149

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1287500A Pending JPH03148759A (ja) 1989-11-06 1989-11-06 日本語処理装置

Country Status (1)

Country Link
JP (1) JPH03148759A (ja)

Similar Documents

Publication Publication Date Title
US6993473B2 (en) Productivity tool for language translators
US4962452A (en) Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence
EP0201096B1 (en) Processing method and processor for machine translation
EP0514305A2 (en) Method and apparatus for facilitating contextual language translation within an interactive software application
JP7690378B2 (ja) 更新可能な点字ディスプレイを動的に分割する方法及び非一時的なコンピュータ可読媒体
JPH09106399A (ja) 機械翻訳装置及び機械翻訳方法
JPH03148759A (ja) 日本語処理装置
JP2570681B2 (ja) ワード・プロセッサ
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JP2737160B2 (ja) 文章処理装置
JPS62203268A (ja) 機械翻訳システム
JP2003271580A (ja) 文書作成支援装置、文書作成支援方法、およびプログラム
JP2786260B2 (ja) かな漢字変換装置
JPH05108711A (ja) 機械翻訳対訳表示装置
JP2936761B2 (ja) 日本語文書の校正装置
JPH06149790A (ja) 文章作成装置
JPS62143178A (ja) 自然言語翻訳方式
JPH03233669A (ja) 文書作成装置
JP3826071B2 (ja) 文章作成支援装置及び方法並びにプログラム
JPH02158863A (ja) 文書作成装置
JPH0240768A (ja) 文章処理装置
JPH0277963A (ja) 文書作成装置
JPH0460760A (ja) 日本語文章校正装置
JPH06149878A (ja) 外国語文作成読解支援装置
JPH01158569A (ja) 形態素解析方式