JPH07200571A - 文書処理方法及びその装置 - Google Patents

文書処理方法及びその装置

Info

Publication number
JPH07200571A
JPH07200571A JP5354526A JP35452693A JPH07200571A JP H07200571 A JPH07200571 A JP H07200571A JP 5354526 A JP5354526 A JP 5354526A JP 35452693 A JP35452693 A JP 35452693A JP H07200571 A JPH07200571 A JP H07200571A
Authority
JP
Japan
Prior art keywords
delimiter
data
phrase
bunsetsu
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5354526A
Other languages
English (en)
Inventor
Koji Maekawa
浩司 前川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5354526A priority Critical patent/JPH07200571A/ja
Publication of JPH07200571A publication Critical patent/JPH07200571A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 本発明は、区切りの指定位置の正確さを増し
て、区切り位置指定データによる誤変換を少なくし、変
換率の向上および操作性の向上を実現できる文書処理方
法及びその装置を提供する。 【構成】 区切り位置指定データをサーチする区切りデ
ータサーチして、前記区切りデータサーチの結果に基づ
いて文節を決定し(図3)、区切り位置の変更があった
場合、区切り位置を記憶する(図4)。前記区切り位置
の記憶は、対象文節を第1の自立部区切りデータとして
記憶し(S41)、対象文節が付属語の文節であり、か
つ前の文節が付属語文節の場合に、付属部区切りデータ
として記憶し(S45)、対象文節が付属語の文節であ
り、かつ前の文節が自立語文節の場合に、第2の自立部
区切りデータとして記憶する(S44)ことにより行わ
れ、前記文節の決定は、前記第1及び第2の自立部区切
りデータと一致する場合(S31)、あるいは前記付属
部区切りデータと一致する場合(S33)に、区切りデ
ータに基づいて文字列を区切ることにより行われる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文書処理方法及びその装
置に関するものである。
【0002】
【従来の技術】従来の文書処理装置では、入力された仮
名文字列を仮名漢字混じり文に変換する場合、変換候補
をオペレータの希望する候補に変更した時には、区切り
位置の変更があるかどうかを判断して、区切り位置の変
更があった場合には区切り位置を記憶して学習情報と
し、以降の変換時の区切り位置を決定する。この場合、
区切り位置の記憶処理として、対象文節が付属語か自立
語かを判断し、自立語ならば入力文字列の先頭からのみ
適用する自立部区切りデータを作成し、付属語ならば入
力文字列の途中から一致しても適用できる付属部区切り
データを作成していた。
【0003】すなわち、図5に示すように、「そうしよ
うとした」という入力文字列を「奏/氏/用と/した」
と変換した場合に、区切り学習データとして付属部区切
りデータ「/し/よう」を作成する。次に同じ文字列の
変換を行う時には区切りデータをサーチして、最初の
「し」の前とその「し」と続く「よう」との間とに区切
りの指定位置が見つかるので、この位置を元に文節決定
処理を行ない、結果的に、前に変換候補の変更を行った
場合と同じ候補を得ていた。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来技術の処理方法では、入力文字列の途中から一致した
場合には、どのような場合でも学習された区切り位置で
文節が切れてしまうので、本来ならば切れて欲しくない
ところでも切れてしまう。例えば、図6に示すように、
「そうさしようとした」と入力して「操作/しようと/
した」と変換したい場合、あるいは「かしよう」と入力
して「菓子/用」と変換したい場合にも、最初の「し」
の前とその「し」と続く「よう」との間とに区切りの指
定位置が見つかるので、誤変換を生んでいた。
【0005】このように、区切り位置の指定データを間
違って使うと、変換への影響が非常に大きく、変換率や
操作性などにも大きな影響を与えていた。
【0006】本発明は、前記従来の欠点を除去し、区切
りの指定位置の正確さを増して、区切り位置指定データ
による誤変換を少なくし、変換率の向上および操作性の
向上を実現できる文書処理方法及びその装置を提供す
る。
【0007】
【課題を解決するための手段】この課題を解決するため
に、本発明の文書処理方法は、区切り位置指定データを
サーチする区切りデータサーチ行程と、前記区切りデー
タサーチの結果に基づいて、文節を決定する文節決定行
程と、前記決定された文節を変更可能とする候補変更行
程と、区切り位置の変更があった場合、区切り位置を記
憶する区切り位置記憶行程とを備え、前記区切り位置記
憶行程は、対象文節を第1の自立部区切りデータとして
記憶する行程と、対象文節が付属語の文節であり、かつ
前の文節が付属語文節の場合に、付属部区切りデータと
して記憶する行程と、対象文節が付属語の文節であり、
かつ前の文節が自立語文節の場合に、第2の自立部区切
りデータとして記憶する行程とを含み、前記文節決定行
程は、前記第1及び第2の自立部区切りデータと一致す
る場合、あるいは前記付属部区切りデータと一致する場
合に、区切りデータに基づいて文字列を区切る文字列区
切行程を含むことを特徴とする。
【0008】また、本発明の文書処理装置は、区切り位
置指定データをサーチする区切りデータサーチして、前
記区切りデータサーチの結果に基づいて文節を決定する
文節決定手段と、区切り位置の変更があった場合、区切
り位置を記憶する区切り位置記憶手段とを備え、前記区
切り位置記憶手段は、対象文節を第1の自立部区切りデ
ータとして記憶し、対象文節が付属語の文節であり、か
つ前の文節が付属語文節の場合に、付属部区切りデータ
として記憶し、対象文節が付属語の文節であり、かつ前
の文節が自立語文節の場合に、第2の自立部区切りデー
タとして記憶し、前記文節決定手段は、前記第1及び第
2の自立部区切りデータと一致する場合、あるいは前記
付属部区切りデータと一致する場合に、区切りデータに
基づいて文字列を区切る文字列区切手段を含むことを特
徴とする。
【0009】
【実施例】以下、本発明の一実施例を図に従って詳細に
説明する。
【0010】図1は、本発明の文書処理方法が実施され
る一実施例の情報処理システムの構成を表したブロック
図である。
【0011】図1に於て、キーボードなどの入力装置1
から入力された文字列は、ハード・ディスク(HD)や
フロッピー・ディスク(FD)やメモリなどの記憶装置
3に記憶されている単語情報を含む辞書3bをもとに、
中央演算処理装置2によって処理プログラム3aが実行
処理されて、その処理結果はCRTなどの出力装置4に
出力されている。
【0012】本実施例での処理の流れを、処理プログラ
ム3aとして格納された図2,図3,図4のフローチャ
ートを用いて説明する。本例でも、従来例と同様に「そ
うさしようとした」という文字列が入力された場合につ
いて説明する。
【0013】図2のステップS21では、図7に示すよ
うに、区切り指定位置のデータをサーチする。ステップ
S21では、図3に示すように、ステップS31で自立
部区切りサーチを行う。その結果、自立部の区切りが見
つかった場合は、ステップS35へ進み区切り位置指定
を行う。ここで、前後の自立部の区切りが一致する場合
のみを、自立部の区切りが見つかったとする。自立部の
区切りが見つからなかった場合はステップS33へ進
み、付属部の区切りサーチを行う。ステップS34で
は、付属部の区切りが見つかった場合はステップS35
へ進み、付属部の区切りが見つからなかった場合は終了
する。ステップS35では、区切り位置指定を行い終了
する。
【0014】ステップS22では、図8の文節決定の図
に示すように、区切り指定位置に一致するデータが格納
されていた場合、そのデータに従って、文節位置を決定
する。見つからない場合には、辞書などをサーチし尤も
らしい1文節に文節を決定する。本実施例例では、「奏
/しようと/した」が格納されていたので、これを変換
候補として出力する。
【0015】ステップS23では、オペレータが希望す
る文節かどうかを判断し、希望する文節でなかった場合
にはステップS24の処理を行なう。ステップS24で
は、図9の候補変更の図に示すように、変換候補をオペ
レータの希望する候補に変更する。本実施例では、従来
例同様に、「奏/氏/用と/した」と変更されたとす
る。
【0016】ステップS25では、区切り位置の変更が
あるかどうか判断し、区切り位置の変更があった場合に
はステップS26で区切り位置を記憶し、区切り位置の
変更がなかった場合にはステップS27の処理を行な
う。ステップS26の区切り位置の記憶では、図9に示
すように、区切り指定位置に従って記憶を行なう。本実
施例では、後述の図4のフローチャートに従って自立部
区切りデータとして「し/よう」と「そう/し」が記憶
される。
【0017】ステップS27では、未処理の文節がある
かどうか判断し、未処理の文節がある場合にはステップ
S25からの処理を繰り返す。
【0018】なお、ステップS26の区切り位置記憶処
理では、図4のフローチャートに示すように、ステップ
S41で対象文節を自立部区切り学習データ(本例では
「し/よう」)として登録する。ステップS42で対象
文節が付属語かどうか判断し、ステップS43で前文節
が付属語かどうか判断し、前文節が自立語だった場合に
は、ステップS44で入力文字列の先頭からしか適用し
ない自立部区切りデータ(本例では「そう/し」)を作
成する。
【0019】前文節が付属語だった場合には、ステップ
S45で入力文字列の途中から一致しても適用できる付
属部区切りデータを作成する。従って、付属部区切りデ
ータ「/し/よう」は作成されない。
【0020】以上のように区切り学習データを作成し、
次に同じ文字列の変換の時には、図2のステップS21
で区切りデータをサーチすると、図10の区切りデータ
サーチの図に示すように、「そう」と「し」の間に自立
部区切りデータが見つかり、更に「し」と「よう」の間
に自立部区切りデータが見つかるので、それぞれの位置
を区切り指定する。この自立部区切りデータの位置を基
にステップS22に示す文節決定処理を行ない、結果的
には図11の文節決定の図に示すように、前の変換と同
じ候補を得ることが出来る。
【0021】ここで、従来例同様に、「そうさしようと
した」あるいは「かしよう」という文字列が入力された
としても、「そう/し」と「し/よう」との両方に合致
しないので、従来例のように「/氏/用と」と区切られ
ることはない。上記入力文字列についても学習が行われ
ていれば、図12に示すように、所望に変換が可能とな
る。
【0022】尚、本実施例では、特定の入力文字列を例
にとって説明したが、この変換方法は本例の入力文字列
においてのみ効果を奏するものでないことは、同業者に
は自明である。
【0023】また、本発明は、複数の機器から構成され
るシステムに適用しても、1つの機器から成る装置に適
用しても良い。また、本発明はシステム或は装置にプロ
グラムを供給することによって達成される場合にも適用
できることは言うまでもない。
【0024】
【発明の効果】付属部の区切りデータの条件を厳しく
し、自立部区切りデータは前後2つのデータの条件が一
致しなければ区切の効果がないように処理をすることに
より、区切りの指定位置の正確性を増して、区切り位置
指定データによる誤変換を少なくし、変換率の向上およ
び操作性の向上を実現できる。
【図面の簡単な説明】
【図1】本実施例の情報処理システムの構成を表すブロ
ック図である。
【図2】本実施例の全体処理のフローチャートである。
【図3】本実施例の区切りデータサーチ処理のフローチ
ャートである。
【図4】本実施例の区切り位置記憶処理のフローチャー
トである。
【図5】従来技術での候補変更処理の例を示す図であ
る。
【図6】従来技術での区切りデータの変換への影響の一
例を示すである。
【図7】本実施例での区切りデータサーチ処理の例を示
す図である。
【図8】本実施例での文節決定処理の例を示す図であ
る。
【図9】本実施例での候補変更処理の例を示す図であ
る。
【図10】本実施例での区切りデータサーチ処理の例を
示す図である。
【図11】本実施例での文節決定処理の例を示す図であ
る。
【図12】本実施例での変換結果の一例を示す図であ
る。
【符号の説明】
1 入力装置 2 中央演算処理装置 3 記憶装置 3a 処理プログラム 3b 辞書 4 出力装置

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 区切り位置指定データをサーチする区切
    りデータサーチ行程と、 前記区切りデータサーチの結果に基づいて、文節を決定
    する文節決定行程と、 前記決定された文節を変更可能とする候補変更行程と、 区切り位置の変更があった場合、区切り位置を記憶する
    区切り位置記憶行程とを備え、 前記区切り位置記憶行程は、対象文節を第1の自立部区
    切りデータとして記憶する行程と、対象文節が付属語の
    文節であり、かつ前の文節が付属語文節の場合に、付属
    部区切りデータとして記憶する行程と、対象文節が付属
    語の文節であり、かつ前の文節が自立語文節の場合に、
    第2の自立部区切りデータとして記憶する行程とを含
    み、 前記文節決定行程は、前記第1及び第2の自立部区切り
    データと一致する場合、あるいは前記付属部区切りデー
    タと一致する場合に、区切りデータに基づいて文字列を
    区切る文字列区切行程を含むことを特徴とする文書処理
    方法。
  2. 【請求項2】 区切り位置指定データをサーチする区切
    りデータサーチして、前記区切りデータサーチの結果に
    基づいて文節を決定する文節決定手段と、 区切り位置の変更があった場合、区切り位置を記憶する
    区切り位置記憶手段とを備え、 前記区切り位置記憶手段は、対象文節を第1の自立部区
    切りデータとして記憶し、対象文節が付属語の文節であ
    り、かつ前の文節が付属語文節の場合に、付属部区切り
    データとして記憶し、対象文節が付属語の文節であり、
    かつ前の文節が自立語文節の場合に、第2の自立部区切
    りデータとして記憶し、 前記文節決定手段は、前記第1及び第2の自立部区切り
    データと一致する場合、あるいは前記付属部区切りデー
    タと一致する場合に、区切りデータに基づいて文字列を
    区切る文字列区切手段を含むことを特徴とする文書処理
    装置。
JP5354526A 1993-12-29 1993-12-29 文書処理方法及びその装置 Pending JPH07200571A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5354526A JPH07200571A (ja) 1993-12-29 1993-12-29 文書処理方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5354526A JPH07200571A (ja) 1993-12-29 1993-12-29 文書処理方法及びその装置

Publications (1)

Publication Number Publication Date
JPH07200571A true JPH07200571A (ja) 1995-08-04

Family

ID=18438150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5354526A Pending JPH07200571A (ja) 1993-12-29 1993-12-29 文書処理方法及びその装置

Country Status (1)

Country Link
JP (1) JPH07200571A (ja)

Similar Documents

Publication Publication Date Title
JP2836159B2 (ja) 同時通訳向き音声認識システムおよびその音声認識方法
US5649023A (en) Method and apparatus for indexing a plurality of handwritten objects
JP2741575B2 (ja) 文字認識文字補完方法及びコンピュータ・システム
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JP4084515B2 (ja) アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体
JPH07200571A (ja) 文書処理方法及びその装置
JPH09198404A (ja) 文書処理方法及び装置
JP2004318441A (ja) かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
JPH07191986A (ja) 文章入力装置
JPH07200576A (ja) 文書処理方法及びその装置
JPH09274613A (ja) 文字列予測方法及びこの文字列予測方法を用いた文書作成装置
JP3466761B2 (ja) 文書処理装置及びその制御方法
JP2002163291A (ja) 類似文書検索装置、類似文書検索方法及び記録媒体
JP3353769B2 (ja) 文字認識装置、文字認識方法、文字認識プログラム記録媒体
JP2838850B2 (ja) 仮名漢字変換装置
JPH04372047A (ja) 仮名漢字変換装置
JP2739823B2 (ja) 形態素解析装置
JPH0380363A (ja) 文書処理装置
JP3387582B2 (ja) 文字処理装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JP2000194389A (ja) 情報処理装置
JPH10269209A (ja) 文字列予測装置及び文字列予測方法
JPH02249087A (ja) 英単語検索装置
JP2000181909A (ja) 辞書学習方法及び文書作成装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040416