JPH04149665A - 文字処理方法およびその装置 - Google Patents
文字処理方法およびその装置Info
- Publication number
- JPH04149665A JPH04149665A JP2271128A JP27112890A JPH04149665A JP H04149665 A JPH04149665 A JP H04149665A JP 2271128 A JP2271128 A JP 2271128A JP 27112890 A JP27112890 A JP 27112890A JP H04149665 A JPH04149665 A JP H04149665A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- katakana
- stored
- character
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明1よ 文書の作直 管理等の文書処理を目的とし
た文字処理方法およびその装置に関するものであム 従来の技術 日本語文章の中では外来語を表わすためにカタカナが用
いられていも しかしなか収 外来語のカタカナ表記方
法は一定でなく、一つの文章中に複数の表記が混在して
いることが多(ち このような現象は 文章の統一性を
損なしく 読み易さを阻害すると言われていも これに
対し カタカナ表記のゆれを自動的に検出するカタカナ
表記のゆれ検出装置が近年考案されていも (特開昭6
2−290965号公報) 第2図(よ 従来のカタカナ表記のゆれ検出装置の構成
図であ4 1屯 21(友 文章記憶部であり、入力された文章を
記憶する。文章記憶部21としては ICメモリ、磁気
ディスク装置などが用いられていも22は カタカナ列
抽出部であり、文章記憶部21が記憶している文章の中
からカタカナ列を抽出す42311 カタカナ列記憶
部であり、カタカす列抽出部22によって抽出されたカ
タカナ列とともに 文章記憶部21に記憶された文章に
おける位置の情報も記憶すも カタカナ記憶部23とし
て1上 文章記憶部21と同様に ICメモリ、磁気デ
ィスク装置などが用いられていム 24はカタカナ列変
形部であり、カタカナ列記憶部23に記憶されたカタカ
ナ列に対してカタカナあるいは部分カタカナ列を削除ま
たは置換することによって変形を加え、L25+L
変形結果記憶部であり、カタカナ列変形部24によって
変形された結果を、カタカナ列記憶部23に記憶された
カタカナ列と対応づけて記憶す4261;L 変形結
果比較部であり、変形結果記憶部25に記憶された変形
結果の一致するカタカナ列の一群を検出すム27(友
カタカナ列比較部であり、変形結果の一致する変形前の
カタカナ列の一群についてカタカナ列記憶部23に記憶
されたカタカナ列を比較することによって、変形結果は
一致するが変形前のカタカナ列は異なるカタカナ列の一
群を検出すも28代 ゆれ部分表示部であり、カタカナ
列比較部27によって検出されたカタカナ列の一群を表
示すも ゆれ部分表示部28として4よ たとえζ区C
RTデイスプレィ、液晶デイスプレィなどを用いも 表
示の方法ζ友 検出されたカタカナ列の部分を反転表示
したり、カラー表示したりする方法があム これら以外
にも構成要素が存在する力(本発明との対比のためには
必要がないので省略すも 上記のように構成された従来のカタカナ表記のゆれ検出
装置で1上 文書作成作業が完了した文書に対してカタ
カナ表記のゆれを検出してい九発明が解決しようとした
課題 従来のカタカナ表記のゆれ検出装置では 文書作成作業
が完了した文書を対象としてゆれを検出してい九 この
たべ ゆれを検出するために1よ文書作成作業が完了し
てから改めてゆれの検出処理を行わなければならなかっ
な 発明1.2沫 従来のカタカナ表記のゆれ検出装置が有
していた前記の問題点に鑑へ 文書作成作業の途屯 文
字列を入力する段階で人力されたカタカナ表記があらか
じめ設定されたカタカナ表記と異なる場合級 あらかじ
め設定されたカタカナ表記に統一することにより、カタ
カナ表記のゆれがない文書を効率よく作成することがで
きる文字処理装置を提供することを目的とすムまf:、
発明3.4 L あらかじめカタカナ文字列が設
定されていない場合でL 文書中で既に使用したカタカ
ナ表記にゆれが生じた場合には表記のゆれを統一できる
文字処理装置を提供することを目的とすa 更に 発明5、6は カタカナ表記のゆれが生じている
場合に あらかじめ設定されたカタカナ表記または文書
中で既に使用したカタカナ表記力\入力中のカタカナ表
記のどちらの表記に統一するかをオペレータが選択でき
る文字処理装置を提供することを目的とすム 課題を解決するための手段 第1の発明1よ 入力文字列を一時記憶する入力文字列
一時記憶部と、カタカナ文字列を記憶するカタカナ文字
列記憶部と、前記カタカナ文字列記憶部に記憶している
カタカナ文字列に対して相互に表記のゆれと認められる
カタカナ文字列を作成するゆれ文字列作成部と、前記ゆ
れ文字列作成部で作成したゆれ文字列を前記カタカナ文
字列記憶部で記憶しているカタカナ文字列と対応づけて
一時記憶するゆれ文字列一時記憶部と、前記入力文字列
一時記憶部で一時記憶している文字列と前記ゆれ文字列
一時記憶部で一時記憶しているゆれ文字列を比較して一
致する部分があるか否かを判定する文字列判定部と、前
記文字列判定部で一致すると判定されたとき、入力文字
列中の一致すると判定された部分を前記ゆれ文字列−鰺
記憶部が一致したゆれ文字列と対応づけて一時記憶して
いるカタカナ文字列と置換する表記統一部とを備えた文
字処理装置であム 第2の発明は 入力文字列を一時記憶する入力文字列一
時記憶段階と、カタカナ文字列に対して相互に表記のゆ
れと認められるカタカナ文字列を作成するゆれ文字列作
成段階と、前記ゆれ文字列作成段階で作成したゆれ文字
列を前記カタカナ文字列記憶段階で記憶しているカタカ
ナ文字列と対応づけて一時記憶するゆれ文字列一時記憶
段階と、前記入力文字列一時記憶段階で一時記憶してい
る文字列と前記ゆれ文字列一時記憶段階で一時記憶して
いるゆれ文字列を比較して一致する部分があるか否かを
判定する文字列判定段階と、前記文字列判定段階で一致
すると判定されたとき、入力文字列中の一致すると判定
された部分を一致したゆれ文字列と対応づけて一時記憶
しているカタカナ文字列と置換する表記統一段階とを備
えた文字処理方法であa 第3の発明は 前記入力部で入力された文字列を漢字か
なまじりの文字列に変換するかな漢字変換部と、前記か
な漢字変換部で変換した漢字かなまじりの文字列を格納
する変換文字列格納部と、前記変換文字列格納部で格納
した文字列の中からカタカナ文字列を抽出し 前記カタ
カナ文字列記憶部に記憶させるカタカナ文字列抽出部と
を付加した文字処理装置であム 第4の発明は 前記入力段階で入力された文字列を漢字
かなまじりの文字列に変換するかな漢字変換段階と、前
記かな漢字変換段階で変換した漢字かなまじりの文字列
を格納する変換文字列格納段階と、前記変換文字列格納
段階で格納した文字列の中からカタカナ文字列を抽出し
前記カタカナ文字列記憶部に記憶させるカタカナ文字
列抽出段階とを付加した文字処理方法であム 第5の発明は 前記入力部で入力された文字列を漢字か
なまじりの文字列に変換するかな漢字変換部と、前記か
な漢字変換部で変換した漢字かなまじりの文字列を格納
する変換文字列格納部と、前記変換文字列格納部で格納
した文字列の中からカタカナ文字列を抽出し 前記カタ
カナ文字列記憶部に記憶させるカタカナ文字列抽出部と
、前記文字列比較部で一致すると判定された部分があっ
たとき、ゆれ文字列と対応づけて記憶しているカタカナ
文字列に統一する力\ ゆれ文字列に統一するかをオペ
レータに選択させる統−表記指示部と、前記統一表記指
示部でゆれ文字列と対応づけて記憶しているカタカナ文
字列に統一すると決定したとき1よ 入力文字列の中で
ゆれ文字列と一致した部分をゆれ文字列と対応づけて記
憶している文字列と置換し ゆれ文字列に統一すると決
定したとき(友 変換文字列格納部で格納している文字
列の中でゆれ文字列と対応づけて記憶しているカタカナ
文字列と一致する部分をゆれ文字列のカタカナ文字列に
置換する拡張表記統一部とを付加した文字処理装置であ
ム 第6の発明(戴 前記入力段階で入力された文字列を漢
字かなまじりの文字列に変換するかな漢字変換段階と、
前記かな漢字変換段階で変換した漢字かなまじりの文字
列を格納する変換文字列格納段階と、前記変換文字列格
納段階で格納した文字列の中からカタカナ文字列を抽出
し 前記カタカナ文字列記憶部に記憶させるカタカナ文
字列抽出段階と、前記文字列比較段階で一致すると判定
された部分があったとき、ゆれ文字列と対応づけて記憶
しているカタカナ文字列に統一する力\ ゆれ文字列に
統一するかをオペレータに選択させる統一表記指示段階
と、前記統一表記指示段階でゆれ文字列と対応づけて記
憶しているカタカナ文字列に統一すると決定したときは
入力文字列の中でゆれ文字列と一致した部分をゆれ文
字列と対応づけて記憶している文字列と置換し ゆれ文
字列に統一すると決定したときは、 変換文字列格納段
階で格納している文字列の中でゆれ文字列と対応づけて
記憶しているカタカナ文字列と一致する部分をゆれ文字
列のカタカナ文字列に置換する拡張表記続−段階とを付
加した文字処理方法であ4作 用 第1、第2の発明は前記した構成により、ゆれ文字列作
成部(′L カタカナ文字列記憶部で記憶しているカタ
カナ文字列に対して、相互に表記のゆれと認められるカ
タカナ文字列を作成すも ゆれ文字列一時記憶部(友
ゆれ文字列作成部が作成したゆれ文字列をカタカナ文字
列記憶部で記憶しているカタカナ文字列と対応づけて一
時記憶す4文字列判定部は 人力文字列一時記憶部で一
時記憶された文字列とゆれ文字列一時記憶部で記憶して
いるゆれ文字列を比較すム 一致する部分があるときに
は 表記統一部力(入力文字列一時記憶部で一時記憶し
ている文字列のゆれ文字列と一致した部分をカタカナ文
字列記憶部で記憶しているカタカナ文字列に置き換えも 第3、第4の発明は前記した構成より、かな漢字変換部
が変換した漢字かなまじりの文字列を変換文字列格納部
が格納すム カタカナ文字列作成部1友 格納された文
字列からカタカナ文字列を抽出し カタカナ文字列記憶
部に記憶させム 以阪第1、第2の発明と同様に文字列
のゆれを統一すム 第5、第6の発明は前記した構成より、統−表記指示部
カミ カタカナ文字列記憶部で記憶しているカタカナ文
字列に統一するかゆれ文字列に統一するかをオペレータ
に選択させた抵 拡張表記統一部は 文書全体を統−表
記指示部が決定したカタカナ文字列に統一すム 実施例 以下、本発明の実施例を図面を用いて説明すも第1図(
上 本発明における一実施例の文字処理装置の構成図で
あa 第1図において101i1 人力文字列一時記憶部で
あり、キーボード等から入力されたひらがな文字列を一
時記憶す410H& かな漢字変換部であり、入力文
字列一時記憶部101で一時記憶されたひらがな文字列
を漢字かなまじりの文字列に変換す、5103i!
変換文字列格納部であり、かな漢字変換部102で変換
された結果を格納す4104i上 カタカナ文字列記憶
部であり、カタカナ文字列を記憶す、4105j&
カタカナ文字列抽出部であり、変換文字列格納部103
で格納した漢字かなまじりの文字列から一連のカタカナ
文字列を抽出し カタカナ文字列記憶部104に重複を
除いて追加記憶させ4106Gi ゆれ文字列作成部
であり、カタカナ文字列記憶部104で記憶しているカ
タカナ文字列に対して相互に表記のゆれと認められるカ
タカナ文字列を作成すも ゆれ文字列ζよ ゆれが生じ
やすい文字列をグループにして変形規則として持板 カ
タカナ文字列中にあてはまる部分があればそこを置き換
えることによって作成す4107!i ゆれ文字列一
時記憶部であり、ゆれ文字列作成部106で作成したゆ
れ文字列をカタカナ文字列記憶部102で記憶している
カタカナ文字列と対応づけて一時記憶すム l O81
友 文字列判定部であり、人力文字列一時記憶部lO
1で入力したひらがな文字列の中で、ゆれ文字列一時記
憶部107で一時記憶しているゆれ文字列と一致するも
のがあるか否かを判定す410941 統−表記指示
部であり、統−表記指示部108で一致するものがある
と判定されたとき番ミ カタカナ文字列記憶部102で
記憶している表記とゆれ文字列のどちらに統一するかを
表示し オペレータに選択させも 110ζ戴 表記統
一部であり、統−表記指示部109でオペレータが選択
したカタカナ文字列に文書全体を統一すa さら&ζ
ゆれ文字列に統一したときには ゆれ文字列一時記憶部
107で一時記憶しているゆれ文字列を削除すム 以上のように構成された本実施例の文字処理装置につい
て以下その動作を説明すも 今、ゆれ文字列作成部106でゆれ文字列を作成するた
めの変形規則の例として次のようなものを考えも ゆれが生じやすいカタカナ文字列のグループ(ジち
ゼ) (ニー、 エイ、 エイ) (つ入 ウニ) ゆれ文字列作成部106では 変形規則の中のカタカナ
文字列をカタカナ文字列の中から検索して同じグループ
の別のカタカナ文字列に変換すもカタカナ文字列記憶部
104で(よ カタカナ表記の1つとして「ブロゼクト
」を記憶しているものとすム ここで、次のような文章を入力すも [文章例] プロジェクト運営において、この問題は大きなウエート
を占めも ところ力(別のテーマが占めるウェイトの方
が大きいようち まず、ゆれ文字列作成部1064友 カタカナ文字列記
憶部104に記憶している「ブロゼクト」に対して、変
形規則(ジち ゼ)を適用してゆれ文字列「プロジェ
クト」を作成すも ゆれ文字列一時記憶部10’N;t
、、r’プロジエクト」をひらがな表記に変換すム こ
のとき、ゆれ文字列一時記憶部107に記憶される結果
は次のようになム[]内の数字はゆれ文字列の連番であ
り、 0内の数字は そのカタカナ文字列記憶部102
で記憶での識別番号であム [1]ぶろじ丸くと (1)次&二 人力
文字列一時記憶部101では ひらがな文字列として、
次のようなものを一時記憶し入力終了後にかな漢字変換
指示を出力すも入力文字列 ぷろじぇくとうんえいにおいて、このもんだいはおおき
なうえ−とをしめム 文字列判定部1084表 ゆれ文字列一時記憶部10
7に一時記憶している文字列と入力文字列を比較すム
この場合、 「ぷろし丸くと」は大力文字列中に一致す
る部分があるので、統−表記指示部1094友 rブロ
ゼクト」と「プロジェクト」を表示して、どちらにする
かをオペレータに選択させも 「プロゼクト」を選択し
た場合 人力文字列中の「ぷろじ、えくと」の部分を「
ブロゼクトに置き換えも 「プロジェクト」を選択した
場合ゆれ文字列一時記憶部で記憶している「ぷろじ丸く
と」を削除すム その抵 残りのひらがな文字列をかな
漢字変換部102で漢字かなまじりの文字列に変換し
変換結果を変換文字列格納部103で格納す社 「ブロ
ゼクト」を選択したとき、変換文字列格納部103で格
納した結果は次にようになム [変換文字列格納結果] ブロゼクト運営において、この問題は大きなウエートを
占めも 次4ミ カタカナ文字列抽出部105 il 変換文
字列格納部103で格納した文字列からカタカナ文字列
を抽出し カタカナ文字列記憶部104で記憶すム ゆ
れ文字列作成部106はゆれ文字列を作成すも この場
合 「プロゼクト」、 「ウエート」が抽出され カタ
カナ文字列記憶部104で沫 以下のように記憶されも (1)プロゼクト (2)ウエート また ゆれ文字列作成部106で61 rプロゼクト
」から「プロジェクト」、 「ウエート」から「ウェイ
ト」と「ウェイト」と「ウェート」が作成されて、ゆれ
文字列一時記憶部107でG戴 以下のように一時記憶
されも [1] [2] [3コ [4] ぶろじえく うえいと うえいと うえ−と と さらに 続きの文字列を次のように入力す表 入力文字列 ところ力(べつのて−まがしめるうえいとのほうがおお
きいようへ このとき、入力文字列中の「うえいと」とゆれ文字列一
時記憶部の[2] 「うえいと」が一致すも 統−表記
指示部109でゆれ文字列の「ウェイト」に統一すると
オペレータが選択したとき、変換文字列格納部103で
格納している文字列中の「ウエート」を「ウェイト」に
すべて置換することによって、文書全体のカタカナ表記
を統一す以上のように 本実施例によれば かな漢字変
換を行う前に ゆれが生じやすいカタカナ文字列をあら
かじめカタカナに変換することによって、かな漢字変換
用の辞書に登録されていないカタカチ語でk 単語区切
れを間違えることなく漢字かなまじりの文字列に変換で
きも な耘 本実施例で(友 カタカナ文字列をカタカナない
しひらがな文字の連鎖として表現していたが英字その他
の手段により表記してもよ(℃発明の効果 第1.第2の発明の文字処理装置及びその方法において
は カタカナ文字列記憶舐 ゆれ文字列作成縁 ゆれ文
字列一時記憶服 文字列判定皿表記統一部を設置す、文
字列の入力時に入力文字列をゆれ文字列と比較し 入力
された文字列中にカタカナ文字列記憶部で記憶している
カタカナ表記と異なるものがある場合に カタカナ文字
列記憶部で記憶しているカタカナ表記に統一することに
より、カタカナ表記のゆれがない文書を効率よく作成す
ることができも また 第3、第4の発明の文字処理装置及びその方法に
おいて11 かな漢字変換服 変換文字列格納餓 カタ
カナ文字列抽出部を設け、かな漢字変換が確定した段階
でカタカナ文字列を抽出し抽出したカタカナ文字列に対
してもゆれ文字列を作成することによって、あらかじめ
カタカナ文字列記憶部にカタカナ文字列が記憶されてい
なくてL 文書中に使用したカタカナ表記にゆれが生じ
た場合には表記のゆれを統一でき、その実用的効果は太
き(■ 更に 第5、第6の発明の文字処理装置及びその方法に
おいて(よ 統−表記指示部を設け、カタカナ表記のゆ
れが生じている場合に あらかじめ設定したカタカナ表
記または文書中で既に使用したカタカナ表記力\ 入力
中のカタカナ表記のどちらの表記に統一するかをオペレ
ータが選択できようにすることによって、オペレータが
所望する表記に柔軟に対応でき、その実用的効果は太き
(′+5
た文字処理方法およびその装置に関するものであム 従来の技術 日本語文章の中では外来語を表わすためにカタカナが用
いられていも しかしなか収 外来語のカタカナ表記方
法は一定でなく、一つの文章中に複数の表記が混在して
いることが多(ち このような現象は 文章の統一性を
損なしく 読み易さを阻害すると言われていも これに
対し カタカナ表記のゆれを自動的に検出するカタカナ
表記のゆれ検出装置が近年考案されていも (特開昭6
2−290965号公報) 第2図(よ 従来のカタカナ表記のゆれ検出装置の構成
図であ4 1屯 21(友 文章記憶部であり、入力された文章を
記憶する。文章記憶部21としては ICメモリ、磁気
ディスク装置などが用いられていも22は カタカナ列
抽出部であり、文章記憶部21が記憶している文章の中
からカタカナ列を抽出す42311 カタカナ列記憶
部であり、カタカす列抽出部22によって抽出されたカ
タカナ列とともに 文章記憶部21に記憶された文章に
おける位置の情報も記憶すも カタカナ記憶部23とし
て1上 文章記憶部21と同様に ICメモリ、磁気デ
ィスク装置などが用いられていム 24はカタカナ列変
形部であり、カタカナ列記憶部23に記憶されたカタカ
ナ列に対してカタカナあるいは部分カタカナ列を削除ま
たは置換することによって変形を加え、L25+L
変形結果記憶部であり、カタカナ列変形部24によって
変形された結果を、カタカナ列記憶部23に記憶された
カタカナ列と対応づけて記憶す4261;L 変形結
果比較部であり、変形結果記憶部25に記憶された変形
結果の一致するカタカナ列の一群を検出すム27(友
カタカナ列比較部であり、変形結果の一致する変形前の
カタカナ列の一群についてカタカナ列記憶部23に記憶
されたカタカナ列を比較することによって、変形結果は
一致するが変形前のカタカナ列は異なるカタカナ列の一
群を検出すも28代 ゆれ部分表示部であり、カタカナ
列比較部27によって検出されたカタカナ列の一群を表
示すも ゆれ部分表示部28として4よ たとえζ区C
RTデイスプレィ、液晶デイスプレィなどを用いも 表
示の方法ζ友 検出されたカタカナ列の部分を反転表示
したり、カラー表示したりする方法があム これら以外
にも構成要素が存在する力(本発明との対比のためには
必要がないので省略すも 上記のように構成された従来のカタカナ表記のゆれ検出
装置で1上 文書作成作業が完了した文書に対してカタ
カナ表記のゆれを検出してい九発明が解決しようとした
課題 従来のカタカナ表記のゆれ検出装置では 文書作成作業
が完了した文書を対象としてゆれを検出してい九 この
たべ ゆれを検出するために1よ文書作成作業が完了し
てから改めてゆれの検出処理を行わなければならなかっ
な 発明1.2沫 従来のカタカナ表記のゆれ検出装置が有
していた前記の問題点に鑑へ 文書作成作業の途屯 文
字列を入力する段階で人力されたカタカナ表記があらか
じめ設定されたカタカナ表記と異なる場合級 あらかじ
め設定されたカタカナ表記に統一することにより、カタ
カナ表記のゆれがない文書を効率よく作成することがで
きる文字処理装置を提供することを目的とすムまf:、
発明3.4 L あらかじめカタカナ文字列が設
定されていない場合でL 文書中で既に使用したカタカ
ナ表記にゆれが生じた場合には表記のゆれを統一できる
文字処理装置を提供することを目的とすa 更に 発明5、6は カタカナ表記のゆれが生じている
場合に あらかじめ設定されたカタカナ表記または文書
中で既に使用したカタカナ表記力\入力中のカタカナ表
記のどちらの表記に統一するかをオペレータが選択でき
る文字処理装置を提供することを目的とすム 課題を解決するための手段 第1の発明1よ 入力文字列を一時記憶する入力文字列
一時記憶部と、カタカナ文字列を記憶するカタカナ文字
列記憶部と、前記カタカナ文字列記憶部に記憶している
カタカナ文字列に対して相互に表記のゆれと認められる
カタカナ文字列を作成するゆれ文字列作成部と、前記ゆ
れ文字列作成部で作成したゆれ文字列を前記カタカナ文
字列記憶部で記憶しているカタカナ文字列と対応づけて
一時記憶するゆれ文字列一時記憶部と、前記入力文字列
一時記憶部で一時記憶している文字列と前記ゆれ文字列
一時記憶部で一時記憶しているゆれ文字列を比較して一
致する部分があるか否かを判定する文字列判定部と、前
記文字列判定部で一致すると判定されたとき、入力文字
列中の一致すると判定された部分を前記ゆれ文字列−鰺
記憶部が一致したゆれ文字列と対応づけて一時記憶して
いるカタカナ文字列と置換する表記統一部とを備えた文
字処理装置であム 第2の発明は 入力文字列を一時記憶する入力文字列一
時記憶段階と、カタカナ文字列に対して相互に表記のゆ
れと認められるカタカナ文字列を作成するゆれ文字列作
成段階と、前記ゆれ文字列作成段階で作成したゆれ文字
列を前記カタカナ文字列記憶段階で記憶しているカタカ
ナ文字列と対応づけて一時記憶するゆれ文字列一時記憶
段階と、前記入力文字列一時記憶段階で一時記憶してい
る文字列と前記ゆれ文字列一時記憶段階で一時記憶して
いるゆれ文字列を比較して一致する部分があるか否かを
判定する文字列判定段階と、前記文字列判定段階で一致
すると判定されたとき、入力文字列中の一致すると判定
された部分を一致したゆれ文字列と対応づけて一時記憶
しているカタカナ文字列と置換する表記統一段階とを備
えた文字処理方法であa 第3の発明は 前記入力部で入力された文字列を漢字か
なまじりの文字列に変換するかな漢字変換部と、前記か
な漢字変換部で変換した漢字かなまじりの文字列を格納
する変換文字列格納部と、前記変換文字列格納部で格納
した文字列の中からカタカナ文字列を抽出し 前記カタ
カナ文字列記憶部に記憶させるカタカナ文字列抽出部と
を付加した文字処理装置であム 第4の発明は 前記入力段階で入力された文字列を漢字
かなまじりの文字列に変換するかな漢字変換段階と、前
記かな漢字変換段階で変換した漢字かなまじりの文字列
を格納する変換文字列格納段階と、前記変換文字列格納
段階で格納した文字列の中からカタカナ文字列を抽出し
前記カタカナ文字列記憶部に記憶させるカタカナ文字
列抽出段階とを付加した文字処理方法であム 第5の発明は 前記入力部で入力された文字列を漢字か
なまじりの文字列に変換するかな漢字変換部と、前記か
な漢字変換部で変換した漢字かなまじりの文字列を格納
する変換文字列格納部と、前記変換文字列格納部で格納
した文字列の中からカタカナ文字列を抽出し 前記カタ
カナ文字列記憶部に記憶させるカタカナ文字列抽出部と
、前記文字列比較部で一致すると判定された部分があっ
たとき、ゆれ文字列と対応づけて記憶しているカタカナ
文字列に統一する力\ ゆれ文字列に統一するかをオペ
レータに選択させる統−表記指示部と、前記統一表記指
示部でゆれ文字列と対応づけて記憶しているカタカナ文
字列に統一すると決定したとき1よ 入力文字列の中で
ゆれ文字列と一致した部分をゆれ文字列と対応づけて記
憶している文字列と置換し ゆれ文字列に統一すると決
定したとき(友 変換文字列格納部で格納している文字
列の中でゆれ文字列と対応づけて記憶しているカタカナ
文字列と一致する部分をゆれ文字列のカタカナ文字列に
置換する拡張表記統一部とを付加した文字処理装置であ
ム 第6の発明(戴 前記入力段階で入力された文字列を漢
字かなまじりの文字列に変換するかな漢字変換段階と、
前記かな漢字変換段階で変換した漢字かなまじりの文字
列を格納する変換文字列格納段階と、前記変換文字列格
納段階で格納した文字列の中からカタカナ文字列を抽出
し 前記カタカナ文字列記憶部に記憶させるカタカナ文
字列抽出段階と、前記文字列比較段階で一致すると判定
された部分があったとき、ゆれ文字列と対応づけて記憶
しているカタカナ文字列に統一する力\ ゆれ文字列に
統一するかをオペレータに選択させる統一表記指示段階
と、前記統一表記指示段階でゆれ文字列と対応づけて記
憶しているカタカナ文字列に統一すると決定したときは
入力文字列の中でゆれ文字列と一致した部分をゆれ文
字列と対応づけて記憶している文字列と置換し ゆれ文
字列に統一すると決定したときは、 変換文字列格納段
階で格納している文字列の中でゆれ文字列と対応づけて
記憶しているカタカナ文字列と一致する部分をゆれ文字
列のカタカナ文字列に置換する拡張表記続−段階とを付
加した文字処理方法であ4作 用 第1、第2の発明は前記した構成により、ゆれ文字列作
成部(′L カタカナ文字列記憶部で記憶しているカタ
カナ文字列に対して、相互に表記のゆれと認められるカ
タカナ文字列を作成すも ゆれ文字列一時記憶部(友
ゆれ文字列作成部が作成したゆれ文字列をカタカナ文字
列記憶部で記憶しているカタカナ文字列と対応づけて一
時記憶す4文字列判定部は 人力文字列一時記憶部で一
時記憶された文字列とゆれ文字列一時記憶部で記憶して
いるゆれ文字列を比較すム 一致する部分があるときに
は 表記統一部力(入力文字列一時記憶部で一時記憶し
ている文字列のゆれ文字列と一致した部分をカタカナ文
字列記憶部で記憶しているカタカナ文字列に置き換えも 第3、第4の発明は前記した構成より、かな漢字変換部
が変換した漢字かなまじりの文字列を変換文字列格納部
が格納すム カタカナ文字列作成部1友 格納された文
字列からカタカナ文字列を抽出し カタカナ文字列記憶
部に記憶させム 以阪第1、第2の発明と同様に文字列
のゆれを統一すム 第5、第6の発明は前記した構成より、統−表記指示部
カミ カタカナ文字列記憶部で記憶しているカタカナ文
字列に統一するかゆれ文字列に統一するかをオペレータ
に選択させた抵 拡張表記統一部は 文書全体を統−表
記指示部が決定したカタカナ文字列に統一すム 実施例 以下、本発明の実施例を図面を用いて説明すも第1図(
上 本発明における一実施例の文字処理装置の構成図で
あa 第1図において101i1 人力文字列一時記憶部で
あり、キーボード等から入力されたひらがな文字列を一
時記憶す410H& かな漢字変換部であり、入力文
字列一時記憶部101で一時記憶されたひらがな文字列
を漢字かなまじりの文字列に変換す、5103i!
変換文字列格納部であり、かな漢字変換部102で変換
された結果を格納す4104i上 カタカナ文字列記憶
部であり、カタカナ文字列を記憶す、4105j&
カタカナ文字列抽出部であり、変換文字列格納部103
で格納した漢字かなまじりの文字列から一連のカタカナ
文字列を抽出し カタカナ文字列記憶部104に重複を
除いて追加記憶させ4106Gi ゆれ文字列作成部
であり、カタカナ文字列記憶部104で記憶しているカ
タカナ文字列に対して相互に表記のゆれと認められるカ
タカナ文字列を作成すも ゆれ文字列ζよ ゆれが生じ
やすい文字列をグループにして変形規則として持板 カ
タカナ文字列中にあてはまる部分があればそこを置き換
えることによって作成す4107!i ゆれ文字列一
時記憶部であり、ゆれ文字列作成部106で作成したゆ
れ文字列をカタカナ文字列記憶部102で記憶している
カタカナ文字列と対応づけて一時記憶すム l O81
友 文字列判定部であり、人力文字列一時記憶部lO
1で入力したひらがな文字列の中で、ゆれ文字列一時記
憶部107で一時記憶しているゆれ文字列と一致するも
のがあるか否かを判定す410941 統−表記指示
部であり、統−表記指示部108で一致するものがある
と判定されたとき番ミ カタカナ文字列記憶部102で
記憶している表記とゆれ文字列のどちらに統一するかを
表示し オペレータに選択させも 110ζ戴 表記統
一部であり、統−表記指示部109でオペレータが選択
したカタカナ文字列に文書全体を統一すa さら&ζ
ゆれ文字列に統一したときには ゆれ文字列一時記憶部
107で一時記憶しているゆれ文字列を削除すム 以上のように構成された本実施例の文字処理装置につい
て以下その動作を説明すも 今、ゆれ文字列作成部106でゆれ文字列を作成するた
めの変形規則の例として次のようなものを考えも ゆれが生じやすいカタカナ文字列のグループ(ジち
ゼ) (ニー、 エイ、 エイ) (つ入 ウニ) ゆれ文字列作成部106では 変形規則の中のカタカナ
文字列をカタカナ文字列の中から検索して同じグループ
の別のカタカナ文字列に変換すもカタカナ文字列記憶部
104で(よ カタカナ表記の1つとして「ブロゼクト
」を記憶しているものとすム ここで、次のような文章を入力すも [文章例] プロジェクト運営において、この問題は大きなウエート
を占めも ところ力(別のテーマが占めるウェイトの方
が大きいようち まず、ゆれ文字列作成部1064友 カタカナ文字列記
憶部104に記憶している「ブロゼクト」に対して、変
形規則(ジち ゼ)を適用してゆれ文字列「プロジェ
クト」を作成すも ゆれ文字列一時記憶部10’N;t
、、r’プロジエクト」をひらがな表記に変換すム こ
のとき、ゆれ文字列一時記憶部107に記憶される結果
は次のようになム[]内の数字はゆれ文字列の連番であ
り、 0内の数字は そのカタカナ文字列記憶部102
で記憶での識別番号であム [1]ぶろじ丸くと (1)次&二 人力
文字列一時記憶部101では ひらがな文字列として、
次のようなものを一時記憶し入力終了後にかな漢字変換
指示を出力すも入力文字列 ぷろじぇくとうんえいにおいて、このもんだいはおおき
なうえ−とをしめム 文字列判定部1084表 ゆれ文字列一時記憶部10
7に一時記憶している文字列と入力文字列を比較すム
この場合、 「ぷろし丸くと」は大力文字列中に一致す
る部分があるので、統−表記指示部1094友 rブロ
ゼクト」と「プロジェクト」を表示して、どちらにする
かをオペレータに選択させも 「プロゼクト」を選択し
た場合 人力文字列中の「ぷろじ、えくと」の部分を「
ブロゼクトに置き換えも 「プロジェクト」を選択した
場合ゆれ文字列一時記憶部で記憶している「ぷろじ丸く
と」を削除すム その抵 残りのひらがな文字列をかな
漢字変換部102で漢字かなまじりの文字列に変換し
変換結果を変換文字列格納部103で格納す社 「ブロ
ゼクト」を選択したとき、変換文字列格納部103で格
納した結果は次にようになム [変換文字列格納結果] ブロゼクト運営において、この問題は大きなウエートを
占めも 次4ミ カタカナ文字列抽出部105 il 変換文
字列格納部103で格納した文字列からカタカナ文字列
を抽出し カタカナ文字列記憶部104で記憶すム ゆ
れ文字列作成部106はゆれ文字列を作成すも この場
合 「プロゼクト」、 「ウエート」が抽出され カタ
カナ文字列記憶部104で沫 以下のように記憶されも (1)プロゼクト (2)ウエート また ゆれ文字列作成部106で61 rプロゼクト
」から「プロジェクト」、 「ウエート」から「ウェイ
ト」と「ウェイト」と「ウェート」が作成されて、ゆれ
文字列一時記憶部107でG戴 以下のように一時記憶
されも [1] [2] [3コ [4] ぶろじえく うえいと うえいと うえ−と と さらに 続きの文字列を次のように入力す表 入力文字列 ところ力(べつのて−まがしめるうえいとのほうがおお
きいようへ このとき、入力文字列中の「うえいと」とゆれ文字列一
時記憶部の[2] 「うえいと」が一致すも 統−表記
指示部109でゆれ文字列の「ウェイト」に統一すると
オペレータが選択したとき、変換文字列格納部103で
格納している文字列中の「ウエート」を「ウェイト」に
すべて置換することによって、文書全体のカタカナ表記
を統一す以上のように 本実施例によれば かな漢字変
換を行う前に ゆれが生じやすいカタカナ文字列をあら
かじめカタカナに変換することによって、かな漢字変換
用の辞書に登録されていないカタカチ語でk 単語区切
れを間違えることなく漢字かなまじりの文字列に変換で
きも な耘 本実施例で(友 カタカナ文字列をカタカナない
しひらがな文字の連鎖として表現していたが英字その他
の手段により表記してもよ(℃発明の効果 第1.第2の発明の文字処理装置及びその方法において
は カタカナ文字列記憶舐 ゆれ文字列作成縁 ゆれ文
字列一時記憶服 文字列判定皿表記統一部を設置す、文
字列の入力時に入力文字列をゆれ文字列と比較し 入力
された文字列中にカタカナ文字列記憶部で記憶している
カタカナ表記と異なるものがある場合に カタカナ文字
列記憶部で記憶しているカタカナ表記に統一することに
より、カタカナ表記のゆれがない文書を効率よく作成す
ることができも また 第3、第4の発明の文字処理装置及びその方法に
おいて11 かな漢字変換服 変換文字列格納餓 カタ
カナ文字列抽出部を設け、かな漢字変換が確定した段階
でカタカナ文字列を抽出し抽出したカタカナ文字列に対
してもゆれ文字列を作成することによって、あらかじめ
カタカナ文字列記憶部にカタカナ文字列が記憶されてい
なくてL 文書中に使用したカタカナ表記にゆれが生じ
た場合には表記のゆれを統一でき、その実用的効果は太
き(■ 更に 第5、第6の発明の文字処理装置及びその方法に
おいて(よ 統−表記指示部を設け、カタカナ表記のゆ
れが生じている場合に あらかじめ設定したカタカナ表
記または文書中で既に使用したカタカナ表記力\ 入力
中のカタカナ表記のどちらの表記に統一するかをオペレ
ータが選択できようにすることによって、オペレータが
所望する表記に柔軟に対応でき、その実用的効果は太き
(′+5
第1図は本発明の一実施例の文字処理装置の構成艮 第
2図は従来の文字処理装置の構成図であム 101・・・入力文字列一時記憶臥 102・・・かな
漢字変換臥 103・・・変換文字列格納眼 104・
・・カタカナ文字列記憶@ 105・・・カタカナ文字
列抽出K 106・・・ゆれ文字列作成服 107・
・・ゆれ文字列一時記憶舐 108・・・文字列判定へ
109・・・統一表記指示a(!、、110・・・拡張
表記統一代理人の氏名 弁理士 小鍜治 明 ほか2名 第 図
2図は従来の文字処理装置の構成図であム 101・・・入力文字列一時記憶臥 102・・・かな
漢字変換臥 103・・・変換文字列格納眼 104・
・・カタカナ文字列記憶@ 105・・・カタカナ文字
列抽出K 106・・・ゆれ文字列作成服 107・
・・ゆれ文字列一時記憶舐 108・・・文字列判定へ
109・・・統一表記指示a(!、、110・・・拡張
表記統一代理人の氏名 弁理士 小鍜治 明 ほか2名 第 図
Claims (6)
- (1)入力文字列を一時記憶する入力文字列一時記憶部
と、カタカナ文字列を記憶するカタカナ文字列記憶部と
、前記カタカナ文字列記憶部に記憶しているカタカナ文
字列に対して相互に表記のゆれと認められるカタカナ文
字列を作成するゆれ文字列作成部と、前記ゆれ文字列作
成部で作成したゆれ文字列を前記カタカナ文字列記憶部
で記憶しているカタカナ文字列と対応づけて一時記憶す
るゆれ文字列一時記憶部と、前記入力文字列一時記憶部
で一時記憶している文字列と前記ゆれ文字列一時記憶部
で一時記憶しているゆれ文字列を比較して一致する部分
があるか否かを判定する文字列判定部と、前記文字列判
定部で一致すると判定されたとき、入力文字列中の一致
すると判定された部分を前記ゆれ文字列一時記憶部が一
致したゆれ文字列と対応づけて一時記憶しているカタカ
ナ文字列と置換する表記統一部とを具備することを特徴
とした文字処理装置。 - (2)入力文字列を一時記憶する入力文字列一時記憶段
階と、カタカナ文字列に対して相互に表記のゆれと認め
られるカタカナ文字列を作成するゆれ文字列作成段階と
、前記ゆれ文字列作成段階で作成したゆれ文字列を前記
カタカナ文字列記憶段階で記憶しているカタカナ文字列
と対応づけて一時記憶するゆれ文字列一時記憶段階と、
前記入力文字列一時記憶段階で一時記憶している文字列
と前記ゆれ文字列一時記憶段階で一時記憶しているゆれ
文字列を比較して一致する部分があるか否かを判定する
文字列判定段階と、前記文字列判定段階で一致すると判
定されたとき、入力文字列中の一致すると判定された部
分を一致したゆれ文字列と対応づけて一時記憶している
カタカナ文字列と置換する表記統一段階とを具備するこ
とを特徴とした文字処理方法。 - (3)入力部で入力された文字列を漢字かなまじりの文
字列に変換するかな漢字変換部と、前記かな漢字変換部
で変換した漢字かなまじりの文字列を格納する変換文字
列格納部と、前記変換文字列格納部で格納した文字列の
中からカタカナ文字列を抽出し、カタカナ文字列記憶部
に記憶させるカタカナ文字列抽出部とを具備することを
特徴とした請求項1記載の文字処理装置。 - (4)入力段階で入力された文字列を漢字かなまじりの
文字列に変換するかな漢字変換段階と、前記かな漢字変
換段階で変換した漢字かなまじりの文字列を格納する変
換文字列格納段階と、前記変換文字列格納段階で格納し
た文字列の中からカタカナ文字列を抽出し、カタカナ文
字列記憶部に記憶させるカタカナ文字列抽出段階とを具
備することを特徴とした請求項2記載の文字処理方法。 - (5)入力部で入力された文字列を漢字かなまじりの文
字列に変換するかな漢字変換部と、前記かな漢字変換部
で変換した漢字かなまじりの文字列を格納する変換文字
列格納部と、前記変換文字列格納部で格納した文字列の
中からカタカナ文字列を抽出し、前記カタカナ文字列記
憶部に記憶させるカタカナ文字列抽出部と、前記文字列
比較部で一致すると判定された部分があったとき、ゆれ
文字列と対応づけて記憶しているカタカナ文字列に統一
するか、ゆれ文字列に統一するかをオペレータに選択さ
せる統一表記指示部と、前記統一表記指示部でゆれ文字
列と対応づけて記憶しているカタカナ文字列に統一する
と決定したときは、入力文字列の中でゆれ文字列と一致
した部分をゆれ文字列と対応づけて記憶している文字列
と置換し、ゆれ文字列に統一すると決定したときは、変
換文字列格納部で格納している文字列の中でゆれ文字列
と対応づけて記憶しているカタカナ文字列と一致する部
分をゆれ文字列のカタカナ文字列に置換する拡張表記統
一部とを具備することを特徴とした請求項1記載の文字
処理装置。 - (6)前記入力段階で入力された文字列を漢字かなまじ
りの文字列に変換するかな漢字変換段階と、前記かな漢
字変換段階で変換した漢字かなまじりの文字列を格納す
る変換文字列格納段階と、前記変換文字列格納段階で格
納した文字列の中からカタカナ文字列を抽出し、前記カ
タカナ文字列記憶部に記憶させるカタカナ文字列抽出段
階と、前記文字列比較段階で一致すると判定された部分
があったとき、ゆれ文字列と対応づけて記憶しているカ
タカナ文字列に統一するか、ゆれ文字列に統一するかを
オペレータに選択させる統一表記指示段階と、前記統一
表記指示段階でゆれ文字列と対応づけて記憶しているカ
タカナ文字列に統一すると決定したときは、入力文字列
の中でゆれ文字列と一致した部分をゆれ文字列と対応づ
けて記憶している文字列と置換し、ゆれ文字列に統一す
ると決定したときは 変換文字列格納段階で格納してい
る文字列の中でゆれ文字列と対応づけて記憶しているカ
タカナ文字列と一致する部分をゆれ文字列のカタカナ文
字列に置換する拡張表記統一段階とを具備することを特
徴とした請求項2記載の文字処理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2271128A JPH04149665A (ja) | 1990-10-09 | 1990-10-09 | 文字処理方法およびその装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2271128A JPH04149665A (ja) | 1990-10-09 | 1990-10-09 | 文字処理方法およびその装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH04149665A true JPH04149665A (ja) | 1992-05-22 |
Family
ID=17495717
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2271128A Pending JPH04149665A (ja) | 1990-10-09 | 1990-10-09 | 文字処理方法およびその装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH04149665A (ja) |
-
1990
- 1990-10-09 JP JP2271128A patent/JPH04149665A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH04149665A (ja) | 文字処理方法およびその装置 | |
| JPS62290967A (ja) | 表記のゆれ統一方式 | |
| JP2007219824A (ja) | 電子辞書及び電子辞書の制御方法 | |
| JP2792147B2 (ja) | 文字処理方法およびその装置 | |
| JP4922030B2 (ja) | 文字列検索装置、方法及びプログラム | |
| JP2000331023A (ja) | 情報検索装置及び情報検索処理プログラムを記憶した記憶媒体 | |
| JP2776069B2 (ja) | 文章検査装置 | |
| JP2815911B2 (ja) | 電子辞書 | |
| JP2002342312A (ja) | 文書を作成するプログラム、記憶媒体、文書作成装置及び文書作成システム | |
| JPH0237466A (ja) | 情報処理システム | |
| JPH04106663A (ja) | 文書分類装置 | |
| JPH01111271A (ja) | 業務処理方式 | |
| JPS62290965A (ja) | 表記のゆれ検出方式 | |
| JP2016207036A (ja) | 支援装置、支援方法及び支援プログラム | |
| JPS62290968A (ja) | 表記のゆれ統一方式 | |
| JPH08185401A (ja) | 文書検索装置 | |
| JP2000348055A (ja) | 情報検索方法及びその装置並びにコンピュータ可読記録媒体 | |
| JPH0338765A (ja) | 文字処理方法およびその装置 | |
| JPH06243164A (ja) | 機械翻訳における文字検索装置 | |
| JPH0335349A (ja) | 用例表示機能付き文書処理装置 | |
| JP2000259649A (ja) | 文書作成方法 | |
| JPH0444166A (ja) | 検索管理方式 | |
| JPH0341551A (ja) | 文字入力装置 | |
| JPH04148271A (ja) | 文字入力方法およびその装置 | |
| JPH04139568A (ja) | 文書処理装置 |