JPH0338765A - 文字処理方法およびその装置 - Google Patents
文字処理方法およびその装置Info
- Publication number
- JPH0338765A JPH0338765A JP1174459A JP17445989A JPH0338765A JP H0338765 A JPH0338765 A JP H0338765A JP 1174459 A JP1174459 A JP 1174459A JP 17445989 A JP17445989 A JP 17445989A JP H0338765 A JPH0338765 A JP H0338765A
- Authority
- JP
- Japan
- Prior art keywords
- katakana
- notation
- string
- compound word
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明1よ 文書処理を目的とした文字処理装置および
その方法に関するものである。
その方法に関するものである。
従来の技術
日本語文章の中では外来語を表わすためにカタカナが用
いられている。しかしながら、外来語のカタカナ表記方
法は一定でなく、一つの文章中で1つの外来語について
複数の表記が混在していることが多鶏 このような現象
(よ 文章の統一性を損な(\ 読み易さを阻害すると
言われている。これに対し カタカナ表記のゆれを自動
的に検出するカタカナ表記のゆれ検出装置が近゛年考案
されている。 (特開昭62−290965)第2図は
前記の従来のカタカナ表記のゆれ検出装置の構成国で
ある。
いられている。しかしながら、外来語のカタカナ表記方
法は一定でなく、一つの文章中で1つの外来語について
複数の表記が混在していることが多鶏 このような現象
(よ 文章の統一性を損な(\ 読み易さを阻害すると
言われている。これに対し カタカナ表記のゆれを自動
的に検出するカタカナ表記のゆれ検出装置が近゛年考案
されている。 (特開昭62−290965)第2図は
前記の従来のカタカナ表記のゆれ検出装置の構成国で
ある。
図1+、2114 文章記憶部であり、入力された文
章を記憶する。文章記憶部21としてi&Icメモリ、
磁気ディスク装置などが用いられている。
章を記憶する。文章記憶部21としてi&Icメモリ、
磁気ディスク装置などが用いられている。
22(戴 カタカナ列抽出部であり、文章記憶部21が
記憶している文章の中からカタカナ列を抽出する。23
(よ カタカナ列記憶部であり、カタカナ列抽出部22
によって抽出されたカタカナ列とともに 文章記憶部2
1に記憶された文章における位置の情報も記憶する。カ
タカナ列記憶部23として(友 文章記憶部21と同様
に ICメモリ、磁気ディスク装゛置などが用いられて
いる。 241よりり、カナ列変形部であり、カタカナ
列記憶部23に記憶されたカタカナ列に対してカタカナ
あるいは部分カタカナ列を削除または置換することによ
って変形を加゛える。 25は 変形結果一時記憶部で
あり、カタカナ列変形部24によって変形された結果を
、カタカナ列記憶部23に記憶されたカタカナ列と対応
づけて記憶する。26(よ 変形結果比較部であり、変
形結果一時記憶部25に記憶された変形結果の一致する
カタカナ列の一群を検出する。27(よ カタカナ列比
較部であり、変形結果の一致する変形前のカタカナ列の
一群についてカタカナ列記憶部23に記憶されたカタカ
ナ列を比較することによって、変形結果は一致するが変
形前のカタカナ列は異なるカタカナ列の一群を検出する
。284;L ゆれ部分表示部であり、カタカナ列比
較部27によって検出されたカタカナ列の一群を表示す
る。ゆれ部分表示部28として4iたとえ+;1l11
.cRTデイスプレィ、液晶デイスプレィなどを用いる
。表示の方法は 検出されたカタカナ列の部分を反転表
示したり、カラー表示したりする方法がある。これら以
外にも構成要素が存在する力交 本発明との対比のため
には必要がないので省略する。
記憶している文章の中からカタカナ列を抽出する。23
(よ カタカナ列記憶部であり、カタカナ列抽出部22
によって抽出されたカタカナ列とともに 文章記憶部2
1に記憶された文章における位置の情報も記憶する。カ
タカナ列記憶部23として(友 文章記憶部21と同様
に ICメモリ、磁気ディスク装゛置などが用いられて
いる。 241よりり、カナ列変形部であり、カタカナ
列記憶部23に記憶されたカタカナ列に対してカタカナ
あるいは部分カタカナ列を削除または置換することによ
って変形を加゛える。 25は 変形結果一時記憶部で
あり、カタカナ列変形部24によって変形された結果を
、カタカナ列記憶部23に記憶されたカタカナ列と対応
づけて記憶する。26(よ 変形結果比較部であり、変
形結果一時記憶部25に記憶された変形結果の一致する
カタカナ列の一群を検出する。27(よ カタカナ列比
較部であり、変形結果の一致する変形前のカタカナ列の
一群についてカタカナ列記憶部23に記憶されたカタカ
ナ列を比較することによって、変形結果は一致するが変
形前のカタカナ列は異なるカタカナ列の一群を検出する
。284;L ゆれ部分表示部であり、カタカナ列比
較部27によって検出されたカタカナ列の一群を表示す
る。ゆれ部分表示部28として4iたとえ+;1l11
.cRTデイスプレィ、液晶デイスプレィなどを用いる
。表示の方法は 検出されたカタカナ列の部分を反転表
示したり、カラー表示したりする方法がある。これら以
外にも構成要素が存在する力交 本発明との対比のため
には必要がないので省略する。
上記のように構成された従来のカタカナ表記のゆれ検出
装置において、まず、文章中からひと続きのカタカナ文
字列を抽出し 次に 「フエ」と「へ」などのように相
互にゆれの可能性がある部分を一方に変形した後、変形
結果を比較してゆれを検出している。たとえば 文章中
に「インタフェース」と「インクフェイス」が混在する
とき、「フェーヘ」、 「ヘイーヘー」、 r−一(削
除)」のようなカタカナ文字列の削除または置換を行っ
て、 「インタフェース」と「インタフェイス」を、次
のように変形する。 「インタフェース」→「インクヘ
ース」→「インクヘス」、「インクフェイス」→「イン
タヘイス」→「インタヘース」→「インタヘス」。この
結電 「インタフェース」と「インタフェイス」(ヨ
変形結果が一致し しかも変形前のカタカナ列は異な
るので表記がゆれていると判定する。
装置において、まず、文章中からひと続きのカタカナ文
字列を抽出し 次に 「フエ」と「へ」などのように相
互にゆれの可能性がある部分を一方に変形した後、変形
結果を比較してゆれを検出している。たとえば 文章中
に「インタフェース」と「インクフェイス」が混在する
とき、「フェーヘ」、 「ヘイーヘー」、 r−一(削
除)」のようなカタカナ文字列の削除または置換を行っ
て、 「インタフェース」と「インタフェイス」を、次
のように変形する。 「インタフェース」→「インクヘ
ース」→「インクヘス」、「インクフェイス」→「イン
タヘイス」→「インタヘース」→「インタヘス」。この
結電 「インタフェース」と「インタフェイス」(ヨ
変形結果が一致し しかも変形前のカタカナ列は異な
るので表記がゆれていると判定する。
発明が解決しようとする課題
従来のカタカナ表記めゆれ検出装置を用いてカタカナ表
記のゆれを検出する場合、カタカナ文学列を抽出する際
に 文章中でひと続きになっているカタカナ文字列を抽
出して、 1つのカタカナ語としていtも このたム
1つの文章中で「マンマシンインタフェース」のよう
な複合語と「インタフェイス」が存在して、複合語の中
に含まれている「インタフェース」の部分の表記がゆれ
ている場合には 表記のゆれとして検出することができ
なかっ氾 本発明(よ 従来のカタカナ表記のゆれ検出装置が有し
ていた前記の問題点に鑑ム 文章中のカタカナ文字列で
、複数のカタカナ語が連なって1つのカタカナ文字列を
形成している場合に 分割して1つずつのカタカナ語と
して処理することにより、複合語の中で使用されている
カタカナ語と単独で使われているカタカナ語・の表記の
ゆれを検出できる文字処理装置およびその方法を提供す
ることを目的とする。
記のゆれを検出する場合、カタカナ文学列を抽出する際
に 文章中でひと続きになっているカタカナ文字列を抽
出して、 1つのカタカナ語としていtも このたム
1つの文章中で「マンマシンインタフェース」のよう
な複合語と「インタフェイス」が存在して、複合語の中
に含まれている「インタフェース」の部分の表記がゆれ
ている場合には 表記のゆれとして検出することができ
なかっ氾 本発明(よ 従来のカタカナ表記のゆれ検出装置が有し
ていた前記の問題点に鑑ム 文章中のカタカナ文字列で
、複数のカタカナ語が連なって1つのカタカナ文字列を
形成している場合に 分割して1つずつのカタカナ語と
して処理することにより、複合語の中で使用されている
カタカナ語と単独で使われているカタカナ語・の表記の
ゆれを検出できる文字処理装置およびその方法を提供す
ることを目的とする。
課題を解決するための手段
(1)文章を記憶する文章記憶部と、前記文章記憶部に
記憶している文章の中からカタカナ文字列を抽出するカ
タカナ列抽出部と、カタカナ語の表記を少なくとも1つ
以上記憶しているカタカナ表記辞書と、カタカナ文字列
がカタカナ語の複合語であるか否かを前記カタカナ表記
辞書に記憶しているカタカナ語と比較することにより判
定するカタカナ複合語判定部と、前記カタカナ複合語判
定部でカタカナ複合語であると判定されたカタカナ文字
列を前記カタカナ表記辞書に記憶しているカタカナ語に
よって1単語ずつに分割するカタカナ複合語分割部と、
カタカナ文字列中の部分カタカナ列を書き換えるカタカ
ナ列変形部と、前記カタカナ列変形部で変形した変形結
果を元のカタカナ文字列と対応づけて一時記憶する変形
結果一時記憶部と、前記変形結果一時記憶部に一時記憶
している変形結果同志を比較して、一致するものを検出
するゆれ候補検出部と、前記ゆれ候補検出部で検出した
ゆれ候補の中で元のカタカナ表記が異なるものがあるか
否かを判定する表記のゆれ判定部とを備えた文字処理装
置である。
記憶している文章の中からカタカナ文字列を抽出するカ
タカナ列抽出部と、カタカナ語の表記を少なくとも1つ
以上記憶しているカタカナ表記辞書と、カタカナ文字列
がカタカナ語の複合語であるか否かを前記カタカナ表記
辞書に記憶しているカタカナ語と比較することにより判
定するカタカナ複合語判定部と、前記カタカナ複合語判
定部でカタカナ複合語であると判定されたカタカナ文字
列を前記カタカナ表記辞書に記憶しているカタカナ語に
よって1単語ずつに分割するカタカナ複合語分割部と、
カタカナ文字列中の部分カタカナ列を書き換えるカタカ
ナ列変形部と、前記カタカナ列変形部で変形した変形結
果を元のカタカナ文字列と対応づけて一時記憶する変形
結果一時記憶部と、前記変形結果一時記憶部に一時記憶
している変形結果同志を比較して、一致するものを検出
するゆれ候補検出部と、前記ゆれ候補検出部で検出した
ゆれ候補の中で元のカタカナ表記が異なるものがあるか
否かを判定する表記のゆれ判定部とを備えた文字処理装
置である。
(2)カタカナ語の表記を少なくとも1つ以上記憶して
いるカタカナ表記辞書を有し 文章の中からカタカナ文
字列を抽出するカタカナ列抽出段階と、カタカナ文字列
がカタカナ語の複合語であるか否かを前記カタカナ表記
辞書に記憶しているカタカナ語と比較することにより判
定するカタカナ複合語判定段階と、前記カタカナ複合語
判定段階でカタカナ複合語であると判定されたカタカナ
文字列を前記カタカナ表記辞書に記憶しているカタカナ
語によってl単語ずつに分割するカタカナ複合語分割段
階と、カタカナ文字列中の部分カタカナ列を書き換える
カタカナ列変形段階と、変形結果同志を比較して、一致
するものを検出するゆれ候補検出段階と、前記ゆれ候補
検出段階で検出したゆれ候補の中で元のカタカナ表記が
異なるものがあるか否かを判定する表記のゆれ判定段階
とを備えた文字処理方法である。
いるカタカナ表記辞書を有し 文章の中からカタカナ文
字列を抽出するカタカナ列抽出段階と、カタカナ文字列
がカタカナ語の複合語であるか否かを前記カタカナ表記
辞書に記憶しているカタカナ語と比較することにより判
定するカタカナ複合語判定段階と、前記カタカナ複合語
判定段階でカタカナ複合語であると判定されたカタカナ
文字列を前記カタカナ表記辞書に記憶しているカタカナ
語によってl単語ずつに分割するカタカナ複合語分割段
階と、カタカナ文字列中の部分カタカナ列を書き換える
カタカナ列変形段階と、変形結果同志を比較して、一致
するものを検出するゆれ候補検出段階と、前記ゆれ候補
検出段階で検出したゆれ候補の中で元のカタカナ表記が
異なるものがあるか否かを判定する表記のゆれ判定段階
とを備えた文字処理方法である。
作用
本発明は前記した構成より、1力タカナ列抽出部力交
文章中からカタカナ文字列を抽出し カタカナ複合語判
定部?! カタカナ文字列が複合語であるか否かを判
定する。カタカナ複合語分割部は複合語であると判定さ
れたカタカナ文字列をカタカナ表記辞書に記憶している
カタカナ語表記で1つずつのカタカナ語に分割する。次
に カタカナ列変形部?L カタカナ文字列の部分文
字列を置換または削除して変形を加える。さらに ゆれ
候補検出部(よ 変形結果を比較して同じものをグルー
プにして検出し 表記のゆれ判定部(よ 各グルー9− プの元の表記を比較して表記がゆれているものを検出す
る。
文章中からカタカナ文字列を抽出し カタカナ複合語判
定部?! カタカナ文字列が複合語であるか否かを判
定する。カタカナ複合語分割部は複合語であると判定さ
れたカタカナ文字列をカタカナ表記辞書に記憶している
カタカナ語表記で1つずつのカタカナ語に分割する。次
に カタカナ列変形部?L カタカナ文字列の部分文
字列を置換または削除して変形を加える。さらに ゆれ
候補検出部(よ 変形結果を比較して同じものをグルー
プにして検出し 表記のゆれ判定部(よ 各グルー9− プの元の表記を比較して表記がゆれているものを検出す
る。
実施例
以下、本発明の実施例を図面を用いて説明する。
第1図(よ 本発明における一実施例の文字処理装置の
構成図である。
構成図である。
第1図において11は 文章記憶部であり、入力された
文章を記憶する。 12(よ カタカナ列抽出部であり
、文章記憶部11が記憶している文章の中からカタカナ
文字列を1つずつ順に抽出する。
文章を記憶する。 12(よ カタカナ列抽出部であり
、文章記憶部11が記憶している文章の中からカタカナ
文字列を1つずつ順に抽出する。
13は カタカナ表記辞書であり、複合語でないカタカ
ナ語で表記にゆれが生じないもののみを記憶する。 1
4(よ カタカナ複合語判定部であり、カタカナ列抽出
部12で抽出したカタカナ文字列とカタカナ表記辞書1
3で記憶しているカタカナ語表記を照合して抽出したカ
タカナ文゛字列が複合語であるか否かを判定する。 1
5 i:L カタカナ複合語分割部であり、カタカナ
複合語判定部14が複合語であると判定したカタカナ列
をカタカナ表記辞書13で記憶しているカタカナ語表記
と照合1〇− してl単語ずつカタカナ語に分割す4161;Lカタカ
ナ列変形部であり、抽出あるいは分割されたカタカナ語
の部分カタカナ列を書き換える。 17は 変形結果一
時記憶部であり、カタカナ列変形部16で書き換えたカ
タカナ列を元のカタカナ文字列と対応づけて、カタカナ
列抽出部12で抽出された順に全て一時記憶する。 1
8【よ ゆれ候補検出部であり、カタカナ列抽出部12
からカタカナ文字列の抽出終了の指示が与えられると、
変形結果一時記憶部17に一時記憶している変形結果を
比較して、一致するものをグループにして検出する。
19は 表記のゆれ判定部であり、ゆれ候補検出部18
で検出されたゆれ候補の各グループの中で元の表記が異
なるものがあるか否かを判定する。20(よ ゆれ部分
表示部であり、表記のゆれ判定部19で表記の異なるも
のがあると判定されたグループのカタカナ文字列を表示
する。ゆれ部分表示部20としてl友 cRTデイスプ
レィ、液晶デイスプレィなどがある。表記方法として(
よゆれのグループの一覧表示する方法負 文章中に1 おいてゆれの部分を反転表示 下線表示して他の部分と
異なる表示をする方法などがある。
ナ語で表記にゆれが生じないもののみを記憶する。 1
4(よ カタカナ複合語判定部であり、カタカナ列抽出
部12で抽出したカタカナ文字列とカタカナ表記辞書1
3で記憶しているカタカナ語表記を照合して抽出したカ
タカナ文゛字列が複合語であるか否かを判定する。 1
5 i:L カタカナ複合語分割部であり、カタカナ
複合語判定部14が複合語であると判定したカタカナ列
をカタカナ表記辞書13で記憶しているカタカナ語表記
と照合1〇− してl単語ずつカタカナ語に分割す4161;Lカタカ
ナ列変形部であり、抽出あるいは分割されたカタカナ語
の部分カタカナ列を書き換える。 17は 変形結果一
時記憶部であり、カタカナ列変形部16で書き換えたカ
タカナ列を元のカタカナ文字列と対応づけて、カタカナ
列抽出部12で抽出された順に全て一時記憶する。 1
8【よ ゆれ候補検出部であり、カタカナ列抽出部12
からカタカナ文字列の抽出終了の指示が与えられると、
変形結果一時記憶部17に一時記憶している変形結果を
比較して、一致するものをグループにして検出する。
19は 表記のゆれ判定部であり、ゆれ候補検出部18
で検出されたゆれ候補の各グループの中で元の表記が異
なるものがあるか否かを判定する。20(よ ゆれ部分
表示部であり、表記のゆれ判定部19で表記の異なるも
のがあると判定されたグループのカタカナ文字列を表示
する。ゆれ部分表示部20としてl友 cRTデイスプ
レィ、液晶デイスプレィなどがある。表記方法として(
よゆれのグループの一覧表示する方法負 文章中に1 おいてゆれの部分を反転表示 下線表示して他の部分と
異なる表示をする方法などがある。
第3図(よ 本発明の一実施例の文字処理方法を説明す
るフロー図である。
るフロー図である。
31&1 カタカナ列抽出段階であり、文章記憶部1
1で記憶している文章中からカタカナ文字列を抽出する
。32(よ カタカナ複合語判定段階であり、 31で
抽出したカタカナ文字列が複合語であるか否かを判定す
る。複合語であれば33の段階に進へ 複合語でなけれ
ば34の段階に進払33 Cl カタカナ複合語分割
段階であり、複合語をカタカナ表記辞書13に記憶して
いるカタカナ語表記によって1つずつの単語に分割する
。 34(よ カタカナ列変形段階であり、 32で複
合語でないと判定されたカタカナ表記1 または33
で分割されたカタカナ列の部分カタカナ列を一定の規則
にしたがって書き換える。書き換えた変形結果は変形結
果一時記憶部17に一時記憶される。 35(上 文章
中からカタカナ文字列をすべて抽出したか否かを判定し
まだカタカナ文字列が残ってい2− れば31の段階に戻る。カタカナ列をすべて抽出したら
36の段階に進払 36は ゆれ候補検出段階であり、
変形結果一時記憶部17に一時記憶している変形結果同
士を比較して同じものをグループにして検出す&37i
上 ゆれ判定段階であり、 36で検出したカタカナ列
の各グループの元の表記を比較して表記の異なるものが
あれば 表記がゆれていると判定する。
1で記憶している文章中からカタカナ文字列を抽出する
。32(よ カタカナ複合語判定段階であり、 31で
抽出したカタカナ文字列が複合語であるか否かを判定す
る。複合語であれば33の段階に進へ 複合語でなけれ
ば34の段階に進払33 Cl カタカナ複合語分割
段階であり、複合語をカタカナ表記辞書13に記憶して
いるカタカナ語表記によって1つずつの単語に分割する
。 34(よ カタカナ列変形段階であり、 32で複
合語でないと判定されたカタカナ表記1 または33
で分割されたカタカナ列の部分カタカナ列を一定の規則
にしたがって書き換える。書き換えた変形結果は変形結
果一時記憶部17に一時記憶される。 35(上 文章
中からカタカナ文字列をすべて抽出したか否かを判定し
まだカタカナ文字列が残ってい2− れば31の段階に戻る。カタカナ列をすべて抽出したら
36の段階に進払 36は ゆれ候補検出段階であり、
変形結果一時記憶部17に一時記憶している変形結果同
士を比較して同じものをグループにして検出す&37i
上 ゆれ判定段階であり、 36で検出したカタカナ列
の各グループの元の表記を比較して表記の異なるものが
あれば 表記がゆれていると判定する。
以上のように構成された本実施例の文字処理装置および
その方法について以下その動作を例を用いて具体的に説
明する。
その方法について以下その動作を例を用いて具体的に説
明する。
第4図(よ 文章記憶部11に記憶されている文章例で
ある。この文章中で(ヨ「ワインメーカ」と「メーカー
」の表記がゆれている。
ある。この文章中で(ヨ「ワインメーカ」と「メーカー
」の表記がゆれている。
第5図1よ カタカナ表記辞書12が記憶しているカタ
カナ表記の例である。
カナ表記の例である。
第6図は カタカナ列変形部16で変形を行う際に用い
る変形規則の例である。
る変形規則の例である。
まず、カタカナ列抽出部12(上 文章記憶部11に記
憶している文章の中から、カタカナ文字列13− を順に抽出する。最初に「ワインメーカ」が抽出される
。そこで、カタカナ複合語判定部14(友カタカナ列抽
出部12で抽出されたカタカナ文字列中にカタカナ表記
辞書13に記憶しているカタカナ語表記が含まれるか否
かを判定する。含まれている場合、カタカナ複合語分割
部15(よ カタカナ表記辞書に記憶しているカタカナ
語表記によってカタカナ抽出部12で抽出されたカタカ
ナ文字列を分割する。 「ワインメーカ」の場合、カタ
カナ表記辞書に記憶している「ワイン」が含まれている
ので「ワイン」と残り部分の「メーカ」の2つに分割す
る。カタカナ抽出部12で抽出されたカタカナ文字列が
カタカナ表記辞書に記憶しているカタカナ語のいずれか
と一致するとき、またはどの部分文字列もカタカナ表記
辞書に記憶しているカタカナ語と一致しないときは 抽
出したカタカナ文字列は複合語でないと判定する。
憶している文章の中から、カタカナ文字列13− を順に抽出する。最初に「ワインメーカ」が抽出される
。そこで、カタカナ複合語判定部14(友カタカナ列抽
出部12で抽出されたカタカナ文字列中にカタカナ表記
辞書13に記憶しているカタカナ語表記が含まれるか否
かを判定する。含まれている場合、カタカナ複合語分割
部15(よ カタカナ表記辞書に記憶しているカタカナ
語表記によってカタカナ抽出部12で抽出されたカタカ
ナ文字列を分割する。 「ワインメーカ」の場合、カタ
カナ表記辞書に記憶している「ワイン」が含まれている
ので「ワイン」と残り部分の「メーカ」の2つに分割す
る。カタカナ抽出部12で抽出されたカタカナ文字列が
カタカナ表記辞書に記憶しているカタカナ語のいずれか
と一致するとき、またはどの部分文字列もカタカナ表記
辞書に記憶しているカタカナ語と一致しないときは 抽
出したカタカナ文字列は複合語でないと判定する。
次に カタカナ列変形部16(よ 第6図に示す変形規
則にしたがって、複合語でないと判定されたカタカナ語
またはカタカナ複合語分割部におい4− て分割されたカタカナ語のうちの特定の部分カタカナ列
に対して削除または置換を行う。
則にしたがって、複合語でないと判定されたカタカナ語
またはカタカナ複合語分割部におい4− て分割されたカタカナ語のうちの特定の部分カタカナ列
に対して削除または置換を行う。
この例に従って変形を行うと、 「ワイン」→「ワイ」
、 「メーカ」→「メカ」となる。 さら?Q変変形
結果随時記憶部1’Ni 変形結果「ワイ」に対しては
文章中の先頭位置を示す「4」とカタカナ文字列の長さ
を示す「3」を対応付けて記憶し「メカ」に対しては「
7」と「3」を対応付けて記憶する。 「ワインメーカ
」に対しての変形処理が終了すると、カタカナ列抽出部
12i、t、 文章記憶部11に記憶している文章の
中から次のカタカナ文字列を抽出し カタカナ列変形部
16で同様の変形を加える。 2番目に抽出される「メ
ーカー」(ヨ「メカ」に変形する。以下、文章記憶部1
1に記憶している文章のすべての文字列に対して同様の
処理を行うと、変形結果一時記憶部17に記憶される結
果は次のようになる。 []内の数字はカタカナ文字列
の連番であり、 0内の数字はそのカタカナ文字列の位
置情報であり、文章の先頭から数えた文字数とカタカナ
文字列の長さであ5− [1コワイ (4,3)[2]メカ
(7,3) [3]メカ (’15.4)[4]ワイ
(26,3)これらに対してゆれ候補検
出部18は 変形結果が一致するものを検出する。この
場合+1[1]と[4]、 「2」と「3」が検出され
る。さらに表記のゆれ判定部191t、、 位置情報
からそれぞれ元の表記を比較する。 「2」と「3」の
それぞれの元の表記が異なるのでこれらは表記がゆれて
いると判定する。ゆれ部分表示部20で「2」と「3」
に相当するカタカナ文字列を表記がゆれているとして表
示する。
、 「メーカ」→「メカ」となる。 さら?Q変変形
結果随時記憶部1’Ni 変形結果「ワイ」に対しては
文章中の先頭位置を示す「4」とカタカナ文字列の長さ
を示す「3」を対応付けて記憶し「メカ」に対しては「
7」と「3」を対応付けて記憶する。 「ワインメーカ
」に対しての変形処理が終了すると、カタカナ列抽出部
12i、t、 文章記憶部11に記憶している文章の
中から次のカタカナ文字列を抽出し カタカナ列変形部
16で同様の変形を加える。 2番目に抽出される「メ
ーカー」(ヨ「メカ」に変形する。以下、文章記憶部1
1に記憶している文章のすべての文字列に対して同様の
処理を行うと、変形結果一時記憶部17に記憶される結
果は次のようになる。 []内の数字はカタカナ文字列
の連番であり、 0内の数字はそのカタカナ文字列の位
置情報であり、文章の先頭から数えた文字数とカタカナ
文字列の長さであ5− [1コワイ (4,3)[2]メカ
(7,3) [3]メカ (’15.4)[4]ワイ
(26,3)これらに対してゆれ候補検
出部18は 変形結果が一致するものを検出する。この
場合+1[1]と[4]、 「2」と「3」が検出され
る。さらに表記のゆれ判定部191t、、 位置情報
からそれぞれ元の表記を比較する。 「2」と「3」の
それぞれの元の表記が異なるのでこれらは表記がゆれて
いると判定する。ゆれ部分表示部20で「2」と「3」
に相当するカタカナ文字列を表記がゆれているとして表
示する。
以上のように 本実施例によれば カタカナ表記辞書と
カタカナ複合語判定部とカタカナ複合語分割部を投法
2つのカタカナ語が連なって1つのカタカナ文字列を形
成している「ワインメーカ」を「ワイン」と「メーカ」
に分割して1つずつのカタカナ語として処理することに
より、複合語「6− ワインメーカ」の中に含まれている「メーカ」と単独で
用いられている「メーカーjのような表記のゆれを検出
することができる。また カタカナ表記辞書に記憶する
カタカナ語を複合語でないカタカナ語で表記にゆれがな
いものと限定することによって、辞書サイズを小さくす
ることができる。
カタカナ複合語判定部とカタカナ複合語分割部を投法
2つのカタカナ語が連なって1つのカタカナ文字列を形
成している「ワインメーカ」を「ワイン」と「メーカ」
に分割して1つずつのカタカナ語として処理することに
より、複合語「6− ワインメーカ」の中に含まれている「メーカ」と単独で
用いられている「メーカーjのような表記のゆれを検出
することができる。また カタカナ表記辞書に記憶する
カタカナ語を複合語でないカタカナ語で表記にゆれがな
いものと限定することによって、辞書サイズを小さくす
ることができる。
すなわち、全てのカタカナ語を記憶する場合、さらに
表記にゆれが生じるものについては生じうる全ての表記
も記憶する場合ζよ 記憶すべきカタカナ語の表記の量
が膨大になることは明らかである。
表記にゆれが生じるものについては生じうる全ての表記
も記憶する場合ζよ 記憶すべきカタカナ語の表記の量
が膨大になることは明らかである。
な抵 本実施例で番上 カタカナ表記辞書に記憶するカ
タカナ文字列を表記にゆれが生じないもののみとした力
交 全てのカタカナ語を記憶し 表記にゆれが生じるも
のについて(よ 生じつる全ての表記も記憶するとして
もよい。ざら&へ カタカナ表記辞書の見出しと見出し
に対してカタカナ列変形部で行われる処理を施した変形
結果を対にして記憶し カタカナ列変形部で行う変形を
省略するとしてもよ(1 7− 発明の効果 本発明においてit 複数のカタカナ語が連なって1
つのカタカナ文字列を形成している場合にカタカナ表記
辞書が記憶しているカタカナ語で分割して1つずつのカ
タカナ語として処理することにより、複合語の中に含ま
れるカタカナ表記のゆれを検出することができ、その実
用的効果は犬き鶏
タカナ文字列を表記にゆれが生じないもののみとした力
交 全てのカタカナ語を記憶し 表記にゆれが生じるも
のについて(よ 生じつる全ての表記も記憶するとして
もよい。ざら&へ カタカナ表記辞書の見出しと見出し
に対してカタカナ列変形部で行われる処理を施した変形
結果を対にして記憶し カタカナ列変形部で行う変形を
省略するとしてもよ(1 7− 発明の効果 本発明においてit 複数のカタカナ語が連なって1
つのカタカナ文字列を形成している場合にカタカナ表記
辞書が記憶しているカタカナ語で分割して1つずつのカ
タカナ語として処理することにより、複合語の中に含ま
れるカタカナ表記のゆれを検出することができ、その実
用的効果は犬き鶏
第1図は本発明の一実施例の文字処理装置の構成阻 第
2図は従来の文字処理装置の構成@ 第3図は本発明の
一実施例の文字処理方法のフロー飄 第4図は文章記憶
部に記憶している文章例の説明は 第5図はカタカナ表
記辞書が記憶しているカタカナ表記例の説明@ 第6図
はカタカナ列変形部で変形を行う際に用いる変形規則の
例の説明図である。 11・・・文章記憶部 12・・・カタカナ列抽出敵1
3・・・カタカナ表記辞書、 14・・・カタカナ複合
語判定R,15・・・カタカナ複合語分割敵 16・8
− ・・カタカナ列変形訊 17・・・変形結果一時記憶敵
18・・・ゆれ候補検出紙 19・・・表記のゆれ判定
敞 20・・・ゆれ部分表示糺
2図は従来の文字処理装置の構成@ 第3図は本発明の
一実施例の文字処理方法のフロー飄 第4図は文章記憶
部に記憶している文章例の説明は 第5図はカタカナ表
記辞書が記憶しているカタカナ表記例の説明@ 第6図
はカタカナ列変形部で変形を行う際に用いる変形規則の
例の説明図である。 11・・・文章記憶部 12・・・カタカナ列抽出敵1
3・・・カタカナ表記辞書、 14・・・カタカナ複合
語判定R,15・・・カタカナ複合語分割敵 16・8
− ・・カタカナ列変形訊 17・・・変形結果一時記憶敵
18・・・ゆれ候補検出紙 19・・・表記のゆれ判定
敞 20・・・ゆれ部分表示糺
Claims (2)
- (1)文章を記憶する文章記憶部と、前記文章記憶部に
記憶している文章の中からカタカナ文字列を抽出するカ
タカナ列抽出部と、カタカナ語の表記を少なくとも1つ
以上記憶しているカタカナ表記辞書と、カタカナ文字列
がカタカナ語の複合語であるか否かを前記カタカナ表記
辞書に記憶しているカタカナ語と比較することにより判
定するカタカナ複合語判定部と、前記カタカナ複合語判
定部でカタカナ複合語であると判定されたカタカナ文字
列を前記カタカナ表記辞書に記憶しているカタカナ語に
よって1単語ずつに分割するカタカナ複合語分割部と、
カタカナ文字列中の部分カタカナ列を書き換えるカタカ
ナ列変形部と、前記カタカナ列変形部で変形した変形結
果を元のカタカナ文字列と対応づけて一時記憶する変形
結果一時記憶部と、前記変形結果一時記憶部に一時記憶
している変形結果同志を比較して、一致するものを検出
するゆれ候補検出部と、前記ゆれ候補検出部で検出した
ゆれ候補の中で元のカタカナ表記が異なるものがあるか
否かを判定する表記のゆれ判定部とを具備することを特
徴とした文字処理装置。 - (2)カタカナ語の表記を少なくとも1つ以上記憶して
いるカタカナ表記辞書を有し、文章の中からカタカナ文
字列を抽出するカタカナ列抽出段階と、カタカナ文字列
がカタカナ語の複合語であるか否かを前記カタカナ表記
辞書に記憶しているカタカナ語と比較することにより判
定するカタカナ複合語判定段階と、前記カタカナ複合語
判定段階でカタカナ複合語であると判定されたカタカナ
文字列を前記カタカナ表記辞書に記憶しているカタカナ
語によって1単語ずつに分割するカタカナ複合語分割段
階と、カタカナ文字列中の部分カタカナ列を書き換える
カタカナ列変形段階と、変形結果同志を比較して、一致
するものを検出するゆれ候補検出段階と、前記ゆれ候補
検出段階で検出したゆれ候補の中で元のカタカナ表記が
異なるものがあるか否かを判定する表記のゆれ判定段階
とを具備することを特徴とした文字処理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1174459A JPH0338765A (ja) | 1989-07-05 | 1989-07-05 | 文字処理方法およびその装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1174459A JPH0338765A (ja) | 1989-07-05 | 1989-07-05 | 文字処理方法およびその装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0338765A true JPH0338765A (ja) | 1991-02-19 |
Family
ID=15978860
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1174459A Pending JPH0338765A (ja) | 1989-07-05 | 1989-07-05 | 文字処理方法およびその装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0338765A (ja) |
-
1989
- 1989-07-05 JP JP1174459A patent/JPH0338765A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0338765A (ja) | 文字処理方法およびその装置 | |
| JP2792147B2 (ja) | 文字処理方法およびその装置 | |
| JPH0896081A (ja) | 文字認識装置及び文字認識方法 | |
| JP2000331023A (ja) | 情報検索装置及び情報検索処理プログラムを記憶した記憶媒体 | |
| JPS5842904B2 (ja) | 手書きカナ・漢字の文字認識装置 | |
| JPH0117192B2 (ja) | ||
| JPH02255937A (ja) | 文字処理装置 | |
| JPH0267684A (ja) | 校正支援方法 | |
| JPS61133487A (ja) | 文字認識装置 | |
| JPS61151738A (ja) | キ−ワ−ド抽出装置 | |
| JPH0721182A (ja) | 文字処理装置およびその方法 | |
| JP2839515B2 (ja) | 文字読取システム | |
| JPH05324610A (ja) | 住所表記漢字入力装置 | |
| JPS62290965A (ja) | 表記のゆれ検出方式 | |
| JPS6059487A (ja) | 手書文字認識装置 | |
| JPS62160534A (ja) | 文字列照合方式 | |
| JPH04149665A (ja) | 文字処理方法およびその装置 | |
| JPH01279324A (ja) | 英単語検索装置 | |
| JPS63115263A (ja) | 日本語文章校正装置 | |
| JPH07249034A (ja) | 文字列抽出処理装置 | |
| JPS6121581A (ja) | 文字認識装置 | |
| JPH03229359A (ja) | 日本語文章校正装置 | |
| JPH01307863A (ja) | 対記号検査装置 | |
| JPH03184162A (ja) | 日本語文書校正支援装置 | |
| JPH0330048A (ja) | 文字入力装置 |