JPH0721182A - 文字処理装置およびその方法 - Google Patents
文字処理装置およびその方法Info
- Publication number
- JPH0721182A JPH0721182A JP5164349A JP16434993A JPH0721182A JP H0721182 A JPH0721182 A JP H0721182A JP 5164349 A JP5164349 A JP 5164349A JP 16434993 A JP16434993 A JP 16434993A JP H0721182 A JPH0721182 A JP H0721182A
- Authority
- JP
- Japan
- Prior art keywords
- katakana character
- character string
- katakana
- character strings
- detecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】 文字列長の長いカタカナ文字列を比較する場
合でも短い時間で比較できる文字処理装置およびその方
法を提供することである。 【構成】 文章データ中から抽出された各カタカナ文字
列は、予備分類されていくつかのグループに予備分類さ
れる。各グループ内において、2つずつカタカナ文字列
が選択されていく。選択された2つのカタカナ文字列が
両方とも所定数以上の文字を含む場合(ステップS10
1)、2つのカタカナ文字列から共通部分が削除されて
(ステップS104)、非共通部分についてのみ変形処
理が行われる(ステップS104)。その後、変形結果
が相互に比較され、一致する変形記号列が有るか否かが
判断される(ステップS105)。一致する変形記号列
が有る場合、元のカタカナ文字列が相互に比較され(ス
テップS107)、異なる場合に表記のゆれが生じてい
ると判断される(ステップS108)。
合でも短い時間で比較できる文字処理装置およびその方
法を提供することである。 【構成】 文章データ中から抽出された各カタカナ文字
列は、予備分類されていくつかのグループに予備分類さ
れる。各グループ内において、2つずつカタカナ文字列
が選択されていく。選択された2つのカタカナ文字列が
両方とも所定数以上の文字を含む場合(ステップS10
1)、2つのカタカナ文字列から共通部分が削除されて
(ステップS104)、非共通部分についてのみ変形処
理が行われる(ステップS104)。その後、変形結果
が相互に比較され、一致する変形記号列が有るか否かが
判断される(ステップS105)。一致する変形記号列
が有る場合、元のカタカナ文字列が相互に比較され(ス
テップS107)、異なる場合に表記のゆれが生じてい
ると判断される(ステップS108)。
Description
【0001】
【産業上の利用分野】本発明は、文字処理装置およびそ
の方法に関し、より特定的には、文章中に含まれるカタ
カナ文字列について表記のゆれが生じているか否かを検
出する文字処理装置およびその方法に関する。
の方法に関し、より特定的には、文章中に含まれるカタ
カナ文字列について表記のゆれが生じているか否かを検
出する文字処理装置およびその方法に関する。
【0002】
【従来の技術】日本語文章の中では外来語を表すために
カタカナが用いられている。しかしながら、原音が日本
語の「かな」と1対1に対応していないため外来語のカ
タカナ表記は一定でなく、「バイオリン」と「ヴァイオ
リン」など1つの文章中に複数の表記が混在しているこ
とが多い。このような現象は、文章の統一性を損ない、
読みやすさを阻害するといわれている。これに対し、文
章中に含まれているカタカナ表記がゆれているか否かを
検出する文字処理装置が近年提案されている(特開昭6
2−290965号公報、特開平2−255937号公
報)。
カタカナが用いられている。しかしながら、原音が日本
語の「かな」と1対1に対応していないため外来語のカ
タカナ表記は一定でなく、「バイオリン」と「ヴァイオ
リン」など1つの文章中に複数の表記が混在しているこ
とが多い。このような現象は、文章の統一性を損ない、
読みやすさを阻害するといわれている。これに対し、文
章中に含まれているカタカナ表記がゆれているか否かを
検出する文字処理装置が近年提案されている(特開昭6
2−290965号公報、特開平2−255937号公
報)。
【0003】図10は、従来の文字処理装置の構成を示
す図である。図10において、従来の文字処理装置は、
文章記憶部41と、カタカナ文字列抽出部42と、カタ
カナ文字列一時記憶部43と、カタカナ文字列変形部4
4と、変形結果一時記憶部45と、変形結果比較部46
と、ゆれ判定部49とを備えている。文章記憶部41
は、入力された文章データを記憶する。文章記憶部41
としては、ICメモリ、磁気ディスク装置などが用いら
れている。カタカナ文字列抽出部42は、文章記憶部4
1が記憶している文章データの中からカタカナ文字列を
抽出する。なお、1つのカタカナ文字列は1つの外来語
に対応している。カタカナ文字列一時記憶部43は、カ
タカナ文字列抽出部42が抽出した各カタカナ文字列を
文章中の位置情報とともに一時記憶する。カタカナ文字
列変形部44は、カタカナ文字列一時記憶部で一時記憶
している各カタカナ文字列に変形を加える。このとき、
特開平2−255937号公報に開示された文字処理装
置では、1つのカタカナ文字列を複数の部分に分解し、
各部分を予め定められた規則に従って削除しまたはカタ
カナでない記号に置き換える。変形結果一時記憶部45
は、カタカナ文字列変形部44によって変形された結果
をカタカナ文字列抽出部42で抽出されたカタカナ文字
列と対応づけて一時記憶する。変形結果比較部46は、
変形結果一時記憶部45に記憶された変形結果が一致す
るカタカナ文字列の一群を検出する。ゆれ判定部49
は、変形結果が一致するカタカナ文字列の一群について
変形前の元のカタカナ文字列を相互に比較し、変形結果
は一致するが変形前のカタカナ文字列は異なるカタカナ
文字列の一群を発見したとき、表記のゆれが生じている
と判定する。
す図である。図10において、従来の文字処理装置は、
文章記憶部41と、カタカナ文字列抽出部42と、カタ
カナ文字列一時記憶部43と、カタカナ文字列変形部4
4と、変形結果一時記憶部45と、変形結果比較部46
と、ゆれ判定部49とを備えている。文章記憶部41
は、入力された文章データを記憶する。文章記憶部41
としては、ICメモリ、磁気ディスク装置などが用いら
れている。カタカナ文字列抽出部42は、文章記憶部4
1が記憶している文章データの中からカタカナ文字列を
抽出する。なお、1つのカタカナ文字列は1つの外来語
に対応している。カタカナ文字列一時記憶部43は、カ
タカナ文字列抽出部42が抽出した各カタカナ文字列を
文章中の位置情報とともに一時記憶する。カタカナ文字
列変形部44は、カタカナ文字列一時記憶部で一時記憶
している各カタカナ文字列に変形を加える。このとき、
特開平2−255937号公報に開示された文字処理装
置では、1つのカタカナ文字列を複数の部分に分解し、
各部分を予め定められた規則に従って削除しまたはカタ
カナでない記号に置き換える。変形結果一時記憶部45
は、カタカナ文字列変形部44によって変形された結果
をカタカナ文字列抽出部42で抽出されたカタカナ文字
列と対応づけて一時記憶する。変形結果比較部46は、
変形結果一時記憶部45に記憶された変形結果が一致す
るカタカナ文字列の一群を検出する。ゆれ判定部49
は、変形結果が一致するカタカナ文字列の一群について
変形前の元のカタカナ文字列を相互に比較し、変形結果
は一致するが変形前のカタカナ文字列は異なるカタカナ
文字列の一群を発見したとき、表記のゆれが生じている
と判定する。
【0004】
【発明が解決しようとする課題】上記のように構成され
た従来の文字処理装置では、カタカナ文字列を変形する
際、1つのカタカナ文字列をどのように分解するかに応
じて1つのカタカナ文字列から複数の変形結果が得られ
る。特に、文字長の長いカタカナ文字列の場合は、分解
の組み合わせ方が多くなるため、変形結果の数が増え
る。その結果、変形結果を比較する回数が増えて比較時
間が大量に必要となるという問題点を有していた。
た従来の文字処理装置では、カタカナ文字列を変形する
際、1つのカタカナ文字列をどのように分解するかに応
じて1つのカタカナ文字列から複数の変形結果が得られ
る。特に、文字長の長いカタカナ文字列の場合は、分解
の組み合わせ方が多くなるため、変形結果の数が増え
る。その結果、変形結果を比較する回数が増えて比較時
間が大量に必要となるという問題点を有していた。
【0005】それゆえに本発明の目的は、文字長の長い
カタカナ文字列を比較する場合でも短時間で比較が完了
する文字処理装置およびその方法を提供することであ
る。
カタカナ文字列を比較する場合でも短時間で比較が完了
する文字処理装置およびその方法を提供することであ
る。
【0006】
【課題を解決するための手段】請求項1に係る発明は、
文章中に含まれるカタカナ文字列について表記のゆれが
生じているか否かを検出する文字処理装置であって、文
章中から抽出された各カタカナ文字列を一時記憶するカ
タカナ文字列一時記憶手段、カタカナ文字列一時記憶手
段で一時記憶している各カタカナ文字列の中から複数の
カタカナ文字列を選択する選択手段、選択手段で選択さ
れた各カタカナ文字列について、互いの共通部分を検出
する共通部分検出手段、選択手段で選択された各カタカ
ナ文字列について、共通部分検出手段で検出された共通
部分以外の非共通部分を所定の規則に従って変形するカ
タカナ文字列変形手段、カタカナ文字列変形手段で変形
した結果を相互に比較し、変形部分が一致するカタカナ
文字列を検出する変形結果比較手段、および変形結果比
較部で検出した変形結果が一致するカタカナ文字列の中
で変形前のカタカナ表記が異なるものを表記がゆれてい
ると判定する表記のゆれ判定手段を備えている。
文章中に含まれるカタカナ文字列について表記のゆれが
生じているか否かを検出する文字処理装置であって、文
章中から抽出された各カタカナ文字列を一時記憶するカ
タカナ文字列一時記憶手段、カタカナ文字列一時記憶手
段で一時記憶している各カタカナ文字列の中から複数の
カタカナ文字列を選択する選択手段、選択手段で選択さ
れた各カタカナ文字列について、互いの共通部分を検出
する共通部分検出手段、選択手段で選択された各カタカ
ナ文字列について、共通部分検出手段で検出された共通
部分以外の非共通部分を所定の規則に従って変形するカ
タカナ文字列変形手段、カタカナ文字列変形手段で変形
した結果を相互に比較し、変形部分が一致するカタカナ
文字列を検出する変形結果比較手段、および変形結果比
較部で検出した変形結果が一致するカタカナ文字列の中
で変形前のカタカナ表記が異なるものを表記がゆれてい
ると判定する表記のゆれ判定手段を備えている。
【0007】請求項2に係る発明は、請求項1の発明に
おいて、カタカナ文字列一時記憶部で一時記憶している
各カタカナ文字列を、類似しているもの同士いくつかの
グループに分類する予備分類手段をさらに備え、選択手
段は、予備分類手段で分類された各グループ毎に複数の
カタカナ文字列を選択することを特徴とする。
おいて、カタカナ文字列一時記憶部で一時記憶している
各カタカナ文字列を、類似しているもの同士いくつかの
グループに分類する予備分類手段をさらに備え、選択手
段は、予備分類手段で分類された各グループ毎に複数の
カタカナ文字列を選択することを特徴とする。
【0008】請求項3に係る発明は、請求項1の発明に
おいて、選択手段で選択された各カタカナ文字列がいず
れも所定数以上の文字を含むか否かを検出する文字列長
検出手段をさらに備え、共通部分検出手段は、選択手段
で選択された各カタカナ文字列がいずれも所定数以上の
文字を含むことを文字列長検出手段が検出した場合にの
み各カタカナ文字列の共通部分を検出することを特徴と
する。
おいて、選択手段で選択された各カタカナ文字列がいず
れも所定数以上の文字を含むか否かを検出する文字列長
検出手段をさらに備え、共通部分検出手段は、選択手段
で選択された各カタカナ文字列がいずれも所定数以上の
文字を含むことを文字列長検出手段が検出した場合にの
み各カタカナ文字列の共通部分を検出することを特徴と
する。
【0009】請求項4に係る発明は、文章中に含まれる
複数のカタカナ文字列について表記のゆれが生じている
か否かを検出する文字処理方法であって、文章中から抽
出された各カタカナ文字列を一時記憶する第1のステッ
プ、第1のステップで一時記憶している各カタカナ文字
列の中から複数のカタカナ文字列を選択する第2のステ
ップ、第2のステップで選択された各カタカナ文字列に
ついて、互いの共通部分を検出する第3のステップ、第
2のステップで選択された各カタカナ文字列について、
第3のステップで検出された共通部分以外の非共通部分
を所定の規則に従って変形する第4のステップ、第4の
ステップで変形した結果を相互に比較し、変形部分が一
致するカタカナ文字列を検出する第5のステップ、およ
び第5のステップで検出した変形結果が一致するカタカ
ナ文字列の中で変形前のカタカナ表記が異なるものを表
記がゆれていると判定する第6のステップを備えてい
る。
複数のカタカナ文字列について表記のゆれが生じている
か否かを検出する文字処理方法であって、文章中から抽
出された各カタカナ文字列を一時記憶する第1のステッ
プ、第1のステップで一時記憶している各カタカナ文字
列の中から複数のカタカナ文字列を選択する第2のステ
ップ、第2のステップで選択された各カタカナ文字列に
ついて、互いの共通部分を検出する第3のステップ、第
2のステップで選択された各カタカナ文字列について、
第3のステップで検出された共通部分以外の非共通部分
を所定の規則に従って変形する第4のステップ、第4の
ステップで変形した結果を相互に比較し、変形部分が一
致するカタカナ文字列を検出する第5のステップ、およ
び第5のステップで検出した変形結果が一致するカタカ
ナ文字列の中で変形前のカタカナ表記が異なるものを表
記がゆれていると判定する第6のステップを備えてい
る。
【0010】
【作用】請求項1または請求項4に係る発明において
は、選択手段で選択された各カタカナ文字列を変形する
前に、各カタカナ文字列の互いの共通部分を検出し、検
出された共通部分を除いた各カタカナ文字列の非共通部
分のみを所定の規則に従って変形することにより、変形
結果比較時におけるデータ量を削減するようにしてい
る。これによって、変形結果比較手段における比較回数
が低減され、短時間で比較が完了する。
は、選択手段で選択された各カタカナ文字列を変形する
前に、各カタカナ文字列の互いの共通部分を検出し、検
出された共通部分を除いた各カタカナ文字列の非共通部
分のみを所定の規則に従って変形することにより、変形
結果比較時におけるデータ量を削減するようにしてい
る。これによって、変形結果比較手段における比較回数
が低減され、短時間で比較が完了する。
【0011】請求項2に係る発明においては、カタカナ
文字列一時記憶部で一時記憶している各カタカナ文字列
を類似しているもの同士いくつかの複数のグループに予
備分類しておき、分類されたグループ毎に複数のカタカ
ナ文字列を選択して変形・比較するようにしている。こ
れによって、抽出された全てのカタカナ文字列を総当た
りで比較する必要がなくなり、より一層比較時間が短縮
化される。
文字列一時記憶部で一時記憶している各カタカナ文字列
を類似しているもの同士いくつかの複数のグループに予
備分類しておき、分類されたグループ毎に複数のカタカ
ナ文字列を選択して変形・比較するようにしている。こ
れによって、抽出された全てのカタカナ文字列を総当た
りで比較する必要がなくなり、より一層比較時間が短縮
化される。
【0012】請求項3に係る発明においては、選択手段
で選択された各カタカナ文字列がいずれも所定数以上の
文字を含む場合にのみ各カタカナ文字列の互いの共通部
分を検出し、非共通部分同士を変形・比較するようにし
ている。これは、文字長の短いカタカナ文字列について
は、それほど多くの変形結果が生じないため、共通部分
を削除するよりは、元のカタカナ文字列をそのまま変形
して比較するほうが全体としての処理効率が上がるから
である。
で選択された各カタカナ文字列がいずれも所定数以上の
文字を含む場合にのみ各カタカナ文字列の互いの共通部
分を検出し、非共通部分同士を変形・比較するようにし
ている。これは、文字長の短いカタカナ文字列について
は、それほど多くの変形結果が生じないため、共通部分
を削除するよりは、元のカタカナ文字列をそのまま変形
して比較するほうが全体としての処理効率が上がるから
である。
【0013】
【実施例】以下本発明の一実施例の文字処理装置につい
て、図面を参照しながら説明する。
て、図面を参照しながら説明する。
【0014】図1は、本発明の一実施例の文字処理装置
の構成を示すブロック図である。図1において、中央処
理装置としてのCPU(セントラル・プロセッシング・
ユニット)1には、RAM(ランダムアクセスメモリ)
2,プログラムメモリ3,ディスプレイ装置4,キーボ
ード5およびディスクドライバ6が接続されている。C
PU1は、プログラムメモリ3に固定的に記憶されたプ
ログラムに従って動作する。プログラムメモリ3として
は、ROM(リードオンリメモリ)やハードディスク装
置等が用いられる。RAM3は、CPU1の作業用メモ
リとして用いられる。ディスプレイ装置4は、CPU1
から表示データを受けて対応する画像を表示する。ディ
スプレイ装置4としては、CRTディスプレイや液晶デ
ィスプレイ等が用いられる。入力手段としてのキーボー
ドは、オペレータの操作に従って種々のデータをCPU
1に入力する。ディスクドライバ6は、フレキシブルデ
ィスク等の記録媒体(図示せず)に対するデータの書き
込みおよび読み出しを実行する。この記録媒体には、例
えばCPU1によって作成された文章データが書き込ま
れる。
の構成を示すブロック図である。図1において、中央処
理装置としてのCPU(セントラル・プロセッシング・
ユニット)1には、RAM(ランダムアクセスメモリ)
2,プログラムメモリ3,ディスプレイ装置4,キーボ
ード5およびディスクドライバ6が接続されている。C
PU1は、プログラムメモリ3に固定的に記憶されたプ
ログラムに従って動作する。プログラムメモリ3として
は、ROM(リードオンリメモリ)やハードディスク装
置等が用いられる。RAM3は、CPU1の作業用メモ
リとして用いられる。ディスプレイ装置4は、CPU1
から表示データを受けて対応する画像を表示する。ディ
スプレイ装置4としては、CRTディスプレイや液晶デ
ィスプレイ等が用いられる。入力手段としてのキーボー
ドは、オペレータの操作に従って種々のデータをCPU
1に入力する。ディスクドライバ6は、フレキシブルデ
ィスク等の記録媒体(図示せず)に対するデータの書き
込みおよび読み出しを実行する。この記録媒体には、例
えばCPU1によって作成された文章データが書き込ま
れる。
【0015】図2および図3は、図1に示す文字処理装
置の動作の内、本発明にとって特徴となる動作を抜き出
して示したフローチャートである。以下、これら図2お
よび図3を参照して、上記実施例の動作を説明する。
今、キーボード5またはディスクドライバ6から入力さ
れた文章データがRAM2に格納されているものとす
る。まず、CPU1は、RAM2に格納された文章デー
タ中からカタカナ文字列を抽出する(ステップS1)。
なお、抽出された各カタカナ文字列は、それぞれが1つ
の外来語に対応しているものとする。次に、CPU1
は、ステップS1で抽出された各カタカナ文字列の文字
の並び方や長さ等から得られる特徴量をもとにして、各
カタカナ文字列を予備分類する(ステップS2)。これ
によって、各カタカナ文字列は、類似しているもの同士
がまとめられ、いくつかのグループに分類される。
置の動作の内、本発明にとって特徴となる動作を抜き出
して示したフローチャートである。以下、これら図2お
よび図3を参照して、上記実施例の動作を説明する。
今、キーボード5またはディスクドライバ6から入力さ
れた文章データがRAM2に格納されているものとす
る。まず、CPU1は、RAM2に格納された文章デー
タ中からカタカナ文字列を抽出する(ステップS1)。
なお、抽出された各カタカナ文字列は、それぞれが1つ
の外来語に対応しているものとする。次に、CPU1
は、ステップS1で抽出された各カタカナ文字列の文字
の並び方や長さ等から得られる特徴量をもとにして、各
カタカナ文字列を予備分類する(ステップS2)。これ
によって、各カタカナ文字列は、類似しているもの同士
がまとめられ、いくつかのグループに分類される。
【0016】なお、上記予備分類の手法としては、種々
の方法が考えられる。第1の方法は、カタカナ文字列の
長さの差が予め定められた数値以下のものを1つのグル
ープにまとめる方法である。この第1の方法によって予
備分類された例を図4に示す。なお、図4におい
て、()内の数字は、文字数を示す。第2の方法は、各
カタカナ文字列が予め定められた特定の文字を含むか否
かを判定し、同じ特定の文字を含むものを1つのグルー
プにまとめる方法である。この第2の方法によって予備
分類された例を図5に示す。第3の方法は、各カタカナ
文字列の文字の並び方の類似度を求め、類似度が近いも
のを1つのグループにまとめる方法である。すなわち、
同じカタカナ文字が同じ順序で出現する割合の高いもの
を1つのグループにまとめる。この第3の方法によって
予備分類された例を図6に示す。
の方法が考えられる。第1の方法は、カタカナ文字列の
長さの差が予め定められた数値以下のものを1つのグル
ープにまとめる方法である。この第1の方法によって予
備分類された例を図4に示す。なお、図4におい
て、()内の数字は、文字数を示す。第2の方法は、各
カタカナ文字列が予め定められた特定の文字を含むか否
かを判定し、同じ特定の文字を含むものを1つのグルー
プにまとめる方法である。この第2の方法によって予備
分類された例を図5に示す。第3の方法は、各カタカナ
文字列の文字の並び方の類似度を求め、類似度が近いも
のを1つのグループにまとめる方法である。すなわち、
同じカタカナ文字が同じ順序で出現する割合の高いもの
を1つのグループにまとめる。この第3の方法によって
予備分類された例を図6に示す。
【0017】次に、CPU1は、レジスタkに予備分類
によって生じたグループ数を設定し(ステップS3)、
カウンタiに“1”をセットする(ステップS4)。な
お、レジスタk,カウンタiは、例えばRAM2の内部
またはCPU1の内部に設けられている。次に、CPU
1は、i番目のグループを選択し(ステップS5)、選
択されたグループに2以上のカタカナ文字列が含まれて
いるか否かを判断する(ステップS6)。選択されたグ
ループに含まれているカタカナ文字列の数が2未満の場
合、すなわち1の場合、そのグループについては表記の
ゆれを生じようがないので、直接ステップS7の動作に
進み、CPU1はカウンタiを1だけインクリメントす
る。これによって表記のゆれの判定処理対象が次のグル
ープに移される。その後、CPU1は、カウンタiのカ
ウント値がレジスタkの設定値以下か否かを判断し(ス
テップS8)、i≦kの場合はステップS5の動作に戻
る。一方、選択されたグループに2以上のカタカナ文字
列が含まれている場合、CPU1は、選択されたグルー
プの中からカタカナ文字列の最初の組み合わせを選択す
る(ステップS9)。なお、本実施例では、2つのカタ
カナ文字列を1つの組として選択している。
によって生じたグループ数を設定し(ステップS3)、
カウンタiに“1”をセットする(ステップS4)。な
お、レジスタk,カウンタiは、例えばRAM2の内部
またはCPU1の内部に設けられている。次に、CPU
1は、i番目のグループを選択し(ステップS5)、選
択されたグループに2以上のカタカナ文字列が含まれて
いるか否かを判断する(ステップS6)。選択されたグ
ループに含まれているカタカナ文字列の数が2未満の場
合、すなわち1の場合、そのグループについては表記の
ゆれを生じようがないので、直接ステップS7の動作に
進み、CPU1はカウンタiを1だけインクリメントす
る。これによって表記のゆれの判定処理対象が次のグル
ープに移される。その後、CPU1は、カウンタiのカ
ウント値がレジスタkの設定値以下か否かを判断し(ス
テップS8)、i≦kの場合はステップS5の動作に戻
る。一方、選択されたグループに2以上のカタカナ文字
列が含まれている場合、CPU1は、選択されたグルー
プの中からカタカナ文字列の最初の組み合わせを選択す
る(ステップS9)。なお、本実施例では、2つのカタ
カナ文字列を1つの組として選択している。
【0018】次に、CPU1は、上記ステップS9で選
択された1組のカタカナ文字列(本実施例では2つのカ
タカナ文字列を含む)について、表記のゆれ判定処理を
実行する(ステップS10)。このステップS10のサ
ブルーチンの詳細は、図3に示されている。図3におい
て、CPU1は、まず選択された2つのカタカナ文字列
がいずれも所定数以上の文字(例えば、10文字)を含
むか否かを判断する(ステップS101)。選択された
2つのカタカナ文字列がいずれも所定数以上の文字を含
む場合、CPU1は、各カタカナ文字列から「ー」や
「・」等のように意味に影響を与えない記号を削除する
(ステップS102)。次に、CPU1は、2つのカタ
カナ文字列から共通部分を削除し、非共通部分カタカナ
文字列を作成する(ステップS103)。次に、CPU
1は、予め定められた変形規則に従って、各非共通部分
カタカナ文字列を先頭の文字から順番に他の記号に置き
換える。この置換(変形)処理は、予め準備された変形
規則テーブル(図7参照)を参照して行われる。
択された1組のカタカナ文字列(本実施例では2つのカ
タカナ文字列を含む)について、表記のゆれ判定処理を
実行する(ステップS10)。このステップS10のサ
ブルーチンの詳細は、図3に示されている。図3におい
て、CPU1は、まず選択された2つのカタカナ文字列
がいずれも所定数以上の文字(例えば、10文字)を含
むか否かを判断する(ステップS101)。選択された
2つのカタカナ文字列がいずれも所定数以上の文字を含
む場合、CPU1は、各カタカナ文字列から「ー」や
「・」等のように意味に影響を与えない記号を削除する
(ステップS102)。次に、CPU1は、2つのカタ
カナ文字列から共通部分を削除し、非共通部分カタカナ
文字列を作成する(ステップS103)。次に、CPU
1は、予め定められた変形規則に従って、各非共通部分
カタカナ文字列を先頭の文字から順番に他の記号に置き
換える。この置換(変形)処理は、予め準備された変形
規則テーブル(図7参照)を参照して行われる。
【0019】次に、CPU1は、2つの非共通部分カタ
カナ文字列から作成された変形後の記号列を互いに比較
し、その中に一致する記号列があるか否かを判断する
(ステップS105)。一致する記号列が無い場合、C
PU1は、選択された組の2つのカタカナ文字列の間で
表記のゆれが生じていないと判定する(ステップS10
6)。一方、一致する記号列が有る場合、CPU1は、
元のカタカナ文字列同士を比較し、両者が異なるか否か
を判断する(ステップS107)。元のカタカナ文字列
同士が互いに一致する場合、CPU1は、表記のゆれが
生じていないと判定する(ステップS106)。一方、
元のカタカナ文字列同士が異なる場合、CPU1は、選
択された組の2つのカタカナ文字列の間で表記のゆれが
生じていると判定する(ステップS108)。上記ステ
ップS106,S108の判定処理の後、CPU1は、
その判定結果をディスプレイ装置4に表示する。その
後、CPU1は、図2のステップS11の動作にリター
ンする。
カナ文字列から作成された変形後の記号列を互いに比較
し、その中に一致する記号列があるか否かを判断する
(ステップS105)。一致する記号列が無い場合、C
PU1は、選択された組の2つのカタカナ文字列の間で
表記のゆれが生じていないと判定する(ステップS10
6)。一方、一致する記号列が有る場合、CPU1は、
元のカタカナ文字列同士を比較し、両者が異なるか否か
を判断する(ステップS107)。元のカタカナ文字列
同士が互いに一致する場合、CPU1は、表記のゆれが
生じていないと判定する(ステップS106)。一方、
元のカタカナ文字列同士が異なる場合、CPU1は、選
択された組の2つのカタカナ文字列の間で表記のゆれが
生じていると判定する(ステップS108)。上記ステ
ップS106,S108の判定処理の後、CPU1は、
その判定結果をディスプレイ装置4に表示する。その
後、CPU1は、図2のステップS11の動作にリター
ンする。
【0020】なお、前述のステップS101において、
2つのカタカナ文字列のいずれかまたは両方が所定数以
上の文字を含んでいないと判断された場合、CPU1
は、ステップS102,S103の動作をスキップして
ステップS104の動作に進む。すなわち、この場合、
共通部分の検出および削除は行われない。これは、文字
長の短いカタカナ文字列については、それほど多くの変
形結果が生じないため、共通部分を検出して削除するよ
りは、元のカタカナ文字列をそのまま変換して比較する
ほうが、全体として処理の効率化が図れるからである。
2つのカタカナ文字列のいずれかまたは両方が所定数以
上の文字を含んでいないと判断された場合、CPU1
は、ステップS102,S103の動作をスキップして
ステップS104の動作に進む。すなわち、この場合、
共通部分の検出および削除は行われない。これは、文字
長の短いカタカナ文字列については、それほど多くの変
形結果が生じないため、共通部分を検出して削除するよ
りは、元のカタカナ文字列をそのまま変換して比較する
ほうが、全体として処理の効率化が図れるからである。
【0021】再び図2を参照して、ステップS11でC
PU1は、前述のステップS5で選択されたグループ中
に次のカタカナ文字列の組み合わせが存在するか否かを
判断する。上記グループ中に次のカタカナ文字列の組み
合わせが存在する場合、CPU1は、次のカタカナ文字
列の組み合わせを選択する(ステップS12)。その
後、ステップS10の動作に進み、選択された次のカタ
カナ文字列の組み合わせについて前述同様の表記のゆれ
判定処理を実行する。以後、同一グループ中の全てのカ
タカナ文字列の組み合わせについて(すなわち、総当た
りで)表記のゆれ判定処理が実行される。
PU1は、前述のステップS5で選択されたグループ中
に次のカタカナ文字列の組み合わせが存在するか否かを
判断する。上記グループ中に次のカタカナ文字列の組み
合わせが存在する場合、CPU1は、次のカタカナ文字
列の組み合わせを選択する(ステップS12)。その
後、ステップS10の動作に進み、選択された次のカタ
カナ文字列の組み合わせについて前述同様の表記のゆれ
判定処理を実行する。以後、同一グループ中の全てのカ
タカナ文字列の組み合わせについて(すなわち、総当た
りで)表記のゆれ判定処理が実行される。
【0022】一方、ステップS11で次のカタカナ文字
列の組み合わせが存在しない場合は、ステップS7に進
み、表記のゆれの判定処理対象が次のグループに移され
る。以後、各グループのカタカナ文字列について、上記
と同様の処理が繰り返される。
列の組み合わせが存在しない場合は、ステップS7に進
み、表記のゆれの判定処理対象が次のグループに移され
る。以後、各グループのカタカナ文字列について、上記
と同様の処理が繰り返される。
【0023】以上説明したように、本実施例の文字処理
装置では、処理の対象となる2つのカタカナ文字列から
共通部分を検出して削除し、残された非共通部分カタカ
ナ文字列について変形を加え、変形後の結果を互いに比
較するようにしているので、元のカタカナ文字列をその
まま変形する場合に比べて変形結果の数が大幅に削減さ
れ、比較回数を低減できる。その結果、処理の効率化を
図ることができる。
装置では、処理の対象となる2つのカタカナ文字列から
共通部分を検出して削除し、残された非共通部分カタカ
ナ文字列について変形を加え、変形後の結果を互いに比
較するようにしているので、元のカタカナ文字列をその
まま変形する場合に比べて変形結果の数が大幅に削減さ
れ、比較回数を低減できる。その結果、処理の効率化を
図ることができる。
【0024】以上説明した本実施例の文字処理装置の動
作および効果をより一層明らかにするために、具体的な
事例を想定して本実施例の動作および効果を以下に具体
的に説明する。
作および効果をより一層明らかにするために、具体的な
事例を想定して本実施例の動作および効果を以下に具体
的に説明する。
【0025】今、RAM2には、以下に示すカタカナ文
字列を含む文章が記憶されているとする。
字列を含む文章が記憶されているとする。
【0026】システム・インテグレーション システムインテグレーター システムインテグレート まず、CPU1は、上記のカタカナ文字列を抽出する
(ステップS1)。RAM2は、抽出されたカタカナ文
字列をそれらの位置情報(開始位置)とともに以下のよ
うに一時記憶する。なお、[]内の数字は、各カタカナ
文字列に付された連番である。
(ステップS1)。RAM2は、抽出されたカタカナ文
字列をそれらの位置情報(開始位置)とともに以下のよ
うに一時記憶する。なお、[]内の数字は、各カタカナ
文字列に付された連番である。
【0027】 [1]システム・インテグレーション ○○文字目 [2]システムインテグレーター △△文字目 [3]システムインテグレート ××文字目 次に、CPU1は、上記カタカナ文字列の中から最初の
組み合わせ、例えば[1]と[2]のカタカナ文字列の
組み合わせを選択する(ステップS9)。次に、CPU
1は、選択された各カタカナ文字列の長さを調べ(ステ
ップS101)、いずれも10文字より長い場合、2つ
のカタカナ文字列から省略可能な文字「ー」、「・」を
除く(ステップS102)。[1]と[2]のカタカナ
文字列は、いずれも文字列長が10文字より長いので、
「ー」、「・」を除く。すると、[1]は「システムイ
ンテグレション」になり、[2]は「システムインテグ
レタ」になる。
組み合わせ、例えば[1]と[2]のカタカナ文字列の
組み合わせを選択する(ステップS9)。次に、CPU
1は、選択された各カタカナ文字列の長さを調べ(ステ
ップS101)、いずれも10文字より長い場合、2つ
のカタカナ文字列から省略可能な文字「ー」、「・」を
除く(ステップS102)。[1]と[2]のカタカナ
文字列は、いずれも文字列長が10文字より長いので、
「ー」、「・」を除く。すると、[1]は「システムイ
ンテグレション」になり、[2]は「システムインテグ
レタ」になる。
【0028】次に、CPU1は、「ー」、「・」が除か
れた2つのカタカナ文字列の共通部分を検出し、共通部
分を削除した非共通部分カタカナ文字列を作成する(ス
テップS103)。[1]と[2]の2つのカタカナ文
字列を比較すると、「システムインテグレ」が共通に出
現する。したがって、CPU1は、[1]のカタカナ文
字列から「ション」を作成し、[2]のカタカナ文字列
から「タ」を作成する。RAM2は、作成された非共通
部分カタカナ文字列を以下のように、一時記憶する。な
お、「」内は元のカタカナ文字列を示している。
れた2つのカタカナ文字列の共通部分を検出し、共通部
分を削除した非共通部分カタカナ文字列を作成する(ス
テップS103)。[1]と[2]の2つのカタカナ文
字列を比較すると、「システムインテグレ」が共通に出
現する。したがって、CPU1は、[1]のカタカナ文
字列から「ション」を作成し、[2]のカタカナ文字列
から「タ」を作成する。RAM2は、作成された非共通
部分カタカナ文字列を以下のように、一時記憶する。な
お、「」内は元のカタカナ文字列を示している。
【0029】 [1]ション 「システム・インテグレーション」 [2]タ 「システムインテグレーター」 次に、CPU1は、RAM2に一時記憶された各非共通
部分カタカナ文字列を、図7に示す変形規則テーブル
(例えば、RAM2またはプログラムメモリ3に格納さ
れている)に従って他の記号に変形する(ステップS1
04)。RAM2は、その変形結果を変形前のカタカナ
文字列と対にして図9のように一時記憶する。なお、図
9において「」内は、変形前のカタカナ文字列を示して
いる。
部分カタカナ文字列を、図7に示す変形規則テーブル
(例えば、RAM2またはプログラムメモリ3に格納さ
れている)に従って他の記号に変形する(ステップS1
04)。RAM2は、その変形結果を変形前のカタカナ
文字列と対にして図9のように一時記憶する。なお、図
9において「」内は、変形前のカタカナ文字列を示して
いる。
【0030】次に、CPU1は、RAM2に一時記憶さ
れた変形結果を比較して一致するものを検出する(ステ
ップS105)。この場合、[1]のカタカナ文字列に
ついて2個、[2]のカタカナ文字列について1個の変
形結果が得られ、比較回数は最大2回になる。すなわ
ち、2回の比較を行なうと一致するものが得られないこ
とがわかる。次に、CPU1は、[1]と[2]のカタ
カナ文字列の変形結果には一致するものがないので、表
記のゆれが生じていないと判定する(ステップS10
6)。
れた変形結果を比較して一致するものを検出する(ステ
ップS105)。この場合、[1]のカタカナ文字列に
ついて2個、[2]のカタカナ文字列について1個の変
形結果が得られ、比較回数は最大2回になる。すなわ
ち、2回の比較を行なうと一致するものが得られないこ
とがわかる。次に、CPU1は、[1]と[2]のカタ
カナ文字列の変形結果には一致するものがないので、表
記のゆれが生じていないと判定する(ステップS10
6)。
【0031】一方、図10に示す従来の文字処理装置で
は、図8に示すように、[1]のカタカナ文字列につい
て16個、[2]のカタカナ文字列について8個、
[3]のカタカナ文字列について8個の変形結果が得ら
れるので、[1]と[2]のカタカナ文字列の比較に1
28回、[1]と[3]のカタカナ文字列の比較に12
8回、[2]と[3]のカタカナ文字列の比較に64回
の繰り返し処理が必要となり比較に時間がかかる。
は、図8に示すように、[1]のカタカナ文字列につい
て16個、[2]のカタカナ文字列について8個、
[3]のカタカナ文字列について8個の変形結果が得ら
れるので、[1]と[2]のカタカナ文字列の比較に1
28回、[1]と[3]のカタカナ文字列の比較に12
8回、[2]と[3]のカタカナ文字列の比較に64回
の繰り返し処理が必要となり比較に時間がかかる。
【0032】以上のように、本実施例によれば、変形結
果を比較するのに従来は128回の比較が必要だったと
ころを、共通部分を検出し削除することによって2回の
比較で済むことになり、比較時間を大幅に短縮化でき
る。
果を比較するのに従来は128回の比較が必要だったと
ころを、共通部分を検出し削除することによって2回の
比較で済むことになり、比較時間を大幅に短縮化でき
る。
【0033】なお、上記実施例では、共通部分の抽出を
行なう条件として、カタカナ文字列の長さがあらかじめ
定められた値より大きい場合としたが、カタカナ文字列
に対する変形結果の数があらかじめ定められた値より大
きい場合を条件としてもよい。
行なう条件として、カタカナ文字列の長さがあらかじめ
定められた値より大きい場合としたが、カタカナ文字列
に対する変形結果の数があらかじめ定められた値より大
きい場合を条件としてもよい。
【0034】また、上記実施例では、予備分類された各
グループ別に表記のゆれ判定の処理対象となるカタカナ
文字列の組み合わせを選択するようにしたが、抽出され
た各カタカナ文字列の全てを総当たりで選択して表記の
ゆれを判定するようにしてもよい。さらに、オペレータ
によって指定されたカタカナ文字列について表記のゆれ
を判定するようにしてもよい。
グループ別に表記のゆれ判定の処理対象となるカタカナ
文字列の組み合わせを選択するようにしたが、抽出され
た各カタカナ文字列の全てを総当たりで選択して表記の
ゆれを判定するようにしてもよい。さらに、オペレータ
によって指定されたカタカナ文字列について表記のゆれ
を判定するようにしてもよい。
【0035】
【発明の効果】請求項1または請求項4に係る発明によ
れば、選択された各カタカナ文字列の互いの共通部分を
検出し、検出された共通部分を除いた非共通部分のみを
所定の規則に従って変形して比較するようにしているの
で、従来のように各カタカナ文字列をそのまま変形して
比較する場合に比べて変形結果の数が減少し、比較回数
を低減できる。その結果、短時間で比較処理を完了する
ことができる。
れば、選択された各カタカナ文字列の互いの共通部分を
検出し、検出された共通部分を除いた非共通部分のみを
所定の規則に従って変形して比較するようにしているの
で、従来のように各カタカナ文字列をそのまま変形して
比較する場合に比べて変形結果の数が減少し、比較回数
を低減できる。その結果、短時間で比較処理を完了する
ことができる。
【0036】請求項2に係る発明によれば、抽出された
各カタカナ文字列を類似しているもの同士いくつかの複
数のグループに予備分類しておき、分類されたグループ
毎に複数のカタカナ文字列を選択して変形・比較するよ
うにしているので、抽出された全てのカタカナ文字列を
総当たりで比較する必要がなくなり、より一層比較時間
を短縮化できる。
各カタカナ文字列を類似しているもの同士いくつかの複
数のグループに予備分類しておき、分類されたグループ
毎に複数のカタカナ文字列を選択して変形・比較するよ
うにしているので、抽出された全てのカタカナ文字列を
総当たりで比較する必要がなくなり、より一層比較時間
を短縮化できる。
【0037】請求項3に係る発明によれば、選択された
各カタカナ文字列がいずれも所定数以上の文字を含む場
合にのみ各カタカナ文字列の互いの共通部分を検出し、
非共通部分同士を変形・比較するようにしているので、
全体としての処理効率をより一層向上できる。なぜなら
ば、文字長の短いカタカナ文字列については、それほど
多くの変形結果が生じないため、共通部分を削除するよ
りは、元のカタカナ文字列をそのまま変形して比較する
ほうが全体としての処理効率が上がるからである。
各カタカナ文字列がいずれも所定数以上の文字を含む場
合にのみ各カタカナ文字列の互いの共通部分を検出し、
非共通部分同士を変形・比較するようにしているので、
全体としての処理効率をより一層向上できる。なぜなら
ば、文字長の短いカタカナ文字列については、それほど
多くの変形結果が生じないため、共通部分を削除するよ
りは、元のカタカナ文字列をそのまま変形して比較する
ほうが全体としての処理効率が上がるからである。
【図1】本発明の一実施例の文字処理装置の構成を示す
ブロック図
ブロック図
【図2】図1の実施例の動作を示すフローチャート
【図3】図2のフローチャートにおけるサブルーチンス
テップS10の詳細な動作を示すフローチャート
テップS10の詳細な動作を示すフローチャート
【図4】図1の実施例で実行される予備分類の第1の方
法による分類結果の例を示す図
法による分類結果の例を示す図
【図5】図1の実施例で実行される予備分類の第2の方
法による分類結果の一例を示す図
法による分類結果の一例を示す図
【図6】図1の実施例で実行される予備分類の第3の方
法による分類結果の一例を示す図
法による分類結果の一例を示す図
【図7】図1の実施例でカタカナ文字列を変形する際に
用いられる変形規則テーブルの一例を示す図
用いられる変形規則テーブルの一例を示す図
【図8】従来の文字処理装置におけるカタカナ文字列の
変形結果の一例を示す図
変形結果の一例を示す図
【図9】図1の実施例におけるカタカナ文字列の変形結
果の一例を示す図
果の一例を示す図
【図10】従来の文字処理装置の構成を示すブロック図
1 CPU 2 RAM 3 プログラムメモリ 4 ディスプレイ装置 5 キーボード 6 ディスクドライバ
Claims (4)
- 【請求項1】文章中に含まれるカタカナ文字列について
表記のゆれが生じているか否かを検出する文字処理装置
であって、 前記文章中から抽出された各カタカナ文字列を一時記憶
するカタカナ文字列一時記憶手段、 前記カタカナ文字列一時記憶手段で一時記憶している各
カタカナ文字列の中から複数のカタカナ文字列を選択す
る選択手段、 前記選択手段で選択された各カタカナ文字列について、
互いの共通部分を検出する共通部分検出手段、 前記選択手段で選択された各カタカナ文字列について、
前記共通部分検出手段で検出された共通部分以外の非共
通部分を所定の規則に従って変形するカタカナ文字列変
形手段、 前記カタカナ文字列変形手段で変形した結果を相互に比
較し、変形部分が一致するカタカナ文字列を検出する変
形結果比較手段、および前記変形結果比較部で検出した
変形結果が一致するカタカナ文字列の中で変形前のカタ
カナ表記が異なるものを表記がゆれていると判定する表
記のゆれ判定手段を備えた、文字処理装置。 - 【請求項2】前記カタカナ文字列一時記憶部で一時記憶
している各カタカナ文字列を、類似しているもの同士い
くつかのグループに分類する予備分類手段をさらに備
え、 前記選択手段は、前記予備分類手段で分類された各グル
ープ毎に前記複数のカタカナ文字列を選択する、請求項
1に記載の文字処理装置。 - 【請求項3】前記選択手段で選択された各カタカナ文字
列がいずれも所定数以上の文字を含むか否かを検出する
文字列長検出手段をさらに備え、 前記共通部分検出手段は、前記選択手段で選択された各
カタカナ文字列がいずれも所定数以上の文字を含むこと
を前記文字列長検出手段が検出した場合にのみ各カタカ
ナ文字列の共通部分を検出する、請求項1に記載の文字
処理装置。 - 【請求項4】文章中に含まれる複数のカタカナ文字列に
ついて表記のゆれが生じているか否かを検出する文字処
理方法であって、 前記文章中から抽出された各カタカナ文字列を一時記憶
する第1のステップ、 前記第1のステップで一時記憶している各カタカナ文字
列の中から複数のカタカナ文字列を選択する第2のステ
ップ、 前記第2のステップで選択された各カタカナ文字列につ
いて、互いの共通部分を検出する第3のステップ、 前記第2のステップで選択された各カタカナ文字列につ
いて、前記第3のステップで検出された共通部分以外の
非共通部分を所定の規則に従って変形する第4のステッ
プ、 前記第4のステップで変形した結果を相互に比較し、変
形部分が一致するカタカナ文字列を検出する第5のステ
ップ、および前記第5のステップで検出した変形結果が
一致するカタカナ文字列の中で変形前のカタカナ表記が
異なるものを表記がゆれていると判定する第6のステッ
プを備えた、文字処理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5164349A JPH0721182A (ja) | 1993-07-02 | 1993-07-02 | 文字処理装置およびその方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5164349A JPH0721182A (ja) | 1993-07-02 | 1993-07-02 | 文字処理装置およびその方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0721182A true JPH0721182A (ja) | 1995-01-24 |
Family
ID=15791479
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5164349A Pending JPH0721182A (ja) | 1993-07-02 | 1993-07-02 | 文字処理装置およびその方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0721182A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002091951A (ja) * | 2000-09-18 | 2002-03-29 | Intec Web & Genome Informatics Corp | カタカナ文字列照合方法及びカタカナ文字列照合プログラムを記録した媒体 |
| JP2016091344A (ja) * | 2014-11-06 | 2016-05-23 | 日本電気株式会社 | ゆれ語判定装置、ゆれ語判定方法、ゆれ語判定プログラム、及び、文書分析装置 |
-
1993
- 1993-07-02 JP JP5164349A patent/JPH0721182A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002091951A (ja) * | 2000-09-18 | 2002-03-29 | Intec Web & Genome Informatics Corp | カタカナ文字列照合方法及びカタカナ文字列照合プログラムを記録した媒体 |
| JP2016091344A (ja) * | 2014-11-06 | 2016-05-23 | 日本電気株式会社 | ゆれ語判定装置、ゆれ語判定方法、ゆれ語判定プログラム、及び、文書分析装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2726568B2 (ja) | 文字認識方法及び装置 | |
| JP2937519B2 (ja) | 文書検索装置 | |
| JPH0721182A (ja) | 文字処理装置およびその方法 | |
| EP0343918A2 (en) | A relational data retrieval apparatus | |
| JPH0619962A (ja) | テキスト分割装置 | |
| JP3275704B2 (ja) | 入力文字列推測認識装置 | |
| JP2001125892A (ja) | ルビ表示装置、ルビ表示方法およびルビ表示プログラムを記録した媒体 | |
| JPH08180066A (ja) | インデックス作成方法、文書検索方法及び文書検索装置 | |
| JP3314443B2 (ja) | 文字出力装置 | |
| US5226174A (en) | Character recognition system for determining a class of similarity based on computer distance with a smallest value indicating close similarity | |
| US7349846B2 (en) | Information processing apparatus, method, program, and storage medium for inputting a pronunciation symbol | |
| JPS6038750B2 (ja) | ワ−ドプロセッサにおける文字插入方法 | |
| JP3072126B2 (ja) | 書体を識別する方法及び装置 | |
| JPH0546607A (ja) | 文書読み上げ装置 | |
| JP2938276B2 (ja) | 文字認識装置 | |
| EP0370766B1 (en) | Sorting method and apparatus | |
| JPH02108157A (ja) | 情報検索方法 | |
| JP2002163291A (ja) | 類似文書検索装置、類似文書検索方法及び記録媒体 | |
| JP2001343995A (ja) | 音声入力処理装置、音声入力処理方法及び音声入力処理プログラムを記録した記録媒体 | |
| JP3035105B2 (ja) | 文章情報処理装置 | |
| JPS61133487A (ja) | 文字認識装置 | |
| JPS6029823A (ja) | 適応型記号列変換方式 | |
| CN1034077A (zh) | 汉字输入装置 | |
| JPH10261049A (ja) | 文字認識装置 | |
| JPH0836563A (ja) | 文書編集方式及び該方式を用いた文書作成装置 |