JPS62290968A - 表記のゆれ統一方式 - Google Patents

表記のゆれ統一方式

Info

Publication number
JPS62290968A
JPS62290968A JP61135319A JP13531986A JPS62290968A JP S62290968 A JPS62290968 A JP S62290968A JP 61135319 A JP61135319 A JP 61135319A JP 13531986 A JP13531986 A JP 13531986A JP S62290968 A JPS62290968 A JP S62290968A
Authority
JP
Japan
Prior art keywords
katakana
string
storage means
stored
transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61135319A
Other languages
English (en)
Other versions
JPH0544701B2 (ja
Inventor
Shunichi Fukushima
俊一 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61135319A priority Critical patent/JPS62290968A/ja
Publication of JPS62290968A publication Critical patent/JPS62290968A/ja
Publication of JPH0544701B2 publication Critical patent/JPH0544701B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の詳細な説明 (産業上の利用分野) 本発明は、日本語文章においてカタカナ表記にゆれを生
じている部分を検出し統一する方式に関するものである
(従来の技術) 外来語のカタカナ表記のしかたは一定ではなく、複数の
カタカナ表記の方法が可能な場合が多い。例えば、速の
ような例がある。
piano−ピアノ、ピャノ violin−バイオリン、ヴァイオリン1nterf
ace→インターフェース、インターフェイス、 インタフェース、 インタフェイス このような外来語の表記のゆれに対して、昭和29年3
月国語審議会報告[外来語の表記コなどで表記法の一応
の指針は与えられているが、現状は、外来語のカタカナ
表記法は人それぞれで異なる。
また、同一の人が書いた文章のなかでも、同一の単語に
対して複数のカタカナ表記法をとってし、まうこともあ
る。
近年、ワードプロセッサにより日本語文章が作成され、
電子化して保存・流用されるようになり、複数の人の作
成した文章をつなげて一つの文章にすることや他人の作
成した文章・例文を部分的に修正して用いることなども
、容易に行われるようになった。そのような場合には文
章全体としての統一性が問題となり、その大きな原因の
一つとして、カタカナ表記のゆれがある。
従来、このようなカタカナ表記のゆれは、作成した文章
のカタカナ部分を目視でチェックし、人手により書き直
すより他に手はなかった。
(発明が解決しようとする間組点) 本発明の目的は、従来、目視でチェックするより他に検
出する方法のなかったカタカナ表記のゆれを自動的に検
出し、統一する方式を提供することである。
(問題を解決するための手段) 本発明は予め入力された予め入力された文章を記憶する
文章記憶手段と、該文章記憶手段に記憶された文章から
カタカナ列を抽出するカタカナ列抽出手段と、該カタカ
ナ列抽出手段によって抽出されたカタカナ列を記憶する
カタカナ列記憶手段と、該カタカナ列記憶手段に記憶さ
れたカタカナ列に対して特定のカタカナあるいは部分カ
タカナ列を削除または置換することによって変形を加え
るカタカナ列変形手段と、前記カタカナ列変形手段によ
って変形された結果を前記カタカナ列記憶手段に記憶さ
れたカタカナ列と対応付けて記憶する変形結果記憶手段
と、該変形結果記憶手段に記憶された変形結果を比較し
て変形結果の一致するカタカナ列の一群を検出する変形
結果比較手段と、前言己変形結果比較手段によって検出
されたカタカナ列の一群について前記カタカナ列記憶手
段に記憶されたカタカナ列を比較することによって、変
形結果は一致するが変形前のカタカナ列は異なるカタカ
ナ列の一群を検出するカタカナ列比較手段、前記カタカ
ナ列変形手段による変形結果と該変形結果に対する正規
のカタカナ表記とを予め対応付けて記憶した書換方法記
憶手段、前記カタカナ列比較手段によって検出されたカ
タカナ列の一群に対して前記書換方法記憶手段に記憶さ
れた正規のカタカナ表記に書き換えるゆれ部分書換手段
とを備えたことを特徴とする表記のゆれ統一方式である
(実施例) 図面を用いて、本発明の構成・作用を説明する。
第1図は本発明の表記のゆれ統一方式の実施例の構成を
示すブロック図である。第1図において、文章記憶手段
1は予め入力された日本語の文章を文字コードとして記
憶するものであり、ICメモリ、磁気ディスク装置、磁
気テープ装置などが用いられる。
カタカナ列抽出手段2は、文章記憶手段1に記憶された
文章の先頭文字から順次、カタカナに対応する文字コー
ドを捜してゆき、連続するカタカナをひとまとまりのカ
タカナ列として抽出し、カタカナ列記憶手段3に書き込
む。
カタカナ列記憶手段3は、カタカナ列抽出手段2によっ
て抽出されたカタカナ列とともに、文章記憶手段1に記
憶された文章における位置の情報も記憶する。文章記憶
手段1と同様に、ICメモリ、磁気ディスク装置、磁気
テープ装置などが用いられる。
カタカナ列変形手段4は、カタカナ列記憶手段3に記憶
されたカタカナ列に対して特定のカタカナあるいは部分
カタカナ列を削除または置換することによって変形を加
え、その変形結果を変形結果記憶手段5に書き込む。こ
こで行う変形(特定のカタカナあるいは部分カタカナ列
の削除または置換)の具体的な例として、(例1)のよ
うなものが上げられる。カタカナ列変形手段4では、(
列1)の矢印の元のカタカナあるいはカタカナ列をカタ
カナ列記憶手段3に記憶されたカタカナ列から検索して
、(例1)の矢印の先のカタカナあるいはカタカナ列へ
の置き換え、または削除を行う。
(例1) ’7”アーハウ゛イービヴ工−ベヴオ→ボフ
ァーハフィ→ヒフェ→ヘフォーホ イイーイー キイーキー ニイ一二一 ヒイーヒーエイ
ーエー ケイーケーネイーネー へイーヘーイヤーイア
 キャーキア ヒヤーヒア ビヤ−ピアエヤーエア ケ
ヤ→ケア へヤ→ヘア ペヤーベアンー(削除)−一(
削除) 変形結果記憶手段5は、カタカナ列変形手段4によって
変形された結果を、カタカナ列記憶手段3に記憶された
カタカナ列と対応付けて記憶する。
ICメモリ、磁気ディスク装置、磁気テープ装置などが
用いられ、カタカナ列記憶手段3と一体化して実現して
もよい。
変形結果比較手段6は、変形結果記憶手段5に記憶され
た変形結果を比較し変形結果の一致するカタカナ列の一
群を検出する。変形結果記憶手段5に記憶された変形結
果には、カタカナ列記憶手段3のカタカナ列との対応が
与えられており、変形結果の一致した一群について、そ
の対応の情報を、カタカナ列比較手段7へ送る。
カタカナ列比較手段7は、変形結果比較手段6より送ら
れてきた対応の情報により、変形結果の一致する変形前
のカタカナ列の一群をカタカナ列記憶手段3から抽出す
る。次にカタカナ列比較手段7は、その変形結果の一致
する変形前のカタカナ列を比較し、変形結果は一致する
が変形前のカタカナ列は一致しないカタカナ列の一群を
検出する。
カタカナ列記憶手段3に記憶されたカタカナ列には、文
章記憶手段1に3己憶された文章における位置の情報が
与えられているので、カタカナ列比較手段7は、検出し
た変形結果は一致するが変形前のカタカナ列は異なるカ
タカナ列の一群について、文章記憶手段1に記憶された
文章における位置の情報と変形結果のカタカナ列とを、
ゆれ部分書換手段8へ送る。
書換方法記憶手段9は、表記のゆれを生ずるカタカナ列
に対して、カタカナ列変形手段4による変形結果を予め
登録しておき、さらに、それらに対応付けて、統一しよ
うとする正規のカタカナ表記を登録したものであり、I
Cメモリ、磁気ディスク装置、磁気テープ装置などが用
いられる。第2図に書換方法記憶手段9の内容の例を示
す。第2図において、90は変形結果の表記であり、9
1は統一する表記形である。例えば、「インターフェー
ス」 [インターフェイスj「インタフェース」「イン
タフェイス1などのカタカナ表記のゆれに対して、[イ
ンターフェースjというカタカナ表記に統一したい場合
には、これらに対するカタカナ列変形手段4による変形
は[インタヘス」となるので、第2図のように、変形結
果の表記90には[インクヘス」、統一する表記形91
には[インターフェース]と登録しておけばよい。
ゆれ部分書換手段8は、カタカナ列比較手段7から送ら
れてきたカタカナ列を、その変形結果に対する書換方法
記憶手段9に記憶された正規のカタカナ表記(統一する
表記形91)に書き換える。
次にこの実施例の動作を例を用いて説明する。
まず、次のような文章が、文章記憶手段1に記憶されて
いるものとする。
プログラムのモジュールの独立性を高めることは重要で
ある。そのためには、モジュール間のインターフェース
を、できるだけシンプルにすることがポイントである。
仮名漢字変換のモジュールは、仮名文字列を受は取り、
漢字仮名混じり文字列を返すというインターフェイスが
考えられるが、このインタフェースの場合、選択操作を
どう扱うかが問題となる。
次に、文字記憶手段1から、カタカナ列抽出手段2がカ
タ々ナダ(を抽出し、カタカナ列記憶手段3に書き込ん
だ結果は、次のようになる。[]内の数字はカタカナ列
の連番であり、(へ)内の数字はは、そのカタカナ列の
文章中の位置の情報であり、文章の先頭から数えた文字
数である。
[11(1〜5)プログラム [2] (7〜11)モジュール [3] (36〜40)モジュール [4] (43〜50)インターフェース[5] (5
8〜61)シンプル [6] (68〜71)ポイント [7] (83〜87)モジュール [8] (117〜124)インターフェイス[9] 
(135〜141)インタフェースこのカタカナ列に対
して、カタカナ列変形手段4は、(例1)に示したよう
に、カタカナあるいはカタカナ列の削除・置換を行う。
すなわち、[モジュールjは[−4の削除により[モジ
ュルjになる。
「インターフェースJは、「フエーヘJの置き換えによ
り「インターヘース」となり、さらに「−」の削除によ
り[インタヘスJとなる。「インターフェイス]は、[
フェーへ]の置き換えにより「インターへイス]となり
、続いて[ヘイーヘ−1の置き換えにより「インターヘ
ース」となり、さらにr−Jの削除により「インタヘス
」となる。「インタフェース」は、「フエーヘ」の置き
換えにより「インタヘース]となり、さらにr−Jの削
除により「インタヘス」となる。他のカタカナ列「プロ
グラム」 [シンプル] [ポイント]は、(例1)に
示したような削除、置換を行う本実施例のカタカナ列変
形手段4では変形されない。その結果は、次のようにな
り、変形結果記憶手段5に記憶される。なお、[]内の
数字は、カタカナ列記憶手段3のものと対応している。
ただし、カタカナ列変形手段4の削除・置換の方法は(
例1)に限定されない。(例1)以外にも、例えば、[
ンjを削除するとか、小文字を大文字に換えるなどの方
法も考えられ、そのような方法を採った場合には、この
例とは異なる変形結果が得られる。
[1]プログラム [2]モジユル [31モジユル [4]インタヘス [5]シンプル [61ポイント [7]モジユル [8]インタヘス [9]インタヘス 次に変形結果比較手段6は、変形結果記憶手段に記憶さ
れた変形結果のなかで一致するものを検出する。その結
果、[2] [3] [7]の一群、および、[4] 
[8][91の一群が一致し、これらの番号が、カタカ
ナ列比較手段7へ送られる。
そこで、カタカナ列比較手段7は、[2] [3] [
7]、および[4] [8] [9]に対する変形前の
カタカナ列が一致するか否かを、カタカナ列記jib手
段3を検索して調べる。その結果、[2] [3] [
7]は一致し、[4] [8] [9]は異なることが
わかり、変形結果は一致するが、変形前のカタカナ列の
異なる[4] [8] [9]に関する、文章中の位置
の情報と変形結果(43〜50:インタヘス)、(11
7〜124:インタヘス)、(135〜141:インタ
ヘス)を、ゆれ部分統一手段8へ送る。
ゆれ部分統一手段8は、カタカナ列比較手段7から送ら
れてきた位置のカタカナ列に対して、変形結果に対応す
る正規のカタカナ表記を書換方法記憶手段9から検索し
て、文章記憶手段1に記憶された文章を書き換える。こ
こでは、変形結果「インタヘスJに対する正規のカタカ
ナ表記が検索され、書換方法記憶手段9として例えば第
2図を用いるならば、正規のカタカナ表記として「イン
ターフェース1が得られ、文章記憶手段1に記憶された
文章の先頭から43−1−50文字目、117〜124
文字目、135〜141文字目とも[インターフェース
」に書き換えられる。この書き換えにより、文章記憶手
段1の内容は次のように変わり、カタカナ表記の統一が
図られたことになる。
プログラムのモジュールの独立性を高めることは重要で
ある。そのためには、モジュール間のインターフェース
を、できるだけシンプルにすることがポイントである。
仮名漢字変換のモジュールは、仮名文字列を受は取り、
漢字仮名混じり文字列を返すというインターフェースが
考えられるが、このインターフェースの場合、選択繰作
をどう扱うかが問題となる。
のように表記が統一される。
(発明の効果) 以上説明したように、本発明によれば、従来、目視での
チェックより他に検出する方法のなかったカタカナ表記
のゆれを自動的に検出し、予め登録しておいたカタカナ
表記に統一することが可能となり、文章の校正作業の効
率化を図ることができる。
【図面の簡単な説明】
第1図は本発明の実施例の構成を示すブロック図、第2
図は書換方法記憶手段9の例である。 図において、 1・・・・・文章記憶手段 2・・・・・カタカナ列抽出手段 3・・・・・カタカナ列記憶手段 4・・・・・カタカナ列変形手段 5・・・・・変形結果記憶手段 6・・・・・変形結果比較手段 7・・・・・カタカナ列比較手段 8・・・・・ゆれ部分書換手段 9・・・・・書換方法記憶手段 第  1  図 第  2  図 変形結果の   統一する 表記90   表記形91 書換方法記憶手段9

Claims (1)

    【特許請求の範囲】
  1. 予め入力された文章を記憶する文章記憶手段と、該文章
    記憶手段に記憶された文章からカタカナ列を抽出するカ
    タカナ列抽出手段と、該カタカナ列抽出手段によって抽
    出されたカタカナ列を記憶するカタカナ列記憶手段と、
    該カタカナ列記憶手段に記憶されたカタカナ列に対して
    特定のカタカナあるいは部分カタカナ列を削除または置
    換することによって変形を加えるカタカナ列変形手段と
    、該カタカナ列変形手段によって変形された結果を前記
    カタカナ列記憶手段に記憶されたカタカナ列と対応付け
    て記憶する変形結果記憶手段と、該変形結果記憶手段に
    記憶された変形結果を比較して変形結果の一致するカタ
    カナ列の一群を検出する変形結果比較手段と、該変形結
    果比較手段によって検出されたカタカナ列の一群につい
    て前記カタカナ列記憶手段に記憶されたカタカナ列を比
    較することによって、変形結果は一致するが変形前のカ
    タカナ列は異なるカタカナ列の一群を検出するカタカナ
    列比較手段と、前記カタカナ列変形手段による変形結果
    と該変形結果に対する正規のカタカナ表記とを予め対応
    付けて記憶した書換方法記憶手段と、前記カタカナ列比
    較手段によって検出されたカタカナ列の一群に対して前
    記書換方法記憶手段に記憶された正規のカタカナ表記に
    書き換えるゆれ部分書換手段とを備えたことを特徴とす
    る表記のゆれ統一方式。
JP61135319A 1986-06-10 1986-06-10 表記のゆれ統一方式 Granted JPS62290968A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61135319A JPS62290968A (ja) 1986-06-10 1986-06-10 表記のゆれ統一方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61135319A JPS62290968A (ja) 1986-06-10 1986-06-10 表記のゆれ統一方式

Publications (2)

Publication Number Publication Date
JPS62290968A true JPS62290968A (ja) 1987-12-17
JPH0544701B2 JPH0544701B2 (ja) 1993-07-07

Family

ID=15148967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61135319A Granted JPS62290968A (ja) 1986-06-10 1986-06-10 表記のゆれ統一方式

Country Status (1)

Country Link
JP (1) JPS62290968A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0267684A (ja) * 1988-09-02 1990-03-07 Hitachi Ltd 校正支援方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0267684A (ja) * 1988-09-02 1990-03-07 Hitachi Ltd 校正支援方法

Also Published As

Publication number Publication date
JPH0544701B2 (ja) 1993-07-07

Similar Documents

Publication Publication Date Title
JPS62290967A (ja) 表記のゆれ統一方式
JPS62290968A (ja) 表記のゆれ統一方式
JPS62290965A (ja) 表記のゆれ検出方式
JP2792147B2 (ja) 文字処理方法およびその装置
JP2621999B2 (ja) 文書処理装置
JPS628259A (ja) かな漢字変換方式
KR102231336B1 (ko) 유사 문자열 고속 탐색 시스템 및 그 방법
JP3187671B2 (ja) 電子辞書表示装置
JPH01307865A (ja) 文字列検索方式
JP2833650B2 (ja) 文書処理装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JP2713942B2 (ja) かな漢字変換装置
JPS62263570A (ja) 文書作成装置
JP3184035B2 (ja) 単文節カナ漢字変換入力方式
JPH0351959A (ja) 電子辞書
JPS6257055A (ja) 日本語ワ−ド・プロセツサ
JPH032963A (ja) 文書処理装置
JPS63184864A (ja) 文章作成装置
JPS6380361A (ja) 言語情報処理装置
JPH0721176A (ja) 文字訂正方法および文字訂正装置
JPH0460754A (ja) 仮名漢字変換方法
JPH0335349A (ja) 用例表示機能付き文書処理装置
JPH02255939A (ja) カタカナ表記の揺れ統一方式
JPH07325844A (ja) 電子化辞書検索装置
JPH06223055A (ja) 文章入力装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term