JPS60258678A

JPS60258678A - 単語変化形生成装置

Info

Publication number: JPS60258678A
Application number: JP59107321A
Authority: JP
Inventors: Jun Ibuki; 潤伊吹
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1984-05-27
Filing date: 1984-05-27
Publication date: 1985-12-20
Also published as: JPH0344342B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（１）発明の技術分野本発明は変化する単語について、その変化形を簡易・有
効に辞書登録し、単梧変化形を早く得ることのできる単
語変化形生成装置に関する。

（２）従来技術と問題点複数の国語間で機械的に翻訳を行うような場合、中絶に
機械的に動作させるため、単語について総て単語辞書を
使用することが必要である。そのとき使用する単語辞書
としては、例えば動詞であるとその現在形を全部書込み
、次に過去形を得るための一般的な規則例えばｒ’ｅｄ
Ｊを付加することの規則に従ったｒｅｄＪの語句を別の
場所に格納して置く。そして成る単語の過去形を文字列
の何処に入れよというような中央処理装置からの指令に
応じ、単語の現在形を読出し、次に過去形を得る語句の
格納されている所からｒｅｄＪを読出し規則的に組合せ
る。そのため単語として英語の［ｐｉｃｎｉｃＪ　（ピ
クニックに行く）の動詞についてはＩ’ｐｉｃｎｉｃｋ
ｅｄＪとする必要があるのに、弔純にｒｅｄＪを付加す
るから誤りとなる。この誤りをなくすためには、辞書に
現在形・過去形・過去分詞の３種類を全部の動詞につい
て格納しておく必要がある。従って動詞以外に名詞の単
数・複数形容詞の原級・比較級・最上級について総て格納することは辞書の容量が忽ち不足する
ことになる。

若し英語・独語・仏語などについてそれらを対応付ける
ときは、極めて膨大な記憶容量を必要として、動作時間
も遅くなり勝ちであった。

（３）発明の目的本発明の目的は前述の欠点を改善し、標準梧を格納する
程度の小容量の辞書と、変化パターンを解析する装置を
使用して補足的情報を４８ることにより、・単語変化形
を自動的に且つ早急に得ることのできる装置を提供する
ことにある。

（４）発明の構成前述の目的を達成するための本発明の構成は、単語文字
列とその品詞とが人力され、複数種類設けた母音テーブ
ルを使用して前記＠′３語文字列を音節に分解する音節
分解装置と、該音節分解装置出力が入力され解析ルール
格納テーブルを使用し該音節の変化パターンを解析する
変化バクーン解析装置と、該解析装置により音節につい
て所定の変化形をめた信号を変化形発生装置に入力し、
当該単語の変化形を得ることである。

（５）発明の実施例第１図は本発明の実施例の構成を示すブロック図である
。第１図において、■は人力信号端子で、単語を形成す
る入力文字列及び補助情報としての品詞種別を人力する
もの、２は音節分解装置で、人力単語を音節毎に区切る
もので、３は母音テーブル、４は変化パターン解析装置
、５は解析ルール格納テーブル、６は変化形発生装置、
７は所定の単語変化形を出力する端子を示している。

第１図についてその原理的な動作をまず説明する。

母音テーブル３は国語の各々について独自のものを準備
し、音節分解装置２において入力単語を調べる。そして
［母音と直前の子音との組合せ」の形に入力文字列を分
解する。解析ルール格納テーブル５は国語の各々につい
て独自のものを準備し変化パターン解析装置４において
該テーブル５を使用しながら音節分解装置２の出力を解
析する。

その結果により変化形発生装置６において単語の変化形
を発止する。

次に入力信号端子に入力する単語が英語の場合について
詳細に説明する。子音より母音の方の数が少ないため、
母音についてまず特定化する。そのための母音テーブル
３の例を示すと、母音学長＝４　ｏｕｇｈ＋　ｏｗｅｒ、　Ｖｅａｒ＋　
など母音学長＝３　ｙａｗ、ｉｇｈ、ｅａｕ、ｅａｒ、
ｅｉｒ、ｏａｒ。

ｏｉｒ、ｏｕｒ　など母音学長＝　２ａｆ、ａｒ＋ａｕ＋ａｗ＋ａｙ。

ｅａ、　ｅｅ、　ｅｉ、　ｅｏ、　ｅｒ、　ｅｕ、　ｅ
ｙ。

Ｏａ　＋　ＯＯＩＯｒ＋　Ｏｕ　＋　Ｏ’４＋　ＯＶ　
＋ｕｅ、ｕｒ。

ｔｒ＋　Ｉｅ＋　Ｏｅ＋　ｙｅ母母音字−１８＋ｅ＋ｌ＋ｏ＋Ｉ＋＋３’　となる＠こ
のテーブルは国語別に英語用・ｆム語用・独語用−のよ
うに複数種類設けておく。

音節分解装置２における動作を第２図のフローチャート
により説明する。第２図において入力文字列ｊｐ＋ｒえ
ば“ＨＯＴ”を取込み、ステップ■において最初に出て
くる母音を探す。このとき２つ以Ｈの母音・母音列があ
ったときはその長い方をとる。

ＨＯＴのときｒＯＪが最初に出てくる母音である。

次にステップ■において当該母音の前に別の文字がある
かどうかを探し、あればまとめて子音部とする。ＨＯＴ
のときはＨが子音部となる。

ステップ■において子音部と母音とをまとめて一つの音
節とする。ＨＯＴのときＨＯが第１音節である。

ステップ■において残りの文字列中に母音があるかどう
かを判断する。あるときはステップ■がら繰り返して行
く。ないときはステップ■に行き、残りの文字列をまと
めて子音部とし、且つ母音のない第２音節とする。ＨＯ
ＴのときはＴが第２音節である。即ち音節要素を分析し
た結果、第１音節はＨＯで、子音Ｃ＝Ｈ，母音ｖ＝。

子音長Ｃ＃＝１．母音長Ｖ＃＝１第２音節はＴでＣ＝Ｔ、　Ｖ＝なしＣ＃＝１’　Ｖ＃＝０となる。

次に解析ルールを格納するテーブルには「条件部」とし
てルールの適用条件を示す部分と、該条件部が満足され
た場合の処理としζ移って行く「生成部」の部分があり
、それらの書式を定めておく。即ぢ条件部の（）は１つの音節を＊−（）の場合は１つ以１−不定個の音節を表す。そし
て（）内の記号は各音節に対する条件を示し、Ｖ＃は母音長を、Ｃ＃は子音長を、Ｖ−は母音の綴りを、Ｃ−は子音の綴りを表す。

（）の次に十の付く記号は全体に対する条件を表し＋ＰＯ３＝ＡＤＪは例えばｐｏｓ　＜・品詞）が形容詞であることを示す
。したがって条件部が（Ｖ＃＝１）（Ｃ＝Ｔ、Ｖ＃＝０）→ＰＯ５＝ＡＤＪと表されているときは、前述のＴＩ　ＯＴの場合であっ
て第１音節は母音長が１、第２音節は子音がＴ、母音長が０を示し、且つ全体が「
形容詞Ｊの単語であることを示している。この条件部が
満足されているとき、−で生成部を記述して行く。生成
部における（）（）は条件部における対応する音節を２
つ持ってく、ることを示し、条件部の数が多いときは前
位２個を持ってくる。

（）の次に十の後に示す記号は全体に付加する属性対即
ち形容詞でいえば比較級と最上級の内容を書く。前述の
例のような条件部の内容としてＣＯＭＰ　（比較級）は
−Ｔ、　Ｅ、　Ｒ１５ＵＰ　’（最上級）は−、Ｔ、Ｂ
、Ｓ　Ｔ、とい・う内容で声る。更に条件部が名詞、動
詞である場合を考え、属性対にはＳ（複数形）−一５ＩＮ（、（進行形）＝−ＴｉＮ２＋；Ａｓｔ（過去形）＝−ＴＥＤＰＰ（過去完了形）　−−ＴＥＤをも格納しておく。

変化パターン解析装置においては、音節分解装置２の出
力により、第１音節・第２音節の値と出力すべき変化形
指定が入力されたとき、解析ルール格納テーブル５を起
動し、前記条件に従う出力値を変化形発生装置６に印加
する。例えばＨＯＴが原形で、品詞は形容詞であると入
力され、ＳＵＰ最上級の変化形をめるよう要求されたと
きに、５ＵＰ＝ＴＥＳＴを変化形発生装Ｎ６に出力するう変化形発生装置６の処理は出力すべき変化形指定と同し
属性名を持つ属性値を使用する。即ちＨＯＴのときＳ　
Ｕ　Ｐ　＝　−Ｔ　Ｅ　Ｓ　Ｔである。

そして属性値を見て「−」を含むときは、原文字列の後
に「−」を除いた属性値を付加して変化形とする。即ち
ＨＯＴのときは−ＴＩ’：ＳＴであるから　ＨＯＴＴＥ
ＳＴとする。

若し属性値がｒ−Ｊを含まないときは文字列の前に、属
性値を空白を挟んで付加する。この場合はｒＢＥＡＵＴ
Ｉ　ＦＵＬＪを１列にして説明する。

形容詞ｒＢＥＡＵＴＩ　ＦＵＬＪのＣＯＭＰ　（比較級
）をめることとする。

イ、音節要素について単語の最初に出てくる母音は、前記テーブル３により最
も長いものを探すと、ｒＥＡＵＪであるから、第１音節
はＢ−ＥＡＵであり、前述のように表現すると、Ｃ＝Ｂ　？ＥＡｕＣ＃＝Ｉ　Ｖ＃＝３第２音節はＴＩであり、Ｃ＝Ｔ　Ｖ＝ＩＣ＃＝ｌ　Ｖ＃−１第３音節はＦＵであり、Ｃ＝Ｆ　Ｖ＝ＵＣ＃＝ｌ　Ｖ＃＝１第４音節はしてあり、Ｃ＝Ｌ　Ｖ＝なしＣ＃＝Ｉ　Ｖ＃＝０口１次に解析ルールの条件部について調べる（　）（）
＊−（）＋ＰＯ３＝ＡＤＪ入力文字列に対する補助情報の品詞がこの場合形容詞で
あったから、それを音節のグループの括弧の次に記述し
て全体的に不適当かどうか判断する。不適当でないとき
、その品詞に従うルール格納テーブルを起動する。

ハ、したがって生成部は音節３個以上のとき、形容詞の
比較級・最上級にはＭＯＲＥ、ＭＯ５Ｔを付加するとい
う文法上の規則のため、 −（）（＞　（）＋５ＵＰ＝’ＭＯ３ＴＣＯＭ　Ｐ　＝
　Ｍ’ＯＲＥとなる。

二、即ちＢＥＡＵＴ’１ＦＵＬのめる出力形の指定と同
じ属性名（比較級）をもつ属性値がこの場合ＭＯＲＢで
ある宏“ら−１炭化形発生装置６において　ＭＯＲＥ　
’　ＢＥＡＵＴＩＦＵＬとする。

次の例として、動詞　５ＴＵＤＹの過去形をめる場合を
説明する。

イ、第１音節はＳＴ　Ｕであり、Ｃ＝ＳＴ　Ｖ＝ＵＣ＃＝２　Ｖ＃＝１第２音節はＤＹであり、Ｃ＝Ｄ　Ｖ＝ＹＣ＃＝Ｉ　Ｖ＃＝１０、条件部は＊−（）（）＋ＰＯ３＝ＶＥＲＢ　（動詞）となる。こ
れは最終音節が母音Ｙのみで終わっているとき、それ以
前の音節は幾つあうても良いという英語における特殊ル
ールがあるため、「＊−」の印を付した音節記号（）を
書いている。

ハ、生成部は、 →（）　４−−−−− であって音節は唯１個で良い。そして−の個所は動Ｊ−
ｊのときは「不定形、三人称単数現在形、進行形、過去
形、過去分詞」が格納してあり、なお［最終音節の母音
がＹの１字であるとき変化形発生装置へ原入力文字を印
加するとき該母音Ｙを削除して行う」というルールも格
納しである。そして前述の音節条件に従う過去形は−Ｉ
ＥＤ、過去分詞は−ＩＥＤである。

ニ、したがって入力文字Ｓ　Ｔ　Ｕ　Ｉ）　Ｙに対する
過去形は−ＩＥＤとめられるので、Ｙを削除した５ＴＵ
Ｄに付加して５ＴＵＩ）ｒ、ＥＤ　となる。

したがって機械的処理ができるようになるから、音節テ
ーブルと解析テーブルとの複数種類を、翻訳システムの
末端の方に準備しておけば、自動化した装置が得られ、
且つ未登録の言葉に対しても直ぐ適用できる。

（６）発明の効果このようにして本発明によると、品詞の変化形をめると
き、文法上の規則について、音節表対応付けてテーブル
に格納しておくから、所定の弔語について音節を調べた
とき、付加すべき情報を正確に早く得ることができる。

したがって各中給について変化形を総て格納しておく必
要がなく、辞書として使用するテーブルの容駐が少なく
てすむ。また内容の更新などの手間が可成り省略できる
。

【図面の簡単な説明】

第１図は本発明の実施例の構成を示すブロック図、第２
図は第１図の音節分解装置の動作を説明するフローチ中
−１・である。１−人力信号端子２−音節分解装置３−＃音テーブル４−変化パターン解析装置５−・−解析ルール格納テーブル６−・変化形発生装置７−・出力端子特許出願人　冨士通株式会社代理人　弁理士　鈴木栄祐第１図第２図

Claims

【特許請求の範囲】

単語文字列とその品詞とが人力され、複数種類設けた母
音テーブルを使用して前記単語文字列を音節に分解する
音節分解装置と、該音節分解装置出力が入力され解析ル
ール格納テーブルを使用し前記音節の変化バクーンを解
析する変化バクーン解析装置と、該解析装置により音節
について所定の変化形をめた信号を変化形発生装置に人
力し、当該単語の変化形を得ることを特徴とする単語変
化形生成装置。