JPS60258678A - 単語変化形生成装置 - Google Patents
単語変化形生成装置Info
- Publication number
- JPS60258678A JPS60258678A JP59107321A JP10732184A JPS60258678A JP S60258678 A JPS60258678 A JP S60258678A JP 59107321 A JP59107321 A JP 59107321A JP 10732184 A JP10732184 A JP 10732184A JP S60258678 A JPS60258678 A JP S60258678A
- Authority
- JP
- Japan
- Prior art keywords
- syllable
- word
- vowel
- inflection
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(1)発明の技術分野
本発明は変化する単語について、その変化形を簡易・有
効に辞書登録し、単梧変化形を早く得ることのできる単
語変化形生成装置に関する。
効に辞書登録し、単梧変化形を早く得ることのできる単
語変化形生成装置に関する。
(2)従来技術と問題点
複数の国語間で機械的に翻訳を行うような場合、中絶に
機械的に動作させるため、単語について総て単語辞書を
使用することが必要である。そのとき使用する単語辞書
としては、例えば動詞であるとその現在形を全部書込み
、次に過去形を得るための一般的な規則例えばr’ed
Jを付加することの規則に従ったredJの語句を別の
場所に格納して置く。そして成る単語の過去形を文字列
の何処に入れよというような中央処理装置からの指令に
応じ、単語の現在形を読出し、次に過去形を得る語句の
格納されている所からredJを読出し規則的に組合せ
る。そのため単語として英語の[picnicJ (ピ
クニックに行く)の動詞についてはI’picnick
edJとする必要があるのに、弔純にredJを付加す
るから誤りとなる。この誤りをなくすためには、辞書に
現在形・過去形・過去分詞の3種類を全部の動詞につい
て格納しておく必要がある。従って動詞以外に名詞の単
数・複数 形容詞の原級・比較級・最上級 について総て格納することは辞書の容量が忽ち不足する
ことになる。
機械的に動作させるため、単語について総て単語辞書を
使用することが必要である。そのとき使用する単語辞書
としては、例えば動詞であるとその現在形を全部書込み
、次に過去形を得るための一般的な規則例えばr’ed
Jを付加することの規則に従ったredJの語句を別の
場所に格納して置く。そして成る単語の過去形を文字列
の何処に入れよというような中央処理装置からの指令に
応じ、単語の現在形を読出し、次に過去形を得る語句の
格納されている所からredJを読出し規則的に組合せ
る。そのため単語として英語の[picnicJ (ピ
クニックに行く)の動詞についてはI’picnick
edJとする必要があるのに、弔純にredJを付加す
るから誤りとなる。この誤りをなくすためには、辞書に
現在形・過去形・過去分詞の3種類を全部の動詞につい
て格納しておく必要がある。従って動詞以外に名詞の単
数・複数 形容詞の原級・比較級・最上級 について総て格納することは辞書の容量が忽ち不足する
ことになる。
若し英語・独語・仏語などについてそれらを対応付ける
ときは、極めて膨大な記憶容量を必要として、動作時間
も遅くなり勝ちであった。
ときは、極めて膨大な記憶容量を必要として、動作時間
も遅くなり勝ちであった。
(3)発明の目的
本発明の目的は前述の欠点を改善し、標準梧を格納する
程度の小容量の辞書と、変化パターンを解析する装置を
使用して補足的情報を48ることにより、・単語変化形
を自動的に且つ早急に得ることのできる装置を提供する
ことにある。
程度の小容量の辞書と、変化パターンを解析する装置を
使用して補足的情報を48ることにより、・単語変化形
を自動的に且つ早急に得ることのできる装置を提供する
ことにある。
(4)発明の構成
前述の目的を達成するための本発明の構成は、単語文字
列とその品詞とが人力され、複数種類設けた母音テーブ
ルを使用して前記@′3語文字列を音節に分解する音節
分解装置と、該音節分解装置出力が入力され解析ルール
格納テーブルを使用し該音節の変化パターンを解析する
変化バクーン解析装置と、該解析装置により音節につい
て所定の変化形をめた信号を変化形発生装置に入力し、
当該単語の変化形を得ることである。
列とその品詞とが人力され、複数種類設けた母音テーブ
ルを使用して前記@′3語文字列を音節に分解する音節
分解装置と、該音節分解装置出力が入力され解析ルール
格納テーブルを使用し該音節の変化パターンを解析する
変化バクーン解析装置と、該解析装置により音節につい
て所定の変化形をめた信号を変化形発生装置に入力し、
当該単語の変化形を得ることである。
(5)発明の実施例
第1図は本発明の実施例の構成を示すブロック図である
。第1図において、■は人力信号端子で、単語を形成す
る入力文字列及び補助情報としての品詞種別を人力する
もの、2は音節分解装置で、人力単語を音節毎に区切る
もので、3は母音テーブル、4は変化パターン解析装置
、5は解析ルール格納テーブル、6は変化形発生装置、
7は所定の単語変化形を出力する端子を示している。
。第1図において、■は人力信号端子で、単語を形成す
る入力文字列及び補助情報としての品詞種別を人力する
もの、2は音節分解装置で、人力単語を音節毎に区切る
もので、3は母音テーブル、4は変化パターン解析装置
、5は解析ルール格納テーブル、6は変化形発生装置、
7は所定の単語変化形を出力する端子を示している。
第1図についてその原理的な動作をまず説明する。
母音テーブル3は国語の各々について独自のものを準備
し、音節分解装置2において入力単語を調べる。そして
[母音と直前の子音との組合せ」の形に入力文字列を分
解する。解析ルール格納テーブル5は国語の各々につい
て独自のものを準備し変化パターン解析装置4において
該テーブル5を使用しながら音節分解装置2の出力を解
析する。
し、音節分解装置2において入力単語を調べる。そして
[母音と直前の子音との組合せ」の形に入力文字列を分
解する。解析ルール格納テーブル5は国語の各々につい
て独自のものを準備し変化パターン解析装置4において
該テーブル5を使用しながら音節分解装置2の出力を解
析する。
その結果により変化形発生装置6において単語の変化形
を発止する。
を発止する。
次に入力信号端子に入力する単語が英語の場合について
詳細に説明する。子音より母音の方の数が少ないため、
母音についてまず特定化する。そのための母音テーブル
3の例を示すと、 母音学長=4 ough+ ower、 Vear+
など母音学長=3 yaw、igh、eau、ear、
eir、oar。
詳細に説明する。子音より母音の方の数が少ないため、
母音についてまず特定化する。そのための母音テーブル
3の例を示すと、 母音学長=4 ough+ ower、 Vear+
など母音学長=3 yaw、igh、eau、ear、
eir、oar。
oir、our など
母音学長= 2af、ar+au+aw+ay。
ea、 ee、 ei、 eo、 er、 eu、 e
y。
y。
Oa + OOIOr+ Ou + O’4+ OV
+ue、ur。
+ue、ur。
tr+ Ie+ Oe+ ye
母母音字−18+e+l+o+I++3’ となる@こ
のテーブルは国語別に英語用・fム語用・独語用−のよ
うに複数種類設けておく。
のテーブルは国語別に英語用・fム語用・独語用−のよ
うに複数種類設けておく。
音節分解装置2における動作を第2図のフローチャート
により説明する。第2図において入力文字列jp+rえ
ば“HOT”を取込み、ステップ■において最初に出て
くる母音を探す。このとき2つ以Hの母音・母音列があ
ったときはその長い方をとる。
により説明する。第2図において入力文字列jp+rえ
ば“HOT”を取込み、ステップ■において最初に出て
くる母音を探す。このとき2つ以Hの母音・母音列があ
ったときはその長い方をとる。
HOTのときrOJが最初に出てくる母音である。
次にステップ■において当該母音の前に別の文字がある
かどうかを探し、あればまとめて子音部とする。HOT
のときはHが子音部となる。
かどうかを探し、あればまとめて子音部とする。HOT
のときはHが子音部となる。
ステップ■において子音部と母音とをまとめて一つの音
節とする。HOTのときHOが第1音節である。
節とする。HOTのときHOが第1音節である。
ステップ■において残りの文字列中に母音があるかどう
かを判断する。あるときはステップ■がら繰り返して行
く。ないときはステップ■に行き、残りの文字列をまと
めて子音部とし、且つ母音のない第2音節とする。HO
TのときはTが第2音節である。即ち音節要素を分析し
た結果、第1音節はHOで、 子音C=H,母音v=。
かを判断する。あるときはステップ■がら繰り返して行
く。ないときはステップ■に行き、残りの文字列をまと
めて子音部とし、且つ母音のない第2音節とする。HO
TのときはTが第2音節である。即ち音節要素を分析し
た結果、第1音節はHOで、 子音C=H,母音v=。
子音長C#=1.母音長V#=1
第2音節はTで
C=T、 V=なし
C#=1’ V#=0
となる。
次に解析ルールを格納するテーブルには「条件部」とし
てルールの適用条件を示す部分と、該条件部が満足され
た場合の処理としζ移って行く「生成部」の部分があり
、それらの書式を定めておく。即ぢ 条件部の()は1つの音節を *−()の場合は1つ以1−不定個の音節を表す。そし
て()内の記号は各音節に対する条件を示し、 V#は母音長を、C#は子音長を、 V−は母音の綴りを、C−は子音の綴りを表す。
てルールの適用条件を示す部分と、該条件部が満足され
た場合の処理としζ移って行く「生成部」の部分があり
、それらの書式を定めておく。即ぢ 条件部の()は1つの音節を *−()の場合は1つ以1−不定個の音節を表す。そし
て()内の記号は各音節に対する条件を示し、 V#は母音長を、C#は子音長を、 V−は母音の綴りを、C−は子音の綴りを表す。
()の次に十の付く記号は全体に対する条件を表し
+PO3=ADJ
は例えばpos <・品詞)が形容詞であることを示す
。したがって条件部が (V#=1)(C=T、V#=0)→PO5=ADJ と表されているときは、前述のTI OTの場合であっ
て 第1音節は母音長が1、 第2音節は子音がT、母音長が0を示し、且つ全体が「
形容詞Jの単語であることを示している。この条件部が
満足されているとき、−で生成部を記述して行く。生成
部における()()は条件部における対応する音節を2
つ持ってく、ることを示し、条件部の数が多いときは前
位2個を持ってくる。
。したがって条件部が (V#=1)(C=T、V#=0)→PO5=ADJ と表されているときは、前述のTI OTの場合であっ
て 第1音節は母音長が1、 第2音節は子音がT、母音長が0を示し、且つ全体が「
形容詞Jの単語であることを示している。この条件部が
満足されているとき、−で生成部を記述して行く。生成
部における()()は条件部における対応する音節を2
つ持ってく、ることを示し、条件部の数が多いときは前
位2個を持ってくる。
()の次に十の後に示す記号は全体に付加する属性対即
ち形容詞でいえば比較級と最上級の内容を書く。前述の
例のような条件部の内容としてCOMP (比較級)は
−T、 E、 R15UP ’(最上級)は−、T、B
、S T、とい・う内容で声る。更に条件部が名詞、動
詞である場合を考え、属性対には S(複数形)−一5 IN(、(進行形)=−TiN2 +;Ast(過去形)=−TED PP(過去完了形) −−TED をも格納しておく。
ち形容詞でいえば比較級と最上級の内容を書く。前述の
例のような条件部の内容としてCOMP (比較級)は
−T、 E、 R15UP ’(最上級)は−、T、B
、S T、とい・う内容で声る。更に条件部が名詞、動
詞である場合を考え、属性対には S(複数形)−一5 IN(、(進行形)=−TiN2 +;Ast(過去形)=−TED PP(過去完了形) −−TED をも格納しておく。
変化パターン解析装置においては、音節分解装置2の出
力により、第1音節・第2音節の値と出力すべき変化形
指定が入力されたとき、解析ルール格納テーブル5を起
動し、前記条件に従う出力値を変化形発生装置6に印加
する。例えばHOTが原形で、品詞は形容詞であると入
力され、SUP最上級の変化形をめるよう要求されたと
きに、5UP=TEST を変化形発生装N6に出力するう 変化形発生装置6の処理は出力すべき変化形指定と同し
属性名を持つ属性値を使用する。即ちHOTのときS
U P = −T E S Tである。
力により、第1音節・第2音節の値と出力すべき変化形
指定が入力されたとき、解析ルール格納テーブル5を起
動し、前記条件に従う出力値を変化形発生装置6に印加
する。例えばHOTが原形で、品詞は形容詞であると入
力され、SUP最上級の変化形をめるよう要求されたと
きに、5UP=TEST を変化形発生装N6に出力するう 変化形発生装置6の処理は出力すべき変化形指定と同し
属性名を持つ属性値を使用する。即ちHOTのときS
U P = −T E S Tである。
そして属性値を見て「−」を含むときは、原文字列の後
に「−」を除いた属性値を付加して変化形とする。即ち
HOTのときは−TI’:STであるから HOTTE
ST とする。
に「−」を除いた属性値を付加して変化形とする。即ち
HOTのときは−TI’:STであるから HOTTE
ST とする。
若し属性値がr−Jを含まないときは文字列の前に、属
性値を空白を挟んで付加する。この場合はrBEAUT
I FULJを1列にして説明する。
性値を空白を挟んで付加する。この場合はrBEAUT
I FULJを1列にして説明する。
形容詞rBEAUTI FULJのCOMP (比較級
)をめることとする。
)をめることとする。
イ、音節要素について
単語の最初に出てくる母音は、前記テーブル3により最
も長いものを探すと、rEAUJであるから、第1音節
はB−EAUであり、前述のように表現すると、 C=B ?EAu C#=I V#=3 第2音節はTIであり、 C=T V=I C#=l V#−1 第3音節はFUであり、 C=F V=U C#=l V#=1 第4音節はしてあり、 C=L V=なし C#=I V#=0 口1次に解析ルールの条件部について調べる( )()
*−()+PO3=ADJ 入力文字列に対する補助情報の品詞がこの場合形容詞で
あったから、それを音節のグループの括弧の次に記述し
て全体的に不適当かどうか判断する。不適当でないとき
、その品詞に従うルール格納テーブルを起動する。
も長いものを探すと、rEAUJであるから、第1音節
はB−EAUであり、前述のように表現すると、 C=B ?EAu C#=I V#=3 第2音節はTIであり、 C=T V=I C#=l V#−1 第3音節はFUであり、 C=F V=U C#=l V#=1 第4音節はしてあり、 C=L V=なし C#=I V#=0 口1次に解析ルールの条件部について調べる( )()
*−()+PO3=ADJ 入力文字列に対する補助情報の品詞がこの場合形容詞で
あったから、それを音節のグループの括弧の次に記述し
て全体的に不適当かどうか判断する。不適当でないとき
、その品詞に従うルール格納テーブルを起動する。
ハ、したがって生成部は音節3個以上のとき、形容詞の
比較級・最上級にはMORE、MO5Tを付加するとい
う文法上の規則のため、 −()(> ()+5UP=’MO3TCOM P =
M’ORE となる。
比較級・最上級にはMORE、MO5Tを付加するとい
う文法上の規則のため、 −()(> ()+5UP=’MO3TCOM P =
M’ORE となる。
二、即ちBEAUT’1FULのめる出力形の指定と同
じ属性名(比較級)をもつ属性値がこの場合MORBで
ある宏“ら−1炭化形発生装置6において MORE
’ BEAUTIFULとする。
じ属性名(比較級)をもつ属性値がこの場合MORBで
ある宏“ら−1炭化形発生装置6において MORE
’ BEAUTIFULとする。
次の例として、動詞 5TUDYの過去形をめる場合を
説明する。
説明する。
イ、第1音節はST Uであり、
C=ST V=U
C#=2 V#=1
第2音節はDYであり、
C=D V=Y
C#=I V#=1
0、条件部は
*−()()+PO3=VERB (動詞)となる。こ
れは最終音節が母音Yのみで終わっているとき、それ以
前の音節は幾つあうても良いという英語における特殊ル
ールがあるため、「*−」の印を付した音節記号()を
書いている。
れは最終音節が母音Yのみで終わっているとき、それ以
前の音節は幾つあうても良いという英語における特殊ル
ールがあるため、「*−」の印を付した音節記号()を
書いている。
ハ、生成部は、
→() 4−−−−−
であって音節は唯1個で良い。そして−の個所は動J−
jのときは「不定形、三人称単数現在形、進行形、過去
形、過去分詞」が格納してあり、なお[最終音節の母音
がYの1字であるとき変化形発生装置へ原入力文字を印
加するとき該母音Yを削除して行う」というルールも格
納しである。そして前述の音節条件に従う過去形は−I
ED、過去分詞は−IEDである。
jのときは「不定形、三人称単数現在形、進行形、過去
形、過去分詞」が格納してあり、なお[最終音節の母音
がYの1字であるとき変化形発生装置へ原入力文字を印
加するとき該母音Yを削除して行う」というルールも格
納しである。そして前述の音節条件に従う過去形は−I
ED、過去分詞は−IEDである。
ニ、したがって入力文字S T U I) Yに対する
過去形は−IEDとめられるので、Yを削除した5TU
Dに付加して 5TUI)r、ED となる。
過去形は−IEDとめられるので、Yを削除した5TU
Dに付加して 5TUI)r、ED となる。
したがって機械的処理ができるようになるから、音節テ
ーブルと解析テーブルとの複数種類を、翻訳システムの
末端の方に準備しておけば、自動化した装置が得られ、
且つ未登録の言葉に対しても直ぐ適用できる。
ーブルと解析テーブルとの複数種類を、翻訳システムの
末端の方に準備しておけば、自動化した装置が得られ、
且つ未登録の言葉に対しても直ぐ適用できる。
(6)発明の効果
このようにして本発明によると、品詞の変化形をめると
き、文法上の規則について、音節表対応付けてテーブル
に格納しておくから、所定の弔語について音節を調べた
とき、付加すべき情報を正確に早く得ることができる。
き、文法上の規則について、音節表対応付けてテーブル
に格納しておくから、所定の弔語について音節を調べた
とき、付加すべき情報を正確に早く得ることができる。
したがって各中給について変化形を総て格納しておく必
要がなく、辞書として使用するテーブルの容駐が少なく
てすむ。また内容の更新などの手間が可成り省略できる
。
要がなく、辞書として使用するテーブルの容駐が少なく
てすむ。また内容の更新などの手間が可成り省略できる
。
第1図は本発明の実施例の構成を示すブロック図、第2
図は第1図の音節分解装置の動作を説明するフローチ中
−1・である。 1−人力信号端子 2−音節分解装置 3−#音テーブル 4−変化パターン解析装置 5−・−解析ルール格納テーブル 6−・変化形発生装置 7−・出力端子 特許出願人 冨士通株式会社 代理人 弁理士 鈴木栄祐 第1図 第2図
図は第1図の音節分解装置の動作を説明するフローチ中
−1・である。 1−人力信号端子 2−音節分解装置 3−#音テーブル 4−変化パターン解析装置 5−・−解析ルール格納テーブル 6−・変化形発生装置 7−・出力端子 特許出願人 冨士通株式会社 代理人 弁理士 鈴木栄祐 第1図 第2図
Claims (1)
- 単語文字列とその品詞とが人力され、複数種類設けた母
音テーブルを使用して前記単語文字列を音節に分解する
音節分解装置と、該音節分解装置出力が入力され解析ル
ール格納テーブルを使用し前記音節の変化バクーンを解
析する変化バクーン解析装置と、該解析装置により音節
について所定の変化形をめた信号を変化形発生装置に人
力し、当該単語の変化形を得ることを特徴とする単語変
化形生成装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59107321A JPS60258678A (ja) | 1984-05-27 | 1984-05-27 | 単語変化形生成装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59107321A JPS60258678A (ja) | 1984-05-27 | 1984-05-27 | 単語変化形生成装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS60258678A true JPS60258678A (ja) | 1985-12-20 |
| JPH0344342B2 JPH0344342B2 (ja) | 1991-07-05 |
Family
ID=14456097
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59107321A Granted JPS60258678A (ja) | 1984-05-27 | 1984-05-27 | 単語変化形生成装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS60258678A (ja) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS57111669A (en) * | 1980-12-27 | 1982-07-12 | Casio Comput Co Ltd | Output system for conjugation form of word |
-
1984
- 1984-05-27 JP JP59107321A patent/JPS60258678A/ja active Granted
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS57111669A (en) * | 1980-12-27 | 1982-07-12 | Casio Comput Co Ltd | Output system for conjugation form of word |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0344342B2 (ja) | 1991-07-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2765665B2 (ja) | タイポグラフィカル情報付き文書の翻訳装置 | |
| US20020152246A1 (en) | Method for predicting the readings of japanese ideographs | |
| JPS6318458A (ja) | 感情情報抽出装置 | |
| JPS5892063A (ja) | イデイオム処理方式 | |
| JPS60258678A (ja) | 単語変化形生成装置 | |
| Mustafa | Phonology of Acehnese reduplication: Applying optimality theory | |
| Sebastian et al. | Machine learning approach to suffix separation on a sandhi rule annotated malayalam data set | |
| Wahlgren | Byzantine Chronicles and Metaphrasis | |
| Azar et al. | A thesaurus for biblical hebrew | |
| KR100371135B1 (ko) | 용언 굴절사전을 이용한 용언 형태소 분석장치 및 방법 | |
| JPH0552543B2 (ja) | ||
| JPS61272873A (ja) | テキストの補整表記方式 | |
| Waxman et al. | A thesaurus for Biblical Hebrew | |
| JPH11161651A (ja) | 発音記号生成装置 | |
| JPH07160685A (ja) | 文章読み上げ装置 | |
| Nojoumian | Towards the development of an automatic diacritizer for the Persian orthography based on the Xerox finite state transducer | |
| JPH07295985A (ja) | 機械翻訳装置 | |
| Killean | Written Arabic: An Approach to the Basic Structures | |
| JPH01219946A (ja) | 文書作成支援装置 | |
| JPS62293472A (ja) | 音声翻訳装置 | |
| JPH0512753B2 (ja) | ||
| JPS62247451A (ja) | 日本語処理装置の単語辞書構成法 | |
| JPH10124501A (ja) | 日本語読み付与方法及び装置及び日本語読み付与プログラム媒体 | |
| JPH07249039A (ja) | 構文解析装置 | |
| JPH04326160A (ja) | 形態素解析装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |