JPS60258678A - 単語変化形生成装置 - Google Patents

単語変化形生成装置

Info

Publication number
JPS60258678A
JPS60258678A JP59107321A JP10732184A JPS60258678A JP S60258678 A JPS60258678 A JP S60258678A JP 59107321 A JP59107321 A JP 59107321A JP 10732184 A JP10732184 A JP 10732184A JP S60258678 A JPS60258678 A JP S60258678A
Authority
JP
Japan
Prior art keywords
syllable
word
vowel
inflection
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59107321A
Other languages
English (en)
Other versions
JPH0344342B2 (ja
Inventor
Jun Ibuki
潤 伊吹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59107321A priority Critical patent/JPS60258678A/ja
Publication of JPS60258678A publication Critical patent/JPS60258678A/ja
Publication of JPH0344342B2 publication Critical patent/JPH0344342B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)発明の技術分野 本発明は変化する単語について、その変化形を簡易・有
効に辞書登録し、単梧変化形を早く得ることのできる単
語変化形生成装置に関する。
(2)従来技術と問題点 複数の国語間で機械的に翻訳を行うような場合、中絶に
機械的に動作させるため、単語について総て単語辞書を
使用することが必要である。そのとき使用する単語辞書
としては、例えば動詞であるとその現在形を全部書込み
、次に過去形を得るための一般的な規則例えばr’ed
Jを付加することの規則に従ったredJの語句を別の
場所に格納して置く。そして成る単語の過去形を文字列
の何処に入れよというような中央処理装置からの指令に
応じ、単語の現在形を読出し、次に過去形を得る語句の
格納されている所からredJを読出し規則的に組合せ
る。そのため単語として英語の[picnicJ (ピ
クニックに行く)の動詞についてはI’picnick
edJとする必要があるのに、弔純にredJを付加す
るから誤りとなる。この誤りをなくすためには、辞書に
現在形・過去形・過去分詞の3種類を全部の動詞につい
て格納しておく必要がある。従って動詞以外に名詞の単
数・複数 形容詞の原級・比較級・最上級 について総て格納することは辞書の容量が忽ち不足する
ことになる。
若し英語・独語・仏語などについてそれらを対応付ける
ときは、極めて膨大な記憶容量を必要として、動作時間
も遅くなり勝ちであった。
(3)発明の目的 本発明の目的は前述の欠点を改善し、標準梧を格納する
程度の小容量の辞書と、変化パターンを解析する装置を
使用して補足的情報を48ることにより、・単語変化形
を自動的に且つ早急に得ることのできる装置を提供する
ことにある。
(4)発明の構成 前述の目的を達成するための本発明の構成は、単語文字
列とその品詞とが人力され、複数種類設けた母音テーブ
ルを使用して前記@′3語文字列を音節に分解する音節
分解装置と、該音節分解装置出力が入力され解析ルール
格納テーブルを使用し該音節の変化パターンを解析する
変化バクーン解析装置と、該解析装置により音節につい
て所定の変化形をめた信号を変化形発生装置に入力し、
当該単語の変化形を得ることである。
(5)発明の実施例 第1図は本発明の実施例の構成を示すブロック図である
。第1図において、■は人力信号端子で、単語を形成す
る入力文字列及び補助情報としての品詞種別を人力する
もの、2は音節分解装置で、人力単語を音節毎に区切る
もので、3は母音テーブル、4は変化パターン解析装置
、5は解析ルール格納テーブル、6は変化形発生装置、
7は所定の単語変化形を出力する端子を示している。
第1図についてその原理的な動作をまず説明する。
母音テーブル3は国語の各々について独自のものを準備
し、音節分解装置2において入力単語を調べる。そして
[母音と直前の子音との組合せ」の形に入力文字列を分
解する。解析ルール格納テーブル5は国語の各々につい
て独自のものを準備し変化パターン解析装置4において
該テーブル5を使用しながら音節分解装置2の出力を解
析する。
その結果により変化形発生装置6において単語の変化形
を発止する。
次に入力信号端子に入力する単語が英語の場合について
詳細に説明する。子音より母音の方の数が少ないため、
母音についてまず特定化する。そのための母音テーブル
3の例を示すと、 母音学長=4 ough+ ower、 Vear+ 
など母音学長=3 yaw、igh、eau、ear、
eir、oar。
oir、our など 母音学長= 2af、ar+au+aw+ay。
ea、 ee、 ei、 eo、 er、 eu、 e
y。
Oa + OOIOr+ Ou + O’4+ OV 
+ue、ur。
tr+ Ie+ Oe+ ye 母母音字−18+e+l+o+I++3’ となる@こ
のテーブルは国語別に英語用・fム語用・独語用−のよ
うに複数種類設けておく。
音節分解装置2における動作を第2図のフローチャート
により説明する。第2図において入力文字列jp+rえ
ば“HOT”を取込み、ステップ■において最初に出て
くる母音を探す。このとき2つ以Hの母音・母音列があ
ったときはその長い方をとる。
HOTのときrOJが最初に出てくる母音である。
次にステップ■において当該母音の前に別の文字がある
かどうかを探し、あればまとめて子音部とする。HOT
のときはHが子音部となる。
ステップ■において子音部と母音とをまとめて一つの音
節とする。HOTのときHOが第1音節である。
ステップ■において残りの文字列中に母音があるかどう
かを判断する。あるときはステップ■がら繰り返して行
く。ないときはステップ■に行き、残りの文字列をまと
めて子音部とし、且つ母音のない第2音節とする。HO
TのときはTが第2音節である。即ち音節要素を分析し
た結果、第1音節はHOで、 子音C=H,母音v=。
子音長C#=1.母音長V#=1 第2音節はTで C=T、 V=なし C#=1’ V#=0 となる。
次に解析ルールを格納するテーブルには「条件部」とし
てルールの適用条件を示す部分と、該条件部が満足され
た場合の処理としζ移って行く「生成部」の部分があり
、それらの書式を定めておく。即ぢ 条件部の()は1つの音節を *−()の場合は1つ以1−不定個の音節を表す。そし
て()内の記号は各音節に対する条件を示し、 V#は母音長を、C#は子音長を、 V−は母音の綴りを、C−は子音の綴りを表す。
()の次に十の付く記号は全体に対する条件を表し +PO3=ADJ は例えばpos <・品詞)が形容詞であることを示す
。したがって条件部が (V#=1)(C=T、V#=0)→PO5=ADJ と表されているときは、前述のTI OTの場合であっ
て 第1音節は母音長が1、 第2音節は子音がT、母音長が0を示し、且つ全体が「
形容詞Jの単語であることを示している。この条件部が
満足されているとき、−で生成部を記述して行く。生成
部における()()は条件部における対応する音節を2
つ持ってく、ることを示し、条件部の数が多いときは前
位2個を持ってくる。
()の次に十の後に示す記号は全体に付加する属性対即
ち形容詞でいえば比較級と最上級の内容を書く。前述の
例のような条件部の内容としてCOMP (比較級)は
−T、 E、 R15UP ’(最上級)は−、T、B
、S T、とい・う内容で声る。更に条件部が名詞、動
詞である場合を考え、属性対には S(複数形)−一5 IN(、(進行形)=−TiN2 +;Ast(過去形)=−TED PP(過去完了形) −−TED をも格納しておく。
変化パターン解析装置においては、音節分解装置2の出
力により、第1音節・第2音節の値と出力すべき変化形
指定が入力されたとき、解析ルール格納テーブル5を起
動し、前記条件に従う出力値を変化形発生装置6に印加
する。例えばHOTが原形で、品詞は形容詞であると入
力され、SUP最上級の変化形をめるよう要求されたと
きに、5UP=TEST を変化形発生装N6に出力するう 変化形発生装置6の処理は出力すべき変化形指定と同し
属性名を持つ属性値を使用する。即ちHOTのときS 
U P = −T E S Tである。
そして属性値を見て「−」を含むときは、原文字列の後
に「−」を除いた属性値を付加して変化形とする。即ち
HOTのときは−TI’:STであるから HOTTE
ST とする。
若し属性値がr−Jを含まないときは文字列の前に、属
性値を空白を挟んで付加する。この場合はrBEAUT
I FULJを1列にして説明する。
形容詞rBEAUTI FULJのCOMP (比較級
)をめることとする。
イ、音節要素について 単語の最初に出てくる母音は、前記テーブル3により最
も長いものを探すと、rEAUJであるから、第1音節
はB−EAUであり、前述のように表現すると、 C=B ?EAu C#=I V#=3 第2音節はTIであり、 C=T V=I C#=l V#−1 第3音節はFUであり、 C=F V=U C#=l V#=1 第4音節はしてあり、 C=L V=なし C#=I V#=0 口1次に解析ルールの条件部について調べる( )()
*−()+PO3=ADJ 入力文字列に対する補助情報の品詞がこの場合形容詞で
あったから、それを音節のグループの括弧の次に記述し
て全体的に不適当かどうか判断する。不適当でないとき
、その品詞に従うルール格納テーブルを起動する。
ハ、したがって生成部は音節3個以上のとき、形容詞の
比較級・最上級にはMORE、MO5Tを付加するとい
う文法上の規則のため、 −()(> ()+5UP=’MO3TCOM P =
 M’ORE となる。
二、即ちBEAUT’1FULのめる出力形の指定と同
じ属性名(比較級)をもつ属性値がこの場合MORBで
ある宏“ら−1炭化形発生装置6において MORE 
’ BEAUTIFULとする。
次の例として、動詞 5TUDYの過去形をめる場合を
説明する。
イ、第1音節はST Uであり、 C=ST V=U C#=2 V#=1 第2音節はDYであり、 C=D V=Y C#=I V#=1 0、条件部は *−()()+PO3=VERB (動詞)となる。こ
れは最終音節が母音Yのみで終わっているとき、それ以
前の音節は幾つあうても良いという英語における特殊ル
ールがあるため、「*−」の印を付した音節記号()を
書いている。
ハ、生成部は、 →() 4−−−−− であって音節は唯1個で良い。そして−の個所は動J−
jのときは「不定形、三人称単数現在形、進行形、過去
形、過去分詞」が格納してあり、なお[最終音節の母音
がYの1字であるとき変化形発生装置へ原入力文字を印
加するとき該母音Yを削除して行う」というルールも格
納しである。そして前述の音節条件に従う過去形は−I
ED、過去分詞は−IEDである。
ニ、したがって入力文字S T U I) Yに対する
過去形は−IEDとめられるので、Yを削除した5TU
Dに付加して 5TUI)r、ED となる。
したがって機械的処理ができるようになるから、音節テ
ーブルと解析テーブルとの複数種類を、翻訳システムの
末端の方に準備しておけば、自動化した装置が得られ、
且つ未登録の言葉に対しても直ぐ適用できる。
(6)発明の効果 このようにして本発明によると、品詞の変化形をめると
き、文法上の規則について、音節表対応付けてテーブル
に格納しておくから、所定の弔語について音節を調べた
とき、付加すべき情報を正確に早く得ることができる。
したがって各中給について変化形を総て格納しておく必
要がなく、辞書として使用するテーブルの容駐が少なく
てすむ。また内容の更新などの手間が可成り省略できる
【図面の簡単な説明】
第1図は本発明の実施例の構成を示すブロック図、第2
図は第1図の音節分解装置の動作を説明するフローチ中
−1・である。 1−人力信号端子 2−音節分解装置 3−#音テーブル 4−変化パターン解析装置 5−・−解析ルール格納テーブル 6−・変化形発生装置 7−・出力端子 特許出願人 冨士通株式会社 代理人 弁理士 鈴木栄祐 第1図 第2図

Claims (1)

    【特許請求の範囲】
  1. 単語文字列とその品詞とが人力され、複数種類設けた母
    音テーブルを使用して前記単語文字列を音節に分解する
    音節分解装置と、該音節分解装置出力が入力され解析ル
    ール格納テーブルを使用し前記音節の変化バクーンを解
    析する変化バクーン解析装置と、該解析装置により音節
    について所定の変化形をめた信号を変化形発生装置に人
    力し、当該単語の変化形を得ることを特徴とする単語変
    化形生成装置。
JP59107321A 1984-05-27 1984-05-27 単語変化形生成装置 Granted JPS60258678A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59107321A JPS60258678A (ja) 1984-05-27 1984-05-27 単語変化形生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59107321A JPS60258678A (ja) 1984-05-27 1984-05-27 単語変化形生成装置

Publications (2)

Publication Number Publication Date
JPS60258678A true JPS60258678A (ja) 1985-12-20
JPH0344342B2 JPH0344342B2 (ja) 1991-07-05

Family

ID=14456097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59107321A Granted JPS60258678A (ja) 1984-05-27 1984-05-27 単語変化形生成装置

Country Status (1)

Country Link
JP (1) JPS60258678A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57111669A (en) * 1980-12-27 1982-07-12 Casio Comput Co Ltd Output system for conjugation form of word

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57111669A (en) * 1980-12-27 1982-07-12 Casio Comput Co Ltd Output system for conjugation form of word

Also Published As

Publication number Publication date
JPH0344342B2 (ja) 1991-07-05

Similar Documents

Publication Publication Date Title
JP2765665B2 (ja) タイポグラフィカル情報付き文書の翻訳装置
US20020152246A1 (en) Method for predicting the readings of japanese ideographs
JPS6318458A (ja) 感情情報抽出装置
JPS5892063A (ja) イデイオム処理方式
JPS60258678A (ja) 単語変化形生成装置
Mustafa Phonology of Acehnese reduplication: Applying optimality theory
Sebastian et al. Machine learning approach to suffix separation on a sandhi rule annotated malayalam data set
Wahlgren Byzantine Chronicles and Metaphrasis
Azar et al. A thesaurus for biblical hebrew
KR100371135B1 (ko) 용언 굴절사전을 이용한 용언 형태소 분석장치 및 방법
JPH0552543B2 (ja)
JPS61272873A (ja) テキストの補整表記方式
Waxman et al. A thesaurus for Biblical Hebrew
JPH11161651A (ja) 発音記号生成装置
JPH07160685A (ja) 文章読み上げ装置
Nojoumian Towards the development of an automatic diacritizer for the Persian orthography based on the Xerox finite state transducer
JPH07295985A (ja) 機械翻訳装置
Killean Written Arabic: An Approach to the Basic Structures
JPH01219946A (ja) 文書作成支援装置
JPS62293472A (ja) 音声翻訳装置
JPH0512753B2 (ja)
JPS62247451A (ja) 日本語処理装置の単語辞書構成法
JPH10124501A (ja) 日本語読み付与方法及び装置及び日本語読み付与プログラム媒体
JPH07249039A (ja) 構文解析装置
JPH04326160A (ja) 形態素解析装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees