JPH0283664A - 引用部分の認定及び解析方式 - Google Patents
引用部分の認定及び解析方式Info
- Publication number
- JPH0283664A JPH0283664A JP63235471A JP23547188A JPH0283664A JP H0283664 A JPH0283664 A JP H0283664A JP 63235471 A JP63235471 A JP 63235471A JP 23547188 A JP23547188 A JP 23547188A JP H0283664 A JPH0283664 A JP H0283664A
- Authority
- JP
- Japan
- Prior art keywords
- quotation
- analysis
- sentence
- parts
- syntactic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
伎椎分災
本発明は、引用部分の認定及び解析方式、より詳細には
、機械翻訳における形態素解析部及び構文解析部に関す
るものである。
、機械翻訳における形態素解析部及び構文解析部に関す
るものである。
■技権
一般に構文解析の解析単位は一文である。解析を行う時
にその解析範囲は短いのが望ましい。つまり、より短い
範囲を解析するのならば、解析規則の適用回数及び組み
合わせ数が少なくて済むので、解析がより容易であり、
解析過程で生まれるあいまい性をより少なく押さえるこ
とができる。
にその解析範囲は短いのが望ましい。つまり、より短い
範囲を解析するのならば、解析規則の適用回数及び組み
合わせ数が少なくて済むので、解析がより容易であり、
解析過程で生まれるあいまい性をより少なく押さえるこ
とができる。
しかし、実際のテキストは短い文ばかりから成り立って
いるわけではなく、その逆に、多くは長い文からなって
いる。そこでブロックという1文の中での部分解析範囲
を考え、1文の中で解析範囲を部分を指定して区切ると
、解析範囲が限定されて、解析規則の適用回数及び組み
合わせ数が著しく減少するので、むだな規則適用や組み
合わせも減少し、解析効率が向上して速度が上がり、あ
いまい性も解消されて解析精度も向上する。この部分解
析範囲指定が自動的にできれば構文解析の精度と速度は
間違いなく上がる。
いるわけではなく、その逆に、多くは長い文からなって
いる。そこでブロックという1文の中での部分解析範囲
を考え、1文の中で解析範囲を部分を指定して区切ると
、解析範囲が限定されて、解析規則の適用回数及び組み
合わせ数が著しく減少するので、むだな規則適用や組み
合わせも減少し、解析効率が向上して速度が上がり、あ
いまい性も解消されて解析精度も向上する。この部分解
析範囲指定が自動的にできれば構文解析の精度と速度は
間違いなく上がる。
月−m−的
本発明は、上述のごとき実情に鑑みてなされたもので、
今まで特に区別しなかった強調引用とその他の引用を区
別できるようにすること、今まで特に区別しなかった任
、意力用とタイトル引用を区別できるようにすること、
強調引用の認定によって効果のない範囲指定をしないで
解析を行えるようにすること、及び、任意引用のときに
加えてタイトル引用のときも、より正確で速く効率の良
い解析が行えるようにすることを目的としてなされたも
のである。
今まで特に区別しなかった強調引用とその他の引用を区
別できるようにすること、今まで特に区別しなかった任
、意力用とタイトル引用を区別できるようにすること、
強調引用の認定によって効果のない範囲指定をしないで
解析を行えるようにすること、及び、任意引用のときに
加えてタイトル引用のときも、より正確で速く効率の良
い解析が行えるようにすることを目的としてなされたも
のである。
構−一一瀉
本発明は、上記目的を達成するために。
(1)機械翻訳等の自然言語解析システムにおける形態
素解析部において、入力されたテキストの引用部の有無
を調入、引用部分の存在する文に対して、引用部内の語
数を数え、語数が1つであったら当該引用部分を強調引
用であると認定すること、或いは、(2)機械翻訳等の
自然言語解析システムにおける形態素解析部において、
入力されたテキストの引用部の有無を調べ、引用部分の
存在する文に対して、引用部分を閉じる引用符号の直前
及び直後の句読点(ピリオド、コンマ)の有無を調べ、
句読点のある引用部分を任意引用部、読点のない引用部
分をタイトル引用部として、分けて認識すること、或い
は、(3)機械翻訳等の自然言語解析システムにおける
、形態素解析部の次の処理過程にあたる構文解析部にお
いて、解析を行うための構文解析・文法規則を備え、前
記(1)にて認定を行った強調引用部分に対し、引用符
号が存在しないものと仮定して、当該強調引用部分が存
在する文の解析を行うこと、或いは、(4)機械翻訳等
の自然言語解析システムにおける、形態素解析部の次の
処理過程にあたる構文解析部において、解析を行うため
の構文解析文法規則を備え、前記(2)にて認定を行っ
た2種類の引用部分に対し、解析対象の単位である1文
の解析を行う前に先がけて、引用部分内を部分解析して
、任意引用部は解析結果をそのまま引用部分が文の中で
要求される構文的役割であるとして当該文の解析を行い
、タイトル引用部は解析結果が名詞句にならなくとも、
引用部分が文の中で要求される構文的役割を名詞句であ
るとして当該文の解析を行うことを特徴としたものであ
る。以下、本発明の実施例に基づいて説明する。
素解析部において、入力されたテキストの引用部の有無
を調入、引用部分の存在する文に対して、引用部内の語
数を数え、語数が1つであったら当該引用部分を強調引
用であると認定すること、或いは、(2)機械翻訳等の
自然言語解析システムにおける形態素解析部において、
入力されたテキストの引用部の有無を調べ、引用部分の
存在する文に対して、引用部分を閉じる引用符号の直前
及び直後の句読点(ピリオド、コンマ)の有無を調べ、
句読点のある引用部分を任意引用部、読点のない引用部
分をタイトル引用部として、分けて認識すること、或い
は、(3)機械翻訳等の自然言語解析システムにおける
、形態素解析部の次の処理過程にあたる構文解析部にお
いて、解析を行うための構文解析・文法規則を備え、前
記(1)にて認定を行った強調引用部分に対し、引用符
号が存在しないものと仮定して、当該強調引用部分が存
在する文の解析を行うこと、或いは、(4)機械翻訳等
の自然言語解析システムにおける、形態素解析部の次の
処理過程にあたる構文解析部において、解析を行うため
の構文解析文法規則を備え、前記(2)にて認定を行っ
た2種類の引用部分に対し、解析対象の単位である1文
の解析を行う前に先がけて、引用部分内を部分解析して
、任意引用部は解析結果をそのまま引用部分が文の中で
要求される構文的役割であるとして当該文の解析を行い
、タイトル引用部は解析結果が名詞句にならなくとも、
引用部分が文の中で要求される構文的役割を名詞句であ
るとして当該文の解析を行うことを特徴としたものであ
る。以下、本発明の実施例に基づいて説明する。
而して、本発明は文中の引用部分をブロック(部分解析
範囲)として解析する方式に改良を加えたものである。
範囲)として解析する方式に改良を加えたものである。
同じ引用部分といっても実際には種別があり、本発明で
はそれらを強調引用部と任意引用部とタイトル引用部の
3つに分け、それぞれを形態素解析部で区別して構文解
析部に渡し、構文解析部でそれらの3つの引用部に対し
て異なった解析処理を行うことにより、構文解析の効率
及び精度の上昇を可能としたものである。
はそれらを強調引用部と任意引用部とタイトル引用部の
3つに分け、それぞれを形態素解析部で区別して構文解
析部に渡し、構文解析部でそれらの3つの引用部に対し
て異なった解析処理を行うことにより、構文解析の効率
及び精度の上昇を可能としたものである。
第1図は、本発明による辞書引き方式を備えた翻訳装置
の一実施例を示す構成図で、図中、1はCRT、2はキ
ーボード、3は0CR54は入力文書、5はスペルチェ
ック部、6は前編集部、7は翻訳本体部、8は後編集部
、9は辞書、10は文法規則、11は出力文書、12は
プリンタで、ファイル入力、キーボード入力、OCR入
力のいずれかによって得た入力文はスペルチェック、前
編集を用いて前処理され、翻訳部によって得られた出力
文は後編集によって翻訳情報を利用して編集され、入力
文と出力文はプリンタを用いて印刷される。
の一実施例を示す構成図で、図中、1はCRT、2はキ
ーボード、3は0CR54は入力文書、5はスペルチェ
ック部、6は前編集部、7は翻訳本体部、8は後編集部
、9は辞書、10は文法規則、11は出力文書、12は
プリンタで、ファイル入力、キーボード入力、OCR入
力のいずれかによって得た入力文はスペルチェック、前
編集を用いて前処理され、翻訳部によって得られた出力
文は後編集によって翻訳情報を利用して編集され、入力
文と出力文はプリンタを用いて印刷される。
第2図は、翻訳本体の流れを示す図で、この翻訳本体(
翻訳部)7は大きく分けて形態素解析、構文解析、変換
、生成の4つの処理からなり、まず、形態素解析部では
入力テキストの辞書引きを行なう。個々の語の情報を得
て構文解析部では文法規則に従ってパージングを行う、
解析結果から木構造を作成する。変換部では入力言語の
木構造から出力言語の木構造に変形する。生成部では得
られた木構造をノードごとに訳出する。
翻訳部)7は大きく分けて形態素解析、構文解析、変換
、生成の4つの処理からなり、まず、形態素解析部では
入力テキストの辞書引きを行なう。個々の語の情報を得
て構文解析部では文法規則に従ってパージングを行う、
解析結果から木構造を作成する。変換部では入力言語の
木構造から出力言語の木構造に変形する。生成部では得
られた木構造をノードごとに訳出する。
本発明は、上記形態素解析部および構文解析部に属する
もので、ここでは入力テキストは英文とする。入力され
たテキストを対象として、形態素解析部では第3図に示
す処理を行う。
もので、ここでは入力テキストは英文とする。入力され
たテキストを対象として、形態素解析部では第3図に示
す処理を行う。
第3図は、形態素解析における引用認定の流れを説明す
るための図で、ここでは、引用符号の有無を調べる。引
用符号が2つあったら、その間を引用部と認定する。次
に引用部内の語数を数える。
るための図で、ここでは、引用符号の有無を調べる。引
用符号が2つあったら、その間を引用部と認定する。次
に引用部内の語数を数える。
語数が1であったらその引用部を強調引用部とする。そ
れ以外の引用部分に対し、引用部分を閉しる引用符号の
直重直後の句読点(ピリオド、コンマ)の有無を調べ、
ピリオドもしくはコンマがあるとき、その引用部分を任
意引用部分と認定する。
れ以外の引用部分に対し、引用部分を閉しる引用符号の
直重直後の句読点(ピリオド、コンマ)の有無を調べ、
ピリオドもしくはコンマがあるとき、その引用部分を任
意引用部分と認定する。
ピリオドもコンマもないとき、その引用部分をタイトル
引用部分と認定する。これらの認定を行った引用部分情
報は形態素解析部から構文解析部に渡される。
引用部分と認定する。これらの認定を行った引用部分情
報は形態素解析部から構文解析部に渡される。
第4図は、構文解析部の流れを示す図で、この構文解析
部では1文ごとに解析を行う。本実施例では文脈自由構
文解析文法規則を用いて対象文を文末からボトムアップ
で解析を進める。全ての可能性を尽して規則を適用しな
がら最終的に対象文が文などを示す1つの文法上のコー
ドにまとまると解析が通常終了する。普通は最終的に得
られる文法上のコードは文(SE:5entence)
である。文の中に部分解析範囲(ブロック)である引用
部分がある場合を考えると、引用部分の種類には3つあ
り、強調引用と任意引用とタイトル引用である。それぞ
れの7低味を説明すると、強調引用は、ある特定の語を
強調するために引用符号で囲ったものであり、引用符号
内部は1語であり、引用部内の語と引用部外の語が引用
符号によって意味的に区切られているわけではなく、い
わゆる、特に区切るべきまとまりを持つ解析範囲とは言
い難い。従って強調引用のときは、特別に1部分解析範
囲であるとはしないで解析処理を行う。任意引用は引用
部を閉じる引用符号の前後に句読点の存在する引用部で
、いわゆる典型的な引用部であり、引用部内と引用部外
にはっきりとした意味の切れ目がある。
部では1文ごとに解析を行う。本実施例では文脈自由構
文解析文法規則を用いて対象文を文末からボトムアップ
で解析を進める。全ての可能性を尽して規則を適用しな
がら最終的に対象文が文などを示す1つの文法上のコー
ドにまとまると解析が通常終了する。普通は最終的に得
られる文法上のコードは文(SE:5entence)
である。文の中に部分解析範囲(ブロック)である引用
部分がある場合を考えると、引用部分の種類には3つあ
り、強調引用と任意引用とタイトル引用である。それぞ
れの7低味を説明すると、強調引用は、ある特定の語を
強調するために引用符号で囲ったものであり、引用符号
内部は1語であり、引用部内の語と引用部外の語が引用
符号によって意味的に区切られているわけではなく、い
わゆる、特に区切るべきまとまりを持つ解析範囲とは言
い難い。従って強調引用のときは、特別に1部分解析範
囲であるとはしないで解析処理を行う。任意引用は引用
部を閉じる引用符号の前後に句読点の存在する引用部で
、いわゆる典型的な引用部であり、引用部内と引用部外
にはっきりとした意味の切れ目がある。
この引用部を持つ文を解析するには、文末から解析を進
める。部分解析範囲(ブロック)である任意引用部まで
解析が進んだら、任意引用部内を解析する。引用部内の
解析が終了したら、解析の結果得られた文法的役割を示
す文法コードをそのまま引用部がこの文に対して果たす
文法的役割であるとして解析を統ける。つまり任意引用
部は、文の解析範囲を区切るという意味を持つ。また、
タイトル引用は引用部を閉じる引用符号の前後に句読点
(ピリオド、コンマ)を持たない引用部で、引用部内が
タイトル(名詞句)であると推定する。
める。部分解析範囲(ブロック)である任意引用部まで
解析が進んだら、任意引用部内を解析する。引用部内の
解析が終了したら、解析の結果得られた文法的役割を示
す文法コードをそのまま引用部がこの文に対して果たす
文法的役割であるとして解析を統ける。つまり任意引用
部は、文の解析範囲を区切るという意味を持つ。また、
タイトル引用は引用部を閉じる引用符号の前後に句読点
(ピリオド、コンマ)を持たない引用部で、引用部内が
タイトル(名詞句)であると推定する。
任意引用と同じく解析を進める。相違点はタイトル引用
部の解析結果をそのまま使って文の解析を行うのではな
く、解析結果がどのようなものになろうと名詞句の役割
を与えて文の解析を行う。
部の解析結果をそのまま使って文の解析を行うのではな
く、解析結果がどのようなものになろうと名詞句の役割
を与えて文の解析を行う。
以下、実例を示して説明する。
a、 All you ”need” is 1ove
。
。
b、 He 5ays、”all you need
is 1ove、”c、 ”All you need
is l0Ve”ars the words of
the Beatles’ song。
is 1ove、”c、 ”All you need
is l0Ve”ars the words of
the Beatles’ song。
まず、これらのa、b、cの3つの文を形態素解析部で
引用認定処理する。引用符号の数を数える。偶数個(普
通は2つだがたまに4つあることもある)あれば引用部
内の語数を数える。1つであれば強調引用であると認定
する。aの文が強調引用の例である。それ以外のときは
、引用符部分を閉じる引用符号の前後の句読点(ピリオ
ド、コンマ)の有無をみる。bは、があるので任意引用
と、Cは、も、もないからタイトル引用と認定する。次
に、構文解析部に進むが、上記のa。
引用認定処理する。引用符号の数を数える。偶数個(普
通は2つだがたまに4つあることもある)あれば引用部
内の語数を数える。1つであれば強調引用であると認定
する。aの文が強調引用の例である。それ以外のときは
、引用符部分を閉じる引用符号の前後の句読点(ピリオ
ド、コンマ)の有無をみる。bは、があるので任意引用
と、Cは、も、もないからタイトル引用と認定する。次
に、構文解析部に進むが、上記のa。
b、cの英文を解析するのに1例えば以下の文法規則が
あるとする。
あるとする。
A1品詞分類コード
prn(主格代名詞) n0u(名詞) no2(
名詞所有格) dat(定冠詞)vil(他動詞句を
目的語にとる) vt2(他動詞that節を目的語
とする)vil(自動詞補語をとる) pre(前置
詞) cma(コンマ) prd(ピリオド) B0文法コード NP(名詞句) SN(主格名詞句) CN(補語
名詞句)ON(目的語名詞句) DP(前置詞句)
CN(コンマ)PD(ピリオド) VC(述語)
QC(thati thatは省略可) WC(目
的語の欠けた述語) SG(文末記号を含まない文)
SE(文末記号を含む文)C0文法規則 1、SE → SG PD 2、 5G −> SN V(1゜3.0C
→ SG 4、VC−) vil CN 5、VC−+ vtl CN 6、 VC+vt2 (CN) QC7、WC−
+ vtl 8.5N −+ NP 9、SN −+ dat NPl、0.
SN−+prn (SN WC)11、CN
4 Nl’ 12、CN −+ det NPl3、ON
4 NP 14、ON −) det NPl5、N
P → nou (DP)16、NP −*
no2 NPl7、DP → pre 0
N IL CN −) cma 19、円) → prd なお、括弧内の要素はあってもなくてもよい。
名詞所有格) dat(定冠詞)vil(他動詞句を
目的語にとる) vt2(他動詞that節を目的語
とする)vil(自動詞補語をとる) pre(前置
詞) cma(コンマ) prd(ピリオド) B0文法コード NP(名詞句) SN(主格名詞句) CN(補語
名詞句)ON(目的語名詞句) DP(前置詞句)
CN(コンマ)PD(ピリオド) VC(述語)
QC(thati thatは省略可) WC(目
的語の欠けた述語) SG(文末記号を含まない文)
SE(文末記号を含む文)C0文法規則 1、SE → SG PD 2、 5G −> SN V(1゜3.0C
→ SG 4、VC−) vil CN 5、VC−+ vtl CN 6、 VC+vt2 (CN) QC7、WC−
+ vtl 8.5N −+ NP 9、SN −+ dat NPl、0.
SN−+prn (SN WC)11、CN
4 Nl’ 12、CN −+ det NPl3、ON
4 NP 14、ON −) det NPl5、N
P → nou (DP)16、NP −*
no2 NPl7、DP → pre 0
N IL CN −) cma 19、円) → prd なお、括弧内の要素はあってもなくてもよい。
また、行頭の数字は規則番号を示す。
aの文の解析を文末から行う。簡単にするためそれぞれ
の語は正解につながる品詞分類だけを持つとする。aの
場合は引用部分がないときの解析と同じである。
の語は正解につながる品詞分類だけを持つとする。aの
場合は引用部分がないときの解析と同じである。
a、 all(prn) you(prn) n
eed(vtl) 1s(via)10νe(nou
) 、(prd) 1、(1!]) PD −+ prd (、)2
、(15) NP + nou (Love)3
、(11) CN−+NP (love)4、
(4) VC−+ vil CN (is 1ov
e)5、 (7) WC−* vtl (ne
ed)6、(1,0) SN →prn (yo
u)7、(10) SN−+prn SN WC(al
l you need)8、 (2) SG −* S
N VC(all you need is 1ove
)9、 (1) SE −+ SG PD (all
you need is 1ove、)ただし、行頭は
通し番号、括弧内は規則番号である。
eed(vtl) 1s(via)10νe(nou
) 、(prd) 1、(1!]) PD −+ prd (、)2
、(15) NP + nou (Love)3
、(11) CN−+NP (love)4、
(4) VC−+ vil CN (is 1ov
e)5、 (7) WC−* vtl (ne
ed)6、(1,0) SN →prn (yo
u)7、(10) SN−+prn SN WC(al
l you need)8、 (2) SG −* S
N VC(all you need is 1ove
)9、 (1) SE −+ SG PD (all
you need is 1ove、)ただし、行頭は
通し番号、括弧内は規則番号である。
bの文は”all you need is 1ove
”が任意引用である。この部分の解析はaの2から7ま
でと同一である。また引用符号自体は解析対象とはなら
ない。
”が任意引用である。この部分の解析はaの2から7ま
でと同一である。また引用符号自体は解析対象とはなら
ない。
b、 he(prn) 5ays(vt2) 、
(cma) all(prn)you(prn)
need(vtl) 1s(vil) 1ove(
nou)、(prd) 1、 (19) PD −+ prd (、
)2、 (15) NP−+ nou (l
ove)8、 (2) SG−+SN VC(all
you need is 1ove)9、 (3)
QC−) SG (all you need
is 1ove)10、 (17) CN −+
crma (1)11、 (6) VC−) v
t2 CN QC(says、 all you ne
edis 1ove) 12、 (10) SN →prn (he))
3. (2) SG −+ SN VC(ha 5a
ys、 all you needis Love) 14、 (1) SE −+ SG PD (he
5ays、 all you needis 1ov
e、) all you need is Loveの解析結果
であるSG(ピリオドのない文)をそのまま利用して解
析を進めている。
(cma) all(prn)you(prn)
need(vtl) 1s(vil) 1ove(
nou)、(prd) 1、 (19) PD −+ prd (、
)2、 (15) NP−+ nou (l
ove)8、 (2) SG−+SN VC(all
you need is 1ove)9、 (3)
QC−) SG (all you need
is 1ove)10、 (17) CN −+
crma (1)11、 (6) VC−) v
t2 CN QC(says、 all you ne
edis 1ove) 12、 (10) SN →prn (he))
3. (2) SG −+ SN VC(ha 5a
ys、 all you needis Love) 14、 (1) SE −+ SG PD (he
5ays、 all you needis 1ov
e、) all you need is Loveの解析結果
であるSG(ピリオドのない文)をそのまま利用して解
析を進めている。
Cの文は” all you need is 1ov
e”がタイトル引用である。この部分の解析はaの2か
ら7までの同一である。また引用符号自体は解析対象と
はならない。
e”がタイトル引用である。この部分の解析はaの2か
ら7までの同一である。また引用符号自体は解析対象と
はならない。
b、 ali(prn) you(prn) n
eed(vtl) 1s(vil)love(nou
) are(vil) the(det)word
s(nou) of(pre) the(det)
Beatles(no2) song(nou)
、(prd)1、 (19) PD −+ prd
(、)2、 (15) NP −+ nou
(song)3、 (16) NP −+ no2
NP (Beatles’ song)4、 (14)
ON →det NP (the Beatles’
song)5、 (17)叶−+ pre ON (
of the Beatles’ song)6、 (
15) NP −* nou DP (words o
f the Beatles’song) 7、 (12) CN −+ det NP (the
words of theBeatles’ son
g) 8、 (4) VC→vil CN (ars th
e words of the13eat1.es’
song) 9、 (15) NP −+ nou
(love)15、 (2) SG 4 SN
VC(all you need is 1ove)1
6、 (0) NP→SG SGにNP(名詞
句)の役割を与える 17、 (8) SN→NP (all you
need is 1ove)18、 (2) SG
4 SN VC(all you need is
1oveare the words of
theBeatlcs’ song) 19、 (1) SE −* SG PD (al
l you need is 1oveare th
e tmords of theBeatles
’ song、) 15行目でSGの文法コードが得られた。このS(iを
使ってそのまま解析を続けても最終的にSHには到達し
ない。解析規則が存在しないからだ。そこで16行目で
、このタイトル引用に対して新しい役割として文法コー
ドNPをダ7える。これは文法規則ではなく15行目で
得られたSGに16行目NPというラベルをはったと思
えばよい。この処理により、Cの文は解析に成功する。
eed(vtl) 1s(vil)love(nou
) are(vil) the(det)word
s(nou) of(pre) the(det)
Beatles(no2) song(nou)
、(prd)1、 (19) PD −+ prd
(、)2、 (15) NP −+ nou
(song)3、 (16) NP −+ no2
NP (Beatles’ song)4、 (14)
ON →det NP (the Beatles’
song)5、 (17)叶−+ pre ON (
of the Beatles’ song)6、 (
15) NP −* nou DP (words o
f the Beatles’song) 7、 (12) CN −+ det NP (the
words of theBeatles’ son
g) 8、 (4) VC→vil CN (ars th
e words of the13eat1.es’
song) 9、 (15) NP −+ nou
(love)15、 (2) SG 4 SN
VC(all you need is 1ove)1
6、 (0) NP→SG SGにNP(名詞
句)の役割を与える 17、 (8) SN→NP (all you
need is 1ove)18、 (2) SG
4 SN VC(all you need is
1oveare the words of
theBeatlcs’ song) 19、 (1) SE −* SG PD (al
l you need is 1oveare th
e tmords of theBeatles
’ song、) 15行目でSGの文法コードが得られた。このS(iを
使ってそのまま解析を続けても最終的にSHには到達し
ない。解析規則が存在しないからだ。そこで16行目で
、このタイトル引用に対して新しい役割として文法コー
ドNPをダ7える。これは文法規則ではなく15行目で
得られたSGに16行目NPというラベルをはったと思
えばよい。この処理により、Cの文は解析に成功する。
1−果
以上の説明から明らかなように、請求項(1)により、
今まで特に区別しなかった強調引用とその他の引用を区
別できるようになった。
今まで特に区別しなかった強調引用とその他の引用を区
別できるようになった。
請求項(2)により、今まで特に区別しなかった任膚:
引用とタイトル引用を区別できるようになった。
引用とタイトル引用を区別できるようになった。
請求項(3)により1強調引用の認定によって効果のな
い範囲指定をしないで解析を行えるようになった。
い範囲指定をしないで解析を行えるようになった。
請求項(4)により、任意引用のときに加えてタイトル
引用のときも、より正確で速く効率の良い解析が行える
ようになった。
引用のときも、より正確で速く効率の良い解析が行える
ようになった。
第1図は、本発明による辞書引き方式を備えた翻訳装置
の一実施例を示す構成図、第2図は、翻訳本体の流れを
示す図、第3図は、形態素解析部における引用認定の流
れを示す図、第4図は、構文解析の流れを示す図である
。 1・・・CRT、2・・・キーボード、3・・・OCR
,4・・・入力文跡、5・・・スペルチ、エラグ部、6
・・・前編集部。 7・・・翻訳本体部、8・・・後編集部、9・・・辞書
、10・・・文法規則、11・・・出力文書、12・・
プリンタ。
の一実施例を示す構成図、第2図は、翻訳本体の流れを
示す図、第3図は、形態素解析部における引用認定の流
れを示す図、第4図は、構文解析の流れを示す図である
。 1・・・CRT、2・・・キーボード、3・・・OCR
,4・・・入力文跡、5・・・スペルチ、エラグ部、6
・・・前編集部。 7・・・翻訳本体部、8・・・後編集部、9・・・辞書
、10・・・文法規則、11・・・出力文書、12・・
プリンタ。
Claims (1)
- 【特許請求の範囲】 1、機械翻訳等の自然言語解析システムにおける形態素
解析部において、入力されたテキストの引用部の有無を
調べ、引用部分の存在する文に対して、引用部内の語数
を数え、語数が1つであったら当該引用部分を強調引用
であると認定することを特徴とする引用部分認定方式。 2、機械翻訳等の自然言語解析システムにおける形態素
解析部において、入力されたテキストの引用部の有無を
調べ、引用部分の存在する文に対して、引用部分を閉じ
る引用符号の直前及び直後の句読点の有無を調べ、句読
点のある引用部分を任意引用部、読点のない引用部分を
タイトル引用部として、分けて認識することを特徴とす
る引用部分認定方式。3、機械翻訳等の自然言語解析シ
ステムにおける、形態素解析部の次の処理過程にあたる
構文解析部において、解析を行うための構文解析文法規
則を備え、請求項(1)にて認定を行った強調引用部分
に対し、引用符号が存在しないものと仮定して、当該強
調引用部分が存在する文の解析を行うことを特徴とする
引用部分解析方式。 4、機械翻訳等の自然言語解析システムにおける、形態
素解析部の次の処理過程にあたる構文解析部において、
解析を行うための構文解析文法規則を備え、請求項(2
)にて認定を行った2種類の引用部分に対し、解析対象
の単位である1文の解析を行う前に先がけて、引用部分
内を部分解析して、任意引用部は解析結果をそのまま引
用部分が文の中で要求される構文的役割であるとして当
該文の解析を行い、タイトル引用部は解析結果が名詞句
にならなくとも、引用部分が文の中で要求される構文的
役割を名詞句であるとして当該文の解析を行うことを特
徴とする引用部分解析方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63235471A JPH0283664A (ja) | 1988-09-20 | 1988-09-20 | 引用部分の認定及び解析方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63235471A JPH0283664A (ja) | 1988-09-20 | 1988-09-20 | 引用部分の認定及び解析方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0283664A true JPH0283664A (ja) | 1990-03-23 |
Family
ID=16986573
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63235471A Pending JPH0283664A (ja) | 1988-09-20 | 1988-09-20 | 引用部分の認定及び解析方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0283664A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1999062000A3 (en) * | 1998-05-26 | 2001-06-07 | Teragram Corp | Spelling and grammar checking system |
-
1988
- 1988-09-20 JP JP63235471A patent/JPH0283664A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1999062000A3 (en) * | 1998-05-26 | 2001-06-07 | Teragram Corp | Spelling and grammar checking system |
| US6424983B1 (en) | 1998-05-26 | 2002-07-23 | Global Information Research And Technologies, Llc | Spelling and grammar checking system |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4024861B2 (ja) | 辞書に基づく品詞確率による自然言語パーザ | |
| US5903858A (en) | Translation machine for editing a original text by rewriting the same and translating the rewrote one | |
| JPH077419B2 (ja) | 機械翻訳装置における略称付き固有名詞処理方法 | |
| JPH0351020B2 (ja) | ||
| Roche | Parsing with finite-state transducers | |
| EP0403057B1 (en) | Method of translating sentence including adverb phrase by using translating apparatus | |
| Varshini et al. | A recognizer and parser for basic sentences in telugu using cyk algorithm | |
| Vasiu et al. | Enhancing tokenization by embedding Romanian language specific morphology | |
| Gavhal et al. | Sentence Compression Using Natural Language Processing | |
| JPH0283664A (ja) | 引用部分の認定及び解析方式 | |
| Shaalan et al. | Towards an Arabic parser for modern scientific text | |
| JP2632806B2 (ja) | 言語解析装置 | |
| Ab Aziz et al. | Pola grammar technique for grammatical relation extraction in Malay language | |
| Loftsson | Tagging Icelandic text using a linguistic and a statistical tagger | |
| Eineborg et al. | ILP in part-of-speech tagging—an overview | |
| Muurisep et al. | Shallow Parsing of Spoken Estonian Using Constraint Grammar | |
| JPH0157826B2 (ja) | ||
| Sutcliffe et al. | Using the link parser of Sleator and Temperley to analyse a software manual corpus | |
| Khemakhem et al. | Arabic morpho-syntactic feature disambiguation in a translation context | |
| JP2719453B2 (ja) | 機械翻訳装置 | |
| Yıldırım et al. | Pronoun resolution in Turkish using decision tree and rule-based learning algorithms | |
| KR20010057781A (ko) | 다중어 형태소 분석장치 및 그 방법 | |
| Ying et al. | A hybrid approach to Chinese-English machine translation | |
| Rodrigues et al. | Arabic data science toolkit: An api for arabic language feature extraction | |
| KR100413966B1 (ko) | 한국어 표준 문형 규칙에 의한 표준 문형 유도 장치 및 그방법 |