JP2003196274A - 構文解析方法及び装置 - Google Patents

構文解析方法及び装置

Info

Publication number
JP2003196274A
JP2003196274A JP2001395617A JP2001395617A JP2003196274A JP 2003196274 A JP2003196274 A JP 2003196274A JP 2001395617 A JP2001395617 A JP 2001395617A JP 2001395617 A JP2001395617 A JP 2001395617A JP 2003196274 A JP2003196274 A JP 2003196274A
Authority
JP
Japan
Prior art keywords
information
analysis
bilingual
syntactic analysis
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001395617A
Other languages
English (en)
Other versions
JP3906356B2 (ja
Inventor
Seiki Uchimoto
清貴 内元
Hitoshi Isahara
均 井佐原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
Communications Research Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communications Research Laboratory filed Critical Communications Research Laboratory
Priority to JP2001395617A priority Critical patent/JP3906356B2/ja
Priority to US10/499,975 priority patent/US20050086047A1/en
Priority to PCT/JP2002/013186 priority patent/WO2003056450A1/ja
Priority to EP02788853A priority patent/EP1471439A4/en
Publication of JP2003196274A publication Critical patent/JP2003196274A/ja
Application granted granted Critical
Publication of JP3906356B2 publication Critical patent/JP3906356B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 精度の高い構文解析方法を提供することによ
って、より正確な言語処理技術に寄与すること。 【解決手段】 単言語文書20aと共に、対訳関係にあ
る対訳文書20bを入力し、単言語文書20aの構文解
析、例えば依存関係解析35で複数の解析結果が生じて
特定が困難な場合に、対訳文書20bの依存関係38を
調べ、その情報に基づいて最適な依存関係解析35を行
う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は言語処理における構
文解析の精度を向上させる技術に関するものであり、よ
り詳しくは、複数の言語を入力して構文解析の精度向上
を図る技術に関わる。
【0002】
【従来の技術】近年、コンピュータによって言語のテキ
ストを解析する技術、或いは生成する技術の開発が進
み、特にそれらの技術を用いた機械翻訳や、要約システ
ムの提供が図られている。その中で、文章の係り受け関
係などを解析する構文解析技術は正確な文脈の把握に極
めて重要であり、従来から高精度な構文解析技術の研究
が進められている。
【0003】特に、日本語のように、係り受け関係が曖
昧であり、省略される語句も多い言語を解析する際に
は、解析時に複数の解析可能性が存在し、解析結果が不
確定になる場合が少なくない。また、単語には複数の語
義があることが多いが、1つの言語を解析しただけで
は、いずれの語義で用いられているのかが不明な場合も
多い。従来の構文解析技術では、当該解析対象の言語に
ついてより多くの文法情報を与え、それによって解析精
度の向上を図るものが多い。しかし、このような手法で
は、確率的により最適なものが選択できるようになるだ
けで、必ずしも正しい解析結果を得ることができなかっ
た。
【0004】
【発明が解決しようとする課題】本発明は、上記従来技
術の有する問題点に鑑みて創出されたものであり、その
目的は、精度の高い構文解析方法を提供することによっ
て、より正確な言語処理技術に寄与することである。
【0005】
【課題を解決するための手段】本発明は、上記の課題を
解決するために、次のような構文解析方法を創出する。
すなわち、本発明では構文解析方法に、従来では解析対
象であった1言語のテキストだけでなく、該対象のテキ
ストとは異なる言語による対訳テキストを入力すること
によって、より高精度な構文解析を実現する。具体的に
は次の手法による。まず、構文解析を行う対象テキスト
と、該対象テキストと少なくともその一部が対訳関係に
ある1つ以上の対訳テキストとを入力する。そして、該
対象テキスト及び対訳テキストの構文解析を行う。この
とき、必ずしもすべての文章について構文解析を行う必
要はなく、対象テキストの構文解析を行いながら、必要
に応じて対訳テキストの構文解析を行ってもよい。
【0006】さらに、該対象テキストについて、少なく
とも2通り以上の構文解析情報が得られる場合、つまり
対象テキストの構文解析の結果、複数の解析情報が得ら
れていずれが最も適当な解析情報であるかの判別が困難
な場合には、上記対訳テキストの構文解析結果を用い
る。対訳テキストが複数ある場合には、例えば最も確か
らしい解析情報が得られた対訳テキストの情報を用い、
それを複数の対象テキストの構文解析情報のうちから最
も適当な対象テキストの特定に利用する。特定された結
果を対象テキストの適当な構文解析結果として出力する
ことによって、従来の1言語のみによる解析では困難な
構文解析も、高精度な解析結果を得ることができるよう
になる。
【0007】さらに、本発明における前記構文解析方法
は、複数の言語を入力して新たな第3の言語を生成する
過程に導入することもできる。従来ある言語から第3の
言語を生成するとき、単一の言語を入力するよりも、複
数の言語を用いて生成するとより精密な生成が可能であ
ることが分かっている。すなわち、本件出願人らによる
特願2001−243118号公報に開示される方法な
どにおいては、すでに複数の対訳テキストが入力として
用いられることから、本発明の実施には極めて好適であ
り、構文解析方法の高精度化により、第3言語生成にも
有効である。
【0008】また、本発明では言語処理における構文解
析装置を提供することもできる。本装置には、まず構文
解析を行う対象テキストを入力する対象テキスト入力手
段と、該対象テキストと、少なくともその一部が対訳関
係にある対訳テキストを、対訳関係を関連づけながら入
力する対訳テキスト入力手段を備える。入力された対象
テキスト及び対訳テキストは、形態素解析手段によって
形態素解析を行う。該形態素解析の結果に対しては、構
文解析手段が、対象テキストの全形態素及び、対訳テキ
ストの少なくとも必要な形態素の構文解析を行う。該対
象テキストの構文解析結果において、複数の構文解析結
果が得られた場合、又は複数の構文解析結果のうち1つ
の構文解析結果が所定の確からしさを超えない場合に、
対訳テキストの構文解析結果を参照し、最も適当な対象
テキストの構文解析結果を特定する最適結果特定手段を
有する。本装置は、構文解析結果出力手段を用いて最適
な結果を出力する。
【0009】
【発明の実施の形態】以下、本発明の実施方法を図面に
示した実施例に基づいて説明する。なお、本発明の実施
形態は以下に限定されず、適宜変更可能である。本発明
は、従来の構文解析技術では困難であった的確な構文解
析を実現する技術であり、人手により作成された高精度
の複数の対訳文書、例えば日英2つの言語を用いて、極
めて高精度な構文解析技術を提供するものである。
【0010】以下、本発明の利用形態の1つとして、構
文解析を行う対象言語文書と共に、その対訳関係にある
言語の文書を入力し、最終的に目標言語を生成して出力
する翻訳システムに実装した場合を例として説明する。
図1に従来から行われている単言語文書を目標言語に変
換、生成するフローチャートを、図2に本発明に係る日
米対訳文書から目標言語に変換、生成するフローチャー
トを示す。
【0011】従来の方法において、単言語文書(10)
を目標言語文書(14)に翻訳するプロセスは、大きく
分類して、構文解析装置(11)、変換装置(12)、
生成装置(13)を経て行うのが一般的であった。それ
ら各装置(11)(12)(13)の開発に当たって
は、人手による規則の作成(15)が不可欠であって、
高精度なシステム開発には大規模な文書の解析作業が必
要であった。たとえば、学習に用いる大規模なテキスト
コーパスは莫大なコストと、研究が必要であり、現状で
は主要言語のみにようやく整備されつつあるものの、非
主要言語において用意される望みは極めて薄い。
【0012】そこで、図2に示すように、主要言語等の
コーパスが整備された単言語文書(20a)と共に、該
単言語文書と対訳関係にある対訳文書(20b)を用
い、目標言語の的確な翻訳を実現する翻訳システムが提
供される。本システムでは、2つ以上の対訳テキストを
入力する入力手段(図示しない)によって文書の入力を
行い、各対訳テキストにつき、各言語毎に、又は各言語
を任意に2つ以上組み合わせて、言語情報の解析を行う
解析手段として本発明による構文解析装置(21)に至
る。
【0013】さらに、構文解析装置(21)における解
析結果に基づき、第3言語への言語変換を行う変換手段
として変換装置(22)、該変換ステップにおける変換
結果に基づき第3言語によるテキストを生成する生成手
段として生成装置(23)を備える。変換装置(2
2)、生成装置(23)にはそれぞれ変換・生成に必要
な情報が変換知識(25)、生成知識(26)として備
えられている。最終的には、別に配設する出力手段(図
示しない)によって目標言語文書(24)が出力可能で
ある。
【0014】入力する言語は、例えば日本語と英語の対
訳関係にある文書である。この際、その全部が完全な対
訳関係にある場合だけでなく、一部が対訳関係にある文
書でもよい。また、入力する言語は2つ以上であればよ
く、例えば3言語によってより高精度な構文解析を実現
することもできる。
【0015】従って、本発明における対訳文書の言語の
組み合わせとしては、日本語と英語や、日本語と中国
語、或いはその3言語を用いるなど、言語体系が異なる
言語を用いると特に好適である。逆に、英語とフランス
語のみ等では本発明による効果は必ずしも大きくない
が、英語・フランス語・日本語のように組み合わせる
と、英語・日本語のみの場合よりも高精度な解析が行え
る可能性が高く、そのような構成でもよい。
【0016】次に、本発明に係る構文解析装置(21)
につき詳述する。本システムは、日英二言語の対訳文書
(20a)(20b)の入力を前提に、語と語(あるい
は日本語の文節のようにもう少し大きい単位)の間の依
存関係(係り受け関係)を解析する。依存関係はすでに
本件出願人らが提案している日本語の係り受けモデル
(内元清貴、村田真樹、関根聡、井佐原均、「後方文脈
を考慮した係り受けモデル」、自然言語処理, Vol.7, N
o.5, pp.3-17 (2000)、に記載)を他言語にも適用する
ことによって決定する。
【0017】このモデルは、二つの語(あるいは文節)が
依存関係にあるかないかを学習するもので、機械学習モ
デルを用いて実現される。依存関係は学習されたモデル
によって計算される確率の積が一文全体で最も高くなる
ように決定する。さらに、この依存関係構造から格解析
(意味解析)を行う。依存関係の処理においては、二言語
対訳入力の有効性は、依存構造における係り受けの正解
率の向上で計量可能である。
【0018】図3に本発明による構文解析装置の構成図
を示す。本装置(21)は、CPU部(30)、読み取
り部(31)、外部記憶部(32)、ROM・RAM部
(33)から構成され、CPU部(30)における以下
の処理を、ROM・RAM部(33)が適宜記録しなが
ら行う。構文解析の結果は、外部記憶部(33)に出力
されて蓄積し、変換装置(22)における処理に向か
う。
【0019】CPU部(30)においては、まず形態素
解析ステップ(34)において入力される単言語文書
(ここでは日本語文書)(20a)と、対訳文書(ここ
では英語文書)(20b)の形態素解析を行う。そし
て、形態素解析の結果に基づいて日本語文書(20a)
における語と語の依存関係を解析する。(依存関係解析
ステップ(35))依存関係解析ステップ(35)にお
ける解析結果が、1個の解析結果を生じる場合、又はそ
の解析結果が上記機械学習によって一定の確からしさを
示している場合には、格解析ステップ(36)において
格解析を行い、その結果を外部記憶部(32)に蓄積す
る。
【0020】しかし、一般に単言語文書の入力だけで、
確実な依存関係を決定することは難しい。依存関係解析
ステップ(35)において、特に重要な情報となるのが
語順であり、例えば「私は少女と犬を見た。」という日
本語を入力する場合には、「私」が「少女と犬を見た」
とも解釈できるし、「私」が「少女」と共に「犬を見
た」とも解釈できる。そこで、本発明では英語文書中の
該当対訳部分を解析し、いずれの解釈が適当であるかを
決定する。
【0021】上記依存関係解析ステップ(35)で、複
数の解析結果が生じ、いずれの解析が適当であるかが判
別出来ない場合、日本語文書(20a)の当該文章に該
当する個所を英語文書(20b)から検索する対訳検索
ステップ(37)に進む。そして、対訳文章が検索され
た場合、該文章についての依存関係を解析する。(対訳
文書依存関係解析ステップ(38))
【0022】上記例文の場合、対訳として検索された文
章「I saw a girl and a dog.」によれば、「私」が
「少女と犬を見た」という前者の解釈が妥当であること
が極めて容易に判明する。それは、後者の「私」が「少
女」と共に見た場合には、対訳の文章が「I and a girl
saw a dog」という語順でなければならず、検索された
文章では取りえない解釈だからである。このように対訳
文書における依存関係の情報を、依存関係解析ステップ
(35)にフィードバックすることで、従来では困難で
あった依存関係の正確な解析が可能となる。
【0023】日本語文と英語文は語順がかなり異なる
上、英語では語順に対する文法的な制約が厳しいため、
日本語文側では曖昧な係り先が英語文側では明らかに決
まる場合やその逆の場合が多くある。上記の例の通り、
対訳文が「I saw a girl and a dog./私は少女と犬を
見た。」の場合、英語文では「and a dog」の係り先は
明らかに「saw」であるが、日本語文では「少女と」が
「見た」に係るのか、並列句として「犬を」に係るのか
が曖昧である。
【0024】また、対訳文が「I saw a girl with a te
lescope./私は望遠鏡で少女を見た。」の場合、逆に、
英語文では「with a telescope」の係り先が「saw」な
のか「a girl」なのかが曖昧であるが、日本語文では
「望遠鏡で」が「見た」に係るということは容易に解析
できる。後者の例では、単言語文書として英語を入力し
た場合に、日本語の対訳文書の入力が有効に作用するこ
とを示している。
【0025】さらに、語順以外にも文法的な情報、例え
ば、英語では冠詞や単複形、動名詞や不定詞など動詞の
活用形の情報、日本語では助詞の情報も有効に用いるこ
とができる。例えば、日本語文で「彼は本を書き、出版
している人を尊敬している。」では、「本を書」いてい
るのが「彼」なのか「出版している人」なのか曖昧であ
る。しかし、対訳文「He respects people who write b
ooks and publish them.」を入力することによって、文
法的にwho以降の動詞はいずれもpeopleに係る(三単現の
sがないため)ことが分かり、「本を書」いているのは
「出版している人」であることが正確に解析できる。
【0026】さらに、省略の有無の情報を用いることも
できる。日本語文では主語が省略されることが多い(ゼ
ロ代名詞がよく使われる)が、英語文では主語が必須の
場合が多いため、省略のため曖昧になっている部分を英
語側の情報で補うことも可能になる。これは特に格解析
で主語を特定する必要がある場合に有効に用いることが
できる。
【0027】例えば、日本語文「友達とレストランに行
きました。有名人に会えてラッキーでした。」の場合、
ラッキーだったのは話者の私なのか、友達なのか、両方
なのか、また、有名人は一人だったのか複数いたのか曖
昧である。この日本語文の対訳が「I went to the rest
aurant with my friend. We were lucky because wemet
a celebrity.」であれば、二人ともラッキーで、会え
たのは一人の有名人ということが分かる。
【0028】語義の曖昧性が相手側の言語で解消され
て、構文的な係り受けの曖昧性の解消につながる場合も
考えられる。例えば、英語文を対象言語とし、日本語を
対訳で入力する場合を考える。「He saw a girl laughi
ng at the second story.」という英語文の場合、彼女
が二番目の話を聞いて笑っているのか、彼が二階で見た
のか、二階で笑っている少女を見たのか、つまり、「at
the second story」が「laughing」に係るのか「saw」
に係るのか、曖昧である。ここで対訳が「彼は二番目の
話を聞いて笑っている少女を見た。」であれば、「stor
y」は「階」を意味するのではなく、「話」を意味する
ことから、「laughing」に係っていることが正確に解析
できる。
【0029】上記例とも関連するが、対訳の情報は構文
解析だけでなく、語義の曖昧性解消にも寄与する。単純
な例として、英語の「bank」の曖昧性に着目する。英語
の「bank」の語義には「銀行」と「土手」という意味の
曖昧性がある一方、日本語の「銀行」と「土手」という
単語は同じ意味として使われることはない。そこで、
「bank」が対訳の日本語文側にどちらの単語として現れ
ているかを調べれば容易に曖昧性を解消することができ
る。そして、語義の曖昧性が相手側の言語によって解消
されることによって係り先が容易に決まることによっ
て、正確な構文解析に寄与することもできる。
【0030】本発明では、以上に示したように従来の単
言語文書を構文解析する手法に、対訳文書の入力を行う
ことで、極めて高精度な構文解析が行えることを編み出
し、新しい構文解析装置の創出を行った。特に、語順の
制約が緩やかな言語と厳しい言語では、厳しい言語によ
る語順を解析することによって、緩やかな言語で複数の
解析結果が得られた場合に、該解析結果中、制約の厳し
い言語で認められ得る解析結果を採用すればよく、簡便
に、かつ高精度に構文解析を行うことができる。
【0031】
【発明の効果】本発明は、以上の構成を備えるので、次
の効果を奏する。請求項1ないし3に記載の構文解析方
法では、従来複数の解析結果が得られた場合に困難であ
った最適な構文解析結果の特定が可能となり、高精度な
構文解析方法に寄与する。特に、日本語などで語順の制
約の緩さから、複数の解釈が可能な文章について、従来
の手法では膨大な知識を備えて、より確からしい解釈を
行うほかなかったが、本発明によると語順の制約が厳し
い言語を対訳文書として入力することにより、適当な解
釈の採用が可能となる。
【0032】さらに、本発明では語順以外にも文法的な
情報も有効に用いることができるので、例えば日本語文
では主語が曖昧な場合にも、英語の単複形から的確な特
定が可能となるなど、解析精度の向上に寄与することが
できる。他に、省略の有無の情報を用いることもでき
る。日本語文では主語が省略され格解析で主語を特定す
る必要がある場合に、従来の単言語のみの解析ではその
予測が困難であったが、本発明によれば、主語を英語文
を参照することによって正確に特定できるため、解析精
度が向上する。単言語のみの入力では、1つの単語に複
数の語義がある場合は少なくなく、従来の構文解析方法
では、しばしば誤った語義の認識から、誤った解析が行
われる例が見られた。この点についても、本発明では対
訳から的確な語義の特定が可能となり、構文解析精度の
向上を図ることができる。
【0033】以上の方法は、実際にしばしば存在する対
訳文書を用いるだけで正確な構文解析が可能となるの
で、構文解析中に人手を介在させて最適な解析結果を選
択するよりも極めて簡便であり、構文解析ひいては言語
処理の自動化の要請にも応えるものである。
【0034】請求項4ないし6に記載の構文解析装置に
よると、対訳関係にある2つ以上の文書を入力すること
で、形態素解析、依存関係解析や格解析等の構文解析を
自動的に行い、例えば依存関係で不明な場合には対訳関
係の文書を解析し、その結果から適切な依存関係を決定
することができるので、従来の構文解析装置を置換可能
な高精度な構文解析装置を提供することが出来る。本発
明は、すでに提供されている複数の対訳言語を入力する
ことで第3言語を生成する翻訳システムに導入すること
で、特に効果的である。
【図面の簡単な説明】
【図1】従来の技術における、単言語文書を目標言語に
変換、生成するフローチャートである。
【図2】本発明の構文解析装置を導入するのに好適な翻
訳システムのフローチャートである。
【図3】本発明における構文解析装置の構成図である。
【符号の説明】
20a 単言語文書 20b 対訳文書 21 本発明に係る構文解析装置 30 CPU部 31 読み取り部 32 外部記憶部 33 ROM・RAM 34 形態素解析ステップ 35 依存関係解析ステップ 36 格解析ステップ 37 対訳検索ステップ 38 対訳文書依存関係解析ステップ

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】言語処理における構文解析方法であって、 構文解析を行う対象テキストと、該対象テキストと少な
    くともその一部が対訳関係にある1つ以上の対訳テキス
    トとを入力し、 該対象テキスト及び対訳テキストの構文解析を行い、 該対象テキストについて、少なくとも2通り以上の構文
    解析情報が得られる場合に、 いずれかの対訳テキストの構文解析情報を用い、該対訳
    テキストの構文解析情報から最も適当な対象テキストの
    構文解析情報を特定し、 該対象テキストの構文解析結果として出力することを特
    徴とする構文解析方法。
  2. 【請求項2】前記構文解析方法が、 前記対象テキストについて、少なくとも2通り以上の構
    文解析情報が得られる場合に、 いずれかの対訳テキストにおける語順に係る情報又は、
    文法的情報又は、省略の有無情報又は、語義情報の少な
    くともいずれかに基づいて構文解析情報を得、該対訳テ
    キストの構文解析情報から最も適当な対象テキストの構
    文解析情報を特定することを特徴とする請求項1に記載
    の構文解析方法。
  3. 【請求項3】前記構文解析方法が、 複数の言語テキストを用いて新たな第3の言語テキスト
    を生成する過程に用いられる請求項1又は2に記載の構
    文解析方法。
  4. 【請求項4】言語処理における構文解析を行う装置であ
    って、 構文解析を行う対象テキストを入力する対象テキスト入
    力手段、 該対象テキストと、少なくともその一部が対訳関係にあ
    る対訳テキストを、対訳関係を関連づけながら入力する
    対訳テキスト入力手段、 該入力された対象テキスト及び対訳テキストに係る形態
    素解析を行う形態素解析手段、 該形態素解析の結果に対して構文解析を行う構文解析手
    段、 該対象テキストの構文解析結果において、複数の構文解
    析結果が得られた場合、又は複数の構文解析結果のうち
    1つの構文解析結果が所定の確からしさを超えない場合
    に、対訳テキストの構文解析結果を参照し、 最も適当な対象テキストの構文解析結果を特定する最適
    結果特定手段、 該最適な結果を出力する構文解析結果出力手段を備える
    ことを特徴とする構文解析装置。
  5. 【請求項5】前記構文解析装置の構文解析手段におい
    て、 前記対象テキストについて、少なくとも2通り以上の構
    文解析情報が得られる場合に、 いずれかの対訳テキストにおける語順に係る情報又は、
    文法的情報又は、省略の有無情報又は、語義情報の少な
    くともいずれかに基づいて構文解析情報を得、 前記最適結果特定手段が、 該対訳テキストの構文解析情報から最も適当な対象テキ
    ストの構文解析情報を特定することを特徴とする請求項
    4に記載の構文解析装置。
  6. 【請求項6】前記構文解析装置が、 複数の言語テキストを用いて新たな第3の言語テキスト
    を生成する装置に具備される請求項4又は5に記載の構
    文解析装置。
JP2001395617A 2001-12-27 2001-12-27 構文解析方法及び装置 Expired - Lifetime JP3906356B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2001395617A JP3906356B2 (ja) 2001-12-27 2001-12-27 構文解析方法及び装置
US10/499,975 US20050086047A1 (en) 2001-12-27 2002-12-17 Syntax analysis method and apparatus
PCT/JP2002/013186 WO2003056450A1 (en) 2001-12-27 2002-12-17 Syntax analysis method and apparatus
EP02788853A EP1471439A4 (en) 2001-12-27 2002-12-17 SYNTAX ANALYSIS PROCESS AND DEVICE

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001395617A JP3906356B2 (ja) 2001-12-27 2001-12-27 構文解析方法及び装置

Publications (2)

Publication Number Publication Date
JP2003196274A true JP2003196274A (ja) 2003-07-11
JP3906356B2 JP3906356B2 (ja) 2007-04-18

Family

ID=19189011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001395617A Expired - Lifetime JP3906356B2 (ja) 2001-12-27 2001-12-27 構文解析方法及び装置

Country Status (4)

Country Link
US (1) US20050086047A1 (ja)
EP (1) EP1471439A4 (ja)
JP (1) JP3906356B2 (ja)
WO (1) WO2003056450A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008108209A (ja) * 2006-10-27 2008-05-08 Internatl Business Mach Corp <Ibm> 機械翻訳の精度を向上させる技術

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8539063B1 (en) 2003-08-29 2013-09-17 Mcafee, Inc. Method and system for containment of networked application client software by explicit human input
JP4476609B2 (ja) * 2003-12-10 2010-06-09 株式会社東芝 中国語解析装置、中国語解析方法および中国語解析プログラム
US7840968B1 (en) 2003-12-17 2010-11-23 Mcafee, Inc. Method and system for containment of usage of language interfaces
US7873955B1 (en) * 2004-09-07 2011-01-18 Mcafee, Inc. Solidifying the executable software set of a computer
US7856661B1 (en) 2005-07-14 2010-12-21 Mcafee, Inc. Classification of software on networked systems
US7757269B1 (en) 2006-02-02 2010-07-13 Mcafee, Inc. Enforcing alignment of approved changes and deployed changes in the software change life-cycle
US7895573B1 (en) * 2006-03-27 2011-02-22 Mcafee, Inc. Execution environment file inventory
US8352930B1 (en) * 2006-04-24 2013-01-08 Mcafee, Inc. Software modification by group to minimize breakage
US8555404B1 (en) 2006-05-18 2013-10-08 Mcafee, Inc. Connectivity-based authorization
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
US8195447B2 (en) * 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US8548795B2 (en) 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9424154B2 (en) 2007-01-10 2016-08-23 Mcafee, Inc. Method of and system for computer system state checks
US8332929B1 (en) 2007-01-10 2012-12-11 Mcafee, Inc. Method and apparatus for process enforced configuration management
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
US8701189B2 (en) 2008-01-31 2014-04-15 Mcafee, Inc. Method of and system for computer system denial-of-service protection
US8615502B2 (en) 2008-04-18 2013-12-24 Mcafee, Inc. Method of and system for reverse mapping vnode pointers
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
TWI376656B (en) * 2008-09-11 2012-11-11 Shing Lung Chen Foreign-language learning method utilizing an original language to review corresponding foreign languages and foreign-language learning database system thereof
US8544003B1 (en) 2008-12-11 2013-09-24 Mcafee, Inc. System and method for managing virtual machine configurations
US8381284B2 (en) 2009-08-21 2013-02-19 Mcafee, Inc. System and method for enforcing security policies in a virtual environment
US9552497B2 (en) * 2009-11-10 2017-01-24 Mcafee, Inc. System and method for preventing data loss using virtual machine wrapped applications
US8925101B2 (en) 2010-07-28 2014-12-30 Mcafee, Inc. System and method for local protection against malicious software
US8938800B2 (en) 2010-07-28 2015-01-20 Mcafee, Inc. System and method for network level protection against malicious software
US8549003B1 (en) 2010-09-12 2013-10-01 Mcafee, Inc. System and method for clustering host inventories
US9075993B2 (en) 2011-01-24 2015-07-07 Mcafee, Inc. System and method for selectively grouping and managing program files
US9112830B2 (en) 2011-02-23 2015-08-18 Mcafee, Inc. System and method for interlocking a host and a gateway
KR20130014106A (ko) * 2011-07-29 2013-02-07 한국전자통신연구원 다중 번역 엔진을 사용한 번역 장치 및 방법
US9594881B2 (en) 2011-09-09 2017-03-14 Mcafee, Inc. System and method for passive threat detection using virtual memory inspection
US8694738B2 (en) 2011-10-11 2014-04-08 Mcafee, Inc. System and method for critical address space protection in a hypervisor environment
US8973144B2 (en) 2011-10-13 2015-03-03 Mcafee, Inc. System and method for kernel rootkit protection in a hypervisor environment
US9069586B2 (en) 2011-10-13 2015-06-30 Mcafee, Inc. System and method for kernel rootkit protection in a hypervisor environment
US8713668B2 (en) 2011-10-17 2014-04-29 Mcafee, Inc. System and method for redirected firewall discovery in a network environment
US8800024B2 (en) 2011-10-17 2014-08-05 Mcafee, Inc. System and method for host-initiated firewall discovery in a network environment
US8935151B1 (en) * 2011-12-07 2015-01-13 Google Inc. Multi-source transfer of delexicalized dependency parsers
US8739272B1 (en) 2012-04-02 2014-05-27 Mcafee, Inc. System and method for interlocking a host and a gateway
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US8973146B2 (en) 2012-12-27 2015-03-03 Mcafee, Inc. Herd based scan avoidance system in a network environment
CN105580023B (zh) 2013-10-24 2019-08-16 迈克菲股份有限公司 网络环境中的代理辅助的恶意应用阻止
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
CN114154497B (zh) * 2021-12-03 2025-07-22 科大讯飞河北科技有限公司 语病识别方法、装置、电子设备和存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
JPH10116286A (ja) * 1996-10-09 1998-05-06 Nippon Telegr & Teleph Corp <Ntt> 自然言語翻訳方法及び装置
JP3508904B2 (ja) * 1997-03-25 2004-03-22 日本電信電話株式会社 自然言語解析装置
US6370498B1 (en) * 1998-06-15 2002-04-09 Maria Ruth Angelica Flores Apparatus and methods for multi-lingual user access
US6275789B1 (en) * 1998-12-18 2001-08-14 Leo Moser Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
CN1302030B (zh) * 1999-12-24 2010-04-21 纽昂斯通讯公司 词义消歧的机器翻译方法和系统
US7016829B2 (en) * 2001-05-04 2006-03-21 Microsoft Corporation Method and apparatus for unsupervised training of natural language processing units
AU2002316581A1 (en) * 2001-07-03 2003-01-21 University Of Southern California A syntax-based statistical translation model

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008108209A (ja) * 2006-10-27 2008-05-08 Internatl Business Mach Corp <Ibm> 機械翻訳の精度を向上させる技術
US8126698B2 (en) 2006-10-27 2012-02-28 International Business Machines Corporation Technique for improving accuracy of machine translation

Also Published As

Publication number Publication date
EP1471439A1 (en) 2004-10-27
JP3906356B2 (ja) 2007-04-18
WO2003056450A1 (en) 2003-07-10
EP1471439A4 (en) 2010-03-31
US20050086047A1 (en) 2005-04-21

Similar Documents

Publication Publication Date Title
JP2003196274A (ja) 構文解析方法及び装置
Al-Twairesh et al. Suar: Towards building a corpus for the Saudi dialect
Antony et al. A survey of advanced methods for efficient text summarization
Aasha et al. Machine translation from English to Malayalam using transfer approach
Graliński et al. PSI-toolkit: A natural language processing pipeline
JP2007241764A (ja) 構文解析プログラム、構文解析方法、構文解析装置、及び構文解析プログラムが記録されたコンピュータ読み取り可能な記録媒体
Sreedeepa et al. Interlingua based Sanskrit-English machine translation
Kammoun et al. The MORPH2 new version: A robust morphological analyzer for Arabic texts
Mille et al. Making Text Resources Accessible to the Reader: the Case of Patent Claims.
Sankaravelayuthan et al. A Comprehensive Study of Shallow Parsing and Machine Translation in Malaylam
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Rajendran Parsing in tamil: Present state of art
Ternovykh et al. Recent advances in textual code-switching
Çakıcı et al. Wide-coverage parsing, semantics, and morphology
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP5245291B2 (ja) 文書解析装置、および文書解析方法、並びにコンピュータ・プログラム
Shukla et al. A Framework of Translator from English Speech to Sanskrit Text
Winge Automatic annotation of Latin vowel length
Khemakhem et al. Arabic morpho-syntactic feature disambiguation in a translation context
Shquier et al. Fully automated Arabic to English machine translation system: transfer-based approach of AE-TBMT
Khemakhem et al. The MIRACL Arabic-English statistical machine translation system for IWSLT 2010
Uddin et al. Bangla to english text conversion using opennlp tools
Najar Integrated NooJ Environment for Arabic Linguistic Disambiguation Improvement Using
Ullah et al. Enhancing English–Urdu Machine Translation Using Transfer Learning
Goyal et al. SIG

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030826

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060919

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061117

R150 Certificate of patent or registration of utility model

Ref document number: 3906356

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term