JPH0827799B2 - 意訳用辞書 - Google Patents
意訳用辞書Info
- Publication number
- JPH0827799B2 JPH0827799B2 JP61076994A JP7699486A JPH0827799B2 JP H0827799 B2 JPH0827799 B2 JP H0827799B2 JP 61076994 A JP61076994 A JP 61076994A JP 7699486 A JP7699486 A JP 7699486A JP H0827799 B2 JPH0827799 B2 JP H0827799B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- information
- meaning
- semantic
- morphological
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Machine Translation (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は、言語処理システムにおいて、形態情報、文
法情報、意味情報、類義語情報という各種言語データを
格納、管理、検索する辞書管理方式に関し、多言語間の
類語検索を実現する意訳用辞書に関する。
法情報、意味情報、類義語情報という各種言語データを
格納、管理、検索する辞書管理方式に関し、多言語間の
類語検索を実現する意訳用辞書に関する。
(従来技術とその問題点) 機械翻訳システムのような言語理解システムには、見
出し語(形態素表記あるいは単語表記)、形態情報、構
文情報(文法情報)、意味情報を格納する辞書が必要で
ある。機械翻訳用の辞書として、見出し語と意味シンボ
ルを辞書検索キーとし、形態情報、構文情報、意味情報
をポインタで結んだ辞書方式(特願昭59−148138)が知
られている、ここで形態素表記とは、「構成」「constr
uct」のような文字表記であり、また、形態情報とは
「構成」に対する「2字漢字」といった字種情報であ
り、「construct」に対する「先頭が子音」といった音
韻情報である。さらに、意味シンボルとは、その単語の
概念を表記する記号のことで、単語の活用や構文変化に
対しては不変である。但し、形態や構文の差によって意
味が変化する場合は、各々別のシンボルとなる。また、
意味の変化する慣用句も含まれる。例えば、「goes」は
「go」と同じ意味なので、シンボル「goes」や「goin
g」はなく、シンボル「go」になる。また、「bank(銀
行)」と「bank(土手)」、及び、「interest(利
子)」と「interesting(興味のある)」とではそれぞ
れ表現は等しいか、あるいは、現在分詞の形態である
が、意味が異なるため各々のシンボルが存在する。ま
た、「take」と「take part in」では異なる意味のた
め、各々シンボルが存在する。
出し語(形態素表記あるいは単語表記)、形態情報、構
文情報(文法情報)、意味情報を格納する辞書が必要で
ある。機械翻訳用の辞書として、見出し語と意味シンボ
ルを辞書検索キーとし、形態情報、構文情報、意味情報
をポインタで結んだ辞書方式(特願昭59−148138)が知
られている、ここで形態素表記とは、「構成」「constr
uct」のような文字表記であり、また、形態情報とは
「構成」に対する「2字漢字」といった字種情報であ
り、「construct」に対する「先頭が子音」といった音
韻情報である。さらに、意味シンボルとは、その単語の
概念を表記する記号のことで、単語の活用や構文変化に
対しては不変である。但し、形態や構文の差によって意
味が変化する場合は、各々別のシンボルとなる。また、
意味の変化する慣用句も含まれる。例えば、「goes」は
「go」と同じ意味なので、シンボル「goes」や「goin
g」はなく、シンボル「go」になる。また、「bank(銀
行)」と「bank(土手)」、及び、「interest(利
子)」と「interesting(興味のある)」とではそれぞ
れ表現は等しいか、あるいは、現在分詞の形態である
が、意味が異なるため各々のシンボルが存在する。ま
た、「take」と「take part in」では異なる意味のた
め、各々シンボルが存在する。
この方式では、類義語の中の形態や構文情報の差、あ
るいは、ニュアンスレベルの差しかない、ほぼ同語の語
彙同士は、意味シンボルが同一であることにより、関係
づけが可能である。つまり狭義の類義語同士は関係づけ
可能である。しかし、能動態と受動態にみられるような
動作と状態といったアスペクト情報の差、副詞修飾の有
無などによる程度の差、自動詞と他動詞の間にみられる
ようなの関係や焦点に関するの意味相違を含む、広義の
類義語同士は同一の意味シンボルにはできない。同一の
意味シンボルとすることは、意味的な差がないと記述し
たことに相当し、結果として差の意味情報が失われるこ
とになる。これは辞書として不適切である。また、異な
る意味シンボルを関係付ける枠組は存在しない。従っ
て、広義の類義語であっても、狭義の類義語でない場合
に、語同士を関係づけることができない。
るいは、ニュアンスレベルの差しかない、ほぼ同語の語
彙同士は、意味シンボルが同一であることにより、関係
づけが可能である。つまり狭義の類義語同士は関係づけ
可能である。しかし、能動態と受動態にみられるような
動作と状態といったアスペクト情報の差、副詞修飾の有
無などによる程度の差、自動詞と他動詞の間にみられる
ようなの関係や焦点に関するの意味相違を含む、広義の
類義語同士は同一の意味シンボルにはできない。同一の
意味シンボルとすることは、意味的な差がないと記述し
たことに相当し、結果として差の意味情報が失われるこ
とになる。これは辞書として不適切である。また、異な
る意味シンボルを関係付ける枠組は存在しない。従っ
て、広義の類義語であっても、狭義の類義語でない場合
に、語同士を関係づけることができない。
例えば、表1では、意味シンボル「READ」を介して、
日本語名詞(読書)と英語動詞(READ)が関係づけられ
ているので、名詞「読書」の訳語として名詞句「readin
g」の選択が可能である。また、意味シンボル「SMALL」
を介して日本語「小さい」を英語「little」とも「smal
l」とも訳せる。これらは、それぞれ狭義の類義語であ
り、従って意味シンボルが同一であるからである。
日本語名詞(読書)と英語動詞(READ)が関係づけられ
ているので、名詞「読書」の訳語として名詞句「readin
g」の選択が可能である。また、意味シンボル「SMALL」
を介して日本語「小さい」を英語「little」とも「smal
l」とも訳せる。これらは、それぞれ狭義の類義語であ
り、従って意味シンボルが同一であるからである。
しかしながら、表2で示すように日本語「構成」に対
して英語、「construct」と「consist−of」に対して、
意味シンボル「CONSTRUCT」と「CONSIST−OF」が別個に
存在する。というのも「construct」は動作を表現する
のに対して、「consist−of」は状態を表現するので、
意味的に差があるため、両者は狭義の意味では類義語と
はいえないからである。であるから、それぞれの意味シ
ンボルが、日本語の「構成(が、を、から)」と英語
「construct」、および、日本語の「構成(が、を)」
と英語の「cosist−of」に対応する。前者「CONSTRUC
T」が「人々は家を木と土と水から構成する」の「構
成」に対応し、後者の「CONSIST−OF」は「木と土と水
が家を構成する」の「構成」に対応する。両者は、意味
シンボルが異なるため、前述したように関係づけること
ができない。一方、前者「構成(が、を、から)」を受
動態で用いた「家が土と木と水から構成されている」と
いう文が存在する。この文の意味は、「ある対象
(家)」が「ある資源(土と木と水)」を元に「ある状
態(構成」にあることと表現される。また、後者「構成
(が、を)」を能動態で用いた「土と木と水が家を構成
する」という文もあり、この意味は先の文と等しいはず
である。しかし、前述のような意味シンボルの差により
関係づけが不可能なため、意味的に同一であることを表
現できない。従って、機械翻訳等でも両方の文は別の意
味として解釈され、異なる訳文を生成することになる。
して英語、「construct」と「consist−of」に対して、
意味シンボル「CONSTRUCT」と「CONSIST−OF」が別個に
存在する。というのも「construct」は動作を表現する
のに対して、「consist−of」は状態を表現するので、
意味的に差があるため、両者は狭義の意味では類義語と
はいえないからである。であるから、それぞれの意味シ
ンボルが、日本語の「構成(が、を、から)」と英語
「construct」、および、日本語の「構成(が、を)」
と英語の「cosist−of」に対応する。前者「CONSTRUC
T」が「人々は家を木と土と水から構成する」の「構
成」に対応し、後者の「CONSIST−OF」は「木と土と水
が家を構成する」の「構成」に対応する。両者は、意味
シンボルが異なるため、前述したように関係づけること
ができない。一方、前者「構成(が、を、から)」を受
動態で用いた「家が土と木と水から構成されている」と
いう文が存在する。この文の意味は、「ある対象
(家)」が「ある資源(土と木と水)」を元に「ある状
態(構成」にあることと表現される。また、後者「構成
(が、を)」を能動態で用いた「土と木と水が家を構成
する」という文もあり、この意味は先の文と等しいはず
である。しかし、前述のような意味シンボルの差により
関係づけが不可能なため、意味的に同一であることを表
現できない。従って、機械翻訳等でも両方の文は別の意
味として解釈され、異なる訳文を生成することになる。
(発明の効果) 本発明は、上述の欠点を解消し、類義語の意味やニュ
アンスの差や、能動態と受動態、自動詞と他動詞の間の
意味や焦点の相違を考慮することができる意訳用辞書を
提案することを目的とする。
アンスの差や、能動態と受動態、自動詞と他動詞の間の
意味や焦点の相違を考慮することができる意訳用辞書を
提案することを目的とする。
(発明の構成) (a)形態素表記や形態情報、およびそれらに対応する
文法情報記述辞書項目へのポインタを有する形態辞書手
段、 (b)前記形態辞書手段内の前記文法情報記述辞書項目
に対応する品詞・文法情報、前記形態辞書手段内の項目
へのポインタ、および前記形態素表記と当該品詞・文法
情報とに対応する意味情報記述辞書項目へのポインタを
保持する構文辞書手段、 (c)意味シンボルや意味情報、それらに対応する前記
構文辞書項目へのポインタ、およびその意味情報の上位
概念を記述するシソーラス項目へのポインタを格納する
意味辞書手段、 (d)前記形態辞書手段内の形態素表記、および前記意
味辞書手段内の意味シンボルを、検索キーとして有する
辞書検索手段、 (e)意味シンボル、当該シソーラス情報に対応する類
義語間に共通する意味情報、その各類義語の格フレーム
を包含する格フレームおよびその各類義語の意味辞書手
段内の意味情報記述辞書項目へのポインタを有するシソ
ーラス手段、 を具備する意訳用辞書が得られる。
文法情報記述辞書項目へのポインタを有する形態辞書手
段、 (b)前記形態辞書手段内の前記文法情報記述辞書項目
に対応する品詞・文法情報、前記形態辞書手段内の項目
へのポインタ、および前記形態素表記と当該品詞・文法
情報とに対応する意味情報記述辞書項目へのポインタを
保持する構文辞書手段、 (c)意味シンボルや意味情報、それらに対応する前記
構文辞書項目へのポインタ、およびその意味情報の上位
概念を記述するシソーラス項目へのポインタを格納する
意味辞書手段、 (d)前記形態辞書手段内の形態素表記、および前記意
味辞書手段内の意味シンボルを、検索キーとして有する
辞書検索手段、 (e)意味シンボル、当該シソーラス情報に対応する類
義語間に共通する意味情報、その各類義語の格フレーム
を包含する格フレームおよびその各類義語の意味辞書手
段内の意味情報記述辞書項目へのポインタを有するシソ
ーラス手段、 を具備する意訳用辞書が得られる。
(実施例) 以下に、図表を参照して、本発明を詳細に説明する。
以下では説明を容易にするために日本語、英語に例をと
る。
以下では説明を容易にするために日本語、英語に例をと
る。
第1図は、本発明の一実施例を示すブロック図であ
る。また、本発明の辞書検索手段0,4、形態辞書手段
1、構文辞書手段2、意味辞書手段3とについては、特
願昭59−148138号明細書(特開昭61−26176号公報)に
記載されている方式と同様であるので、ここでは簡略し
た説明にとどめる。
る。また、本発明の辞書検索手段0,4、形態辞書手段
1、構文辞書手段2、意味辞書手段3とについては、特
願昭59−148138号明細書(特開昭61−26176号公報)に
記載されている方式と同様であるので、ここでは簡略し
た説明にとどめる。
辞書検索手段0は、形態素表記を指定し、対応する形
態情報/品詞・文法情報/意味情報などの情報を出力す
る機能を有する。外部からの形態素表記を入力とし、そ
れに対応する形態辞書項目を形態辞書手段1に出力する
(01)。
態情報/品詞・文法情報/意味情報などの情報を出力す
る機能を有する。外部からの形態素表記を入力とし、そ
れに対応する形態辞書項目を形態辞書手段1に出力する
(01)。
また、辞書検索手段4からの意味シンボル入力が各種
辞書手段を介した後に形態辞書手段1から対応する形態
情報/品詞・文法情報/意味情報などの情報として本辞
書検索手段0に入力される。
辞書手段を介した後に形態辞書手段1から対応する形態
情報/品詞・文法情報/意味情報などの情報として本辞
書検索手段0に入力される。
形態辞書手段1は、形態素表記/形態情報とその情報
に対応する文法情報記述辞書項目へのポインタとを有す
る形態辞書項目のセットからなり、形態情報を文法情報
に対応付ける機能を有する。辞書検索手段0を介して特
定の形態辞書項目が入力されると、該形態辞書項目内の
形態素表記と形態情報とが対応する全ての文法情報記述
辞書項目を構文辞書手段2に対して出力する(12)。
に対応する文法情報記述辞書項目へのポインタとを有す
る形態辞書項目のセットからなり、形態情報を文法情報
に対応付ける機能を有する。辞書検索手段0を介して特
定の形態辞書項目が入力されると、該形態辞書項目内の
形態素表記と形態情報とが対応する全ての文法情報記述
辞書項目を構文辞書手段2に対して出力する(12)。
また、構文辞書手段2を介して形態辞書項目が入力さ
れると、付随入力の品詞・文法情報や意味情報と共に対
応する形態素表記/形態辞書を辞書検索手段0に出力す
る。
れると、付随入力の品詞・文法情報や意味情報と共に対
応する形態素表記/形態辞書を辞書検索手段0に出力す
る。
構文辞書手段2は、品詞・文法情報とそれに対応する
形態辞書項目へのポインタ、及び意味情報記述辞書項目
へのポインタとを有する文法情報記述辞書項目のセット
からなる。品詞・文法情報を形態情報に、あるいは、品
詞・文法情報を意味情報に対応付ける機能を有する。
形態辞書項目へのポインタ、及び意味情報記述辞書項目
へのポインタとを有する文法情報記述辞書項目のセット
からなる。品詞・文法情報を形態情報に、あるいは、品
詞・文法情報を意味情報に対応付ける機能を有する。
形態辞書手段1を介して特定の文法情報記述辞書項目
が入力されると(12)、付随入力の形態情報と、該文法
情報記述辞書項目内の品詞・文法情報と、対応する全て
の意味情報記述辞書項目を意味辞書手段3に出力する。
が入力されると(12)、付随入力の形態情報と、該文法
情報記述辞書項目内の品詞・文法情報と、対応する全て
の意味情報記述辞書項目を意味辞書手段3に出力する。
また、意味辞書手段3を介して特定の文法情報記述辞
書項目が入力されると(23)、付随入力の意味情報と文
法情報記述辞書項目内の品詞・文法情報と、対応する全
ての形態辞書項目を形態辞書手段1に出力する(12)。
書項目が入力されると(23)、付随入力の意味情報と文
法情報記述辞書項目内の品詞・文法情報と、対応する全
ての形態辞書項目を形態辞書手段1に出力する(12)。
意味辞書手段3は、意味シンボルや意味情報とそれに
対応する文法情報記述辞書項目へのポインタと、シソー
ラス項目へのポインタとを有する意味情報記述辞書項目
のセットからなる。意味情報をシソーラス上の上位概念
に、あるいは、品詞・文法情報に対応付ける機能を有す
る。
対応する文法情報記述辞書項目へのポインタと、シソー
ラス項目へのポインタとを有する意味情報記述辞書項目
のセットからなる。意味情報をシソーラス上の上位概念
に、あるいは、品詞・文法情報に対応付ける機能を有す
る。
構文辞書手段2を介して特定の意味情報記述辞書項目
が入力されると(23)、付随入力の形態情報/品詞・文
法情報と意味情報記述辞書項目内の意味情報を辞書検索
手段4へ出力する。同時に対応する全てのシソーラス項
目をシソーラス手段5に出力する(35)。
が入力されると(23)、付随入力の形態情報/品詞・文
法情報と意味情報記述辞書項目内の意味情報を辞書検索
手段4へ出力する。同時に対応する全てのシソーラス項
目をシソーラス手段5に出力する(35)。
また、シソーラス手段5または辞書検索手段4を介し
て特定の意味情報記述辞書項目が入力されると(34、3
5)、意味情報記述辞書項目内の意味シンボルや意味情
報とともに、対応する全ての文法情報記述辞書項目を構
文辞書手段2に出力する(23)。
て特定の意味情報記述辞書項目が入力されると(34、3
5)、意味情報記述辞書項目内の意味シンボルや意味情
報とともに、対応する全ての文法情報記述辞書項目を構
文辞書手段2に出力する(23)。
辞書検索手段4は、意味シンボルからそれに対応する
形態情報/品詞・文法情報/意味情報などの情報を出力
する機能を有する。外部からの意味シンボルを入力と
し、対応する意味情報記述辞書項目を意味辞書手段3に
出力する(34)。また、辞書検索手段0からの形態素表
記入力が各種辞書手段を介した後に意味辞書手段3から
対応する形態情報/品詞・文法情報/意味情報などの情
報として本辞書検索手段4にに入力される。
形態情報/品詞・文法情報/意味情報などの情報を出力
する機能を有する。外部からの意味シンボルを入力と
し、対応する意味情報記述辞書項目を意味辞書手段3に
出力する(34)。また、辞書検索手段0からの形態素表
記入力が各種辞書手段を介した後に意味辞書手段3から
対応する形態情報/品詞・文法情報/意味情報などの情
報として本辞書検索手段4にに入力される。
シソーラス手段5は、意味的な上下関係を基軸とした
階層構造をもち、意味シンボルとともにその下位の意味
情報記述辞書項目の内容を包含する意味情報と格フレー
ム情報を有し、下位の全ての意味情報記述辞書項目への
ポインタを有するシソーラス項目のセットからなる。類
義の意味辞書項目同士を対応付ける機能を有する。
階層構造をもち、意味シンボルとともにその下位の意味
情報記述辞書項目の内容を包含する意味情報と格フレー
ム情報を有し、下位の全ての意味情報記述辞書項目への
ポインタを有するシソーラス項目のセットからなる。類
義の意味辞書項目同士を対応付ける機能を有する。
意味辞書手段3を介して特定のシソーラス項目が入力
されると(35)、項目内容とともに対応する全ての意味
情報記述辞書項目を意味辞書検索手段3へ出力する(2
3)。
されると(35)、項目内容とともに対応する全ての意味
情報記述辞書項目を意味辞書検索手段3へ出力する(2
3)。
ここで、本発明の動作の実施例について、「家が土と
木と水から構成された」及び「very large」が入力デー
タとして入力された場合を例にとり、図表を用いて説明
する。
木と水から構成された」及び「very large」が入力デー
タとして入力された場合を例にとり、図表を用いて説明
する。
ここで、入力データ「家が土と木と水から構成され
た」について説明する。まず、「構成」に対して、辞書
検索手段0、形態辞書手段1、構文辞書手段2を経て意
味情報記述辞書項目ID1が意味辞書手段3へ出力され
る。形態辞書手段1から形態素表記「構成」や形態情報
(文字:2字漢字)が、また、構文辞書手段2からは、品
詞(動詞)や文法情報(動詞形:が、を、から)などが
求まる。ここで、動詞形とは、その動詞がとりやすい助
詞の集合のことである。更に、意味辞書手段3により、
第2図に示したように、「意味シンボル:S# CONSTRUC
T,意味情報:動作,格フレーム:AGENT,OBJECT,SOURCE」
が求まる。一方「された」から「動作を受動化すると状
態化する」という日本語の特色により意味情報が状態に
変更され、また助詞「が、から」から利用される格は
「OBJECT,SOURCE」のみとなる。なお、本例での意味情
報は動詞のアスペクトであり、また、格フレームはフィ
ルモアの深層格に準拠する。(フィルモアの深層格につ
いては、「格文法の原理 言語の意味と構造」フィルモ
ア著(田中春美、船城道雄 訳)三省堂出版1975年刊に
詳しい。) よって、「構成された」の入力データの意味として
「意味シンボル:S# CONSTRUCT,意味情報:状態,格フ
レーム:OBJECT,SOURCE」が求まる。
た」について説明する。まず、「構成」に対して、辞書
検索手段0、形態辞書手段1、構文辞書手段2を経て意
味情報記述辞書項目ID1が意味辞書手段3へ出力され
る。形態辞書手段1から形態素表記「構成」や形態情報
(文字:2字漢字)が、また、構文辞書手段2からは、品
詞(動詞)や文法情報(動詞形:が、を、から)などが
求まる。ここで、動詞形とは、その動詞がとりやすい助
詞の集合のことである。更に、意味辞書手段3により、
第2図に示したように、「意味シンボル:S# CONSTRUC
T,意味情報:動作,格フレーム:AGENT,OBJECT,SOURCE」
が求まる。一方「された」から「動作を受動化すると状
態化する」という日本語の特色により意味情報が状態に
変更され、また助詞「が、から」から利用される格は
「OBJECT,SOURCE」のみとなる。なお、本例での意味情
報は動詞のアスペクトであり、また、格フレームはフィ
ルモアの深層格に準拠する。(フィルモアの深層格につ
いては、「格文法の原理 言語の意味と構造」フィルモ
ア著(田中春美、船城道雄 訳)三省堂出版1975年刊に
詳しい。) よって、「構成された」の入力データの意味として
「意味シンボル:S# CONSTRUCT,意味情報:状態,格フ
レーム:OBJECT,SOURCE」が求まる。
従来の方式ではこのID1に継る訳語「construct」の選
択のみが可能で「beconstructed」のような表現が選択
されていた。本発明では意味辞書手段に従い、ID1とTD1
の上位/下位関係を利用して、上位のシソーラス項目TD
1を得る。更にシソーラス手段に従って、TD1の下位語で
ID1の類義語として項目ID2を参照できる。このID2の意
味情報と格フレームの内容とが、先の入力文からの情報
と一致することにより、この意味情報記述辞書項目が選
択される。
択のみが可能で「beconstructed」のような表現が選択
されていた。本発明では意味辞書手段に従い、ID1とTD1
の上位/下位関係を利用して、上位のシソーラス項目TD
1を得る。更にシソーラス手段に従って、TD1の下位語で
ID1の類義語として項目ID2を参照できる。このID2の意
味情報と格フレームの内容とが、先の入力文からの情報
と一致することにより、この意味情報記述辞書項目が選
択される。
更に、意味辞書手段、構文辞書手段と形態辞書手段を
介して、ID2からつながる形態素表記「consist of」
が、入力データに対応する訳語となる。
介して、ID2からつながる形態素表記「consist of」
が、入力データに対応する訳語となる。
同様に入力データ「very large」では、[large]か
ら意味情報記述辞書項目ID4が選択され、[very]から
意味情報が変更される。ここでの意味情報は程度であ
り、入力データの意味は「S#large,意味情報:強」と
なる。この場合も、シソーラス手段により、意味辞書項
目ID3を参照し、意味情報内容が一致することにより、
結果として訳語「巨大」が選択可能となる。
ら意味情報記述辞書項目ID4が選択され、[very]から
意味情報が変更される。ここでの意味情報は程度であ
り、入力データの意味は「S#large,意味情報:強」と
なる。この場合も、シソーラス手段により、意味辞書項
目ID3を参照し、意味情報内容が一致することにより、
結果として訳語「巨大」が選択可能となる。
また、入力データ「small fish」では、[small]か
ら意味情報記述辞書項目ID5が選択され、[small]から
意味情報が変更される。ここでの意味情報はサイズの大
小であり、入力データの意味は「S#FISH,意味情報:
サイズ小」となる。この場合も、シソーラス手段によ
り、意味辞書項目ID6を参照し、意味情報内容が一致す
ることにより、結果として訳語「小魚」が選択可能とな
る。
ら意味情報記述辞書項目ID5が選択され、[small]から
意味情報が変更される。ここでの意味情報はサイズの大
小であり、入力データの意味は「S#FISH,意味情報:
サイズ小」となる。この場合も、シソーラス手段によ
り、意味辞書項目ID6を参照し、意味情報内容が一致す
ることにより、結果として訳語「小魚」が選択可能とな
る。
さらに、入力データ「read thoroughly」では、[rea
d]から意味情報記述辞書項目ID7が選択され、[thorou
ghly]から意味情報が変更される。ここでの意味応報は
詳細度の大小であり、入力データの意味は「S#READ,
意味情報:詳細度大」となる。この場合も、シソーラス
手段により、意味辞書項目ID8を参照し、意味情報内容
が一致することにより、結果として訳語「熟読」が選択
可能となる。
d]から意味情報記述辞書項目ID7が選択され、[thorou
ghly]から意味情報が変更される。ここでの意味応報は
詳細度の大小であり、入力データの意味は「S#READ,
意味情報:詳細度大」となる。この場合も、シソーラス
手段により、意味辞書項目ID8を参照し、意味情報内容
が一致することにより、結果として訳語「熟読」が選択
可能となる。
(発明の効果) 本発明により、類義語間に共通の意味での格フレーム
をシソーラスにもたせて、個々の語の持っている意味の
差がニュアンスの差をそれぞれの意味辞書項目に持たせ
る辞書構成が実現できる。これにより、訳文生成時に原
言語のニュアンスを反映する訳語を選択できる。また、
話題・表現の焦点の差により、他動詞と自動詞の選択、
能動形と受動形の差が生ずるが、その選択も本発明によ
り、言語に応じて行うことができ、原文の意図を保持し
た意訳が可能となる。
をシソーラスにもたせて、個々の語の持っている意味の
差がニュアンスの差をそれぞれの意味辞書項目に持たせ
る辞書構成が実現できる。これにより、訳文生成時に原
言語のニュアンスを反映する訳語を選択できる。また、
話題・表現の焦点の差により、他動詞と自動詞の選択、
能動形と受動形の差が生ずるが、その選択も本発明によ
り、言語に応じて行うことができ、原文の意図を保持し
た意訳が可能となる。
また、特願昭59−148138号明細書(特開昭61−26176
号公報)に記載の発明では、共通の意味シンボルを持つ
同義語(類義語)同士の対応づけは可能である。しか
し、アスペクト/モダリティ/程度などの意味情報が異
なる語同士は、同義語ではない。この意味情報が異なる
語同士については、意味の差があるために共通の意味シ
ンボルにすることができない。もし共通化した場合は、
意味的に異なる表現を同一と解釈するため、翻訳などに
利用する場合に誤りを生じる。
号公報)に記載の発明では、共通の意味シンボルを持つ
同義語(類義語)同士の対応づけは可能である。しか
し、アスペクト/モダリティ/程度などの意味情報が異
なる語同士は、同義語ではない。この意味情報が異なる
語同士については、意味の差があるために共通の意味シ
ンボルにすることができない。もし共通化した場合は、
意味的に異なる表現を同一と解釈するため、翻訳などに
利用する場合に誤りを生じる。
本発明ではシソーラス上の上位のシンボルを介して結
合しており、それぞれの意味シンボルに相当する意味情
報は意味情報記述辞書項目レベルで記載されている。従
って、意味的な異なりとともに上位での対応づけも実現
されており、より広範囲な類義表現間の対応づけが可能
になる。
合しており、それぞれの意味シンボルに相当する意味情
報は意味情報記述辞書項目レベルで記載されている。従
って、意味的な異なりとともに上位での対応づけも実現
されており、より広範囲な類義表現間の対応づけが可能
になる。
例えば、特願昭59−148138号明細書(特開昭61−2617
6号公報)記載の類義語検索機能としての「festival,fa
ir,bazar」についてはシンボルの共通化で対応可能であ
る。しかし、「construct,consist of」については、前
者が動作、後者が状態とアスペクト情報が異なるため、
既存の方式では対応づけができない。また、「巨大、ve
ry large」も程度の情報が異なるため意味シンボルが異
なり、対応づけ不可能となる。他方、本方式では、シソ
ーラス項目上の「T# 構成」,「T# 大きい」を介
して結合しているため、単語間の対応づけが可能とな
る。
6号公報)記載の類義語検索機能としての「festival,fa
ir,bazar」についてはシンボルの共通化で対応可能であ
る。しかし、「construct,consist of」については、前
者が動作、後者が状態とアスペクト情報が異なるため、
既存の方式では対応づけができない。また、「巨大、ve
ry large」も程度の情報が異なるため意味シンボルが異
なり、対応づけ不可能となる。他方、本方式では、シソ
ーラス項目上の「T# 構成」,「T# 大きい」を介
して結合しているため、単語間の対応づけが可能とな
る。
翻訳に例をとると、「構成する」に対して「construc
t」、「大きい」に対して「large」が結合している。こ
こで「構成される」や「very large」という表現の翻訳
については、既存の方式では結合可能な語彙が限定され
ているため、「be constructed」「非常に大きい」とし
か訳せない。他方、本方式はより広範な語から最適な表
現を選択可能なため「consist of」「巨大」という適切
な翻訳が可能となる。
t」、「大きい」に対して「large」が結合している。こ
こで「構成される」や「very large」という表現の翻訳
については、既存の方式では結合可能な語彙が限定され
ているため、「be constructed」「非常に大きい」とし
か訳せない。他方、本方式はより広範な語から最適な表
現を選択可能なため「consist of」「巨大」という適切
な翻訳が可能となる。
第1図は本発明の一実施例のブロック図、第2図は第1
図中の意味辞書手段と、シソーラス手段との関係を説明
する模式図である。 0,4…辞書検索手段、1…形態辞書手段、2…構文辞書
手段、3…意味辞書手段、5…シソーラス手段、IDi…
意味情報記述辞書項目、TDj…シソーラス項目。
図中の意味辞書手段と、シソーラス手段との関係を説明
する模式図である。 0,4…辞書検索手段、1…形態辞書手段、2…構文辞書
手段、3…意味辞書手段、5…シソーラス手段、IDi…
意味情報記述辞書項目、TDj…シソーラス項目。
Claims (1)
- 【請求項1】形態素表記や形態情報、およびそれらに対
応する文法情報記述辞書項目へのポインタを有する形態
辞書手段と、 前記形態辞書手段内の前記文法情報記述辞書項目に対応
する品詞・文法情報、前記形態辞書手段内の項目へのポ
インタ、および前記形態素表記と当該品詞・文法情報と
に対応する意味情報記述辞書項目へのポインタを保持す
る構文辞書手段と、 意味シンボルや意味情報、それらに対応する前記構文辞
書項目へのポインタ、およびその意味情報の上位概念を
記述するシソーラス項目へのポインタを格納する意味辞
書手段と、 前記形態辞書手段内の形態素表記、および前記意味辞書
手段内の意味シンボルを、検索キーとして有する辞書検
索手段と、 意味シンボル、当該シソーラス情報に対応する類義語間
に共通する意味情報、その各類義語の格フレームを包含
する格フレームおよびその各類義語の意味辞書手段内の
意味情報記述辞書項目へのポインタを有するシソーラス
手段と を有する意訳用辞書。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61076994A JPH0827799B2 (ja) | 1986-04-02 | 1986-04-02 | 意訳用辞書 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61076994A JPH0827799B2 (ja) | 1986-04-02 | 1986-04-02 | 意訳用辞書 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS62232080A JPS62232080A (ja) | 1987-10-12 |
| JPH0827799B2 true JPH0827799B2 (ja) | 1996-03-21 |
Family
ID=13621331
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61076994A Expired - Lifetime JPH0827799B2 (ja) | 1986-04-02 | 1986-04-02 | 意訳用辞書 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0827799B2 (ja) |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6126176A (ja) * | 1984-07-17 | 1986-02-05 | Nec Corp | 言語処理用辞書 |
-
1986
- 1986-04-02 JP JP61076994A patent/JPH0827799B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPS62232080A (ja) | 1987-10-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Jacquemin | Spotting and discovering terms through natural language processing | |
| JPH03278174A (ja) | 異言語交信用翻訳方法およびシステム | |
| JPH1074203A (ja) | 大文字及び非強調テキストの語彙処理の方法及びシステム | |
| Dror et al. | Morphological Analysis of the Qur'an | |
| JP2001515616A (ja) | 自動自然言語翻訳 | |
| Nguyen et al. | Ensuring annotation consistency and accuracy for Vietnamese treebank | |
| Gaizauskas et al. | Concepticons vs. lexicons: An architecture for multilingual information extraction | |
| Balkan | Translation tools | |
| JP2997469B2 (ja) | 自然言語理解方法および情報検索装置 | |
| Attia | Implications of the agreement features in machine translation | |
| Shawar et al. | Arabic question-answering via instance based learning from an FAQ corpus | |
| Bharati et al. | Paninian framework and its application to Anusaraka | |
| JPH0827799B2 (ja) | 意訳用辞書 | |
| Langkilde-Geary | A foundation for general-purpose natural language generation: sentence realization using probabilistic models of language | |
| Zarri | Natural language processing associated with expert systems | |
| Magwenzi | The Development of lexicographical databases, tools, and resources for storing Multilingual Data in Support of the Abstract Wikipedia Project: A Literature Review | |
| JP3892227B2 (ja) | 機械翻訳システム | |
| Lee | Syntax and parsing | |
| Ahmed et al. | English to Urdu translation system | |
| Barker | Noun modifier relationship analysis in the TANKA system | |
| JP2819766B2 (ja) | 外国語電子辞書検索方式 | |
| Narayan et al. | Pre-Neural Approaches | |
| Nijholt | Linguistic engineering: a survey | |
| Branner | Wenyan Syntax as Context-Free Formal Grammar1 | |
| Sigurd | Machine Translation—State of the Art |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| EXPY | Cancellation because of completion of term |