JPH02242372A - 文生成装置 - Google Patents
文生成装置Info
- Publication number
- JPH02242372A JPH02242372A JP1063310A JP6331089A JPH02242372A JP H02242372 A JPH02242372 A JP H02242372A JP 1063310 A JP1063310 A JP 1063310A JP 6331089 A JP6331089 A JP 6331089A JP H02242372 A JPH02242372 A JP H02242372A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- rule
- sentence generation
- conceptional
- generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の目的〕
(産業上の利用分野)
本発明は、文生成の素となる概念構造から文を生成する
文生成装置に関する。
文生成装置に関する。
(従来の技術)
これまでの文生成装置は、基本的には、概念構造がある
パターンにマツチすればある表現形態及び語順を一意に
与えるもので、文としてのバランスなどを考慮しての表
現の仕分けは全くなされていなかった。
パターンにマツチすればある表現形態及び語順を一意に
与えるもので、文としてのバランスなどを考慮しての表
現の仕分けは全くなされていなかった。
たとえば、日本語の「〜すれば良い。」に当たる概念か
ら英文を生成する場合を考えると、rvhat is
needed is to〜、 Jと「〜lng 〜1
ssatlsfactory、 Jという2つの表現候
補がある場合、もし「〜」の部分を構成する部分構造、
例えば単語数が大きければ、第2の候補を用いると主語
の大きな文となりバランスの悪い文の生成へとつながる
ので、第1の候補の採用が望ましい。逆に、r〜」の部
分が小さければ第2の候補の方が望ましいとも言える。
ら英文を生成する場合を考えると、rvhat is
needed is to〜、 Jと「〜lng 〜1
ssatlsfactory、 Jという2つの表現候
補がある場合、もし「〜」の部分を構成する部分構造、
例えば単語数が大きければ、第2の候補を用いると主語
の大きな文となりバランスの悪い文の生成へとつながる
ので、第1の候補の採用が望ましい。逆に、r〜」の部
分が小さければ第2の候補の方が望ましいとも言える。
しかし、このような表現の選択は、従来技術では不可能
であった。
であった。
また、語順コントロール処理の例を挙げると、英語では
、重い句・複雑な句・焦点のあたっている句は交尾の位
置が好まれる。そのため、文法的には正しいrHe h
ad called the man on whos
elndge*ent he now had to
rely an 1dlot 、 Jという文よりも、
これに目的語と目的格補語の語順の転換を施したrHe
had called an 1diot them
an on whose indgcvent he
now had to rely、Jの方が望ましい。
、重い句・複雑な句・焦点のあたっている句は交尾の位
置が好まれる。そのため、文法的には正しいrHe h
ad called the man on whos
elndge*ent he now had to
rely an 1dlot 、 Jという文よりも、
これに目的語と目的格補語の語順の転換を施したrHe
had called an 1diot them
an on whose indgcvent he
now had to rely、Jの方が望ましい。
これを制御するには部分構造の大きさをはかる必要があ
るが、従来は、この機能を持たなかったため、不可能で
あった。
るが、従来は、この機能を持たなかったため、不可能で
あった。
このように、従来技術では、構文レベルでの表現のしわ
けが不可能であり、不自然な文の生成をすることも多か
った。
けが不可能であり、不自然な文の生成をすることも多か
った。
(発明が解決しようとする課題)
従来技術では、概念構造に応じた表現構文の決定、語順
コントロールが不可能であり、より自然な文章を生成す
る能力に欠けていた。
コントロールが不可能であり、より自然な文章を生成す
る能力に欠けていた。
そこで、本発明は、より自然で理解し易い文を作成する
ことができる文生成装置を提供することを目的とする。
ことができる文生成装置を提供することを目的とする。
(課題を解決するための手段)
この発明は、概念構造中の任意の部分構造の単語数など
大きさをはかる機能を持ち、規則中に指定した部分構造
の大きさにより、表現する構文や用いる語句の選択なら
びに語順などのコントロールを行うことを特徴とする。
大きさをはかる機能を持ち、規則中に指定した部分構造
の大きさにより、表現する構文や用いる語句の選択なら
びに語順などのコントロールを行うことを特徴とする。
(作用)
この発明では、規則中で指定した関与する部分構造の大
きさにより、表現形態としてとるべき構文、語句、なら
びに語順などのコントロールを行い、より自然で理解し
易い文を生成するよう、表現の仕分けを行う。
きさにより、表現形態としてとるべき構文、語句、なら
びに語順などのコントロールを行い、より自然で理解し
易い文を生成するよう、表現の仕分けを行う。
(実施例)
第1図は、本発明の実施例としての文生成装置を示す全
体ブロック図である。
体ブロック図である。
この装置は、文生成の素となる概念構造を保持する概念
構造収容部1と、文生成に使用する知識を含んだ生成規
則2、(2a、2b)と、この生成規則2を用いて、前
記概念構造収容部1に保持された概念構造から文生成の
処理を行う文生成部3とにより構成される。本例の生成
規則2は、概念別規則2a及び構文生成規則2bから成
る。
構造収容部1と、文生成に使用する知識を含んだ生成規
則2、(2a、2b)と、この生成規則2を用いて、前
記概念構造収容部1に保持された概念構造から文生成の
処理を行う文生成部3とにより構成される。本例の生成
規則2は、概念別規則2a及び構文生成規則2bから成
る。
第2図は、文生成部3における文生成の流れを示すフロ
ーチャートである。構造変換(S 31)では、概念別
規則2aを用いて表現形態としてとるべき構文・語句の
選択・決定を行い、それにあわせて概念構造を変形する
。
ーチャートである。構造変換(S 31)では、概念別
規則2aを用いて表現形態としてとるべき構文・語句の
選択・決定を行い、それにあわせて概念構造を変形する
。
構文生成(S 32)では、構文生成規則2bを用いて
前記構造変換(S 31)より得られた概念構造に対し
て、語順を決定し、単語別に変換する。
前記構造変換(S 31)より得られた概念構造に対し
て、語順を決定し、単語別に変換する。
以上のように構成されたシステムにおいて、更に、概念
構造への構造変換、ならびに変換後の概念構造からの文
生成にお゛いて、概念構造中の任意の部分構造の大きさ
をはかりながら、構文レベルの表現のしわけを行う処理
について英文生成を例にとって説明する。なお、わかり
やすくするため、初期時点の概念構造は日本語で表記す
る。
構造への構造変換、ならびに変換後の概念構造からの文
生成にお゛いて、概念構造中の任意の部分構造の大きさ
をはかりながら、構文レベルの表現のしわけを行う処理
について英文生成を例にとって説明する。なお、わかり
やすくするため、初期時点の概念構造は日本語で表記す
る。
まず、構造変換(S31)において日本語の「a」 「
この本を読めば良い。」と「b」 「明日までにこの手
紙を彼の事務所へ届ければ良い。」に対応する概念構造
に対して表現の仕分けを行う過程を説明する。
この本を読めば良い。」と「b」 「明日までにこの手
紙を彼の事務所へ届ければ良い。」に対応する概念構造
に対して表現の仕分けを行う過程を説明する。
第3図、第4図は、それぞれ、初期時点の概念構造を示
す図、第5図はU〜すれば良い。」に当たる概念の持つ
構造変換規則を概念的に表した規則モデルである。
す図、第5図はU〜すれば良い。」に当たる概念の持つ
構造変換規則を概念的に表した規則モデルである。
第5図に示すルール例■、■のそれぞれ1行目が構造変
換のバタンを示しており、2行目がルール適用の条件、
3行目が構造変換に伴うアクシジンを示している。
換のバタンを示しており、2行目がルール適用の条件、
3行目が構造変換に伴うアクシジンを示している。
具体的には、ルール■は、「〜ば良い。」中の「〜ば」
の部分に当たる部分構造が単語数4以下から成ッテいれ
ば、r 〜Ing ls 5atisfactory
Jの構文を採用させ、ルール■は、同様に単語数5以上
なら「what Is needed is to 〜
Jの構文を採用させるためのものである。raJの文で
は、この部分構造が「この」と「本」と「読む」とで3
、bの文は「明日」 「までに」 「この」 「手紙」
「彼」 「事務所」 「届ける」の7であるので、それ
ぞれr a ’ J rReading thls
book l5satisfactory、 J、rb
’ j rWhat Is neededis to
dellver thls 1etter to hi
s oft’ice bytomorrow、 Jと表
現仕分けされる。
の部分に当たる部分構造が単語数4以下から成ッテいれ
ば、r 〜Ing ls 5atisfactory
Jの構文を採用させ、ルール■は、同様に単語数5以上
なら「what Is needed is to 〜
Jの構文を採用させるためのものである。raJの文で
は、この部分構造が「この」と「本」と「読む」とで3
、bの文は「明日」 「までに」 「この」 「手紙」
「彼」 「事務所」 「届ける」の7であるので、それ
ぞれr a ’ J rReading thls
book l5satisfactory、 J、rb
’ j rWhat Is neededis to
dellver thls 1etter to hi
s oft’ice bytomorrow、 Jと表
現仕分けされる。
次に、構文生成(S 32)において、語順をコントロ
ールする処理について説明する。
ールする処理について説明する。
第6図は、日本語C[私たちは、通信衛星を介してのオ
ンライン自動翻訳文字対話を可能にした。
ンライン自動翻訳文字対話を可能にした。
]に当たる概念構造に構造変換を施した後の概念構造で
ある。「自動翻訳文字対話」はひとつの概念として捉え
ている。
ある。「自動翻訳文字対話」はひとつの概念として捉え
ている。
続いて、第7図に任意の部分木の重さの参照をゆるして
の目的語と、目的格補語の語順コントロールする規則の
記述モデルを示す。具体的な意味は「重さ8未満の目的
語、あるいは、重さ7以上の関係節をもたない目的語、
あるいは、重さ7以上の前置詞をもたない目的語は、目
的格補語より先に生成し、それ以外の目的語は、目的格
補語の後に生成する。」である。ここにおいて「重さ」
とは、部分木のノード数ではなく、各ノードが持つ表現
語句を構成する単語数を示す。すなわち、「自動翻訳文
字対話」はノード数1であるが表現語句の単語数が4と
なり、結果としてこの例の目的語の重さpwは8となる
。
の目的語と、目的格補語の語順コントロールする規則の
記述モデルを示す。具体的な意味は「重さ8未満の目的
語、あるいは、重さ7以上の関係節をもたない目的語、
あるいは、重さ7以上の前置詞をもたない目的語は、目
的格補語より先に生成し、それ以外の目的語は、目的格
補語の後に生成する。」である。ここにおいて「重さ」
とは、部分木のノード数ではなく、各ノードが持つ表現
語句を構成する単語数を示す。すなわち、「自動翻訳文
字対話」はノード数1であるが表現語句の単語数が4と
なり、結果としてこの例の目的語の重さpwは8となる
。
よって、生成文としては、rc’ J rye ma
deon−1ine autmatlc tran
selatlon dlalogue viaco
ssunlcatlon 5atelllte pos
sible、ではなく、r c ’ J rle 5
ade possible on−line auto
matictranselatton dlalog
e via cosgunicattonsatt
ellte 、 Jが生成される。
deon−1ine autmatlc tran
selatlon dlalogue viaco
ssunlcatlon 5atelllte pos
sible、ではなく、r c ’ J rle 5
ade possible on−line auto
matictranselatton dlalog
e via cosgunicattonsatt
ellte 、 Jが生成される。
以上のように、本例では、概念構造の任意の部分構造の
重さ(構成する単語数)に従って、表現すべき構文、語
句の選択や語順をコントロールすることにより、自然な
文章生成を実現するものである。
重さ(構成する単語数)に従って、表現すべき構文、語
句の選択や語順をコントロールすることにより、自然な
文章生成を実現するものである。
なお、この発明は、上記の実施例に限定されるものでは
ない。上記の実施例では、2種の異なった方法をあえて
示すため、構造変換過程は、部分構造の大きさをノード
数で代表させ、構文生成過程では表層の語句を構成する
単語数により表わしたが、当然、構造変換過程において
も、表層の語句を構成する単語数で表わしてもよい。ま
た、単純に、ノード数に限定してしまってもよい。
ない。上記の実施例では、2種の異なった方法をあえて
示すため、構造変換過程は、部分構造の大きさをノード
数で代表させ、構文生成過程では表層の語句を構成する
単語数により表わしたが、当然、構造変換過程において
も、表層の語句を構成する単語数で表わしてもよい。ま
た、単純に、ノード数に限定してしまってもよい。
また、この発明は、単独の独立した装置としてのみでな
く、機械翻訳システムや、要約システム1、翻訳電話シ
ステム等の言語処理システムにとり入れて実施すること
もできる。要するに、本発明の趣旨を逸脱しない範囲で
種々変形して用いることができる。
く、機械翻訳システムや、要約システム1、翻訳電話シ
ステム等の言語処理システムにとり入れて実施すること
もできる。要するに、本発明の趣旨を逸脱しない範囲で
種々変形して用いることができる。
以上の通り、この発明は、特許請求の範囲に記載の通り
の文生成装置であるので、大局的には同じ構造から成る
概念でも概念構造性質に応じて表現としてとるべき構文
、語句の選択、語順のコントロールを行うことが可能で
あり、結果として、より自然で理解し易い文を生成する
ことができる。
の文生成装置であるので、大局的には同じ構造から成る
概念でも概念構造性質に応じて表現としてとるべき構文
、語句の選択、語順のコントロールを行うことが可能で
あり、結果として、より自然で理解し易い文を生成する
ことができる。
第1図はこの発明の一実施例を示す全体ブロック図、第
2図はこの発明の一実施例で用いる文生成部の処理の流
れを示すフローチャート、第3図、第4図はこの発明の
一実施例で用いる概念構造のモデルを示す説明図、38
5図はこの発明の一実施例で用いる概念別規則のモデル
を示す説明図、第6図はこの発明の一実施例で用いる構
造変換後の概念構造のモデルを示す説明図、第7図はこ
の発明の一実施例で用いる構文生成規則のモデルを示す
説明図である。 l・・・概念構造収容部 2・・・文生成規則 3・・・文生成部
2図はこの発明の一実施例で用いる文生成部の処理の流
れを示すフローチャート、第3図、第4図はこの発明の
一実施例で用いる概念構造のモデルを示す説明図、38
5図はこの発明の一実施例で用いる概念別規則のモデル
を示す説明図、第6図はこの発明の一実施例で用いる構
造変換後の概念構造のモデルを示す説明図、第7図はこ
の発明の一実施例で用いる構文生成規則のモデルを示す
説明図である。 l・・・概念構造収容部 2・・・文生成規則 3・・・文生成部
Claims (2)
- (1)文生成の素となる概念構造を保持する概念構造収
容部と、 文生成に使用する知識を含んだ生成規則と、この生成規
則を用いて、前記概念構造収容部に保持された概念構造
から文生成の処理を行う文生成部とを具備し、 概念構造中の任意の部分構造の単語数など大きさにより
、各句の生成位置をコントロールすることを特徴とする
文生成装置。 - (2)文生成の素となる概念構造を保持する概念構造収
容部と、 文生成に使用する知識を含んだ生成規則と、この生成規
則を用いて、前記概念構造収容部に保持された概念構造
から文生成の処理を行う文生成部とを具備し、 概念構造中の任意の部分構造の単語数など大きさにより
、用いる語句、構文など文の選択をコントロールするこ
とを特徴とする文生成装置。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1063310A JPH02242372A (ja) | 1989-03-15 | 1989-03-15 | 文生成装置 |
| DE69030682T DE69030682T2 (de) | 1989-03-15 | 1990-03-15 | Verfahren und Vorrichtung zum Bilden von Sätzen |
| EP90104922A EP0387876B1 (en) | 1989-03-15 | 1990-03-15 | Method and apparatus for generating sentences |
| US07/851,123 US5317510A (en) | 1989-03-15 | 1992-03-16 | Method and apparatus for generating sentences from conceptual structures |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1063310A JPH02242372A (ja) | 1989-03-15 | 1989-03-15 | 文生成装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02242372A true JPH02242372A (ja) | 1990-09-26 |
Family
ID=13225586
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1063310A Pending JPH02242372A (ja) | 1989-03-15 | 1989-03-15 | 文生成装置 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US5317510A (ja) |
| EP (1) | EP0387876B1 (ja) |
| JP (1) | JPH02242372A (ja) |
| DE (1) | DE69030682T2 (ja) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5369574A (en) * | 1990-08-01 | 1994-11-29 | Canon Kabushiki Kaisha | Sentence generating system |
| US5541836A (en) * | 1991-12-30 | 1996-07-30 | At&T Corp. | Word disambiguation apparatus and methods |
| GB9209346D0 (en) * | 1992-04-30 | 1992-06-17 | Sharp Kk | Machine translation system |
| US5721938A (en) * | 1995-06-07 | 1998-02-24 | Stuckey; Barbara K. | Method and device for parsing and analyzing natural language sentences and text |
| EP1235818A4 (en) | 1999-10-15 | 2005-01-19 | Danisco Cultor America Inc | DIRECT ESTERIFICATION PROCESS OF SORBITOL WITH FATTY ACIDS |
| US20050120002A1 (en) * | 2003-10-02 | 2005-06-02 | Hassan Behbehani | Automated text generation process |
| US11347966B2 (en) * | 2018-07-20 | 2022-05-31 | Samsung Electronics Co., Ltd. | Electronic apparatus and learning method of electronic apparatus |
| KR102742169B1 (ko) * | 2018-07-20 | 2024-12-13 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 학습 방법 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58201175A (ja) * | 1982-05-20 | 1983-11-22 | Kokusai Denshin Denwa Co Ltd <Kdd> | 機械翻訳方式 |
| JPS59201172A (ja) * | 1983-04-28 | 1984-11-14 | Nec Corp | 曖味さ解析方式 |
| JPS6084667A (ja) * | 1983-10-17 | 1985-05-14 | Mitsubishi Electric Corp | 文章組立装置 |
| US4914590A (en) * | 1988-05-18 | 1990-04-03 | Emhart Industries, Inc. | Natural language understanding system |
-
1989
- 1989-03-15 JP JP1063310A patent/JPH02242372A/ja active Pending
-
1990
- 1990-03-15 DE DE69030682T patent/DE69030682T2/de not_active Expired - Fee Related
- 1990-03-15 EP EP90104922A patent/EP0387876B1/en not_active Expired - Lifetime
-
1992
- 1992-03-16 US US07/851,123 patent/US5317510A/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| EP0387876A3 (en) | 1992-10-14 |
| EP0387876B1 (en) | 1997-05-14 |
| DE69030682T2 (de) | 1997-10-02 |
| EP0387876A2 (en) | 1990-09-19 |
| DE69030682D1 (de) | 1997-06-19 |
| US5317510A (en) | 1994-05-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Mazaré et al. | Training millions of personalized dialogue agents | |
| Chambers | Dynamic typology and vernacular universals | |
| EP0469884B1 (en) | Sentence generating system | |
| EP0138619B1 (en) | Sentence forming apparatus | |
| JP2021197133A (ja) | 意味マッチング方法、装置、電子機器、記憶媒体及びコンピュータプログラム | |
| US6023669A (en) | System for generating natural language information from information expressed by concept and method therefor | |
| US20020087313A1 (en) | Computer-implemented intelligent speech model partitioning method and system | |
| CN110134944A (zh) | 一种基于强化学习的指代消解方法 | |
| KR20190127708A (ko) | 대화 시스템 및 그것을 위한 컴퓨터 프로그램 | |
| JPH02242372A (ja) | 文生成装置 | |
| Cao et al. | Referring expression generation using entity profiles | |
| US20060036428A1 (en) | Language model architecture | |
| Choudhury et al. | A diachronic approach for schwa deletion in Indo Aryan languages | |
| Verma et al. | Deep analysis of chatbots: Features, methodology, and comparison | |
| Fujita et al. | Long short-term memory networks for automatic generation of conversations | |
| Shree et al. | A novel approach to Sandhi splitting at Character level for Kannada Language | |
| JP2001075584A (ja) | 自然言語処理方法及び前記方法を用いた音声合成装置 | |
| KR100304529B1 (ko) | 신경회로망을이용한휴지기생성방법 | |
| Sultonkhodjayeva et al. | Multilingual Sentiment Analysis for Emotion-Aware Feedback in Language Learning Platforms | |
| Sultan et al. | A Strategic Framework for the Development of a Microtext AI Chatbot for Tourism in Indian Cities | |
| Situngkir et al. | Syllabic Agglutinative Tokenizations for Indonesian LLM: A Study from | |
| Karkada et al. | Strategy-level entrainment of dialogue system users in a creative visual reference resolution task | |
| JPS60200368A (ja) | 機械翻訳方式 | |
| Gebre et al. | Automatic Spell Checker for Kafi Noonoo using Bidirectional Beam Search | |
| KR20240039319A (ko) | 다이나믹한 스타일의 문장 재생성 시스템 및 이의 동작 방법 |