JPH0887501A - 話題構造認識における話題レベル制御方法および話題構造認識装置 - Google Patents
話題構造認識における話題レベル制御方法および話題構造認識装置Info
- Publication number
- JPH0887501A JPH0887501A JP6223151A JP22315194A JPH0887501A JP H0887501 A JPH0887501 A JP H0887501A JP 6223151 A JP6223151 A JP 6223151A JP 22315194 A JP22315194 A JP 22315194A JP H0887501 A JPH0887501 A JP H0887501A
- Authority
- JP
- Japan
- Prior art keywords
- topic
- level
- expansion
- storage unit
- topic level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
上に深くなることが抑制され、人間にとって分かりやす
い話題構造を出力できるようにする。 【構成】条件に応じて話題レベルの値を増減させるため
の話題レベル増減テーブルと、所定の条件が満足したと
きにそのときの値によらず話題レベルを新しい値に設定
するための話題レベル設定テーブルとを使用する。ま
ず、話題レベル増減テーブルにしたがって話題レベルを
更新し(ステップ201)、話題レベル設定テーブルの
条件が満たされている場合には、話題レベル設定テーブ
ルでのその条件に対応する値に話題レベルを設定する
(ステップ203)。
Description
話題構造認識の方法および装置に関し、特に話題レベル
を決定する話題レベル制御方法とこの話題レベル制御方
法が適用される話題構造認識装置とに関する。
「これらテキストないし対話データの中から同じことが
書いてあるブロックと、その『同じこと』を求めよ」と
いう課題を与えると、個人差なく同じ構造を答えるとい
う性質が実験的に確認されている。その実験について
は、例えば『竹下他:「話題構造認識の観点からのヒュ
ーマンコミュニケーションの研究」電子情報通信学会1
993年秋季大会D-62(p.6-64)』に記載されている。人
間によって把握されるこのような構造を「話題構造」と
呼ぶ。話題構造は入れ子構造を形成するので、各話題
は、話題を示す「話題語」と、入れ子の深さを表す「話
題レベル」と、テキストないし対話データの中において
その話題がどの文からどの文まで継続するかという「話
題スコープ」によって表現できる。以下において、話題
構造の解析の対象となるテキストや対話データのことを
言語データと呼ぶ。
語データに対する話題構造の一例を示している。言語デ
ータは、第0文から始まって少なくとも第770文まで
続いている。そして、「通信サービス」という話題語を
持つ話題の話題レベルは1であり、その話題スコープは
第0文から第770文までの範囲である。なお、説明を
簡単にするために、以下においては、『「通信サービ
ス」の話題』のように、話題語を用いてその話題を指す
ことにする。
ベルが2である「新規サービス」と「従来からのサービ
ス」という話題が存在し、「新規サービス」の話題は第
125文から第431文までの話題スコープを持ち、
「従来からのサービス」の話題は第432文から第77
0文までの話題スコープを持つ。また、「新規サービ
ス」の話題の中には「サービスA」という子話題が、
「従来からのサービス」の話題の中には「サービスB」
という子話題が存在し、それぞれの話題スコープは第3
01文から第431文までと第521文と第770文ま
でである。
することを話題構造認識と呼ぶ。話題構造を認識するた
めの方法は、これまでにもいくつか提案されている。こ
こでは、『竹下:「話題構造認識を用いた映像検索シス
テム」情報処理学会情報メディア研究会94-IM-15-1』で
述べられている話題構造の認識方法について簡単に説明
する。図2はこの認識方法で使用する話題構造認識装置
の一例の構成を示すブロック図であり、図3はこの認識
方法における話題構造認識処理を示すフローチャートで
あり、図4はこの話題構造認識処理における話題構造認
識前処理以降の処理の流れの一例を示す図である。
は、言語データが入力するデータ入力部701と、各種
の処理を実行する処理部702と、結果を表示する表示
部703と、処理結果や処理途中で必要となるデータを
保持する記憶部704と、話題構造認識処理で使用され
る辞書や規則類を格納する辞書・規則部705によって
構成されている。記憶部704には、前処理後の言語デ
ータを記憶する言語データ記憶部710と、中間の処理
結果や最終的な処理結果を保持する話題構造記憶部71
1とが設けられている。さらに話題構造記憶部711に
は、基板展開記憶部712と意味的展開記憶部713と
統合話題記憶部714が設けられている。一方、辞書・
規則部705には、前処理用辞書721と意味的展開処
理規則722と基板展開処理規則723と統合処理規則
724とが設けられている。
識処理を行なう場合、まず、図3に示すように、入力さ
れた言語データ730に対する話題構造認識前処理74
0を行なう。この話題構造認識前処理740の第1ステ
ップは、入力した言語データ730に対する形態素解析
処理741である。形態素解析処理741では、入力さ
れた言語データ730の文字列を単語ごとに区切って単
語列とし、さらに各単語の品詞や活用語の活用形等を同
定する。続いて、前処理740の第2ステップとして、
形態素解析の結果を入力として、単文区切り処理742
を行なう。単文区切り処理742は、埋め込み文や重文
のように複数の述語を含む文を、1つの述語のみを含む
単文に分割する処理である。前処理740の第3ステッ
プとして、顕著名詞句抽出743を実行する。顕著名詞
句抽出743は、単文区切り処理742の結果を入力と
して、各単文において最も強調されている名詞句を抽出
する処理である。そして、前処理740の第4ステップ
として、ブロック認識744を実行する。ブロック認識
744は、テキストでの段落に相当するブロックを認識
する処理である。これら、話題構造認識前処理740に
属する各処理は、辞書・規則部705内にある前処理用
辞書721を用いて、処理部702によって実行され、
その結果は、記憶部704内の言語データ記憶部710
に格納される。
話題の展開の処理を基板展開処理750と意味的展開処
理760とに分離して実行する。ここで基盤展開とは、
「まず」や「次に」のような手掛かり句や章立て、箇条
書きなどによって明示的に示された話題展開のことであ
り、意味的展開とは、基盤展開の各話題の中で、明示的
ではない形で提示、進行する話題の展開のことである。
理750において、話題確立区間の決定751、話題語
の決定752、話題スコープと話題レベルの決定753
という3つの処理を順次行なう。ここで話題確立区間と
は、話題が提示、確立される区間のことである。話題語
の決定752では、各話題確立区間における顕著名詞句
を話題語候補とし、これら話題語候補の中で優先順位が
最も高いものを選んで話題語とする。話題スコープと話
題レベルの決定753では、箇条書き等の構造に基づい
て、処理が行なわれる。基盤展開処理750は、辞書・
規則部705内の基盤展開処理規則723を用いて処理
部702で実行され、その結果は記憶部704の中の話
題構造記憶部711内に含まれる基盤展開記憶部712
に格納される。
理の具体例が図4に示されている。まず、言語データの
開始時点と「まず」とか「次に」といった手掛かり句の
近辺とを基盤展開の話題確立区間として決定している。
そして、話題語の決定752では、最初の話題確立区間
からは「通信サービス」が、2番目の話題確立区間から
は「新規サービス」が、3番目の話題確立区間からは
「従来からのサービス」が、それぞれ、話題語として選
ばれている。
処理760が実行される。意味的展開処理760は、基
盤展開処理750と同様に、話題確立区間の決定76
1、話題語の決定762、話題スコープと話題レベルの
決定763という3つの処理によって構成される。この
意味的展開処理760は、辞書・規則部705内の意味
的展開処理規則722を用いるとともに基盤展開処理7
50の結果も利用して処理部702で実行され、その結
果は記憶部704の中の話題構造記憶部711に含まれ
る意味的展開記憶部713に格納される。
て、ある程度以上長い段落が選択され、それらにおける
話題語として、「サービスA」と「サービスB」が選ば
れている。話題スコープとしては、上述した話題確立区
間の開始点から基盤展開における次の話題確立区間の開
始点までが求められている。話題レベルは、テキストの
意味的展開の場合には、全て同じレベルすなわちレベル
1とされる。
770が行なわれ、その結果として、言語データ全体の
話題構造780が出力される。この統合処理770は、
基盤展開処理750と意味的展開処理760のそれぞれ
の話題構造を入力とし、辞書・規則部705内の統合処
理規則724を用いて、処理部702によって実行され
る。図4に示した例では、統合処理の結果として、図1
に示したのと同様の話題構造780が得られている。
て、話題確立区間や話題語、話題スコープ、話題レベル
を決定するための規則(意味的展開処理規則722や基
盤展開処理規則723)は、言語データが対話、モノロ
ーグ、書き言葉テキストなどのどの伝達形態によるもの
であるかによって異なる。伝達形態による話題展開様式
や話題構造認識規則の違いと、話題構造認識実験の結果
については、『竹下他:「話題構造認識の観点からのヒ
ューマンコミュニケーションの研究」電子情報通信学会
1993年秋季大会D-62(p.6-64)』に記載がある。
た従来の話題構造認識技術では、話題の入れ子の開始点
を認識するのは容易であるのに対して、話題の入れ子の
終了点を認識することは困難である。このため、話題構
造認識結果における話題レベルは言語データの後ろにな
ればなるほど深くなってしまうという傾向があり、この
話題構造認識結果を例えば人間にとっての目次として利
用しようとしたときに、人間にとって分かりにくいもの
になってしまったり、人間の認識する話題レベルとは大
きく異なった話題レベルとして扱われてしまったりする
という問題がある。特に、言語データが長かったり、話
題が多岐にわたる場合にこのような傾向が顕著である。
を取り上げる。図5は、会議録の例(代表質問)であっ
て、多岐にわたる話題を多数含む言語データの代表的な
ものである。図5に示した言語データに対し、上述した
従来の方法で話題構造を認識し、その結果を目次形態で
出力したものが図6に示されている。なおここに示した
ものでは、通常の目次とは異なり、章タイトルのみなら
ず、言語データ中でその章タイトルが出現した箇所の前
後の文字列も併記してある。図6に示した例でも、目次
の後半ほど章立ての入れ子が深くなっており、最後の
「5.11.1.11.1.2.2.3.3.10 PKOの法案」では、章立
ての入れ子は10重にもなっている。これだけ話題レベ
ルが深くなってしまうと、章立ての関係を理解すること
が人間にとって困難となり、目次としての機能が薄れて
しまう。
る話題レベルが必要以上に深くなることが抑制され、人
間にとって分かりやすい話題構造を出力できる話題レベ
ル制御方法と話題構造認識装置とを提供することにあ
る。
方法は、予め準備された規則を用いて言語データの話題
構造を認識する話題構造認識処理における話題レベルの
決定方法において、条件と話題レベルの増減との関係を
記述する話題レベル増減テーブルと、条件と新しい話題
レベルの対を記述する話題レベル設定テーブルとを予め
準備し、前記話題レベル増減テーブルおよび前記話題レ
ベル設定テーブルを用いて話題レベルを決定する。
を入力するための入力部と、話題構造認識のための規則
類を蓄える辞書・規則部と、該辞書・記憶部の規則類を
用いた処理を行なう処理部と、前記処理部による結果を
蓄える記憶部と、前記処理部による処理結果を表示する
表示部とを有し、手掛かり句が入れ子開始型と話題転換
型と入れ子終了型の3つのタイプに分類され、前記辞書
・規則部が、入れ子開始型の手掛かり句についてその単
語と品詞とを登録した入れ子開始型手掛かり句テーブル
と、話題転換型の手掛かり句についてその単語と品詞と
を登録した話題転換型手掛かり句テーブルと、入れ子終
了型の手掛かり句についてその単語と品詞とを登録した
入れ子終了型手掛かり句テーブルと、前記手掛かり句の
タイプの情報を含む条件と話題レベルの増減との関係を
記述した話題レベル増減テーブルと、条件と話題レベル
の値との組を記述した話題レベル設定テーブルとを含
み、前記記憶部が、入力部から入力された言語データに
関する情報を蓄える言語データ記憶部と、話題構造に関
する情報を蓄える話題構造記憶部とを含み、前記言語デ
ータ記憶部が、前記言語データに含まれる各単語の文字
列と品詞に関する情報を格納する単語情報テーブルと、
前記言語データの各単文に含まれる単語と手掛かり句と
手掛かり句のタイプに関する情報を格納する単文情報テ
ーブルと、各発話番の話者と開始単文番号を含む情報を
格納する発話番情報テーブルとを含み、話題構造記憶部
が、話題が提示、確立される範囲である話題確立区間と
話題語と話題レベルと話題スコープとを含む情報を格納
するテーブルを含む。
ベル増減テーブルと、条件と新しい話題レベル値の対を
記述した話題レベル設定テーブルを用いることにより、
認識結果として得られる話題構造の話題レベルが深くな
らないようにすることを可能とする。これにより、例え
ば話題構造を目次として用いた場合に、ユーザは言語デ
ータにおける話の流れをより容易に理解できるようにな
る。
して説明する。図7は、本発明の一実施例の話題構造認
識装置の構成を示すブロック図である。この話題構造認
識装置は、図2に示す従来の話題構造認識装置と比べ、
特に、辞書・規則部105に含まれるテーブル類の構成
において異なっている。
例の話題構造認識装置には、言語データが入力するデー
タ入力部101と、各種の処理を実行する処理部102
と、結果を表示する表示部103と、処理結果や処理途
中で必要となるデータを保持する記憶部104と、話題
構造認識処理で使用される辞書や規則類を格納する辞書
・規則部105によって構成されている。記憶部104
には、前処理後の言語データを記憶する言語データ記憶
部110と、中間の処理結果や最終的な処理結果を保持
する話題構造記憶部111とが設けられている。言語デ
ータ記憶部110には、単文情報テーブル115と単語
情報テーブル116と発話番情報テーブル117が設け
られており、話題構造記憶部111には、基板展開記憶
部112と意味的展開記憶部113と統合話題記憶部1
14が設けられている。一方、辞書・規則部105に
は、前処理用辞書121と意味的展開処理規則122と
基板展開処理規則123と統合処理規則124と話題レ
ベル増減テーブル125と話題レベル設定テーブル12
6と入れ子開始型手掛かり句テーブル127と話題転換
型手掛かり句テーブル128と入れ子終了型手掛かり句
テーブル129とが設けられている。
の話題構造の解析を行なう場合、その処理は図3に示し
た従来の処理の流れと同様に処理が行なわれるが、基盤
展開処理における話題レベルの決定方法において相違す
る。この話題構造認識装置を使用する場合には、話題レ
ベル増減テーブル125と話題レベル設定テーブル12
6を用いて話題レベルが決定される。これらのテーブル
125,126の詳細については後述するが、話題レベ
ル増減テーブル125はある条件が成立した場合に話題
レベルを相対的にどれだけ変化させるかを記述したもの
であり、話題レベル設定テーブルは特定の条件が成立し
た場合に話題レベルを強制的にどの値に変更するか(絶
対的変化)を記述したものである。そして、これらテー
ブル125,126に記載されている条件を判断するた
めに、各手掛かり句テーブル127〜129が使用され
る。以下、話題レベルの決定方法の中心にして、本実施
例の話題構造認識装置による話題構造の解析手順を説明
する。
体の流れ]図8のフローチャートは、基盤展開における
話題レベル決定の処理手順を示している。まず、基盤展
開の話題確立区間について、話題レベル増減テーブル1
25にしたがって、話題レベルを更新する(ステップ2
01)。そして、話題レベル設定テーブル126の条件
が満足しているかが判断され(ステップ202)、成立
していない場合にはそのまま話題レベル決定の処理を終
了し、成立している場合には、話題レベル設定テーブル
126にしたがって話題レベルを更新して(ステップ2
03)、話題レベル決定処理を終了する。
増減テーブル125の構成例を示す図である。本実施例
では、直前の手掛かり句から現在の手掛かり句への手掛
かり句タイプの遷移パターンによって話題レベルを増減
させており、話題レベル増減テーブル125はこの遷移
パターンと話題レベルの増減量との関係を記述してい
る。本実施例では、「まず」や「次に」などの手掛かり
句を「入れ子開始型」、「話題転換型」、「入れ子終了
型」の3つのタイプに分類している。各タイプに属する
手掛かり句の例が表1に示されている。
型であれば、直前の手掛かり句のタイプによらず、話題
レベルを1だけ増加させる。また、現在の手掛かり句が
話題転換型か入れ子終了型で、かつ直前の手掛かり句が
入れ子開始型か話題転換型のいずれかであれば、話題レ
ベルは変わらないものとする。また、現在の手掛かり句
が話題転換型か入れ子終了型で、かつ直前の手掛かり句
が入れ子終了型であれば、話題レベルを1減少させる。
型手掛かり句テーブル127、話題転換型手掛かり句テ
ーブル128および入れ子終了型手掛かり句テーブル1
29の構成を示す図であり、図中の値は、図5に示した
言語データ例に対する処理過程での値である。表1に示
した3種類の手掛かり句を記憶するために、辞書・規則
部105にはこれら手掛かり句テーブル127〜129
が含まれている。各手掛かり句テーブル127〜129
は、手掛かり句番号のフィールドと、手掛かり句の単語
を記述するためのフィールドと、各単語の品詞を記述す
るためのフィールドとが設けられている。例えば、入れ
子開始型手掛かり句テーブル127において、手掛かり
句番号0の手掛かり句は、「まず」というlつの単語か
ら構成され、その品詞は副詞である。
110には単文情報テーブル115と単語情報テーブル
116が設けられている。これらのテーブル115,1
16の構成例が、図11(a),(b)にそれぞれ示されてい
る。単文情報テーブル116は、述語を1つだけ持つ単
位である単文に関する情報を記述するためのものであっ
て、各単文番号のフィールドと、各単文に含まれる手掛
かり句をその手掛かり句番号で記述するフィールドと、
その手掛かり句のタイプを記述するフィールドと、その
単文が属する発話番(その単文が何番目の話者によるも
のかを示す)を表わすフィールドと、その単文の開始お
よび終了の単語番号を表わすフィールド(単語範囲フィ
ールド)とによって構成されている。単文番号は、その
単文が言語データ中の何番目の単文であるかを0から始
まる連続番号で示したものである。手掛かり句と手掛か
り句タイプのフィールドにおける値"−1"は、手掛かり
句が存在しないことを示している。単語情報テーブル1
16には、言語データ中でその単語が何番目の単語であ
るかを示す単語番号フィールドと、その単語を記述する
ためのフィールドと、その単語の品詞等の情報を記述す
るためのフィールドとが設定されている。上述したよう
に、話題構造認識前処理(図3参照)において形態素解
析と単文区切り処理とが行なわれており、これらの処理
結果が単文情報テーブル115と単語情報テーブル11
6に格納されることになる。なお、言語データ記憶部1
10には、発話番情報テーブル117も設けられている
が、この発話番情報テーブル117は、話者の発話の順
序を示す発話番番号フィールドと、話者名が記述される
話者フィールドと、その話者の単文がどの単文番号の単
文から始まるかを示す開始単文フィールドとによって、
構成されている。
テーブル115の単語範囲の値を取り出して、単語情報
テーブル116上でのこの範囲内に、3種類の各手掛か
り句テーブル127〜129に含まれる項目が存在する
かどうかを調べることにより行なわれる。例えば、単文
番号0の単語範囲は単語番号0から12であるから、単
語情報テーブル116の単語番号0から12の範囲内
に、手掛かり句テーブル127〜129に含まれる項目
が含まれているかどうかを調べる。単文番号0の場合、
手掛かり句は含まれていないので、単文番号0に係る手
掛かり句と手掛かり句タイプの各フィールド値は、共に
−1としている。もし、手掛かり句が検出されれば、そ
の手掛かり句番号を手掛かり句フィールドに記録し、そ
のタイプを手掛かり句タイプフィールドに記述する。
の構成例を示している。話題レベル設定テーブル126
は、条件フィールドと新しい話題レベルを記述するフィ
ールドとによって構成されている。条件フィールドに記
されているいずれかの条件が満たされた場合には、その
満足した条件に対応する値(満足した条件の右側の欄に
記載された値)に話題レベルが設定される。上述の話題
レベル増減テーブル125による話題レベルの遷移はそ
れまでの話題レベルを基準にした増減であるのに対し
て、この話題レベル設定テーブル126による話題レベ
ルの更新では、それまでの話題レベル値とは無関係に話
題レベルの絶対値が指定される。図12に示した例で
は、話題レベルが5を越えた場合には話題レベルが1に
戻される。また、話者交替が起こり、かつ新しい発話番
が3単文以上から構成されており、かつ今回の話者交替
より前に5単文以上存在する場合に、話題レベルが1に
戻される。また、もし2つ以上の条件が同時に満たされ
た場合には、例えば、話題レベル設定テーブル126の
中で上位に記述されているものを採用するようにすれば
よい。
ーブル115および発話番情報テーブル117のそれぞ
れと話題レベル設定テーブル126に記述された条件と
の関係について、図13を用いて説明する。図中の値
は、図5に示した言語データ例に対する処理過程での値
である。
に、話題が提示・確立される話題確立区間の開始と終了
をそれぞれ示す単文番号を記述するフィールド(話題確
立区間フィールド)と、話題語を記述するフィールド
と、話題レベルを記述するフィールドと、話題スコープ
をその開始および終了の単語番号で記述するフィールド
とが含まれる。上述したように発話番情報テーブル11
7には、発話番番号フィールドと、話者を記述するフィ
ールドと、発話番が開始する単文番号を記述するフィー
ルドとが含まれ、図示した例では、発話番0の話者は
「議長」であり、単文0から開始し、終了は次の発話番
1の開始単文の1つ前である単文1となっている。
26の条件にある「話題レベル>5」が満たされている
かどうかは、基盤展開記憶部112の話題レベルのフィ
ールドの値を調べることにより判定することが可能であ
る。また、話題レベル設定テーブル126の条件にある
「話者交替が発生したとき」が満たされているかどうか
は、基盤展開記憶部112に記録されている話題確立区
間の開始単文について、単文情報テーブル115の発話
番フィールドを調べることにより判定できる。また、話
題レベル設定テーブル126の条件にある「新しい発話
番に3単文以上含まれている」と「言語データ開始時か
ら話者交替までに5単文以上含まれている」が満たされ
ているかどうかは、発話番情報テーブル117の開始単
文フィールドの値から判定できる。
3に示された例を用いて、本実施例における基盤展開で
の話題レベル制御方法を詳細に説明する。以下の説明に
おいて、単文番号がNの単文のことを簡単のために単文
#Nと記載することにする。
開記憶部112に記憶されており、その値は4である。
また、話題番号45の話題確立区間は単文#720から
開始する。単文情報テーブル115によると、この単文
#720は発話番4に属する。
ていないので(図示空欄になっている)、本発明にした
がって決定する。まず、話題レベル増減テーブル125
にしたがって、話題レベルを更新する。話題番号46の
話題確立区間は単文#822から#826までであり、
単文情報テーブル115のその範囲を見ると、単文#8
22に入れ子開始型の手掛かり句が存在する。図9に示
されるようにこの話題レベル増減テーブル125によれ
ば、今回の手掛かり句が入れ子開始型であれば前回の手
掛かり句が何であっても話題レベルは+1されるので、
話題レベルは5となる。
件が満たされているかどうかを調べる。「話題レベル>
5」という条件は、話題レベルが5であるので、満たさ
れていない。話題番号46の話題確立区間は単文#82
2から開始するが、単文情報テーブル115によると、
この単文は発話番6に属する。前述したように、話題番
号45は発話番4に属するので、話者交替が起きている
ことがわかる。また、発話番情報テーブル117による
と、発話番号6は単文#785から開始しており、次の
発話番号7の開始単文#1047の1つ前の単文#10
46まで続くので、「新しい発話番に3単文以上含まれ
ている」という条件も満たされる。また、発話番号6は
単文#785から開始であるので、「言語データ開始時
から話者交替までに5単文以上含まれている」という条
件も満たされる。これらにより、図11に示した話題レ
ベル設定テーブル126の2番目の条件が満たされてい
ることが分かるので、最終的に話題番号46の話題レベ
ルは1となる。
いて図5に例示した言語データに対して話題構造認識を
行なった結果が、図14に示されている。図14に示す
目次では、章立ての入れ子は最高でも4重であり、さら
に妥当な箇所で入れ子レベルが戻されているので、従来
の方法による図6の目次と比較すると、人間にとって非
常に分かりやすいものとなっている。
ル増減テーブルと話題レベル設定テーブルとを用いるこ
とにより、話題構造認識結果における話題レベルが深く
なるのを抑制することが可能となるという効果がある。
会議録や講義録のように長い言語データに対して非常に
有効であり、その中でも特に会議録のように1つの発話
番にたくさんの文が含まれているような言語データに有
効である。本発明により、認識された語題構造はユーザ
にとって理解しやすいものとなる。
ロック図である。
チャートである。
ある。
認識方法を適用して話題構造を抽出した結果を示す図で
ある。
示すブロック図である。
処理を示すフローチャートである。
る。
句テーブル、話題転換型手掛かり句テーブルおよび入れ
子終了型手掛かり句テーブルの構成例を示す図である。
単語情報テーブルの構成例を示す図である。
ある。
話番情報テーブルのそれぞれと話題レベル設定テーブル
に記述された条件との関係を説明する図である。
なった話題構造認識結果の例を示す図である。
Claims (10)
- 【請求項1】 予め準備された規則を用いて言語データ
の話題構造を認識する話題構造認識処理における話題レ
ベルの決定方法において、 条件と話題レベルの増減との関係を記述する話題レベル
増減テーブルと、条件と新しい話題レベルの対を記述す
る話題レベル設定テーブルとを予め準備し、 前記話題レベル増減テーブルおよび前記話題レベル設定
テーブルを用いて話題レベルを決定することを特徴とす
る話題レベル制御方法。 - 【請求項2】 前記話題構造認識処理が、 述語を1つだけ持つ単位である単文に前記言語データを
分割し、前記各単文から手掛かり句を抽出し、該手掛か
り句のタイプを同定することを含む話題構造認識前処理
を行ない、 その後、明示的に示される基盤展開と該基盤展開の中で
展開する意味的展開とに話題の展開を分離し、 それぞれ基盤展開処理規則と意味的展開処理規則とを用
いて、前記基盤展開について、話題が提示・確立される
話題確立区間の決定と、該話題確立区間における話題語
の決定と、話題の入れ子を表す話題レベルと話題スコー
プの決定を順次行ない、次に、前記意味的展開につい
て、話題確立区間の決定、話題語の決定、話題スコープ
と話題レベルの決定を順次行ない、 その後、統合処理規則を用いて、基盤展開と意味的展開
のそれぞれの処理結果に対して統合する処理を行なう処
理である、請求項1に記載の話題レベル制御方法。 - 【請求項3】 前記話題レベル増減テーブルにしたがっ
て前記話題レベルを更新し、次に前記話題レベル設定テ
ーブルの条件が満たされているかどうかを判断し、当該
条件が成立している場合に前記話題レベル設定テーブル
にしたがって前記話題レベルを更新する、請求項1に記
載の話題レベル制御方法。 - 【請求項4】 前記話題レベル設定テーブルの条件とし
て、話者交替に関する情報が含まれる、請求項3に記載
の話題レベル制御方法。 - 【請求項5】 前記話題レベル設定テーブルの条件とし
て、前記話題レベル増減テーブルによって更新された後
の話題レベルの値に関する情報が含まれる、請求項3に
記載の話題レベル制御方法。 - 【請求項6】 言語データを入力するための入力部と、
話題構造認識のための規則類を蓄える辞書・規則部と、
該辞書・記憶部の規則類を用いた処理を行なう処理部
と、前記処理部による結果を蓄える記憶部と、前記処理
部による処理結果を表示する表示部とを有し、 手掛かり句が入れ子開始型と話題転換型と入れ子終了型
の3つのタイプに分類され、 前記辞書・規則部が、入れ子開始型の手掛かり句につい
てその単語と品詞とを登録した入れ子開始型手掛かり句
テーブルと、話題転換型の手掛かり句についてその単語
と品詞とを登録した話題転換型手掛かり句テーブルと、
入れ子終了型の手掛かり句についてその単語と品詞とを
登録した入れ子終了型手掛かり句テーブルと、前記手掛
かり句のタイプの情報を含む条件と話題レベルの増減と
の関係を記述した話題レベル増減テーブルと、条件と話
題レベルの値との組を記述した話題レベル設定テーブル
とを含み、 前記記憶部が、前記入力部から入力された言語データに
関する情報を蓄える言語データ記憶部と、話題構造に関
する情報を蓄える話題構造記憶部とを含み、 前記言語データ記憶部が、前記言語データに含まれる各
単語の文字列と品詞に関する情報を格納する単語情報テ
ーブルと、前記言語データの各単文に含まれる単語と手
掛かり句と手掛かり句のタイプに関する情報を格納する
単文情報テーブルと、各発話番の話者と開始単文番号を
含む情報を格納する発話番情報テーブルとを含み、 話題構造記憶部が、話題が提示、確立される範囲である
話題確立区間と話題語と話題レベルと話題スコープとを
含む情報を格納するテーブルを含む、 ことを特徴とする話題構造認識装置。 - 【請求項7】 前記辞書・規則部が、述語を1つだけ持
つ単位である単文に前記言語データを分割し、前記各単
文から手掛かり句を抽出し、該手掛かり句のタイプを同
定することを含む話題構造認識前処理のための前処理用
辞書と、基盤展開に対する処理を行なうための基盤展開
処理規則と、意味的展開に対する処理を行なうための意
味的展開処理規則と、基盤展開と意味的展開を統合する
ための統合処理規則とを含み、 前記話題構造記憶部が、基盤展開に関する情報を蓄える
基盤展開記憶部と、意味的展開に関する情報を蓄える意
味的展開記憶部と、基盤展開と意味的展開の統合後の情
報を蓄える統合話題記憶部とを含み、 意味的展開記憶部と基盤展開記憶部のそれぞれが、話題
が提示、確立される範囲である話題確立区間と、話題語
と、話題レベルと、話題スコープとを含む情報を格納す
るテーブルを含む、請求項6に記載の話題構造認識装
置。 - 【請求項8】 前記処理部が、前記話題レベル増減テー
ブルにしたがって話題レベルを更新してその結果を前記
基盤展開記憶部に保存し、次に、前記話題レベル設定テ
ーブルの条件が満たされているかどうかを調ベて満たさ
れている場合には前記話題レベル設定テーブルにしたが
って話題レベルを更新してその結果を前記基盤展開記憶
部に格納するものである、請求項6に記載の話題構造認
識装置。 - 【請求項9】 前記話題レベル設定テーブルの条件に、
前記発話番情報テーブルに記述されている開始単文と前
記単文情報テーブルに記述されている発話番とに関する
情報を用いる条件が含まれる請求項8に記載の話題構造
認識装置。 - 【請求項10】 前記話題レベル設定テーブルの条件
に、前記基盤展開記憶部に格納されている話題レベルの
値を用いる条件が含まれる請求項8に記載の話題構造認
識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP22315194A JP3329352B2 (ja) | 1994-09-19 | 1994-09-19 | 話題構造認識における話題レベル制御方法および話題構造認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP22315194A JP3329352B2 (ja) | 1994-09-19 | 1994-09-19 | 話題構造認識における話題レベル制御方法および話題構造認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0887501A true JPH0887501A (ja) | 1996-04-02 |
| JP3329352B2 JP3329352B2 (ja) | 2002-09-30 |
Family
ID=16793593
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP22315194A Expired - Lifetime JP3329352B2 (ja) | 1994-09-19 | 1994-09-19 | 話題構造認識における話題レベル制御方法および話題構造認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3329352B2 (ja) |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04332084A (ja) * | 1991-05-07 | 1992-11-19 | Nippon Telegr & Teleph Corp <Ntt> | 自動情報提供方法 |
| JPH06139276A (ja) * | 1992-10-29 | 1994-05-20 | Nippon Telegr & Teleph Corp <Ntt> | 話題認識方法 |
| JPH06236410A (ja) * | 1991-11-12 | 1994-08-23 | Nippon Telegr & Teleph Corp <Ntt> | 自動情報提供方法 |
| JPH07160711A (ja) * | 1993-12-07 | 1995-06-23 | Nippon Telegr & Teleph Corp <Ntt> | 書き言葉テキストに対する話題構造認識方法および装置 |
| JPH07160710A (ja) * | 1993-12-07 | 1995-06-23 | Nippon Telegr & Teleph Corp <Ntt> | モノローグ・データに対する話題構造認識方法および装置 |
| JPH07160712A (ja) * | 1993-12-07 | 1995-06-23 | Nippon Telegr & Teleph Corp <Ntt> | 話題構造認識方法および装置 |
-
1994
- 1994-09-19 JP JP22315194A patent/JP3329352B2/ja not_active Expired - Lifetime
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04332084A (ja) * | 1991-05-07 | 1992-11-19 | Nippon Telegr & Teleph Corp <Ntt> | 自動情報提供方法 |
| JPH06236410A (ja) * | 1991-11-12 | 1994-08-23 | Nippon Telegr & Teleph Corp <Ntt> | 自動情報提供方法 |
| JPH06139276A (ja) * | 1992-10-29 | 1994-05-20 | Nippon Telegr & Teleph Corp <Ntt> | 話題認識方法 |
| JPH07160711A (ja) * | 1993-12-07 | 1995-06-23 | Nippon Telegr & Teleph Corp <Ntt> | 書き言葉テキストに対する話題構造認識方法および装置 |
| JPH07160710A (ja) * | 1993-12-07 | 1995-06-23 | Nippon Telegr & Teleph Corp <Ntt> | モノローグ・データに対する話題構造認識方法および装置 |
| JPH07160712A (ja) * | 1993-12-07 | 1995-06-23 | Nippon Telegr & Teleph Corp <Ntt> | 話題構造認識方法および装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3329352B2 (ja) | 2002-09-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4654780B2 (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
| JP6813591B2 (ja) | モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、及びプログラム | |
| US8209166B2 (en) | Apparatus, method, and computer program product for machine translation | |
| JP3426176B2 (ja) | 音声認識装置、方法、コンピュータ・システム及び記憶媒体 | |
| EP1875462A2 (en) | Method and system for generating spelling suggestions | |
| JP2007517338A (ja) | サーチ品質の改善システムおよび改善方法 | |
| JP4826275B2 (ja) | 応答生成装置、方法及びプログラム | |
| US7949527B2 (en) | Multiresolution searching | |
| JP4289715B2 (ja) | 音声認識装置及び音声認識方法並びにその方法に用いられる木構造辞書の作成方法 | |
| US7860707B2 (en) | Compound word splitting for directory assistance services | |
| JP3983265B1 (ja) | 辞書作成支援システム、方法及びプログラム | |
| JP2000259645A (ja) | 音声処理装置及び音声データ検索装置 | |
| JPH0887501A (ja) | 話題構造認識における話題レベル制御方法および話題構造認識装置 | |
| JP2014052803A (ja) | 音声ドキュメント検索方法および音声ドキュメント検索システム | |
| JP3333952B2 (ja) | 話題構造認識方法及び装置 | |
| JP3082890B2 (ja) | 書き言葉テキストに対する話題構造認識方法および装置 | |
| KR100452024B1 (ko) | 자연어 질의 응답 검색 엔진 및 검색 방법 | |
| JP4756764B2 (ja) | プログラム及び情報処理装置並びに情報処理方法 | |
| JP3329353B2 (ja) | テキスト用話題構造認識における話題語選択方法と話題構造認識装置 | |
| JP3072955B2 (ja) | 重複話題語を考慮した話題構造認識方法と装置 | |
| JP3082889B2 (ja) | モノローグ・データに対する話題構造認識方法および装置 | |
| JP4980604B2 (ja) | 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体 | |
| JP3956730B2 (ja) | 言語処理装置 | |
| JP2008217529A (ja) | テキスト分析装置およびテキスト分析プログラム | |
| JP2001265792A (ja) | 自動要約文生成装置、自動要約文生成方法及び自動要約文生成方法を記録した媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070719 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080719 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080719 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090719 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090719 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100719 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100719 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110719 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120719 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130719 Year of fee payment: 11 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| EXPY | Cancellation because of completion of term |