JPH1125112A - 対話音声処理方法及び装置、記録媒体 - Google Patents
対話音声処理方法及び装置、記録媒体Info
- Publication number
- JPH1125112A JPH1125112A JP9180159A JP18015997A JPH1125112A JP H1125112 A JPH1125112 A JP H1125112A JP 9180159 A JP9180159 A JP 9180159A JP 18015997 A JP18015997 A JP 18015997A JP H1125112 A JPH1125112 A JP H1125112A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- data
- voice data
- dialogue
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【課題】 収録された対話音声から必要部分の情報を効
率的に再生できるようにする改良された対話音声処理装
置を提供する。 【解決手段】 分割処理部1は、時系列順に入力される
対話音声を音声処理して複数の音声データを生成する。
項目内容記録処理部2は、対話音声のインデックスとな
るデータ項目(話題)に対してその内容を対応付ける。
データ項目対応付け処理部3は、データ項目と音声デー
タ群との対応付けを行い、音声データセットをデータ項
目毎にデータ蓄積部4に格納する。対話内容再生部6
は、データ蓄積部4から必要なデータ項目についての音
声データセットのみを索出して対話内容を再生する。
率的に再生できるようにする改良された対話音声処理装
置を提供する。 【解決手段】 分割処理部1は、時系列順に入力される
対話音声を音声処理して複数の音声データを生成する。
項目内容記録処理部2は、対話音声のインデックスとな
るデータ項目(話題)に対してその内容を対応付ける。
データ項目対応付け処理部3は、データ項目と音声デー
タ群との対応付けを行い、音声データセットをデータ項
目毎にデータ蓄積部4に格納する。対話内容再生部6
は、データ蓄積部4から必要なデータ項目についての音
声データセットのみを索出して対話内容を再生する。
Description
【0001】
【発明の属する技術分野】本発明は、例えば、対話音声
を収録しておいて、事後的に対話音声を効率的に再生し
て対話内容を把握するための音声データ処理技術に関す
る。
を収録しておいて、事後的に対話音声を効率的に再生し
て対話内容を把握するための音声データ処理技術に関す
る。
【0002】
【従来の技術】対話型音声処理技術を応用したサービス
システムにおいて、顧客と対話しながら顧客対応記録の
作成を行う受付担当者の支援装置が知られている。この
支援装置では、予め決められた顧客対応のデータ項目を
受付担当者がキーボードで入力したり、メニューを選択
することによって、顧客データの入力や顧客対応記録の
作成を行う。サービス担当者は、受付担当者が作成した
顧客対応記録に記入されている顧客の要求をみてその顧
客への応対内容を決定し、必要な措置をとる。
システムにおいて、顧客と対話しながら顧客対応記録の
作成を行う受付担当者の支援装置が知られている。この
支援装置では、予め決められた顧客対応のデータ項目を
受付担当者がキーボードで入力したり、メニューを選択
することによって、顧客データの入力や顧客対応記録の
作成を行う。サービス担当者は、受付担当者が作成した
顧客対応記録に記入されている顧客の要求をみてその顧
客への応対内容を決定し、必要な措置をとる。
【0003】
【発明が解決しようとする課題】ところで、サービス担
当者は、受付担当者から伝達された情報が顧客への対処
を行う上で不十分であった場合は、再度、顧客に問い合
わせを行う必要が生じる。この場合、顧客にとっては、
すでに受付担当者に対して話した内容と同じ内容を再度
サービス担当者に話さなければならないため、煩わしい
ものとなる。このような問題の解決法としては、顧客と
受付担当者との対話をすべて収録しておき、伝達された
情報が足りない場合に、サービス担当者が事後的に対話
内容を把握できるようにすることが考えられる。しか
し、この手法では、収録された対話のうち実際に必要と
なる部分は非常に短いにもかかわらず、対話全体を聞か
なければならないという事態が生じる。そのため、対話
が長い場合や、複数の対話が収録されている場合は、サ
ービス担当者が対話音声を聞きとるまで時間がかかって
しまうという間題点があった。
当者は、受付担当者から伝達された情報が顧客への対処
を行う上で不十分であった場合は、再度、顧客に問い合
わせを行う必要が生じる。この場合、顧客にとっては、
すでに受付担当者に対して話した内容と同じ内容を再度
サービス担当者に話さなければならないため、煩わしい
ものとなる。このような問題の解決法としては、顧客と
受付担当者との対話をすべて収録しておき、伝達された
情報が足りない場合に、サービス担当者が事後的に対話
内容を把握できるようにすることが考えられる。しか
し、この手法では、収録された対話のうち実際に必要と
なる部分は非常に短いにもかかわらず、対話全体を聞か
なければならないという事態が生じる。そのため、対話
が長い場合や、複数の対話が収録されている場合は、サ
ービス担当者が対話音声を聞きとるまで時間がかかって
しまうという間題点があった。
【0004】このような問題は、顧客と受付担当者との
対話内容をサービス担当者が事後的に把握する用途のほ
か、単に対話内容の概略を知るという目的で、収録され
た対話音声を聞く場合にも同様に生じる。
対話内容をサービス担当者が事後的に把握する用途のほ
か、単に対話内容の概略を知るという目的で、収録され
た対話音声を聞く場合にも同様に生じる。
【0005】そこで本発明の課題は、収録された対話音
声から必要部分の情報を効率的に再生できるようにする
改良された対話音声処理方法を提供することにある。本
発明の他の課題は、上記対話音声処理方法の実施に適し
た装置、及びこの装置を汎用のコンピュータ装置上で実
現するための記録媒体を提供することにある。
声から必要部分の情報を効率的に再生できるようにする
改良された対話音声処理方法を提供することにある。本
発明の他の課題は、上記対話音声処理方法の実施に適し
た装置、及びこの装置を汎用のコンピュータ装置上で実
現するための記録媒体を提供することにある。
【0006】
【課題を解決するための手段】上記課題を解決する本発
明の対話音声処理方法は、コンピュータ装置を用いた方
法であって、入力された対話音声を複数の音声データに
分割し、分割された各音声データを話題毎に対応付けて
蓄積するとともに、蓄積された音声データから特定の話
題に対応する音声データ群を選択的に読み出して対話内
容を再生する過程を含むことを特徴とする。この方法に
よれば、話題についての音声データ群のみを検索して再
生できるので、検索効率が向上するとともに、すべての
音声データを時系列に再生する場合に比べて対話内容の
把握に要する時間を格段に短縮することができる。
明の対話音声処理方法は、コンピュータ装置を用いた方
法であって、入力された対話音声を複数の音声データに
分割し、分割された各音声データを話題毎に対応付けて
蓄積するとともに、蓄積された音声データから特定の話
題に対応する音声データ群を選択的に読み出して対話内
容を再生する過程を含むことを特徴とする。この方法に
よれば、話題についての音声データ群のみを検索して再
生できるので、検索効率が向上するとともに、すべての
音声データを時系列に再生する場合に比べて対話内容の
把握に要する時間を格段に短縮することができる。
【0007】また、本発明の他の対話音声処理方法は、
入力された対話音声を複数の音声データに分割し、予め
話題毎に定められたキーワードが含まれているかどうか
を個々の音声データ毎に判定して、当該音声データを前
記判定結果と対応付けて蓄積するとともに、蓄積された
音声データから前記キーワードを含む音声データを蓄積
順に読み出して対話内容を再生する過程を含むことを特
徴とする。この方法によれば、キーワードが含まれる、
即ち重要度が比較的高いと推定される音声データに基づ
いて対話内容が時系列に再生されるので、対話内容の概
要を把握することが可能となる。
入力された対話音声を複数の音声データに分割し、予め
話題毎に定められたキーワードが含まれているかどうか
を個々の音声データ毎に判定して、当該音声データを前
記判定結果と対応付けて蓄積するとともに、蓄積された
音声データから前記キーワードを含む音声データを蓄積
順に読み出して対話内容を再生する過程を含むことを特
徴とする。この方法によれば、キーワードが含まれる、
即ち重要度が比較的高いと推定される音声データに基づ
いて対話内容が時系列に再生されるので、対話内容の概
要を把握することが可能となる。
【0008】なお、キーワードに予め優先順位をつけて
おき、優先順位の高いキーワードに対応する音声データ
を優先的に再生するようにしても良い。
おき、優先順位の高いキーワードに対応する音声データ
を優先的に再生するようにしても良い。
【0009】また、上記他の課題を解決する第1構成の
対話音声処理装置は、対話音声を入力する音声入力手段
と、入力された対話音声を所定の処理単位毎に分割して
複数の音声データを生成する手段と、前記生成された複
数の音声データをそれぞれ対話内容のインデックスとな
るデータ項目に対応付けて蓄積する手段とを備え、前記
蓄積された複数の音声データから前記データ項目毎の対
応音声データ群を索出するように構成されたことを特徴
とする。
対話音声処理装置は、対話音声を入力する音声入力手段
と、入力された対話音声を所定の処理単位毎に分割して
複数の音声データを生成する手段と、前記生成された複
数の音声データをそれぞれ対話内容のインデックスとな
るデータ項目に対応付けて蓄積する手段とを備え、前記
蓄積された複数の音声データから前記データ項目毎の対
応音声データ群を索出するように構成されたことを特徴
とする。
【0010】第2構成の対話音声処理装置は、対話音声
を入力する音声入力手段と、入力された対話音声を所定
の処理単位毎に分割して複数の音声データを生成する手
段と、予め話題毎に定めたキーワードが個々の音声デー
タに存在するかどうかを判定する手段と、前記判定の結
果情報を当該音声データに付与して蓄積する手段とを備
え、前記蓄積された複数の音声データから前記キーワー
ドを含む音声データ群を蓄積順に索出するように構成さ
れたことを特徴とする。
を入力する音声入力手段と、入力された対話音声を所定
の処理単位毎に分割して複数の音声データを生成する手
段と、予め話題毎に定めたキーワードが個々の音声デー
タに存在するかどうかを判定する手段と、前記判定の結
果情報を当該音声データに付与して蓄積する手段とを備
え、前記蓄積された複数の音声データから前記キーワー
ドを含む音声データ群を蓄積順に索出するように構成さ
れたことを特徴とする。
【0011】第3構成の対話音声処理装置は、対話音声
を入力する音声入力手段と、入力された対話音声を所定
の処理単位毎に分割して複数の音声データを生成する手
段と、予め話題毎に定めたキーワードが個々の音声デー
タに存在するかどうかを判定する手段と、個々の音声デ
ータに前記判定の結果情報を付与するとともに、各音声
データをそれぞれ対話内容のインデックスとなるデータ
項目に対応付けて蓄積する手段とを備え、前記蓄積され
た複数の音声データから前記データ項目毎またはキーワ
ード毎に対応音声データ群を索出するように構成された
ことを特徴とする。
を入力する音声入力手段と、入力された対話音声を所定
の処理単位毎に分割して複数の音声データを生成する手
段と、予め話題毎に定めたキーワードが個々の音声デー
タに存在するかどうかを判定する手段と、個々の音声デ
ータに前記判定の結果情報を付与するとともに、各音声
データをそれぞれ対話内容のインデックスとなるデータ
項目に対応付けて蓄積する手段とを備え、前記蓄積され
た複数の音声データから前記データ項目毎またはキーワ
ード毎に対応音声データ群を索出するように構成された
ことを特徴とする。
【0012】なお、各対話音声処理装置において、好ま
しくは、索出された対応音声データ群に基づいて対話内
容を再生する再生手段をさらに備える。
しくは、索出された対応音声データ群に基づいて対話内
容を再生する再生手段をさらに備える。
【0013】さらに、上記他の課題を解決する本発明の
記録媒体は、コンピュータ装置に下記の処理を実行させ
るプログラムを当該コンピュータ装置が読み取り可能な
形態で記録してなる記録媒体である。 (1)対話音声を入力する音声入力処理、(2)入力さ
れた対話音声を所定の処理単位毎に分割して複数の音声
データを生成する処理、(3)予め話題毎に定めたキー
ワードが個々の音声データに存在するかどうかを判定す
る処理、(4)前記生成された音声データにそれぞれ前
記判定の結果情報を付与するとともに各音声データを対
話内容のインデックスとなるデータ項目と対応付けて蓄
積する処理、(5)前記蓄積された音声データを前記デ
ータ項目毎またはキーワード毎に索出して対話内容を再
生する処理。
記録媒体は、コンピュータ装置に下記の処理を実行させ
るプログラムを当該コンピュータ装置が読み取り可能な
形態で記録してなる記録媒体である。 (1)対話音声を入力する音声入力処理、(2)入力さ
れた対話音声を所定の処理単位毎に分割して複数の音声
データを生成する処理、(3)予め話題毎に定めたキー
ワードが個々の音声データに存在するかどうかを判定す
る処理、(4)前記生成された音声データにそれぞれ前
記判定の結果情報を付与するとともに各音声データを対
話内容のインデックスとなるデータ項目と対応付けて蓄
積する処理、(5)前記蓄積された音声データを前記デ
ータ項目毎またはキーワード毎に索出して対話内容を再
生する処理。
【0014】
【発明の実施の形態】以下、本発明を、顧客と受付担当
者との間で交わされる対話音声を対象とする対話音声処
理装置に適用した場合の実施の形態を詳細に説明する。
図1は、本実施形態による対話音声処理装置の概略構成
図である。この対話音声処理装置は、コンピュータ装置
が所定のプログラムを読み込んで実行することにより形
成される、分割処理部1、項目内容記録処理部2、デー
タ項目対応付け処理部3、データ蓄積部4、キーワード
検出部5、及び対話内容再生部6の機能を備えて構成さ
れる。なお、各機能ブロック1〜6を形成するためのプ
ログラムは、通常、当該コンピュータ装置の内部記憶装
置あるいは外部記憶装置に格納され、随時読み取られて
実行されるようになっているが、当該コンピュータ装置
とは分離可能な記録媒体、例えばCD−ROMやFD等
に格納され、使用時に上記内部記憶装置または外部記憶
装置にインストールされて随時実行に供されるものであ
っても良い。
者との間で交わされる対話音声を対象とする対話音声処
理装置に適用した場合の実施の形態を詳細に説明する。
図1は、本実施形態による対話音声処理装置の概略構成
図である。この対話音声処理装置は、コンピュータ装置
が所定のプログラムを読み込んで実行することにより形
成される、分割処理部1、項目内容記録処理部2、デー
タ項目対応付け処理部3、データ蓄積部4、キーワード
検出部5、及び対話内容再生部6の機能を備えて構成さ
れる。なお、各機能ブロック1〜6を形成するためのプ
ログラムは、通常、当該コンピュータ装置の内部記憶装
置あるいは外部記憶装置に格納され、随時読み取られて
実行されるようになっているが、当該コンピュータ装置
とは分離可能な記録媒体、例えばCD−ROMやFD等
に格納され、使用時に上記内部記憶装置または外部記憶
装置にインストールされて随時実行に供されるものであ
っても良い。
【0015】本実施形態による対話音声は、電話等を通
じて本装置に入力される顧客及び受付担当者の音声であ
る。分割処理部1は、入力された対話音声を適当な処理
単位の音声データに分割し、各音声データに連続の番号
を付与する。音声データの分割は、例えば発話と発話の
間の任意の長さ以上の無音区間を用いて行うことができ
る。多くの場合、対話音声は、一方の話者が話し始めて
から他方の話者が話し始めるまでを一区間の音声データ
として分割される。勿論、他の手法によって分割処理を
行うことも可能である。
じて本装置に入力される顧客及び受付担当者の音声であ
る。分割処理部1は、入力された対話音声を適当な処理
単位の音声データに分割し、各音声データに連続の番号
を付与する。音声データの分割は、例えば発話と発話の
間の任意の長さ以上の無音区間を用いて行うことができ
る。多くの場合、対話音声は、一方の話者が話し始めて
から他方の話者が話し始めるまでを一区間の音声データ
として分割される。勿論、他の手法によって分割処理を
行うことも可能である。
【0016】項目内容記録処理部2は、入力された対話
音声から予め定められた顧客対応データ項目(以下、デ
ータ項目と略す)の内容を抽出し、抽出結果をデータ項
目対応付け処理部3に渡す。対話音声からの項目内容の
抽出は、音声自動認識処理等によって行うことが可能で
ある。例えば、本装置を操作する受付担当者がデータ項
目を顧客に尋ねるようにし、顧客による返答部分の音声
を音声認識処理して当該顧客についてのデータ項目の内
容を把握する。あるいは、音声自動認識処理等によら
ず、受付担当者が顧客と直接会話し、その会話中にデー
タ項目に関する内容が含まれていた場合、これを図示し
ないキーボードによって項目内容記録処理部2への項目
内容として入力するようにしても良い。
音声から予め定められた顧客対応データ項目(以下、デ
ータ項目と略す)の内容を抽出し、抽出結果をデータ項
目対応付け処理部3に渡す。対話音声からの項目内容の
抽出は、音声自動認識処理等によって行うことが可能で
ある。例えば、本装置を操作する受付担当者がデータ項
目を顧客に尋ねるようにし、顧客による返答部分の音声
を音声認識処理して当該顧客についてのデータ項目の内
容を把握する。あるいは、音声自動認識処理等によら
ず、受付担当者が顧客と直接会話し、その会話中にデー
タ項目に関する内容が含まれていた場合、これを図示し
ないキーボードによって項目内容記録処理部2への項目
内容として入力するようにしても良い。
【0017】データ項目対応付け処理部3は、顧客と受
付担当者との間の話題のインデックスとなるデータ項目
と、項目内容記録処理部2で抽出された各項目内容とを
対応付けるとともに、分割処理部1からの音声データ
(付与された番号)と上記データ項目とを対応付け、そ
れらを一連の顧客対応データとしてデータ蓄積部4に蓄
積する。また、各データ項目について、受付担当者によ
る、あるキー入力(キーボードによる入力、以下同じ)
があった時点以前で、かつ、一つ前のデータ項目のキー
入力があった時点よりも後に話された一連の音声データ
のすべてを、そのデータ項目と対応付けておく。
付担当者との間の話題のインデックスとなるデータ項目
と、項目内容記録処理部2で抽出された各項目内容とを
対応付けるとともに、分割処理部1からの音声データ
(付与された番号)と上記データ項目とを対応付け、そ
れらを一連の顧客対応データとしてデータ蓄積部4に蓄
積する。また、各データ項目について、受付担当者によ
る、あるキー入力(キーボードによる入力、以下同じ)
があった時点以前で、かつ、一つ前のデータ項目のキー
入力があった時点よりも後に話された一連の音声データ
のすべてを、そのデータ項目と対応付けておく。
【0018】キーワード検出部5は、予め対話に出現す
ると予想されるキーワードのリストを話題毎、つまりデ
ータ項目毎に保持しており、分割された音声データ中に
上記キーワードが含まれるかどうかをキーワード認識処
理により調べて、その有無の情報を音声データに対応付
けてデータ蓄積部4に蓄積する。このキーワード認識処
理は、音声データの分割処理と平行して行えるように、
マルチタスク形式で実行する。
ると予想されるキーワードのリストを話題毎、つまりデ
ータ項目毎に保持しており、分割された音声データ中に
上記キーワードが含まれるかどうかをキーワード認識処
理により調べて、その有無の情報を音声データに対応付
けてデータ蓄積部4に蓄積する。このキーワード認識処
理は、音声データの分割処理と平行して行えるように、
マルチタスク形式で実行する。
【0019】対話内容再生部6は、データ蓄積部4に蓄
積されている複数の音声データからデータ項目毎あるい
はキーワード毎に該当するものを探索して所定順に並
べ、対話内容を再生するものである。再生に際しては、
通常、音響手法が用いられるが、音声データを音声認識
処理してこれを文字情報化、符号化、図形化してディス
プレイ表示する等の方法を採用することもできる。音声
データの探索についてはテキストサーチ等の検索手法を
採用することができる。
積されている複数の音声データからデータ項目毎あるい
はキーワード毎に該当するものを探索して所定順に並
べ、対話内容を再生するものである。再生に際しては、
通常、音響手法が用いられるが、音声データを音声認識
処理してこれを文字情報化、符号化、図形化してディス
プレイ表示する等の方法を採用することもできる。音声
データの探索についてはテキストサーチ等の検索手法を
採用することができる。
【0020】次に、本実施形態の対話音声処理装置(以
下、本装置)において、音声データを蓄積する場合の処
理を図2を参照して説明する。本装置における音声デー
タの蓄積処理は、顧客が電話回線をつないでから切断す
るまで続くものとする。
下、本装置)において、音声データを蓄積する場合の処
理を図2を参照して説明する。本装置における音声デー
タの蓄積処理は、顧客が電話回線をつないでから切断す
るまで続くものとする。
【0021】本装置では、回線が切断されていないこと
を確認した後(ステップS1:No)、キー入力及び音
声入力を待つ(ステップS2:No、ステップS3:N
o)。音声が入力された場合は(ステップS3:Ye
s)、図示しない記録領域への音声データ毎の記録処理
を行う(ステップS4)。この処理は音声入力が終了す
るまで繰り返し行われる(ステップS5:No)。音声
入力が終了すると(ステップS5:Yes)、入力音声
から分割された一連の音声データについての番号付与処
理を行う(ステップS6)。以上の処理は、分割処理部
1で行われる。ステップS2において、キー入力があっ
た場合、例えばあるデータ項目に関して2つの音声デー
タが使用され、そのデータ項目についてのキー入力があ
った場合は、データ項目対応付け処理部3で、そのデー
タ項目と音声データとの対応付け処理を行う(ステップ
S7)。その後、キーワード検出部5で、キーワード認
識処理及び音声データ中のキーワードの有無を検出し、
検出結果をデータ蓄積部4に蓄積する(ステップS
8)。これらの一連の処理を回線切断があるまで繰り返
す。
を確認した後(ステップS1:No)、キー入力及び音
声入力を待つ(ステップS2:No、ステップS3:N
o)。音声が入力された場合は(ステップS3:Ye
s)、図示しない記録領域への音声データ毎の記録処理
を行う(ステップS4)。この処理は音声入力が終了す
るまで繰り返し行われる(ステップS5:No)。音声
入力が終了すると(ステップS5:Yes)、入力音声
から分割された一連の音声データについての番号付与処
理を行う(ステップS6)。以上の処理は、分割処理部
1で行われる。ステップS2において、キー入力があっ
た場合、例えばあるデータ項目に関して2つの音声デー
タが使用され、そのデータ項目についてのキー入力があ
った場合は、データ項目対応付け処理部3で、そのデー
タ項目と音声データとの対応付け処理を行う(ステップ
S7)。その後、キーワード検出部5で、キーワード認
識処理及び音声データ中のキーワードの有無を検出し、
検出結果をデータ蓄積部4に蓄積する(ステップS
8)。これらの一連の処理を回線切断があるまで繰り返
す。
【0022】以上の処理を、顧客が、購入したパーソナ
ルコンピュータに関する相談を本装置の受付担当者に対
して行う場合に適用した場合について具体的に説明す
る。図3は、この例における対話の流れとそのときの音
声データの内容を示す図である。この例では、顧客と受
付担当者との間で交わされる対話が、それぞれ分割処理
部1において複数の音声データに分割され、各音声デー
タに連続番号「0000」〜「0013」が付与され
る。また、データ項目に対応した音声データ群、すなわ
ち音声データセットの開始音声データ「0000」がデ
ータ蓄積部4の該当領域に記録される。対話が進行し、
顧客の名前が分かった段階で、受付担当者は、データ項
目「顧客名」に「いそべ」という顧客名をキー入力し、
これらの音声データセット(0001〜0002)をデ
ータ蓄積部4の該当領域に蓄積する。同様に、データ項
目「用件」に「メモリー型番問い合わせ」、データ項目
「対象ハードウェア」にパソコンの種類「XX−Y
Y」、データ項目「連絡先」に顧客の電話番号「03−
2456−7777」をそれぞれキー入力し、それぞれ
のデータ項目についての音声データセットをデータ蓄積
部4の該当領域に蓄積する。
ルコンピュータに関する相談を本装置の受付担当者に対
して行う場合に適用した場合について具体的に説明す
る。図3は、この例における対話の流れとそのときの音
声データの内容を示す図である。この例では、顧客と受
付担当者との間で交わされる対話が、それぞれ分割処理
部1において複数の音声データに分割され、各音声デー
タに連続番号「0000」〜「0013」が付与され
る。また、データ項目に対応した音声データ群、すなわ
ち音声データセットの開始音声データ「0000」がデ
ータ蓄積部4の該当領域に記録される。対話が進行し、
顧客の名前が分かった段階で、受付担当者は、データ項
目「顧客名」に「いそべ」という顧客名をキー入力し、
これらの音声データセット(0001〜0002)をデ
ータ蓄積部4の該当領域に蓄積する。同様に、データ項
目「用件」に「メモリー型番問い合わせ」、データ項目
「対象ハードウェア」にパソコンの種類「XX−Y
Y」、データ項目「連絡先」に顧客の電話番号「03−
2456−7777」をそれぞれキー入力し、それぞれ
のデータ項目についての音声データセットをデータ蓄積
部4の該当領域に蓄積する。
【0023】本対話に基づいて作成されたデータ項目と
その内容の対応関係を表すデータ(顧客対応データ)の
例を図4に示す。本実施形態では、そのデータ項目につ
いての区切り情報であるキー入力を完了した時点で、そ
れ以前で最も新しく発声された音声データを当該データ
項目についての音声データセットの終了音声データとす
る。これにより音声データセットの範囲とその対応先の
項目とが決定する。
その内容の対応関係を表すデータ(顧客対応データ)の
例を図4に示す。本実施形態では、そのデータ項目につ
いての区切り情報であるキー入力を完了した時点で、そ
れ以前で最も新しく発声された音声データを当該データ
項目についての音声データセットの終了音声データとす
る。これにより音声データセットの範囲とその対応先の
項目とが決定する。
【0024】キーワード検出部5は、音声データセット
の範囲とその対応先の項目とが決定した時点、例えばデ
ータ項目「用件」についていえば、その内容「メモリー
型番問い合わせ」がキー入力された時点で、音声データ
セット「0003」〜「0005」が、そのデータ項目
「用件」に対応した音声データであると判定し、その音
声データ「0003」〜「0005」に対してキーワー
ド認識処理を行う。このキーワード認識処理は、事前に
登録されたキーワードのリストに基づいて行う。図5
は、このリストの例を示す図であり、例えばデータ項目
「用件」に対応したキーワードとして登録されているも
のに、「パソコン」、「聞きたい」、「型番」、「教え
て」・・・がある。キーワード検出部5は、例えばデー
タ項目「用件」についてのキーワードが含まれている音
声データとして音声データ「0003」および「000
5」を選定し、音声データ「0004」にはキーワード
が含まれていないと判定する。これらの結果は図6に示
すように、データ項目名、項目内容、対応音声データ
(一つまたは複数の音声データの番号、音声データファ
イル名、それぞれの音声データ中のキーワード含有の有
無の情報(1=有/0=無))の組データとして、デー
タ蓄積部4に蓄積される。
の範囲とその対応先の項目とが決定した時点、例えばデ
ータ項目「用件」についていえば、その内容「メモリー
型番問い合わせ」がキー入力された時点で、音声データ
セット「0003」〜「0005」が、そのデータ項目
「用件」に対応した音声データであると判定し、その音
声データ「0003」〜「0005」に対してキーワー
ド認識処理を行う。このキーワード認識処理は、事前に
登録されたキーワードのリストに基づいて行う。図5
は、このリストの例を示す図であり、例えばデータ項目
「用件」に対応したキーワードとして登録されているも
のに、「パソコン」、「聞きたい」、「型番」、「教え
て」・・・がある。キーワード検出部5は、例えばデー
タ項目「用件」についてのキーワードが含まれている音
声データとして音声データ「0003」および「000
5」を選定し、音声データ「0004」にはキーワード
が含まれていないと判定する。これらの結果は図6に示
すように、データ項目名、項目内容、対応音声データ
(一つまたは複数の音声データの番号、音声データファ
イル名、それぞれの音声データ中のキーワード含有の有
無の情報(1=有/0=無))の組データとして、デー
タ蓄積部4に蓄積される。
【0025】ところで、図3の例では、受付担当者によ
って4つのデータ項目の情報がキー入力されている。し
かし、顧客が話した内容のうち、購入時期である「昨年
9月」、購入場所である「XX電器」、購入予定のメモ
リーの容量である「8Mから40Mへの変更」という情
報については、受付担当者がキー入力を行っていない。
また、顧客の電話番号は誤ってキー入力されている。こ
のような場合、サービス担当者が受付担当者の作成した
顧客対応データを基に回答をしようとすると、情報が不
足したり、回答すべき情報が誤ってしまうことが予想さ
れる。この場合、サービス担当者は、以下のようにして
対応することになる。
って4つのデータ項目の情報がキー入力されている。し
かし、顧客が話した内容のうち、購入時期である「昨年
9月」、購入場所である「XX電器」、購入予定のメモ
リーの容量である「8Mから40Mへの変更」という情
報については、受付担当者がキー入力を行っていない。
また、顧客の電話番号は誤ってキー入力されている。こ
のような場合、サービス担当者が受付担当者の作成した
顧客対応データを基に回答をしようとすると、情報が不
足したり、回答すべき情報が誤ってしまうことが予想さ
れる。この場合、サービス担当者は、以下のようにして
対応することになる。
【0026】まず、生産時期によってメモリーの型番が
違う事実がある場合、製品番号や購入時期を正しく知る
必要がある。このときは、すでに収録されている「用
件」の部分の音声データセットをデータ蓄積部4から索
出して対話内容再生部6で再生し、商品の購入時期を知
ることにより、商品の生産時期と、正しいメモリーの型
番を判断する。また、顧客対応データの「連絡」項目の
電話番号に電話をかけた場合、受付担当者がキー入力を
間違ったために顧客につながらない。この場合は、顧客
対応データの「連絡先」項目に対応した音声データセッ
トを選択的にデータ蓄積部4より索出し、これを対話内
容再生部6で再生して確認することにより、顧客が発し
た正しい電話番号を知ることができるようになる。
違う事実がある場合、製品番号や購入時期を正しく知る
必要がある。このときは、すでに収録されている「用
件」の部分の音声データセットをデータ蓄積部4から索
出して対話内容再生部6で再生し、商品の購入時期を知
ることにより、商品の生産時期と、正しいメモリーの型
番を判断する。また、顧客対応データの「連絡」項目の
電話番号に電話をかけた場合、受付担当者がキー入力を
間違ったために顧客につながらない。この場合は、顧客
対応データの「連絡先」項目に対応した音声データセッ
トを選択的にデータ蓄積部4より索出し、これを対話内
容再生部6で再生して確認することにより、顧客が発し
た正しい電話番号を知ることができるようになる。
【0027】さらに、対話の内容の概略を聞く場合は、
キーワードを含有する音声データのみを、時間的に古い
ものからデータ蓄積部4から索出して並び替えし、これ
を対話内容再生部6で再生することにより、その概略を
迅速に把握することができるようになる。図7は、図3
の対話例からキーワードを含む音声データのみを抜き出
して作成した対話内容の例である。下線をひかれた単語
が、予め登録されたキーワードである。図7から明らか
なように、図3の対話内容に比べて格段に短い内容にな
っている。しかも、必要な会話内容についてはすべて網
羅されているので、対話内容の正しい把握が可能にな
る。
キーワードを含有する音声データのみを、時間的に古い
ものからデータ蓄積部4から索出して並び替えし、これ
を対話内容再生部6で再生することにより、その概略を
迅速に把握することができるようになる。図7は、図3
の対話例からキーワードを含む音声データのみを抜き出
して作成した対話内容の例である。下線をひかれた単語
が、予め登録されたキーワードである。図7から明らか
なように、図3の対話内容に比べて格段に短い内容にな
っている。しかも、必要な会話内容についてはすべて網
羅されているので、対話内容の正しい把握が可能にな
る。
【0028】なお、対話内容の再生に際しては、音声デ
ータをソーティングしたうえで再生したり、任意の法則
によりキーワードに優先順位をつけておき、優先順位の
高いキーワードに対応する音声データから順に再生する
ようにすることも可能である。このようにすれば、関心
のある順に対話音声を把握できるようになり、目的に合
致した利用形態を実現することができるようになる。
ータをソーティングしたうえで再生したり、任意の法則
によりキーワードに優先順位をつけておき、優先順位の
高いキーワードに対応する音声データから順に再生する
ようにすることも可能である。このようにすれば、関心
のある順に対話音声を把握できるようになり、目的に合
致した利用形態を実現することができるようになる。
【0029】以上説明したように、本実施形態の対話音
声処理装置では、顧客と受付担当者との間で交わされる
対話音声を分割して複数の音声データを生成するととも
に、予め決めておいたデータ項目毎の音声データセット
毎に対応付けて蓄積し、該当データ項目毎の再生を可能
にしたので、対話内容を事後的に把握するときに、従来
のように対話の初めから通して音声を聞く必要がなくな
り、必要な情報を取得するための労力と所要時間を節約
することができるようになる。
声処理装置では、顧客と受付担当者との間で交わされる
対話音声を分割して複数の音声データを生成するととも
に、予め決めておいたデータ項目毎の音声データセット
毎に対応付けて蓄積し、該当データ項目毎の再生を可能
にしたので、対話内容を事後的に把握するときに、従来
のように対話の初めから通して音声を聞く必要がなくな
り、必要な情報を取得するための労力と所要時間を節約
することができるようになる。
【0030】また、分割した音声データの中で、対話内
容に関して重要なもの、例えば、予め話題毎に定めたキ
ーワードを含んだ音声データのみを時系列上に並べて対
話の概略内容を再生できるようにしたので、対話内容を
簡潔に理解することが可能になる。
容に関して重要なもの、例えば、予め話題毎に定めたキ
ーワードを含んだ音声データのみを時系列上に並べて対
話の概略内容を再生できるようにしたので、対話内容を
簡潔に理解することが可能になる。
【0031】なお、本実施形態では、顧客と受付担当者
との対話音声を例に挙げて説明したが、この例に限ら
ず、任意の対話に対しても本発明を適用することが可能
であることはいうまでもないことである。
との対話音声を例に挙げて説明したが、この例に限ら
ず、任意の対話に対しても本発明を適用することが可能
であることはいうまでもないことである。
【0032】
【発明の効果】以上の説明から明らかなように、本発明
によれば、対話音声を収録する際に対話音声を複数の音
声データに分割し、話題毎の音声データセットとして蓄
積するようにしたので、知りたい話題についての情報が
含まれる可能性がある話題部分の音声データセットのみ
を再生することが可能になる。
によれば、対話音声を収録する際に対話音声を複数の音
声データに分割し、話題毎の音声データセットとして蓄
積するようにしたので、知りたい話題についての情報が
含まれる可能性がある話題部分の音声データセットのみ
を再生することが可能になる。
【0033】また、本発明によれば、蓄積された複数の
音声データから所要のキーワードが含まれる音声データ
を選択的に索出して再生することができるので、対話内
容を全体的に要約して把握することが可能となる。特
に、キーワードを含む音声データを、対話の時系列順に
再生することで、もとの対話音声の流れに沿った再生が
可能になり、対話内容を正しく理解できるようになる。
音声データから所要のキーワードが含まれる音声データ
を選択的に索出して再生することができるので、対話内
容を全体的に要約して把握することが可能となる。特
に、キーワードを含む音声データを、対話の時系列順に
再生することで、もとの対話音声の流れに沿った再生が
可能になり、対話内容を正しく理解できるようになる。
【図1】本発明の一実施形態に係る対話音声処理装置の
概略機能説明図。
概略機能説明図。
【図2】本実施形態の対話音声処理装置の処理手順説明
図。
図。
【図3】顧客と対話音声処理装置の受付担当者との間の
対話の流れとそのときの音声データの内容を示す説明
図。
対話の流れとそのときの音声データの内容を示す説明
図。
【図4】本実施形態による顧客対応データの説明図。
【図5】予め設定されたキーワードリストの内容例を示
す説明図。
す説明図。
【図6】データ蓄積部に蓄積される組データの内容例を
示す説明図。
示す説明図。
【図7】キーワード抽出によって再生された対話音声の
説明図。
説明図。
1 分割処理部 2 項目内容記録処理部 3 データ項目対応付け処理部 4 データ蓄積部 5 キーワード検出部 6 対話内容再生部
Claims (9)
- 【請求項1】 入力された対話音声を複数の音声データ
に分割し、分割された音声データを話題毎の音声データ
セットとして蓄積するとともに、蓄積された音声データ
から特定の話題に対応する音声データセットを選択的に
索出して対話内容を再生する過程を含む、コンピュータ
装置を用いた対話音声処理方法。 - 【請求項2】 前記音声データセットの範囲は、個々の
話題について前回の区切り情報の決定後に入力された音
声データを開始音声データとし、次の区切り情報の決定
以前の最新に入力された音声データを終了音声データと
して決定することを特徴とする請求項1記載の対話音声
処理方法。 - 【請求項3】 入力された対話音声を複数の音声データ
に分割し、予め話題毎に定められたキーワードが含まれ
ているかどうかを個々の音声データ毎に判定して、当該
音声データを前記判定結果と対応付けて蓄積するととも
に、蓄積された音声データから前記キーワードを含む音
声データを蓄積順に読み出して対話内容を再生する過程
を含む、コンピュータ装置を用いた対話音声処理方法。 - 【請求項4】 前記キーワードに予め優先順位をつけて
おき、優先順位の高いキーワードに対応する音声データ
を優先的に再生することを特徴とする請求項3記載の対
話音声処理方法。 - 【請求項5】 対話音声を入力する音声入力手段と、 入力された対話音声を所定の処理単位毎に分割して複数
の音声データを生成する手段と、 前記生成された複数の音声データをそれぞれ対話内容の
インデックスとなるデータ項目に対応付けて蓄積する手
段とを備え、 前記蓄積された複数の音声データから前記データ項目毎
の対応音声データ群を索出するように構成された対話音
声処理装置。 - 【請求項6】 対話音声を入力する音声入力手段と、 入力された対話音声を所定の処理単位毎に分割して複数
の音声データを生成する手段と、 予め話題毎に定めたキーワードが個々の音声データに存
在するかどうかを判定する手段と、 前記判定の結果情報を当該音声データに付与して蓄積す
る手段とを備え、 前記蓄積された複数の音声データから前記キーワードを
含む音声データ群を蓄積順に索出するように構成された
対話音声処理装置。 - 【請求項7】 対話音声を入力する音声入力手段と、 入力された対話音声を所定の処理単位毎に分割して複数
の音声データを生成する手段と、 予め話題毎に定めたキーワードが個々の音声データに存
在するかどうかを判定する手段と、 個々の音声データに前記判定の結果情報を付与するとと
もに、各音声データをそれぞれ対話内容のインデックス
となるデータ項目に対応付けて蓄積する手段とを備え、 前記蓄積された複数の音声データから前記データ項目毎
またはキーワード毎に対応音声データ群を索出するよう
に構成された対話音声処理装置。 - 【請求項8】 索出された対応音声データ群に基づいて
対話内容を再生する再生手段をさらに備えてなる請求項
5ないし7のいずれかの項記載の対話音声処理装置。 - 【請求項9】 対話音声を入力する音声入力処理と、 入力された対話音声を所定の処理単位毎に分割して複数
の音声データを生成する処理と、 予め話題毎に定めたキーワードが個々の音声データに存
在するかどうかを判定する処理と、 前記生成された音声データにそれぞれ前記判定の結果情
報を付与するとともに各音声データを対話内容のインデ
ックスとなるデータ項目と対応付けて蓄積する処理と、 前記蓄積された音声データを前記データ項目毎またはキ
ーワード毎に索出して対話内容を再生する処理とをコン
ピュータ装置に実行させるプログラムを当該コンピュー
タ装置が読み取り可能な形態で記録してなる記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9180159A JPH1125112A (ja) | 1997-07-04 | 1997-07-04 | 対話音声処理方法及び装置、記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP9180159A JPH1125112A (ja) | 1997-07-04 | 1997-07-04 | 対話音声処理方法及び装置、記録媒体 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1125112A true JPH1125112A (ja) | 1999-01-29 |
Family
ID=16078439
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP9180159A Pending JPH1125112A (ja) | 1997-07-04 | 1997-07-04 | 対話音声処理方法及び装置、記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1125112A (ja) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005237017A (ja) * | 2005-03-07 | 2005-09-02 | Toshiba Corp | コミュニケーション記録システム |
| US7039585B2 (en) | 2001-04-10 | 2006-05-02 | International Business Machines Corporation | Method and system for searching recorded speech and retrieving relevant segments |
| US7136684B2 (en) | 2002-01-07 | 2006-11-14 | Kabushiki Kaisha Toshiba | Headset with radio communication function and communication recording system using time information |
| US7940915B2 (en) | 2006-01-05 | 2011-05-10 | Fujitsu Limited | Apparatus and method for determining part of elicitation from spoken dialogue data |
| JP2011113570A (ja) * | 2009-11-27 | 2011-06-09 | Ricoh Co Ltd | 音声検索装置と音声検索方法 |
| JP2013183459A (ja) * | 2012-03-02 | 2013-09-12 | Samsung Electronics Co Ltd | 録音機能が連動されたメモ機能運用方法および装置 |
| JP2013200423A (ja) * | 2012-03-23 | 2013-10-03 | Toshiba Corp | 音声対話支援装置、方法、およびプログラム |
| JP5423993B2 (ja) * | 2008-12-26 | 2014-02-19 | 日本電気株式会社 | テキスト処理装置、テキスト処理方法、及びプログラム |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06139289A (ja) * | 1992-10-26 | 1994-05-20 | Olympus Optical Co Ltd | 情報再生装置 |
| JPH07182365A (ja) * | 1993-12-24 | 1995-07-21 | Hitachi Ltd | マルチメディア会議録作成支援装置および方法 |
| JPH08274872A (ja) * | 1995-03-30 | 1996-10-18 | Toppan Printing Co Ltd | 音声記録システム |
| JPH0962296A (ja) * | 1995-08-30 | 1997-03-07 | Olympus Optical Co Ltd | 音声記録装置および音声再生装置 |
-
1997
- 1997-07-04 JP JP9180159A patent/JPH1125112A/ja active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06139289A (ja) * | 1992-10-26 | 1994-05-20 | Olympus Optical Co Ltd | 情報再生装置 |
| JPH07182365A (ja) * | 1993-12-24 | 1995-07-21 | Hitachi Ltd | マルチメディア会議録作成支援装置および方法 |
| JPH08274872A (ja) * | 1995-03-30 | 1996-10-18 | Toppan Printing Co Ltd | 音声記録システム |
| JPH0962296A (ja) * | 1995-08-30 | 1997-03-07 | Olympus Optical Co Ltd | 音声記録装置および音声再生装置 |
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7039585B2 (en) | 2001-04-10 | 2006-05-02 | International Business Machines Corporation | Method and system for searching recorded speech and retrieving relevant segments |
| US7136684B2 (en) | 2002-01-07 | 2006-11-14 | Kabushiki Kaisha Toshiba | Headset with radio communication function and communication recording system using time information |
| JP2005237017A (ja) * | 2005-03-07 | 2005-09-02 | Toshiba Corp | コミュニケーション記録システム |
| US7940915B2 (en) | 2006-01-05 | 2011-05-10 | Fujitsu Limited | Apparatus and method for determining part of elicitation from spoken dialogue data |
| JP5423993B2 (ja) * | 2008-12-26 | 2014-02-19 | 日本電気株式会社 | テキスト処理装置、テキスト処理方法、及びプログラム |
| US8886519B2 (en) | 2008-12-26 | 2014-11-11 | Nec Corporation | Text processing apparatus, text processing method, and computer-readable recording medium |
| JP2011113570A (ja) * | 2009-11-27 | 2011-06-09 | Ricoh Co Ltd | 音声検索装置と音声検索方法 |
| JP2013183459A (ja) * | 2012-03-02 | 2013-09-12 | Samsung Electronics Co Ltd | 録音機能が連動されたメモ機能運用方法および装置 |
| US10007403B2 (en) | 2012-03-02 | 2018-06-26 | Samsung Electronics Co., Ltd. | System and method for operating memo function cooperating with audio recording function |
| JP2013200423A (ja) * | 2012-03-23 | 2013-10-03 | Toshiba Corp | 音声対話支援装置、方法、およびプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10320982B2 (en) | Speech recognition method of and system for determining the status of an answered telephone during the course of an outbound telephone call | |
| US7844454B2 (en) | Apparatus and method for providing voice recognition for multiple speakers | |
| US7013280B2 (en) | Disambiguation method and system for a voice activated directory assistance system | |
| US6570964B1 (en) | Technique for recognizing telephone numbers and other spoken information embedded in voice messages stored in a voice messaging system | |
| US5983187A (en) | Speech data storage organizing system using form field indicators | |
| US7624016B2 (en) | Method and apparatus for robustly locating user barge-ins in voice-activated command systems | |
| US20160171100A1 (en) | Voice Search System, Voice Search Method, and Computer-Readable Storage Medium | |
| JP5731998B2 (ja) | 対話支援装置、対話支援方法および対話支援プログラム | |
| JP2001005481A (ja) | 音声メッセージ中のキーセグメントにスポットをあてる方法。 | |
| JP3437617B2 (ja) | 時系列データ記録再生装置 | |
| JPH1125112A (ja) | 対話音声処理方法及び装置、記録媒体 | |
| CN110602334A (zh) | 一种基于人机协同的智能外呼方法及系统 | |
| JP3526101B2 (ja) | 音声認識装置 | |
| JP2016062333A (ja) | 検索サーバ、及び検索方法 | |
| JPH10233837A (ja) | 電話応答システムとその使用方法 | |
| JP2008032825A (ja) | 発言者表示システム、発言者表示方法および発言者表示プログラム | |
| KR20010014991A (ko) | 음성 메시지 분류 방법 | |
| JPH10173769A (ja) | 音声メッセージ検索装置 | |
| JP2009290468A (ja) | 通話録音装置及び方法 | |
| JP2001007929A (ja) | 音声メールメッセージの取り出し方法 | |
| JP2555009B2 (ja) | 音声フアイル装置 | |
| JP2002297179A (ja) | 自動応答対話システム | |
| CN110162605B (zh) | 检索结果提供装置及检索结果提供方法 | |
| JP2012108262A (ja) | 対話内容抽出装置、対話内容抽出方法、そのプログラム及び記録媒体 | |
| JP4353084B2 (ja) | 映像再生方法及び装置及びプログラム |