JP2011087005A - 通話音声要約生成システム、その方法及び通話音声要約生成プログラム - Google Patents
通話音声要約生成システム、その方法及び通話音声要約生成プログラム Download PDFInfo
- Publication number
- JP2011087005A JP2011087005A JP2009236486A JP2009236486A JP2011087005A JP 2011087005 A JP2011087005 A JP 2011087005A JP 2009236486 A JP2009236486 A JP 2009236486A JP 2009236486 A JP2009236486 A JP 2009236486A JP 2011087005 A JP2011087005 A JP 2011087005A
- Authority
- JP
- Japan
- Prior art keywords
- call
- sentence
- voice
- text
- summary sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 73
- 230000008569 process Effects 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 30
- 238000003860 storage Methods 0.000 claims description 22
- 238000004904 shortening Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 3
- 230000004044 response Effects 0.000 description 41
- 230000000875 corresponding effect Effects 0.000 description 18
- 238000012790 confirmation Methods 0.000 description 15
- 101100189471 Mus musculus Pbx1 gene Proteins 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000007717 exclusion Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Abstract
【課題】 大規模なハードウエア資源を要することなく、音声通話から簡明な要約文を生成し、生成された要約文の迅速な確認又は照査を実現する。
【解決手段】 通話の呼情報を参照することにより各発話の話者を識別し、識別された一方の話者のみの通話音声データを通話音声データから選択する話者選択部と、通話音声データ中から音声認識の対象とされるべき重要文を定義する重要文辞書を参照して、選択された通話音声データを音声認識して、通話音声テキストを抽出する音声認識部と、抽出された通話音声テキストに要約文テンプレートを適用し、抽出された通話音声テキスト中の冗長箇所を削除して要約文テキストに変換する要約文生成部を備える。
【選択図】 図5
【解決手段】 通話の呼情報を参照することにより各発話の話者を識別し、識別された一方の話者のみの通話音声データを通話音声データから選択する話者選択部と、通話音声データ中から音声認識の対象とされるべき重要文を定義する重要文辞書を参照して、選択された通話音声データを音声認識して、通話音声テキストを抽出する音声認識部と、抽出された通話音声テキストに要約文テンプレートを適用し、抽出された通話音声テキスト中の冗長箇所を削除して要約文テキストに変換する要約文生成部を備える。
【選択図】 図5
Description
本発明は、通話音声要約生成システム、その方法及び通話音声要約生成プログラムに関する。より詳細には、例えば顧客の電話と応対担当者の電話との間でなされた通話を録音蓄積して管理するCustomer Relationship Management(CRM)システムにおいて、対話によりなされた音声通話の要約を生成し、生成された要約を表示、更新及び出力可能とするための技術に関する。
顧客と事業者との間でなされた通話音声を事業者側において録音して管理する各種技術が提案されている。
例えば、顧客からの電話応対部署であるコールセンタにおけるオペレータの通話内容をデータ化して録音すると共に検索するための、中央集中型通話録音システムにおいては、一般に、事業者が運営するコールセンタ等の構内には、公衆電話交換回線網(Public Switched Telephone Network:PSTN)からの発信及び着信が集中する交換機(PBX)が設置され、この交換機により音声通話が、コールセンタ構内の複数の固定電話に分配される。このため、この交換機から分岐する通話録音サーバを設ければ、通話を録音蓄積することができる。オペレータ側には、電話応対用内線電話と共に、PCなどの端末装置が設けられてよく、このオペレータ端末装置には、発話者が告げた顧客名をキーとして顧客情報を検索する機能や、当該顧客の過去の通話履歴を表示する機能が備えられてよい。
ところで、音声データファイルに録音蓄積された顧客とオペレータとの間の音声通話の概要を、1回の電話応対ごとに、応対履歴として記録保持し、通話終了後にこの応対履歴を閲覧及び報告書として出力可能とすることが要請される。なぜならば、例えば、顧客に電話応対を行ったオペレータ自身やその管理者等は、顧客とオペレータとの間の通話内容を視認により迅速に確認し、必要に応じて複数の後方処理に振り分けることが必要であるし、他方、例えば、オペレータの電話応対における品質やコンプライアンスの管理者は、法規上或いはコンプライアンス上禁止される語句又は文章をオペレータが顧客に対して発話していないかの照査を迅速に行うことがまた必要であるからである。また、この応対履歴は、確認、照査を迅速に行うため、一覧性に優れ、かつ記憶容量も小さいテキストファイルで記録保持されることが要請される。
従来においては、コールセンタのオペレータは、通話終了後に、電話応対を中断して、終了した通話の要約を応対履歴として手動でデータファイルに入力しなければならず、作業効率が低かった。
ところで、一般に要約文生成のソースは、文書テキスト、音声等多様であるが、音声データからの要約文生成技術において、音声データファイル中の音声を音声認識処理により文字コード化し、文字コード化された音声テキストデータから要約文を生成する技術が公知である。
例えば、特許文献1は、ビデオテープレコーダ(VTR)により記録媒体に録音された音声を音声認識して文字コード列に変換し、この音声認識された文字コード列中の文の構成要素の重要度、典型的には名詞・動詞・助詞・形容詞等の品詞別、主格・目的格・述部等の句別に付与された重要度、を予め登録された重要度テーブルを参照することにより判定し、重要度が高いと判定された文中構成要素を組み合わせることで要約文を自動生成する技術を開示する。
しかしながら、特許文献1に開示された技術をコールセンタにおける電話応対業務に適用することは困難である。なぜなら、顧客とオペレータ間の音声通話は、通常、顧客情報の取得・確認、問い合わせ内容の取得・確認、問い合わせへの回答内容の取得・確認、顧客の理解度及び免責内容の提示・確認等、多くの段階を経るため不可避的に冗長であり、また、同じ発話内容が繰り返され、結果対話が長時間に亘ることも多い。このため、顧客とオペレータとの間でなされた音声通話の全音声データをそのまま入力として音声認識した上で要約文を生成したのでは、音声認識処理及び要約文生成処理の負荷が高く、処理終了までに長時間を要するばかりか、CPUやメモリ等の多くのハードウエア資源を必要とするためハードウエア設備を不可避的に高額化させる。
またそもそも、コールセンタ業務においては、多数のオペレータの各人について終日通話音声が録音蓄積されていくため、これら蓄積された膨大な通話録音データの全てを通話音声テキストデータに変換し、この通話音声テキストデータを要約して要約文を生成することは、事実上困難である。
より深刻なことに、上記のとおり顧客とオペレータとの間の音声通話は、例えば問い合わせ文書や原稿を読み上げることによる発話等、容易に洗練され得る要約文作成源と異なり、冗長であり、繰り返し部分が多く、かつ対話が長時間に亘るという特性を有するため、この音声通話をそのまま音声認識して得られる音声通話テキストに公知の要約文作成技術を適用しても、生成される要約文もまた不可避的に冗長かつ長文となってしまう不都合があり、利便性が乏しかった。
本発明は、上記課題に鑑みてされたものであり、その目的は、通話、典型的には顧客の電話と応対担当者の電話との間でなされた通話を録音蓄積し管理するCRMシステムに好適な、大規模なハードウエア資源を要することなく、音声通話から簡明な要約文を生成し、生成された要約文を迅速に確認又は照査可能な通話音声要約生成システム、その方法及び通話音声要約生成プログラムを提供する点にある。
本発明の他の目的は、音声認識辞書へのわずかなメンテナンス作業で、高速に、通話音声からの要約文の自動生成を可能とする点にある。
本発明の他の目的は、要約を作成すべき音声通話が大容量かつ長時間に亘る場合であっても、迅速な確認又は照査に耐え得る程度に短縮された要約文を得る点にある。
本願発明者らは、コールセンタ業務における顧客とオペレータとの間の音声通話から応対履歴としての要約を得るに際し、一方の発話者、典型的にはオペレータの発話のみから応対履歴を要約するに足る情報が効率的に得られるとの知見を得た。
また、顧客とオペレータ間の音声通話は、通常、顧客情報の取得・確認、問い合わせ内容の取得・確認、問い合わせへの回答内容の取得・確認、顧客の理解度及び免責内容の提示・確認等、多くの段階を経るものの、要約文生成源としては、一方の発話者の発話文集合のうちの一部の発話文で必要な情報が十分に得られるとの知見を得た。
かかる知見に基づき、本願発明においては、通話音声全体を音声認識することに替えて、音声認識対象を予め絞り込む。具体的には、顧客の発話を捨象して音声認識対象とせず、オペレータの発話のみを音声認識の対象として選択する。従って、このオペレータ発話の通話音声のみが要約文作成源とされる。
好適には、オペレータの発話に係る通話音声データを音声認識するために参照される音声認識辞書には、業務ごと想定される重要文のみを辞書登録し、この重要文に対応する通話音声データのみが、音声認識結果として要約文生成源とされるよう構成されてよい。
さらに本願発明においては、音声認識により得られた通話音声テキストの冗長性を排除する。
好適には、この応対履歴の要約文は、より簡明な要約とするため、通常の話し言葉から、例えば体言止め等を用いた報告書調の文章へ変換されてよい。
また、本願発明においては、音声認識を経た音声通話テキストを解析し、時系列上後方でなされた発話を優先して要約文作成を行ってよく、例えば、同一内容の発話が繰り返し出現する場合には、前方の発話を文書ごと削除してもよい。
本発明のある特徴によれば、通話の呼情報を参照することにより、前記通話内の各発話の話者を識別し、識別された一方の話者のみの通話音声データを、通話音声データから選択する話者選択部と、選択された通話音声データ中から音声認識の対象とされるべき重要文を定義する重要文辞書と、前記重要文辞書を参照することにより、前記選択された通話音声データを音声認識して、前記重要文辞書に定義された重要文に相当する通話音声テキストを抽出する音声認識部と、前記重要文と対応する要約文のテンプレートを記憶するテンプレート記憶部と、抽出された通話音声テキストに前記要約文テンプレートを適用し、抽出された通話音声テキスト中の冗長箇所を削除して要約文テキストに変換する要約文生成部と、変換された要約文テキストを1通話ごと要約文データベースに格納する要約文格納部とを具備することを特徴とする通話音声要約生成サーバ装置が提供される。
上記通話音声要約生成サーバ装置は、前記要約文テキストに含まれるべき重要語を定義する重要語テーブルと、前記通話音声テキストから前記重要語を検出し、検出された重要語に従って前記通話の結果を示す通話種別を決定する通話種別決定部と、前記要約文テキストを決定された通話種別と共に視認可能に出力する出力部とを具備してよい。
上記通話音声要約生成サーバ装置は、前記要約文テキストに含まれるべき重要語を、該重要語の重要度と共に定義する第2の重要語テーブルと、生成されるべき要約文の最大長の閾値を保持し、前記要約文生成部から得られる要約文のテキスト長が前記閾値を越える場合に、前記第2の重要語テーブルを参照して、前記要約文を複数に区切って得られる要約文セグメントごとに前記重要度を加算し、加算された前記重要度が低い要約文セグメントを削除することにより、前記要約文を前記閾値内のテキスト長に短縮して、短縮要約文を得る要約文短縮部とを具備してよい。
前記要約文生成部は、1の通話ごとに、1の要約文を生成してよい。
上記通話音声要約生成サーバ装置は、前記要約文を更新入力可能に表示出力し、更新入力された要約文を、前記要約文データベースに書き戻すと共に、更新された要約文を参照して、前記重要文辞書を必要に応じて更新する要約文更新部を具備してよい。
本発明の他の特徴によれば、話者選択部と、重要文辞書と、音声認識部と、テンプレート記憶部と、要約文生成部と、要約文格納部とを具備する通話音声要約生成サーバ装置が実行する通話音声要約生成方法であって、前記話者選択部により、通話の呼情報を参照することにより、前記通話内の各発話の話者を識別し、識別された一方の話者のみの通話音声データを、通話音声データから選択するステップと、前記音声認識部により、選択された通話音声データ中から音声認識の対象とされるべき重要文を定義する重要文辞書を参照することにより、前記選択された通話音声データを音声認識して、前記重要文辞書に定義された重要文に相当する通話音声テキストを抽出するステップと、テンプレート記憶部により、前記重要文と対応する要約文のテンプレートを記憶するステップと、前記要約文生成部により、抽出された通話音声テキストに前記要約文テンプレートを適用し、抽出された通話音声テキスト中の冗長箇所を削除して要約文テキストに変換するステップと、前記要約文格納部により、変換された要約文テキストを1通話ごと要約文データベースに格納するステップとを含むことを特徴とする通話音声要約生成方法が提供される。
本発明の他の特徴によれば、通話音声要約生成処理をコンピュータに実行させるための通話音声要約生成プログラムであって、該プログラムは、前記コンピュータに、通話の呼情報を参照することにより、前記通話内の各発話の話者を識別し、識別された一方の話者のみの通話音声データを、通話音声データから選択する話者選択処理と、選択された通話音声データ中から音声認識の対象とされるべき重要文を定義する重要文辞書を参照することにより、前記選択された通話音声データを音声認識して、前記重要文辞書に定義された重要文に相当する通話音声テキストを抽出する音声認識処理と、前記重要文と対応する要約文のテンプレートを記憶するテンプレート記憶処理と、抽出された通話音声テキストに前記要約文テンプレートを適用し、抽出された通話音声テキスト中の冗長箇所を削除して要約文テキストに変換する要約文生成処理と、変換された要約文テキストを1通話ごと要約文データベースに格納する要約文格納処理とを含む処理を実行させるためのものであることを特徴とする通話音声要約生成プログラムが提供される。
本発明によれば、音声認識サーバは、顧客の発話を捨象して音声認識対象とせず、オペレータの発話に係る通話音声データのみを音声認識して通話音声テキストを得、通話要約生成サーバは、この通話音声テキストを要約文作成源として通話の要約を自動生成する。
また、音声認識サーバは、予め通話中に出現することが想定され、かつ要約文に含まれるべき重要情報を含む重要文が辞書登録される重要文辞書を参照して、音声通話から重要文に相当する通話音声テキストを得、通話要約生成サーバは、この得られた通話音声テキストを要約文作成源として通話の要約を自動生成する。
さらに、通話要約生成サーバは、通話音声テキスト内の冗長性を排除して通話の要約を自動生成する。
これにより、通話、典型的には顧客の電話と応対担当者の電話との間でなされた通話を録音蓄積し管理するCRMシステムに好適な、大規模なハードウエア資源を要することなく、音声通話から簡明な要約文を生成し、生成された要約文を迅速に確認又は照査可能な通話音声の要約文生成が実現される。
また、音声認識辞書へのわずかなメンテナンス作業で、高速に、通話音声からの要約文の自動生成が可能となる。
さらに、要約を作成すべき音声通話が大容量かつ長時間に亘る場合であっても、迅速な確認又は照査に耐え得る程度に短縮された要約文を得ることが可能となる。
従って、本発明に係る通話音声要約生成システム、その方法及び通話音声要約生成プログラムによれば、追加的設備をほとんど要することなく、通話履歴、典型的には顧客とオペレータとの間の通話応対履歴の可用性が向上し、応対の品質管理及び監査をわずかな労力で正確に実現することができ、事業者のCRM向上に資する。
以下、添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能及び構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
<本実施形態のネットワーク構成>
図1は、本発明の実施形態に係る通話音声要約生成システムのネットワーク構成の非限定的一例を示す。通話音声要約生成システムは、PBX(交換機)1、音声取得サーバ2、通話録音サーバ3、制御サーバ4、音声認識サーバ5、通話要約生成サーバ6、顧客電話端末7、PSTN(公衆電話網)8、オペレータ電話端末9a、通話要約照会PC端末9bを具備する。通話音声要約生成システム中、PBX(交換機)1、音声取得サーバ2、通話録音サーバ3、制御サーバ4、音声認識サーバ5、通話要約生成サーバ6、オペレータ電話端末9a、通話要約照会PC端末9bの全部或いは一部は、コールセンタ内に設置され、LAN/WAN等のイントラネット11d等のIP(Internet Protocol)網により相互接続されてよい。或いは代替的に、音声取得サーバ2、通話録音サーバ3、制御サーバ4、音声認識サーバ5、通話要約生成サーバ6、及びこれらサーバが備える通話音声ファイル31、呼情報データベース32、顧客情報データベース33、重要文辞書51、通話音声テキストファイル52、重要語テーブル61、不要語テーブル62、要約文テンプレート63、要約文データベース64の全部或いは一部は、インターネット等の遠隔IP接続を介して適宜コールセンタ外部に設置されてもよい。特に、コールセンタのオペレータ以外の管理者等が通話要約照会PC端末9bを操作して要約文データベース64内の応対履歴である通話音声要約の照会及び更新処理を行う場合には、通話要約照会PC端末9bは、オペレータ電話端末9aの近傍に設置される必要はなく、遠隔IP接続を介して適宜コールセンタ外部に設置されることが好適である。
図1は、本発明の実施形態に係る通話音声要約生成システムのネットワーク構成の非限定的一例を示す。通話音声要約生成システムは、PBX(交換機)1、音声取得サーバ2、通話録音サーバ3、制御サーバ4、音声認識サーバ5、通話要約生成サーバ6、顧客電話端末7、PSTN(公衆電話網)8、オペレータ電話端末9a、通話要約照会PC端末9bを具備する。通話音声要約生成システム中、PBX(交換機)1、音声取得サーバ2、通話録音サーバ3、制御サーバ4、音声認識サーバ5、通話要約生成サーバ6、オペレータ電話端末9a、通話要約照会PC端末9bの全部或いは一部は、コールセンタ内に設置され、LAN/WAN等のイントラネット11d等のIP(Internet Protocol)網により相互接続されてよい。或いは代替的に、音声取得サーバ2、通話録音サーバ3、制御サーバ4、音声認識サーバ5、通話要約生成サーバ6、及びこれらサーバが備える通話音声ファイル31、呼情報データベース32、顧客情報データベース33、重要文辞書51、通話音声テキストファイル52、重要語テーブル61、不要語テーブル62、要約文テンプレート63、要約文データベース64の全部或いは一部は、インターネット等の遠隔IP接続を介して適宜コールセンタ外部に設置されてもよい。特に、コールセンタのオペレータ以外の管理者等が通話要約照会PC端末9bを操作して要約文データベース64内の応対履歴である通話音声要約の照会及び更新処理を行う場合には、通話要約照会PC端末9bは、オペレータ電話端末9aの近傍に設置される必要はなく、遠隔IP接続を介して適宜コールセンタ外部に設置されることが好適である。
PBX1は、コールセンタ内の内線電話を収容し、これら内線電話同士を接続すると共に、各オペレータ電話端末9aを、構内回線11a、11b、11c・・・を介してPSTN(公衆電話網)8に回線交換接続して、各オペレータ電話端末9aと顧客電話端末7との通話を実現する。
音声取得サーバ2は、PBX1に分岐接続され、各オペレータ電話端末9aと顧客電話端末7との通話音声を取得すると共に、取得された音声をオペレータ電話端末9aの番号(例えば内線番号)と対応付けて各サーバに供給する。代替的に、この音声取得サーバ2は、PSTN8の終端装置(DSU)とPBX1との間の回線に分岐接続されてもよい。
通話録音サーバ3は、制御サーバ4の制御の下、着呼後に音声取得サーバ2から供給される取得音声を、必要に応じて圧縮し、取得された音声データを、例えばNAS(Network Appliance Storage)等の大規模外部記憶装置により構成されるデータベースに蓄積保存する。
好適には、通話録音サーバ3は、音声取得サーバ2からアナログ音声が供給された場合、このアナログ音声波形を電圧で表したものを所定のビット深度と所定のサンプリング周波数でサンプリングすることによりデジタル音声に変換し、通話音声ファイル31に蓄積保存する。
このデジタル音声データは、圧縮後に通話音声ファイル31に蓄積保存されてよい。録音音声の圧縮には、種々の公知の手法を種々の圧縮率で用いることができ、非限定的一例として、モノラル5分の1圧縮、モノラル10分の1圧縮、或いはステレオ無圧縮などにより録音音声が圧縮される。代替的に、通話録音サーバ3は、音声取得サーバ2から供給される音声データを変換圧縮することなく、通話音声ファイルに蓄積保存してもよい。
通話録音サーバ3はまた、通話音声ファイル31内に蓄積保存された通話音声ファイルに関連付けて、呼情報ファイル32に通話の制御情報として取得される呼情報を書き出す。この呼情報は、PBX1への着呼時にPBX1により取得される。取得される呼情報とは、例えば、着信開始情報(着信開始タイムスタンプを含む)、発信開始情報(発信開始タイムスタンプを含む)、通話開始情報(通話開始タイムスタンプを含む)、通話終了情報(通話終了タイムスタンプを含む)等の呼制御情報と、発信元電話番号、発信先電話番号、発信元チャネル番号、発信者番号、着信チャネル番号、着信電話番号(着信先内線番号等)等の呼識別情報とを含む。
この呼情報はさらに、録音された通話内の発話が、インバウンド、すなわち顧客側からの発話であるか、アウトバウンド、すなわちオペレータ側からの発話であるかの極性を識別する話者識別情報を含む。この話者識別情報は、PBX1により取得可能であり、例えばISDNの場合には、回線終端装置(Digital Service Unit:DSU)の物理的なピン位置として把握可能である。また、SIP(Session Initiation Protocol)プロトコルの場合には、呼生成の際のセッション構成時に把握可能であり、具体的には、例えば、セッション構成時に、発呼側から着呼側送信されるInviteコマンド中で、セッション開始に必要な情報を記述するSDP(Session Description Protocol)内に発呼側が受信に使用するIPアドレスとポート番号を指定し、一方これに応答して着呼側から発呼側へ送信される200 OKメッセージ中のSDP内に着呼側が受信に使用するIPアドレスとポート番号を指定し、このそれぞれ指定されたIPアドレスとポート番号を使用してRTP(Realtime Transport Protocol)プロトコル上音声データが送受信される。このため、これら発呼側及び着呼側がそれぞれ受信に使用するIPアドレスとポート番号を取得することにより、1通話内の発話それぞれの話者識別情報を得ることができ、1通話内の顧客の発話とオペレータの発話とを必要に応じて区別或いは分離することができる。
これら呼情報は、好適には、CTI(Computer Telephony Integration)プロトコルを実装した制御サーバ4上ないしオペレータPC端末装置上で稼動するCTIプログラムと連動して、これらの表示装置上に呼情報をリアルタイムに表示してよい。
通話録音サーバ3はまた、すでに応対履歴のある顧客を中心とする顧客の情報が事前登録された顧客情報データベース33を備える。この顧客情報は、顧客を識別する個人情報であって、例えば顧客氏名、住所、登録された顧客電話番号、生年月日、年齢層、性別、その他顧客属性、製品購入履歴、応対履歴等を含むものとし、オペレータが操作可能な端末装置に、オペレータの指示入力に応じて適宜表示出力され得る。
なお、通話録音サーバ3は、構内回線11dに接続するのに換えて、代替的に、例えばPSTN8とPBX1との間に接続されてよく、このように構成すれば、通話録音サーバ3は、上記の話者識別情報を直接取得することができる。さらに代替的に、音声取得サーバ2を別途設置することなく、通話録音サーバ3は構内回線に接続され、構内回線に供給される通話音声を直接取得してよい。
制御サーバ4は、音声取得サーバ2、通話録音サーバ3、音声認識サーバ5及び通話要約生成サーバ6から供給されるデータ及び制御情報に基づいて、これらサーバが実行する処理、これらサーバ間のデータトラフィック及び制御情報の送受信を制御する。代替的に、音声認識サーバ5及び通話要約生成サーバ6は、通話録音サーバ3が保有する通話音声ファイル31や呼情報ファイル32へのアクセスや通話要約照会PC端末9bへのインターフェースを、制御サーバ4を介することなく、直接提供してもよい。
音声認識サーバ5は、重要文辞書51と、通話音声テキストファイル52とを備える。
音声認識サーバ5は、通話音声ファイル31に蓄積保存された通話音声データを1通話分ごと読み出して解析して特徴量を抽出し、重要文辞書51を参照して、公知の音声認識技術を適用して通話音声データを文字コード列に変換し、さらに変換された文字コード列を通話音声テキストとして通話音声テキストファイル52に出力する。一例として、通話音声データ中の必要に応じて変換処理された音声波形から抽出される特徴量を、予め定義されている音素ごとの参照音響パターンと比較処理することにより、音声波形データを文字コード列に変換することができる。代替的に、音声認識サーバ5は、通話音声ファイル31を読み出すことなく、音声取得サーバ2から、直接通話音声データを取得してよい。
重要文辞書51には、予め音声認識の対象と想定され、かつ要約文に含まれるべき重要情報を含む重要文のデータのみが定義されているため、重要文辞書51に定義された重要文に相当する通話音声データの音素列のみが抽出されて意味付けされる。従って、読み出された通話音声データのうち、この定義された重要文に相当する通話音声データ箇所のみが通話音声テキストに変換され、音声認識結果として出力される。
音声認識サーバ5は、呼情報データベース32を参照して、1通話内の話者識別情報を判別することにより、1通話内の発話のそれぞれの発話者が顧客であるかオペレータであるかを識別し、オペレータの発話であると識別された発話の通話音声データのみを音声認識して、通話音声テキストに変換する。このように構成すれば、高負荷な音声認識を行う音声認識サーバ5内におけるハードウエア資源が低減でき、音声認識処理が短時間で終了できると共に通話音声テキストファイル51の容量も削減でき、さらに、通話要約生成サーバ6における要約文生成処理も高速化できると共に高精度の要約文生成が可能となる。
通話要約生成サーバ6は、通話音声テキストファイル51に格納された1通話分ごとの通話音声テキスト、好適には1通話内のオペレータ発話の通話音声テキストを読み出し、以下に詳述される要約文生成処理を実行することにより生成された通話要約文を、要約文データベース64に出力する。
この1通話ごとに生成される要約文は、適宜、照会入力に応答して、通話要約照会PC端末9b等のディスプレイ装置やプリンタ装置等の出力装置に出力可能であり、好適には、呼情報からデコードされた通話開始時間、通話終了時間、通話の発信者識別情報(顧客から着信した通話か、オペレータから発信した通話かを識別する情報)等と関連付けて出力されてよい。好適には、通話要約照会PC端末9b等に表示出力される要約文は、操作者の修正入力により、適宜更新され得る。この更新結果を学習し、重要文辞書51、重要語テーブル61、不要語テーブル62、及び要約文テンプレート63を適宜更新することにより、より高精度かつ簡明な要約文を生成することが可能となる。
通話要約生成サーバ6は、重要語テーブル61と、不要語テーブル62と、要約文テンプレート63と、要約文データベース64とを備える。重要語テーブル61は、予め、要約文内にキーワードとして記述されるべき重要語を、好適にはその重要度と共に定義する。さらに好適には、この重要語テーブルは、コールセンタ業務が受託する業種ごと、かつ事業者ごとに定義されてよい。
不要語テーブル62は、通話音声テキストから削除されるべき語を定義する。好適には、通話要約生成サーバ6は、通話音声テキスト中の語を報告書調の他の語に置き換える置換テーブルを参照して要約文を生成してよい。
要約文テンプレート63は、要約文テンプレートを、好適には応対種別ごとに定義する。この要約文テンプレートは、話し言葉である通話音声テキストを、簡明に理解可能な報告書調の文章に変換し、かつ一覧的に視認可能な程度のテキスト長の要約文を得るために参照される。通話要約生成サーバ6は、この要約文テンプレート63を参照し、1又は複数の通話音声テキスト文を、応対種別ごとに定義された所定の要約文テンプレートに置き換えた上で、通話音声テキスト中に出現するキーワード、例えば商品名、日時、価格等をこの要約文テンプレート中に挿入して、要約文データベース64に格納すべき要約文を生成する。
なお、図1におけるPBX1は、PSTN1等の公衆電話交換回線網を介して顧客通話端末4に接続されているが、これに替えて、或いはこれに加えて、IP網接続機能を備えることにより、VoIP(Voice Over Internet Protocol)ネットワーク等の音声パケット通信ネットワークを介して、IP電話機能を備える顧客IP通話端末に接続されてよく、この場合、音声取得サーバ2は、顧客IP通話端末及びオペレータ電話端末9a間の音声通話を取得することができる。顧客電話端末7は、固定電話機或いは携帯電話機のいずれであってもよい。
また、図1に示すネットワーク及びハードウエアの構成は一例に過ぎず、各サーバ及びデータベースを必要に応じて一体としてもよく、各コンポーネントをASP(Application Service Provider)等の外部に設置してもよい。
<本実施形態における電話応対シーケンスの一例>
図2は、必要に応じて制御サーバ4による制御の下実行される、本実施形態に係る通話音声要約生成システムにおける、顧客電話端末7からコールセンタ内オペレータ電話端末9aへの着呼から呼切断までの1通話内の電話応対シーケンスと、通話音声認識処理及び通話音声要約処理の処理タイミングとを、非限定的一例として示す。
図2は、必要に応じて制御サーバ4による制御の下実行される、本実施形態に係る通話音声要約生成システムにおける、顧客電話端末7からコールセンタ内オペレータ電話端末9aへの着呼から呼切断までの1通話内の電話応対シーケンスと、通話音声認識処理及び通話音声要約処理の処理タイミングとを、非限定的一例として示す。
図2において、まず顧客電話端末7からオペレータ電話端末9aに着呼し、顧客電話端末7から、顧客の発話により、一例として問い合わせを内容とする通話メッセージがオペレータ電話端末9aに送信される(ステップS1)。なお言うまでもなく、送信される通話メッセージはあらゆる内容であってよく、他の例として相談を内容としてもよい。オペレータ電話端末9aから、オペレータの発話により、問い合わせ元の顧客を識別する情報、例えば氏名、住所、連絡先電話番号、生年月日等を確認する旨の通話メッセージが顧客電話端末7に送信される。
音声認識サーバ5は、当該通話の呼情報中の話者識別情報を参照することにより、このオペレータの発話による顧客を識別する情報を確認する通話メッセージを取得し(ステップS2)、この取得した通話メッセージに音声認識処理を適用することにより、音声通話テキストに変換する(ステップS3)。ステップS3における音声認識処理、及び後述されるステップS6、ステップS8、ステップS12におけるそれぞれの音声認識処理は、オペレータ電話端末9aから顧客電話端末7への通話メッセージの送信に続いて実行されてもよく、代替的に、通話音声が蓄積保存された通話音声ファイル31から非同期的に対象となる通話のオペレータ発話音声を読み出した後に実行されてもよい。
ステップS4に戻り、顧客電話端末7から顧客の発話により問い合わせ内容を含む通話メッセージがオペレータ電話端末9aに送信される(ステップS4)。
オペレータ電話端末9aから、オペレータの発話により、顧客からの問い合わせ内容を確認する通話メッセージが顧客電話端末7に送信される。音声認識サーバ5は、当該通話の呼情報中の話者識別情報を参照することにより、このオペレータの発話による問い合わせ内容を確認する通話メッセージを取得し(ステップS5)、この取得した通話メッセージに音声認識処理を適用することにより、音声通話テキストに変換する(ステップS6)。
これに続き、オペレータ電話端末9aから、オペレータの発話により、顧客からの問い合わせ内容に応答する情報を提供する通話メッセージが顧客電話端末7に送信される。音声認識サーバ5は、当該通話の呼情報中の話者識別情報を参照することにより、このオペレータの発話による問い合わせ内容に応答する情報を提供する通話メッセージを取得し(ステップS7)、この取得した通話メッセージに音声認識処理を適用することにより、音声通話テキストに変換する(ステップS8)。
この問い合わせ内容に応答する情報を提供した後、オペレータ電話端末9aから、オペレータの発話により、顧客が提供した情報を理解したか、さらにどの程度理解したかを確認する旨の通話メッセージが顧客電話端末7に送信される。音声認識サーバ5は、当該通話の呼情報中の話者識別情報を参照することにより、このオペレータの発話による顧客が提供した情報を理解したか、さらにどの程度理解したかを確認する旨の通話メッセージを取得し(ステップS9)、この取得した通話メッセージに音声認識処理を適用することにより、音声通話テキストに変換する(ステップS10)。
これに応答して、顧客電話端末7から顧客の発話により理解度確認に応答する通話メッセージがオペレータ電話端末9aに送信される(ステップS11)。
これに続き、オペレータ電話端末9aから、オペレータの発話により、顧客からの理解度確認を復唱する通話メッセージが顧客電話端末7に送信される。音声認識サーバ5は、当該通話の呼情報中の話者識別情報を参照することにより、このオペレータの発話による理解度確認を復唱する通話メッセージを取得し(ステップS12)、この取得した通話メッセージに音声認識処理を適用することにより、音声通話テキストに変換する(ステップS13)。
呼切断により、音声認識サーバ5は、1通話分の音声認識された通話音声テキストを、通話要約生成サーバ6に送信する(ステップS14)。代替的に、音声認識サーバ5は、通話要約生成サーバ6に呼切断の事象を通知するメッセージを送信し、該メッセージを受信した通話要約生成サーバ6が、通話音声テキストファイル51から直接呼切断された通話に対応する音声通話テキストを読み出してもよい。
通話要約生成サーバ6は、音声認識サーバ5から供給される通話音声テキストを入力とし、通話音声要約処理を実行して、要約文を生成する(ステップS15)。生成された要約文は、その記述内容に応じて、オペレータないし管理者にフィードバックされ、例えば資料送付、社内エスカレーション等の次工程決定のため参照される(ステップS16)。
図3は、図2とは着呼方向を逆とし、必要に応じて制御サーバ4による制御の下実行される、本実施形態に係る通話音声要約生成システムにおける、コールセンタ内オペレータ電話端末9aから顧客電話端末7への着呼から呼切断までの1通話内の電話応対シーケンスと、通話音声認識処理及び通話音声要約処理の処理タイミングとを、非限定的一例として示す。
図3において、まずオペレータ電話端末9aから顧客電話に着呼し、オペレータ電話端末9aから、オペレータの発話により、通話メッセージが顧客電話端末7に送信される(ステップS21)。なお言うまでもなく、送信される通話メッセージはあらゆる内容であってよく、例えば商品又はサービスの販売促進や督促等を内容としてもよい。オペレータ電話端末9aから、オペレータの発話により、問い合わせ元の顧客を識別する情報、例えば氏名、住所、連絡先電話番号、生年月日等を確認する旨の通話メッセージが顧客電話端末7に送信される。音声認識サーバ5は、当該通話の呼情報中の話者識別情報を参照することにより、このオペレータの発話による顧客を識別する情報を確認する通話メッセージを取得し(ステップS22)、この取得した通話メッセージに音声認識処理を適用することにより、音声通話テキストに変換する(ステップS23)。ステップS23における音声認識処理、及び後述されるステップS25、ステップS29におけるそれぞれの音声認識処理は、オペレータ電話端末9aから顧客電話端末7への通話メッセージの送信に続いて実行されてもよく、代替的に、通話音声が蓄積保存された通話音声ファイル31から非同期的に対象となる通話のオペレータ発話音声を読み出した後に実行されてもよい。
ステップS24に戻り、オペレータ電話端末9aからオペレータの発話により、例えば商品照会や督促等の情報を提供する通話メッセージが顧客電話端末7に送信される。音声認識サーバ5は、当該通話の呼情報中の話者識別情報を参照することにより、このオペレータの発話による情報を提供する通話メッセージを取得し(ステップS24)、この取得した通話メッセージに音声認識処理を適用することにより、音声通話テキストに変換する(ステップS25)。
この情報を提供した後、オペレータ電話端末9aから、オペレータの発話により、顧客が提供した情報を理解したか、さらにどの程度理解したかを確認する旨の通話メッセージが顧客電話端末7に送信される。音声認識サーバ5は、当該通話の呼情報中の話者識別情報を参照することにより、このオペレータの発話による顧客が提供した情報を理解したか、さらにどの程度理解したかを確認する旨の通話メッセージを取得し(ステップS26)、この取得した通話メッセージに音声認識処理を適用することにより、音声通話テキストに変換する(ステップS27)。
これに応答して、顧客電話端末7から顧客の発話により理解度確認に応答する通話メッセージがオペレータ電話端末9aに送信される(ステップS28)。
これに続き、オペレータ電話端末9aから、オペレータの発話により、顧客からの理解度確認を復唱する通話メッセージが顧客電話端末7に送信される。音声認識サーバ5は、当該通話の呼情報中の話者識別情報を参照することにより、このオペレータの発話による理解度確認を復唱する通話メッセージを取得し(ステップS29)、この取得した通話メッセージに音声認識処理を適用することにより、音声通話テキストに変換する(ステップS30)。
呼切断により、音声認識サーバ5は、1通話分の音声認識された通話音声テキストを、通話要約生成サーバ6に送信する(ステップS31)。代替的に、音声認識サーバ5は、通話要約生成サーバ6に呼切断の事象を通知するメッセージを送信し、該メッセージを受信した通話要約生成サーバ6が、通話音声テキストファイル51から直接呼切断された通話に対応する音声通話テキストを読み出してもよい。
通話要約生成サーバ6は、音声認識サーバ5から供給される通話音声テキストを入力とし、音声要約処理を実行して、要約文を生成する(ステップS32)。生成された要約文は、その記述内容に応じて、オペレータないし管理者にフィードバックされ、例えば資料送付、社内エスカレーション等の次工程決定のため参照される(ステップS33)。
<本実施形態に係る通話音声認識処理及び通話音声要約生成処理詳細>
図4は、図1に示される音声認識サーバ5及び通話要約生成サーバ6内の各コンポーネントにより実行される、本実施形態に係る通話音声認識処理及び通話音声要約生成処理の詳細を非限定的一例として示す。
図4は、図1に示される音声認識サーバ5及び通話要約生成サーバ6内の各コンポーネントにより実行される、本実施形態に係る通話音声認識処理及び通話音声要約生成処理の詳細を非限定的一例として示す。
図5は、図1に示される本実施形態に係る通話要約生成サーバ6内の機能構成の非限定的一例を示す。
図5において、通話要約生成サーバ6は、応対種別決定部61と、冗長性排除部62と、要約文生成部63と、要約文短縮部64と、要約文格納部65とを備える。冗長性排除部62は、さらに、不要語削除部621と、冗長文削除部622とを備え、要約文生成部63は、さらに、文体変換部631を備える。
図4及び図5を参照して、音声認識サーバ5は、通話音声ファイル31から顧客とオペレータとの間の1通話分の通話音声ファイルを読み出し、呼情報データベース32を参照して、呼情報中の話者識別情報を判定し、読み出された通話音声ファイル中の発話のそれぞれについて、発話者を識別する(ステップS41)。音声認識サーバ5は、さらに、識別された発話者がオペレータである発話の通話音声部分のみを、音声認識対象の通話音声データとして選択する(ステップS42)。
選択された、発話者がオペレータである通話音声データが音声認識サーバ5に備えられた音声認識エンジンに入力され、音声認識サーバ5は、重要文辞書51を参照して、入力された通話音声データを音声認識処理及び形態素解析処理し、認識結果として得られた通話音声テキストを、通話音声テキストファイル52に出力する(ステップS43)。
重要文辞書51は、オペレータの発話に係る通話音声データを音声認識するために参照されるが、この重要文辞書51には、業務ごと、重要文、すなわち通話中に出現することが想定され、かつ要約文に含まれるべき文章のみが辞書登録される。従って、ステップS42から出力される通話音声データのうち、この重要文に相当する通話音声データのみが、音声認識結果として要約文生成源とされる。このため、音声認識辞書に汎用的な語を多数登録することが不要となり、音声認識辞書のメンテナンスが容易化されると共に、音声認識辞書ファイルの容量も削減される。
音声認識サーバ5は、オペレータ発話のうち、重要文辞書51に登録された重要文のみを音声認識して通話音声テキストに変換してもよく、代替的に、重要文辞書51に登録された重要文(ないし重要句、重要語)を含むオペレータの1発話内容全体を音声認識してもよく、後者の場合には、音声認識サーバ5は、重要文辞書51の他、さらに一般的な音声認識用辞書を備えてよい。
非限定的一例として、重要文辞書51は、例えばコールセンタ対象業務が受発注業務であれば、商品の受発注に関する重要文として、「『○○』を『△△』ですね。」(『○○』には商品名称、『△△』には商品購入個数がそれぞれ挿入される。)、「「ご希望の商品ですが、『××』にお届け致します。」(『××』には年月日が挿入される。)商品の問い合わせに関する重要文として、「お問い合わせのご用件は、『○○』製品に付属のリモコンの操作方法についてですね。」等が定義されてよい。その他、コールセンタ対象業務に応じて、重要文辞書51は、販促業務であれば、この他訪問日時調整に関する重要文を、督促業務であれば、滞納状況確認文、支払い督促文等を、受発注業務であれば、受注文、発注文等を、相談業務であれば、問い合わせ文、クレーム文、意見感想文等を、それぞれ定義してよい。
図7a、図7b、図7cは、それぞれ、販促業務についての重要文、督促業務についての重要文、相談業務(製造業、流通業における)についての重要文の非限定的一例を示す。
図7aを参照して、販促業務についての重要文として、重要文辞書51には、「お忙しい所、恐れ入りますが、『商品』のご案内を2・3分程、お時間をいただけますか。」、「それでは、『商品』をご説明させていただきます。」、「それでは、『日時』にお伺いさせていただきます。」、「畏まりました。『商品』について、ご興味がないと言う事ですね。」等が定義される(なお、本明細書において、『』内には包括的名称が記述され、要約文生成の際には、通話音声から得られた具体的名称ないし記載が埋め込まれる。)
図7bを参照して、督促業務についての重要文として、重要文辞書51には、「今月分のご返済ですが、未だにご入金の確認ができておりません。」、「至急、お支払いいただきますよう、お願い申し上げます。」、「『月日』までにご入金いただけない場合は、やむを得ず法的手段をとるほか、遅延損害金、延滞損害金、延滞利息、請求手数料を加算させていただくこともございますので、ご了承下さい。」等が定義される。
図7bを参照して、督促業務についての重要文として、重要文辞書51には、「今月分のご返済ですが、未だにご入金の確認ができておりません。」、「至急、お支払いいただきますよう、お願い申し上げます。」、「『月日』までにご入金いただけない場合は、やむを得ず法的手段をとるほか、遅延損害金、延滞損害金、延滞利息、請求手数料を加算させていただくこともございますので、ご了承下さい。」等が定義される。
図7cを参照して、相談業務についての重要文として、重要文辞書51には、「ご迷惑おかけして申し訳ありません。」、「『商品』をお使いになって、異臭がしたとの事ですね。」、「早急に調査しまして、担当より折り返しお電話させていただきます。」、「ご自宅にお伺いさせていただきたいのですが、よろしいでしょうか。」、「それでは、『月日』にご自宅にお伺いさせていただきます。」、「『駅名』の側で『商品』を扱っているお店をご紹介致します。」等が定義される。
音声認識サーバ5は、図7aないし図7cに例示されるこれらの重要文に対応する通話音声テキストを、通話音声テキストファイル52を介して通話要約サーバ6に供給する。
図4及び図5に戻り、通話要約生成サーバ6内の応対種別決定部61は、通話音声テキストファイル52から音声認識された通話音声テキストを読み出して、重要語テーブル61を参照し、重要語テーブル61に予め登録された重要語と通話音声テキストとを比較することにより、当該通話における応対種別を決定し(ステップS44)、決定された応対種別を冗長性排除部62及び要約文生成部63に供給する。
この応対種別は、当該通話の結論、結果ないし事後に執るべき対処を示すものであり、非限定的一例として、販促業務の応対種別としては、「商品説明」、「訪問OK」、「訪問NG」、「担当不在」、「再コール」、「資料送付」等と規定され、督促業務の応対種別としては、「滞納確認」、「支払いOK」、「支払いNG」、「要相談」、「本人不在」、「再コール」、「督促郵送」等と規定され、受発注業務の応対種別としては、「受注」、「発注」、「問い合わせ」、「クレーム」、「転送」、「受注なし」等と規定され、相談業務の応対種別としては、「問い合わせ」、「クレーム」、「販売店紹介」、「転送」等と規定されてよい。
図11は、重要語テーブル61に定義される重要語と、導出されるべき応対種別との対応を定義する応対種別導出テーブルの他の非限定的一例を示す。図11を参照して、1又は複数の重要語の組み合わせにより、最左欄に規定される応対種別が導出できる。
次に、通話要約生成サーバ6内の冗長性排除部62は、不要語テーブル62を参照し、音声認識された通話音声テキスト中の冗長性を排除して簡明化された通話音声テキストを要約文生成部63に供給する(ステップS45)。
より詳細には、冗長性排除部62内の不要語削除部621は、不要語テーブル62中に格納される、要約文生成源から削除されるべき不要語を定義する不要語テーブルを参照して、通話音声テキストから不要語を削除する。
好適には、不要語削除部621は、不要語テーブルに定義される不要語の他、さらに単独で意味が把握できない不明語を削除してよい。
図6は、不要語テーブルが定義する不要語の非限定的一例を示す。図6を参照して、不要語テーブル62には、「えー、」等の間投詞、「いつもお世話になっております。」等の定型挨拶文等が不要語として定義されている。
なお、重要文辞書51に事前登録される重要文が十分に洗練されている場合には、冗長性排除部62には、不要語からなる文の通話音声テキストの多くは供給されることはない。しかしながら、この場合にあっても、通話テキスト文が、不要語と重要文とを共に含む場合、不要語削除部621は、通話テキスト文中の不要語を、不要語テーブル62を参照して削除することができる。一例として、「それでは、ご注文内容を復唱させていただきます。」との通話音声テキストが供給されたと想定すると、「それでは、」を不要語テーブル62に登録しておけば、後段の「ご注文内容を復唱させていただきます。」との重要文のみを抽出して、要約生成源を短縮化することができる。
冗長性排除部62内の冗長文排除部622は、1通話分の通話音声テキストから、同一ないし類似内容を記述する文(ないし句、語等の意味を有する纏まりであってもよい)が複数回出現した場合に、重複する文を適宜削除する。好適には、冗長文排除部622は、1通話分の通話音声テキスト中に同一ないし類似内容を記述する文等が複数回出現した場合には、通話開始から終了までの時系列上前方に出現した文を削除し、最後に出現した文を残してよい。通話終了時点に近い文が、より応対の最終的な結論を記述する蓋然性が高いとの知見によるものである。
好適には、冗長文排除部622は、さらに、応対種別が判別できない文章を削除してよい。
図4及び図5に戻り、要約文生成部63中の文体変換部631は、話し言葉で記述された通話音声テキストを報告調の文章に整形し、さらに要約文生成部63は、要約文テンプレート63を参照して決定された応対種別に対応する要約文テンプレートを通話音声テキストに適用することにより、冗長性排除部62から供給される通話音声テキストから要約文を生成する(ステップS46)。
好適には、要約文生成部63は、冗長性排除部62から複数文が供給された場合に、1個の文が供給された場合と同様、1個の要約文を生成してよい。
要約文生成部63は、通話音声テキストを報告調の簡潔な文体、例えば体言止めの文体に変換する。
図8aないしc、及び図9aないしcは、要約文テンプレート63内に記述される要約文テンプレートの非限定的一例を示す。
図8aは、販促業務について、得られた応対種別に応じて、通話音声テキストを報告調の文体に変換する非限定的一例を示す。図8aを参照して、要約文生成部63は、「商品説明」の応対種別の場合は、通話音声テキスト「それでは、『商品』を説明させていただきます。」を、「『商品』を説明。」と、「訪問OK」の応対種別の場合は、通話音声テキスト「それでは、『日時』にお伺いさせていただきます。」を、「『日時』に訪問アポ。」と、それぞれ変換する。図8bは、督促業務についての文体変換例を、図8cは、相談業務についての文体変換例を、それぞれ示す。
図9aは、販促業務について、得られた応対種別に応じて、複数の通話音声テキスト文から、1個の要約文を生成する非限定的一例を示す。図9aを参照して、要約文生成部63は、2個の通話音声テキスト文「それでは、『商品』をご説明させていただきます。」、及び「畏まりました。『商品』について、ご興味がないという事ですね。」を、「『商品』を説明したが、興味なしとの回答。」と変換する。同様に、要約文生成部63は、2つの通話音声テキスト文「それでは、『商品』をご説明させていただきます。」、及び「それでは、『日時』にお伺いさせていただきます。」を、「『商品』を説明し、『日時』に訪問アポ。」と変換する。図9bは、督促業務についての要約文生成例を、図9cは、相談業務についての要約文生成例を、それぞれ示す。
図4及び図5に戻り、要約文短縮部64は、要約文生成部63により生成された要約文が所定長、例えば所定文字数の閾値を超えた場合に、該閾値内の要約文長となるよう、要約文を短縮する(ステップS47)。
好適には、要約文短縮部64は、通話要約文が一覧表示される照会結果画面において、1通話の要約文表示用に設けられた出力欄に要約文全文がスクロールを要することなく表示可能な文字数以内に要約文を短縮してよい。これにより、要約文確認のための追加操作が不要となり、要約文の迅速な視認が可能となる。
より詳細には、要約文短縮部64は、重要語テーブル61を参照して、要約文中に出現する重要語に付与された重要度に基づいて、要約文を短縮してよい。
図10aないしcは、業務ごとに定義される重要度テーブル61の非限定的一例を示す。
図10aは、販促業務について、定義される重要度テーブル61の非限定的一例を示す。図10aを参照して、「『商品』(商品の固有名称)」、「『日時』(特定日時)」には90点が付与され、「特約条項」、「資産運用利回り」、「自己契約の禁止」、「告知義務違反」、「告知義務」等、重要事項やコンプライアンスに高い相関を持つ重要語には70点が付与され、一方「地震保険」、「財形保険」、「財形年金保険」、「個人賠償責任保険」、「個人年金保険」、「国内旅行傷害保険」等、商品の一般名称には50点が付与される。図10bは、督促業務についての重要度テーブルの例を、図10cは、相談業務についての重要度テーブルの例を、それぞれ示す。
一例として、要約文短縮部64は、冗長性排除部62から供給される通話音声テキスト文を、句点(「。」)ごとに区切り、1通話音声テキスト文ごとに文中出現する重要語の重要度を加算し、高い重要度が算出された通話音声テキスト文を優先的に選択してよい。
図4及び図5に戻り、要約文格納部65は、要約文短縮部64から供給される要約文を、要約文データベース64に格納する(ステップS48)。
図12は、冗長性排除部62が、不要語排除のため参照する不要語テーブルの他の例を示す。図12を参照して、他の例による不要語テーブルは、不要語として通話音声テキストから削除されるべき、語句を定義する。
図13は、冗長性排除部62及び/又は要約文生成部63が適宜参照し得る置換テーブルの一例を示す。図13を参照して、冗長性排除部62及び/又は要約文生成部63は、左欄に記述される変換前の語句を、右欄に記述される変換後の語句に変換してよい。
図14は、上記の通話要約生成処理に入力される音声通話データを、図15は、図14に記載される音声通話データから生成される通話要約文を、それぞれ非限定的一例として示す。
図16は、通話要約照会PC端末9b又は他の入力装置から入力される要約文照会に応答して、通話要約照会PC端末9b又は他の出力装置に表示出力される通話要約文表示画面の非限定的一例を示す。図16には、3件の通話の要約文がリスト表示されており、好適には、それぞれの通話に対応する表示ボタン161、162、163を押下入力すると、録音された音声通話の全部又は一部が音声出力されてよい。
好適には、それぞれの通話要約文に対応する応対種別が、対応する通話要約文と共に表示出力されてよい。
上記ではコールセンタ業務の例を説明したが、本実施形態は、通話を用いるあらゆる応対業務やその他の通話履歴取得に適用することが可能である。変形例として、例えば、営業担当員が、携帯電話或いは固定電話で、所属企業の電話番号に発呼し、所属企業内或いは外部に配設された音声応答システムが提供する音声ガイダンスに従って、訪問内容や営業実績などを発話し、この発話を録音して本実施形態に係る通話要約文生成システムに供給すれば、出力される要約文を、営業日報として利用することもできる。
<本実施形態に係る通話音声要約生成システムのハードウエア構成>
図17は、本実施形態に係る各サーバ装置のハードウエア構成の一例を示すブロック図である。図17に示されるコンピュータ装置110である各サーバ装置において、CPU111は、ROM114および/またはハードディスクドライブ116に格納されたプログラムに従い、RAM115を一次記憶用ワークメモリとして利用して、システム全体を制御する。さらに、CPU111は、マウス112aまたはキーボード112を介して入力される利用者の指示に従い、ハードディスクドライブ116に格納されたプログラムに基づき、本実施形態に係る通話音声要約生成処理及び通話音声要約照会処理を実行する。ディスプレイインタフェイス113には、CRTやLCDなどのディスプレイが接続され、CPU111が実行する通話音声要約生成処理及び通話音声要約照会処理のための入力待ち受け画面、処理経過や処理結果、検索結果などが表示される。リムーバブルメディアドライブ117は、主に、リムーバブルメディアからハードディスクドライブ116へファイルを書き込んだり、ハードディスクドライブ116から読み出したファイルをリムーバブルメディアへ書き込む場合に利用される。リムーバブルメディアとしては、フロッピディスク(FD)、CD−ROM、CD−R、CD−R/W、DVD−ROM、DVD−R、DVD−R/W、DVD−RAMやMO、あるいはメモリカード、CFカード、スマートメディア、SDカード、メモリスティックなどが利用可能である。
図17は、本実施形態に係る各サーバ装置のハードウエア構成の一例を示すブロック図である。図17に示されるコンピュータ装置110である各サーバ装置において、CPU111は、ROM114および/またはハードディスクドライブ116に格納されたプログラムに従い、RAM115を一次記憶用ワークメモリとして利用して、システム全体を制御する。さらに、CPU111は、マウス112aまたはキーボード112を介して入力される利用者の指示に従い、ハードディスクドライブ116に格納されたプログラムに基づき、本実施形態に係る通話音声要約生成処理及び通話音声要約照会処理を実行する。ディスプレイインタフェイス113には、CRTやLCDなどのディスプレイが接続され、CPU111が実行する通話音声要約生成処理及び通話音声要約照会処理のための入力待ち受け画面、処理経過や処理結果、検索結果などが表示される。リムーバブルメディアドライブ117は、主に、リムーバブルメディアからハードディスクドライブ116へファイルを書き込んだり、ハードディスクドライブ116から読み出したファイルをリムーバブルメディアへ書き込む場合に利用される。リムーバブルメディアとしては、フロッピディスク(FD)、CD−ROM、CD−R、CD−R/W、DVD−ROM、DVD−R、DVD−R/W、DVD−RAMやMO、あるいはメモリカード、CFカード、スマートメディア、SDカード、メモリスティックなどが利用可能である。
プリンタインタフェイス118には、レーザビームプリンタやインクジェットプリンタなどのプリンタが接続される。ネットワークインタフェイス119は、コンピュータ装置をネットワークへ接続するためのインターフェースである。
なお、本実施形態に係る各サーバ装置及び通話音声要約照会PC端末9bに対する入力手段は、マウス112aあるいはキーボード112に限定されることなく、任意のポインティングデバイス、例えばトラックボール、トラックパッド、タブレットなどを適宜用いることができる。携帯情報端末を本実施形態に係るサーバ装置及び通話音声要約照会PC端末9bに接続される入出力装置として用いる場合には、入力部をボタンやモードダイヤル等で構成してもよい。
また、図17に示した本実施形態に係る各サーバのハードウエア構成は一例に過ぎず、その他の任意のハードウエア構成を用いることができることはいうまでもない。
殊に、本実施形態に係る通話音声要約生成処理及び通話音声要約照会処理の全部又は一部は、上記コンピュータ端末装置110あるいはPDA等の携帯情報端末装置等によって実現されてもよく、コンピュータ端末装置等とサーバー装置とをBluetooth(登録商標)等の無線、あるいはインターネット(TCP/IP)、公共電話網(PSTN)、統合サービス・ディジタル網(ISDN)等の有線通信回線で相互接続した、インターネットあるいは任意の周知のローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)からなるネットワークシステムによって通話録音処理及び音声キーワード照合処理の一部又は全部が実現されてもよい。
以上のとおり、本実施形態によれば、音声認識サーバは、顧客の発話を捨象して音声認識対象とせず、オペレータの発話に係る通話音声データのみを音声認識して通話音声テキストを得、通話要約生成サーバは、この通話音声テキストを要約文作成源として通話の要約を自動生成する。
また、音声認識サーバは、予め通話中に出現することが想定され、かつ要約文に含まれるべき重要情報を含む重要文が辞書登録される重要文辞書を参照して、音声通話から重要文に相当する通話音声テキストを得、通話要約生成サーバは、この得られた通話音声テキストを要約文作成源として通話の要約を自動生成する。
さらに、通話要約生成サーバは、通話音声テキスト内の冗長性を排除して通話の要約を自動生成する。
これにより、通話、典型的には顧客の電話と応対担当者の電話との間でなされた通話を録音蓄積し管理するCRMシステムに好適な、大規模なハードウエア資源を要することなく、音声通話から簡明な要約文を生成し、生成された要約文を迅速に確認又は照査可能な通話音声の要約文生成が実現される。
また、音声認識辞書へのわずかなメンテナンス作業で、高速に、通話音声からの要約文の自動生成が可能となる。
さらに、要約を作成すべき音声通話が大容量かつ長時間に亘る場合であっても、迅速な確認又は照査に耐え得る程度に短縮された要約文を得ることが可能となる。
本発明の範囲は、図示され記載された例示的な実施形態に限定されるものではなく、本発明が目的とするものと均等な効果をもたらすすべての実施形態をも含み、その要旨を逸脱しない範囲で多様な改良ないし変更が可能である。例えば、本実施形態において開示された通話録音処理、音声認識処理、通話音声要約生成処理、及び通話音声要約照会処理は、それぞれ本実施形態に係る通話音声要約生成システムに単独で実装されてもよく、任意の組み合わせで実装されてもよい。
さらに、本発明の範囲は、請求項1により画される発明の特徴の組み合わせに限定されるものではなく、すべての開示されたそれぞれの特徴のうち特定の特徴のあらゆる所望する組み合わせによって画されうる。
PBX 1
音声取得サーバ 2
通話録音サーバ 3
制御サーバ4
音声認識サーバ 5
通話要約生成サーバ 6
顧客電話端末 7
PSTN 8
オペレータ電話端末 9a
通話要約照会PC端末 9b
構内回線 11a,11b,11c
通話音声ファイル 31
呼情報データベース 32
顧客情報データベース 33
重要文辞書 51
通話音声テキストファイル 52
重要語テーブル 61
不要語テーブル62
要約文テンプレート 63
要約文データベース 64
音声取得サーバ 2
通話録音サーバ 3
制御サーバ4
音声認識サーバ 5
通話要約生成サーバ 6
顧客電話端末 7
PSTN 8
オペレータ電話端末 9a
通話要約照会PC端末 9b
構内回線 11a,11b,11c
通話音声ファイル 31
呼情報データベース 32
顧客情報データベース 33
重要文辞書 51
通話音声テキストファイル 52
重要語テーブル 61
不要語テーブル62
要約文テンプレート 63
要約文データベース 64
Claims (15)
- 通話の呼情報を参照することにより、前記通話内の各発話の話者を識別し、識別された一方の話者のみの通話音声データを、通話音声データから選択する話者選択部と、
選択された通話音声データ中から音声認識の対象とされるべき重要文を定義する重要文辞書と、
前記重要文辞書を参照することにより、前記選択された通話音声データを音声認識して、前記重要文辞書に定義された重要文に相当する通話音声テキストを抽出する音声認識部と、
前記重要文と対応する要約文のテンプレートを記憶するテンプレート記憶部と、
抽出された通話音声テキストに前記要約文テンプレートを適用し、抽出された通話音声テキスト中の冗長箇所を削除して要約文テキストに変換する要約文生成部と、
変換された要約文テキストを1通話ごと要約文データベースに格納する要約文格納部とを具備する
ことを特徴とする通話音声要約生成サーバ装置。 - 上記通話音声要約生成サーバ装置は、
前記要約文テキストに含まれるべき重要語を定義する重要語テーブルと、
前記通話音声テキストから前記重要語を検出し、検出された重要語に従って前記通話の結果を示す通話種別を決定する通話種別決定部と、
前記要約文テキストを決定された通話種別と共に視認可能に出力する出力部とを具備する
ことを特徴とする請求項1に記載の通話音声要約生成サーバ装置。 - 上記通話音声要約生成サーバ装置は、
前記要約文テキストに含まれるべき重要語を、該重要語の重要度と共に定義する第2の重要語テーブルと、
生成されるべき要約文の最大長の閾値を保持し、前記要約文生成部から得られる要約文のテキスト長が前記閾値を越える場合に、前記第2の重要語テーブルを参照して、前記要約文を複数に区切って得られる要約文セグメントごとに前記重要度を加算し、加算された前記重要度が低い要約文セグメントを削除することにより、前記要約文を前記閾値内のテキスト長に短縮して、短縮要約文を得る要約文短縮部とを具備する
ことを特徴とする請求項1又は2に記載の通話音声要約生成サーバ装置。 - 前記要約文生成部は、1の通話ごとに、1の要約文を生成する
ことを特徴とする請求項1ないし3のいずれか記載の通話音声要約生成サーバ装置。 - 上記通話音声要約生成サーバ装置は、
前記要約文を更新入力可能に表示出力し、更新入力された要約文を、前記要約文データベースに書き戻すと共に、更新された要約文を参照して、前記重要文辞書を必要に応じて更新する要約文更新部を具備する
ことを特徴とする請求項1ないし4のいずれか記載の通話音声要約生成サーバ装置。 - 話者選択部と、重要文辞書と、音声認識部と、テンプレート記憶部と、要約文生成部と、要約文格納部とを具備する通話音声要約生成サーバ装置が実行する通話音声要約生成方法であって、
前記話者選択部により、通話の呼情報を参照することにより、前記通話内の各発話の話者を識別し、識別された一方の話者のみの通話音声データを、通話音声データから選択するステップと、
前記音声認識部により、選択された通話音声データ中から音声認識の対象とされるべき重要文を定義する重要文辞書を参照することにより、前記選択された通話音声データを音声認識して、前記重要文辞書に定義された重要文に相当する通話音声テキストを抽出するステップと、
テンプレート記憶部により、前記重要文と対応する要約文のテンプレートを記憶するステップと、
前記要約文生成部により、抽出された通話音声テキストに前記要約文テンプレートを適用し、抽出された通話音声テキスト中の冗長箇所を削除して要約文テキストに変換するステップと、
前記要約文格納部により、変換された要約文テキストを1通話ごと要約文データベースに格納するステップとを含む
ことを特徴とする通話音声要約生成方法。 - 上記通話音声要約生成方法は、
通話種別決定部により、前記通話音声テキストから、前記要約文テキストに含まれるべき重要語を定義する重要語テーブルを参照して、前記重要語を検出し、検出された重要語に従って前記通話の結果を示す通話種別を決定するステップと、
出力部により、前記要約文テキストを決定された通話種別と共に視認可能に出力するステップとを含む
ことを特徴とする請求項6に記載の通話音声要約生成方法。 - 上記通話音声要約生成方法は、
要約文短縮部により、生成されるべき要約文の最大長の閾値を保持し、前記要約文生成部から得られる要約文のテキスト長が前記閾値を越える場合に、前記要約文テキストに含まれるべき重要語を該重要語の重要度と共に定義する第2の重要語テーブルを参照して、前記要約文を複数に区切って得られる要約文セグメントごとに前記重要度を加算し、加算された前記重要度が低い要約文セグメントを削除することにより、前記要約文を前記閾値内のテキスト長に短縮して、短縮要約文を得るステップを含む
ことを特徴とする請求項6又は7に記載の通話音声要約生成方法。 - 前記要約文生成部において、1の通話ごとに、1の要約文を生成する
ことを特徴とする請求項6ないし8のいずれか記載の通話音声要約生成方法。 - 上記通話音声要約生成方法は、
要約文更新部により、前記要約文を更新入力可能に表示出力し、更新入力された要約文を、前記要約文データベースに書き戻すと共に、更新された要約文を参照して、前記重要文辞書を必要に応じて更新するステップを含む
ことを特徴とする請求項6ないし9のいずれか記載の通話音声要約生成方法。 - 通話音声要約生成処理をコンピュータに実行させるための通話音声要約生成プログラムであって、該プログラムは、前記コンピュータに、
通話の呼情報を参照することにより、前記通話内の各発話の話者を識別し、識別された一方の話者のみの通話音声データを、通話音声データから選択する話者選択処理と、
選択された通話音声データ中から音声認識の対象とされるべき重要文を定義する重要文辞書を参照することにより、前記選択された通話音声データを音声認識して、前記重要文辞書に定義された重要文に相当する通話音声テキストを抽出する音声認識処理と、
前記重要文と対応する要約文のテンプレートを記憶するテンプレート記憶処理と、
抽出された通話音声テキストに前記要約文テンプレートを適用し、抽出された通話音声テキスト中の冗長箇所を削除して要約文テキストに変換する要約文生成処理と、
変換された要約文テキストを1通話ごと要約文データベースに格納する要約文格納処理とを含む処理を実行させるためのものである
ことを特徴とする通話音声要約生成プログラム。 - 上記通話音声要約生成プログラムは、
前記通話音声テキストから、前記要約文テキストに含まれるべき重要語を定義する重要語テーブルを参照して、前記重要語を検出し、検出された重要語に従って前記通話の結果を示す通話種別を決定する通話種別決定処理と、
前記要約文テキストを決定された通話種別と共に視認可能に出力する出力処理とを含む
ことを特徴とする請求項11に記載の通話音声要約生成プログラム。 - 上記通話音声要約生成プログラムは、
生成されるべき要約文の最大長の閾値を保持し、前記要約文生成部から得られる要約文のテキスト長が前記閾値を越える場合に、前記要約文テキストに含まれるべき重要語を該重要語の重要度と共に定義する第2の重要語テーブルを参照して、前記要約文を複数に区切って得られる要約文セグメントごとに前記重要度を加算し、加算された前記重要度が低い要約文セグメントを削除することにより、前記要約文を前記閾値内のテキスト長に短縮して、短縮要約文を得る要約文短縮処理を含む
ことを特徴とする請求項11又は12に記載の通話音声要約生成プログラム。 - 前記要約文生成処理において、1の通話ごとに、1の要約文を生成する
ことを特徴とする請求項11ないし13のいずれか記載の通話音声要約生成プログラム。 - 上記通話音声要約生成プログラムは、
前記要約文を更新入力可能に表示出力し、更新入力された要約文を、前記要約文データベースに書き戻すと共に、更新された要約文を参照して、前記重要文辞書を必要に応じて更新する要約文更新処理を含む
ことを特徴とする請求項11ないし14のいずれか記載の通話音声要約生成プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009236486A JP2011087005A (ja) | 2009-10-13 | 2009-10-13 | 通話音声要約生成システム、その方法及び通話音声要約生成プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009236486A JP2011087005A (ja) | 2009-10-13 | 2009-10-13 | 通話音声要約生成システム、その方法及び通話音声要約生成プログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2011087005A true JP2011087005A (ja) | 2011-04-28 |
Family
ID=44079658
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009236486A Pending JP2011087005A (ja) | 2009-10-13 | 2009-10-13 | 通話音声要約生成システム、その方法及び通話音声要約生成プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2011087005A (ja) |
Cited By (22)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013018731A1 (ja) * | 2011-08-03 | 2013-02-07 | 株式会社資生堂 | カウンセリングシステム、カウンセリング装置、及びクライアント端末 |
| JP2015156062A (ja) * | 2014-02-19 | 2015-08-27 | 株式会社東芝 | 業務支援システム |
| KR20160060335A (ko) * | 2014-11-20 | 2016-05-30 | 에스케이텔레콤 주식회사 | 대화 분리 장치 및 이에서의 대화 분리 방법 |
| JP2017194910A (ja) * | 2016-04-22 | 2017-10-26 | Cocoro Sb株式会社 | 応対データ収集システム、顧客応対システム及びプログラム |
| US9824143B2 (en) | 2011-07-11 | 2017-11-21 | Sony Corporation | Apparatus, method and program to facilitate retrieval of voice messages |
| JP2018156593A (ja) * | 2017-03-21 | 2018-10-04 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
| JP2019121075A (ja) * | 2017-12-28 | 2019-07-22 | 株式会社日立ソリューションズ | 会議の音声データから要約書を作成する方法 |
| WO2020036190A1 (ja) * | 2018-08-15 | 2020-02-20 | 日本電信電話株式会社 | 要点抽出装置、要点抽出方法、及びプログラム |
| JP2020035272A (ja) * | 2018-08-31 | 2020-03-05 | 株式会社日立ソリューションズ東日本 | 要約生成装置および要約生成方法 |
| JP2020071676A (ja) * | 2018-10-31 | 2020-05-07 | 株式会社eVOICE | 対話要約生成装置、対話要約生成方法およびプログラム |
| JPWO2019003395A1 (ja) * | 2017-06-29 | 2020-06-11 | 株式会社オプティム | コールセンター会話内容表示システム、方法及びプログラム |
| WO2020122331A1 (ko) * | 2018-12-12 | 2020-06-18 | 주식회사 마인즈랩 | 상담 정보 제공 방법 |
| CN111489754A (zh) * | 2019-01-28 | 2020-08-04 | 国家电网有限公司客户服务中心 | 一种基于智能语音技术的话务数据分析方法 |
| JP2020187309A (ja) * | 2019-05-17 | 2020-11-19 | 富士電機株式会社 | 対応支援装置および対応支援方法 |
| CN112291423A (zh) * | 2020-10-23 | 2021-01-29 | 腾讯科技(深圳)有限公司 | 通信呼叫智能应答处理方法、装置、电子设备及存储介质 |
| WO2021193548A1 (ja) * | 2020-03-23 | 2021-09-30 | 富士フイルム株式会社 | 文書作成支援装置、方法およびプログラム |
| US11176944B2 (en) | 2019-05-10 | 2021-11-16 | Sorenson Ip Holdings, Llc | Transcription summary presentation |
| JP2022032691A (ja) * | 2020-08-13 | 2022-02-25 | 大日本印刷株式会社 | 情報処理装置、プログラム及び情報処理方法 |
| JP7293322B1 (ja) | 2021-12-02 | 2023-06-19 | みずほリサーチ&テクノロジーズ株式会社 | 文書作成システム、文書作成方法及び文書作成プログラム |
| JP2024032135A (ja) * | 2022-08-29 | 2024-03-12 | 株式会社ナカヨ | 音声テキスト要約システムおよびその方法 |
| US12035070B2 (en) | 2020-02-21 | 2024-07-09 | Ultratec, Inc. | Caption modification and augmentation systems and methods for use by hearing assisted user |
| WO2026047914A1 (ja) * | 2024-08-28 | 2026-03-05 | 株式会社Nttドコモ | 装置および方法 |
-
2009
- 2009-10-13 JP JP2009236486A patent/JP2011087005A/ja active Pending
Cited By (37)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9824143B2 (en) | 2011-07-11 | 2017-11-21 | Sony Corporation | Apparatus, method and program to facilitate retrieval of voice messages |
| JP2013037401A (ja) * | 2011-08-03 | 2013-02-21 | Shiseido Co Ltd | カウンセリングシステム、カウンセリング装置、クライアント端末、及びカウンセリングプログラム |
| WO2013018731A1 (ja) * | 2011-08-03 | 2013-02-07 | 株式会社資生堂 | カウンセリングシステム、カウンセリング装置、及びクライアント端末 |
| JP2015156062A (ja) * | 2014-02-19 | 2015-08-27 | 株式会社東芝 | 業務支援システム |
| KR102097710B1 (ko) * | 2014-11-20 | 2020-05-27 | 에스케이텔레콤 주식회사 | 대화 분리 장치 및 이에서의 대화 분리 방법 |
| KR20160060335A (ko) * | 2014-11-20 | 2016-05-30 | 에스케이텔레콤 주식회사 | 대화 분리 장치 및 이에서의 대화 분리 방법 |
| JP2017194910A (ja) * | 2016-04-22 | 2017-10-26 | Cocoro Sb株式会社 | 応対データ収集システム、顧客応対システム及びプログラム |
| WO2017183524A1 (ja) * | 2016-04-22 | 2017-10-26 | Cocoro Sb株式会社 | 応対データ収集システム、顧客応対システム及びプログラム |
| CN109074590A (zh) * | 2016-04-22 | 2018-12-21 | 情感爱思比株式会社 | 应对数据收集系统、顾客应对系统及程序 |
| JP2018156593A (ja) * | 2017-03-21 | 2018-10-04 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
| JPWO2019003395A1 (ja) * | 2017-06-29 | 2020-06-11 | 株式会社オプティム | コールセンター会話内容表示システム、方法及びプログラム |
| JP2019121075A (ja) * | 2017-12-28 | 2019-07-22 | 株式会社日立ソリューションズ | 会議の音声データから要約書を作成する方法 |
| WO2020036190A1 (ja) * | 2018-08-15 | 2020-02-20 | 日本電信電話株式会社 | 要点抽出装置、要点抽出方法、及びプログラム |
| JP7125630B2 (ja) | 2018-08-15 | 2022-08-25 | 日本電信電話株式会社 | 要点抽出装置、要点抽出方法、及びプログラム |
| JPWO2020036190A1 (ja) * | 2018-08-15 | 2021-08-10 | 日本電信電話株式会社 | 要点抽出装置、要点抽出方法、及びプログラム |
| JP7288293B2 (ja) | 2018-08-31 | 2023-06-07 | 株式会社日立ソリューションズ東日本 | 要約生成装置および要約生成方法 |
| JP2020035272A (ja) * | 2018-08-31 | 2020-03-05 | 株式会社日立ソリューションズ東日本 | 要約生成装置および要約生成方法 |
| JP2020071676A (ja) * | 2018-10-31 | 2020-05-07 | 株式会社eVOICE | 対話要約生成装置、対話要約生成方法およびプログラム |
| WO2020122331A1 (ko) * | 2018-12-12 | 2020-06-18 | 주식회사 마인즈랩 | 상담 정보 제공 방법 |
| CN111489754A (zh) * | 2019-01-28 | 2020-08-04 | 国家电网有限公司客户服务中心 | 一种基于智能语音技术的话务数据分析方法 |
| US11176944B2 (en) | 2019-05-10 | 2021-11-16 | Sorenson Ip Holdings, Llc | Transcription summary presentation |
| US11636859B2 (en) | 2019-05-10 | 2023-04-25 | Sorenson Ip Holdings, Llc | Transcription summary presentation |
| JP2020187309A (ja) * | 2019-05-17 | 2020-11-19 | 富士電機株式会社 | 対応支援装置および対応支援方法 |
| JP7334467B2 (ja) | 2019-05-17 | 2023-08-29 | 富士電機株式会社 | 対応支援装置および対応支援方法 |
| US12035070B2 (en) | 2020-02-21 | 2024-07-09 | Ultratec, Inc. | Caption modification and augmentation systems and methods for use by hearing assisted user |
| WO2021193548A1 (ja) * | 2020-03-23 | 2021-09-30 | 富士フイルム株式会社 | 文書作成支援装置、方法およびプログラム |
| JPWO2021193548A1 (ja) * | 2020-03-23 | 2021-09-30 | ||
| JP7436636B2 (ja) | 2020-03-23 | 2024-02-21 | 富士フイルム株式会社 | 文書作成支援装置、方法およびプログラム |
| US12417838B2 (en) | 2020-03-23 | 2025-09-16 | Fujifilm Corporation | Document creation support apparatus, method, and program to generate medical document based on medical images |
| JP2022032691A (ja) * | 2020-08-13 | 2022-02-25 | 大日本印刷株式会社 | 情報処理装置、プログラム及び情報処理方法 |
| CN112291423A (zh) * | 2020-10-23 | 2021-01-29 | 腾讯科技(深圳)有限公司 | 通信呼叫智能应答处理方法、装置、电子设备及存储介质 |
| CN112291423B (zh) * | 2020-10-23 | 2023-09-26 | 腾讯科技(深圳)有限公司 | 通信呼叫智能应答处理方法、装置、电子设备及存储介质 |
| JP2023088336A (ja) * | 2021-12-02 | 2023-06-27 | みずほリサーチ&テクノロジーズ株式会社 | 文書作成システム、文書作成方法及び文書作成プログラム |
| JP7293322B1 (ja) | 2021-12-02 | 2023-06-19 | みずほリサーチ&テクノロジーズ株式会社 | 文書作成システム、文書作成方法及び文書作成プログラム |
| JP2024032135A (ja) * | 2022-08-29 | 2024-03-12 | 株式会社ナカヨ | 音声テキスト要約システムおよびその方法 |
| JP7826880B2 (ja) | 2022-08-29 | 2026-03-10 | 株式会社ナカヨ | 音声テキスト要約システムおよびその方法 |
| WO2026047914A1 (ja) * | 2024-08-28 | 2026-03-05 | 株式会社Nttドコモ | 装置および方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2011087005A (ja) | 通話音声要約生成システム、その方法及び通話音声要約生成プログラム | |
| US11636430B2 (en) | Device, system and method for summarizing agreements | |
| US8145482B2 (en) | Enhancing analysis of test key phrases from acoustic sources with key phrase training models | |
| US10276153B2 (en) | Online chat communication analysis via mono-recording system and methods | |
| JP6517419B1 (ja) | 対話要約生成装置、対話要約生成方法およびプログラム | |
| US9063935B2 (en) | System and method for synchronously generating an index to a media stream | |
| US8774372B2 (en) | Telephone call inbox | |
| JP6513869B1 (ja) | 対話要約生成装置、対話要約生成方法およびプログラム | |
| US7783028B2 (en) | System and method of using speech recognition at call centers to improve their efficiency and customer satisfaction | |
| US20080275701A1 (en) | System and method for retrieving data based on topics of conversation | |
| EP1798945A1 (en) | System and methods for enabling applications of who-is-speaking (WIS) signals | |
| JP2007212532A (ja) | モニタリング装置、評価データ選別装置、応対者評価装置、応対者評価システムおよびプログラム | |
| WO2006124942A1 (en) | A method and system for analyzing separated voice data of a telephonic communication between a customer and a contact center by applying a psychological behavioral model thereto | |
| US11955113B1 (en) | Electronic signatures via voice for virtual assistants' interactions | |
| US11418647B1 (en) | Presenting multiple customer contact channels in a browseable interface | |
| US20140362738A1 (en) | Voice conversation analysis utilising keywords | |
| US10887462B1 (en) | System and method for assisting an agent during a client interaction | |
| US20190089824A1 (en) | Communication between users of a telephone system | |
| CN117424960A (zh) | 智能语音服务方法、装置、终端设备以及存储介质 | |
| KR101063261B1 (ko) | 핵심키워드를 이용하여 통화 내용을 녹취하는 인터넷 프로토콜 컨텍트 센터 녹취 시스템 및 그 방법 | |
| JP2016225740A (ja) | 通話振り分けシステム、呼制御装置およびプログラム | |
| US20080037745A1 (en) | Systems, Methods, And Media For Automated Conference Calling | |
| JP2026000442A (ja) | 議事録作成支援装置、およびプログラム | |
| US10924611B2 (en) | Voice recognition system and call evaluation setting method | |
| JP2015164269A (ja) | 自動音声応答装置および自動音声応答方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20110315 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20110630 |