JP6238246B2 - 会話処理装置、および会話処理方法 - Google Patents
会話処理装置、および会話処理方法 Download PDFInfo
- Publication number
- JP6238246B2 JP6238246B2 JP2015084130A JP2015084130A JP6238246B2 JP 6238246 B2 JP6238246 B2 JP 6238246B2 JP 2015084130 A JP2015084130 A JP 2015084130A JP 2015084130 A JP2015084130 A JP 2015084130A JP 6238246 B2 JP6238246 B2 JP 6238246B2
- Authority
- JP
- Japan
- Prior art keywords
- conversation
- unit
- speakers
- degree
- excitement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephonic Communication Services (AREA)
Description
(3)また、本発明の一態様に係る会話処理装置において、前記盛り上がり度合いは、前記任意の2人の話者それぞれが時系列で会話に与えた影響に基づくようにしてもよい。
(4)また、本発明の一態様に係る会話処理装置において、前記会話分析部は、前記任意の2人の話者の前記盛り上がり度合いを、熱方程式を用いて算出するようにしてもよい。
(7)また、本発明の一態様に係る会話処理装置において、前記会話分析部は、前記任意の2人の話者の前記盛り上がり度合いが、所定の閾値より大きい場合に前記会話が活性化されていたと判別するようにしてもよい。
(10)また、本発明の一態様に係る会話処理方法は、前記会話分析部が、前記会話分析手順において次式を用いて前記音量を正規化する、
上述した(3)、(4)の構成によれば、抽出された2人の話者が発話したとき、それぞれの発話が時系列で注入される熱伝搬モデルにおいて熱方程式を解くことで盛り上がり度を算出することができる。
上述した(5)の構成によれば、重み付き完全グラフを用いて、会話の中心人物を推定することができる。
上述した(6)の構成によれば、所定の時刻毎に盛り上がり度を算出できるので、会議における盛り上がり度の時間変化を提供することができる。
上述した(7)の構成によれば、会議が盛り上がっていたか否かを判別することができる。
上述した(8)の構成によれば、例えばマイクロフォンアレイによって収音された音声信号を、音源分離部によって音源分離を行って、分離された音声信号のうちの任意の2人の音声信号を用いて、話者間の盛り上がり度を測定することができる。
発明の概要について説明する。
複数の話者が参加している会議において、会話処理装置1(図6参照)は、各話者の発話を音源分離させて記録する。会話処理装置1は、記録された音声から、任意の2人の会話を逐次選択する。例えば、会議の参加者がAとBの2名の場合、選択されるペアの組み合わせは、AB(=BA)の1通りである。参加者がAとBとCの3名の場合、選択されるペアの組み合わせは、AB(=BA)、AC(=CA)、BC(=CB)の3通りである。本実施形態では、会話を熱の供給とし、会話中の盛り上がりを空間における熱の伝搬として、熱伝搬モデルを用いて会話の盛り上がり度合いを示す盛り上がり度を算出する。会話処理装置1は、選択した2人の音声を用いて、時刻毎の会話の盛り上がり度を、熱方程式を用いて算出する。そして、会話処理装置1は、算出した盛り上がり度を用いて、重み付き完全グラフを生成する。会話処理装置1は、生成した重み付き完全グラフを用いて、会議における発話の所定の時刻毎の寄与度(以下、発話寄与度という)を算出することで、会議における所定の時刻毎の中心人物を推定する。なお、所定の時刻毎とは、例えば1秒毎である。
まず、本実施形態で用いる盛り上がり度について説明する。
図1は、本実施形態に係る話者が2人の場合の盛り上がり度モデルを表す図である。図1において、横軸はx軸方向であり、話者が存在する位置を表している。また、縦軸は盛り上がり度を表している。
図1に示すように、話者Aがx軸上の一方端(=0)に存在し、話者Bが他方端(=1)に存在している。本実施形態では、熱伝搬モデルを盛り上がり度モデルとして用いる。これにより、x=0から加えられる熱に相当するのは、話者Aの発話であり、x=1から加えられる熱に相当するのは、話者Bの発話である。この盛り上がり度モデルにおいて、2人のうちの一方が発話した場合は、話者の存在するx=0またはx=1の片側から熱量が供給される。また、2人の話者が共に発話を行っていない場合は、両端から供給される熱量が減少する。
本実施形態では、図1に示すように、話者AとBとがそれぞれ存在する中心(x/2)の位置において、熱方程式における温度uを盛り上がり度hABとして定義する。なお、下付きABは、話者AとBを表している。
まず、本実施形態で用いる用語の定義を行う。
会話の参加人数をMで表し、個々の話者の通し番号をm(∈{1、・・・、M})とする。1つの会議において、話者mが発話した総発話数をImとし、話者mの発話の通し番号をim(∈{1、・・・、Im})とする。
話者mによる発話imの発話開始時刻をtimとする。また、話者mの第im番目の発話の音量(以下、発話音量ともいう)をvimとする。
時刻ti1のとき話者1が発話を行ったことによって、盛り上がり度モデルの一方端から音量vi1が供給される。
時刻ti1より後の時刻ti2のとき話者2が発話を行ったことによって、盛り上がり度モデルの他方端から音量vi2が供給される。
以下、話者1または話者2が発話を行ったときに、盛り上がり度モデルの端部から音量vimが逐次供給される。
数直線x上に導体がある場合の熱方程式は、次式(1)のように表される。
なお、図2に示した例は一例であり、正規化に用いる分布は、パレート分布に限られず、他の統計的な分布を用いてもよい。
本実施形態では、このように算出された盛り上がり度hABをグラフにおけるエッジの重みとして用いる。話者がAとBの2人の場合、ノードはAとBであり、ノードAとBの間のエッジに対する重みが盛り上がり度hABである。
次に、話者AとBとの会話における盛り上がり度hABの時間変化の例を説明する。
図3は、本実施形態に係る話者AとBの会話における盛り上がり度hABの時間変化の例を表す図である。図3において、横軸は時刻を表し、縦軸は盛り上がり度hABを表している。また、曲線g2は、時刻に対する盛り上がり度hAB(t)を表し、破線g3は、会話が盛り上がっているか否かを判別する際に用いられる閾値を表している。
図3に示す例では、時刻t0〜t6の間に会議が行われ、閾値g3以上の期間である時刻t1〜t3の期間と、時刻t4〜t5の期間が、会話が盛り上がっていたと判別される期間である。また、図3に示す例では、時刻t2のときが、盛り上がり度hAB(t)の値が最も大きな時刻である。
次に、話者がA、B、Cの3人の場合を説明する。
話者が3人の場合、会話処理装置1は、記録されている音声信号から話者AとBの音声信号、話者AとCの音声信号、話者BとCの音声信号それぞれを逐次抽出する。会話処理装置1は、式(2)においてhABをhACまたはhBCに置き換えて、2人の話者間の盛り上がり度hAB、hAC、hBCを算出する。会話処理装置1は、算出した盛り上がり度hAB、hAC、hBCを用いて、図4に示すように重み付き完全グラフを生成する。なお、完全グラフとは、全てのノード間にエッジが存在するグラフである。重み付きグラフとは、エッジに重みが付与されているグラフである。図4は、本実施形態に係る話者が3人の場合の重み付き完全グラフを表す図である。
なお、話者が4人の場合には、4頂点(ノード)重み付き完全グラフを用い、話者がm人の場合には、m頂点重み付き完全グラフを用いる。
図5は、本実施形態に係る話者AとBとCの会話における盛り上がり度hAB、hBC、hACおよび3つの盛り上がり度の平均h ̄の時間変化の例を表す図である。
図5において、横軸は時刻を表し、縦軸は盛り上がり度を表している。破線g3は、会話が盛り上がっているか否かを判別する際に用いられる閾値を表している。曲線g11は、話者AとBとの会話における時刻に対する盛り上がり度hAB(t)を表し、曲線g12は、話者BとCとの会話における時刻に対する盛り上がり度hBC(t)を表し、曲線g13は、話者AとCとの会話における時刻に対する盛り上がり度hAC(t)を表している。また、曲線g14は、盛り上がり度hAB(t)、hBC(t)、hAC(t)の平均h ̄(t)(=1/3(hAB(t)+hBC(t)+hAC(t)))を表している。
次に、会議の盛り上げに寄与した話者の推定について説明する。
例として、話者が3人の場合について説明する。話者がA、B、Cの3人の場合、上述したように、グラフにおけるノードはA、B、Cであり、エッジの重みは盛り上がり度hAB、hBC、hACである。このような3人の話者における重み付き完全グラフの隣接行列Nは、次式(5)のように表される。
ここで、ペロン・フロベニウスの定理よりすべての成分が非負となる行列の最大固有値に対する固有ベクトル成分は、全ての符号が等しくなる。生成したグラフの隣接行列Nの各成分は、式(5)に示したように全て非負であるため最大固有値に対する固有ベクトル成分はすべての符号が等しい。本実施形態では、最大固有値に対する固有ベクトルRを会話における発話寄与度と定義する。
会話処理装置1は、この隣接行列Nの固有ベクトルRを、次式(6)によって算出する。
なお、上述した会話寄与度Cの算出手法は一例であり、これに限られない。会話処理装置1は、グラフ理論における中心を算出する他の手法を用いて、会話寄与度Cを算出するようにしてもよい。
次に、会話処理装置1の構成について説明する。
図6は、本実施形態に係る会話処理装置1の構成を示すブロック図である。
図6に示すように、会話処理装置1は、収音部11、音声信号取得部12、音源定位部13、音源分離部14、会話記録部15、操作部16、会話分析部17、および分析結果出力部18を備える。
なお、音源分離部14は、例えば自部に記憶されている室内の伝達関数を用いて、雑音と話者の音声信号とを分離した後、話者毎の音声信号を分離するようにしてもよい。この場合、音源分離部14は、例えばN個の音声信号毎に音響特徴量を算出し、算出した音響特徴量及び音源定位部13から入力された方位角情報に基づいて、話者毎の音声信号に分離するようにしてもよい。
操作部16は、利用者の操作を受け付け、受け付けた操作された操作情報を会話分析部17に出力する。操作情報には、例えば、記録されている会議のうちのいずれの会議について分析を行うのかを示す会議選択情報、分析の開始を示す分析開始情報等が含まれている。
また、盛り上がり度算出部173は、全ての話者のペア毎の盛り上がり度の平均h ̄(t)(図5参照)を算出する。盛り上がり度算出部173は、自部に記憶されている閾値を用いて、図5に示したようなペア毎の盛り上がり度hxy(t)の時間変化を表す画像と、盛り上がり度の平均h ̄(t)の時間変化を表す画像とを生成し、生成した画像を分析結果出力部18に出力する。
次に、会話処理装置1が行う処理手順の例について説明する。
図8は、本実施形態に係る会話処理装置1が行う処理の一例を表すフローチャートである。なお、以下の処理では、すでに会議中の音声信号が取得され、音源分離された話者毎の音声信号と識別情報とが会話記録部15に記録されている。そして、以下の処理は、利用者によって、会議の音声信号に対して解析指示が操作部16によって指示された後に行われる。
以上で、会話処理装置1が行う処理を終了する。
次に、本実施形態の会話処理装置1を用いて行った実験結果の一例を説明する。
実験は、3人の話者が参加した会議を記録して行った。
まず、前述した式(2)における会話拡散率Dの値を変化させた結果の例を説明する。
図9は、本実施形態に係る会話拡散率Dの値を変えた場合の盛り上がり度hxy(t)の時間変化の一例を表す図である。図9において、横軸は時刻であり、縦軸は盛り上がり度である。
図9に示す例において、曲線g16は、会話拡散率Dの値が1の例であり、曲線g17は、会話拡散率Dの値が20の例である。図9に示すように、会話拡散率Dの値が小さいほど、盛り上がり度hxy(t)の時間変化はなめらかな曲線となる。
会話拡散率Dの値、および会議が盛り上がっているか否かを判別する際に用いる閾値は、会話処理装置1の利用者によって、予め設定されていてもよい。または、図9に示したような盛り上がり度hxy(t)の時間変化を、会話処理装置1に接続されている表示部(不図示)に表示させ、利用者が表示された画像を見ながら操作部16を操作して会話拡散率Dを設定するようにしてもよい。この場合、例えば、会話拡散率Dの値と閾値値との対応は、寄与度算出部175に記憶されていてもよい。
図10は、本実施形態に係る3人の話者の会話について寄与度算出部175が推定した推定結果の一例を表す図である。図10において、横軸は時刻を表し、縦軸は発話寄与度Cを表す。
また、図10において、曲線g21は、識別情報Aの話者の発話寄与度CAを表し、曲線g22は、識別情報Bの話者の発話寄与度CBを表し、曲線g23は、識別情報Cの話者の発話寄与度CCを表している。
また、図10に示す例では、会議の始めの時間、話者Aの発話寄与度CAが高かったが、その後、話者Bの発話寄与度CBが発話寄与度CAより高くなり、その後もの発話寄与度CBが高いことが分かる。
利用者は、会話処理装置1から出力された図10のような推定結果を使用して、会議の中心人物の時刻毎の変化、会議全体における会議を盛り上げた中心人物を知ることができる。
この構成によって、本実施形態によれば、任意の2人の音声信号を用いて、話者間の盛り上がり度を測定することができる。
また、本実施形態の会話処理装置1において、会話分析部17は、任意の2人の話者の盛り上がり度合いを、熱方程式(例えば式(2))を用いて算出する。
この構成によって、本実施形態では、抽出された2人の話者が発話したとき、それぞれの発話が時系列で熱伝搬モデルに注入される。そして、本実施形態では、この熱伝搬モデルにおいて熱方程式を解くことで盛り上がり度を算出することができる。
この構成によって、本実施形態によれば、重み付き完全グラフを用いて、会話の中心人物を推定することができる。
また、本実施形態の会話処理装置1において、会話分析部17は、任意の2人の話者間の会話における音声信号について、1回に発話された音声信号の長さに基づいて音量を正規化する。
この構成によって、本実施形態によれば、選択された2人の話者間の音量が異なっていた場合であっても、正規化することで、音量差の影響を低減することができる。また、本実施形態によれば、1人の話者の発話時間を考慮して音量を正規化することで、1人の話者の発話が長くなった場合であっても、盛り上がり度を適切に算出することができる。
この構成によって、本実施形態によれば、所定の時刻毎に盛り上がり度を算出できるので、会議における盛り上がり度の時間変化を提供することができる。
この構成によって、本実施形態によれば、会議が盛り上がっていたか否かを判別することができる。
この構成によって、例えばマイクロフォンアレイによって収音された音声信号を、音源分離部14によって音源分離を行って、分離された音声信号のうち任意の2人の音声信号を用いて、話者間の盛り上がり度を測定することができる。
Claims (10)
- 複数の話者の音声信号を収音する収音部と、
前記収音部によって収音された各話者の音声信号を記録する会話記録部と、
前記会話記録部に記録された音声信号から、任意の2人の話者間の会話を解析して前記2人の話者間の会話における盛り上がり度合いを算出し、前記任意の2人の話者間の会話における音声信号について、1回に発話された音声信号の長さに基づいて音量を正規化する会話分析部と、
を備える会話処理装置。 - 前記盛り上がり度合いは、
前記任意の2人の話者それぞれが時系列で会話に与えた影響に基づく請求項1または請求項2に記載の会話処理装置。 - 前記会話分析部は、
前記任意の2人の話者の前記盛り上がり度合いを、熱方程式を用いて算出する請求項1から請求項3のいずれか1項に記載の会話処理装置。 - 前記会話分析部は、
前記複数の話者に対して、前記任意の2人の話者の全てのペアを選択し、選択した前記ペア毎に前記盛り上がり度合いを算出し、算出した前記ペア毎の前記盛り上がり度合いをエッジに対する重みに用いて、ノートとエッジとで構成される重み付き完全グラフを生成し、生成した前記重み付き完全グラフに基づいて、会話の中心人物を推定する請求項1から請求項4のいずれか1項に記載の会話処理装置。 - 前記会話分析部は、
前記任意の2人の話者の前記盛り上がり度合いを、所定の時刻毎に算出する請求項1から請求項5のいずれか1項に記載の会話処理装置。 - 前記会話分析部は、
前記任意の2人の話者の前記盛り上がり度合いが、所定の閾値より大きい場合に前記会話が活性化されていたと判別する請求項1から請求項6のいずれか1項に記載の会話処理装置。 - 前記収音部によって収音された音声信号を用いて音源位置を定位する音源定位部と、
前記音源定位部によって定位された結果に基づいて音源分離を行う音源分離部と、
を備え、
前記会話記録部は、
前記音源分離部によって分離された各話者の音声信号を記録する請求項1から請求項7のいずれか1項に記載の会話処理装置。 - 収音部が、複数の話者の音声信号を収音する収音手順と、
会話記録部が、前記収音手順によって収音された各話者の音声信号を記録する会話記録手順と、
会話分析部が、前記会話記録手順によって記録された音声信号から、任意の2人の話者間の会話を解析して前記2人の話者間の会話における盛り上がり度合いを算出し、前記任意の2人の話者間の会話における音声信号について、1回に発話された音声信号の長さに基づいて音量を正規化する会話分析手順と、
を含む会話処理方法。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015084130A JP6238246B2 (ja) | 2015-04-16 | 2015-04-16 | 会話処理装置、および会話処理方法 |
| US15/091,886 US10013982B2 (en) | 2015-04-16 | 2016-04-06 | Conversation processing apparatus and conversation processing method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015084130A JP6238246B2 (ja) | 2015-04-16 | 2015-04-16 | 会話処理装置、および会話処理方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2016206261A JP2016206261A (ja) | 2016-12-08 |
| JP6238246B2 true JP6238246B2 (ja) | 2017-11-29 |
Family
ID=57128619
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015084130A Active JP6238246B2 (ja) | 2015-04-16 | 2015-04-16 | 会話処理装置、および会話処理方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US10013982B2 (ja) |
| JP (1) | JP6238246B2 (ja) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7135295B2 (ja) * | 2017-10-26 | 2022-09-13 | 富士フイルムビジネスイノベーション株式会社 | 装置 |
| JP2019101385A (ja) * | 2017-12-08 | 2019-06-24 | 富士通株式会社 | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
| EP3709194A1 (en) | 2019-03-15 | 2020-09-16 | Spotify AB | Ensemble-based data comparison |
| US11094319B2 (en) | 2019-08-30 | 2021-08-17 | Spotify Ab | Systems and methods for generating a cleaned version of ambient sound |
| US10827028B1 (en) | 2019-09-05 | 2020-11-03 | Spotify Ab | Systems and methods for playing media content on a target device |
| US12038973B2 (en) * | 2020-01-17 | 2024-07-16 | Nippon Telegraph And Telephone Corporation | Relation visualizing apparatus, relation visualizing method and program |
| US11328722B2 (en) | 2020-02-11 | 2022-05-10 | Spotify Ab | Systems and methods for generating a singular voice audio stream |
| US11308959B2 (en) | 2020-02-11 | 2022-04-19 | Spotify Ab | Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices |
| JP7668030B2 (ja) * | 2021-02-02 | 2025-04-24 | 株式会社I’mbesideyou | ビデオセッション評価端末、ビデオセッション評価システム及びビデオセッション評価プログラム |
| US12293771B2 (en) * | 2022-09-06 | 2025-05-06 | Dell Products, L.P. | Equalization of audio during a collaboration session in a heterogenous computing platform |
Family Cites Families (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4931934A (en) * | 1988-06-27 | 1990-06-05 | Snyder Thomas E | Method and system for measuring clarified intensity of emotion |
| US5025471A (en) * | 1989-08-04 | 1991-06-18 | Scott Instruments Corporation | Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns |
| US5862519A (en) * | 1996-04-02 | 1999-01-19 | T-Netix, Inc. | Blind clustering of data with application to speech processing systems |
| US6011851A (en) * | 1997-06-23 | 2000-01-04 | Cisco Technology, Inc. | Spatial audio processing method and apparatus for context switching between telephony applications |
| US7222075B2 (en) * | 1999-08-31 | 2007-05-22 | Accenture Llp | Detecting emotions using voice signal analysis |
| US6275806B1 (en) * | 1999-08-31 | 2001-08-14 | Andersen Consulting, Llp | System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters |
| US6480826B2 (en) * | 1999-08-31 | 2002-11-12 | Accenture Llp | System and method for a telephonic emotion detection that provides operator feedback |
| US6151571A (en) * | 1999-08-31 | 2000-11-21 | Andersen Consulting | System, method and article of manufacture for detecting emotion in voice signals through analysis of a plurality of voice signal parameters |
| US7475013B2 (en) * | 2003-03-26 | 2009-01-06 | Honda Motor Co., Ltd. | Speaker recognition using local models |
| JP4804801B2 (ja) * | 2005-06-03 | 2011-11-02 | 日本電信電話株式会社 | 会話構造推定方法、プログラム、および記録媒体 |
| JP5055781B2 (ja) * | 2006-02-14 | 2012-10-24 | 株式会社日立製作所 | 会話音声分析方法、及び、会話音声分析装置 |
| JP4816221B2 (ja) | 2006-04-21 | 2011-11-16 | ヤマハ株式会社 | 収音装置および音声会議装置 |
| US9646603B2 (en) * | 2009-02-27 | 2017-05-09 | Longsand Limited | Various apparatus and methods for a speech recognition system |
| JP5433696B2 (ja) * | 2009-07-31 | 2014-03-05 | 株式会社東芝 | 音声処理装置 |
| US8666672B2 (en) * | 2009-11-21 | 2014-03-04 | Radial Comm Research L.L.C. | System and method for interpreting a user's psychological state from sensed biometric information and communicating that state to a social networking site |
| US8825584B1 (en) * | 2011-08-04 | 2014-09-02 | Smart Information Flow Technologies LLC | Systems and methods for determining social regard scores |
| WO2013056721A1 (de) * | 2011-10-18 | 2013-04-25 | Siemens Enterprise Communications Gmbh & Co.Kg | Verfahren und vorrichtung zur bereitstellung von in einer konferenz erzeugten daten |
| JP5433760B2 (ja) * | 2012-10-18 | 2014-03-05 | 株式会社日立製作所 | 会議分析システム |
| US11232466B2 (en) * | 2015-01-29 | 2022-01-25 | Affectomatics Ltd. | Recommendation for experiences based on measurements of affective response that are backed by assurances |
-
2015
- 2015-04-16 JP JP2015084130A patent/JP6238246B2/ja active Active
-
2016
- 2016-04-06 US US15/091,886 patent/US10013982B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2016206261A (ja) | 2016-12-08 |
| US10013982B2 (en) | 2018-07-03 |
| US20160307570A1 (en) | 2016-10-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6238246B2 (ja) | 会話処理装置、および会話処理方法 | |
| CN110070882B (zh) | 语音分离方法、语音识别方法及电子设备 | |
| US8731936B2 (en) | Energy-efficient unobtrusive identification of a speaker | |
| CN105405439B (zh) | 语音播放方法及装置 | |
| EP2541543B1 (en) | Signal processing apparatus and signal processing method | |
| US9916843B2 (en) | Voice processing apparatus, voice processing method, and non-transitory computer-readable storage medium to determine whether voice signals are in a conversation state | |
| JP2023120294A5 (ja) | ||
| US20180286423A1 (en) | Audio processing device, audio processing method, and program | |
| WO2018223727A1 (zh) | 识别声纹的方法、装置、设备及介质 | |
| JP6737398B2 (ja) | 重要単語抽出装置、関連会議抽出システム、及び重要単語抽出方法 | |
| CN114127846B (zh) | 语音跟踪收听设备 | |
| CN108417201A (zh) | 单信道多说话人身份识别方法及系统 | |
| CN110169082A (zh) | 组合音频信号输出 | |
| EP2806415B1 (en) | Voice processing device and voice processing method | |
| US20210335352A1 (en) | Information processing apparatus | |
| US10176818B2 (en) | Sound processing using a product-of-filters model | |
| CN111640451A (zh) | 一种成熟度评估方法及装置、存储介质 | |
| CN107393549A (zh) | 时延估计方法及装置 | |
| CN116895284B (zh) | 自适应声掩蔽方法、装置、设备及可读存储介质 | |
| JP5803125B2 (ja) | 音声による抑圧状態検出装置およびプログラム | |
| Williams et al. | Privacy-preserving occupancy estimation | |
| KR20210054174A (ko) | 음성 데이터의 주기 성분을 이용하여 화자를 분류하는 장치, 방법 및 컴퓨터 프로그램 | |
| CN116612772B (zh) | 音频数据生成方法、装置、设备及存储介质 | |
| JP2016111426A (ja) | 推定装置、推定方法、およびプログラム | |
| WO2019156079A1 (ja) | 推定装置、推定方法、およびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170207 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170410 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170420 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171003 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171024 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6238246 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
