JP7565742B2 - 意図推定装置 - Google Patents
意図推定装置 Download PDFInfo
- Publication number
- JP7565742B2 JP7565742B2 JP2020170610A JP2020170610A JP7565742B2 JP 7565742 B2 JP7565742 B2 JP 7565742B2 JP 2020170610 A JP2020170610 A JP 2020170610A JP 2020170610 A JP2020170610 A JP 2020170610A JP 7565742 B2 JP7565742 B2 JP 7565742B2
- Authority
- JP
- Japan
- Prior art keywords
- intention
- utterance
- section
- estimation
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
本発明はまた、発話の推定結果をリアルタイムで算出して提示することにある。
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有する意図推定装置である。
本発明はまた、上記意図推定装置において動作する意図推定方法として把握できる。
さらに、本発明は、上記意図推定装置における機能または上記方法における処理ステップを、コンピュータで実行して実現するプログラムとしても把握できる。
図1は、プリンタの保守点検現場における作業員の発話系列例101と、その時に実現したい保守点検結果の推定例102を時系列に示している。ここで、作業者の各発話104に対して、時系列に発話番号(No)103が付けられて、推定が行われるべきタイミングで点検項目105と点検結果106の推定結果が記されている。なお、テキストとして示されている作業員の発話情報101は、例えばマイクを装着した作業員の発話を音声認識することにより取得することができる。
発話文合成部701は、入力された発話系列に対して、移動窓(Moving Window)を用いて連続する発話文をつなげて意図推定部702への入力となる連結文(入力文という)を生成する。Moving Windowの窓サイズ(Windowサイズ)は窓サイズDB(データベース)711に記憶されている。Windowサイズは、発話文合成部701が前後いくつの文まで結合するかを規定する。
意図区間推定部703は、意図推定部702で取得した尤度を基に発話の意図区間を推定する、すなわち発話系列を意図区間に分割する。点検結果抽出部704は、推定された意図区間に対応する意図推定結果を意図推定部702の出力結果から参照して推定結果を出力する。出力部705は、その推定結果を点検結果として出力する。出力された点検結果は、例えば作業員が所持する端末に表示または音声出力され、また記憶部(不図示)に格納される。なお、この端末は例えば、携帯端末或いは作業員が装着するウェアラブル端末などであり、音声又はタッチキー等による入力部、音声出力部、表示部、メモリ等の記憶部、プログラムを実行して所定の機能を実現するプロセッサ等を有する。
図8は、発話文合成部701によるMoving Windowを用いて連結文を生成する例を示す。ここでは、簡単のため、Windowサイズ(以降、W_Sizeと表示する)を「3」に設定した場合について説明する。
ここでは、従来方式(図2)と同様の前提、すなわち、単語ベクトル系列902を、ニューラルネットワーク903を用いて識別を行い、意図ベクトル904とその尤度905を出力する。ただし、たとえ入力が複数の文で構成されていたとしても、1度の入力に対して出力が行われるのは、入力文の最後の1度である。この例では、「プリンタの保守をします。コンセントよし。」という連結文901に対する意図推定結果が「コンセントOK」、その尤度が0.85であることを表している。このように、1入力1出力方式の識別器を利用する理由は、入力された連結区間全体が意図区間として適切かどうかを判定するためである。また、従来方式(図2)の1入力多出力方式に対して、本実施例では1入力1出力方式を用いることにより、図3のように様々な遷移パターンで学習を行う必要がなくなり、図5に示すように、点検項目ごとの学習で済むようになる。なお、識別に用いるニューラルネットワークモデルとしては、RNNやLSTMだけでなく、CNN(Convolutional Neural Network)やGRU(Gated Recurrent Unit)(非特許文献4)、BERT(Bidirectional Encoder Representations from Transformers)(非特許文献5)、Bi-directional RNN、Bi-directional LSTM、Bi-directional GRUや、これらの改良系などでも構わない。また、複数のモデルを組み合わせても良い。例えば、RNNによる識別器とLSTMによる識別器の2種類を用意し、各識別器で算出した尤度の平均値などを最終結果とすると効果的である。また、ニューラルネットワーク以外にも、SVM(Support Vector Machine)やRF(Random Forest)、DT(Decision Tree)、k-近傍法など、多クラス分類が可能な機械学習方法を利用しても良い。
実施例1の意図推定方法では、作業員が発話してから推定結果が確定するまでに時間がかかる。そのため、実施例5のARグラスのように、作業員とシステムが双方向にやり取りするHMI(Human Machine Interface)を実現する場合、推定結果が確定してからそれを作業員に提示すると作業員は結果が出るまでの間長く待たされることになり、心的ストレスが生じる。一方、推定結果が未だ確定していない段階で結果を提示してしまうと、その後の推定結果が変化した場合に作業員は困惑してしまう。そこで、推定結果が今後変化するかもしれない状態(暫定結果)と、推定が完了して今後変化しない状態(確定結果)に分けて出力することにより、作業員は現在の状態を正確に把握できるようになる。
収集した音声データ(全ての発話文)を一括で解析する場合など、作業員へのフィードバックが必要ない場合には、推定が確定した結果のみを出力すればよい。この場合、暫定結果を出力するための余分な処理(意図区間推定の途中結果の記録・更新など)が必要なく、リアルタイム処理時よりも処理量が減少する。この例については、図12~図13を参照して説明する。
バッチ処理は、対象とする全ての発話文を一括して処理する。
図12は、バッチ処理による意図推定処理フローの例を示す。
まず、入力部700が対象とする発話系列を受け入れる(1201)。入力された発話系列(全ての発話文(以下単に文という))は記憶部(不図示)に一時保持される。次に、発話文合成部701が、発話系列に含まれる全ての文に対して、Moving Windowにより隣接する文を連結して意図推定処理の入力文を作成する(1202)。なお、バッチ処理では、Moving Windowが不要である(W_Size=∞に設定)。
そして、発話系列に含まれる全ての文に対して処理を行ったかを判断して、その結果全てについて行っていなければ(1203:No)、処理1202を繰り返す。
図13は、リアルタイム処理による意図推定装置の構成例を示す。
この意図推定装置は、図7の意図推定装置と同様に、入力部1300と、発話文合成部1301と、意図推定部1302と、意図区間推定部1303と、点検結果抽出部1304と、出力部1305を有して構成される。図7の意図推定装置に比べて、窓サイズDB1311と、区間推定情報DB1312が追加される。窓サイズDB1311は図7の窓サイズDB711と同様にWindowサイズを記憶する。区間推定情報DB1312は、意図区間推定部1303の出力である区間推定結果(区間推定情報)を格納する。区間推定情報には、途中の推定結果(暫定結果)と、最終的な推定結果(確定結果)が含まれる。区間推定情報については、図14を参照して後述する。
図示は、図11において動的計画法により意図区間推定を行った場合、文4の評価が終わった時点での内容を示している。区間推定情報DB1312は、意図区間の区間推定結果1401と、各文に関して評価を行った(評価文に対する)最適値MAX_W(1402)を格納する。ここで、区間推定結果1401は、各文を評価する際に推定した、意図区間と、区間ごとの意図推定結果と、その状態(対象区間の推定結果が暫定かまたは確定か)を記録する。本実施例のように、Moving Windowと動的計画法を利用した場合、文Mの評価が終わった時点では、区画内に含まれる文の番号が全て{M-(W_Size-1)}以下である意図区間が確定区画となる。
図13に示す、意図推定装置による意図推定処理は以下のように行われる。
まず、入力部1300が対象とする発話系列から時系列順に発話文の入力を受け入れる(1501)。発話合成部1301が、入力された発話文に対して、Moving Windowにより隣接する文を連結して意図推定処理の入力文を作成する(1502)。
続いて、作成された全ての連結文に対して意図推定処理を行い(1505)、意図推定結果とその尤度を算出する(1504)。その後、尤度に基づいて意図区間を推定する(1506)。そして、結果が未確定である全ての意図区間に対して(1508)、対応する意図推定結果を取得する(1507)。
ここで、推定結果を出力する処理(1509、1510)に関しては、例えば、区間推定情報DB1312において、文4が入力された時点では、{意図区間:[文0, 文1]、意図推定結果:「フィルムNG」}が確定結果として、{意図区間:[文2, 文3, 文4]、意図推定結果:「用紙残量OK」}が暫定結果として記録される。
本実施例の意図推定装置によれば、「発話文」を入力して「意図カテゴリ」(保守点検では、「点検項目」と「点検結果」の組合せ。例えば「用紙残量:NG」など。)を出力できる。この手法をコミュニケーションロボットに適用する場合、「意図カテゴリ」を、「相手の要求している内容」(例えば、「挨拶をしたい」、「道を聞きたい」など)に設定すれば良い。QA対話システムであれば「データベースの中のどの回答を返せばよいか」に設定すればよく、文書解析であれば「文書のジャンル」に設定すれば良いことになる。「発話文」と「意図カテゴリ」の入出力関係は、意図推定部702によって変わってくるので、これを学習する際のデータを適用分野に合わせて用意すれば他の分野にも容易に適用できる。
意図区間が全体的に長い場合は、点検中に作業員が多く発話していることを意味するため、W_Sizeの値を大きくして(長いWindowサイズを用いて)、推定精度を高くすることができる。この場合、例えば図18に示す処理フローにて、W_Sizeの調整を行うのが好ましい。
未点検の検査項目に関する尤度に対して重みを高く設定すると、推定精度が高くなる。ここで、未点検とは、出力された意図推定結果が、図17に示す点検履歴情報の点検履歴の点検項目1721に含まれない状態であることを言う。この場合、例えば数1による重みW(M,N)に対して、数2のように調整した重みW2(M,N)を利用すると効果的である。
なお、実施例2によるWindowサイズと重み調整は、実施例1による意図推定処理に限らず、Windowサイズや重みを用いて区間を決定するどのような手法に対しても適用可能である。
発話文の中に、点検用語辞書DB2202に含まれる用語が存在する場合は、W_Sizeを大きく設定(長いWindowサイズを利用)することにより、意図区間を適切に推定できる。逆に発話文の中に、点検用語辞書DB2202に含まれる用語が存在しない場合、W_Sizeを小さく設定(短いWindowサイズを利用)することで、計算量を節約できる。そのため、例えば、数5のように、W_Sizeを決定すると効果的である。実施例2によるWindowサイズの調整は、特に実施例1による意図推定処理でなくても、Moving Windowを用いる手法であればどのようなものに対しても適用できる。また、実施例2では点検用語辞書を利用したが、文章内に存在する用語の種類によって最適なWindowサイズが決定できる場合には、どのような種類の辞書を利用しても同様の方法で調整を行うことができる。
正しく推定された意図区間では、同じ辞書に含まれる複数種類の用語が同一区間に存在することは稀である。そこで、このような場合にはその区画の重みを小さく設定することにより、推定精度を高めることができる。例えば、図23の点検項目に関する用語辞書に関しては、対象区画内に複数の辞書用語が含まれるかどうかを調べる。例えば、区間内に「コンセント」「フィルム」の両方の用語が含まれる場合は、複数の辞書用語が含まれるとして、重みを調整する。ここでは、数1による重みW(M,N)に対して、数6のように調整した重みW5(M,N)を利用すると効果的である。
作業員の端末は、作業支援UI3401による画面を提示する、例えばAR/MRグラス、スマートグラスなどの作業員が装着する端末を想定している。なお、これに限らず、スマートウォッチや液晶ディスプレイなどを利用して視覚的に情報を表示し、或いはヘッドフォンなどを利用して音声で情報を出力するなど、情報の提示手段は特に問わない。
また、本発明は、意図推定装置およびその方法として把握したが、発話処理装置およびその方法として把握することもできる。
702,1302:意図推定部 703,1303:意図区間推定部
704,1304:点検結果抽出部 705、1305:出力部
1311:WindowサイズDB 1312、3402:区間推定情報DB
1306:点検結果(暫定) 1307:点検結果(確定)
1601、2101、2201、2601:Windowサイズ調整部
1602、2102、2203、2603、3302:重み調整部
1603、2103、2703、3303:点検履歴DB
2202、2606、2706、3306:点検用語辞書DB
2704、3304:行動パターンDB
2705、3305:行動パターンモデル化部
3401:作業支援UI
Claims (22)
- 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、
分割された区間(分割区間)ごとに、前記意図推定結果と、該意図推定結果が確定しているか否かを表す情報とを対応させて記憶する記憶部と、を有し、
前記発話文合成部は、移動窓を用いて隣接する発話文をつなげて前記連結文を生成し、
前記意図区間推定部は、前記移動窓のサイズと、前記記憶部に記憶されている情報(区間推定情報)を参照して、動的計画法を用いて意図区間を推定し、
前記結果抽出部は、前記意図区間推定部による推定結果に応じて、該推定結果が確定かまたは暫定かを示す情報を出力する
ことを特徴とする意図推定装置。 - 請求項1記載の意図推定装置において、前記意図推定部は1つの連結文に対して1組の意図推定結果を出力する。
- 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有し、
前記意図区間推定部は、移動窓を用いて発話系列を意味単位で区間分割し、分割された区間(分割区間)に含まれる発話文の数に関する履歴に基づいて該移動窓のサイズを決定する
ことを特徴とする意図推定装置。 - 請求項3記載の意図推定装置において、前記分割区間に含まれる発話文の数が多い場合、前記移動窓のサイズを大きく設定する。
- 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有し、
前記意図区間推定部は、移動窓を用いて発話系列を意味単位で区間分割し、発話の時間間隔または単位時間中に発話していた時間の割合に関する履歴に基づいて該移動窓のサイズを決定する
ことを特徴とする意図推定装置。 - 請求項5記載の意図推定装置において、発話の時間間隔が大きい場合または単位時間中に発話していた時間の割合が低い場合に前記移動窓のサイズを小さく設定する。
- 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有し、
前記意図区間推定部は、移動窓を用いて発話系列を意味単位で区間分割し、分割された区間に対する意図推定結果に関する履歴に基づいて該移動窓のサイズを決定する
ことを特徴とする意図推定装置。 - 請求項7記載の意図推定装置において、特定の意図推定結果に関する履歴が多い場合に前記移動窓のサイズを大きく設定する。
- 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有し、
前記意図区間推定部は、各区画に与えられた評価値に基づいて発話系列を意味単位で区間分割し、分割された区間に対する意図推定結果に関する履歴に基づいて該評価値の重みを変化させる
ことを特徴とする意図推定装置。 - 請求項9記載の意図推定装置において、前記評価値の高い区画(または低い区画)が分割区間として選択される可能性が高い場合、履歴に存在しない意図推定結果が得られる区画に対する該評価値を高く(または低く)設定する。
- 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有し、
前記意図区間推定部は、各区画に与えられた評価値に基づいて発話系列を意味単位で区間分割し、発話時刻に基づいて発話文をクラスタリングした結果、該結果に基づいて該評価値の重みを変化させる
ことを特徴とする意図推定装置。 - 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有し、
前記意図区間推定部は、各区画に与えられた評価値に基づいて発話系列を意味単位で区間分割し、該評価値の高い区画(または低い区画)が分割区間として選択される可能性が高い場合、区画内の発話間隔が小さい場合に該評価値を高く(または低く)するように重みを設定する
ことを特徴とする意図推定装置。 - 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有し、
前記意図区間推定部は、移動窓を用いて発話系列を意味単位で区間分割し、推定結果に関わる用語を集めた辞書に基づいて該移動窓のサイズを決定する
ことを特徴とする意図推定装置。 - 請求項13記載の意図推定装置において、前記意図区間推定部は、辞書用語が含まれる文を評価する際に前記移動窓のサイズを大きく設定する。
- 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有し、
前記意図区間推定部は、各区画に与えられた評価値に基づいて発話系列を意味単位で区間分割し、推定結果に関わる用語を集めた辞書に基づいて該評価値の重みを変化させる
ことを特徴とする意図推定装置。 - 請求項15記載の意図推定装置において、前記意図区間推定部は、前記評価値の高い区画(または低い区画)が分割区間として選択される可能性が高い場合、辞書用語が共起している区間または同一用語が複数存在している区画に対する該評価値を低く(または高く)設定する。
- 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有し、
前記意図区間推定部は、各区画に与えられた評価値に基づいて発話系列を意味単位で区間分割し、意図推定結果の出力順序に関する履歴に基づいて該評価値の重みを変化させる
ことを特徴とする意図推定装置。 - 請求項17記載の意図推定装置において、前記評価値の高い区画(または低い区画)が分割区間として選択される可能性が高く、かつ、対応する意図推定結果が現在の順序で出力される確率が高い場合に、対象区画に対する該評価値を高く(または低く)設定する。
- 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有し、
前記意図区間推定部は、各区画に与えられた評価値に基づいて発話系列を意味単位で区間分割し、分割された区間における発話時間に関する履歴に基づいて該評価値の重みを変化させる
ことを特徴とする意図推定装置。 - 請求項19記載の意図推定装置において、前記評価値の高い区画が分割区間として選択される可能性が高く、かつ、発話時間が履歴よりも短い(または長い)場合に、対象区画に対する該評価値を高く設定する。
- 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有し、
前記意図区間推定部は、移動窓を用いて発話系列を意味単位で区間分割し、意図推定結果の出力順序と、それぞれの区間における発話時間に関する履歴に基づいて該移動窓のサイズを決定し、かつ
前記意図区間推定部は、現在の順序における履歴中の発話時間が長い場合に、前記移動窓のサイズを大きく設定する
ことを特徴とする意図推定装置。 - 入力された発話系列に対し、隣接する発話文をつなげて連結文を生成する発話文合成部と、
前記発話文合成部により生成された前記連結文に対して意図推定を行い、意図推定結果とその尤度を出力する意図推定部と、
前記尤度に基づいて発話系列を意味単位で区間分割する意図区間推定部と、
分割された区間ごとに前記意図推定結果を出力する結果抽出部と、を有し、
前記結果抽出部は、前記意図推定結果を暫定結果と確定結果を分けて出力し、
ユーザが有する端末に該意図推定結果をリアルタイムで提示し、ユーザの操作により該端末から該暫定結果または該確定結果に対して修正の入力を行うことができるユーザインタフェースを有する
ことを特徴とする意図推定装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020170610A JP7565742B2 (ja) | 2020-10-08 | 2020-10-08 | 意図推定装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020170610A JP7565742B2 (ja) | 2020-10-08 | 2020-10-08 | 意図推定装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022062532A JP2022062532A (ja) | 2022-04-20 |
| JP7565742B2 true JP7565742B2 (ja) | 2024-10-11 |
Family
ID=81211009
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020170610A Active JP7565742B2 (ja) | 2020-10-08 | 2020-10-08 | 意図推定装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7565742B2 (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000200273A (ja) | 1998-11-04 | 2000-07-18 | Atr Interpreting Telecommunications Res Lab | 発話意図認識装置 |
| JP2007241902A (ja) | 2006-03-10 | 2007-09-20 | Univ Of Tsukuba | テキストデータの分割システム及びテキストデータの分割及び階層化方法 |
| WO2014083945A1 (ja) | 2012-11-30 | 2014-06-05 | 三菱電機株式会社 | 意図推定装置および意図推定方法 |
-
2020
- 2020-10-08 JP JP2020170610A patent/JP7565742B2/ja active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000200273A (ja) | 1998-11-04 | 2000-07-18 | Atr Interpreting Telecommunications Res Lab | 発話意図認識装置 |
| JP2007241902A (ja) | 2006-03-10 | 2007-09-20 | Univ Of Tsukuba | テキストデータの分割システム及びテキストデータの分割及び階層化方法 |
| WO2014083945A1 (ja) | 2012-11-30 | 2014-06-05 | 三菱電機株式会社 | 意図推定装置および意図推定方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022062532A (ja) | 2022-04-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20240038218A1 (en) | Speech model personalization via ambient context harvesting | |
| CN113987179B (zh) | 基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质 | |
| US10832667B2 (en) | Spoken dialogue system, a spoken dialogue method and a method of adapting a spoken dialogue system | |
| Sadoughi et al. | Speech-driven expressive talking lips with conditional sequential generative adversarial networks | |
| CN111966800B (zh) | 情感对话生成方法、装置及情感对话模型训练方法、装置 | |
| Nicholson et al. | Emotion recognition in speech using neural networks | |
| US9058811B2 (en) | Speech synthesis with fuzzy heteronym prediction using decision trees | |
| López-Espejo et al. | A novel loss function and training strategy for noise-robust keyword spotting | |
| WO2020211820A1 (zh) | 语音情感识别方法和装置 | |
| CN114254096B (zh) | 一种基于交互机器人对话的多模态情感预测方法及系统 | |
| Gupta et al. | Speech emotion recognition using svm with thresholding fusion | |
| WO2021229643A1 (ja) | 音声信号変換モデル学習装置、音声信号変換装置、音声信号変換モデル学習方法及びプログラム | |
| JP7170594B2 (ja) | 同一事象に対して時系列に発生した異なるメディアデータを統合した学習モデルを構築するプログラム、装置及び方法 | |
| US12308022B2 (en) | Apparatus, method, and program for utilizing language model | |
| JP7565742B2 (ja) | 意図推定装置 | |
| GB2573213A (en) | A spoken dialogue system, a spoken dialogue method and a method of adapting a spoken dialogue system | |
| JPH064097A (ja) | 話者認識方法 | |
| JP6997046B2 (ja) | アノテーション支援装置 | |
| Patel et al. | Google duplex-a big leap in the evolution of artificial intelligence | |
| Xie et al. | Speaker and style disentanglement of speech based on contrastive predictive coding supported factorized variational autoencoder | |
| KR102408638B1 (ko) | 녹음의 품질을 평가하는 방법 및 시스템 | |
| JP2982689B2 (ja) | 情報量基準を用いた標準パターン作成方式 | |
| Wu et al. | Emotional communication robot based on 3d face model and ASR technology | |
| JPH08248988A (ja) | 音声認識方法 | |
| CN113593524A (zh) | 口音识别声学模型训练、口音识别方法、装置和存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230424 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240304 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240507 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240624 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240917 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241001 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7565742 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |















