JPH0863186A - 音声情報の処理方法及びその装置 - Google Patents
音声情報の処理方法及びその装置Info
- Publication number
- JPH0863186A JPH0863186A JP6192637A JP19263794A JPH0863186A JP H0863186 A JPH0863186 A JP H0863186A JP 6192637 A JP6192637 A JP 6192637A JP 19263794 A JP19263794 A JP 19263794A JP H0863186 A JPH0863186 A JP H0863186A
- Authority
- JP
- Japan
- Prior art keywords
- voice information
- pattern
- search
- registered
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
なよう音声情報について検索に有用な各種の性質を抽出
し、検索マークを付しておく。 【構成】 マイク等で構成された音声情報入力部1から
解析部2に音声情報が入力されると、解析部2はパター
ン辞書3から登録されたパターンを読出してこれを検索
し、入力された音声情報の性質と対応するパターンが検
索されると、その部分に検索用のマークを付して記憶
し、音声情報の検索時に音声情報と共に検索用のマーク
を表示部4へ表示させる。
Description
的で行われる検索に有用な性質を抽出し、抽出した各部
分に検索用のマークを付して記憶しておき、検索に際し
て音声情報をその各部分に付した検索用のマークと共に
表示部に視認可能に表示するようにした音声情報の処理
方法及びその装置に関する。
特定の話者の声、また会場が湧いている部分、講演の議
題部分、又はまとめ部分等を知るためには、音声情報に
ついてこれらの検索が可能なよう検索に有用な各種の性
質について予めこれを抽出しておくことが必要となる。
報の処理技術としては、特徴量の一つである音量を音声
波形に基づいて計算し、計算した音量データについて各
所定時間長の区間、所謂フレームについてそれが有音区
間か、無音区間かを判別し、この判別結果から所定数以
上の無音となっているフレームが連続している領域を語
区間ポーズとして抽出する。そして検索に際しては言語
的意味の単位を元にした音量データを表示部に表示しつ
つ、検索する方式が知られている(特開昭63−259
686号公報)。
来方法から検出される言語的意味の単位は音声情報全体
に比較して小さ過ぎるため、この単位を元に前記した如
き、例えば特定話者の声等を検索することは難しく、ま
た全ての語区間ポーズに重要な意味があるとは限らない
にもかかわらず、音量のみを単純に特徴量として抽出し
ているため検索の手掛かりが少なく、しかも、不必要な
検索対象が多くなって、検索に時間を要し、特に音声情
報が長時間にわたる場合にこの欠点が顕著となる。
性質を示すパターンを予め登録しておき、入力された音
声情報をこの登録されたパターンに基づいて解析し、登
録されたパターンと対応するパターンを抽出し、音声情
報全体から検索に有効な各種の性質を抽出することで各
種目的の検索に対応可能とした音声情報の処理方法及び
その装置を提供することを目的とする。
時間軸をとって入力された音声情報及び検索用のマーク
を付して表示させることで、入力された音声情報及び検
索用のマークを視認しつつ、効率的な検索を行うことを
可能とすることにある。本発明の更に他の目的は1又は
複数の話者の音高に関する登録したパターンを備えたパ
ターン辞書を用いることで、各話者夫々の音声情報の検
索を可能とすることにある。
別に登録されたパターンを夫々有する複数のパターン辞
書を備えておき、切換え手段にて入力された音声情報夫
々の分野に応じてパターン辞書を切換えることで、分野
別に専用のパターン辞書を用いて音声情報の認識の誤り
を低減し、正確な抽出を可能とするにある。
す原理図に基づき説明する。図1は本発明に係る音声情
報の処理方法及びその装置の原理を示す原理図であり、
図中1は音声情報入力部、2は解析部、3はパターン辞
書、4は表示部を示している。音声情報入力部1から入
力されたアナログデータである音声情報は、ディジタル
データに変換されて解析部2へ入力される。
してのデータベースであり、検索に有効な音声情報の性
質を示すパターンが予め登録されている。パターン辞書
3には複数の話者夫々の音声情報の性質を示すパター
ン、例えば音高に関するパターンを登録し、各話者夫々
の音声情報を抽出することも可能となっている。
報、打合せの音声情報、インタビューの音声情報の如く
異なっている場合には、音声情報の性質を示すパターン
も夫々の分野に対応可能なようこれら各分野別に登録し
ておき、例えば講演会の音声情報の処理に際しては切換
えスイッチにて講演会用のパターン辞書に切換え、分野
別夫々の専用のパターン辞書を用いて音声情報の性質の
抽出を行い得るようにしてある。
パターン辞書3から登録されたパターンを読み出し、入
力された音声情報と対応するパターンを検索する。解析
部2は検索の結果、入力された音声情報と対応する登録
されたパターンがあると、音声情報におけるその対応す
る部分に検索用のマークを付して図示しない記憶装置に
記憶させておき、検索に際して表示部4に時間軸をとっ
て音声情報、例えば音声波形を検索用のマークと共に表
示する。
性質を解析部にてパターン辞書から読出して登録された
パターンに基づいて解析し、登録してあるパターンと対
応する音声情報を抽出し、対応する音声情報の各部に検
索用のマークを付して記憶しておくことで、各種目的の
検索に際して音声情報の性質から広範囲の検索対象を確
実に検索することが可能となる。
各部に付した検索用のマークを時間軸をとって表示部に
表示させることで操作者が視認しつつ検索を行うことが
出来て、効率的な検索が可能となる。
ら音声情報が入力されると解析部はパターン辞書から読
出したパターンに基づいて音声情報を解析し、登録され
たパターンと対応する部分を抽出し、ここに検索用のマ
ークを付して記憶しておくことで、音声情報をパターン
として検索することが可能となり、音声情報の特徴検索
を効果的に行ない得る。
音声情報の性質、特に音高に関するパターンを登録して
おくことで、必要に応じて各話者夫々の音声情報を個別
に検索することが可能となる。第5の発明にあっては音
声情報の分野別にパターンを個別に登録しておき、各分
野夫々の専用のパターン辞書を用いることで、無駄な検
索量を縮小出来、また誤検索を低減し得る。
具体的に説明する。図2は本発明に係る音声情報の処理
方法及びその装置の構成を示す模式図であり、図中1は
マイク等で構成された音声情報入力部、2はマイクロコ
ンピュータ等で構成されたCPUを含む解析部、3はハ
ードディスク等に格納されたパターン辞書、4は表示
部、5はA/D(アナログ・ディジタル)変換器を示し
ている。
情報はA/D変換器5にてアナログ情報からディジタル
情報に変換されて解析部2へ入力される。解析部2はパ
ターン辞書3から読み出した予め登録されたパターンに
基づき入力された音声情報を解析する。具体的には入力
された音声情報を登録されたパターンと比較し、入力さ
れた音声情報の各部分と対応する登録されたパターンを
検索する。入力された音声情報と対応する登録されたパ
ターンが存在する場合にはこの登録されたパターンと対
応する部分に登録されたパターン夫々に応じた検索用の
マークを付し、その検索結果を図示しない記憶装置へ記
憶させておき、検索時に音声情報及びこれに付した検索
用のマークを表示部4へ時間軸をとって表示させるよう
になっている。
ては音声情報の検索に有用な性質を示すパターンであれ
ばよく、音声波形の周期,振幅、その他音声情報のうち
の時間的に最初の部分、最後の部分等である。表1はそ
の一例を示している。
て、例えば音声情報の波形の振幅が相対的に小さい、波
形の振幅が相対的に大きい、波形の周期が相対的に短
い、波形の周期が相対的に長い…等であり、これら各項
目夫々には音量が小さい、音量が大きい、音高が高い、
音高が低いの意味がある。なお表1中における項目であ
る振幅の大,小夫々の範囲、周期の長,短の範囲、また
音声情報の最初の方,最後の方の範囲等は抽出すべき性
質に応じて適宜定めればよい。
程を示すフローチャートである。解析部2に音声情報の
入力があると、解析部2はパターン辞書3の項目を読み
出してこれを所定の順序に従って検索し (ステップS
1)、入力された音声情報の性質と対応する登録された
パターン(同じ又は近似した登録されたパターン)が存
在するか否かを判断し (ステップS2)、対応する登録
されたパターンが存在しない場合にはステップS4へ進
み、また対応する登録されたパターンが有る場合にはパ
ターン辞書3における項目の意味を調べ (ステップS
2)、ステップS4へ進む。
パターン辞書3における検索すべき最後の項目か否かを
判断し、最後の項目でない場合にはステップS1へ戻
り、また最後の項目である場合にはそれまでに検索した
項目の意味を解析し、検索用のマークを付し、その後に
おける音声情報の検索に際しては表示部4に時間軸をと
って音声情報,及び検索用のマークを視認可能に表示さ
せる。
索パターンの説明図であり、横軸に時間を、縦軸に音量
をとって音量の時間的推移を示す波形11を表示すると
共に、これに音高が高い部分、音高が低い部分、本人の
発言部分、その他、音声情報の冒頭部分、音声情報の末
尾部分等、登録されたパターンと対応する部分毎に、検
索用のマーク12が色別(又はマーク等)で識別表示が
なされている。検索用のマーク12の表示態様について
は特に限定するものではないが、例えば図4にハッチン
グを付して示す如く、色の濃淡、又は明暗を付して表
す。図4にあっては音高い部分は色が薄く、本人の発音
部分,音声が高い部分がこの順序で色が濃く表示されて
いる。
の各部について、パターン辞書(3)に登録されたパタ
ーンと対応する部分に検索用のマーク12を付して記憶
しておくこととしているから、登録されたパターンに基
づき様々な検索対象に対応することが可能となる。
成を示す模式図であり、図中1はマイク等で構成された
音声情報入力部、2はCPU等を備える解析部、3a,
3b,3cはパターン辞書、4は表示部、5はA/D変
換器を示している。この実施例2ではパターン辞書3を
音声情報の分野別、例えば講演会用パターン辞書3a、
打合せ用パターン辞書3b、インタビュー用パターン辞
書3c等、複数備えており、各パターン辞書3には夫々
講演会,打合せ,インタビューの音声情報の検索に用い
られる音声情報の性質を示すパターンが分野別に登録さ
れている。音声情報の入力に際して、操作者がパターン
辞書3a,3b,3cのいずれかを選定する。また夫々
に応じた解析部2のモード設定はソフトウェアスイッチ
6にて自動的に選定される。
いるパターンの項目の例を表2に示す。
れているパターンの項目の例を表3に示す。
登録されているパターンの項目の例を表4に示す。
であり、対応する部分に同じ番号を付して説明を省略す
る。
ン辞書3aに登録されたパターンと対応する部分を抽出
し、音量の波形を示す波形11と共に夫々の部分に検索
用のマークを付して表示部4に表示させた状態を示す説
明図、図7は打合せの音声情報について、パターン辞書
3bに登録されたパターンと対応する部分を抽出し、音
量の推移を示す波形11と共に夫々の部分に検索用のマ
ーク12を付して表示部4に表示させた状態を示す説明
図、図8はインタビューの音声情報についてパターン辞
書3cに登録されたパターンと対応する部分を抽出し、
夫々の部分に検索用のマーク12を付して表示部4に表
示させた状態を示す説明図である。
フトウェアスイッチ6にて講演会用のパターン辞書3a
が選択されていることを示す表示13と共に、横軸に時
間(時)を、また縦軸に音量をとって、音量の時間的推
移を示す波形11が矢印で示した検索用のマーク12と
共に表示されている。図6中には話題の区切れ部分を示
す矢印、会場が湧いている部分を示す矢印の他、講演の
まとめが話されている可能性の大きい部分である「まと
め」の文字、講演者の交替が行われた可能性のある部分
に「講演者の交替」の文字等が表示されている。
ェアスイッチ6にて打合せ用のパターン辞書3bが選択
されたことを示す表示13と共に、横軸に時間(時)
を、また縦軸に音量をとって、音量の時間的推移を示す
波形11が表示され本人の発言部分が抽出されてここに
検索用のマーク12が付されている。他に、打合せの連
絡事項,まとめの音声情報が存在している可能性がある
部分に夫々「連絡事項」,「まとめ」の文字が表示さ
れ、また議論が滞っていると考えられる部分,議論が盛
り上がっていると考えられる部分については矢印による
検索用のマーク12を付して表示してある。
ェアスイッチにてインタビュー用のパターン辞書3cが
選択されたことを示す表示13と共に、横軸に時間
(時)を、また縦軸に音量をとって、音量の時間的推移
を示す波形11及び質問者の質問部分、応答者の応対部
分が抽出され、夫々に色別の検索用のマーク12が付さ
れている。
演会用、打合せ用、インタビュー用等分野別の各パター
ン辞書3a,3b,3cを持つハードディスクを用意
し、パターン抽出に際して使用者がその選択を行い、ま
たパターン辞書3a,3b,3cの切替えはソフトウェ
アスイッチ6によって行うことで検索対象項目が分野別
に制限され、無駄な検索が低減され、検索速度が向上す
ると共に、誤認識も低減される。
情報の性質をパターンとして予めパターン辞書に登録し
ておき、音声情報が解析部に入力されると解析部がパタ
ーン辞書からこれに登録されているパターンを読み出
し、音声情報の性質と対応する登録されたパターンの有
無を検索し、対応する登録されたパターンが存在する部
分には検索用のマークを付して記憶しておくことで、検
索に際して音声情報及び検索用のマークの表示を容易に
行い得る。
音声情報,検索用のマークを視認しつつ時間軸を基に音
声情報の全体から検索することが可能となり、検索時間
が短縮出来、検索効率の向上も図れる。
ーン辞書の登録されたパターンと対応する部分に検索用
のマークを付して音声情報の性質を抽出しておくこと
で、正確、且つ迅速な音声情報の検索が可能となる。
音高に関する性質をパターンとして登録しておくこと
で、音声情報から各話者の音声情報を個別に検索するこ
とが可能となる。
声情報夫々の部分に対応して複数個備えるから解析部で
の音声情報とパターン辞書のパターンとの比較に際し、
無駄な対比が大幅に低減され、それだけ抽出ミスも低減
し得る。
る。
用いて抽出を行ったときの表示部の表示例を示す説明図
である。
用いて抽出を行ったときの表示部の表示例を示す説明図
である。
ターン辞書を用いて抽出を湖なったときの表示部の表示
例を示す説明図である。
Claims (5)
- 【請求項1】 音声情報入力部から入力された音声情報
を解析し、検索に有用な性質を抽出する音声情報の処理
方法において、予め検索に有用な音声情報の性質を示す
パターンをパターン辞書に登録しておき、前記音声情報
入力部から音声情報が入力されると、前記パターン辞書
から登録されたパターンを読み出し、入力された音声情
報から前記登録されたパターンと対応する部分を抽出
し、抽出した音声情報の各部分に検索のためのマークを
付して音声情報と共に記憶しておくことを特徴とする音
声情報の処理方法。 - 【請求項2】 音声情報の検索に際して、前記音声情報
及びこれに付した検索用のマークを表示部に時間軸をと
って視認可能に表示させることを特徴とする請求項1記
載の音声情報の処理方法。 - 【請求項3】 音声情報入力部と、該音声情報入力部か
ら入力された音声情報について検索に有用な性質を抽出
する手段とを備えた音声情報の処理装置において、音声
情報の検索に有用な性質を示すパターンが予め登録され
ているパターン辞書と、前記パターン辞書から読み出し
た登録されたパターンに基づいて前記音声情報入力部か
ら入力された音声情報を解析し、音声情報から登録され
たパターンと対応する部分を抽出し、登録されたパター
ンと対応する音声情報の各部分に検索用のマークを付し
てこれを記憶する解析部とを具備することを特徴とする
音声情報の処理装置。 - 【請求項4】 前記パターン辞書は1又は複数の話者夫
々の音声情報のうち音高に関しての登録されたパターン
を備えることを特徴とする請求項3記載の音声情報の処
理装置。 - 【請求項5】 前記パターン辞書は音声情報の分野別の
登録されたパターンを夫々有する複数のパターン辞書で
構成され、また前記複数のパターン辞書を、入力された
音声情報の分野夫々に対応して切り換える切換え手段を
備えることを特徴とする請求項3又は4記載の音声情報
の処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP19263794A JP3664499B2 (ja) | 1994-08-16 | 1994-08-16 | 音声情報の処理方法及びその装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP19263794A JP3664499B2 (ja) | 1994-08-16 | 1994-08-16 | 音声情報の処理方法及びその装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0863186A true JPH0863186A (ja) | 1996-03-08 |
| JP3664499B2 JP3664499B2 (ja) | 2005-06-29 |
Family
ID=16294571
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP19263794A Expired - Fee Related JP3664499B2 (ja) | 1994-08-16 | 1994-08-16 | 音声情報の処理方法及びその装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3664499B2 (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002297187A (ja) * | 2001-03-30 | 2002-10-11 | Konami Computer Entertainment Yokyo Inc | 音声編集装置及び音声編集プログラム |
| JP2008111866A (ja) * | 2006-10-27 | 2008-05-15 | Sanyo Electric Co Ltd | 音声分類装置及びコンピュータプログラム |
| JP2008139654A (ja) * | 2006-12-04 | 2008-06-19 | Nec Corp | 対話状況区切り推定方法、対話状況推定方法、対話状況推定システムおよび対話状況推定プログラム |
| US8165306B2 (en) | 1999-08-26 | 2012-04-24 | Sony Corporation | Information retrieving method, information retrieving device, information storing method and information storage device |
| JP2012090337A (ja) * | 2012-01-13 | 2012-05-10 | Toshiba Corp | 電子機器および表示処理方法 |
| US8935169B2 (en) | 2007-09-27 | 2015-01-13 | Kabushiki Kaisha Toshiba | Electronic apparatus and display process |
| JP2016157225A (ja) * | 2015-02-24 | 2016-09-01 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
-
1994
- 1994-08-16 JP JP19263794A patent/JP3664499B2/ja not_active Expired - Fee Related
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8165306B2 (en) | 1999-08-26 | 2012-04-24 | Sony Corporation | Information retrieving method, information retrieving device, information storing method and information storage device |
| JP2002297187A (ja) * | 2001-03-30 | 2002-10-11 | Konami Computer Entertainment Yokyo Inc | 音声編集装置及び音声編集プログラム |
| JP2008111866A (ja) * | 2006-10-27 | 2008-05-15 | Sanyo Electric Co Ltd | 音声分類装置及びコンピュータプログラム |
| JP2008139654A (ja) * | 2006-12-04 | 2008-06-19 | Nec Corp | 対話状況区切り推定方法、対話状況推定方法、対話状況推定システムおよび対話状況推定プログラム |
| US8935169B2 (en) | 2007-09-27 | 2015-01-13 | Kabushiki Kaisha Toshiba | Electronic apparatus and display process |
| JP2012090337A (ja) * | 2012-01-13 | 2012-05-10 | Toshiba Corp | 電子機器および表示処理方法 |
| JP2016157225A (ja) * | 2015-02-24 | 2016-09-01 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
| US9734871B2 (en) | 2015-02-24 | 2017-08-15 | Casio Computer Co., Ltd. | Voice retrieval apparatus, voice retrieval method, and non-transitory recording medium |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3664499B2 (ja) | 2005-06-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN112804400B (zh) | 客服呼叫语音质检方法、装置、电子设备及存储介质 | |
| US9014363B2 (en) | System and method for automatically generating adaptive interaction logs from customer interaction text | |
| US6219407B1 (en) | Apparatus and method for improved digit recognition and caller identification in telephone mail messaging | |
| CN107274916B (zh) | 基于声纹信息对音频/视频文件进行操作的方法及装置 | |
| US6434520B1 (en) | System and method for indexing and querying audio archives | |
| US6839667B2 (en) | Method of speech recognition by presenting N-best word candidates | |
| US20180197548A1 (en) | System and method for diarization of speech, automated generation of transcripts, and automatic information extraction | |
| US8542802B2 (en) | System and method for three-way call detection | |
| US20190080687A1 (en) | Learning-type interactive device | |
| CN109271585B (zh) | 一种信息推送方法及家教设备 | |
| JPWO2005069171A1 (ja) | 文書対応付け装置、および文書対応付け方法 | |
| CN110198381B (zh) | 一种识别ai来电的方法、装置、语音助手、终端、计算机设备及计算机可读存储介质 | |
| CN113838460A (zh) | 视频语音识别方法、装置、设备和存储介质 | |
| CN117708290A (zh) | 问答方法、装置、电子设备和存储介质 | |
| CN113691382A (zh) | 会议记录方法、装置、计算机设备及介质 | |
| JP3437617B2 (ja) | 時系列データ記録再生装置 | |
| JPH08286693A (ja) | 情報処理装置 | |
| JPH0863186A (ja) | 音声情報の処理方法及びその装置 | |
| JP5258056B2 (ja) | 質問文候補提示装置 | |
| CN116127011A (zh) | 意图识别方法、装置、电子设备及存储介质 | |
| CN111081092B (zh) | 一种学习内容输出方法及学习设备 | |
| CN118446221A (zh) | 一种基于深度学习的智能写作辅助系统及方法 | |
| JP3980988B2 (ja) | 音声発生区間検索方法,音声発生区間検索装置,並びにそのプログラムおよびそのプログラムの記録媒体 | |
| CN116996620A (zh) | 一种外呼拦截的处理方法、装置及电子设备 | |
| JP2000216943A (ja) | 機械音処理装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20030610 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050301 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050329 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080408 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090408 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090408 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100408 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110408 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110408 Year of fee payment: 6 |
|
| LAPS | Cancellation because of no payment of annual fees |