JP5053285B2 - オーディオ装置品質の決定 - Google Patents

オーディオ装置品質の決定 Download PDF

Info

Publication number
JP5053285B2
JP5053285B2 JP2008541199A JP2008541199A JP5053285B2 JP 5053285 B2 JP5053285 B2 JP 5053285B2 JP 2008541199 A JP2008541199 A JP 2008541199A JP 2008541199 A JP2008541199 A JP 2008541199A JP 5053285 B2 JP5053285 B2 JP 5053285B2
Authority
JP
Japan
Prior art keywords
audio
sample
captured
signal
device configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008541199A
Other languages
English (en)
Other versions
JP2009518662A (ja
JP2009518662A5 (ja
Inventor
ダブリュ.クランツ アントン
エル.ルーニー ウィリアム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2009518662A publication Critical patent/JP2009518662A/ja
Publication of JP2009518662A5 publication Critical patent/JP2009518662A5/ja
Application granted granted Critical
Publication of JP5053285B2 publication Critical patent/JP5053285B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephonic Communication Services (AREA)
  • Stereophonic System (AREA)

Description

本発明は、オーディオ装置の品質の決定に関する。
ネットワーク接続されたコンピューティング装置を使用するリアルタイム通信は、ますます普及しつつある。これは、例えばVOIP(voice over Internet protocol)電話、オーディオ使用可能チャットプログラム(audio-enabled chat program)、ウェブテレビ会議、ならびに、オーディオおよびビデオストリーミングの形をとることがある。最高品質のオーディオおよび/またはビデオ体験を提供することは、リアルタイム通信オーディオクライアントを提供する多くの企業間の重要な差別化要因となり得る。多くの場合、ユーザは、通信セッションに使用することができる複数のオーディオ装置を有することがある。リアルタイムオーディオクライアントは典型的に、ユーザが、電話をかけるために使用するオーディオ装置を選択して構成することを必要とする。しかし、オーディオクライアントは、選択されたオーディオ装置により高品質の通信体験が得られることを保証せず、選択された装置が最良の構成オプションを提供するかどうかさえも示さない。
本明細書のこの背景技術の欄に含まれる情報は、技術的参考の目的で含まれるものにすぎず、本発明の範囲を定める対象と見なされるべきでない。
本発明は、コンピュータシステム内の特定のオーディオ出力または入力装置、あるいはそれらの組合せの品質を自動検出することを対象とする。
本明細書に記載され、特許請求の範囲に記載される技術は、コンピュータシステム内の特定のオーディオ出力または入力装置、あるいはそれらの組合せの品質を自動検出することを対象とする。コンピューティング装置のメモリに格納されたモデルサンプルオーディオファイルは、コンピュータシステムに接続されたスピーカ出力装置を通じて再生される。それにより生成された音声(sound)は、コンピュータシステムに接続されたマイクロホン入力装置によってキャプチャされ、変換されて、コンピュータシステムよって記録して処理するためのキャプチャされたオーディオ信号が作成される。キャプチャされたオーディオ信号は、キャプチャされたオーディオ信号の精度を決定するために、サンプルオーディオ信号と相関される。
キャプチャされたオーディオ信号のサンプルオーディオ信号との相関のためのアルゴリズムは、例えば、キャプチャされたオーディオ信号をサンプルオーディオ信号と比較する場合に、1つまたは複数の以下の要因を考慮することができる。すなわち、比較エネルギーレベルまたは強度(intensity)、存在する周波数の範囲、ひずみ(distortion)のレベル、および信号とノイズの比率を考慮することができる。他のオーディオ品質の要因を、追加的にまたは代替的に使用して、サンプルオーディオ信号とキャプチャされたオーディオ信号との間の比較オーディオ品質(comparative audio quality)を算出することができる。装置品質スコアを計算して、異なるオーディオ装置構成間の相対的な利点についての簡単な表示をユーザに提供することができる。装置の潜在的な組合せのすべてを自動的に比較し、最も高い装置品質スコアを有する構成をアクティブにした後に、オーディオ入力装置と出力装置の最適なペアを、コンピュータシステムによって自動的に選択することができる。
いくつかの実装形態では、生成物は、コンピュータプログラム生成物として提供される。コンピュータプログラム生成物の一実装形態は、コンピュータシステムで読み取り可能でありコンピュータプログラムを符号化する、コンピュータプログラム記憶媒体を提供する。コンピュータプログラム生成物の別の実装形態を、コンピュータシステムによって搬送波で具現化されコンピュータプログラムを符号化する、コンピュータデータ信号で提供することができる。この要約は、以下の詳細な説明でさらに説明される概念の選択を簡略化した形式で紹介するために提供される。この要約は、特許請求の範囲に記載される対象の主要な特徴または本質的な特徴を識別することを意図されておらず、特許請求の範囲に記載される対象の範囲を限定するように用いられることも意図されていない。特許請求の範囲に記載された対象の他の特徴、詳細、利用性、および利点は、添付の図面でさらに示され、添付の特許請求の範囲で定義されるように、様々な実施形態および実装形態についての以下のより具体的な記載された詳細な説明から明らかになるであろう。
本明細書に記載される技術の一実装形態は、コンピュータシステムに関連するオーディオ装置構成の品質の自動的な決定を提供する。この技術は、リアルタイム通信セッションおよび他のオーディオ環境セッションを実施するコンピュータシステムのユーザに、このようなセッションを実施するために選択される装置が、最良のオーディオ品質構成を備えることを保証するのを助ける。例えば、パーソナルコンピュータシステムを使用して、例えばVOIP電話会議などの音声会議を実施するとき、通信セッションを実施するためには、例えばマイクロホンなどのオーディオ入力装置と、例えば1つまたは複数のスピーカなどのオーディオ出力装置の両方が必要である。選択されたマイクロホンおよびスピーカのいずれか、または両方が正しく構成されず、あるいは組み合わせてうまく機能しない場合、ユーザは、質の悪いオーディオ品質のために苛立たしい通信体験をすることがある。本明細書に記載されるシステムおよび方法は、通信セッション中のオーディオ体験の品質を最大にするために、コンピュータシステムのユーザに、オーディオ入力および出力装置の最適な構成に関する情報を提供する自動的な補助(automatic aid)として機能する。
コンピュータシステムのユーザは、通信セッションに使用することができる様々なオプションのオーディオ装置に直面することがある。例えば、コンピュータシステムは、組込みマイクロホン、組込みマイクロホンを有するディスプレイ、組込みマイクロホンを有するウェブカメラ、ハンドセットとスピーカフォンオプションを有するVOIP電話、マイクロホンとヘッドホンを有するヘッドセット、組込みスピーカを有するディスプレイ、外部スピーカ、およびスピーカを有する別個のホームオーディオシステムの接続の1つまたは複数のいずれかを有することができる。
例えば、図1は、様々なオーディオ周辺装置を備える例示的なパーソナルコンピュータシステム100を示す。典型的なパーソナルコンピュータシステム100は、コンピュータ102、ビデオモニタ104、キーボード106、コンピュータ102に接続されたマウス108を含むことができる。コンピュータ102は、音声生成用の組込みスピーカ118を有することができる。ビデオモニタ104は、一対のスピーカ110を備えることもできる。さらに、パーソナルコンピュータシステム100のユーザは、1組の外部スピーカ112をコンピュータ102に取り付けることもできる。パーソナルコンピュータシステム100は、インターネットテレビ会議を実施するためのビデオカメラとマイクロホンの組合せ114を含むこともできる。ユーザは、VOIPまたはインターネットテレビ会議に参加するために、イヤホンスピーカとマイクロホンを組み合わせるヘッドセット116を取り付けることもできる。
例示的なオーディオ構成では、コンピュータシステムは、所望のオーディオセッションに最良の装置構成を自動的に選択し、アクティブにすることができる。サンプルオーディオファイルを、コンピュータシステムに接続されたスピーカ装置を通して出力することができる。サンプルオーディオファイルを、コンピュータシステムに関連するメモリに格納することができ、またはネットワーク上でリモートコンピュータシステムからアクセスすることもできる。サンプルオーディオファイルを、アナログ信号に転換し、スピーカに送信することができる。あるいは、オーディオ信号を、命令セット(instruction set)に従って同時に生成することができる。スピーカがデジタルである場合、すなわちスピーカがアナログ/デジタル変換器を有する場合は、サンプルオーディオファイルをスピーカに直接送信することができる。スピーカは、大気中の音波(sound wave)を作成するためにアナログオーディオ信号を音響エネルギー(acoustic energy)に変換する。
サンプルオーディオファイルがスピーカによって再生されるのと同じ時間の間、マイクロホンによって受信される音声を記録するように、テストが実行される。サンプルオーディオファイルに対応する音声を含め、いずれの音波も、マイクロホンによってピックアップされ、同様にアナログオーディオ信号に変換される。アナログオーディオ信号は、コンピュータシステムによってデジタルデータフォーマットに変換される。あるいは、デジタルマイクロホンの場合は、音波を、コンピュータへの入力用のデジタル信号にすぐに変換することができる。
必要であれば、マイクロホンによってキャプチャされるオーディオデータ、およびサンプルオーディオファイルは、共通データフォーマットに変換される。次いで、キャプチャされた音声からのオーディオデータは、キャプチャされたオーディオデータの全体的な品質および精度を決定するために、モデルオーディオサンプルファイルからのオーディオデータと比較される。キャプチャされたオーディオデータのモデルオーディオサンプルとの相関のためのアルゴリズムは、例えば、比較エネルギーレベルまたは強度、存在する周波数の範囲、ひずみのレベル、および信号とノイズの比率を含むいくつかの要因を比較することができる。装置品質スコアを、これらの要因に基づいて計算し、オーディオ装置構成の品質についての単純な表示をユーザに提供することができる。
自動的に、潜在的な装置の組合せのすべてを比較し、最も高い装置品質スコアを有する構成をアクティブにした後に、オーディオ入力装置と出力装置の最適な対を、コンピュータシステムによって自動的に選択することができる。あるいは、コンピュータシステムに接続される例えばマイクロホンおよびスピーカなどのオーディオ装置の品質を決定し、ユーザに報告することができる。次いで、ユーザは、テストするためのオーディオ装置の別の構成を手動で選択し、最終的に、それぞれの品質スコアに基づいてオーディオセッションに最良の構成を選択することができる。
図2に、品質決定技術を実装するためのコンポーネントおよびモジュールを有する例示的なコンピュータシステム200を示す。2つの例示的な周辺装置、マイクロホン202およびスピーカ204が、コンピュータシステム200に接続されている。マイクロホン202を、オーディオキャプチャモジュール206への入力装置としてコンピュータシステム200に接続することができる。スピーカ204を、オーディオレンダモジュール208の出力装置としてコンピュータシステム200に接続することができる。
マイクロホン202は、コンピュータシステム200の内部のハードウェア装置、あるいは有線または無線接続を介してコンピュータシステム200に接続される外部装置とすることができる。同様に、スピーカ204は、コンピュータシステム200の内部のハードウェア装置、あるいは有線または無線接続を介してコンピュータシステム200に接続される外部装置とすることができる。スピーカ204は、単一のスピーカ、一対のスピーカ、または、例えば「サラウンドサウンド(surround sound)」構成内の複数のスピーカのシステムとすることができる。あるいは、マイクロホン202およびスピーカ204は、単一の装置、例えば電話ハンドセットまたはヘッドセットで組み合わせることができる。
図2に示されるように、自動の装置構成検出機能は、コンピュータシステム200のリソースと命令レベルとの組み合わせによって、例えば、破線210によって示されるようにコンピュータシステム200のカーネルとユーザモードの両方のリソースで実装される。他のオペレーティングシステムおよびコンピューティング環境では、このようなコンポーネントおよびモジュールを、他のレベルのソフトウェアアーキテクチャで制御することができる。カーネルは、プロセッサ、メモリ、および低レベルのハードウェアインタフェースを含むマシンのハードウェアリソースを管理し、他のソフトウェアコンポーネント、例えばユーザモードコンポーネントが、これらのリソースに、例えば装置ドライバ、メモリ管理ルーチン、スケジューラ、およびシステムコールを通じてアクセスすることができる方法を制御する。
オーディオキャプチャモジュール206とオーディオレンダリングモジュール208の両方とも、カーネルに存在する。オーディオキャプチャモジュール206は、マイクロホン202によって音波から変換されるアナログオーディオ信号を、コンピュータシステム200でさらに処理するために、デジタルデータ信号、例えばPCM(pulse code modulated)、CDR(compact disc raw)データ、または他の共通データフォーマットに変換する。PCMデータは、様々な品質のもの、例えばPCM 16、PCM 32またはPCM 48とすることができる。オーディオレンダリングモジュール208は、例えばWAV(waveform audio)、MPEG1、DSM(digital sound module)フォーマット、または他の共通データフォーマットのデジタルオーディオファイルを、スピーカ204による音響変換用のアナログオーディオ信号に変換する。
追加的な機能は、マイクロホン202およびオーディオキャプチャモジュール206によって受信されるオーディオデータ、ならびに他のデータに作用するソフトウェア処理ルーチンとしてユーザモードで実装される。品質検出モジュール212には、サンプルオーディオファイル214、信号プロセッサ216、信号相関/品質管理モジュール218が含まれる。サンプルオーディオファイル214に、品質検出モジュール212によって実行される操作によってアクセスすることができ、サンプルオーディオファイル214を、オーディオレンダリングモジュール208および信号プロセッサ216のいずれかまたは両方に送信することができる。サンプルオーディオファイル214は、スピーカ204およびマイクロホン202の品質構成テストを実施するために、スピーカ204への出力用のモデルオーディオサンプルとしてオーディオレンダリングモジュール208に送信される。
サンプルオーディオファイル214は、生成された音声の属性に関して選択されるデジタルオーディオファイル、例えばWAVファイルとすることができる。例えば、サンプルオーディオファイル214は、マイクロホン202と通して検出するのが容易な特定の周波数の範囲、またはスピーカ204とマイクロホン202の組合せの周波数応答(frequency response)についての良好な表示を提供する特定の周波数範囲を含む音声を生成することができる。ユーザが聞くのに心地よい音声、例えば音楽シーケンス(musical sequence)を生成するように、またはユーザにとって価値のある情報、例えば構成命令または通知(advertisement)を提供するように、サンプルオーディオファイル214をさらに選択することができる。
マイクロホン202から受信されるオーディオ信号も、オーディオキャプチャモジュール206から信号プロセッサ216に送信される。オーディオ信号の比較の目的でオーディオ信号を共通データフォーマットに変換するために、オーディオキャプチャモジュール206からのオーディオ信号、およびサンプルオーディオファイル214のいずれかまたは両方を信号プロセッサ216によって処理することができる。オーディオ信号(および他のデジタルデータ信号)を任意のフォーマットに変換して、格納することができる。例えば、オーディオキャプチャモジュール206からのオーディオ信号がPCMフォーマットであり、オーディオサンプルファイル214がWAVフォーマットである場合、オーディオサンプルファイル214を、信号プロセッサ216によってPCMフォーマットに変換することができる。あるいは、オーディオキャプチャモジュール206からのオーディオ信号を、信号プロセッサによってWAVフォーマットに変換することができる。さらに別の場合では、オーディオキャプチャモジュール206からのオーディオ信号とオーディオサンプルファイル214の両方を、第3のフォーマット、例えばオーディオ交換ファイルフォーマット(AIFF:audio interchange file format)に、このようなフォーマットが品質検出モジュール212によるさらなる処理を助けることとなる事象では、信号プロセッサ216によって変換することができる。
オーディオキャプチャモジュール206からのオーディオ信号、およびサンプルオーディオファイル214のいずれかまたは両方が、信号プロセッサ216によって処理されると、キャプチャされたオーディオ信号は、品質測定値を決定するために信号相関/品質測定モジュール218によってサンプルオーディオファイル214と比較される。オーディオキャプチャモジュール206からのオーディオ信号をサンプルオーディオファイル214と比較することは、オーディオ装置構成の品質の客観的な尺度を決定するのに望ましい。
品質評価の前に、信号相関/品質測定モジュール218は、マイクロホン202によってピックアップされた音声が、スピーカ204によって生成されたものか、または単にマイクロホン202が配置される環境の周囲の音声にすぎないのかを識別することができる。この信号相関機能は、オーディオ信号とサンプルオーディオファイル214の間の合理的な相関関係を識別して、相関されたオーディオデータの比較を確実にするために、継続的にマイクロホン202からのキャプチャされたオーディオ信号のウィンドウまたはスナップショットを比較しようする。
サンプルオーディオファイル214がスピーカ204によって再生される時間に対応する特定の時間の間、マイクロホン202からのオーディオ信号をキャプチャし、記録することによって、信号相関機能を助けることができる。したがって、信号相関/品質測定モジュール218は、オーディオキャプチャモジュール206からのオーディオ信号に対応するデータの特性、例えば周波数、強度、およびタイミングをオーディオサンプルファイル214からのデータと比較し、データの一致があるかどうか判定する。データが相関する場合、図3および図4に関して本明細書にさらに記載されるように、信号相関/品質測定モジュール218は、キャプチャされたデータの品質分析を実施し、特定のオーディオ装置構成についての品質スコアを生成する。
図2に示されるように、コンピュータシステム200は、ユーザモード内で動作するオーディオアプリケーション222も含む。オーディオアプリケーション222は、構成されている入力および出力装置、例えばマイクロホン202およびスピーカ204を制御することとなるユーザによってインスタンス化されたソフトウェアプログラムとすることができる。例示的なオーディオアプリケーションは、VOIPクライアントおよびオーディオ使用可能チャットプログラムとすることができる。あるいは、オーディオアプリケーション222は単に、新しいオーディオ装置をインストールするために、または以前にインストールされたオーディオ装置の特徴を最適化するためにインスタンス化されたオーディオ装置構成プログラム、例えば「ウィザード」プログラムとすることができる。
「オーディオ装置品質測定」220のAPIは、構成品質スコアを有するデータをオーディオアプリケーション222に転送するように、品質検出モジュール212内の信号相関/品質測定モジュール218の間のインターフェースとしての役割を果たす。オーディオアプリケーション222は、オーディオ装置品質測定API220からのデータを使用して、オーディオ装置構成に関する情報をユーザに伝えることができる。例えば、スピーカ204によって生成され、マイクロホン202でキャプチャされた音声の強度が、弱いという表示である場合、オーディオアプリケーション222は、例えばスピーカ204の音量出力を増加させることまたは動かすことによって、スピーカ204のトラブルを解決するようにユーザに警告することができる。あるいは、オーディオアプリケーション222は、代替スピーカがよりよい品質をもたらすかどうか判断するために、ユーザが別のスピーカオプション、例えば外部のスピーカセットから、取り付けられたモニタに組み込まれた代替スピーカへの切り替えを選択することを推奨することがある。1つの例示的な形式では、オーディオアプリケーション222は、ユーザに、GUI(graphical user interface)内でメッセージを通じて警告を与えることができる(例えば「ポップアップ」ウィンドウをディスプレイモニタ上に提示することができる)。
第2のAPIであるオーディオ装置選択API224はまた、オーディオアプリケーション222と、さらには入出力ポートとインターフェースをとり、この入出力ポートを介して、マイクロホン202およびスピーカ204が、コンピュータシステム200に接続される。(図2では示されていないが、オーディオアプリケーション222はさらに、オーディオアプリケーション222(例えばVOIP通話)によって実施される通信セッションからの音声をスピーカ204で生成するように、別個のAPIを有するオーディオレンダリングモジュール208とインターフェースをとることができる)。オーディオ装置選択API224は、選択されたマイクロホン202およびスピーカ204構成に接続される入力ポートまたは出力ポートをアクティブにする。例えば、ユーザのコンピュータシステム200は、複数のマイクロホン202、例えばディスプレイモニタに組み込まれた第1のマイクロホンおよびウェブカメラに組み込まれた第2のマイクロホン、ならびに例えばコンピュータシステム200に有線接続された第1のスピーカのセットおよびディスプレイモニタに組み込まれた第2のスピーカのセットなどの複数のスピーカ204を有することができる。
オーディオアプリケーション222は、オーディオ通信のためにどのマイクロホンおよびスピーカのセットを使用したいかをユーザに尋ねることがある。オーディオアプリケーション222は、オーディオ装置選択API224を通じて、適切なデータポートを開閉して、所望のマイクロホン202およびスピーカ204の組合せをアクティブにする。オーディオアプリケーション222はさらに、オーディオ装置選択API224を呼び出し、コンピュータシステム200に接続された任意の使用可能な装置を自動的に繰り返して、最も高い品質スコアを有するオーディオ装置構成を見つけることができる。
自動品質検出機能を実施するためにコンピュータシステムによって実施される例示的な一連の操作を、図3に示す。図2のコンピュータシステム200の例示的な構成の文脈では、信号相関/品質測定モジュールは、コンピュータシステムに接続された、あり得るマイクロホン/スピーカ構成それぞれに関する客観的な品質評価を決定するように構成される。図2のコンピュータシステムの文脈で記載されているが、本明細書に記載される操作を、コンピュータシステム200以外のシステムによって実施することができることを理解されたい。さらに、記載される任意の操作を、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せにより実行することができる。
最初に選択操作302では、オーディオアプリケーションは、オーディオセッション、例えばオーディオ通信セッションで使用する初期オーディオ装置構成を、自動的に選択するか、または選択するようにユーザに促す。このようなプロンプトまたはリクエストを、ディスプレイモニタ上でGUIメッセージを通じて提示することができる。構成が選択されると、再生操作304により、サンプルオーディオファイルが、選択されたスピーカを通して再生用のオーディオレンダリング装置に送信されることとなる。
キャプチャ操作306は、スピーカによって生成されサンプルオーディオファイルと相関される音声を含め、マイクロホンによってピックアップされる音波を記録する。音波は、マイクロホンによってアナログ信号に変換され、このアナログ信号は、オーディオキャプチャモジュールによってデジタルオーディオフォーマットにさらに変換される。サンプルオーディオファイルも、信号プロセッサによってアクセスされ、変換操作308で、キャプチャされたオーディオデータのフォーマットと容易に比較することができるデータフォーマットに変換される。例えば、キャプチャされたオーディオデータがPMCフォーマットであり、サンプルオーディオファイルがWAVフォーマットである場合、サンプルオーディオファイルを、WAVからPMCに変換することができる。代替操作(図3に図示せず)では、キャプチャされたオーディオデータを、信号プロセッサによってサンプルオーディオファイルのフォーマットに変換することができる。さらに別の代替操作(図3に図示せず)では、キャプチャされたオーディオデータおよびサンプルオーディオファイルの両方のデータフォーマットを、第3の共通フォーマットに変換することができる。
サンプルオーディオファイル、およびキャプチャされたオーディオデータが共通のフォーマットになると、第1の分析操作310は、変換されたサンプルファイルに対応するオーディオ信号の周波数範囲およびエネルギーレベルを分析する。第2の分析操作312は同様に、キャプチャされたオーディオデータに対応するオーディオ信号の周波数範囲およびエネルギーレベルを分析する。第2の分析操作312は、相関操作314を助けるために、キャプチャされたオーディオデータのウィンドウまたはスナップショットを継続的に分析することができる。
相関操作314は、キャプチャされたオーディオ信号のウィンドウそれぞれの周波数範囲およびエネルギーレベルと、変換されたサンプルファイルの周波数範囲およびエネルギーレベルとの間の合理的な相関関係を識別して、品質決定プロセスで相関オーディオデータを比較することを保証する。換言すると、相関プロセスは、スピーカによって再生されるサンプルオーディオファイルの記録であるキャプチャされたオーディオ信号の部分を識別しようと試みる。オーディオ信号の周波数範囲およびエネルギーレベルは同一である必要はなく、単に適度に近いものにすぎない。適度に近いと見なされる値の差のしきい値または範囲を、予め定めることができ、またはユーザ設定可能である。相関操作314は、スピーカによってサンプルオーディオファイルを再生した時間に対応する特定の時間からウィンドウを選択することによって、相関関係についてレビューされるキャプチャされたオーディオ信号のウィンドウを制限することができる。
キャプチャされたオーディオ信号とサンプルオーディオファイルとの間の相関関係が識別されると、計算操作316は、オーディオ装置構成、例えば特定のマイクロホン/スピーカの組合せについてオーディオ品質スコアを計算する。オーディオ品質スコアは、サンプルオーディオファイルによって生成されたオーディオ信号のオーディオ品質と、マイクロホンによってキャプチャされたオーディオ信号との間の精度の要因に基づく。精度の要因には、オーディオ信号間の比較エネルギー、周波数範囲の類似性、信号のひずみ、および信号とノイズの比率を含めることができる。例示的な計算操作を、本明細書では図3に関してより詳細に述べる。
照会操作318は、追加的な装置構成が可能かどうかを自動的に判断することができる。可能である場合は、コンピュータシステムは選択操作302に戻って、品質分析のためのマイクロホンおよびスピーカの代替構成を選択する。コンピュータシステムは、取り付けられたスピーカおよびマイクロホン装置のぞれぞれの機能を識別し、図3に列挙された品質テストプロセスを実行するようにマイクロホンとスピーカのあり得る各対を順に反復する。
あるいは、照会操作318は、ユーザが他の装置構成の品質を決定したいかどうかGUIメッセージを通してユーザに尋ねることがある。決定したい場合は、コンピュータシステムは、選択操作302に戻って、品質を分析するマイクロホンおよびスピーカの代替構成を選択する。ユーザが他の装置構成の品質を決定することを望まない場合、またはコンピュータシステムが他の構成が不可能であると自動的に判断する場合は、提示/選択操作320は、分析されたそれぞれの装置構成のオーディオ品質スコアを(例えばGUIメッセージを通して)ユーザに提示するか、オーディオ品質スコアの比較に基づいて最良の装置構成を自動的に選択するか、またはその両方を行う。
オーディオ装置構成の品質スコアを算出するための例示的なプロセスを、図4に示す。これらの操作は、例えば、図2のコンピュータシステム200内の品質検出モジュール212の信号相関/品質測定モジュール218内で起こることがある。図4に示されるように、受信操作402は、オーディオキャプチャモジュールおよび信号プロセッサを介して、キャプチャされたオーディオ信号データをマイクロホンから受信する。キャプチャされたオーディオ信号データは、第1の決定操作404で分析され、キャプチャされたオーディオ信号の音量の特性、例えば音量強度、信号とノイズの比率、ダイナミックレンジ、および全高調波ひずみ(total harmonic distortion)が測定される。次に、第2の決定操作406は、キャプチャされたオーディオ信号の周波数特性、例えば、周波数範囲(例えば、キャプチャされたオーディオ信号中に存在する最高および最低の周波数)、周波数構成(例えば、キャプチャされたオーディオ信号中に存在する別個の周波数)、および強度(例えば、特定の周波数でのキャプチャされたオーディオ信号の強さ)を調べる。
キャプチャされたオーディオ信号の音量および周波数の特性が決定されると、相関操作408で、対応するサンプルオーディオファイルの音量および周波数の特性と相関される。相関操作のための値を提供するために、同じ音量および周波数の分析を、サンプルオーディオファイルに対応するサンプルオーディオ信号に関して、キャプチャされたオーディオ信号の分析と同時に実行することができる。あるいは、サンプルオーディオファイルは予め選択され、知られているので、サンプルオーディオファイルに関する音量および周波数の特性は単に、メモリに保存され比較操作での使用に利用可能なデータとすることができる。次いで、相関されたデータは、算出操作410で、キャプチャされたオーディオ信号とサンプルオーディオファイルの間の精度を求めるために分析される。
算出操作410で、「最小二乗」法を使用して、サンプルオーディオファイルの元の信号と、キャプチャされたオーディオ信号との間の相対的な精度を決定することができる。最小二乗法は、データと予測値の差(残差(residual)と呼ばれる)の二乗和を最小にすることを試みることによって、1組のデータ間、この場合はキャプチャされたオーディオ信号と、予測値、この場合はサンプルオーディオファイルとの間の「最良適合(best fit)」を見つけようと試みる数学的な最適化技術である。キャプチャされたオーディオ信号の精度は、オーディオ構成の品質、例えばスピーカおよびマイクロホンのそれぞれの周波数応答、マイクロホンの感度、スピーカの音量、マイクロホンとスピーカの互いに対する物理的な配置、オーディオ装置が配置される物理的な環境、および周囲のノイズによって影響を受ける。
次いで、決定され比較された音量および周波数の特性のそれぞれに関する精度の最小二乗差に対応する値は、計算操作412で計算され、特定のオーディオ装置構成に関するオーディオ品質スコアと見なされる。それぞれの特性をさらに、オーディオ品質に対する特定の特性の寄与の重要度に基づき、異なる重みによって、割り当てられるかスケーリングされる。このオーディオ品質スコアを保存し、他の使用可能なオーディオ装置構成に関するオーディオ品質スコアと比較し、最良のオーディオ品質スコアを有する構成を、通信セッションのためのコンピュータシステム内の操作のために、または特定のオーディオアプリケーションに関して、自動的に選択またはユーザに推奨することができる。
代替としてまたは追加として、最高のオーディオ品質スコアに対応する最上のオーディオ構成セットを提示することができる。さらに、あるオーディオ装置構成が特定の環境または特定のユーザに最も適していることを示すフィードバックを、ユーザに提示することができるであろう。例えば、あるオーディオ装置構成は、戸外での使用によく適するが、別のオーディオ構成は、コンピューティング装置が小さい領域に位置するときの使用により適している。別の例として、あるオーディオ装置構成は、より高い周波数範囲の音声を生成する女性の声により適していることがあり、別の構成は、より低い周波数範囲の音声を生成する男性の声により適していることがある。
図5は、ネットワーク上でリアルタイム通信セッションを実施するために使用することができ、本明細書で述べられる品質測定技術が動作することができる例示的なコンピュータシステム500を示す。一実装形態では、コンピュータシステム500を、デスクトップまたはラップトップコンピュータにより具現化することができるが、他の実装形態、例えばビデオゲームコンソール、セットトップボックス、携帯用ゲームシステム、携帯情報端末、および携帯電話は、述べられた技術を組み込むことができる。コンピュータシステム500には典型的に、少なくとも1つの処理ユニット502およびメモリ504が含まれる。コンピュータシステム500の正確な構成およびタイプに応じて、メモリ504は、揮発性(例えば、RAM)、不揮発性(例えば、ROMおよびフラッシュメモリ)、またはその両方の何らかの組合せとすることができる。コンピュータシステム500の最も基本的な構成は、破線506によって示されるように、処理ユニット502およびメモリ504のみを含む必要がある。
コンピュータシステム500はさらに、メモリストレージまたは取出しのための追加の装置を含むことができる。これらの装置は、リムーバブルストレージデバイス508または非リムーバブルストレージデバイス510、例えば、磁気および光媒体においてメモリストレージおよび取出しのための磁気ディスクドライブ、磁気テープドライブ、および光ドライブとすることができる。記憶媒体は、リムーバブルと非リムーバブルの両方の揮発性および不揮発性媒体を含むことができ、記憶媒体を任意の数の構成、例えば、RAM、ROM、EEPROM、フラッシュメモリ、CD−ROM、DVDまたは他の光学記憶媒体、磁気カセット、磁気テープ、磁気ディスク、または他の磁気記憶装置、あるいはデータを格納するために使用することができかつ処理ユニット502によってアクセスすることができる他のメモリ技術または媒体で提供することができる。データ、例えばコンピュータ読取可能命令、データ構造、およびプログラムモジュールの記憶のための任意の方法または技術を使用して、情報をストレージ媒体内に格納することができる。
コンピュータシステム500は、システム500が他の装置と通信することを可能にする1つまたは複数の通信インターフェース512を有することもできる。通信インターフェース512を、LAN(local area network)、WAN(wide area network)、電話網、ケーブルネットワーク、インターネット、直接有線接続、例えば無線周波数、赤外線、マイクロ波、または音響などの無線ネットワーク、あるいは装置間のデータ転送を可能にする他のネットワークに接続することができる。データは一般に、変調データ信号、例えば搬送波または他のトランスポート媒体を介してネットワーク上で、通信インターフェース512との間で伝送される。変調データ信号は、信号内のデータを符号化するような手法で設定または変更することができる特性を有する電磁信号である。
コンピュータシステム500はさらに、様々な入力装置514および出力装置516を有することができる。例示的な入力装置514は、キーボード、マウス、タブレット、タッチスクリーン装置、スキャナ、視覚入力装置、およびマイクロホンまたは他の音声入力装置を含むことができる。例示的な出力装置516は、ディスプレイモニタ、プリンタ、およびスピーカを含むことができる。このような入力装置514および出力装置516を、コンピュータシステム500に組み込むことができ、あるいは、有線または無線で、例えばBluetoothプロトコルを介してコンピュータシステム500に接続することができる。これらの組み込まれた入出力装置または周辺入出力装置は一般に、よく知られており、本明細書ではさらに論じない。一実装形態では、例えばサンプルオーディオファイルを含むオーディオ品質を決定するための方法またはモジュールを実装するプログラム命令は、メモリ504、ストレージデバイス508および510で具現化され、処理ユニット502によって実行される。例えばオーディオレンダリングモジュールおよびオーディオキャプチャモジュールによって実行される他の機能を、コンピュータシステム500の不揮発性メモリ504内のオペレーティングシステムによって実行することができる。
本明細書に述べられた技術は、1つまたは複数のシステム内の論理操作および/またはモジュールとして実装される。論理操作を、1つまたは複数のコンピュータシステム内で実行するプロセッサ実装ステップのシーケンスとして、ならびに、1つまたは複数のコンピュータシステム内の相互接続したマシンまたは回路モジュールとして実装することができる。同様に、様々なコンポーネントモジュールについて説明を、モジュールによって実行または達成される操作に関して提供することができる。結果としてもらされる実装形態は、述べられた技術を実装する、基礎となるシステムの性能要件に応じた選択の問題である。したがって、本明細書で述べられた技術の実施形態を構成する論理操作は、操作、ステップ、オブジェクト、またはモジュールと様々に呼ばれる。さらに、明示的に特許請求の範囲に記載されない限り、またはクレームの文言によって特定の順序が本質的に必要とされない限り、論理操作を任意の順序で実行することができることを理解されたい。
上記の詳述、実施例、およびデータは、本発明の例示的な実施形態の構造および使用についての完全な説明を提供する。本発明の様々な実施形態を、ある程度の具体性とともに、あるいは1つまたは複数の個々の実施形態を参照して上記で述べたが、当業者であれば、本発明の精神または範囲から逸脱することなく、開示された実施形態に様々な変更をすることができるであろう。特に、述べられた技術は、パーソナルコンピュータとは独立に利用することができることを理解されたい。したがって、他の実施形態が検討される。上記説明に含まれ、添付の図面に示されるすべての事項は、限定ではなく、特定の実施形態の例にすぎないと解釈されることを意図している。以下の特許請求の範囲で定義される本発明の基本的な要素から逸脱することなく、詳細または構造の変更を行うことができる。
接続された複数のオーディオ装置を有する例示的なパーソナルコンピュータシステムを示す図である。 オーディオ装置構成の品質を決定するためのコンピュータシステム内の例示的なモジュールを示す図である。 オーディオ装置品質を決定するためにモジュールによって実行される一連の例示的な操作を示す図である。 オーディオ装置品質スコアを決定するために実行される別の一連の例示的な操作を示す図である。 リアルタイム通信セッションおよび他のオーディオ入出力機能を実施するための例示的なコンピュータシステムを示す図である。

Claims (14)

  1. コンピュータシステムに接続されたマイクロホンとスピーカとを備えたオーディオ装置構成の品質を決定するための方法であって、
    オーディオセッションに関してテストすべきオーディオ装置構成を、前記コンピュータシステムに接続された複数のオーディオ入力装置および出力装置から選択することであって、前記オーディオ装置構成は、前記オーディオセッション中にユーザから通信されるオーディオ入力を受信するためのオーディオ入力装置として構成されたマイクロホンと、前記オーディオセッション中に前記ユーザに通信するオーディオ出力を提供するためのオーディオ出力装置として構成されたスピーカとを含む、前記オーディオセッションに利用可能なオーディオ入力装置および出力装置の組み合わせを備える、該選択することと、
    前記コンピュータシステムのメモリに格納されたサンプルオーディオファイルから生成されたサンプル音声を、前記オーディオ装置構成をテストするために前記オーディオ装置構成の前記スピーカを介して出力することと、
    前記オーディオ装置構成の前記マイクロホンを介して前記サンプル音声をキャプチャして、キャプチャされたオーディオ信号を作成することと、
    前記キャプチャされたオーディオ信号のオーディオ特性を分析することと、
    前記キャプチャされたオーディオ信号の前記オーディオ特性を、前記サンプルオーディオファイルに対応するサンプルオーディオ信号のオーディオ特性と比較することと、
    前記キャプチャされたオーディオ信号の前記オーディオ特性と、前記サンプルオーディオ信号の前記オーディオ特性との前記比較に基づいてオーディオ品質スコアを計算することと、
    前記オーディオ装置構成の計算された前記オーディオ品質スコアを、前記オーディオセッションに利用可能な他のオーディオ装置構成それぞれのオーディオ品質スコアと比較することであって、前記他のオーディオ装置構成はそれぞれ、前記コンピュータシステムに接続された前記複数のオーディオ入力装置および出力装置の異なる組み合わせを備える、該比較することと、
    前記オーディオセッションについて、最も高いオーディオ品質スコアを有するオーディオ装置構成をアクティブ化することと
    を含むことを特徴とする方法。
  2. 前記マイクロホンによってキャプチャされた前記サンプル音声を、キャプチャされたオーディオ信号に変換することをさらに含むことを特徴とする請求項1に記載の方法。
  3. 前記コンピュータシステムのユーザに前記オーディオ品質スコアを示す表示を提示することをさらに含むことを特徴とする請求項1に記載の方法。
  4. 前記分析することは、前記サンプルオーディオ信号と前記キャプチャされたオーディオ信号との少なくとも1つを処理して、前記サンプルオーディオ信号、前記キャプチャされたオーディオ信号、またはその両方を共通のフォーマットに変換することをさらに含むことを特徴とする請求項1に記載の方法。
  5. 前記分析することは、前記キャプチャされたオーディオ信号の周波数範囲とエネルギーレベルとの少なくとも1つを分析することをさらに含むことを特徴とする請求項1に記載の方法。
  6. 前記計算することは、前記キャプチャされたオーディオ信号の前記オーディオ特性と、前記サンプルオーディオ信号の前記オーディオ特性との間の最小二乗値を算出することをさらに含むことを特徴とする請求項1に記載の方法。
  7. 前記オーディオセッションに利用可能な他のオーディオ装置構成のそれぞれについて、テストしてオーディオ品質スコアを計算することをさらに含むことを特徴とする請求項1に記載の方法。
  8. 前記オーディオセッションに利用可能な前記他のオーディオ装置構成のオーディオ品質スコアを提示することをさらに含むことを特徴とする請求項に記載の方法。
  9. コンピュータシステムに接続されたマイクロホンとスピーカとを備えたオーディオ装置構成の品質を決定するための方法であって、
    オーディオセッションに関してテストすべきオーディオ装置構成を、前記コンピュータシステムに接続された複数のオーディオ入力装置および出力装置から選択することであって、前記オーディオ装置構成は、前記オーディオセッション中にユーザから通信されるオーディオ入力を受信するためのオーディオ入力装置として構成されたマイクロホンと、前記オーディオセッション中に前記ユーザに通信するオーディオ出力を提供するためのオーディオ出力装置として構成されたスピーカとを含む、前記オーディオセッションに利用可能なオーディオ入力装置および出力装置の組み合わせを備える、該選択することと、
    前記コンピュータシステムのメモリに格納されたサンプルオーディオファイルから生成されたサンプル音声を、前記オーディオ装置構成をテストするために前記オーディオ装置構成の前記スピーカを介して出力することと、
    前記オーディオ装置構成の前記マイクロホンを介して前記サンプル音声をキャプチャして、キャプチャされたオーディオ信号を作成することと、
    前記キャプチャされたオーディオ信号の音量特性を決定することと、
    前記キャプチャされたオーディオ信号の周波数特性を決定することと、
    前記サンプルオーディオファイルに対応するサンプルオーディオ信号の音量特性を決定することと、
    前記サンプルオーディオ信号の周波数特性を決定することと、
    前記キャプチャされたオーディオ信号の前記音量特性および前記周波数特性と、前記サンプルオーディオ信号の前記音量特性および前記周波数特性との各々の比較に基づいて、前記オーディオ装置構成のオーディオ品質スコアを算出することと、
    前記オーディオ装置構成の算出された前記オーディオ品質スコアを、前記オーディオセッションに利用可能な他のオーディオ装置構成それぞれのオーディオ品質スコアと比較することであって、前記他のオーディオ装置構成はそれぞれ、前記コンピュータシステムに接続された前記複数のオーディオ入力装置および出力装置の異なる組み合わせを備える、該比較することと、
    前記オーディオセッションについて、最も高いオーディオ品質スコアを有するオーディオ装置構成をアクティブ化することと
    を含むことを特徴とする方法。
  10. 前記音量特性は、音量強度、信号とノイズの比率、ダイナミックレンジ、および全高調波ひずみの少なくとも1つを含むことを特徴とする請求項に記載の方法。
  11. 前記周波数特性は、周波数範囲、周波数構成、および周波数強度の少なくとも1つを含むことを特徴とする請求項に記載の方法。
  12. 前記算出することは、前記周波数特性、前記音量特性のうちの1つまたは複数、あるいは両方に対して重み係数を適用することをさらに含むことを特徴とする請求項に記載の方法。
  13. 前記算出することは、前記キャプチャされたオーディオ信号の前記音量特性および前記周波数特性と、前記サンプルオーディオ信号の前記音量特性および前記周波数特性との間の最小二乗値をそれぞれ算出することをさらに含むことを特徴とする請求項に記載の方法。
  14. オーディオ装置構成の品質を決定するコンピュータシステムであって、
    プロセッサと、
    前記プロセッサによってアクセス可能であり、サンプルオーディオファイルを格納するメモリと、
    前記プロセッサによって制御され、オーディオセッションに選択されたオーディオ装置構成をテストするためにサンプル音声を出力することができるスピーカであって、前記サンプル音声は、前記サンプルオーディオファイルから生成され、選択された前記オーディオ装置構成は、該コンピュータシステムに接続された複数のオーディオ入力装置および出力装置から選択された前記オーディオセッションに利用可能なオーディオ入力装置および出力装置を備える、該スピーカと、
    前記プロセッサによって制御され、キャプチャされたオーディオ信号を作成するために前記サンプル音声を受信することができるマイクロホンであって、前記スピーカおよび該マイクロホンはともに、選択された前記オーディオ装置構成を備え、該マイクロホンは、前記オーディオセッション中にユーザから通信されるオーディオ入力を受信するためのオーディオ入力装置として構成され、前記スピーカは、前記オーディオセッション中に前記ユーザに通信するオーディオ出力を提供するためのオーディオ出力装置として構成される、該マイクロホンと、
    前記プロセッサによって制御される品質検出モジュールであって、
    前記メモリからの前記サンプルオーディオファイルにアクセスし、
    前記サンプルオーディオファイルからサンプルオーディオ信号を生成し、
    前記オーディオ装置構成の前記マイクロホンから前記キャプチャされたオーディオ信号を受信し、
    前記キャプチャされたオーディオ信号のオーディオ特性を分析し、
    前記キャプチャされたオーディオ信号のオーディオ特性を、前記サンプルオーディオ信号のオーディオ特性と比較し
    前記キャプチャされたオーディオ信号の前記オーディオ特性と、前記サンプルオーディオ信号の前記オーディオ特性との前記比較に基づいて前記オーディオ装置構成のオーディオ品質スコアを計算し、
    前記オーディオ装置構成について計算された前記オーディオ品質スコアを、該コンピュータシステムに接続された前記複数のオーディオ入力装置および出力装置の異なる組み合わせを各々が備える、前記オーディオセッションに利用可能な他のオーディオ装置構成それぞれのオーディオ品質スコアと比較し、
    前記オーディオセッションについて、最も高いオーディオ品質スコアを有するオーディオ装置構成をアクティブ化する
    該品質検出モジュールと
    を備えたことを特徴とするコンピュータシステム。
JP2008541199A 2005-11-17 2006-10-30 オーディオ装置品質の決定 Expired - Fee Related JP5053285B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/280,999 2005-11-17
US11/280,999 US20070112563A1 (en) 2005-11-17 2005-11-17 Determination of audio device quality
PCT/US2006/042506 WO2007061584A1 (en) 2005-11-17 2006-10-30 Determination of audio device quality

Publications (3)

Publication Number Publication Date
JP2009518662A JP2009518662A (ja) 2009-05-07
JP2009518662A5 JP2009518662A5 (ja) 2009-12-17
JP5053285B2 true JP5053285B2 (ja) 2012-10-17

Family

ID=38041987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008541199A Expired - Fee Related JP5053285B2 (ja) 2005-11-17 2006-10-30 オーディオ装置品質の決定

Country Status (7)

Country Link
US (1) US20070112563A1 (ja)
EP (1) EP1913708B1 (ja)
JP (1) JP5053285B2 (ja)
KR (1) KR20080077085A (ja)
CN (1) CN101313482B (ja)
ES (1) ES2421927T3 (ja)
WO (1) WO2007061584A1 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009105129A1 (en) * 2008-02-18 2009-08-27 Clear Channel Management Services, L.P. System and method for media stream monitoring
US8401178B2 (en) * 2008-09-30 2013-03-19 Apple Inc. Multiple microphone switching and configuration
KR101015102B1 (ko) 2009-02-23 2011-02-16 한국과학기술연구원 마이크로폰 배열에 대한 자가고장 검출 시스템, 자가고장 검출 방법 및 오디오 기반 장치
US8284259B2 (en) * 2009-09-23 2012-10-09 Avaya Inc. Policy-based video quality assessment
US9020621B1 (en) * 2009-11-18 2015-04-28 Cochlear Limited Network based media enhancement function based on an identifier
WO2012169679A1 (ko) * 2011-06-10 2012-12-13 엘지전자 주식회사 디스플레이 장치, 디스플레이 장치의 제어 방법 및 디스플레이 장치의 음성인식 시스템
DE102012202232A1 (de) * 2012-02-14 2013-08-14 Lufthansa Systems Ag Verfahren zur Durchführung von Durchsagen in einem Verkehrsmittel
CN103634577B (zh) 2012-08-22 2014-12-31 华为技术有限公司 多媒体质量的监控方法和设备
CN103634731B (zh) * 2012-08-29 2016-12-28 联想(北京)有限公司 一种调整扬声器的方法及电子设备
ES2545824T3 (es) 2012-11-20 2015-09-16 Bombardier Transportation Gmbh Reproducción de audio segura en interfaz hombre-máquina
CN103916433B (zh) * 2013-01-04 2017-08-01 中兴通讯股份有限公司 一种卡拉ok数据处理方法、装置、物联网服务平台及终端
CN105359499B (zh) * 2013-07-11 2019-04-30 哈曼国际工业有限公司 用于数字音频会议工作流管理的系统和方法
KR20150049469A (ko) * 2013-10-30 2015-05-08 삼성전자주식회사 멀티 윈도우에서의 사용자 인터페이스 제공 방법 및 장치
CN103747407B (zh) * 2013-12-27 2017-04-12 深圳英飞拓科技股份有限公司 一种基于fft扫频的音频模块自动化测试方法
US10057699B2 (en) 2014-10-01 2018-08-21 Sartorius Stedim Biotech Gmbh Audio identification device, audio identification method and audio identification system
KR102386309B1 (ko) * 2015-06-04 2022-04-14 삼성전자주식회사 전자 장치 및 전자 장치에서의 입출력 제어 방법
CN105188007B (zh) * 2015-06-05 2018-11-27 彭显东 一种高保真音频设备的测试装置及测试方法
CN105100489B (zh) * 2015-08-07 2017-02-15 努比亚技术有限公司 降低谐波失真的装置和方法
US10484484B2 (en) * 2016-02-05 2019-11-19 International Business Machines Corporation Context-aware task processing for multiple devices
US9653096B1 (en) * 2016-04-19 2017-05-16 FirstAgenda A/S Computer-implemented method performed by an electronic data processing apparatus to implement a quality suggestion engine and data processing apparatus for the same
WO2018022085A1 (en) 2016-07-29 2018-02-01 Hewlett-Packard Development Company, L.P. Identification of preferred communication devices
US10310800B2 (en) 2017-02-08 2019-06-04 Microsoft Technology Licensing, Llc Selective routing of audio between applications
US10467088B2 (en) * 2017-02-08 2019-11-05 Microsoft Technology Licensing, Llc Audio system maintenance using system call monitoring
US10069976B1 (en) * 2017-06-13 2018-09-04 Harman International Industries, Incorporated Voice agent forwarding
WO2019005688A1 (en) * 2017-06-28 2019-01-03 Blue Jeans Network, Inc. SELECTING AND MANAGING DEVICES FOR USE IN VIDEO CONFERENCE
US11197095B2 (en) * 2017-10-13 2021-12-07 Harman International Industries, Incorporated One-click measurement for headphones
CN108492837B (zh) * 2018-03-23 2020-10-13 腾讯音乐娱乐科技(深圳)有限公司 音频突发白噪声的检测方法、装置及存储介质
US11488615B2 (en) * 2018-05-21 2022-11-01 International Business Machines Corporation Real-time assessment of call quality
US10833886B2 (en) 2018-11-07 2020-11-10 International Business Machines Corporation Optimal device selection for streaming content
CN111176250B (zh) * 2018-11-12 2022-09-27 广东美的制冷设备有限公司 故障检测方法、模块、家电设备、系统和计算机存储介质
EP4029018B1 (en) * 2019-09-11 2023-07-26 DTS, Inc. Context-aware voice intelligibility enhancement
US11151981B2 (en) 2019-10-10 2021-10-19 International Business Machines Corporation Audio quality of speech in sound systems
US11153043B2 (en) * 2019-10-24 2021-10-19 Roku, Inc. Measuring and evaluating a test signal generated by a device under test (DUT)
US11665013B1 (en) * 2019-12-13 2023-05-30 Amazon Technologies, Inc. Output device selection
CN111863032A (zh) * 2020-06-12 2020-10-30 随锐科技集团股份有限公司 音频采集设备的优选方法及系统、计算机可读存储介质
CN115885523A (zh) * 2020-06-19 2023-03-31 杜比实验室特许公司 非侵入式换能器健康检测
FR3124593B1 (fr) * 2021-06-23 2024-02-16 Orange Score de réception d’un signal de visioconférence
US11652655B1 (en) 2022-01-31 2023-05-16 Zoom Video Communications, Inc. Audio capture device selection for remote conference participants

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4191864A (en) * 1978-08-25 1980-03-04 American Hospital Supply Corporation Method and apparatus for measuring attack and release times of hearing aids
FR2517905B1 (fr) * 1981-12-09 1985-11-29 Telecommunications Sa Dispositif d'initialisation pour annuleur d'echo et son application aux echos lointains
US4788708A (en) * 1987-11-25 1988-11-29 Tele-Technix, Inc. Universal headset tester
US5347586A (en) * 1992-04-28 1994-09-13 Westinghouse Electric Corporation Adaptive system for controlling noise generated by or emanating from a primary noise source
JPH0666625A (ja) * 1992-08-17 1994-03-11 Daikin Ind Ltd 騒音の音質計測方法及び計測装置並びに機器運転音の音質制御方法及び制御装置
JPH06311588A (ja) * 1993-04-19 1994-11-04 Clarion Co Ltd オーディオ装置の周波数特性解析方法
US6760451B1 (en) * 1993-08-03 2004-07-06 Peter Graham Craven Compensating filters
US5544228A (en) * 1993-09-27 1996-08-06 The Walt Disney Company Method and apparatus for transmission of full frequency digital audio
US6130949A (en) * 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
JPH10111693A (ja) * 1996-10-04 1998-04-28 Nippon Columbia Co Ltd 音響特性測定用記録媒体、音響特性測定装置及び音響特性測定方法
JP3396393B2 (ja) * 1997-04-30 2003-04-14 沖電気工業株式会社 エコー・雑音成分除去装置
KR100233166B1 (ko) * 1997-07-04 1999-12-01 윤종용 다수의 마이크들을 구비하는 핸드 프리 장치 및 그 제어 방법
US6016136A (en) * 1997-10-29 2000-01-18 International Business Machines Corporation Configuring audio interface for multiple combinations of microphones and speakers
US6628780B2 (en) * 1997-10-31 2003-09-30 Lucent Technologies Inc. Echo cancellation in the network for data applications
US6240070B1 (en) * 1998-10-09 2001-05-29 Siemens Information And Communication Networks, Inc. System and method for improving audio quality on a conferencing network
US6275805B1 (en) * 1999-02-25 2001-08-14 International Business Machines Corp. Maintaining input device identity
US6766025B1 (en) * 1999-03-15 2004-07-20 Koninklijke Philips Electronics N.V. Intelligent speaker training using microphone feedback and pre-loaded templates
US6823302B1 (en) * 1999-05-25 2004-11-23 National Semiconductor Corporation Real-time quality analyzer for voice and audio signals
US6580793B1 (en) * 1999-08-31 2003-06-17 Lucent Technologies Inc. Method and apparatus for echo cancellation with self-deactivation
US6931370B1 (en) * 1999-11-02 2005-08-16 Digital Theater Systems, Inc. System and method for providing interactive audio in a multi-channel audio environment
NL1014075C2 (nl) * 2000-01-13 2001-07-16 Koninkl Kpn Nv Methode en inrichting voor het bepalen van de kwaliteit van een signaal.
US6928329B1 (en) * 2000-02-29 2005-08-09 Microsoft Corporation Enabling separate chat and selective enablement of microphone
US20040057586A1 (en) * 2000-07-27 2004-03-25 Zvi Licht Voice enhancement system
DE10046098C5 (de) * 2000-09-18 2005-01-05 Siemens Audiologische Technik Gmbh Verfahren zum Prüfen eines Hörhilfegerätes sowie Hörhilfegerät
US7117145B1 (en) * 2000-10-19 2006-10-03 Lear Corporation Adaptive filter for speech enhancement in a noisy environment
JP3676244B2 (ja) * 2001-02-02 2005-07-27 三菱電機株式会社 携帯機端末、および携帯機端末の音響試験用周辺装置
US20040252826A1 (en) * 2001-05-17 2004-12-16 Tian Wen Shun Echo canceller and a method of cancelling echo
CA2354755A1 (en) * 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
US20030112887A1 (en) * 2001-12-18 2003-06-19 Sang Tzu Hsien Method and system for implementing weighted vector error echo cancellers
US6961423B2 (en) * 2002-06-24 2005-11-01 Freescale Semiconductor, Inc. Method and apparatus for performing adaptive filtering
US20040059578A1 (en) * 2002-09-20 2004-03-25 Stefan Schulz Method and apparatus for improving the quality of speech signals transmitted in an aircraft communication system
DE10254612A1 (de) * 2002-11-22 2004-06-17 Humboldt-Universität Zu Berlin Verfahren zur Ermittlung spezifisch relevanter akustischer Merkmale von Schallsignalen für die Analyse unbekannter Schallsignale einer Schallerzeugung
JP2004193782A (ja) * 2002-12-09 2004-07-08 Toa Corp スピーカとマイクロホン間の音波伝搬時間測定方法およびその装置
KR100923297B1 (ko) * 2002-12-14 2009-10-23 삼성전자주식회사 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치
KR100908117B1 (ko) * 2002-12-16 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
US20060126859A1 (en) * 2003-01-31 2006-06-15 Claus Elberling Sound system improving speech intelligibility
JP2004318075A (ja) * 2003-03-31 2004-11-11 Xing Inc 音楽再生装置
JP4128916B2 (ja) * 2003-08-15 2008-07-30 株式会社東芝 字幕制御装置および方法ならびにプログラム
US6889189B2 (en) * 2003-09-26 2005-05-03 Matsushita Electric Industrial Co., Ltd. Speech recognizer performance in car and home applications utilizing novel multiple microphone configurations
JP2005151356A (ja) * 2003-11-18 2005-06-09 Pioneer Electronic Corp 試聴用スピーカ装置
US20050138617A1 (en) * 2003-12-19 2005-06-23 Friedman Lee G. Adaptive discovery and configuration of a user-selected input/output device
US7031461B2 (en) * 2004-01-12 2006-04-18 Acoustic Technologies, Inc. Robust adaptive filter for echo cancellation
US8731907B2 (en) * 2005-09-20 2014-05-20 Telefonaktiebolaget L M Ericsson (Publ) Method and test signal for measuring speech intelligibility
US8472633B2 (en) * 2005-11-15 2013-06-25 Microsoft Corporation Detection of device configuration
US7881460B2 (en) * 2005-11-17 2011-02-01 Microsoft Corporation Configuration of echo cancellation

Also Published As

Publication number Publication date
KR20080077085A (ko) 2008-08-21
EP1913708A4 (en) 2008-09-10
EP1913708A1 (en) 2008-04-23
ES2421927T3 (es) 2013-09-06
EP1913708B1 (en) 2013-06-19
CN101313482A (zh) 2008-11-26
US20070112563A1 (en) 2007-05-17
CN101313482B (zh) 2011-12-21
WO2007061584A1 (en) 2007-05-31
JP2009518662A (ja) 2009-05-07

Similar Documents

Publication Publication Date Title
JP5053285B2 (ja) オーディオ装置品質の決定
US10085102B2 (en) Detection of device configuration
CN101313483B (zh) 回音消除的配置
JP2024507916A (ja) オーディオ信号の処理方法、装置、電子機器、及びコンピュータプログラム
JP2011511571A (ja) 複数のマイクからの信号間で知的に選択することによって音質を改善すること
CN107580155B (zh) 网络电话质量确定方法、装置、计算机设备和存储介质
CN106961509B (zh) 通话参数处理方法、装置及电子设备
JP7597300B2 (ja) 音声データ処理方法と装置及びコンピュータ機器とプログラム
US20240406622A1 (en) Method and system of automatic microphone selection for multi-microphone environments
CN113096694B (zh) 一种电子终端的播放质量检测方法及电子终端
CN115810356A (zh) 语音控制方法、装置、存储介质以及电子设备
CN112735455A (zh) 声音信息的处理方法和装置
CN106293607B (zh) 自动切换音频输出模式的方法及系统
CN113113046B (zh) 音频处理的性能检测方法、装置、存储介质及电子设备
JP2020086027A (ja) 音声再生システムおよびプログラム
CN115695628A (zh) 音频处理方法、电子设备及存储介质
CN118692478B (zh) 基于动态门限的混音方法、设备、系统和存储介质
CN105718557A (zh) 一种信息搜索方法及装置
CN119767230A (zh) 音频系统的检测方法、装置、设备、车辆、介质和程序
CN117579770A (zh) 用于会议中确定主发言人的方法、装置、电子设备和介质
CN116778954A (zh) 一种广播系统静音检测方法、音频输出设备及存储介质
CN115831139A (zh) 一种啸叫抑制方法和相关设备
CN116320867A (zh) 风噪检测方法、装置及耳机
WO2019061055A1 (zh) 电子设备的测试方法及系统

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091030

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091030

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120720

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120725

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150803

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees