JP2004508596A - 出力ベースの客観的音声品質評価方法及び装置 - Google Patents
出力ベースの客観的音声品質評価方法及び装置 Download PDFInfo
- Publication number
- JP2004508596A JP2004508596A JP2002525646A JP2002525646A JP2004508596A JP 2004508596 A JP2004508596 A JP 2004508596A JP 2002525646 A JP2002525646 A JP 2002525646A JP 2002525646 A JP2002525646 A JP 2002525646A JP 2004508596 A JP2004508596 A JP 2004508596A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- output
- signal
- output audio
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000013441 quality evaluation Methods 0.000 title claims description 7
- 230000005236 sound signal Effects 0.000 claims abstract description 119
- 238000004891 communication Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 6
- 238000001303 quality assessment method Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims 1
- 238000005259 measurement Methods 0.000 description 13
- 238000012360 testing method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000001934 delay Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 101150093282 SG12 gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Monitoring And Testing Of Exchanges (AREA)
- Telephonic Communication Services (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Tests Of Electronic Circuits (AREA)
Abstract
Description
【技術分野】
本発明は、一般的に、音声品質評価に関し、さらに詳しく言えば、人間の聞き手を関与させることなく、無線通信システムで受信される出力信号及びボイス・オーバー・インターネット・プロトコル(VoIP:Voice over Internet Protocol)に従って伝送される音声信号などの出力信号の音声品質を客観的に評価するための方法及び装置に関する。
【0002】
【背景技術】
音声品質評価により、音声符号化伝送アルゴリズム及び機器の制御及びデザインが最適化される。
【0003】
例えば、平均オピニオン評点(MOS:Mean Opinion Score)や診断受入基準(DAM:Diagnostic Acceptability Measure)などの人間の聞き手の評価手法を伴う音声品質の評価方法により、客観的な品質基準が得られる。
【0004】
このタイプの音声品質評価は、非常にコストがかかり、適切な施設や試験機器及び条件を必要とする。
【0005】
人間の聞き手を関与させないために、数式を用いて客観的音声品質の推定または予測を試みる客観的音声測定法がこれまで提案されてきた。
【0006】
典型的に、客観的音声品質評価方法は、明瞭で歪みのない元の入力音声信号と劣化した出力音声信号とを比較することに基づく。しかしながら、実際のところ、明瞭な元の入力信号は、一般に、被試験システムまたは装置の出力で入手不能である。
【0007】
国際特許出願第WO−A−96/06495号には、例えば、明瞭な歪みのない入力信号を必要とせずに、通信リンクによりどのように出力信号が修正されたり歪ませられたりしたかを決定するために、不特定話者の音声の一定の統計的な特徴を解析することが提案されている。
【0008】
同じ目的で、国際特許出願第WO−A−96/06496号には、音声認識器により受信信号の内容を解析することが開示されている。この解析結果は、歪みのない音声信号を発生するための音声合成器により処理される。
【0009】
国際特許出願第WO−A−97/05730号には、声道解析を用いた音声品質測定と、明瞭な入力信号のレプリカとして参照信号を発生するニューラルネットワークとが開示されている。
【0010】
その音声品質を解析するために、音声を認識し、音声を合成し、劣化信号の話者の声及び他の特性へ合成信号を適応させることで、劣化した音声信号と比較するために参照信号を与えることは、実際のところ、限られた精度で計算集約型のタスクを含む。
【0011】
しかしながら、元の入力音声信号に等しい参照信号を劣化音声信号から復元することは不可能である。
【0012】
さらに、評価された品質が所定レベルより低ければ、音声品質を高めるように制御するための適時のフィードバックを妨げる遅延がある参照信号となる。
【0013】
【発明の要約】
本発明の目的は、出力ベースの客観的音声品質を評価するさいの計算集約型タスク及びそれにより生じる固有の遅延を回避することである。
【0014】
本発明により、音声情報部分を含む劣化出力音声信号が、出力音声信号から取り出された参照信号と比較される出力ベースの客観的音声品質の評価方法であって、参照信号は、1秒当たりのビット有限数、すなわちビット伝送速度を与える有限エントロピーの参照音声信号を生成する音声リコーダを使用して、出力音声信号の音声情報部分の知覚近似により与えられる新規の方法が提供される。
【0015】
本発明は、有限ビット伝送速度で知覚近似を実行する音声リコーダを使用して歪み音声信号を処理することにより、劣化出力音声信号の音声情報部分が、音声リコーダの特性に従って客観的に復元されて、音声品質を客観的に評価するための参照音声信号を与えるという洞察に基づいたものである。
【0016】
本発明による音声リコーダを使用することにより、被試験出力音声から音声パラメータなどを抽出するために、膨大なコンピュータ処理及び計算が不要になるため、不都合な遅延が導入されない。
【0017】
音声コーデック(音声符号器/音声復号器)とは、音声信号を1秒当たりのビット有限数の信号に知覚処理する装置である。したがって、本発明による方法の好適な実施形態において、参照信号は、例えば、ITU−T G.729規格またはETSI 6.71規格に準拠したコーデックなどの参照音声コーデック(リコーダ)を使用して、劣化出力音声信号を再符号化することにより与えられる。
【0018】
リコーダは、(理想的には)、明瞭な歪みのない音声信号に対して本質的に透過性のものであり、ひずみのある音声信号に対して、音声信号の歪みの大きさの程度に応じて本質的に非透過性のものでなければならない。
【0019】
すなわち、例えば、劣化信号が不快な量のバックグラウンドノイズを含めば、リコーダは、例えば、バックグラウンドノイズを抑制することにより、信号を「歪ませ」たり、ノイズによるビット消費により、出力音声信号を「劣化」させなければならない。被試験音声伝送システムが透過性のものである場合、客観的品質測定は、このような透過性も予測しなければならず、これは、明瞭な音声信号に対してほぼ透過性のものであるリコーダにより達成される。
【0020】
上記に略述した従来技術の方法と比較すると、本発明は、非常に実用性の高いアプローチをとっており、劣化出力音声信号の音声情報部分から参照音声信号を引き出すことに焦点を当て、この劣化出力音声信号は、劣化音声信号の歪みの程度の大きさである劣化音声信号からの知覚距離を有する。
【0021】
したがって、本発明による方法のさらなる実施形態において、参照信号と劣化出力音声信号の比較は、出力音声信号と参照信号との間の知覚距離の計算を含む。
【0022】
一般的に、再符号化された音声信号の主観的音声品質の程度は、元の入力より低い。知覚距離測定値として、ITU−T SG12/課題13により標準化を求めて提出されたITU−T P.861またはPSQM99など、人間の聴覚の心理音響モデルが使用されてよい。知覚距離測定値は、知覚測定値をリコーダへ及び/またはその逆に適応させることにより、より高い精度で決定可能である。この代わりとして、劣化出力音声信号と参照音声信号との間の知覚距離は、出力音声信号の大きく歪んだ部分をフィルタリングして除去することにより、または、予測された品質が非常に低いか非常に高い場合に、出力音声信号にある大きな歪みを取り除くことにより、減少または増大されてよい。出力音声信号及び参照音声信号の平均値の処理は、これらの信号の間の知覚距離を減少させるために使用されてよい。
【0023】
実際のところ、出力音声信号は、その一部分または複数部分が消失され、すなわち、信号の振幅が、例えば、ゼロまたはほぼゼロまで減少されるという点で劣化されることがある。リコーダが劣化音声に対して透過性のものである場合、生成される参照音声信号は、消失した出力音声も同様に反映するため、出力音声信号と参照音声信号との比較により、目標とする品質測定値が得られないことを認識されたい。
【0024】
本発明による方法のさらなる実施形態において、この問題は、いわゆる、出力音声信号に特有のマクロ特性が取り出され、これらのマクロ特性が参照音声信号に課せられることで解消される。
【0025】
当業者により認識されるように、音声は、例えば、数十ミリ秒の間隔にわたって、瞬間的なエネルギーレベル及び音の一定の周期性を含む。一般的に、音声信号は、多数のいわゆるマクロ特性、すなわち、無音、バックグラウンドノイズ、周期性、元の振幅の急激な減少などにより特徴付けられる。これらのマクロ特性を出力音声信号から抽出し、それを参照信号に課すことにより、例えば、消失するか、音声信号のマクロ特性を乱した出力音声信号の一部分または複数部分が、参照信号において補償され得る。したがって、出力音声信号と参照信号とを引き続き比較することにより、マクロ特性を乱した一部分または複数部分による出力音声信号の劣化量を反映した品質測定値が得られることになる。
【0026】
出力音声信号から抽出されたマクロ特性は、本発明による方法のさらなる実施形態において、音声リコーダによる知覚近似の前に、出力音声信号に課せられてよい。本発明のさらなる実施形態において、マクロ特性は、音声リコーダによる知覚近似中に出力音声信号に課せられる。すなわち、参照音声コーデックをリコーダとして使用する間、マクロ特性は、出力音声信号を符号化した後及び参照コーデックによりそれを復号化する前に重畳されてよい。本発明のさらなる実施形態において、マクロ特性は、知覚近似後に出力音声信号に重畳され、すなわち、生成された参照音声信号に直接重畳される。さらに、マクロ特性は、劣化出力音声信号から生成された参照音声信号と比較するために、劣化出力音声信号に適用されることが好ましい場合がある。
【0027】
本発明の単純な実施形態において、音声信号のマクロ特性に対する乱れは、同様の歪みまたは乱れを参照音声信号に組み込むことにより補償されて、同じものが品質測定値に反映される。
【0028】
出力音声信号の知覚近似は、時間及び/または周波数ドメインに与えられてよい。後者の場合、本発明によれば、出力音声信号は、時間・周波数ドメイン変換を受け、参照音声信号は、変換された出力音声信号から取り出される。
【0029】
さらに、本発明によれば、上述した方法により、出力ベースの客観的音声の評価装置が提供される。
【0030】
本発明による方法及び装置は、VoIPや無線IP通信ネットワークなどのIP(インターネットプロトコル)ベースの通信ネットワークにおいて、出力音声信号の音声品質を評価するのに特に適しており、評価された音声品質は、ネットワークの音声及び伝送品質の実時間制御及び適応に使用されてよい。
【0031】
以下の記載において、添付の図面を参照しながら、本発明の上記及び他の特徴及び利点を説明する。
【0032】
【実施形態の詳細な説明】
図1に、IP(インターネットプロトコル)固定または無線通信システムなどの被試験システムが、参照符号1により概して示されている。システム1は、コーデック3として概して示された音声符号・復号手段を含む。
【0033】
例えば、無線、有線またはVoIP(ボイス・オーバー・インターネット・プロトコル)による音声伝送システムの電話端末に話者により与えられる元の入力音声信号が、システム1を介して伝送され、システム1の別の電話端末で劣化出力音声として受信される。劣化出力音声信号は、声または音声情報部分と、ノイズまたは歪み部分とを含む。
【0034】
出力音声信号の主観的品質の基準が、人間の被検者4を伴う公知の平均オピニオン評点(MOS)などの人間の聞き手の評価手法から得られる。
【0035】
被試験システム1により与えられる出力音声信号の音声品質の客観的基準が、客観的MOSとして例示的に参照された人間の被検者をモデリングしたコンピュータモデル5から引き出される。コンピュータモデル5は、劣化出力音声信号を表すデータと、元の入力音声信号を表すデータの両方を必要とする。
【0036】
しかしながら、本発明の目的である出力ベースの客観的音声品質評価において、元の入力音声信号を表すデータは入手できない。したがって、劣化出力音声信号と比較するために、参照データが生成されなければならない。
【0037】
本発明によれば、音声リコーダ2を使用して劣化出力音声信号を処理することにより、参照音声信号が生成される。音声リコーダ2は、有限ビット伝送速度の参照音声信号の形をした出力音声信号の音声情報部分の知覚近似を与える。
【0038】
図2は、本発明による客観的音声品質測定装置の実際的なセットアップを示し、音声リコーダは、特性が明瞭な音声信号に対して本質的に透過性のものであり、歪みのある音声信号に対して、入力音声信号の歪みの大きさの程度に応じて本質的に不透過性のものである参照音声コーデック6である。
【0039】
コーデック6は、バックグラウンドノイズ、クリック及び他の歪みが、出力される再符号化信号に現れないように、入力で音声信号を「歪ませ」、または「劣化させる」。すなわち、リコーダ6により再符号化された被試験システム1の劣化出力音声信号により、元の明瞭な入力音声信号の音声情報部分を表す参照音声信号が得られる。
【0040】
参照音声信号を受信した劣化出力音声信号と比較することにより、知覚品質測定手段7を使用して、品質測定値が与えられて、MOSの予測が得られる。
【0041】
参照音声コーデック6は、例えば、ITU−T G.729またはETSI 6.71規格に準拠したコーデックなどの任意の適切なタイプのものであってよい。
【0042】
知覚品質測定値として、ITU−T P.861またはPSQM99など、人間の聴覚の心理音響モデルが使用されてよく、再符号化された参照音声信号と劣化出力音声信号との間の知覚距離測定値を計算する。
【0043】
音声リコーダ2、すなわち、コーデック6が、従来技術の方法の固有の時間遅延を回避すると同時に、話者の音声を表すパラメータ及び他のデータを抽出するための計算集約型タスクを必要とせずに、参照音声信号を生成可能であることは、当業者により認識されるであろう。
【0044】
参照信号及びそれらの比較を与えるために劣化出力音声信号の処理または近似が、時間/周波数ドメインの両方に与えられてよい。後者の場合、図2に破線で示されているように、劣化出力音声信号は、時間周波数ドメイン変換(TFDT:Time Frequency Domain Transformation)11を受ける。
【0045】
図3は、例えば、劣化出力音声の一部分または複数部分が消失、すなわち、信号の振幅がゼロまたはほぼゼロになった場合、MOS予測値を補償する本発明の実施形態を示す。これは、例えば、オリジナルの入力音声信号が被試験システム1により一時的に消音される場合である。
【0046】
自然な無音、周期性、急激な振幅減少、バックグラウンドノイズなど、出力音声信号の声の程度を表す出力音声信号からマクロ特性を取り出すための手段8が作動的に接続される。マクロ特性は、手段8により劣化出力音声信号に課された後、音声リコーダ2または音声コーデック6によりそれを処理し、後者は、図3において、音声符号器9と後続の音声復号器10に分離されている。
【0047】
マクロ特性を抽出し課すための手段8は、図4に示されているように、音声リコーダ2とともに動作してもよく、手段8は、音声符号器9と音声復号器10との間に作動的に接続される。
【0048】
図5は、音声符号器9及び音声復号器10により与えられる再符号化された参照音声信号で手段8が作動する本発明の別の実施形態を示す。
【0049】
図6は、劣化出力音声から得られた再符号化音声を、マクロ特性が課された劣化出力音声と比較するための手段7の前に作動的に接続された手段8を示す。
【0050】
本発明の単純な実施形態において、音声信号のマクロ特性に対する乱れは、同様の歪みまたは乱れを参照音声信号に組み込むことにより補償されて、同じものが品質測定値に反映される(図示せず)。
【0051】
与えられるMOS予測は、特に、IP有線または無線データ通信ネットワークなどの通信ネットワークにおいて、音声品質及び/または伝送品質を制御するために使用可能である。
【0052】
実験的なセットアップから、出力ベースの客観的音声品質評価の従来の方法より、複雑性が著しく減り、アプローチの操作性が大幅に高められた高信頼性の出力ベース客観的音声品質評価が提供されることが確証された。
【図面の簡単な説明】
【図1】
図1は本発明による出力ベースの客観的音声品質評価の原理を示した略図である。
【図2】
図2は本発明による出力ベースの客観的音声品質の評価装置の一般的なブロック図である。
【図3】
図3は本発明による装置の実施形態のブロック図である。
【図4】
図4は本発明による装置の実施形態のブロック図である。
【図5】
図5は本発明による装置の実施形態のブロック図である。
【図6】
図6は本発明による装置の実施形態のブロック図である。
Claims (23)
- 音声情報部分を含む劣化出力音声信号が、前記出力音声信号から取り出された参照信号と比較される出力ベースの客観的音声品質の評価方法であって、前記参照信号は、有限のビット伝送速度の参照音声信号を生成する音声リコーダを使用して、前記出力音声信号の前記音声情報部分の知覚近似により与えられる方法。
- 前記参照音声信号は、音声リコーダなどの参照音声コーデックを使用して前記出力音声信号を再符号化することにより与えられる請求項1に記載の方法。
- 前記リコーダのタイプは、明瞭な歪みのない音声信号に対して本質的に透過性のものであり、歪みのある音声信号に対して、前記音声信号の歪みの大きさの程度に応じて、本質的に非透過性のものである請求項1または2に記載の方法。
- 前記出力音声信号を表すマクロ特性が取り出され、前記マクロ特性は、前記参照音声信号に課される請求項1から3のいずれか一項に記載の方法。
- 前記マクロ特性は、前記知覚近似の前に前記出力音声信号に課される請求項4に記載の方法。
- 前記マクロ特性は、前記知覚近似中に前記出力音声信号に課される請求項4に記載の方法。
- 前記マクロ特性は、前記知覚近似後に前記出力音声信号に課される請求項4に記載の方法。
- 前記出力音声信号を表すマクロ特性が取り出され、前記マクロ特性は、前記比較の前に前記出力音声信号に課される請求項1から3のいずれか一項に記載の方法。
- 前記比較は、前記出力音声信号と前記参照信号との間の知覚距離の計算を含む請求項1から8のいずれか一項に記載の方法。
- 前記出力音声信号は、時間/周波数ドメイン変換を受け、前記参照音声信号は、前記変換された出力音声信号から取り出される請求項1から9のいずれか一項に記載の方法。
- 音声情報を含む劣化出力音声信号から参照信号を取り出すために作動的に接続された取り出し手段と、前記出力音声信号を前記参照信号と比較するために作動的に接続された比較器とを含む出力ベースの客観的音声品質の評価のための装置であって、前記取り出し手段は、有限ビット伝送速度の参照音声信号を生成する音声リコーダを使用して、前記出力音声信号の前記音声情報部分を知覚近似するために作動的に接続された処理手段を含む装置。
- 前記取り出し手段は、前記出力音声信号の再符号化により、前記参照音声信号を与えるための音声リコーダとして参照音声コーデックを含む請求項11に記載の装置。
- 前記音声リコーダのタイプは、明瞭な歪みのない音声信号に対して本質的に透過性のものであり、歪みのある音声信号に対して、前記音声信号の歪みの大きさの程度に応じて、本質的に非透過性のものである請求項11または21に記載の方法。
- 前記出力音声信号を表すマクロ特性を取り出すために作動的に接続された手段と、前記マクロ特性を前記参照信号に課すための重畳手段とを含む請求項11から13のいずれか一項に記載の装置。
- 前記重畳手段は、前記知覚近似の前に前記マクロ特性を前記出力音声信号に課すために作動的に接続された請求項14に記載の装置。
- 前記重畳手段は、前記出力信号を知覚近似するために作動する前記処理手段を介して、前記マクロ特性を前記出力音声信号に課すために作動的に接続される請求項14に記載の装置。
- 前記重畳手段は、前記知覚近似後に前記マクロ特性を前記出力音声信号に課すために作動的に接続された請求項14に記載の装置。
- 前記重畳手段は、比較前に前記マクロ特性を前記出力音声信号に課すために作動的に接続された請求項14に記載の装置。
- 前記比較手段は、前記出力音声信号と前記参照信号との間の知覚距離を計算するために作動的に接続された請求項11から18のいずれか一項に記載の装置。
- 前記出力音声信号の時間/周波数ドメイン変換を行うための変換手段を含み、前記取り出し手段は、前記変換された出力音声信号から前記参照音声信号を取り出すために作動的に接続される請求項11から19のいずれか一項に記載の装置。
- IP(インターネットプロトコル)ベースの通信ネットワークにおいて、出力音声信号の音声品質を評価するための請求項1から20のいずれか一項に記載の方法及び装置の使用。
- 前記通信ネットワークが、無線IP通信ネットワークである請求項21に記載の方法及び装置の使用。
- 前記通信ネットワークにおいて音声品質を制御するための請求項21または22に記載の方法及び装置の使用。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP00203109A EP1187100A1 (en) | 2000-09-06 | 2000-09-06 | A method and a device for objective speech quality assessment without reference signal |
| PCT/EP2001/010154 WO2002021514A1 (en) | 2000-09-06 | 2001-09-03 | A method and a device for objective speech quality assessment without reference signal |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2004508596A true JP2004508596A (ja) | 2004-03-18 |
Family
ID=8171994
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002525646A Pending JP2004508596A (ja) | 2000-09-06 | 2001-09-03 | 出力ベースの客観的音声品質評価方法及び装置 |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US7024352B2 (ja) |
| EP (2) | EP1187100A1 (ja) |
| JP (1) | JP2004508596A (ja) |
| AT (1) | ATE338331T1 (ja) |
| AU (1) | AU2002213876A1 (ja) |
| DE (1) | DE60122751T2 (ja) |
| DK (1) | DK1317752T3 (ja) |
| ES (1) | ES2271084T3 (ja) |
| WO (1) | WO2002021514A1 (ja) |
Families Citing this family (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1298646B1 (en) * | 2001-10-01 | 2006-01-11 | Koninklijke KPN N.V. | Improved method for determining the quality of a speech signal |
| US7308403B2 (en) * | 2002-07-01 | 2007-12-11 | Lucent Technologies Inc. | Compensation for utterance dependent articulation for speech quality assessment |
| US7499856B2 (en) | 2002-12-25 | 2009-03-03 | Nippon Telegraph And Telephone Corporation | Estimation method and apparatus of overall conversational quality taking into account the interaction between quality factors |
| EP2854159B1 (en) * | 2003-06-02 | 2018-06-20 | Nikon Corporation | Multilayer film reflector and X-ray exposure system |
| EP1492084B1 (en) * | 2003-06-25 | 2006-05-17 | Psytechnics Ltd | Binaural quality assessment apparatus and method |
| US20050228655A1 (en) * | 2004-04-05 | 2005-10-13 | Lucent Technologies, Inc. | Real-time objective voice analyzer |
| US7392187B2 (en) * | 2004-09-20 | 2008-06-24 | Educational Testing Service | Method and system for the automatic generation of speech features for scoring high entropy speech |
| KR20060066416A (ko) * | 2004-12-13 | 2006-06-16 | 한국전자통신연구원 | 음성 코덱을 이용한 후두 원격 진단 서비스 장치 및 그 방법 |
| US7856355B2 (en) * | 2005-07-05 | 2010-12-21 | Alcatel-Lucent Usa Inc. | Speech quality assessment method and system |
| US8370132B1 (en) * | 2005-11-21 | 2013-02-05 | Verizon Services Corp. | Distributed apparatus and method for a perceptual quality measurement service |
| DE602006015328D1 (de) * | 2006-11-03 | 2010-08-19 | Psytechnics Ltd | Abtastfehlerkompensation |
| US8321222B2 (en) * | 2007-08-14 | 2012-11-27 | Nuance Communications, Inc. | Synthesis by generation and concatenation of multi-form segments |
| CN102157147B (zh) * | 2011-03-08 | 2012-05-30 | 公安部第一研究所 | 一种拾音系统语音质量客观评价的测试方法 |
| PL401371A1 (pl) * | 2012-10-26 | 2014-04-28 | Ivona Software Spółka Z Ograniczoną Odpowiedzialnością | Opracowanie głosu dla zautomatyzowanej zamiany tekstu na mowę |
| PL401372A1 (pl) * | 2012-10-26 | 2014-04-28 | Ivona Software Spółka Z Ograniczoną Odpowiedzialnością | Hybrydowa kompresja danych głosowych w systemach zamiany tekstu na mowę |
| DE102013005844B3 (de) * | 2013-03-28 | 2014-08-28 | Technische Universität Braunschweig | Verfahren und Vorrichtung zum Messen der Qualität eines Sprachsignals |
| US9396738B2 (en) | 2013-05-31 | 2016-07-19 | Sonus Networks, Inc. | Methods and apparatus for signal quality analysis |
| US10148526B2 (en) | 2013-11-20 | 2018-12-04 | International Business Machines Corporation | Determining quality of experience for communication sessions |
| US11888919B2 (en) | 2013-11-20 | 2024-01-30 | International Business Machines Corporation | Determining quality of experience for communication sessions |
| CN106531190B (zh) * | 2016-10-12 | 2020-05-05 | 科大讯飞股份有限公司 | 语音质量评价方法和装置 |
| RU2729147C1 (ru) * | 2020-04-02 | 2020-08-05 | Общество С Ограниченной Ответственностью "Центр Коррекции Слуха И Речи "Мелфон" (Ооо "Цкср "Мелфон") | Способ автоматизированной оценки качества распознавания речи пациентом |
| RU2743049C1 (ru) * | 2020-09-07 | 2021-02-15 | Общество С Ограниченной Ответственностью "Центр Коррекции Слуха И Речи "Мелфон" (Ооо "Цкср "Мелфон") | Способ доврачебной оценки качества распознавания речи, скрининговой аудиометрии и программно-аппаратный комплекс, его реализующий |
| CN114374924B (zh) * | 2022-01-07 | 2024-01-19 | 上海纽泰仑教育科技有限公司 | 录音质量检测方法及相关装置 |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FI94810C (fi) * | 1993-10-11 | 1995-10-25 | Nokia Mobile Phones Ltd | Menetelmä huonon GSM-puhekehyksen tunnistamiseksi |
| JPH10505718A (ja) * | 1994-08-18 | 1998-06-02 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | オーディオ品質の解析 |
| US5706392A (en) * | 1995-06-01 | 1998-01-06 | Rutgers, The State University Of New Jersey | Perceptual speech coder and method |
| US6201960B1 (en) * | 1997-06-24 | 2001-03-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech quality measurement based on radio link parameters and objective measurement of received speech signals |
| US6330428B1 (en) * | 1998-12-23 | 2001-12-11 | Nortel Networks Limited | Voice quality performance evaluator and method of operation in conjunction with a communication network |
| US6246978B1 (en) * | 1999-05-18 | 2001-06-12 | Mci Worldcom, Inc. | Method and system for measurement of speech distortion from samples of telephonic voice signals |
| US6609092B1 (en) * | 1999-12-16 | 2003-08-19 | Lucent Technologies Inc. | Method and apparatus for estimating subjective audio signal quality from objective distortion measures |
-
2000
- 2000-09-06 EP EP00203109A patent/EP1187100A1/en not_active Withdrawn
-
2001
- 2001-09-03 DE DE60122751T patent/DE60122751T2/de not_active Expired - Lifetime
- 2001-09-03 WO PCT/EP2001/010154 patent/WO2002021514A1/en not_active Ceased
- 2001-09-03 AT AT01982239T patent/ATE338331T1/de active
- 2001-09-03 EP EP01982239A patent/EP1317752B1/en not_active Expired - Lifetime
- 2001-09-03 JP JP2002525646A patent/JP2004508596A/ja active Pending
- 2001-09-03 US US10/363,235 patent/US7024352B2/en not_active Expired - Lifetime
- 2001-09-03 AU AU2002213876A patent/AU2002213876A1/en not_active Abandoned
- 2001-09-03 DK DK01982239T patent/DK1317752T3/da active
- 2001-09-03 ES ES01982239T patent/ES2271084T3/es not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| DE60122751T2 (de) | 2007-08-30 |
| AU2002213876A1 (en) | 2002-03-22 |
| EP1317752B1 (en) | 2006-08-30 |
| ES2271084T3 (es) | 2007-04-16 |
| DK1317752T3 (da) | 2007-01-08 |
| US20030171922A1 (en) | 2003-09-11 |
| US7024352B2 (en) | 2006-04-04 |
| EP1317752A1 (en) | 2003-06-11 |
| EP1187100A1 (en) | 2002-03-13 |
| ATE338331T1 (de) | 2006-09-15 |
| DE60122751D1 (de) | 2006-10-12 |
| WO2002021514A1 (en) | 2002-03-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2004508596A (ja) | 出力ベースの客観的音声品質評価方法及び装置 | |
| JP5006343B2 (ja) | 不侵入の信号の品質評価 | |
| CN1185626C (zh) | 修改语音信号的系统和方法 | |
| CN1838239B (zh) | 一种用于增强信源解码器的设备及方法 | |
| JP4173641B2 (ja) | 音声活動に基づくゲイン制限による音声強化 | |
| KR101143724B1 (ko) | 부호화 장치 및 부호화 방법, 및 부호화 장치를 구비한 통신 단말 장치 및 기지국 장치 | |
| JP4302978B2 (ja) | 音声コーデックにおける擬似高帯域信号の推定システム | |
| JP2010540990A (ja) | 埋め込み話声およびオーディオコーデックにおける変換情報の効率的量子化のための方法および装置 | |
| TWI281657B (en) | Method and system for speech coding | |
| JP3999807B2 (ja) | 改良された周波数領域におけるエラー隠蔽技術 | |
| KR100216018B1 (ko) | 배경음을 엔코딩 및 디코딩하는 방법 및 장치 | |
| JP3144009B2 (ja) | 音声符号復号化装置 | |
| JP2953238B2 (ja) | 音質主観評価予測方式 | |
| WO2002101721A1 (en) | Improved method for determining the quality of a speech signal | |
| Cai et al. | Speech quality evaluation: A new application of digital watermarking | |
| JP3616307B2 (ja) | 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体 | |
| KR20060067016A (ko) | 음성 부호화 장치 및 방법 | |
| JP2004222257A (ja) | 総合通話品質推定方法及び装置、その方法を実行するプログラム、及びその記録媒体 | |
| JPH0784596A (ja) | 符号化音声の品質評価方法 | |
| Beritelli et al. | A psychoacoustic auditory model to evaluate the performance of a voice activity detector | |
| JP6713424B2 (ja) | 音声復号装置、音声復号方法、プログラム、および記録媒体 | |
| Lindblom et al. | Error protection and packet loss concealment based on a signal matched sinusoidal vocoder | |
| Gibson et al. | New rate distortion bounds for speech coding based on composite source models | |
| JPH0235994B2 (ja) | ||
| Hoene et al. | Error propagation after Concealing a lost speech frame |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060328 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20060526 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20060602 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060928 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061107 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070205 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070315 |
|
| A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20070406 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080908 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080911 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20081008 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20081015 |