JPH11352992A - 複数ワ―ドを表示する方法および装置 - Google Patents
複数ワ―ドを表示する方法および装置Info
- Publication number
- JPH11352992A JPH11352992A JP11132377A JP13237799A JPH11352992A JP H11352992 A JPH11352992 A JP H11352992A JP 11132377 A JP11132377 A JP 11132377A JP 13237799 A JP13237799 A JP 13237799A JP H11352992 A JPH11352992 A JP H11352992A
- Authority
- JP
- Japan
- Prior art keywords
- words
- displayed
- displaying
- confidence value
- confidence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Controls And Circuits For Display Device (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】
【課題】 複数の表示ワードからなるテキストのより簡
単なより速い訂正が可能な、音声信号から引き出された
複数ワードを表示する方法および装置を提供せんとす
る。 【解決手段】 本発明に係る複数ワードを表示する方法
に使用される装置は、音響音声信号入力から引き出され
た複数ワードを表示する装置であって:音響音声信号を
受信し、前記信号とともに関連した複数の信頼値から引
き出される複数ワードを表わすデータを供給する処理デ
バイス(12,14,16,18)と;表示デバイス(22)用の制御信
号に前記データを変換する制御デバイス(20)とを具えた
複数ワードを表示する装置において、複数の信頼値を表
わすデータが表示デバイス(22)用の関連複数ワードに対
応する複数制御信号を変える目的で制御デバイス(20)に
供給される。
単なより速い訂正が可能な、音声信号から引き出された
複数ワードを表示する方法および装置を提供せんとす
る。 【解決手段】 本発明に係る複数ワードを表示する方法
に使用される装置は、音響音声信号入力から引き出され
た複数ワードを表示する装置であって:音響音声信号を
受信し、前記信号とともに関連した複数の信頼値から引
き出される複数ワードを表わすデータを供給する処理デ
バイス(12,14,16,18)と;表示デバイス(22)用の制御信
号に前記データを変換する制御デバイス(20)とを具えた
複数ワードを表示する装置において、複数の信頼値を表
わすデータが表示デバイス(22)用の関連複数ワードに対
応する複数制御信号を変える目的で制御デバイス(20)に
供給される。
Description
【0001】
【発明の属する技術分野】この発明は、各ワードについ
て信頼値が形成され、音声信号入力から引き出された複
数ワードを表示デバイスに表示する方法に関するもので
ある。
て信頼値が形成され、音声信号入力から引き出された複
数ワードを表示デバイスに表示する方法に関するもので
ある。
【0002】
【従来の技術】かかる方法は音声信号から引き出された
複数ワードがスクリーンに表示される所謂ディクテーシ
ョンシステム(口述システム,dictation system) にお
いて公知である。口述から引き出されたテキスト(text)
の直接印刷は一般的に現実的ではない、それはスクリー
ン上に示されたテキストに基づいて始めに訂正されねば
ならないあまりにも多くの誤りが現在公知のシステムで
発生するからである。
複数ワードがスクリーンに表示される所謂ディクテーシ
ョンシステム(口述システム,dictation system) にお
いて公知である。口述から引き出されたテキスト(text)
の直接印刷は一般的に現実的ではない、それはスクリー
ン上に示されたテキストに基づいて始めに訂正されねば
ならないあまりにも多くの誤りが現在公知のシステムで
発生するからである。
【0003】
【発明が解決しようとする課題】この訂正を実行するに
は、オペレータ(operator)は、システムにより完全には
認識されなかったワードを決定して訂正するために、必
要なら口述され記憶されたテキスト、すなはち音声信号
を聴取する際に、表示されたテキストを注意深く読み取
らねばならない。このことは、かなりの時間量を必要と
し、口述テキストを表示テキストに自動変換することに
よる時間節約を一部打ち消してしまう。本発明の目的
は、複数の表示ワードからなるテキストのより簡単なよ
り速い訂正が可能な冒頭のパラグラフに記載した方法を
提供せんとするものである。
は、オペレータ(operator)は、システムにより完全には
認識されなかったワードを決定して訂正するために、必
要なら口述され記憶されたテキスト、すなはち音声信号
を聴取する際に、表示されたテキストを注意深く読み取
らねばならない。このことは、かなりの時間量を必要と
し、口述テキストを表示テキストに自動変換することに
よる時間節約を一部打ち消してしまう。本発明の目的
は、複数の表示ワードからなるテキストのより簡単なよ
り速い訂正が可能な冒頭のパラグラフに記載した方法を
提供せんとするものである。
【0004】
【課題を解決するための手段】本発明によれば、この目
的は複数ワードがそれらそれぞれの信頼値に依存して異
なった方法で表示されることにより達成される。音声信
号から引き出された各ワードに関する信頼値の決定はI
CASSP1995,vol. I,pp.297-300,に公知であ
り、種々の目的、例えば音声信号から引き出された1つ
のワードが情報システム、特に対話が保持されるシステ
ムで受け取られるべきか拒絶されるべきかを決定するの
に役に立つ。事実信頼値はまた、あるワードが認識さ
れ、すなはち特に、認識されたワードがシステムに記憶
された音響モデルに如何によく対応するか、そして言語
モデルが使用される時、このワードが認識されるワード
並びのその位置に如何なる確立で発生するかの確からし
さの程度の目安となる。本発明によれば、信頼値は今や
テキストで口述ワードが正確に決定されなかった確立を
表示するのに使用される。訂正処理の際に低い信頼値を
有するワードの視覚的強調は、オペレータをしてどのワ
ードがどうしても正確に認識されなかったかを速やかに
確かめることを可能とし、それでこのワードをその時よ
り速やかに訂正できる。
的は複数ワードがそれらそれぞれの信頼値に依存して異
なった方法で表示されることにより達成される。音声信
号から引き出された各ワードに関する信頼値の決定はI
CASSP1995,vol. I,pp.297-300,に公知であ
り、種々の目的、例えば音声信号から引き出された1つ
のワードが情報システム、特に対話が保持されるシステ
ムで受け取られるべきか拒絶されるべきかを決定するの
に役に立つ。事実信頼値はまた、あるワードが認識さ
れ、すなはち特に、認識されたワードがシステムに記憶
された音響モデルに如何によく対応するか、そして言語
モデルが使用される時、このワードが認識されるワード
並びのその位置に如何なる確立で発生するかの確からし
さの程度の目安となる。本発明によれば、信頼値は今や
テキストで口述ワードが正確に決定されなかった確立を
表示するのに使用される。訂正処理の際に低い信頼値を
有するワードの視覚的強調は、オペレータをしてどのワ
ードがどうしても正確に認識されなかったかを速やかに
確かめることを可能とし、それでこのワードをその時よ
り速やかに訂正できる。
【0005】信頼値に依存する複数ワードの表示は、種
々の方法で行なわれる。1つの可能性は信頼値に依存し
て灰色の色調でワードを表示する事である。他の可能性
は信頼値に依存して表示された色彩を変える事である。
複数ワードはまた、信頼値に依存する異なった背景に対
し、異なった字体の文字で、またはアンダーライン付で
表示されることができる。ここで表現“字体”は一般に
文字の異なった形状、太字、イタリックまたは他の規格
外の文字形態を含むものとする。個々の可能性の組み合
わせが使用され得て、例えば、かなり低い信頼値を有す
るワードは異なった灰色の色調または異なった色彩のみ
ならず、アンダーライン付でまた表示可能である。
々の方法で行なわれる。1つの可能性は信頼値に依存し
て灰色の色調でワードを表示する事である。他の可能性
は信頼値に依存して表示された色彩を変える事である。
複数ワードはまた、信頼値に依存する異なった背景に対
し、異なった字体の文字で、またはアンダーライン付で
表示されることができる。ここで表現“字体”は一般に
文字の異なった形状、太字、イタリックまたは他の規格
外の文字形態を含むものとする。個々の可能性の組み合
わせが使用され得て、例えば、かなり低い信頼値を有す
るワードは異なった灰色の色調または異なった色彩のみ
ならず、アンダーライン付でまた表示可能である。
【0006】特徴ある表示が、例えば、信頼値に比例す
るように発生できる。しかしながら、このことは、少な
くとも1つの閾値が信頼値のために用意され、前記少な
くとも1つの閾値または複数の閾値のなかの1つの閾値
をその信頼値が越えるかどうかに依存して表示が発生す
る時に、異なった字体の文字またはアンダーライン付に
より表示される場合特に実際的である。最高に高い閾値
以上の十分に高い信頼値で決定されたワードは正規に表
示され、一方前記最高に高い閾値または任意の閾値以下
の信頼値を有するワードのみが異なった方法で表示され
る。かかるワードはその時より速く認識され、それでこ
のワードの訂正は、必要なら、より容易になされる。
るように発生できる。しかしながら、このことは、少な
くとも1つの閾値が信頼値のために用意され、前記少な
くとも1つの閾値または複数の閾値のなかの1つの閾値
をその信頼値が越えるかどうかに依存して表示が発生す
る時に、異なった字体の文字またはアンダーライン付に
より表示される場合特に実際的である。最高に高い閾値
以上の十分に高い信頼値で決定されたワードは正規に表
示され、一方前記最高に高い閾値または任意の閾値以下
の信頼値を有するワードのみが異なった方法で表示され
る。かかるワードはその時より速く認識され、それでこ
のワードの訂正は、必要なら、より容易になされる。
【0007】このことは前記少なくとも1つの閾値また
は複数の閾値が可変である時有用である。閾値における
かかる変化は、例えば、正確に認識された多くのワード
が異なった方法で不必要に表示されるのをオペレータが
認識する場合オペレータにより有効になされ得る。かか
る変化はまた、ほんのわずか削減された信頼値の理由で
異なって表示された多くのワードが、それでもオペレー
タによる補正として特徴付けられる時には、システムに
より自動的に実施されることができる。
は複数の閾値が可変である時有用である。閾値における
かかる変化は、例えば、正確に認識された多くのワード
が異なった方法で不必要に表示されるのをオペレータが
認識する場合オペレータにより有効になされ得る。かか
る変化はまた、ほんのわずか削減された信頼値の理由で
異なって表示された多くのワードが、それでもオペレー
タによる補正として特徴付けられる時には、システムに
より自動的に実施されることができる。
【0008】表示されたテキストの補正は一般に、カー
ソルがテキストの引き続く複数ワードに、これら複数ワ
ードが引き出され記憶された音声信号の再生と多分並列
に自動的に置かれて実施される。カーソルは特に異なっ
て表示されたワードで、例えばオペレータが不正確と認
識するならこのワードを補正するようにキーが操作され
て停止されることができる。各口述されたワードからワ
ードを決定しそれを表示するのみならず、単一のワード
または完全な別の文章用に別のワードを提供するシステ
ムがまたあり、このシステムはEP(ヨーロッパ特許)
0614172A2号に公知で、その場合、カーソルが
好適に信頼値の順序で停止されるワードに隣接してかか
る別のワードが自動的に表示される時それは有用であ
る。補正はその時より速く実施される。
ソルがテキストの引き続く複数ワードに、これら複数ワ
ードが引き出され記憶された音声信号の再生と多分並列
に自動的に置かれて実施される。カーソルは特に異なっ
て表示されたワードで、例えばオペレータが不正確と認
識するならこのワードを補正するようにキーが操作され
て停止されることができる。各口述されたワードからワ
ードを決定しそれを表示するのみならず、単一のワード
または完全な別の文章用に別のワードを提供するシステ
ムがまたあり、このシステムはEP(ヨーロッパ特許)
0614172A2号に公知で、その場合、カーソルが
好適に信頼値の順序で停止されるワードに隣接してかか
る別のワードが自動的に表示される時それは有用であ
る。補正はその時より速く実施される。
【0009】本発明はさらに、音響音声信号入力から引
き出された複数ワードを表示する装置であって:音響音
声信号を受信し、前記信号および関連した複数の信頼値
から引き出される複数ワードを表わすデータを供給する
処理デバイスと;表示デバイス用の制御信号に前記デー
タを変換する制御デバイスとを具えた複数ワードを表示
する装置に関係する。
き出された複数ワードを表示する装置であって:音響音
声信号を受信し、前記信号および関連した複数の信頼値
から引き出される複数ワードを表わすデータを供給する
処理デバイスと;表示デバイス用の制御信号に前記デー
タを変換する制御デバイスとを具えた複数ワードを表示
する装置に関係する。
【0010】この装置の目的は、表示デバイスに表示さ
れた複数ワード間からおそらく不正確に認識された複数
ワードをかかる回路配置でより速やかに認識するにあ
る。本発明はさらに、複数信頼値を表すデータが関連複
数ワード用に発生された表示デバイス用にこの制御信号
を変える目的で制御デバイスに供給されることを特徴と
するものである。
れた複数ワード間からおそらく不正確に認識された複数
ワードをかかる回路配置でより速やかに認識するにあ
る。本発明はさらに、複数信頼値を表すデータが関連複
数ワード用に発生された表示デバイス用にこの制御信号
を変える目的で制御デバイスに供給されることを特徴と
するものである。
【0011】認識された複数ワードの文字を表わすデー
タは一般に8ビットデータワードである。これらは制御
デバイスに供給され、このデバイスはデータワードを、
例えば複数ワードを明瞭なテキストとして表示するよう
に受像管用の制御信号に変換する。この目的用の制御デ
バイスは付加的な制御コマンドを受け取り、そのコマン
ドはそのテキストがどのような方法で表示されたか、例
えばどのような大きさの字体か、どのような字体の文字
か、どのような色彩かなどなど。制御デバイスに供給さ
れた信頼値、またはそれから引き出されたデータは、次
に複数ワードが如何に表示されるべきかを決定する付加
的制御コマンドとして制御デバイスに供給される。
タは一般に8ビットデータワードである。これらは制御
デバイスに供給され、このデバイスはデータワードを、
例えば複数ワードを明瞭なテキストとして表示するよう
に受像管用の制御信号に変換する。この目的用の制御デ
バイスは付加的な制御コマンドを受け取り、そのコマン
ドはそのテキストがどのような方法で表示されたか、例
えばどのような大きさの字体か、どのような字体の文字
か、どのような色彩かなどなど。制御デバイスに供給さ
れた信頼値、またはそれから引き出されたデータは、次
に複数ワードが如何に表示されるべきかを決定する付加
的制御コマンドとして制御デバイスに供給される。
【0012】
【発明の実例の形態】以下添付図面を参照し実施例によ
り本発明の実例の形態を詳細に説明する。添付唯1つの
図面図1では、音響学的に供給された音声信号がマイク
ロホン10により電気信号に変換され、次にその電気信
号の音声信号を特徴付ける一連のテスト信号に変換する
前処理ユニット12に印加される。これらテスト信号は
処理デバイス14に供給され、このデバイスはまた各テ
スト信号と数多くの基準信号との間の比較を実施するよ
うメモリ16から基準信号を受け取る。複数ワードはあ
る基準信号の配列とテスト信号の配列との間の類似性か
ら決定され、そのため別のメモリ18からの複数言語モ
デル値が一般に使用され、前記複数ワードはメモリ16
の一連の基準信号により規定される。
り本発明の実例の形態を詳細に説明する。添付唯1つの
図面図1では、音響学的に供給された音声信号がマイク
ロホン10により電気信号に変換され、次にその電気信
号の音声信号を特徴付ける一連のテスト信号に変換する
前処理ユニット12に印加される。これらテスト信号は
処理デバイス14に供給され、このデバイスはまた各テ
スト信号と数多くの基準信号との間の比較を実施するよ
うメモリ16から基準信号を受け取る。複数ワードはあ
る基準信号の配列とテスト信号の配列との間の類似性か
ら決定され、そのため別のメモリ18からの複数言語モ
デル値が一般に使用され、前記複数ワードはメモリ16
の一連の基準信号により規定される。
【0013】これら複数ワード、またはこれら複数ワー
ドの文字は、引き続いて制御デバイス20にライン15
で供給される。このデバイスは図示されていない方法
で、データ信号を好適には受像管22の制御信号にライ
ン15で変換するよう、制御デバイスに前以て好適に供
給された制御コマンドにより同調される。
ドの文字は、引き続いて制御デバイス20にライン15
で供給される。このデバイスは図示されていない方法
で、データ信号を好適には受像管22の制御信号にライ
ン15で変換するよう、制御デバイスに前以て好適に供
給された制御コマンドにより同調される。
【0014】加うるに、複数の信頼値はメモリ16から
の基準信号と処理デバイス14のテスト信号との比較、
多分またメモリ18からの言語モデル信号の使用との比
較で個々のワードについて形成され、これら信頼値は制
御デバイス20にライン17を介してまた供給される。
前記複数の信頼値はここで上に述べた複数の制御コマン
ドの方法、すなはちそれらコマンドが受像管22用の制
御信号の発生で制御ユニット20に影響する方法と同じ
方法で作用し、それで複数ワードはそれら複数の信頼値
に依存して表示される。複数の信頼値は次に、例えば、
また処理デバイス14の1つまたはいくつかの閾値と比
較され、それで関連ワードの信頼値がある複数閾値の上
にあるか下にあるかをしめす信号のみがライン17を通
って送信される。複数コマンドは処理デバイス14へ入
力デバイス24、例えば、キイボードを介して送信さ
れ、これらコマンドは複数閾値を変化できる。加うる
に、音声信号から正確に引き出されない複数ワードの補
正値はまたこの入力デバイス24により入力される。こ
れら制御コマンドはまたこの入力デバイス24を介して
送信され、これらコマンドは与えられた1つの表示ワー
ドに対して別の複数のワードの表示を止めて前記別の複
数のワードのなかから1つのワードを選択する。
の基準信号と処理デバイス14のテスト信号との比較、
多分またメモリ18からの言語モデル信号の使用との比
較で個々のワードについて形成され、これら信頼値は制
御デバイス20にライン17を介してまた供給される。
前記複数の信頼値はここで上に述べた複数の制御コマン
ドの方法、すなはちそれらコマンドが受像管22用の制
御信号の発生で制御ユニット20に影響する方法と同じ
方法で作用し、それで複数ワードはそれら複数の信頼値
に依存して表示される。複数の信頼値は次に、例えば、
また処理デバイス14の1つまたはいくつかの閾値と比
較され、それで関連ワードの信頼値がある複数閾値の上
にあるか下にあるかをしめす信号のみがライン17を通
って送信される。複数コマンドは処理デバイス14へ入
力デバイス24、例えば、キイボードを介して送信さ
れ、これらコマンドは複数閾値を変化できる。加うる
に、音声信号から正確に引き出されない複数ワードの補
正値はまたこの入力デバイス24により入力される。こ
れら制御コマンドはまたこの入力デバイス24を介して
送信され、これらコマンドは与えられた1つの表示ワー
ドに対して別の複数のワードの表示を止めて前記別の複
数のワードのなかから1つのワードを選択する。
【図1】 本発明に係る実施例の構成ブロック線図を示
す図。
す図。
10 マイクロホン 12 前処理ユニット 14 処理ユニット 15,17,25 ライン 16 メモリ 18 別のメモリ 20 制御ユニット 22 受像機 24 入力デバイス
───────────────────────────────────────────────────── フロントページの続き (71)出願人 590000248 Groenewoudseweg 1, 5621 BA Eindhoven, Th e Netherlands
Claims (10)
- 【請求項1】 各ワードについて信頼値が形成され、音
声信号入力から引き出された複数ワードを表示デバイス
に表示する方法において、複数ワードがそれらそれぞれ
の信頼値に依存して異なった方法で表示されることを特
徴とする複数ワードを表示する方法。 - 【請求項2】 請求項1記載の方法において、複数ワー
ドが信頼値に依存して灰色の色調で表示されることを特
徴とする複数ワードを表示する方法。 - 【請求項3】 請求項1記載の方法において、複数ワー
ドが信頼値に依存して色彩で表示されることを特徴とす
る複数ワードを表示する方法。 - 【請求項4】 請求項1記載の方法において、複数ワー
ドが信頼値に依存して文字の字体で表示されることを特
徴とする複数ワードを表示する方法。 - 【請求項5】 請求項1記載の方法において、複数ワー
ドが信頼値に依存してアンダーライン付で表示されるこ
とを特徴とする複数ワードを表示する方法。 - 【請求項6】 請求項1記載の方法において、複数ワー
ドが信頼値に依存する背景と対照して表示されることを
特徴とする複数ワードを表示する方法。 - 【請求項7】 請求項1から6いずれか記載の方法にお
いて、少なくとも1つの閾値が信頼値用に設けられ、前
記信頼値が前記少なくとも1つの閾値または複数の閾値
のうちの1つの閾値を越えるかどうかに依存して表示が
発生することを特徴とする複数ワードを表示する方法。 - 【請求項8】 請求項7記載の方法において、前記1つ
の閾値または複数の閾値が可変であることを特徴とする
複数ワードを表示する方法。 - 【請求項9】 より低い信頼値を有する別の複数ワード
が少なくとも幾つかのワード用の音声信号から発生され
る請求項7または8記載の方法において、信頼値が少な
くとも1つの閾値以下にある少なくとも1つの別のワー
ドがあるコマンドの入力で表示され、さらに別のコマン
ドの入力でもとの表示されたワードに置き換わるよう挿
入されることを特徴とする複数ワードを表示する方法。 - 【請求項10】 音響音声信号入力から引き出された複
数ワードを表示デバイスに表示する装置であって:音響
音声信号を受信し、前記信号とともに関連した複数の信
頼値から引き出される複数ワードを表わすデータを供給
する処理デバイス(12,14,16,18)と;表示デバイス(22)
用の制御信号に前記データを変換する制御デバイス(20)
とを具えた複数ワードを表示する装置において、複数の
信頼値を表わすデータが表示デバイス(22)用の関連複数
ワードに対応する制御信号を変える目的で制御デバイス
(20)に供給されることを特徴とする複数ワードを表示す
る装置。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19821422:7 | 1998-05-13 | ||
| DE19821422A DE19821422A1 (de) | 1998-05-13 | 1998-05-13 | Verfahren zum Darstellen von aus einem Sprachsignal ermittelten Wörtern |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH11352992A true JPH11352992A (ja) | 1999-12-24 |
Family
ID=7867631
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11132377A Pending JPH11352992A (ja) | 1998-05-13 | 1999-05-13 | 複数ワ―ドを表示する方法および装置 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US20020128833A1 (ja) |
| EP (1) | EP0957470A3 (ja) |
| JP (1) | JPH11352992A (ja) |
| KR (1) | KR19990088216A (ja) |
| CN (1) | CN1238489A (ja) |
| DE (1) | DE19821422A1 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006522363A (ja) * | 2003-03-31 | 2006-09-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信頼水準の指示により音声認識の結果を訂正するためのシステム |
Families Citing this family (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6006183A (en) * | 1997-12-16 | 1999-12-21 | International Business Machines Corp. | Speech recognition confidence level display |
| WO2002009093A1 (en) * | 2000-07-20 | 2002-01-31 | Koninklijke Philips Electronics N.V. | Feedback of recognized command confidence level |
| US6785650B2 (en) * | 2001-03-16 | 2004-08-31 | International Business Machines Corporation | Hierarchical transcription and display of input speech |
| DE10138408A1 (de) * | 2001-08-04 | 2003-02-20 | Philips Corp Intellectual Pty | Verfahren zur Unterstützung des Korrekturlesens eines spracherkannten Textes mit an die Erkennungszuverlässigkeit angepasstem Wiedergabegeschwindigkeitsverlauf |
| DE60211197T2 (de) * | 2001-10-31 | 2007-05-03 | Koninklijke Philips Electronics N.V. | Verfahren und vorrichtung zur wandlung gesprochener in geschriebene texte und korrektur der erkannten texte |
| EP1361740A1 (de) * | 2002-05-08 | 2003-11-12 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachinformationen eines Dialogs |
| EP1363271A1 (de) | 2002-05-08 | 2003-11-19 | Sap Ag | Verfahren und System zur Verarbeitung und Speicherung von Sprachinformationen eines Dialogs |
| DE10220524B4 (de) | 2002-05-08 | 2006-08-10 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachdaten und zur Erkennung einer Sprache |
| DE10220521B4 (de) * | 2002-05-08 | 2005-11-24 | Sap Ag | Verfahren und System zur Verarbeitung von Sprachdaten und Klassifizierung von Gesprächen |
| US6993482B2 (en) * | 2002-12-18 | 2006-01-31 | Motorola, Inc. | Method and apparatus for displaying speech recognition results |
| JP2004208858A (ja) * | 2002-12-27 | 2004-07-29 | Toshiba Corp | 超音波診断装置及び超音波画像処理装置 |
| KR101462932B1 (ko) | 2008-05-28 | 2014-12-04 | 엘지전자 주식회사 | 이동 단말기 및 그의 텍스트 수정방법 |
| KR101233561B1 (ko) | 2011-05-12 | 2013-02-14 | 엔에이치엔(주) | 단어 수준의 후보 생성에 기초한 음성 인식 시스템 및 방법 |
| JP5799733B2 (ja) * | 2011-10-12 | 2015-10-28 | 富士通株式会社 | 認識装置、認識プログラムおよび認識方法 |
| US9558747B2 (en) * | 2014-12-10 | 2017-01-31 | Honeywell International Inc. | High intelligibility voice announcement system |
| WO2020166183A1 (ja) * | 2019-02-13 | 2020-08-20 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5884258A (en) * | 1996-10-31 | 1999-03-16 | Microsoft Corporation | Method and system for editing phrases during continuous speech recognition |
| US6006183A (en) * | 1997-12-16 | 1999-12-21 | International Business Machines Corp. | Speech recognition confidence level display |
-
1998
- 1998-05-13 DE DE19821422A patent/DE19821422A1/de not_active Withdrawn
-
1999
- 1999-05-06 EP EP99201424A patent/EP0957470A3/de not_active Withdrawn
- 1999-05-10 CN CN99106731A patent/CN1238489A/zh active Pending
- 1999-05-10 US US09/307,979 patent/US20020128833A1/en not_active Abandoned
- 1999-05-12 KR KR1019990016923A patent/KR19990088216A/ko not_active Withdrawn
- 1999-05-13 JP JP11132377A patent/JPH11352992A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006522363A (ja) * | 2003-03-31 | 2006-09-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信頼水準の指示により音声認識の結果を訂正するためのシステム |
Also Published As
| Publication number | Publication date |
|---|---|
| EP0957470A3 (de) | 1999-12-15 |
| US20020128833A1 (en) | 2002-09-12 |
| DE19821422A1 (de) | 1999-11-18 |
| CN1238489A (zh) | 1999-12-15 |
| EP0957470A2 (de) | 1999-11-17 |
| KR19990088216A (ko) | 1999-12-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH11352992A (ja) | 複数ワ―ドを表示する方法および装置 | |
| CA2001164C (en) | Text-processing system | |
| US7617106B2 (en) | Error detection for speech to text transcription systems | |
| US4769845A (en) | Method of recognizing speech using a lip image | |
| JP4241376B2 (ja) | 認識されたテキスト中の音声シーケンスと手動入力される補正ワードの音声転写との比較を通した音声認識により認識されたテキストの補正 | |
| EP0865651B1 (en) | Method of and system for recognizing a spoken text | |
| US7676373B2 (en) | Displaying text of speech in synchronization with the speech | |
| JP4145796B2 (ja) | テキストファイルのディクテーションを筆記するための及びテキストを修正するための方法及びシステム | |
| US20080270134A1 (en) | Hybrid-captioning system | |
| KR19990062566A (ko) | 음성 인식 신뢰도 레벨 디스플레이 | |
| KR20010054622A (ko) | 음성 인식 시스템의 음성 인식률 향상 방법 | |
| JP2011002656A (ja) | 音声認識結果修正候補検出装置、音声書き起こし支援装置、方法及びプログラム | |
| JPH11194793A (ja) | 音声ワープロ | |
| JPH10254489A (ja) | 数字用音声認識システム | |
| JPH04248596A (ja) | 音声認識訂正装置 | |
| JP2003186491A (ja) | 電子化テキスト作成支援システム | |
| KR102267276B1 (ko) | 학습데이터 확장 및 후처리 정제 기능을 가지는 음성 텍스트 변환 시스템 및 방법 | |
| JPH11352988A (ja) | 音声認識装置 | |
| JPH0736481A (ja) | 補完音声認識装置 | |
| JP6991409B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
| JPH0654503B2 (ja) | パタ−ン認識装置 | |
| JP2002268679A (ja) | 音声認識結果の誤り検出方法及び装置及び音声認識結果の誤り検出プログラム | |
| JPH0222400B2 (ja) | ||
| JP2002116788A (ja) | 音素認識装置および方法 | |
| KR20220022159A (ko) | 콘텐츠에 대한 자막 동기화를 수행하는 전자 장치 및 방법 |