JPH11352992A

JPH11352992A - 複数ワ―ドを表示する方法および装置

Info

Publication number: JPH11352992A
Application number: JP11132377A
Authority: JP
Inventors: Volker Dr Steinbiss; シュタインビスフォルケル
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 1998-05-13
Filing date: 1999-05-13
Publication date: 1999-12-24
Also published as: EP0957470A3; US20020128833A1; DE19821422A1; CN1238489A; EP0957470A2; KR19990088216A

Abstract

(57)【要約】【課題】複数の表示ワードからなるテキストのより簡
単なより速い訂正が可能な、音声信号から引き出された
複数ワードを表示する方法および装置を提供せんとす
る。【解決手段】本発明に係る複数ワードを表示する方法
に使用される装置は、音響音声信号入力から引き出され
た複数ワードを表示する装置であって：音響音声信号を
受信し、前記信号とともに関連した複数の信頼値から引
き出される複数ワードを表わすデータを供給する処理デ
バイス(12,14,16,18）と；表示デバイス(22)用の制御信
号に前記データを変換する制御デバイス(20)とを具えた
複数ワードを表示する装置において、複数の信頼値を表
わすデータが表示デバイス(22)用の関連複数ワードに対
応する複数制御信号を変える目的で制御デバイス(20)に
供給される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、各ワードについ
て信頼値が形成され、音声信号入力から引き出された複
数ワードを表示デバイスに表示する方法に関するもので
ある。

【０００２】

【従来の技術】かかる方法は音声信号から引き出された
複数ワードがスクリーンに表示される所謂ディクテーシ
ョンシステム（口述システム，dictation system) にお
いて公知である。口述から引き出されたテキスト(text)
の直接印刷は一般的に現実的ではない、それはスクリー
ン上に示されたテキストに基づいて始めに訂正されねば
ならないあまりにも多くの誤りが現在公知のシステムで
発生するからである。

【０００３】

【発明が解決しようとする課題】この訂正を実行するに
は、オペレータ(operator)は、システムにより完全には
認識されなかったワードを決定して訂正するために、必
要なら口述され記憶されたテキスト、すなはち音声信号
を聴取する際に、表示されたテキストを注意深く読み取
らねばならない。このことは、かなりの時間量を必要と
し、口述テキストを表示テキストに自動変換することに
よる時間節約を一部打ち消してしまう。本発明の目的
は、複数の表示ワードからなるテキストのより簡単なよ
り速い訂正が可能な冒頭のパラグラフに記載した方法を
提供せんとするものである。

【０００４】

【課題を解決するための手段】本発明によれば、この目
的は複数ワードがそれらそれぞれの信頼値に依存して異
なった方法で表示されることにより達成される。音声信
号から引き出された各ワードに関する信頼値の決定はＩ
ＣＡＳＳＰ１９９５,vol. Ｉ,pp.297-300,に公知であ
り、種々の目的、例えば音声信号から引き出された１つ
のワードが情報システム、特に対話が保持されるシステ
ムで受け取られるべきか拒絶されるべきかを決定するの
に役に立つ。事実信頼値はまた、あるワードが認識さ
れ、すなはち特に、認識されたワードがシステムに記憶
された音響モデルに如何によく対応するか、そして言語
モデルが使用される時、このワードが認識されるワード
並びのその位置に如何なる確立で発生するかの確からし
さの程度の目安となる。本発明によれば、信頼値は今や
テキストで口述ワードが正確に決定されなかった確立を
表示するのに使用される。訂正処理の際に低い信頼値を
有するワードの視覚的強調は、オペレータをしてどのワ
ードがどうしても正確に認識されなかったかを速やかに
確かめることを可能とし、それでこのワードをその時よ
り速やかに訂正できる。

【０００５】信頼値に依存する複数ワードの表示は、種
々の方法で行なわれる。１つの可能性は信頼値に依存し
て灰色の色調でワードを表示する事である。他の可能性
は信頼値に依存して表示された色彩を変える事である。
複数ワードはまた、信頼値に依存する異なった背景に対
し、異なった字体の文字で、またはアンダーライン付で
表示されることができる。ここで表現“字体”は一般に
文字の異なった形状、太字、イタリックまたは他の規格
外の文字形態を含むものとする。個々の可能性の組み合
わせが使用され得て、例えば、かなり低い信頼値を有す
るワードは異なった灰色の色調または異なった色彩のみ
ならず、アンダーライン付でまた表示可能である。

【０００６】特徴ある表示が、例えば、信頼値に比例す
るように発生できる。しかしながら、このことは、少な
くとも１つの閾値が信頼値のために用意され、前記少な
くとも１つの閾値または複数の閾値のなかの１つの閾値
をその信頼値が越えるかどうかに依存して表示が発生す
る時に、異なった字体の文字またはアンダーライン付に
より表示される場合特に実際的である。最高に高い閾値
以上の十分に高い信頼値で決定されたワードは正規に表
示され、一方前記最高に高い閾値または任意の閾値以下
の信頼値を有するワードのみが異なった方法で表示され
る。かかるワードはその時より速く認識され、それでこ
のワードの訂正は、必要なら、より容易になされる。

【０００７】このことは前記少なくとも１つの閾値また
は複数の閾値が可変である時有用である。閾値における
かかる変化は、例えば、正確に認識された多くのワード
が異なった方法で不必要に表示されるのをオペレータが
認識する場合オペレータにより有効になされ得る。かか
る変化はまた、ほんのわずか削減された信頼値の理由で
異なって表示された多くのワードが、それでもオペレー
タによる補正として特徴付けられる時には、システムに
より自動的に実施されることができる。

【０００８】表示されたテキストの補正は一般に、カー
ソルがテキストの引き続く複数ワードに、これら複数ワ
ードが引き出され記憶された音声信号の再生と多分並列
に自動的に置かれて実施される。カーソルは特に異なっ
て表示されたワードで、例えばオペレータが不正確と認
識するならこのワードを補正するようにキーが操作され
て停止されることができる。各口述されたワードからワ
ードを決定しそれを表示するのみならず、単一のワード
または完全な別の文章用に別のワードを提供するシステ
ムがまたあり、このシステムはＥＰ（ヨーロッパ特許）
０６１４１７２Ａ２号に公知で、その場合、カーソルが
好適に信頼値の順序で停止されるワードに隣接してかか
る別のワードが自動的に表示される時それは有用であ
る。補正はその時より速く実施される。

【０００９】本発明はさらに、音響音声信号入力から引
き出された複数ワードを表示する装置であって：音響音
声信号を受信し、前記信号および関連した複数の信頼値
から引き出される複数ワードを表わすデータを供給する
処理デバイスと；表示デバイス用の制御信号に前記デー
タを変換する制御デバイスとを具えた複数ワードを表示
する装置に関係する。

【００１０】この装置の目的は、表示デバイスに表示さ
れた複数ワード間からおそらく不正確に認識された複数
ワードをかかる回路配置でより速やかに認識するにあ
る。本発明はさらに、複数信頼値を表すデータが関連複
数ワード用に発生された表示デバイス用にこの制御信号
を変える目的で制御デバイスに供給されることを特徴と
するものである。

【００１１】認識された複数ワードの文字を表わすデー
タは一般に８ビットデータワードである。これらは制御
デバイスに供給され、このデバイスはデータワードを、
例えば複数ワードを明瞭なテキストとして表示するよう
に受像管用の制御信号に変換する。この目的用の制御デ
バイスは付加的な制御コマンドを受け取り、そのコマン
ドはそのテキストがどのような方法で表示されたか、例
えばどのような大きさの字体か、どのような字体の文字
か、どのような色彩かなどなど。制御デバイスに供給さ
れた信頼値、またはそれから引き出されたデータは、次
に複数ワードが如何に表示されるべきかを決定する付加
的制御コマンドとして制御デバイスに供給される。

【００１２】

【発明の実例の形態】以下添付図面を参照し実施例によ
り本発明の実例の形態を詳細に説明する。添付唯１つの
図面図１では、音響学的に供給された音声信号がマイク
ロホン１０により電気信号に変換され、次にその電気信
号の音声信号を特徴付ける一連のテスト信号に変換する
前処理ユニット１２に印加される。これらテスト信号は
処理デバイス１４に供給され、このデバイスはまた各テ
スト信号と数多くの基準信号との間の比較を実施するよ
うメモリ１６から基準信号を受け取る。複数ワードはあ
る基準信号の配列とテスト信号の配列との間の類似性か
ら決定され、そのため別のメモリ１８からの複数言語モ
デル値が一般に使用され、前記複数ワードはメモリ１６
の一連の基準信号により規定される。

【００１３】これら複数ワード、またはこれら複数ワー
ドの文字は、引き続いて制御デバイス２０にライン１５
で供給される。このデバイスは図示されていない方法
で、データ信号を好適には受像管２２の制御信号にライ
ン１５で変換するよう、制御デバイスに前以て好適に供
給された制御コマンドにより同調される。

【００１４】加うるに、複数の信頼値はメモリ１６から
の基準信号と処理デバイス１４のテスト信号との比較、
多分またメモリ１８からの言語モデル信号の使用との比
較で個々のワードについて形成され、これら信頼値は制
御デバイス２０にライン１７を介してまた供給される。
前記複数の信頼値はここで上に述べた複数の制御コマン
ドの方法、すなはちそれらコマンドが受像管２２用の制
御信号の発生で制御ユニット２０に影響する方法と同じ
方法で作用し、それで複数ワードはそれら複数の信頼値
に依存して表示される。複数の信頼値は次に、例えば、
また処理デバイス１４の１つまたはいくつかの閾値と比
較され、それで関連ワードの信頼値がある複数閾値の上
にあるか下にあるかをしめす信号のみがライン１７を通
って送信される。複数コマンドは処理デバイス１４へ入
力デバイス２４、例えば、キイボードを介して送信さ
れ、これらコマンドは複数閾値を変化できる。加うる
に、音声信号から正確に引き出されない複数ワードの補
正値はまたこの入力デバイス２４により入力される。こ
れら制御コマンドはまたこの入力デバイス２４を介して
送信され、これらコマンドは与えられた１つの表示ワー
ドに対して別の複数のワードの表示を止めて前記別の複
数のワードのなかから１つのワードを選択する。

【図面の簡単な説明】

【図１】本発明に係る実施例の構成ブロック線図を示
す図。

【符号の説明】

１０マイクロホン１２前処理ユニット１４処理ユニット１５，１７，２５ライン１６メモリ１８別のメモリ２０制御ユニット２２受像機２４入力デバイス

───────────────────────────────────────────────────── フロントページの続き (71)出願人 590000248 Ｇｒｏｅｎｅｗｏｕｄｓｅｗｅｇ１, 5621 ＢＡＥｉｎｄｈｏｖｅｎ，ＴｈｅＮｅｔｈｅｒｌａｎｄｓ

Claims

【特許請求の範囲】

【請求項１】各ワードについて信頼値が形成され、音
声信号入力から引き出された複数ワードを表示デバイス
に表示する方法において、複数ワードがそれらそれぞれ
の信頼値に依存して異なった方法で表示されることを特
徴とする複数ワードを表示する方法。
【請求項２】請求項１記載の方法において、複数ワー
ドが信頼値に依存して灰色の色調で表示されることを特
徴とする複数ワードを表示する方法。
【請求項３】請求項１記載の方法において、複数ワー
ドが信頼値に依存して色彩で表示されることを特徴とす
る複数ワードを表示する方法。
【請求項４】請求項１記載の方法において、複数ワー
ドが信頼値に依存して文字の字体で表示されることを特
徴とする複数ワードを表示する方法。
【請求項５】請求項１記載の方法において、複数ワー
ドが信頼値に依存してアンダーライン付で表示されるこ
とを特徴とする複数ワードを表示する方法。
【請求項６】請求項１記載の方法において、複数ワー
ドが信頼値に依存する背景と対照して表示されることを
特徴とする複数ワードを表示する方法。
【請求項７】請求項１から６いずれか記載の方法にお
いて、少なくとも１つの閾値が信頼値用に設けられ、前
記信頼値が前記少なくとも１つの閾値または複数の閾値
のうちの１つの閾値を越えるかどうかに依存して表示が
発生することを特徴とする複数ワードを表示する方法。
【請求項８】請求項７記載の方法において、前記１つ
の閾値または複数の閾値が可変であることを特徴とする
複数ワードを表示する方法。
【請求項９】より低い信頼値を有する別の複数ワード
が少なくとも幾つかのワード用の音声信号から発生され
る請求項７または８記載の方法において、信頼値が少な
くとも１つの閾値以下にある少なくとも１つの別のワー
ドがあるコマンドの入力で表示され、さらに別のコマン
ドの入力でもとの表示されたワードに置き換わるよう挿
入されることを特徴とする複数ワードを表示する方法。
【請求項１０】音響音声信号入力から引き出された複
数ワードを表示デバイスに表示する装置であって：音響
音声信号を受信し、前記信号とともに関連した複数の信
頼値から引き出される複数ワードを表わすデータを供給
する処理デバイス(12,14,16,18）と；表示デバイス(22)
用の制御信号に前記データを変換する制御デバイス(20)
とを具えた複数ワードを表示する装置において、複数の
信頼値を表わすデータが表示デバイス(22)用の関連複数
ワードに対応する制御信号を変える目的で制御デバイス
(20)に供給されることを特徴とする複数ワードを表示す
る装置。