JPH11296060A

JPH11296060A - 教育機器

Info

Publication number: JPH11296060A
Application number: JP10121771A
Authority: JP
Inventors: John F Cullen; エフカレンジョン; Junichiro Fujimoto; 潤一郎藤本
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1998-04-15
Filing date: 1998-04-15
Publication date: 1999-10-29
Anticipated expiration: 2018-04-15
Also published as: JP3741536B2

Abstract

(57)【要約】【課題】模範音声を練習者(利用者)に提示して練習者
に自己の発音の正しさを判断させることができるととも
に、練習者に言葉の意味と発音との両方を身に付けさせ
ることの可能な教育機器を提供する。【解決手段】認識用の標準パターンの登録時には、制
御部１は、音声記録保持部２に記録保持されている音声
を音声再生部４によって再生させ、利用者が再生された
音声に近い音声を発声するとき、利用者が発声した音声
の特徴パターンを抽出することで、認識用の標準パター
ンを生成して、これを音声認識手段１０に登録し、ま
た、音声認識時には、制御部１は、発声すべき音声を指
示部５によって利用者に指示させた後、利用者に該音声
を発声させ、利用者の発声音声を音声認識手段１０で認
識させ、その認識結果が指示部５で指示された音声と関
連付けられているか否かを比較手段２０で判断して、そ
の結果を利用者に提示する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声認識を利用し
た教育機器に関する。

【０００２】

【従来の技術】近年、音声を使った語学教育機器とし
て、いくつかの技術が提案されている。例えば、特開昭
６３−３０３４００号には、カード状の記録装置に模範
の音声(習得したい言語(例えば英語)の模範の音声)を入
れておいて、それを聞きながら復唱してスピーキングの
練習を行なう技術が示されている。この技術によれば、
効果的に模範音声を聞くことはできるが、発音の間違が
あっても本人が気がつかない限り、直すことができない
という欠点がある。

【０００３】一方、特開昭５９−２２０７７５号には、
模範となる音声を磁気テープに録音しており、それと利
用者の音声を比較して、類似しているかどうかを機械的
に判断しその結果を話者に知らせる技術が示されてい
る。また、特開昭６０−１６２２８１号には、模範発声
者の音声と練習者の入力音声とを記憶して、これらを音
響分析し、練習者の入力音声の特徴を模範音声の特徴と
比べて評価し、その分析および評価結果を表示装置に表
示し、練習者は自分の発音を聞き、且つ、表示装置４に
表示された模範音声および自分の音声の分析結果およ
び、自分の音声の評価結果を見て、模範音声と自分の音
声の音声特徴の相違を確認し、自分の発音を矯正する技
術が示されている。

【０００４】

【発明が解決しようとする課題】特開昭５９−２２０７
７５号，特開昭６０−１６２２８１号の技術によれば、
模範音声と学習者の音声とを、振幅，ピッチ，ホルマン
トで比較するので、音の比較はできるが、一般の人にと
っては、何を正せば模範の音声に近付くのか理解しにく
いなどの欠点がある。

【０００５】また、特開昭５９−２２０７７５号，特開
昭６０−１６２２８１号の技術では、模範音声(習得し
たい言語(例えば英語)の模範の音声)が出力されるだけ
であって、これにより、利用者は、仮に、この言語の正
しい発音を身につけることができたとしても、その言語
の意味が何であるかを知りたいとき、これをすぐには知
得することができないという欠点があった。すなわち、
語学の学習の基礎は単語の習得にあり、単語を正しい発
音で身につけるためには、教材として正しい発音を示す
ことのみならず、意味を理解することが非常に重要であ
り、現在、日本では単語カードの表面に日本語、裏に外
国語を記入して、表の日本語を見て裏の外国語(例えば
英語)の単語を思い出させるというような手法が広く用
いられているが、特開昭５９−２２０７７５号，特開昭
６０−１６２２８１号の技術では、上記の単語カードの
ような使い方ができないという欠点があった。

【０００６】本発明は、模範音声を練習者(利用者)に提
示して練習者に自己の発音の正しさを判断させることが
できるとともに、練習者に言葉の意味と発音との両方を
身に付けさせることの可能な教育機器を提供することを
目的としている。

【０００７】また、本発明は模範となる文字や絵を示
し、練習者に言葉で答えさせることで、練習者に言葉の
意味と発音との両方を身に付けさせることの可能な教育
機器を提供することを目的としている。

【０００８】

【課題を解決するための手段】上記目的を達成するため
に、請求項１記載の発明では、全体を制御する制御部
と、音声を入力する音声入力部と、音声を記録保持する
音声記録保持部と、該音声記録保持部に記録保持されて
いる音声を再生する音声再生部と、音声記録保持部に記
録保持されている音声のいずれかを指示する指示部とを
有し、制御部には、音声認識用の標準パターンを登録可
能であって音声入力部からの音声を認識可能な音声認識
手段が設けられ、音声認識用の標準パターンの登録時に
は、制御部は、音声記録保持部に記録されている音声を
音声再生部によって再生させ、利用者が再生された音声
に近い音声を発声するとき、利用者が発声した音声に基
づいて音声認識用の標準パターンを生成して、これを音
声認識手段に登録し、また、音声認識時には、制御部
は、発声すべき音声を指示部によって利用者に指示させ
た後、利用者に該音声を発声させ、利用者の発声音声を
音声認識手段で認識させ、その認識結果が指示部で指示
された音声と関連付けられているか否かを判断して利用
者に提示するようになっていることを特徴としている。

【０００９】また、請求項２記載の発明では、全体を制
御する制御部と、音声を入力する音声入力部と、２種類
以上の言語でそれぞれ発声された内容の音声が互いに対
応付けて記録されている音声記録部と、音声記録部に記
録された内容を一時的に記憶する一時記憶部と、一時記
憶部に記憶されている内容の音声を再生する音声再生部
とを有し、制御部には、音声認識用の標準パターンを登
録可能であって音声入力部からの音声を認識可能な音声
認識手段が設けられ、音声認識用の標準パターンの登録
時には、制御部は、一時記憶部に記録された２種類以上
の言語の音声のうち一種類以上の言語の音声を第１の音
声として再生し、利用者に該第１の声に従って発声さ
せ、利用者が発声した音声に基づいて音声認識用の標準
パターンを生成して、これを音声認識手段に登録し、ま
た、音声認識時には、制御部は、一時記憶部に記録され
た２種類以上の言語の音声の中から、利用者が発声した
種類の言語とは別の種類の言語の音声を第２の音声とし
て再生し、利用者に、この第２の音声に対応した第１の
音声を発声させ、利用者の発声音声を音声認識手段で認
識させ、その認識結果が、一時記録部に記録されていて
第１の音声として再生された音声と関連付けられている
か否かを判断して利用者に提示するようになっているこ
とを特徴としている。

【００１０】また、請求項３記載の発明では、全体を制
御する制御部と、音声を入力する音声入力部と、音声を
記録保持する音声記録保持部と、該音声記録保持部に記
録保持されている音声を再生する音声再生部と、音声記
録保持部に記録保持されている音声のいずれかを指示す
る指示部とを有し、制御部には、音声認識用の標準パタ
ーンを登録可能であって音声入力部からの音声を認識可
能な音声認識手段が設けられ、音声認識用の標準パター
ンの登録時には、制御部は、音声記録保持部に記録され
ている音声を音声再生部によって再生させて、利用者に
再生された音声に近い音声を発声させ、利用者が発声し
た音声と音声記録保持部の記録部分、あるいは別の部分
に保持した音声との間の類似性を求め、類似性が高い場
合に、利用者が発声した音声の特徴パターンを音声認識
用の標準パターンとして音声認識手段に登録する一方、
類似性が低い場合には同じ音声に対して複数回の発声動
作を利用者に求め、最も類似性が高い音声の特徴パター
ンを音声認識用の標準パターンとして登録するようにな
っていることを特徴としている。

【００１１】また、請求項４記載の発明では、請求項１
乃至請求項３のいずれか一項に記載の教育機器におい
て、音声認識手段には、特定話者用標準パターン登録部
と、比較部と、結果出力部と、不特定話者用標準パター
ン登録部とが設けられており、音声認識手段は、まず、
不特定話者用の標準パターンを使って、利用者が正しい
発音をしているかどうかをチェックし、正しいと判断さ
れた利用者の音声の特徴パターンを特定話者用の標準パ
ターンとして特定話者用標準パターン登録部に登録する
ことを特徴としている。

【００１２】また、請求項５記載の発明では、請求項１
乃至請求項４のいずれか一項に記載の教育機器におい
て、音声認識手段の認識結果が違っていた場合に、制御
部は、指示された音声と対になる一方または両方の音声
を、音声記録保持部あるいは一時記憶部から読み出して
音声再生部から再生するようになっていることを特徴と
している。

【００１３】また、請求項６記載の発明では、請求項１
乃至請求項４のいずれか一項に記載の教育機器におい
て、音声認識手段の認識結果が違っていた場合に、制御
部は、いま再生された音声を再度再生して、利用者に発
声を求めるようにし、利用者が再度発声すると、その音
声の特徴パターンで先に登録した音声認識用の標準パタ
ーンを書き換えるようになっていることを特徴としてい
る。

【００１４】また、請求項７記載の発明では、全体を制
御する制御部と、音声を入力する音声入力部と、音声を
記録保持する音声記録保持部と、該記録音声を再生する
音声再生部と、音声記録保持部に記録されている音声の
いずれかを指示する指示部とを有し、制御部には、認識
用の音声パターンを登録可能であって音声を認識可能な
音声認識手段が設けられ、認識用の音声パターンの登録
時には、制御部は、音声記録保持部に記録されている音
声を音声再生部によって再生させ、利用者が再生された
音声に近い音声を発声するとき、利用者が発声した音声
と音声記録保持部の記録部分、あるいは別の部分に保持
した音声との間の類似性を求め、類似性が高い場合に、
利用者が発声した音声を認識用の音声パターンとして音
声認識手段に登録する一方、類似性が低い場合には同じ
音声に対して複数回の発声動作を利用者に求め、最も類
似性が高い音声を認識用の音声パターンとして登録し、
また、音声認識時には、制御部は、指示部によって発声
する音声を利用者に指示させた後、利用者に該音声を発
声させ、利用者の発声音声を音声認識手段で認識させ、
その認識結果が指示部で指示された音声と関連付けられ
ているか否かを判断し、その後、音声認識部によって発
声する音声を指定し、利用者が発した音声の特徴パター
ンと標準パターンとの間で類似度を計算して認識結果を
割り出し、正しい認識結果が得られず、誤認識された場
合は、計算された類似度が予め決められた所定の閾値よ
りも小さいか、大きいかを判断し、小さい時は、誤認識
された音声を再生するようになっていることを特徴とし
ている。

【００１５】また、請求項８記載の発明では、請求項７
記載の教育機器において、所定の閾値としては、特定話
者方式の標準パターンと正しい入力音声の特徴パターン
との間で生じる類似度の１／２から２／３程度のものが
用いられることを特徴としている。

【００１６】また、請求項９記載の発明では、全体を制
御する制御部と、音声を入力する音声入力部と、音声、
および、音声に対応した画像を記録保持する音声・画像
記録保持部と、該音声・画像記録保持部に記録保持され
ている音声を再生する音声再生部と、音声・画像記録保
持部に記録保持されている画像を表示する表示部と、音
声・画像記録保持部に記録保持されている音声および／
またはこれに対応した画像を指示する指示部とを有し、
制御部には、音声認識用の標準パターンを登録可能であ
って音声入力部からの音声を認識可能な音声認識手段が
設けられ、音声認識用の標準パターンの登録時には、制
御部は、音声・画像記録保持部に記録されている画像を
表示部に表示させるとともに、音声・画像記録保持部に
記録されている対応する音声を音声再生部によって再生
させ、それに従って利用者が再生された音声に近い音声
を発声するとき、利用者が発声した音声に基づいて音声
認識用の標準パターンを生成して、これを音声認識手段
に登録し、また、音声認識時には、制御部は、発声すべ
き音声および／またはこれに対応した画像を指示部によ
って利用者に指示させた後、利用者に該音声を発声さ
せ、利用者の発声音声を音声認識手段で認識させ、その
認識結果が指示部で指示された音声と関連付けられてい
るか否かを判断して利用者に提示するようになっている
ことを特徴としている。

【００１７】

【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図１は本発明に係る教育機器の構成
例を示す図である。図１を参照すると、この教育機器
は、全体を制御する制御部１と、音声を入力する音声入
力部(例えばマイクロフォン)２と、音声を記録保持する
音声記録保持部(例えばメモリ)３と、該音声記録保持部
３に記録保持されている音声を再生する音声再生部(例
えばスピーカ)４と、音声記録保持部３に記録されてい
る音声のいずれかを指示する指示部(例えばキーボード)
５とを有し、前記制御部１には、認識用の音声パターン
(標準パターン)を登録可能であって音声を認識可能な音
声認識手段１０と、比較手段２０とが設けられ、認識用
の標準パターンの登録時には、制御部１は、音声記録保
持部２に記録保持されている音声を音声再生部４によっ
て再生させ、利用者が再生された音声に近い音声を発声
するとき、利用者が発声した音声に基づいて(この音声
の特徴パターンを抽出することで)、認識用の標準パタ
ーンを生成して、これを音声認識手段１０に登録し、ま
た、音声認識時には、制御部１は、発声すべき音声を指
示部５によって利用者に指示させた後、利用者に該音声
を発声させ、利用者の発声音声を音声認識手段１０で認
識させ、その認識結果が指示部５で指示された音声と関
連付けられているか否かを比較手段２０で判断して、そ
の結果を利用者に提示するようになっている。

【００１８】ここで、音声記録保持部３には、より詳し
くは、例えば教育機器を動作させるための制御プログラ
ム，外国語の単語の発音音声のデータ(例えば模範とな
る英語音声データ)，外国語の単語の日本語の意味など
が記憶されている。

【００１９】また、音声認識手段１０の音声認識方式に
関しては、従来公知の任意の方式を用いることができ
る。例えば文献「古井著デジタル音声処理(東海大出
版１９８５年))」に記載されているような方式のものを
用いることができる。

【００２０】図２は音声認識手段１０の構成例を示す図
である。図２の例では、音声認識手段１０は、特徴抽出
部１１と、特定話者用標準パターン登録部１２と、比較
部１３と、結果出力部１４とを有している。

【００２１】音声認識手段１０が図２のように構成され
ている場合において、標準パターンの登録時には、利用
者(特定話者)の予め決められた単語の入力音声を特徴抽
出部１１で特徴量(特徴パターン)に変換した後、特徴抽
出部１１で抽出された特徴パターンを特定話者用標準パ
ターン登録部１２に標準パターンとして記憶するように
なっている。一方、音声認識時には、利用者(特定話者)
の未知の単語の入力音声を特徴抽出部１１で特徴量(特
徴パターン)に変換した後、比較部１３において、未知
の単語の入力音声の特徴パターンと特定話者用標準パタ
ーン登録部１２に予め登録してある種々の単語の標準パ
ターンとの間でそれぞれ類似度を計算し、結果出力部１
４では、最も高い類似度を与えた標準パターンをもつ単
語を認識結果として出力するようになっている。

【００２２】次に、このような構成の教育機器の処理動
作例について説明する。先ず、音声認識手段１０に特定
話者音声認識用の標準パターンを登録する場合について
説明する。いま、指示部５から利用者が単語(単語名)を
例えば日本語で指定(入力)すると、制御部１は、その日
本語を前述したような仕方で利用者に提示する。日本語
の提示の仕方として、例えば、図１に示すように、さら
に表示部６を設け、表示部６に日本語の文字(キャラク
タ)を表示しても良いし、あらかじめ日本語の単語の音
声を波形データとして音声記録保持部(メモリ)３に記憶
しておいて音声再生部(スピーカ)４から再生するように
しても良い。なお、日本語を音声再生で提示するときに
は、表示部６は必ずしも設けられていなくても良い。

【００２３】このように、日本語を利用者に提示した
後、制御部１は、この日本語単語に対応した外国語の単
語の発音音声データを音声記録保持部３から読み出し、
再生する。これにより、利用者は、この日本語単語に対
応した外国語の単語の発音をスピーカ４を通して聞くこ
とができる。例えば、音声記録保持部３に、日本語単語
とこれに対応した外国語(英語)の単語が単語数“５”で
登録されているとする。ここで、５つの単語を「赤」
「青」「緑」「白」「黒」とする。まず、利用者は、キ
ーボード５から「赤」と入力すると、スピーカ４から
「ｒｅｄ」と言う発音が出る。利用者はこれを真似して
マイクロフォン２に向かって「レッド」と発音する。な
お、利用者は、必要に応じて、この発声を複数回繰り返
しても良い。

【００２４】マイクロフォン２から入力された音声(例
えば「レッド」)はＡ／Ｄ変換されて、制御部１に与え
られる。制御部１では、与えられた音声の一部を音声認
識手段１０に与え、他の一部を再生用の音声として音声
波形のまま音声記録保持部(メモリ)３に記憶することが
できる。なお、この例では、音声信号を分岐して、音声
認識手段１０，メモリ３の両方に入力させているが、必
ずしも音声信号を分岐して両方へ入力させる必要はな
い。例えば、マイクロフォン２から入力された音声信号
を音声波形のままメモリ３へ記憶させ、必要に応じて音
声認識手段１０へ入力させても良い。また、音声信号を
音声波形のままメモリ３へ記憶させても良いが、利用者
の音声を再生する必要がない場合は、これを音声認識手
段１０だけに与え、音声認識用の特徴パターンに変換さ
せて記憶させても良い。この場合には、使用するメモリ
量を少なくさせることができる。

【００２５】このように、利用者の発声した音声が音声
認識手段１０に入力されると、音声認識手段１０では、
入力された音声(例えば「レッド」)を特定話者音声認識
用の標準パターンとしての登録に利用できる。すなわ
ち、入力された音声(例えば「レッド」)の特徴パターン
をこの利用者(特定話者)の認識用標準パターンとして、
特定話者用標準パターン登録部１２に登録することがで
きる。

【００２６】このような動作を順次に繰り返して、５つ
の単語全ての発音練習を行ない、５つの単語の英語発声
音声に基づいてこの話者用の標準パターンを作成し、こ
れを音声認識手段１０に登録する。そして、５つの単語
全ての発音練習を終了すると、利用者は、指示部(キー
ボード)５からテストのモードを選択し、そのとき、単
語名を指定することができる。テストのモードが選択さ
れ単語名が指定されると、制御部１は、音声記録保持部
(メモリ)３に記憶されている日本語(指定された日本語)
を例えば音声で再生して利用者に提示し、この再生が終
了すると、音声認識手段１０は、未知の入力音声に対す
る認識待ちの状態に入る。

【００２７】次に、未知の入力音声に対する認識処理
時，すなわち、実際の音声認識時について説明する。先
ず、指示部５から利用者が単語(単語名)を例えば日本語
で指定(入力)すると、制御部１は、その日本語を前述し
たような仕方で利用者に提示する。日本語の提示の仕方
として、例えば、図１に示すように、さらに表示部６を
設け、表示部６に日本語の文字(キャラクタ)を表示して
も良いし、あらかじめ日本語の単語の音声を波形データ
として音声記録保持部(メモリ)３に記憶しておいて音声
再生部(スピーカ)４から再生するようにしても良い。な
お、日本語を音声再生で提示するときには、表示部６は
必ずしも設けられていなくても良い。

【００２８】このように、日本語を利用者に提示した
後、利用者は、音声再生部４から日本語で提示された単
語の英語発声を試みることができる。利用者がこの単語
を英語発声すると、英語発声された音声は、制御部１に
取り込まれ、制御部１では、この音声を音声認識手段１
０に与えて、音声認識させる。音声認識手段１０では、
入力された英語音声の特徴パターンを求め、この特徴パ
ターンを予め登録されている５つの単語(英語)の標準パ
ターンと照合して、最も類似している標準パターンをも
つ単語を認識結果とし、この認識結果を結果出力部１４
から出力させる。この段階で、制御部１は、先に指定さ
れている単語名と認識結果とを比較手段２０で比較し、
この比較の結果、同じであれば正解であると判断し、違
っていれば誤りと判断する。そして、この判断結果を例
えば表示部６に表示して利用者に知らせる。この時、単
語の表示の順番は、登録順でも、登録の逆順でも良い
し、あるいは、ランダムにしてもよい。

【００２９】図３，図４は図１の教育機器の処理動作の
具体例を説明するためのフローチャートである。図３，
図４の例では、利用者は、先ず、個人情報を記録するフ
ァイル名を入力する(ステップＳ１)。なお、このファイ
ル名は、利用者がキーボード５から入力しても良いし、
あるいは、機器のメモリに予め記憶されている単語名を
機器自体が自動で読み出し、機器自体が自動的に発生す
ることも可能である。このようにして、ファイル名の入
力がなされると、このファイル名が新しいファイルであ
るか否かを判断する(ステップＳ２)。この結果、新しい
ファイルの場合は初めての利用であるので、利用者に発
音練習を行なわせ、音声認識用の標準パターンを作成す
る必要がある。そのために、先ず、単語カウンタＷＣＮ
Ｔを“１”に初期設定し(ステップＳ３)，日本語の単語
名を入力する(ステップＳ４)。日本語の単語名の入力
も、ファイル名の入力と同様に、利用者によりキーボー
ド５から入力させても良いし、あるいは、機器のメモリ
に予め記憶されている単語名を機器自体が自動で読み出
し、機器自体が自動的に発生することも可能である。

【００３０】次に、その日本語の単語名に対応する英語
の単語名を入力する(ステップＳ５)。例えば、ステップ
Ｓ４で、日本語の単語名として「赤」と入力した時に
は、ステップＳ５では「ｒｅｄ」と入力する。この際、
英語の入力も、手入力でなされても良いし、機器が自動
で入力しても良い。

【００３１】このように、日本語とそれに対応した英語
が入力されると、これらを例えば表示部６に表示する
(ステップＳ６)。すなわち、例えば、「赤」，「ｒｅ
ｄ」のように表示する。そして、この教育機器は、模範
の発音を出力し、それに従って、利用者に発声(復唱)さ
せる(ステップＳ７)。すなわち、機器は模範の音声とし
て「レッド」を出力し、利用者はこれに従い、模範音声
にできる限り似せて「レッド」を発声する。

【００３２】利用者が発声したこの音声は音声認識手段
１０へ取り込まれ、音声認識手段１０では、利用者が発
声した単語の音声の特徴パターンをこの単語の標準パタ
ーンとして例えばファイルに登録する(ステップＳ８)。
次いで、単語カウンタＷＣＮＴを“１”だけ増加させ
(ステップＳ９)、カウンタ値ＷＣＮＴが全ての単語数ｎ
を超えたかを判断する(ステップＳ１０)。ｎを超えない
ときには、ｎを超えるまで、ステップＳ４乃至ステップ
Ｓ９の処理を繰り返し、終了したら、上記ファイルを保
存する。

【００３３】次いで、発音練習だけか、発音練習の他に
さらに単語の記憶トレーニングをするかを利用者に選択
させる(ステップＳ１１)。利用者が模範音声を聞いて発
音練習するだけの時はこれで処理を終了するが、発音練
習と単語の記憶トレーニングをする時はここからテスト
ルーチンへ入る(すなわち、ステップＳ１５に進む)。

【００３４】また、ステップＳ２において、入力された
ファイル名がすでに存在し、利用者がすでに発声練習を
したと判断されるときには、互いに対応づけられた英語
語彙と日本語語彙とをロードし(ステップＳ１２，Ｓ１
３)、ステップＳ８で作成された音声認識用の標準パタ
ーン(テンプレート)をロードする(ステップＳ１４)。な
お、ここで、語彙とは単語の集合である。

【００３５】次いで、ステップＳ１５からのテストルー
チンに入る。テストルーチンでは、先ず、単語ポインタ
を最初の単語位置にセットする(ステップＳ１５)。そし
て、単語カウンタＷＣＮＴを“１”に初期設定する(ス
テップＳ１６)。次いで、その単語位置の日本語の単語
を例えば表示部６に提示(例えば表示)する(ステップＳ
１７)。ここで、日本語の単語を必ずしも文字表示する
必要はなく、録音された音声で出力しても良い。

【００３６】このように、日本語の単語を利用者に提示
するとき、利用者は、それに対応する英語単語を発声す
ることができる(ステップＳ１８)。利用者が英語単語を
発声し、その音声が入力されると、音声認識手段１０で
は、この英語単語の音声を音声認識する(ステップＳ１
９)。すなわち、この英語単語の音声の特徴パターンを
抽出し、この特徴パターンをステップＳ８で登録された
各単語の標準パターンと照合することで、音声認識を行
なう。そして、この音声認識の結果、利用者の発声した
音声の特徴パターンが正しい英語単語の音声特徴量(標
準パターン)を備えたものであるか否かを判断し(ステッ
プＳ２０)、利用者の発声した音声が正しい英語単語の
音声特徴量(標準パターン)を備えたものでないときには
(リジェクトされたか、あるいは、誤認識結果だった
ら)、ステップＳ１７に戻り、再度日本語の単語を表示
して利用者に再度それに対応する英語単語を発声させ、
ステップＳ１７乃至Ｓ２０の音声認識処理を繰り返す。

【００３７】一方、ステップＳ２０において、認識結果
が正しければ、単語カウンタＷＣＮＴを“１”だけ増加
して(ステップＳ２１)、単語カウンタＷＣＮＴが所定値
ｎを越えたか否かを判断する(ステップＳ２２)。この結
果、所定値ｎに達していないときには、再びステップＳ
１７に戻り、次の日本語の単語を表示し、上記テストル
ーチンを繰り返す。このようにして、ステップＳ２２で
単語カウンタＷＣＮＴが所定値ｎを越えたときに、全て
の処理を終了する。

【００３８】なお、上述のテストルーチン(ステップＳ
１５乃至Ｓ２２)では、単語ポインタを最初の単語位置
にセットし、最初の単語位置の単語から順次にテストを
行なうようになっているが、これのかわりに、例えば、
乱数を発生させてテストする単語をランダムに決めても
良い。

【００３９】このようなテストを行なうことで、利用者
は、日本語の単語名に対応した英単語の正しい発音を習
得でき、また、これと同時に、この英単語の意味(すな
わち、日本語の単語)が何であるかを把握できる。ま
た、上述の例では、利用者に単語を提示したが、日本語
の文章を提示し、これに対応した英語の文章を利用者に
発声させても良い。また、上述の例では、指示部５にキ
ーボードを用いたが、キーボードのかわりに、例えばフ
ロッピー・ディスクやＣＤ−ＲＯＭなどの記録媒体を用
いることもできる。また、上述の例では、指示部５が設
けられているが、指示部５のかわりに、２種類以上の言
語でそれぞれ発声された内容の音声が互いに対応付けて
記録されている音声記録部(フロッピー・ディスクやＣ
Ｄ−ＲＯＭなどの記録媒体など)を設けることもでき
る。

【００４０】図５は本発明に係る教育機器の他の構成例
を示す図であり、図５の教育機器は、図１の教育機器に
おいて、指示部５のかわりに、２種類以上の言語でそれ
ぞれ発声された内容の音声が互いに対応付けて記録され
ている音声記録部７(フロッピー・ディスクやＣＤ−Ｒ
ＯＭなどの記録媒体など)が設けられたものとなってい
る。

【００４１】また、図５の教育機器では、音声記録保持
部３は、音声記録部７に記録された内容を一時的に記憶
する一時記憶部としての機能も有し、認識用の標準パタ
ーンの登録時には、ある単語について、制御部１は、音
声記録部７から音声記録保持部(一時記憶部)３に記録さ
れた２種類以上の言語の音声のうち一種類以上の言語の
音声(例えば、英語の音声)を第１の音声として音声再生
部４から再生し、利用者に該第１の音声(英語の音声)に
従って英語の音声を発声させ、利用者が発声した音声に
基づいて認識用の標準パターンを生成して、これを音声
認識手段１０に登録するようになっており、また、音声
認識時には、ある単語について、制御部１は、音声記録
部７から音声記録保持部(一時記憶部)３に記録された２
種類以上の言語の音声の中から、前記利用者が発声した
種類の言語とは別の種類の言語の音声(例えば、日本語
の音声)を第２の音声として再生し、利用者に、この第
２の音声(日本語の音声)に対応した第１の音声(英語の
音声)を発声させ、利用者のこの発声音声を音声認識手
段１０で認識させ、その認識結果が音声記録保持部(一
時記憶部)３に記録され第１の音声として再生された音
声と関連付けられているか否かを判断して利用者に提示
するようになっている。

【００４２】図５の教育機器では、音声記録部(記録媒
体)７の内容として、種々のものを設定することがで
き、この内容は、一時的に音声記録保持部３へ記憶され
ることで、発声を促す単語の種類を換えたり、言語の種
類を換えたり、更にはプログラムの変更によって、外国
語だけでなく、質問に対する答えを教えることや、目の
不自由な人に対する訓練機にすることもできる。従っ
て、この音声記憶部７，すなわち記録媒体だけを取り替
えることで教育機器の機能を容易に変更できる。

【００４３】このように、図５の教育機器では、記録媒
体を取り替えることで、１つのシステムを多くの人が使
ったり、様々なレベルの学習に使うことができる。

【００４４】ところで、上述した各教育機器(より具体
的には、制御部１の音声認識手段１０が図２の構成とな
っている機器)では、利用者の誤りをシステム側から指
摘することができない。具体的には、本人が気がつかな
い誤りがある場合、例え「ｒｅｄ」を常に「レット」と
発音する人がいた場合、「赤」−「ｒｅｄ」というガイ
ダンスに沿って「レット」と発音すると、これがこの特
定話者の標準パターンとして登録されてしまい、テスト
で「赤は何と言うでしょう」との問に対し、「レット」
と発音すれば、音声認識の結果は正解となってしまう。
そのため、模範の発音と自分の発音の違っていることを
誰かに指摘されるまで、上述した教育機器ではその発音
の誤りを正すことはできない。

【００４５】図６は本人の思い込みで発音しているよう
な誤りに対する修正を可能にすることを意図した音声認
識手段１０’の構成例を示す図である。すなわち、図６
の構成例では、できるだけ正しい発音で標準パターンを
作成することと、正しい発音を学習することとを意図し
たものとなっており、音声認識手段１０’は、特徴抽出
部１１と、特定話者用標準パターン登録部１２と、比較
部１３と、結果出力部１４との他に、さらに、不特定話
者用標準パターン登録部１５を有している。

【００４６】図６の構成例は、現在、不特定話者用の音
声認識装置が利用できるようになってきたことと、特定
話者方式の方が認識精度が高いこととの２つの特徴を利
用したものであり、図６の構成例では、まず、不特定話
者用の標準パターンを使って、利用者が正しい発音をし
ているかどうかをチェックし、正しいと判断されたもの
に対して特定話者用の標準パターンを登録するようにし
ている。

【００４７】図７は制御部１の音声認識手段が図６のよ
うな音声認識手段１０’の構成となっている場合の教育
機器の他の構成例を示す図であり、図７の教育機器は、
前述のように、本人の思い込みで発音しているような誤
りに対する修正を可能にすることを意図している。すな
わち、図７の教育機器は、できるだけ正しい発音で標準
パターンを作成することと、正しい発音を学習すること
とを目的になされたものである。

【００４８】図７の例の教育機器は、図１の構成例の教
育機器において、制御部１の音声認識手段が図６のよう
な音声認識手段１０’の構成となっていることの他に、
指示部(例えばキーボード)５とともに、図５の構成例に
示したような音声記録部(記録媒体)７がさらに設けられ
たものとなっている。ここで、音声記録部(記録媒体)７
には、２種類以上の言語でそれぞれ発声された内容の音
声が互いに対応付けて記録されているが、この際、記録
されるべき発声された内容の音声は、不特定話者のもの
となっている(例えば、複数の話者の音声の平均をとっ
た標準的な音声のものとなっている)。

【００４９】図６，図７の構成の教育機器では、利用者
の音声の標準パターンを特定話者用標準パターン登録部
１２に登録するに先立って、利用者が発声した音声の特
徴パターンと不特定話者用標準パターン登録部１５に登
録されている不特定話者用の標準パターンとの類似度を
求めて、正しい認識結果が得られるかどうかを調べ、正
しい認識結果が得られれば、その音声の特徴パターンを
特定話者用標準パターン登録部１２にそのまま登録し、
正しい認識結果が得られない場合は、「もう一度発声練
習をしましょう」とか「発音は正しいですか？」などの
メッセージを利用者に与え、上述したのと同じ動作を繰
り返し行なわせる。このような動作を行なって、不特定
話者用標準パターン登録部１５に登録されている不特定
話者用の標準パターンと最も高い類似度を得た利用者音
声の特徴パターンを特定話者用の標準パターンとして特
定話者用標準パターン登録部１２に登録することができ
る。

【００５０】具体的に、利用者が自分が正しい発音をし
ているのか否かを調べるため、ある単語の音声を発声す
ると、音声認識手段１０’では入力された単語の音声の
特徴パターンを抽出し、入力音声の特徴パターンを先ず
最初の不特定話者用の標準パターンと比較する。そし
て、その時の両者の類似度と、この類似度を与えた標準
パターンの単語名とを例えばメモリ(図示せず)に一時記
憶し、次いで、入力音声の特徴パターンを次の不特定話
者用の標準パターンと比較する。この標準パターンとの
類似度が先の標準パターンとの類似度よりも大きい時に
は、先に記憶した標準パターンを消去し、現在の類似度
とその類似度を与えた標準パターンの単語名とを上記メ
モリに記憶する。一方、現在の類似度の方が小さいとき
は、先に記憶した標準パターンをそのままメモリに記憶
保持する。このようにして、入力音声の特徴パターンを
不特定話者用の各標準パターンと順次に比較し、これら
の類似度を求めた後、最も高い類似度を与えた標準パタ
ーン，すなわち、メモリに残っている単語が最大の類似
度を得たもの(単語名)が認識結果となる。

【００５１】このように音声認識手段から認識結果が得
られたとき、制御部１は、この認識結果と、利用者に対
し発声を促した単語名とが一致するか否かを比較し、単
語名が一致するならば正しい発音と判断し、違っていれ
ば、誤まった発音と判断する。これによって本人が気が
つかないような発音の誤りを指摘できる。そして、上記
認識結果と利用者に対し発声を促した単語名とが一致す
るときに、上記認識結果を与えた不特定話者用の標準パ
ターンを特定話者用の標準パターンとして登録すること
ができる。

【００５２】このように、図６，図７の構成の教育機器
では、利用者の音声の標準パターンを特定話者用標準パ
ターン登録部１２に登録するに先立って、利用者が発声
した音声の特徴パターンと不特定話者用標準パターン登
録部１５に登録されている不特定話者用の標準パターン
との類似度を求めて、正しい認識結果が得られるかどう
かを調べ利用者は自分が正しい発音をしているかどうか
が判断でき、正しい音声で教育機器を使うことができ
る。また、これと同時に、自分自身が正しい発音を身に
つけることができる。すなわち、本人の思い込みで発音
しているような誤りに対する修正が可能となり、できる
だけ正しい発音で標準パターンを作成することと、正し
い発音を学習することが可能となる。

【００５３】また、上記のような各教育機器において、
単語発声などの学習中に音声認識結果が誤りとなる場合
として、機器から発音提示された時の発音を忘れてしま
って、まったく別の言葉を発声してしまったり、あるい
は、提示された発音と似ている発音をしているが登録し
たときの正しい発音とは違っている場合がある。いずれ
の場合にしても、利用者は正しい発音をもう一度聞いて
みる必要がある。

【００５４】図８は本発明に係る教育機器の他の構成例
を示す図であり、図８の教育機器は、上記の問題を解決
することを意図している。

【００５５】すなわち、図８を参照すると、この教育機
器において、制御部１の音声認識手段は例えば図９のよ
うな音声認識手段１０''の構成のものとなっている。ま
た、図８の教育機器の例では、指示部５の他に、音声記
録部(記録媒体)７が設けられている。

【００５６】また、図８，図９の教育機器では、音声認
識手段１０''の認識結果が比較手段２０において違って
いたと判断した場合に、制御部１は、指示された音声と
対になる一方または両方の音声を音声記録保持部(一時
記憶部)３から読み出して音声再生部４に与え、これを
再生させるようになっている。

【００５７】具体的に、図８の教育機器においても、音
声記録保持部３には、例えば音声記録部(記録媒体)７か
ら、例えば教育機器を動作させるための制御プログラ
ム，外国語の単語の発音音声のデータ(例えば模範とな
る英語音声データ)，外国語の単語の日本語の意味など
がロードされ記憶されている。

【００５８】そして、この教育機器においても、標準パ
ターンの登録時には、音声記録保持部３に保持されてい
る単語の音声を音声再生部４から再生して、再生された
音声に近い音声を利用者に繰り返し発声させ、その特徴
パターンを特定話者用の標準パターンとして特定話者用
標準パターン登録部１２に登録するようにしている。そ
の後、発声すべき英語を意味する日本語を表示し、それ
に対して発声された英語発音を前述したと同様の仕方で
認識して認識結果を得る。このとき、発声された英語の
音声を、例えば音声記録保持部３に一時的に保存してお
くのも効果的である。

【００５９】ところで、この教育機器では、このような
認識の結果、誤認識している時は、制御部１は、音声記
録保持部３から該当単語の英語の音声を取り出し、この
音声信号を音声再生部４から再生して利用者に聞かせ
る。それに続いて、制御部１は、一時的に音声記録保持
部３に取り込んでおいた利用者の発音音声を音声再生部
４から再生して利用者に聞かせる。これによって、利用
者は、正しい英語の発音と自己の発声した発音との違い
を明瞭に把握することができる。すなわち、この種の教
育機器においては、単語発声などの学習中に音声認識結
果が誤りとなる場合として、機器から発音提示された時
の発音を忘れてしまって、まったく別の言葉を発声して
しまったり、あるいは、提示された発音と似ている発音
をしているが登録したときの正しい発音とは違っている
場合があるが、図８の教育機器では、いずれの場合につ
いても、利用者は正しい発音をもう一度聞くことができ
る。

【００６０】図１０は図８の教育機器の変形例を示す図
であり、図１０の教育機器は、図８の教育機器におい
て、制御部１の音声認識手段に図２の音声認識手段１０
が用いられている。すなわち、図１０の教育機器は、音
声認識手段１０の認識結果が違っていた場合に、制御部
１は、再度、指示された音声を再生して、利用者に発声
を求めるようにし、利用者が再度発声すると、その音声
の特徴パターンで先に登録した音声認識用の標準パター
ンを書き換えるようになっている。

【００６１】すなわち、教育機器を使用する場合、利用
者は自分の知らない言葉を発声しなければならないこと
がある。そのために発声が安定しなかったり、間違えた
りする。このうち、発声の不安定さを低減するには、こ
の教育機器を繰り返し使用することが有効であり、これ
によって発声を安定させることができるが、言い誤り
は、元の標準パターンを書き換えておく必要がある。

【００６２】また、音声認識の誤りには、上記の原因以
外に経時変化がある。すなわち、音声を登録してから時
間が経つと、正しい発音をしているにもかかわらず、正
しい認識ができない場合が生ずることがある。

【００６３】図１０の教育機器では、誤認識した音声の
標準パターンを新しいものと入れ替えるようにしている
ので、上記のような場合に対処することができる。

【００６４】具体的に、図１０の教育機器においても、
音声記録保持部３には、例えば音声記録部(記録媒体)７
から、例えば教育機器を動作させるための制御プログラ
ム，外国語の単語の発音音声のデータ(例えば模範とな
る英語音声データ)，外国語の単語の日本語の意味など
がロードされ記憶されている。

【００６５】そして、この教育機器においても、標準パ
ターンの登録時には、音声記録保持部３に保持されてい
る単語の音声を音声再生部４から再生して、再生された
音声に近い音声を利用者に繰り返し発声させ、それを特
定話者用の標準パターンとして特定話者用標準パターン
登録部１２に登録するようにしている。その後、発声す
べき英語を意味する日本語を表示し、それに対して発声
された英語発音を前述したと同様の仕方で認識して認識
結果を得る。このとき、発声された英語の音声を、例え
ば音声記録保持部３に一時的に保存しておくのも効果的
である。

【００６６】ところで、この教育機器では、このような
認識の結果、誤認識している時は、制御部１は、音声記
録保持部３から該当単語の英語の音声を取り出し、この
音声信号を音声再生部４から再生して利用者に聞かせ
る。

【００６７】また、これと同時に、音声認識手段１０を
登録モードにする。そこで、利用者が音声を発声する
と、発声した音声は特徴抽出されその特徴パターンが特
定話者用標準パターン登録部１２に標準パターンとして
登録される。なお、このようにして特徴パターンが標準
パターンとして登録されることによって、先に登録され
ている既存の標準パターン、すなわち現在、誤認識とな
った標準パターンは消去される。しかしながら、既存の
標準パターンを必ずしも消去して書き換えなければなら
ないわけではなく、新たな標準パターンを既存の標準パ
ターンと平均を取ったものを標準パターンとして登録し
てもかまわない。こうすることによって標準パターンの
老朽化を防ぐことができる。

【００６８】また、上述した各構成例の教育機器では、
音声認識手段が誤認識した場合に、これが利用者が間違
えた単語を発声したものなのか、正しい単語を間違えて
発声したものなのかを区別できない。

【００６９】図１１は本発明に係る教育機器の他の構成
例を示す図であり、図１１の教育機器は、音声認識手段
が誤認識した場合に、これが利用者が間違えた単語を発
声したものなのか、正しい単語を間違えて発声したもの
なのかを区別することを意図している。

【００７０】すなわち、図１１の教育機器は、例えば図
８や図１０の構成例において、制御部１が図１２に示す
ような構成のものとなっている。図１２を参照すると、
図１１の教育機器の制御部１は、音声認識手段１０'''
が、特徴抽出部１１と、特定話者用標準パターン登録部
１２と、比較部１３と、結果出力部１４との他に、さら
に、比較部１３で得られる類似度(認識結果が得られる
とき、この認識結果を与えた単語の音声の特徴パターン
の標準パターンに対する類似度)を保持する指定単語類
似度保持部１７を有している。また、制御部１の比較手
段２０'は、音声認識手段１０'''の指定単語類似度保持
部１７に保持された類似度を閾値ＴＨと比較し、類似度
が閾値ＴＨよりも大きいか小さいかをも判断するように
なっている。

【００７１】このような構成の教育機器では、音声認識
時には、制御部１は、例えば指示部５によって発声する
音声を利用者に指示させた後、利用者に該音声を発声さ
せ、利用者の発声音声を音声認識手段１０'''で認識さ
せ、その認識結果が指示部５で指示された音声と関連付
けられているか否かを判断し、その後、音声認識手段１
０'''によって発声する音声を指定し、利用者が発した
音声の特徴パターンと標準パターンとの間で類似度を計
算して前述したと同様にして認識結果を得る。この結
果、正しい認識結果が得られた時は、前述したものと同
様の動作をする一方、正しく認識されなかった場合は、
計算された類似度が予め決められた閾値ＴＨよりも小さ
いか、大きいかを判断し、閾値ＴＨよりも小さい時は、
誤認識された音声を再生するようにしている。

【００７２】具体的に、音声認識手段が誤認識する場合
として、前述のように、利用者が教育機器から提示され
た時の発音を忘れてしまって、まったく別の言葉を発声
してしまうか、または、似ている発音をしているが登録
した時の正しい発音とは違った発音となっている場合が
考えられる。前者の場合は後者に比べて類似度が低いの
で類似度の違いによって、両者を区別することができ
る。すなわち、正しく認識されなかった場合は、計算さ
れた類似度が予め決められた閾値ＴＨよりも小さいか、
大きいかを判断することで、両者を区別することができ
る。このように区別がなされると、前者の場合であれ
ば、例えば「単語を間違えていませんか？」のメッセー
ジを利用者に示し、また、後者の場合であれば、「この
単語と区別しましょう」のメッセージを利用者に示し、
誤認識先の単語の音声を再生し、「正解はこれです」と
言って、正しい音声を再生する。

【００７３】図１１の教育機器の動作について、より具
体的に説明する。図１１の教育機器においても、音声記
録保持部３には、例えば音声記録部(記録媒体)７から、
例えば教育機器を動作させるための制御プログラム，外
国語の単語の発音音声のデータ(例えば模範となる英語
音声データ)，外国語の単語の日本語の意味などがロー
ドされ記憶されている。

【００７４】そして、この教育機器においても、標準パ
ターンの登録時には、音声記録保持部３に保持されてい
る単語の音声を音声再生部４から再生して、再生された
音声に近い音声を利用者に繰り返し発声させ、それを特
定話者用の標準パターンとして特定話者用標準パターン
登録部１２に登録するようにしている。その後、発声す
べき英語を意味する日本語を表示し、それに対して発声
された英語発音を前述したと同様の仕方で認識して認識
結果を得る。このとき、発声された英語の音声を、例え
ば音声記録保持部３に一時的に保存しておくのも効果的
である。

【００７５】ところで、この教育機器では、利用者が自
分が正しい発音をしているのか否かを調べるため、ある
単語の音声を発声すると、音声認識手段１０'''では、
入力された単語の音声の特徴パターンを抽出し、入力音
声の特徴パターンを先ず最初の不特定話者用の標準パタ
ーンと比較する。そして、その時の両者の類似度と、こ
の類似度を与えた標準パターンの単語名とを指定単語類
似度保持部１７に一時記憶し、次いで、入力音声の特徴
パターンを次の特定話者用標準パターンと比較する。こ
の標準パターンとの類似度が先の標準パターンとの類似
度よりも大きい時には、先に記憶した標準パターンを消
去し、現在の類似度とその類似度を与えた標準パターン
の単語名とを記憶する。一方、現在の類似度の方が小さ
い時は、そのまま現在の物を消去して、次の標準パター
ンを取り出す。但し、照合する標準パターンの単語名
が、記憶部から音声再生部４を通じて発声されたものと
同じ場合は、類似度にかかわらず、同じ記憶部に記憶し
ておく。

【００７６】このようにして、入力音声の特徴パターン
を特定話者用の各標準パターンと順次に比較し、これら
の類似度を求めた後、最も高い類似度を与えた標準パタ
ーン，すなわち、記憶部に残っている単語が最大の類似
度を得たもの(単語名)が認識結果となる。この認識結果
が誤っていた場合には、正しい単語名と共に保存されて
いる類似度を、閾値ＴＨと比較する。類似度が閾値ＴＨ
よりも低ければ、「単語を間違えていませんか？」と言
うメッセージと共に表示し、一方、閾値ＴＨよりも高け
れば、この単語と「間違えていませんか」と言うメッセ
ージと共に、誤認識した単語の音声を音声記録保持部３
から取り出し、音声再生部４から出力する。

【００７７】これにより、利用者(話者)は自分が間違っ
ていたことに気付く。あるいは、自分の発音が間違われ
やすい単語を知ることによって、間違われないような発
音をすることになる。

【００７８】ここでの閾値ＴＨの決め方は、特定話者方
式の標準パターンと正しい入力音声特徴パターンとの間
で生じる類似度の１／２から２／３程度のものが適当で
ある。

【００７９】このようにして、音声認識結果が誤認識で
ある時、利用者が間違えた単語を発声しているのか、正
しい単語を間違えて発声しているのかを区別し、利用者
へ知らせることが可能になる。

【００８０】また、図１３は本発明に係る教育機器の他
の構成例を示す図であり、図１３の教育機器は、模範と
なる文字や絵を示し、練習者に言葉で答えさせること
で、練習者に言葉の意味と発音との両方を身に付けさせ
ることの可能な教育機器を提供することを目的としてい
る。

【００８１】すなわち、図１３の教育機器では、例え
ば、図１，図５の教育機器において、音声記録保持部３
のかわりに、音声・画像記録保持部(メモリ)２３が設け
られており、音声・画像記録保持部２３には、本機器を
動作させるためのプログラムと、単語の外国語発音音声
のデータとともに、それに対応した画像(文字や絵)が記
憶されている。なお、図１３の例は図１に対応したもの
となっている(指示部５が設けられたものとなってい
る)。

【００８２】図１３の構成例では、指示部(例えばキー
ボード)５から例えば絵を指定すると、その絵を表示部
(ディスプレイ)６に表示して、この絵に対応した音声デ
ータ(外国語の発音)を音声・画像記録保持部２３から読
み出し、外国語の発音を音声再生部(スピーカ)４から出
力する。これにより、利用者は、表示部６で絵を見なが
ら、この絵に対応した外国語の発音をスピーカ４を通し
て聞くことができる。例として、外国語が英語であると
し、また、単語数が５の場合を示す。いま仮に、５単語
を「犬」「猫」「鳥」「馬」「牛」とする。プログラム
をスタートすると、最初の犬の絵が表示部６に表示さ
れ、音声再生部(スピーカ)４から「ｄｏｇ」と言う発音
が出力される。利用者はこれを真似して音声入力部(マ
イクロフォン)２に向かって「ドッグ」と発音する。必
要に応じて、これを複数回繰り返しても良い。

【００８３】音声入力部(マイクロフォン)２から入力さ
れた音声はＡ／Ｄ変換されて、一部は音声認識手段１０
へ入力し、他の一部は再生用に音声波形のまま音声・画
像記録保持部(メモリ)２３に記憶しておいても良い。こ
の部分は、音声信号を分岐して必ずしも両方へ入れる必
要はない。音声波形のまま音声・画像記録保持部(メモ
リ)２３へ記憶し、必要に応じて音声認識手段１０へ入
力しても良いし、利用者の音声を再生する必要がない場
合は、音声認識用の特徴量に直して記憶する方が使用す
るメモリ量が少なくて済む。音声認識手段１０では入力
された音声を特定話者音声認識の音声登録に利用して話
者の認識用標準パターンを作る。

【００８４】このような動作を繰り返して５単語全ての
発音練習を終わる。指示部(キーボード)５からテストの
モードを選ぶと、表示部(ディスプレイ)６に動物の絵が
表示され、認識待ちの状態に入る。

【００８５】利用者は、表示部６に表示された絵の英語
発声を試みる。英語発声された音声は、音声認識手段１
０へ入力されて登録されている５単語の中で認識され、
認識結果を比較手段２０へ出力する。ここでは先に送ら
れている単語名と認識結果が比較され、同じであれば正
解、違っていれば誤りとする。その結果を表示部６で利
用者に知らせる。このように、表示部６に絵を順次に表
示させて、利用者にそれに対応した外国語を順次に発声
させてその発音が正しいか否かの結果を利用者に報告で
きる。この時、絵の表示の順番は登録順でも、登録の逆
順でもあるいは、ランダムにしてもよい。

【００８６】このように、図１３の教育機器では、模範
となる文字や絵を示し、練習者に言葉で答えさせること
で、練習者に言葉の意味と発音との両方を身に付けさせ
ることが可能となる。

【００８７】なお、図１３の構成例において、音声認識
手段１０は、例えば、図２に示したと同様の構成となっ
ており、入力された音声は特徴抽出部１１で特徴量に変
換され、音声登録に際しては、変換された特徴量が、直
接、特定話者用標準パターン記録部１２に記憶される。
一方、認識に際しては、未知の入力音声を特徴抽出部１
１で特徴量に変換した後、比較部１３において、予め登
録されている標準パターンのそれぞれとの間で類似度を
計算し、最も類似度が高いものを結果出力部１４から認
識結果として出力する。

【００８８】また、上述の例では、外国語が英語であ
り、単語数が５であるとしたが、外国語は英語以外のも
のでも良く、また、単語数も任意の個数のものにするこ
とができる。また、上述の例では、絵と外国語の単語と
の対応付けを述べたが、それに限るものではなく、例え
ば国旗と国名、社章と社名、顔と人名、漢字と読み方、
地図上の位置と場所名との対応付けなどを行なうことも
できる。また、絵を動画にすれば、手話の学習など、視
覚情報と聴覚情報の対応づけの教育に有効である。

【００８９】また、上述の例では、単語で示したが、文
章でも良いことはいうまでもない。また、図１３におい
て、上述の例では、指示部５がキーボードであるとし、
キーボードからコマンド入力や選択をするようにした
が、指示部５は、必ずしもキーボードである必要なく、
例えばフロッピィディスクなどを用い、プロッピィディ
スクに記憶されているプログラムでコントロールしても
よい。

【００９０】

【発明の効果】以上に説明したように、請求項１乃至請
求項８記載の発明によれば、模範となる音声を示し、練
習者の発音の正しさを判断することと、言葉の意味と、
発音の両方が一度に身につけられるような教育機器を提
供できる。

【００９１】また、請求項９記載の発明によれば、視覚
情報と聴覚情報とを対応づけた学習を極めて効率良く行
なうことが可能となる。

【図面の簡単な説明】

【図１】本発明に係る教育機器の構成例を示す図であ
る。

【図２】音声認識手段の構成例を示す図である。

【図３】図１の教育機器の処理動作を説明するためのフ
ローチャートである。

【図４】図１の教育機器の処理動作を説明するためのフ
ローチャートである。

【図５】本発明に係る教育機器の他の構成例を示す図で
ある。

【図６】音声認識手段の他の構成例を示す図である。

【図７】本発明に係る教育機器の他の構成例を示す図で
ある。

【図８】本発明に係る教育機器の他の構成例を示す図で
ある。

【図９】音声認識手段の他の構成例を示す図である。

【図１０】図８の教育機器の変形例を示す図である。

【図１１】本発明に係る教育機器の他の構成例を示す図
である。

【図１２】図１１の教育機器の制御部の構成例を示す図
である。

【図１３】本発明に係る教育機器の他の構成例を示す図
である。

【符号の説明】

１制御部２音声入力部３音声記録保持部４音声再生部５指示部６表示部７音声記録部１０，１０',１０''，１０''' 音声認識手段１１特徴抽出部１２特定話者用標準パターン登録部１３比較部１４結果出力部１５不特定話者用標準パターン登録部２０,２０' 比較手段２３音声・画像記録保持部

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁶ 識別記号ＦＩＧ１０Ｌ 3/00 ５７１Ｇ１０Ｌ 3/00 ５７１Ｈ

Claims

【特許請求の範囲】

【請求項１】全体を制御する制御部と、音声を入力す
る音声入力部と、音声を記録保持する音声記録保持部
と、該音声記録保持部に記録保持されている音声を再生
する音声再生部と、音声記録保持部に記録保持されてい
る音声のいずれかを指示する指示部とを有し、前記制御
部には、音声認識用の標準パターンを登録可能であって
音声入力部からの音声を認識可能な音声認識手段が設け
られ、音声認識用の標準パターンの登録時には、前記制
御部は、音声記録保持部に記録されている音声を音声再
生部によって再生させ、利用者が再生された音声に近い
音声を発声するとき、利用者が発声した音声に基づいて
音声認識用の標準パターンを生成して、これを音声認識
手段に登録し、また、音声認識時には、前記制御部は、
発声すべき音声を前記指示部によって利用者に指示させ
た後、利用者に該音声を発声させ、利用者の発声音声を
音声認識手段で認識させ、その認識結果が指示部で指示
された音声と関連付けられているか否かを判断して利用
者に提示するようになっていることを特徴とする教育機
器。
【請求項２】全体を制御する制御部と、音声を入力す
る音声入力部と、２種類以上の言語でそれぞれ発声され
た内容の音声が互いに対応付けて記録されている音声記
録部と、音声記録部に記録された内容を一時的に記憶す
る一時記憶部と、一時記憶部に記憶されている内容の音
声を再生する音声再生部とを有し、前記制御部には、音
声認識用の標準パターンを登録可能であって音声入力部
からの音声を認識可能な音声認識手段が設けられ、音声
認識用の標準パターンの登録時には、前記制御部は、一
時記憶部に記録された２種類以上の言語の音声のうち一
種類以上の言語の音声を第１の音声として再生し、利用
者に該第１の声に従って発声させ、利用者が発声した音
声に基づいて音声認識用の標準パターンを生成して、こ
れを音声認識手段に登録し、また、音声認識時には、前
記制御部は、一時記憶部に記録された２種類以上の言語
の音声の中から、前記利用者が発声した種類の言語とは
別の種類の言語の音声を第２の音声として再生し、利用
者に、この第２の音声に対応した第１の音声を発声さ
せ、利用者の発声音声を音声認識手段で認識させ、その
認識結果が、一時記録部に記録されていて第１の音声と
して再生された音声と関連付けられているか否かを判断
して利用者に提示するようになっていることを特徴とす
る教育機器。
【請求項３】全体を制御する制御部と、音声を入力す
る音声入力部と、音声を記録保持する音声記録保持部
と、該音声記録保持部に記録保持されている音声を再生
する音声再生部と、音声記録保持部に記録保持されてい
る音声のいずれかを指示する指示部とを有し、前記制御
部には、音声認識用の標準パターンを登録可能であって
音声入力部からの音声を認識可能な音声認識手段が設け
られ、音声認識用の標準パターンの登録時には、前記制
御部は、音声記録保持部に記録されている音声を音声再
生部によって再生させて、利用者に再生された音声に近
い音声を発声させ、利用者が発声した音声と音声記録保
持部の記録部分、あるいは別の部分に保持した音声との
間の類似性を求め、類似性が高い場合に、利用者が発声
した音声の特徴パターンを音声認識用の標準パターンと
して音声認識手段に登録する一方、類似性が低い場合に
は同じ音声に対して複数回の発声動作を利用者に求め、
最も類似性が高い音声の特徴パターンを音声認識用の標
準パターンとして登録するようになっていることを特徴
とする教育機器。
【請求項４】請求項１乃至請求項３のいずれか一項に
記載の教育機器において、前記音声認識手段には、特定
話者用標準パターン登録部と、比較部と、結果出力部
と、不特定話者用標準パターン登録部とが設けられてお
り、前記音声認識手段は、まず、不特定話者用の標準パ
ターンを使って、利用者が正しい発音をしているかどう
かをチェックし、正しいと判断された利用者の音声の特
徴パターンを特定話者用の標準パターンとして特定話者
用標準パターン登録部に登録することを特徴とする教育
機器。
【請求項５】請求項１乃至請求項４のいずれか一項に
記載の教育機器において、音声認識手段の認識結果が違
っていた場合に、制御部は、指示された音声と対になる
一方または両方の音声を、音声記録保持部あるいは一時
記憶部から読み出して音声再生部から再生するようにな
っていることを特徴とする教育機器。
【請求項６】請求項１乃至請求項４のいずれか一項に
記載の教育機器において、音声認識手段の認識結果が違
っていた場合に、制御部は、いま再生された音声を再度
再生して、利用者に発声を求めるようにし、利用者が再
度発声すると、その音声の特徴パターンで先に登録した
音声認識用の標準パターンを書き換えるようになってい
ることを特徴とする教育機器。
【請求項７】全体を制御する制御部と、音声を入力す
る音声入力部と、音声を記録保持する音声記録保持部
と、該記録音声を再生する音声再生部と、音声記録保持
部に記録されている音声のいずれかを指示する指示部と
を有し、前記制御部には、認識用の音声パターンを登録
可能であって音声を認識可能な音声認識手段が設けら
れ、認識用の音声パターンの登録時には、前記制御部
は、音声記録保持部に記録されている音声を音声再生部
によって再生させ、利用者が再生された音声に近い音声
を発声するとき、利用者が発声した音声と音声記録保持
部の記録部分、あるいは別の部分に保持した音声との間
の類似性を求め、類似性が高い場合に、利用者が発声し
た音声を認識用の音声パターンとして音声認識手段に登
録する一方、類似性が低い場合には同じ音声に対して複
数回の発声動作を利用者に求め、最も類似性が高い音声
を認識用の音声パターンとして登録し、また、音声認識
時には、前記制御部は、前記指示部によって発声する音
声を利用者に指示させた後、利用者に該音声を発声さ
せ、利用者の発声音声を音声認識手段で認識させ、その
認識結果が指示部で指示された音声と関連付けられてい
るか否かを判断し、その後、音声認識部によって発声す
る音声を指定し、利用者が発した音声の特徴パターンと
標準パターンとの間で類似度を計算して認識結果を割り
出し、正しい認識結果が得られず、誤認識された場合
は、計算された類似度が予め決められた所定の閾値より
も小さいか、大きいかを判断し、小さい時は、誤認識さ
れた音声を再生するようになっていることを特徴とする
教育機器。
【請求項８】請求項７記載の教育機器において、前記
所定の閾値としては、特定話者方式の標準パターンと正
しい入力音声の特徴パターンとの間で生じる類似度の１
／２から２／３程度のものが用いられることを特徴とす
る教育機器。
【請求項９】全体を制御する制御部と、音声を入力す
る音声入力部と、音声、および、音声に対応した画像を
記録保持する音声・画像記録保持部と、該音声・画像記
録保持部に記録保持されている音声を再生する音声再生
部と、音声・画像記録保持部に記録保持されている画像
を表示する表示部と、音声・画像記録保持部に記録保持
されている音声および／またはこれに対応した画像を指
示する指示部とを有し、前記制御部には、音声認識用の
標準パターンを登録可能であって音声入力部からの音声
を認識可能な音声認識手段が設けられ、音声認識用の標
準パターンの登録時には、前記制御部は、音声・画像記
録保持部に記録されている画像を表示部に表示させると
ともに、音声・画像記録保持部に記録されている対応す
る音声を音声再生部によって再生させ、それに従って利
用者が再生された音声に近い音声を発声するとき、利用
者が発声した音声に基づいて音声認識用の標準パターン
を生成して、これを音声認識手段に登録し、また、音声
認識時には、前記制御部は、発声すべき音声および／ま
たはこれに対応した画像を前記指示部によって利用者に
指示させた後、利用者に該音声を発声させ、利用者の発
声音声を音声認識手段で認識させ、その認識結果が指示
部で指示された音声と関連付けられているか否かを判断
して利用者に提示するようになっていることを特徴とす
る教育機器。