JPH11296060A - 教育機器 - Google Patents
教育機器Info
- Publication number
- JPH11296060A JPH11296060A JP10121771A JP12177198A JPH11296060A JP H11296060 A JPH11296060 A JP H11296060A JP 10121771 A JP10121771 A JP 10121771A JP 12177198 A JP12177198 A JP 12177198A JP H11296060 A JPH11296060 A JP H11296060A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- unit
- user
- recognition
- recording
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
に自己の発音の正しさを判断させることができるととも
に、練習者に言葉の意味と発音との両方を身に付けさせ
ることの可能な教育機器を提供する。 【解決手段】 認識用の標準パターンの登録時には、制
御部1は、音声記録保持部2に記録保持されている音声
を音声再生部4によって再生させ、利用者が再生された
音声に近い音声を発声するとき、利用者が発声した音声
の特徴パターンを抽出することで、認識用の標準パター
ンを生成して、これを音声認識手段10に登録し、ま
た、音声認識時には、制御部1は、発声すべき音声を指
示部5によって利用者に指示させた後、利用者に該音声
を発声させ、利用者の発声音声を音声認識手段10で認
識させ、その認識結果が指示部5で指示された音声と関
連付けられているか否かを比較手段20で判断して、そ
の結果を利用者に提示する。
Description
た教育機器に関する。
て、いくつかの技術が提案されている。例えば、特開昭
63−303400号には、カード状の記録装置に模範
の音声(習得したい言語(例えば英語)の模範の音声)を入
れておいて、それを聞きながら復唱してスピーキングの
練習を行なう技術が示されている。この技術によれば、
効果的に模範音声を聞くことはできるが、発音の間違が
あっても本人が気がつかない限り、直すことができない
という欠点がある。
模範となる音声を磁気テープに録音しており、それと利
用者の音声を比較して、類似しているかどうかを機械的
に判断しその結果を話者に知らせる技術が示されてい
る。また、特開昭60−162281号には、模範発声
者の音声と練習者の入力音声とを記憶して、これらを音
響分析し、練習者の入力音声の特徴を模範音声の特徴と
比べて評価し、その分析および評価結果を表示装置に表
示し、練習者は自分の発音を聞き、且つ、表示装置4に
表示された模範音声および自分の音声の分析結果およ
び、自分の音声の評価結果を見て、模範音声と自分の音
声の音声特徴の相違を確認し、自分の発音を矯正する技
術が示されている。
75号,特開昭60−162281号の技術によれば、
模範音声と学習者の音声とを、振幅,ピッチ,ホルマン
トで比較するので、音の比較はできるが、一般の人にと
っては、何を正せば模範の音声に近付くのか理解しにく
いなどの欠点がある。
昭60−162281号の技術では、模範音声(習得し
たい言語(例えば英語)の模範の音声)が出力されるだけ
であって、これにより、利用者は、仮に、この言語の正
しい発音を身につけることができたとしても、その言語
の意味が何であるかを知りたいとき、これをすぐには知
得することができないという欠点があった。すなわち、
語学の学習の基礎は単語の習得にあり、単語を正しい発
音で身につけるためには、教材として正しい発音を示す
ことのみならず、意味を理解することが非常に重要であ
り、現在、日本では単語カードの表面に日本語、裏に外
国語を記入して、表の日本語を見て裏の外国語(例えば
英語)の単語を思い出させるというような手法が広く用
いられているが、特開昭59−220775号,特開昭
60−162281号の技術では、上記の単語カードの
ような使い方ができないという欠点があった。
示して練習者に自己の発音の正しさを判断させることが
できるとともに、練習者に言葉の意味と発音との両方を
身に付けさせることの可能な教育機器を提供することを
目的としている。
し、練習者に言葉で答えさせることで、練習者に言葉の
意味と発音との両方を身に付けさせることの可能な教育
機器を提供することを目的としている。
に、請求項1記載の発明では、全体を制御する制御部
と、音声を入力する音声入力部と、音声を記録保持する
音声記録保持部と、該音声記録保持部に記録保持されて
いる音声を再生する音声再生部と、音声記録保持部に記
録保持されている音声のいずれかを指示する指示部とを
有し、制御部には、音声認識用の標準パターンを登録可
能であって音声入力部からの音声を認識可能な音声認識
手段が設けられ、音声認識用の標準パターンの登録時に
は、制御部は、音声記録保持部に記録されている音声を
音声再生部によって再生させ、利用者が再生された音声
に近い音声を発声するとき、利用者が発声した音声に基
づいて音声認識用の標準パターンを生成して、これを音
声認識手段に登録し、また、音声認識時には、制御部
は、発声すべき音声を指示部によって利用者に指示させ
た後、利用者に該音声を発声させ、利用者の発声音声を
音声認識手段で認識させ、その認識結果が指示部で指示
された音声と関連付けられているか否かを判断して利用
者に提示するようになっていることを特徴としている。
御する制御部と、音声を入力する音声入力部と、2種類
以上の言語でそれぞれ発声された内容の音声が互いに対
応付けて記録されている音声記録部と、音声記録部に記
録された内容を一時的に記憶する一時記憶部と、一時記
憶部に記憶されている内容の音声を再生する音声再生部
とを有し、制御部には、音声認識用の標準パターンを登
録可能であって音声入力部からの音声を認識可能な音声
認識手段が設けられ、音声認識用の標準パターンの登録
時には、制御部は、一時記憶部に記録された2種類以上
の言語の音声のうち一種類以上の言語の音声を第1の音
声として再生し、利用者に該第1の声に従って発声さ
せ、利用者が発声した音声に基づいて音声認識用の標準
パターンを生成して、これを音声認識手段に登録し、ま
た、音声認識時には、制御部は、一時記憶部に記録され
た2種類以上の言語の音声の中から、利用者が発声した
種類の言語とは別の種類の言語の音声を第2の音声とし
て再生し、利用者に、この第2の音声に対応した第1の
音声を発声させ、利用者の発声音声を音声認識手段で認
識させ、その認識結果が、一時記録部に記録されていて
第1の音声として再生された音声と関連付けられている
か否かを判断して利用者に提示するようになっているこ
とを特徴としている。
御する制御部と、音声を入力する音声入力部と、音声を
記録保持する音声記録保持部と、該音声記録保持部に記
録保持されている音声を再生する音声再生部と、音声記
録保持部に記録保持されている音声のいずれかを指示す
る指示部とを有し、制御部には、音声認識用の標準パタ
ーンを登録可能であって音声入力部からの音声を認識可
能な音声認識手段が設けられ、音声認識用の標準パター
ンの登録時には、制御部は、音声記録保持部に記録され
ている音声を音声再生部によって再生させて、利用者に
再生された音声に近い音声を発声させ、利用者が発声し
た音声と音声記録保持部の記録部分、あるいは別の部分
に保持した音声との間の類似性を求め、類似性が高い場
合に、利用者が発声した音声の特徴パターンを音声認識
用の標準パターンとして音声認識手段に登録する一方、
類似性が低い場合には同じ音声に対して複数回の発声動
作を利用者に求め、最も類似性が高い音声の特徴パター
ンを音声認識用の標準パターンとして登録するようにな
っていることを特徴としている。
乃至請求項3のいずれか一項に記載の教育機器におい
て、音声認識手段には、特定話者用標準パターン登録部
と、比較部と、結果出力部と、不特定話者用標準パター
ン登録部とが設けられており、音声認識手段は、まず、
不特定話者用の標準パターンを使って、利用者が正しい
発音をしているかどうかをチェックし、正しいと判断さ
れた利用者の音声の特徴パターンを特定話者用の標準パ
ターンとして特定話者用標準パターン登録部に登録する
ことを特徴としている。
乃至請求項4のいずれか一項に記載の教育機器におい
て、音声認識手段の認識結果が違っていた場合に、制御
部は、指示された音声と対になる一方または両方の音声
を、音声記録保持部あるいは一時記憶部から読み出して
音声再生部から再生するようになっていることを特徴と
している。
乃至請求項4のいずれか一項に記載の教育機器におい
て、音声認識手段の認識結果が違っていた場合に、制御
部は、いま再生された音声を再度再生して、利用者に発
声を求めるようにし、利用者が再度発声すると、その音
声の特徴パターンで先に登録した音声認識用の標準パタ
ーンを書き換えるようになっていることを特徴としてい
る。
御する制御部と、音声を入力する音声入力部と、音声を
記録保持する音声記録保持部と、該記録音声を再生する
音声再生部と、音声記録保持部に記録されている音声の
いずれかを指示する指示部とを有し、制御部には、認識
用の音声パターンを登録可能であって音声を認識可能な
音声認識手段が設けられ、認識用の音声パターンの登録
時には、制御部は、音声記録保持部に記録されている音
声を音声再生部によって再生させ、利用者が再生された
音声に近い音声を発声するとき、利用者が発声した音声
と音声記録保持部の記録部分、あるいは別の部分に保持
した音声との間の類似性を求め、類似性が高い場合に、
利用者が発声した音声を認識用の音声パターンとして音
声認識手段に登録する一方、類似性が低い場合には同じ
音声に対して複数回の発声動作を利用者に求め、最も類
似性が高い音声を認識用の音声パターンとして登録し、
また、音声認識時には、制御部は、指示部によって発声
する音声を利用者に指示させた後、利用者に該音声を発
声させ、利用者の発声音声を音声認識手段で認識させ、
その認識結果が指示部で指示された音声と関連付けられ
ているか否かを判断し、その後、音声認識部によって発
声する音声を指定し、利用者が発した音声の特徴パター
ンと標準パターンとの間で類似度を計算して認識結果を
割り出し、正しい認識結果が得られず、誤認識された場
合は、計算された類似度が予め決められた所定の閾値よ
りも小さいか、大きいかを判断し、小さい時は、誤認識
された音声を再生するようになっていることを特徴とし
ている。
記載の教育機器において、所定の閾値としては、特定話
者方式の標準パターンと正しい入力音声の特徴パターン
との間で生じる類似度の1/2から2/3程度のものが
用いられることを特徴としている。
御する制御部と、音声を入力する音声入力部と、音声、
および、音声に対応した画像を記録保持する音声・画像
記録保持部と、該音声・画像記録保持部に記録保持され
ている音声を再生する音声再生部と、音声・画像記録保
持部に記録保持されている画像を表示する表示部と、音
声・画像記録保持部に記録保持されている音声および/
またはこれに対応した画像を指示する指示部とを有し、
制御部には、音声認識用の標準パターンを登録可能であ
って音声入力部からの音声を認識可能な音声認識手段が
設けられ、音声認識用の標準パターンの登録時には、制
御部は、音声・画像記録保持部に記録されている画像を
表示部に表示させるとともに、音声・画像記録保持部に
記録されている対応する音声を音声再生部によって再生
させ、それに従って利用者が再生された音声に近い音声
を発声するとき、利用者が発声した音声に基づいて音声
認識用の標準パターンを生成して、これを音声認識手段
に登録し、また、音声認識時には、制御部は、発声すべ
き音声および/またはこれに対応した画像を指示部によ
って利用者に指示させた後、利用者に該音声を発声さ
せ、利用者の発声音声を音声認識手段で認識させ、その
認識結果が指示部で指示された音声と関連付けられてい
るか否かを判断して利用者に提示するようになっている
ことを特徴としている。
基づいて説明する。図1は本発明に係る教育機器の構成
例を示す図である。図1を参照すると、この教育機器
は、全体を制御する制御部1と、音声を入力する音声入
力部(例えばマイクロフォン)2と、音声を記録保持する
音声記録保持部(例えばメモリ)3と、該音声記録保持部
3に記録保持されている音声を再生する音声再生部(例
えばスピーカ)4と、音声記録保持部3に記録されてい
る音声のいずれかを指示する指示部(例えばキーボード)
5とを有し、前記制御部1には、認識用の音声パターン
(標準パターン)を登録可能であって音声を認識可能な音
声認識手段10と、比較手段20とが設けられ、認識用
の標準パターンの登録時には、制御部1は、音声記録保
持部2に記録保持されている音声を音声再生部4によっ
て再生させ、利用者が再生された音声に近い音声を発声
するとき、利用者が発声した音声に基づいて(この音声
の特徴パターンを抽出することで)、認識用の標準パタ
ーンを生成して、これを音声認識手段10に登録し、ま
た、音声認識時には、制御部1は、発声すべき音声を指
示部5によって利用者に指示させた後、利用者に該音声
を発声させ、利用者の発声音声を音声認識手段10で認
識させ、その認識結果が指示部5で指示された音声と関
連付けられているか否かを比較手段20で判断して、そ
の結果を利用者に提示するようになっている。
くは、例えば教育機器を動作させるための制御プログラ
ム,外国語の単語の発音音声のデータ(例えば模範とな
る英語音声データ),外国語の単語の日本語の意味など
が記憶されている。
関しては、従来公知の任意の方式を用いることができ
る。例えば文献「古井著 デジタル音声処理(東海大出
版1985年))」に記載されているような方式のものを
用いることができる。
である。図2の例では、音声認識手段10は、特徴抽出
部11と、特定話者用標準パターン登録部12と、比較
部13と、結果出力部14とを有している。
ている場合において、標準パターンの登録時には、利用
者(特定話者)の予め決められた単語の入力音声を特徴抽
出部11で特徴量(特徴パターン)に変換した後、特徴抽
出部11で抽出された特徴パターンを特定話者用標準パ
ターン登録部12に標準パターンとして記憶するように
なっている。一方、音声認識時には、利用者(特定話者)
の未知の単語の入力音声を特徴抽出部11で特徴量(特
徴パターン)に変換した後、比較部13において、未知
の単語の入力音声の特徴パターンと特定話者用標準パタ
ーン登録部12に予め登録してある種々の単語の標準パ
ターンとの間でそれぞれ類似度を計算し、結果出力部1
4では、最も高い類似度を与えた標準パターンをもつ単
語を認識結果として出力するようになっている。
作例について説明する。先ず、音声認識手段10に特定
話者音声認識用の標準パターンを登録する場合について
説明する。いま、指示部5から利用者が単語(単語名)を
例えば日本語で指定(入力)すると、制御部1は、その日
本語を前述したような仕方で利用者に提示する。日本語
の提示の仕方として、例えば、図1に示すように、さら
に表示部6を設け、表示部6に日本語の文字(キャラク
タ)を表示しても良いし、あらかじめ日本語の単語の音
声を波形データとして音声記録保持部(メモリ)3に記憶
しておいて音声再生部(スピーカ)4から再生するように
しても良い。なお、日本語を音声再生で提示するときに
は、表示部6は必ずしも設けられていなくても良い。
後、制御部1は、この日本語単語に対応した外国語の単
語の発音音声データを音声記録保持部3から読み出し、
再生する。これにより、利用者は、この日本語単語に対
応した外国語の単語の発音をスピーカ4を通して聞くこ
とができる。例えば、音声記録保持部3に、日本語単語
とこれに対応した外国語(英語)の単語が単語数“5”で
登録されているとする。ここで、5つの単語を「赤」
「青」「緑」「白」「黒」とする。まず、利用者は、キ
ーボード5から「赤」と入力すると、スピーカ4から
「red」と言う発音が出る。利用者はこれを真似して
マイクロフォン2に向かって「レッド」と発音する。な
お、利用者は、必要に応じて、この発声を複数回繰り返
しても良い。
えば「レッド」)はA/D変換されて、制御部1に与え
られる。制御部1では、与えられた音声の一部を音声認
識手段10に与え、他の一部を再生用の音声として音声
波形のまま音声記録保持部(メモリ)3に記憶することが
できる。なお、この例では、音声信号を分岐して、音声
認識手段10,メモリ3の両方に入力させているが、必
ずしも音声信号を分岐して両方へ入力させる必要はな
い。例えば、マイクロフォン2から入力された音声信号
を音声波形のままメモリ3へ記憶させ、必要に応じて音
声認識手段10へ入力させても良い。また、音声信号を
音声波形のままメモリ3へ記憶させても良いが、利用者
の音声を再生する必要がない場合は、これを音声認識手
段10だけに与え、音声認識用の特徴パターンに変換さ
せて記憶させても良い。この場合には、使用するメモリ
量を少なくさせることができる。
認識手段10に入力されると、音声認識手段10では、
入力された音声(例えば「レッド」)を特定話者音声認識
用の標準パターンとしての登録に利用できる。すなわ
ち、入力された音声(例えば「レッド」)の特徴パターン
をこの利用者(特定話者)の認識用標準パターンとして、
特定話者用標準パターン登録部12に登録することがで
きる。
の単語全ての発音練習を行ない、5つの単語の英語発声
音声に基づいてこの話者用の標準パターンを作成し、こ
れを音声認識手段10に登録する。そして、5つの単語
全ての発音練習を終了すると、利用者は、指示部(キー
ボード)5からテストのモードを選択し、そのとき、単
語名を指定することができる。テストのモードが選択さ
れ単語名が指定されると、制御部1は、音声記録保持部
(メモリ)3に記憶されている日本語(指定された日本語)
を例えば音声で再生して利用者に提示し、この再生が終
了すると、音声認識手段10は、未知の入力音声に対す
る認識待ちの状態に入る。
時,すなわち、実際の音声認識時について説明する。先
ず、指示部5から利用者が単語(単語名)を例えば日本語
で指定(入力)すると、制御部1は、その日本語を前述し
たような仕方で利用者に提示する。日本語の提示の仕方
として、例えば、図1に示すように、さらに表示部6を
設け、表示部6に日本語の文字(キャラクタ)を表示して
も良いし、あらかじめ日本語の単語の音声を波形データ
として音声記録保持部(メモリ)3に記憶しておいて音声
再生部(スピーカ)4から再生するようにしても良い。な
お、日本語を音声再生で提示するときには、表示部6は
必ずしも設けられていなくても良い。
後、利用者は、音声再生部4から日本語で提示された単
語の英語発声を試みることができる。利用者がこの単語
を英語発声すると、英語発声された音声は、制御部1に
取り込まれ、制御部1では、この音声を音声認識手段1
0に与えて、音声認識させる。音声認識手段10では、
入力された英語音声の特徴パターンを求め、この特徴パ
ターンを予め登録されている5つの単語(英語)の標準パ
ターンと照合して、最も類似している標準パターンをも
つ単語を認識結果とし、この認識結果を結果出力部14
から出力させる。この段階で、制御部1は、先に指定さ
れている単語名と認識結果とを比較手段20で比較し、
この比較の結果、同じであれば正解であると判断し、違
っていれば誤りと判断する。そして、この判断結果を例
えば表示部6に表示して利用者に知らせる。この時、単
語の表示の順番は、登録順でも、登録の逆順でも良い
し、あるいは、ランダムにしてもよい。
具体例を説明するためのフローチャートである。図3,
図4の例では、利用者は、先ず、個人情報を記録するフ
ァイル名を入力する(ステップS1)。なお、このファイ
ル名は、利用者がキーボード5から入力しても良いし、
あるいは、機器のメモリに予め記憶されている単語名を
機器自体が自動で読み出し、機器自体が自動的に発生す
ることも可能である。このようにして、ファイル名の入
力がなされると、このファイル名が新しいファイルであ
るか否かを判断する(ステップS2)。この結果、新しい
ファイルの場合は初めての利用であるので、利用者に発
音練習を行なわせ、音声認識用の標準パターンを作成す
る必要がある。そのために、先ず、単語カウンタWCN
Tを“1”に初期設定し(ステップS3),日本語の単語
名を入力する(ステップS4)。日本語の単語名の入力
も、ファイル名の入力と同様に、利用者によりキーボー
ド5から入力させても良いし、あるいは、機器のメモリ
に予め記憶されている単語名を機器自体が自動で読み出
し、機器自体が自動的に発生することも可能である。
の単語名を入力する(ステップS5)。例えば、ステップ
S4で、日本語の単語名として「赤」と入力した時に
は、ステップS5では「red」と入力する。この際、
英語の入力も、手入力でなされても良いし、機器が自動
で入力しても良い。
が入力されると、これらを例えば表示部6に表示する
(ステップS6)。すなわち、例えば、「赤」,「re
d」のように表示する。そして、この教育機器は、模範
の発音を出力し、それに従って、利用者に発声(復唱)さ
せる(ステップS7)。すなわち、機器は模範の音声とし
て「レッド」を出力し、利用者はこれに従い、模範音声
にできる限り似せて「レッド」を発声する。
10へ取り込まれ、音声認識手段10では、利用者が発
声した単語の音声の特徴パターンをこの単語の標準パタ
ーンとして例えばファイルに登録する(ステップS8)。
次いで、単語カウンタWCNTを“1”だけ増加させ
(ステップS9)、カウンタ値WCNTが全ての単語数n
を超えたかを判断する(ステップS10)。nを超えない
ときには、nを超えるまで、ステップS4乃至ステップ
S9の処理を繰り返し、終了したら、上記ファイルを保
存する。
さらに単語の記憶トレーニングをするかを利用者に選択
させる(ステップS11)。利用者が模範音声を聞いて発
音練習するだけの時はこれで処理を終了するが、発音練
習と単語の記憶トレーニングをする時はここからテスト
ルーチンへ入る(すなわち、ステップS15に進む)。
ファイル名がすでに存在し、利用者がすでに発声練習を
したと判断されるときには、互いに対応づけられた英語
語彙と日本語語彙とをロードし(ステップS12,S1
3)、ステップS8で作成された音声認識用の標準パタ
ーン(テンプレート)をロードする(ステップS14)。な
お、ここで、語彙とは単語の集合である。
チンに入る。テストルーチンでは、先ず、単語ポインタ
を最初の単語位置にセットする(ステップS15)。そし
て、単語カウンタWCNTを“1”に初期設定する(ス
テップS16)。次いで、その単語位置の日本語の単語
を例えば表示部6に提示(例えば表示)する(ステップS
17)。ここで、日本語の単語を必ずしも文字表示する
必要はなく、録音された音声で出力しても良い。
するとき、利用者は、それに対応する英語単語を発声す
ることができる(ステップS18)。利用者が英語単語を
発声し、その音声が入力されると、音声認識手段10で
は、この英語単語の音声を音声認識する(ステップS1
9)。すなわち、この英語単語の音声の特徴パターンを
抽出し、この特徴パターンをステップS8で登録された
各単語の標準パターンと照合することで、音声認識を行
なう。そして、この音声認識の結果、利用者の発声した
音声の特徴パターンが正しい英語単語の音声特徴量(標
準パターン)を備えたものであるか否かを判断し(ステッ
プS20)、利用者の発声した音声が正しい英語単語の
音声特徴量(標準パターン)を備えたものでないときには
(リジェクトされたか、あるいは、誤認識結果だった
ら)、ステップS17に戻り、再度日本語の単語を表示
して利用者に再度それに対応する英語単語を発声させ、
ステップS17乃至S20の音声認識処理を繰り返す。
が正しければ、単語カウンタWCNTを“1”だけ増加
して(ステップS21)、単語カウンタWCNTが所定値
nを越えたか否かを判断する(ステップS22)。この結
果、所定値nに達していないときには、再びステップS
17に戻り、次の日本語の単語を表示し、上記テストル
ーチンを繰り返す。このようにして、ステップS22で
単語カウンタWCNTが所定値nを越えたときに、全て
の処理を終了する。
15乃至S22)では、単語ポインタを最初の単語位置
にセットし、最初の単語位置の単語から順次にテストを
行なうようになっているが、これのかわりに、例えば、
乱数を発生させてテストする単語をランダムに決めても
良い。
は、日本語の単語名に対応した英単語の正しい発音を習
得でき、また、これと同時に、この英単語の意味(すな
わち、日本語の単語)が何であるかを把握できる。ま
た、上述の例では、利用者に単語を提示したが、日本語
の文章を提示し、これに対応した英語の文章を利用者に
発声させても良い。また、上述の例では、指示部5にキ
ーボードを用いたが、キーボードのかわりに、例えばフ
ロッピー・ディスクやCD−ROMなどの記録媒体を用
いることもできる。また、上述の例では、指示部5が設
けられているが、指示部5のかわりに、2種類以上の言
語でそれぞれ発声された内容の音声が互いに対応付けて
記録されている音声記録部(フロッピー・ディスクやC
D−ROMなどの記録媒体など)を設けることもでき
る。
を示す図であり、図5の教育機器は、図1の教育機器に
おいて、指示部5のかわりに、2種類以上の言語でそれ
ぞれ発声された内容の音声が互いに対応付けて記録され
ている音声記録部7(フロッピー・ディスクやCD−R
OMなどの記録媒体など)が設けられたものとなってい
る。
部3は、音声記録部7に記録された内容を一時的に記憶
する一時記憶部としての機能も有し、認識用の標準パタ
ーンの登録時には、ある単語について、制御部1は、音
声記録部7から音声記録保持部(一時記憶部)3に記録さ
れた2種類以上の言語の音声のうち一種類以上の言語の
音声(例えば、英語の音声)を第1の音声として音声再生
部4から再生し、利用者に該第1の音声(英語の音声)に
従って英語の音声を発声させ、利用者が発声した音声に
基づいて認識用の標準パターンを生成して、これを音声
認識手段10に登録するようになっており、また、音声
認識時には、ある単語について、制御部1は、音声記録
部7から音声記録保持部(一時記憶部)3に記録された2
種類以上の言語の音声の中から、前記利用者が発声した
種類の言語とは別の種類の言語の音声(例えば、日本語
の音声)を第2の音声として再生し、利用者に、この第
2の音声(日本語の音声)に対応した第1の音声(英語の
音声)を発声させ、利用者のこの発声音声を音声認識手
段10で認識させ、その認識結果が音声記録保持部(一
時記憶部)3に記録され第1の音声として再生された音
声と関連付けられているか否かを判断して利用者に提示
するようになっている。
体)7の内容として、種々のものを設定することがで
き、この内容は、一時的に音声記録保持部3へ記憶され
ることで、発声を促す単語の種類を換えたり、言語の種
類を換えたり、更にはプログラムの変更によって、外国
語だけでなく、質問に対する答えを教えることや、目の
不自由な人に対する訓練機にすることもできる。従っ
て、この音声記憶部7,すなわち記録媒体だけを取り替
えることで教育機器の機能を容易に変更できる。
体を取り替えることで、1つのシステムを多くの人が使
ったり、様々なレベルの学習に使うことができる。
的には、制御部1の音声認識手段10が図2の構成とな
っている機器)では、利用者の誤りをシステム側から指
摘することができない。具体的には、本人が気がつかな
い誤りがある場合、例え「red」を常に「レット」と
発音する人がいた場合、「赤」−「red」というガイ
ダンスに沿って「レット」と発音すると、これがこの特
定話者の標準パターンとして登録されてしまい、テスト
で「赤は何と言うでしょう」との問に対し、「レット」
と発音すれば、音声認識の結果は正解となってしまう。
そのため、模範の発音と自分の発音の違っていることを
誰かに指摘されるまで、上述した教育機器ではその発音
の誤りを正すことはできない。
な誤りに対する修正を可能にすることを意図した音声認
識手段10’の構成例を示す図である。すなわち、図6
の構成例では、できるだけ正しい発音で標準パターンを
作成することと、正しい発音を学習することとを意図し
たものとなっており、音声認識手段10’は、特徴抽出
部11と、特定話者用標準パターン登録部12と、比較
部13と、結果出力部14との他に、さらに、不特定話
者用標準パターン登録部15を有している。
声認識装置が利用できるようになってきたことと、特定
話者方式の方が認識精度が高いこととの2つの特徴を利
用したものであり、図6の構成例では、まず、不特定話
者用の標準パターンを使って、利用者が正しい発音をし
ているかどうかをチェックし、正しいと判断されたもの
に対して特定話者用の標準パターンを登録するようにし
ている。
うな音声認識手段10’の構成となっている場合の教育
機器の他の構成例を示す図であり、図7の教育機器は、
前述のように、本人の思い込みで発音しているような誤
りに対する修正を可能にすることを意図している。すな
わち、図7の教育機器は、できるだけ正しい発音で標準
パターンを作成することと、正しい発音を学習すること
とを目的になされたものである。
育機器において、制御部1の音声認識手段が図6のよう
な音声認識手段10’の構成となっていることの他に、
指示部(例えばキーボード)5とともに、図5の構成例に
示したような音声記録部(記録媒体)7がさらに設けられ
たものとなっている。ここで、音声記録部(記録媒体)7
には、2種類以上の言語でそれぞれ発声された内容の音
声が互いに対応付けて記録されているが、この際、記録
されるべき発声された内容の音声は、不特定話者のもの
となっている(例えば、複数の話者の音声の平均をとっ
た標準的な音声のものとなっている)。
の音声の標準パターンを特定話者用標準パターン登録部
12に登録するに先立って、利用者が発声した音声の特
徴パターンと不特定話者用標準パターン登録部15に登
録されている不特定話者用の標準パターンとの類似度を
求めて、正しい認識結果が得られるかどうかを調べ、正
しい認識結果が得られれば、その音声の特徴パターンを
特定話者用標準パターン登録部12にそのまま登録し、
正しい認識結果が得られない場合は、「もう一度発声練
習をしましょう」とか「発音は正しいですか?」などの
メッセージを利用者に与え、上述したのと同じ動作を繰
り返し行なわせる。このような動作を行なって、不特定
話者用標準パターン登録部15に登録されている不特定
話者用の標準パターンと最も高い類似度を得た利用者音
声の特徴パターンを特定話者用の標準パターンとして特
定話者用標準パターン登録部12に登録することができ
る。
ているのか否かを調べるため、ある単語の音声を発声す
ると、音声認識手段10’では入力された単語の音声の
特徴パターンを抽出し、入力音声の特徴パターンを先ず
最初の不特定話者用の標準パターンと比較する。そし
て、その時の両者の類似度と、この類似度を与えた標準
パターンの単語名とを例えばメモリ(図示せず)に一時記
憶し、次いで、入力音声の特徴パターンを次の不特定話
者用の標準パターンと比較する。この標準パターンとの
類似度が先の標準パターンとの類似度よりも大きい時に
は、先に記憶した標準パターンを消去し、現在の類似度
とその類似度を与えた標準パターンの単語名とを上記メ
モリに記憶する。一方、現在の類似度の方が小さいとき
は、先に記憶した標準パターンをそのままメモリに記憶
保持する。このようにして、入力音声の特徴パターンを
不特定話者用の各標準パターンと順次に比較し、これら
の類似度を求めた後、最も高い類似度を与えた標準パタ
ーン,すなわち、メモリに残っている単語が最大の類似
度を得たもの(単語名)が認識結果となる。
られたとき、制御部1は、この認識結果と、利用者に対
し発声を促した単語名とが一致するか否かを比較し、単
語名が一致するならば正しい発音と判断し、違っていれ
ば、誤まった発音と判断する。これによって本人が気が
つかないような発音の誤りを指摘できる。そして、上記
認識結果と利用者に対し発声を促した単語名とが一致す
るときに、上記認識結果を与えた不特定話者用の標準パ
ターンを特定話者用の標準パターンとして登録すること
ができる。
では、利用者の音声の標準パターンを特定話者用標準パ
ターン登録部12に登録するに先立って、利用者が発声
した音声の特徴パターンと不特定話者用標準パターン登
録部15に登録されている不特定話者用の標準パターン
との類似度を求めて、正しい認識結果が得られるかどう
かを調べ利用者は自分が正しい発音をしているかどうか
が判断でき、正しい音声で教育機器を使うことができ
る。また、これと同時に、自分自身が正しい発音を身に
つけることができる。すなわち、本人の思い込みで発音
しているような誤りに対する修正が可能となり、できる
だけ正しい発音で標準パターンを作成することと、正し
い発音を学習することが可能となる。
単語発声などの学習中に音声認識結果が誤りとなる場合
として、機器から発音提示された時の発音を忘れてしま
って、まったく別の言葉を発声してしまったり、あるい
は、提示された発音と似ている発音をしているが登録し
たときの正しい発音とは違っている場合がある。いずれ
の場合にしても、利用者は正しい発音をもう一度聞いて
みる必要がある。
を示す図であり、図8の教育機器は、上記の問題を解決
することを意図している。
器において、制御部1の音声認識手段は例えば図9のよ
うな音声認識手段10''の構成のものとなっている。ま
た、図8の教育機器の例では、指示部5の他に、音声記
録部(記録媒体)7が設けられている。
識手段10''の認識結果が比較手段20において違って
いたと判断した場合に、制御部1は、指示された音声と
対になる一方または両方の音声を音声記録保持部(一時
記憶部)3から読み出して音声再生部4に与え、これを
再生させるようになっている。
声記録保持部3には、例えば音声記録部(記録媒体)7か
ら、例えば教育機器を動作させるための制御プログラ
ム,外国語の単語の発音音声のデータ(例えば模範とな
る英語音声データ),外国語の単語の日本語の意味など
がロードされ記憶されている。
ターンの登録時には、音声記録保持部3に保持されてい
る単語の音声を音声再生部4から再生して、再生された
音声に近い音声を利用者に繰り返し発声させ、その特徴
パターンを特定話者用の標準パターンとして特定話者用
標準パターン登録部12に登録するようにしている。そ
の後、発声すべき英語を意味する日本語を表示し、それ
に対して発声された英語発音を前述したと同様の仕方で
認識して認識結果を得る。このとき、発声された英語の
音声を、例えば音声記録保持部3に一時的に保存してお
くのも効果的である。
認識の結果、誤認識している時は、制御部1は、音声記
録保持部3から該当単語の英語の音声を取り出し、この
音声信号を音声再生部4から再生して利用者に聞かせ
る。それに続いて、制御部1は、一時的に音声記録保持
部3に取り込んでおいた利用者の発音音声を音声再生部
4から再生して利用者に聞かせる。これによって、利用
者は、正しい英語の発音と自己の発声した発音との違い
を明瞭に把握することができる。すなわち、この種の教
育機器においては、単語発声などの学習中に音声認識結
果が誤りとなる場合として、機器から発音提示された時
の発音を忘れてしまって、まったく別の言葉を発声して
しまったり、あるいは、提示された発音と似ている発音
をしているが登録したときの正しい発音とは違っている
場合があるが、図8の教育機器では、いずれの場合につ
いても、利用者は正しい発音をもう一度聞くことができ
る。
であり、図10の教育機器は、図8の教育機器におい
て、制御部1の音声認識手段に図2の音声認識手段10
が用いられている。すなわち、図10の教育機器は、音
声認識手段10の認識結果が違っていた場合に、制御部
1は、再度、指示された音声を再生して、利用者に発声
を求めるようにし、利用者が再度発声すると、その音声
の特徴パターンで先に登録した音声認識用の標準パター
ンを書き換えるようになっている。
者は自分の知らない言葉を発声しなければならないこと
がある。そのために発声が安定しなかったり、間違えた
りする。このうち、発声の不安定さを低減するには、こ
の教育機器を繰り返し使用することが有効であり、これ
によって発声を安定させることができるが、言い誤り
は、元の標準パターンを書き換えておく必要がある。
外に経時変化がある。すなわち、音声を登録してから時
間が経つと、正しい発音をしているにもかかわらず、正
しい認識ができない場合が生ずることがある。
標準パターンを新しいものと入れ替えるようにしている
ので、上記のような場合に対処することができる。
音声記録保持部3には、例えば音声記録部(記録媒体)7
から、例えば教育機器を動作させるための制御プログラ
ム,外国語の単語の発音音声のデータ(例えば模範とな
る英語音声データ),外国語の単語の日本語の意味など
がロードされ記憶されている。
ターンの登録時には、音声記録保持部3に保持されてい
る単語の音声を音声再生部4から再生して、再生された
音声に近い音声を利用者に繰り返し発声させ、それを特
定話者用の標準パターンとして特定話者用標準パターン
登録部12に登録するようにしている。その後、発声す
べき英語を意味する日本語を表示し、それに対して発声
された英語発音を前述したと同様の仕方で認識して認識
結果を得る。このとき、発声された英語の音声を、例え
ば音声記録保持部3に一時的に保存しておくのも効果的
である。
認識の結果、誤認識している時は、制御部1は、音声記
録保持部3から該当単語の英語の音声を取り出し、この
音声信号を音声再生部4から再生して利用者に聞かせ
る。
登録モードにする。そこで、利用者が音声を発声する
と、発声した音声は特徴抽出されその特徴パターンが特
定話者用標準パターン登録部12に標準パターンとして
登録される。なお、このようにして特徴パターンが標準
パターンとして登録されることによって、先に登録され
ている既存の標準パターン、すなわち現在、誤認識とな
った標準パターンは消去される。しかしながら、既存の
標準パターンを必ずしも消去して書き換えなければなら
ないわけではなく、新たな標準パターンを既存の標準パ
ターンと平均を取ったものを標準パターンとして登録し
てもかまわない。こうすることによって標準パターンの
老朽化を防ぐことができる。
音声認識手段が誤認識した場合に、これが利用者が間違
えた単語を発声したものなのか、正しい単語を間違えて
発声したものなのかを区別できない。
例を示す図であり、図11の教育機器は、音声認識手段
が誤認識した場合に、これが利用者が間違えた単語を発
声したものなのか、正しい単語を間違えて発声したもの
なのかを区別することを意図している。
8や図10の構成例において、制御部1が図12に示す
ような構成のものとなっている。図12を参照すると、
図11の教育機器の制御部1は、音声認識手段10'''
が、特徴抽出部11と、特定話者用標準パターン登録部
12と、比較部13と、結果出力部14との他に、さら
に、比較部13で得られる類似度(認識結果が得られる
とき、この認識結果を与えた単語の音声の特徴パターン
の標準パターンに対する類似度)を保持する指定単語類
似度保持部17を有している。また、制御部1の比較手
段20'は、音声認識手段10'''の指定単語類似度保持
部17に保持された類似度を閾値THと比較し、類似度
が閾値THよりも大きいか小さいかをも判断するように
なっている。
時には、制御部1は、例えば指示部5によって発声する
音声を利用者に指示させた後、利用者に該音声を発声さ
せ、利用者の発声音声を音声認識手段10'''で認識さ
せ、その認識結果が指示部5で指示された音声と関連付
けられているか否かを判断し、その後、音声認識手段1
0'''によって発声する音声を指定し、利用者が発した
音声の特徴パターンと標準パターンとの間で類似度を計
算して前述したと同様にして認識結果を得る。この結
果、正しい認識結果が得られた時は、前述したものと同
様の動作をする一方、正しく認識されなかった場合は、
計算された類似度が予め決められた閾値THよりも小さ
いか、大きいかを判断し、閾値THよりも小さい時は、
誤認識された音声を再生するようにしている。
として、前述のように、利用者が教育機器から提示され
た時の発音を忘れてしまって、まったく別の言葉を発声
してしまうか、または、似ている発音をしているが登録
した時の正しい発音とは違った発音となっている場合が
考えられる。前者の場合は後者に比べて類似度が低いの
で類似度の違いによって、両者を区別することができ
る。すなわち、正しく認識されなかった場合は、計算さ
れた類似度が予め決められた閾値THよりも小さいか、
大きいかを判断することで、両者を区別することができ
る。このように区別がなされると、前者の場合であれ
ば、例えば「単語を間違えていませんか?」のメッセー
ジを利用者に示し、また、後者の場合であれば、「この
単語と区別しましょう」のメッセージを利用者に示し、
誤認識先の単語の音声を再生し、「正解はこれです」と
言って、正しい音声を再生する。
体的に説明する。図11の教育機器においても、音声記
録保持部3には、例えば音声記録部(記録媒体)7から、
例えば教育機器を動作させるための制御プログラム,外
国語の単語の発音音声のデータ(例えば模範となる英語
音声データ),外国語の単語の日本語の意味などがロー
ドされ記憶されている。
ターンの登録時には、音声記録保持部3に保持されてい
る単語の音声を音声再生部4から再生して、再生された
音声に近い音声を利用者に繰り返し発声させ、それを特
定話者用の標準パターンとして特定話者用標準パターン
登録部12に登録するようにしている。その後、発声す
べき英語を意味する日本語を表示し、それに対して発声
された英語発音を前述したと同様の仕方で認識して認識
結果を得る。このとき、発声された英語の音声を、例え
ば音声記録保持部3に一時的に保存しておくのも効果的
である。
分が正しい発音をしているのか否かを調べるため、ある
単語の音声を発声すると、音声認識手段10'''では、
入力された単語の音声の特徴パターンを抽出し、入力音
声の特徴パターンを先ず最初の不特定話者用の標準パタ
ーンと比較する。そして、その時の両者の類似度と、こ
の類似度を与えた標準パターンの単語名とを指定単語類
似度保持部17に一時記憶し、次いで、入力音声の特徴
パターンを次の特定話者用標準パターンと比較する。こ
の標準パターンとの類似度が先の標準パターンとの類似
度よりも大きい時には、先に記憶した標準パターンを消
去し、現在の類似度とその類似度を与えた標準パターン
の単語名とを記憶する。一方、現在の類似度の方が小さ
い時は、そのまま現在の物を消去して、次の標準パター
ンを取り出す。但し、照合する標準パターンの単語名
が、記憶部から音声再生部4を通じて発声されたものと
同じ場合は、類似度にかかわらず、同じ記憶部に記憶し
ておく。
を特定話者用の各標準パターンと順次に比較し、これら
の類似度を求めた後、最も高い類似度を与えた標準パタ
ーン,すなわち、記憶部に残っている単語が最大の類似
度を得たもの(単語名)が認識結果となる。この認識結果
が誤っていた場合には、正しい単語名と共に保存されて
いる類似度を、閾値THと比較する。類似度が閾値TH
よりも低ければ、「単語を間違えていませんか?」と言
うメッセージと共に表示し、一方、閾値THよりも高け
れば、この単語と「間違えていませんか」と言うメッセ
ージと共に、誤認識した単語の音声を音声記録保持部3
から取り出し、音声再生部4から出力する。
ていたことに気付く。あるいは、自分の発音が間違われ
やすい単語を知ることによって、間違われないような発
音をすることになる。
式の標準パターンと正しい入力音声特徴パターンとの間
で生じる類似度の1/2から2/3程度のものが適当で
ある。
ある時、利用者が間違えた単語を発声しているのか、正
しい単語を間違えて発声しているのかを区別し、利用者
へ知らせることが可能になる。
の構成例を示す図であり、図13の教育機器は、模範と
なる文字や絵を示し、練習者に言葉で答えさせること
で、練習者に言葉の意味と発音との両方を身に付けさせ
ることの可能な教育機器を提供することを目的としてい
る。
ば、図1,図5の教育機器において、音声記録保持部3
のかわりに、音声・画像記録保持部(メモリ)23が設け
られており、音声・画像記録保持部23には、本機器を
動作させるためのプログラムと、単語の外国語発音音声
のデータとともに、それに対応した画像(文字や絵)が記
憶されている。なお、図13の例は図1に対応したもの
となっている(指示部5が設けられたものとなってい
る)。
ボード)5から例えば絵を指定すると、その絵を表示部
(ディスプレイ)6に表示して、この絵に対応した音声デ
ータ(外国語の発音)を音声・画像記録保持部23から読
み出し、外国語の発音を音声再生部(スピーカ)4から出
力する。これにより、利用者は、表示部6で絵を見なが
ら、この絵に対応した外国語の発音をスピーカ4を通し
て聞くことができる。例として、外国語が英語であると
し、また、単語数が5の場合を示す。いま仮に、5単語
を「犬」「猫」「鳥」「馬」「牛」とする。プログラム
をスタートすると、最初の犬の絵が表示部6に表示さ
れ、音声再生部(スピーカ)4から「dog」と言う発音
が出力される。利用者はこれを真似して音声入力部(マ
イクロフォン)2に向かって「ドッグ」と発音する。必
要に応じて、これを複数回繰り返しても良い。
れた音声はA/D変換されて、一部は音声認識手段10
へ入力し、他の一部は再生用に音声波形のまま音声・画
像記録保持部(メモリ)23に記憶しておいても良い。こ
の部分は、音声信号を分岐して必ずしも両方へ入れる必
要はない。音声波形のまま音声・画像記録保持部(メモ
リ)23へ記憶し、必要に応じて音声認識手段10へ入
力しても良いし、利用者の音声を再生する必要がない場
合は、音声認識用の特徴量に直して記憶する方が使用す
るメモリ量が少なくて済む。音声認識手段10では入力
された音声を特定話者音声認識の音声登録に利用して話
者の認識用標準パターンを作る。
発音練習を終わる。指示部(キーボード)5からテストの
モードを選ぶと、表示部(ディスプレイ)6に動物の絵が
表示され、認識待ちの状態に入る。
発声を試みる。英語発声された音声は、音声認識手段1
0へ入力されて登録されている5単語の中で認識され、
認識結果を比較手段20へ出力する。ここでは先に送ら
れている単語名と認識結果が比較され、同じであれば正
解、違っていれば誤りとする。その結果を表示部6で利
用者に知らせる。このように、表示部6に絵を順次に表
示させて、利用者にそれに対応した外国語を順次に発声
させてその発音が正しいか否かの結果を利用者に報告で
きる。この時、絵の表示の順番は登録順でも、登録の逆
順でもあるいは、ランダムにしてもよい。
となる文字や絵を示し、練習者に言葉で答えさせること
で、練習者に言葉の意味と発音との両方を身に付けさせ
ることが可能となる。
手段10は、例えば、図2に示したと同様の構成となっ
ており、入力された音声は特徴抽出部11で特徴量に変
換され、音声登録に際しては、変換された特徴量が、直
接、特定話者用標準パターン記録部12に記憶される。
一方、認識に際しては、未知の入力音声を特徴抽出部1
1で特徴量に変換した後、比較部13において、予め登
録されている標準パターンのそれぞれとの間で類似度を
計算し、最も類似度が高いものを結果出力部14から認
識結果として出力する。
り、単語数が5であるとしたが、外国語は英語以外のも
のでも良く、また、単語数も任意の個数のものにするこ
とができる。また、上述の例では、絵と外国語の単語と
の対応付けを述べたが、それに限るものではなく、例え
ば国旗と国名、社章と社名、顔と人名、漢字と読み方、
地図上の位置と場所名との対応付けなどを行なうことも
できる。また、絵を動画にすれば、手話の学習など、視
覚情報と聴覚情報の対応づけの教育に有効である。
章でも良いことはいうまでもない。また、図13におい
て、上述の例では、指示部5がキーボードであるとし、
キーボードからコマンド入力や選択をするようにした
が、指示部5は、必ずしもキーボードである必要なく、
例えばフロッピィディスクなどを用い、プロッピィディ
スクに記憶されているプログラムでコントロールしても
よい。
求項8記載の発明によれば、模範となる音声を示し、練
習者の発音の正しさを判断することと、言葉の意味と、
発音の両方が一度に身につけられるような教育機器を提
供できる。
情報と聴覚情報とを対応づけた学習を極めて効率良く行
なうことが可能となる。
る。
ローチャートである。
ローチャートである。
ある。
ある。
ある。
である。
である。
である。
Claims (9)
- 【請求項1】 全体を制御する制御部と、音声を入力す
る音声入力部と、音声を記録保持する音声記録保持部
と、該音声記録保持部に記録保持されている音声を再生
する音声再生部と、音声記録保持部に記録保持されてい
る音声のいずれかを指示する指示部とを有し、前記制御
部には、音声認識用の標準パターンを登録可能であって
音声入力部からの音声を認識可能な音声認識手段が設け
られ、音声認識用の標準パターンの登録時には、前記制
御部は、音声記録保持部に記録されている音声を音声再
生部によって再生させ、利用者が再生された音声に近い
音声を発声するとき、利用者が発声した音声に基づいて
音声認識用の標準パターンを生成して、これを音声認識
手段に登録し、また、音声認識時には、前記制御部は、
発声すべき音声を前記指示部によって利用者に指示させ
た後、利用者に該音声を発声させ、利用者の発声音声を
音声認識手段で認識させ、その認識結果が指示部で指示
された音声と関連付けられているか否かを判断して利用
者に提示するようになっていることを特徴とする教育機
器。 - 【請求項2】 全体を制御する制御部と、音声を入力す
る音声入力部と、2種類以上の言語でそれぞれ発声され
た内容の音声が互いに対応付けて記録されている音声記
録部と、音声記録部に記録された内容を一時的に記憶す
る一時記憶部と、一時記憶部に記憶されている内容の音
声を再生する音声再生部とを有し、前記制御部には、音
声認識用の標準パターンを登録可能であって音声入力部
からの音声を認識可能な音声認識手段が設けられ、音声
認識用の標準パターンの登録時には、前記制御部は、一
時記憶部に記録された2種類以上の言語の音声のうち一
種類以上の言語の音声を第1の音声として再生し、利用
者に該第1の声に従って発声させ、利用者が発声した音
声に基づいて音声認識用の標準パターンを生成して、こ
れを音声認識手段に登録し、また、音声認識時には、前
記制御部は、一時記憶部に記録された2種類以上の言語
の音声の中から、前記利用者が発声した種類の言語とは
別の種類の言語の音声を第2の音声として再生し、利用
者に、この第2の音声に対応した第1の音声を発声さ
せ、利用者の発声音声を音声認識手段で認識させ、その
認識結果が、一時記録部に記録されていて第1の音声と
して再生された音声と関連付けられているか否かを判断
して利用者に提示するようになっていることを特徴とす
る教育機器。 - 【請求項3】 全体を制御する制御部と、音声を入力す
る音声入力部と、音声を記録保持する音声記録保持部
と、該音声記録保持部に記録保持されている音声を再生
する音声再生部と、音声記録保持部に記録保持されてい
る音声のいずれかを指示する指示部とを有し、前記制御
部には、音声認識用の標準パターンを登録可能であって
音声入力部からの音声を認識可能な音声認識手段が設け
られ、音声認識用の標準パターンの登録時には、前記制
御部は、音声記録保持部に記録されている音声を音声再
生部によって再生させて、利用者に再生された音声に近
い音声を発声させ、利用者が発声した音声と音声記録保
持部の記録部分、あるいは別の部分に保持した音声との
間の類似性を求め、類似性が高い場合に、利用者が発声
した音声の特徴パターンを音声認識用の標準パターンと
して音声認識手段に登録する一方、類似性が低い場合に
は同じ音声に対して複数回の発声動作を利用者に求め、
最も類似性が高い音声の特徴パターンを音声認識用の標
準パターンとして登録するようになっていることを特徴
とする教育機器。 - 【請求項4】 請求項1乃至請求項3のいずれか一項に
記載の教育機器において、前記音声認識手段には、特定
話者用標準パターン登録部と、比較部と、結果出力部
と、不特定話者用標準パターン登録部とが設けられてお
り、前記音声認識手段は、まず、不特定話者用の標準パ
ターンを使って、利用者が正しい発音をしているかどう
かをチェックし、正しいと判断された利用者の音声の特
徴パターンを特定話者用の標準パターンとして特定話者
用標準パターン登録部に登録することを特徴とする教育
機器。 - 【請求項5】 請求項1乃至請求項4のいずれか一項に
記載の教育機器において、音声認識手段の認識結果が違
っていた場合に、制御部は、指示された音声と対になる
一方または両方の音声を、音声記録保持部あるいは一時
記憶部から読み出して音声再生部から再生するようにな
っていることを特徴とする教育機器。 - 【請求項6】 請求項1乃至請求項4のいずれか一項に
記載の教育機器において、音声認識手段の認識結果が違
っていた場合に、制御部は、いま再生された音声を再度
再生して、利用者に発声を求めるようにし、利用者が再
度発声すると、その音声の特徴パターンで先に登録した
音声認識用の標準パターンを書き換えるようになってい
ることを特徴とする教育機器。 - 【請求項7】 全体を制御する制御部と、音声を入力す
る音声入力部と、音声を記録保持する音声記録保持部
と、該記録音声を再生する音声再生部と、音声記録保持
部に記録されている音声のいずれかを指示する指示部と
を有し、前記制御部には、認識用の音声パターンを登録
可能であって音声を認識可能な音声認識手段が設けら
れ、認識用の音声パターンの登録時には、前記制御部
は、音声記録保持部に記録されている音声を音声再生部
によって再生させ、利用者が再生された音声に近い音声
を発声するとき、利用者が発声した音声と音声記録保持
部の記録部分、あるいは別の部分に保持した音声との間
の類似性を求め、類似性が高い場合に、利用者が発声し
た音声を認識用の音声パターンとして音声認識手段に登
録する一方、類似性が低い場合には同じ音声に対して複
数回の発声動作を利用者に求め、最も類似性が高い音声
を認識用の音声パターンとして登録し、また、音声認識
時には、前記制御部は、前記指示部によって発声する音
声を利用者に指示させた後、利用者に該音声を発声さ
せ、利用者の発声音声を音声認識手段で認識させ、その
認識結果が指示部で指示された音声と関連付けられてい
るか否かを判断し、その後、音声認識部によって発声す
る音声を指定し、利用者が発した音声の特徴パターンと
標準パターンとの間で類似度を計算して認識結果を割り
出し、正しい認識結果が得られず、誤認識された場合
は、計算された類似度が予め決められた所定の閾値より
も小さいか、大きいかを判断し、小さい時は、誤認識さ
れた音声を再生するようになっていることを特徴とする
教育機器。 - 【請求項8】 請求項7記載の教育機器において、前記
所定の閾値としては、特定話者方式の標準パターンと正
しい入力音声の特徴パターンとの間で生じる類似度の1
/2から2/3程度のものが用いられることを特徴とす
る教育機器。 - 【請求項9】 全体を制御する制御部と、音声を入力す
る音声入力部と、音声、および、音声に対応した画像を
記録保持する音声・画像記録保持部と、該音声・画像記
録保持部に記録保持されている音声を再生する音声再生
部と、音声・画像記録保持部に記録保持されている画像
を表示する表示部と、音声・画像記録保持部に記録保持
されている音声および/またはこれに対応した画像を指
示する指示部とを有し、前記制御部には、音声認識用の
標準パターンを登録可能であって音声入力部からの音声
を認識可能な音声認識手段が設けられ、音声認識用の標
準パターンの登録時には、前記制御部は、音声・画像記
録保持部に記録されている画像を表示部に表示させると
ともに、音声・画像記録保持部に記録されている対応す
る音声を音声再生部によって再生させ、それに従って利
用者が再生された音声に近い音声を発声するとき、利用
者が発声した音声に基づいて音声認識用の標準パターン
を生成して、これを音声認識手段に登録し、また、音声
認識時には、前記制御部は、発声すべき音声および/ま
たはこれに対応した画像を前記指示部によって利用者に
指示させた後、利用者に該音声を発声させ、利用者の発
声音声を音声認識手段で認識させ、その認識結果が指示
部で指示された音声と関連付けられているか否かを判断
して利用者に提示するようになっていることを特徴とす
る教育機器。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP12177198A JP3741536B2 (ja) | 1998-04-15 | 1998-04-15 | 教育機器 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP12177198A JP3741536B2 (ja) | 1998-04-15 | 1998-04-15 | 教育機器 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH11296060A true JPH11296060A (ja) | 1999-10-29 |
| JP3741536B2 JP3741536B2 (ja) | 2006-02-01 |
Family
ID=14819490
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP12177198A Expired - Fee Related JP3741536B2 (ja) | 1998-04-15 | 1998-04-15 | 教育機器 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3741536B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007017733A (ja) * | 2005-07-08 | 2007-01-25 | Sharp Corp | 入力装置、入力システム、入力方法、入力処理プログラム、および、プログラム記録媒体 |
| JP2024507734A (ja) * | 2021-02-07 | 2024-02-21 | レモン インコーポレイテッド | 音声類似度決定方法及び装置、プログラム製品 |
-
1998
- 1998-04-15 JP JP12177198A patent/JP3741536B2/ja not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007017733A (ja) * | 2005-07-08 | 2007-01-25 | Sharp Corp | 入力装置、入力システム、入力方法、入力処理プログラム、および、プログラム記録媒体 |
| JP2024507734A (ja) * | 2021-02-07 | 2024-02-21 | レモン インコーポレイテッド | 音声類似度決定方法及び装置、プログラム製品 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3741536B2 (ja) | 2006-02-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3520022B2 (ja) | 外国語学習装置、外国語学習方法および媒体 | |
| KR100312060B1 (ko) | 음독이 미숙한 자용 및 표시기가 없는 장치용 음성 인식등록 방법 및 장치 | |
| US8033831B2 (en) | System and method for programmatically evaluating and aiding a person learning a new language | |
| US9786199B2 (en) | System and method for assisting language learning | |
| US6134529A (en) | Speech recognition apparatus and method for learning | |
| US5717828A (en) | Speech recognition apparatus and method for learning | |
| EP0986802B1 (en) | Reading and pronunciation tutor | |
| US8221126B2 (en) | System and method for performing programmatic language learning tests and evaluations | |
| US20060057545A1 (en) | Pronunciation training method and apparatus | |
| US20080140401A1 (en) | Method and apparatus for reading education | |
| JP2001159865A (ja) | 対話型語学指導のための方法および装置 | |
| US20070067174A1 (en) | Visual comparison of speech utterance waveforms in which syllables are indicated | |
| JP2003228279A (ja) | 音声認識を用いた語学学習装置、語学学習方法及びその格納媒体 | |
| KR101992370B1 (ko) | 말하기 학습방법 및 학습시스템 | |
| JP2001249679A (ja) | 外国語自律学習システム | |
| JP3741536B2 (ja) | 教育機器 | |
| JP3837816B2 (ja) | 学習支援装置および問題回答提示方法 | |
| WO2024205497A1 (en) | Method and apparatus to generate differentiated oral prompts for learning | |
| Piton et al. | Using Commercial ASR Solutions to Assess Reading Skills in Children: A Case Report. | |
| JP2873830B2 (ja) | 自動会話練習装置 | |
| JP2001282098A (ja) | 外国語学習装置、外国語学習方法および媒体 | |
| Tsubota et al. | Practical use of autonomous English pronunciation learning system for Japanese students | |
| JPS60244989A (ja) | 発音訓練機 | |
| JPS617868A (ja) | 発声訓練装置 | |
| WO2006057896A2 (en) | System and method for assisting language learning |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050715 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050726 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050926 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051108 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051108 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081118 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091118 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101118 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111118 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111118 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121118 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131118 Year of fee payment: 8 |
|
| LAPS | Cancellation because of no payment of annual fees |