JPS6242200A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS6242200A JPS6242200A JP60182521A JP18252185A JPS6242200A JP S6242200 A JPS6242200 A JP S6242200A JP 60182521 A JP60182521 A JP 60182521A JP 18252185 A JP18252185 A JP 18252185A JP S6242200 A JPS6242200 A JP S6242200A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- recognition
- recognition device
- section
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
技夏分災
本発明は、音声認識装置に関する。
従来1地
複数の異なる種類の音声を認識する音声認識装置におい
て、どの音声の種類も同じ発声間隔をとることは広く知
られているが、これでは異なる種類の音声の分類がされ
にくく、高認識率を得ることはできない。
て、どの音声の種類も同じ発声間隔をとることは広く知
られているが、これでは異なる種類の音声の分類がされ
にくく、高認識率を得ることはできない。
また、発声間隔を利用する技術は、特開昭56−114
04L号公報に開示された音声入力文書作成装置におい
て公知であるが、この場合の発声間隔は単語や文章の区
切りに利用するもので、異なる種類の音声の分類に利用
しているものではない。更に、異なる種類の音声、例え
ば単語と単音節を同じ方式で認識すると認識精度が悪く
なるため、入力部は同じでも認識部は別々に持−)こと
が通常である。一般には、入力された音声の長さ。
04L号公報に開示された音声入力文書作成装置におい
て公知であるが、この場合の発声間隔は単語や文章の区
切りに利用するもので、異なる種類の音声の分類に利用
しているものではない。更に、異なる種類の音声、例え
ば単語と単音節を同じ方式で認識すると認識精度が悪く
なるため、入力部は同じでも認識部は別々に持−)こと
が通常である。一般には、入力された音声の長さ。
パワー安定部のスペクトル変化などで分類されているが
1例えば単音節「れ」と単語「例(れ−)」や集音部「
きよ」と米語「今日」などの区分が正確にできないとい
う欠点を持っている。
1例えば単音節「れ」と単語「例(れ−)」や集音部「
きよ」と米語「今日」などの区分が正確にできないとい
う欠点を持っている。
■−−煎
本発明は、」二連のごとき実情に鑑みてなされたもので
、特に、認識率の高い音声認識装置を提供することを目
的としてなされたものである。
、特に、認識率の高い音声認識装置を提供することを目
的としてなされたものである。
楕成
本発明は、上記目的を達成するために、音声入力部と音
声認識部とを有し、複数の異なる種類の音声を認識する
音声認識装置において、入力しようとする音声の種類が
直前の入力音声の種類と異なる時は、直前の入力音声の
種類と同じ時に発声する発声間隔とは、異なる発声間隔
をとること、或いは、集音部と、集音された信号から音
声に係る部分を検出する検出部と、異なる複数の音声を
認識し得る認識部とを具備しで成る音声認識装置におい
て、認識せんとする音声と、(の前後に認識した音声の
時間間隔を測定し、該時間間隔の長さにより音声信号の
認識部を選択するようにしたこと、或いは、集音部と、
集音された信号から音声に係る部分を検出する検出部と
、異なる種類への音声を認識し得る認識部と、認識結果
を表示する表示部とを具備して成る音声認識装置におい
て、認識せんとする音声と、その前後に認識した音声の
時間間隔を測定し、該時間間隔の長さにより認識結果の
いずれかを選択して表示するようにしたことを特徴とし
たものである。以下、本発明の実施例に基づいて説明す
る。
声認識部とを有し、複数の異なる種類の音声を認識する
音声認識装置において、入力しようとする音声の種類が
直前の入力音声の種類と異なる時は、直前の入力音声の
種類と同じ時に発声する発声間隔とは、異なる発声間隔
をとること、或いは、集音部と、集音された信号から音
声に係る部分を検出する検出部と、異なる複数の音声を
認識し得る認識部とを具備しで成る音声認識装置におい
て、認識せんとする音声と、(の前後に認識した音声の
時間間隔を測定し、該時間間隔の長さにより音声信号の
認識部を選択するようにしたこと、或いは、集音部と、
集音された信号から音声に係る部分を検出する検出部と
、異なる種類への音声を認識し得る認識部と、認識結果
を表示する表示部とを具備して成る音声認識装置におい
て、認識せんとする音声と、その前後に認識した音声の
時間間隔を測定し、該時間間隔の長さにより認識結果の
いずれかを選択して表示するようにしたことを特徴とし
たものである。以下、本発明の実施例に基づいて説明す
る。
本発明は、複数の異なる種類の音声を認識する音声認識
装置において、入力しようとする音声の種類が、直前の
入力音声の種類と異なる時は、直前の入力音声の種類と
同じ時に発声する間隔よりも発声間隔を長くとることに
より、音声の種類を分類しやすくし、もって、認識率を
あげるようにしたものである。
装置において、入力しようとする音声の種類が、直前の
入力音声の種類と異なる時は、直前の入力音声の種類と
同じ時に発声する間隔よりも発声間隔を長くとることに
より、音声の種類を分類しやすくし、もって、認識率を
あげるようにしたものである。
第1図は、本発明の一実施例を説明するための構成図で
、図中、]は音声入力部、2は音声認識部、3は畠力部
で、音声認識部2は単語認識部2Aと単音節認識部2B
より成っており、音声入力部1からは単音節と単語が入
力される。
、図中、]は音声入力部、2は音声認識部、3は畠力部
で、音声認識部2は単語認識部2Aと単音節認識部2B
より成っており、音声入力部1からは単音節と単語が入
力される。
第2図は、上記音声認識装置における全体の処理フロー
を示す図で、今、単音節又は単語入力が続く場合の発声
間隔をtl、単音節と単語が交互に入力される場合の発
声間隔をt2としく但し。
を示す図で、今、単音節又は単語入力が続く場合の発声
間隔をtl、単音節と単語が交互に入力される場合の発
声間隔をt2としく但し。
tlくt2とする)、入力する文頭は必らず単音節でい
れるものときめておけば、例えば、「きようばてんきが
よいてす」という文章中、「てんき」。
れるものときめておけば、例えば、「きようばてんきが
よいてす」という文章中、「てんき」。
「よい」、「です」の3つが単語辞書パターンに登録さ
れている時は、発声は、 tt tt t2 t2 t2 tt
の様におこなえばよい。
れている時は、発声は、 tt tt t2 t2 t2 tt
の様におこなえばよい。
第3図は、第1図に示した実施例の変形実施例を示す図
で、第1図に示した実施例においては、文頭は必ず単音
節で入力するようにしたが、この実施例においては、指
定部4を設け、この指定部4により、最初の入力音声が
単音節であるか、単語であるかと指定するようにしてい
る。
で、第1図に示した実施例においては、文頭は必ず単音
節で入力するようにしたが、この実施例においては、指
定部4を設け、この指定部4により、最初の入力音声が
単音節であるか、単語であるかと指定するようにしてい
る。
第4図及び第5図は、それぞれ本発明の他の実施例を説
明するための構成図で、図中、11は集音部、12は検
出部、13は時間間隔測定部。
明するための構成図で、図中、11は集音部、12は検
出部、13は時間間隔測定部。
14は単語認識部、15は単音節認識部、16は出力表
示部で、この場合の音声入力は、例えば、単音節を入力
する時、直前に発声したものとの間隔をjl+単語を入
力する時、直前に発声したものとの間隔をt2とする(
ただし、t1≠t2)。
示部で、この場合の音声入力は、例えば、単音節を入力
する時、直前に発声したものとの間隔をjl+単語を入
力する時、直前に発声したものとの間隔をt2とする(
ただし、t1≠t2)。
今、第1図に示した実施例の例題文を同じ条件で(単語
が3つ含まれている)入力するとすれば、その時のその
発声方法は、 tt t、 t2 t、 t2 t2
というように行う(この例では、tl<t2)。
が3つ含まれている)入力するとすれば、その時のその
発声方法は、 tt t、 t2 t、 t2 t2
というように行う(この例では、tl<t2)。
而して、第4図に示した実施例は、認識せんとする音声
と、その前後に認識した音声の時間間隔を時間間隔測定
部13で測定し、その時間間隔の長さにより音声信号の
認識部の選択すなわち単語認識部14と単音節認識部1
5のいずれかを選択するものであり、第5図に示した実
施例は、測定した時間間隔の長さにより認識結果のいず
れかを選択するようにしたものである。
と、その前後に認識した音声の時間間隔を時間間隔測定
部13で測定し、その時間間隔の長さにより音声信号の
認識部の選択すなわち単語認識部14と単音節認識部1
5のいずれかを選択するものであり、第5図に示した実
施例は、測定した時間間隔の長さにより認識結果のいず
れかを選択するようにしたものである。
効 果
以上の説明から明らかなように、本発明によると、複数
の異なる種類の音声を認識する装置において、音声の種
類を分類するために特別な回路を設けずに分類すること
ができ、そのため低コストで高性能の認識装置を得るこ
とができる。
の異なる種類の音声を認識する装置において、音声の種
類を分類するために特別な回路を設けずに分類すること
ができ、そのため低コストで高性能の認識装置を得るこ
とができる。
第1図は、本発明による音声認識装置の一実施例を説明
するための構成図、第2図は、第1図に示した実施例の
動作説明をするためのフローチャート、第3図は、第1
図に示した実施例の変形実施例を示す図、第4図及び第
5図は、それぞれ本発明の他の実施例を示す構成図であ
る。 1・・・音声入力部、2・・・認識部、2A・・・単語
認識部、2B・・・単音節認識部、3・・・出力部、4
・・・指定部、11・・・集音部、12・・・検出部、
13・・・時間間隔測定部、14・・・単語認識部、1
5・・・単音節認識部、16・・・出力表示部。 特許出願人 株式会社 リコー 第 1 図 第2図 第3図 第 4 図 第5図 手続補正帯(師) 昭和60年 特許願 第182521号2、発明の名称 音声認識装置 3、補正をする者 事件との関係 特許出願人 オオタ り ナカマゴメ 住所 東京都大田区中馬込1丁目3番6号氏名(名称
) (674)株式会社リコー代表者 浜 1)
広 4、代 理 人 住 所 〒231 横浜市中区不老町1−2−7
6、補正の対象 明細書の発明の詳細な説明の欄7
、補正の内容 明細書第5頁第1行目に記載の「発声間隔を長くとるこ
とにより、」を「発声間隔を長く(又は、短く)するこ
とにより、」に補正する。
するための構成図、第2図は、第1図に示した実施例の
動作説明をするためのフローチャート、第3図は、第1
図に示した実施例の変形実施例を示す図、第4図及び第
5図は、それぞれ本発明の他の実施例を示す構成図であ
る。 1・・・音声入力部、2・・・認識部、2A・・・単語
認識部、2B・・・単音節認識部、3・・・出力部、4
・・・指定部、11・・・集音部、12・・・検出部、
13・・・時間間隔測定部、14・・・単語認識部、1
5・・・単音節認識部、16・・・出力表示部。 特許出願人 株式会社 リコー 第 1 図 第2図 第3図 第 4 図 第5図 手続補正帯(師) 昭和60年 特許願 第182521号2、発明の名称 音声認識装置 3、補正をする者 事件との関係 特許出願人 オオタ り ナカマゴメ 住所 東京都大田区中馬込1丁目3番6号氏名(名称
) (674)株式会社リコー代表者 浜 1)
広 4、代 理 人 住 所 〒231 横浜市中区不老町1−2−7
6、補正の対象 明細書の発明の詳細な説明の欄7
、補正の内容 明細書第5頁第1行目に記載の「発声間隔を長くとるこ
とにより、」を「発声間隔を長く(又は、短く)するこ
とにより、」に補正する。
Claims (4)
- (1)、音声入力部と音声認識部とを有し、複数の異な
る種類の音声を認識する音声認識装置において、入力し
ようとする音声の種類が直前の入力音声の種類と異なる
時は、直前の入力音声の種類と同じ時に発声する発声間
隔とは、異なる発声間隔をとることを特徴とする音声認
識装置。 - (2)、最初の入力音声の種類を指定することを特徴と
する特許請求の範囲第(1)項に記載の音声認識装置。 - (3)、集音部と、集音された信号から音声に係る部分
を検出する検出部と、異なる複数の音声を認識し得る認
識部とを具備して成る音声認識装置において、認識せん
とする音声と、その前後に認識した音声の時間間隔を測
定し、該時間間隔の長さにより音声信号の認識部を選択
するようにしたことを特徴とする音声認識装置。 - (4)、集音部と、集音された信号から音声に係る部分
を検出する検出部と、異なる種類への音声を認識し得る
認識部と、認識結果を表示する表示部とを具備して成る
音声認識装置において、認識せんとする音声と、その前
後に認識した音声の時間間隔を測定し、該時間間隔の長
さにより認識結果のいずれかを選択して表示するように
したことを特徴とする音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60182521A JPS6242200A (ja) | 1985-08-20 | 1985-08-20 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60182521A JPS6242200A (ja) | 1985-08-20 | 1985-08-20 | 音声認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS6242200A true JPS6242200A (ja) | 1987-02-24 |
Family
ID=16119753
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60182521A Pending JPS6242200A (ja) | 1985-08-20 | 1985-08-20 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6242200A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11615796B2 (en) | 2019-10-31 | 2023-03-28 | Ricoh Company, Ltd. | Information processing apparatus, information processing system, and information processing method |
-
1985
- 1985-08-20 JP JP60182521A patent/JPS6242200A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11615796B2 (en) | 2019-10-31 | 2023-03-28 | Ricoh Company, Ltd. | Information processing apparatus, information processing system, and information processing method |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR910002198B1 (ko) | 음성인식방법과 그 장치 | |
| US4720863A (en) | Method and apparatus for text-independent speaker recognition | |
| JPS5972496A (ja) | 単音識別装置 | |
| Bhanja et al. | Deep neural network based two-stage Indian language identification system using glottal closure instants as anchor points | |
| Esfandiari et al. | Vowel classification and vowel space in Persian | |
| JPS6242200A (ja) | 音声認識装置 | |
| JPS5972500A (ja) | 音声認識方式 | |
| JP2813209B2 (ja) | 大語彙音声認識装置 | |
| JPS58108590A (ja) | 音声認識装置 | |
| JPH0441357B2 (ja) | ||
| JPS63217399A (ja) | 音声区間検出装置 | |
| JPS61249099A (ja) | 音声認識装置 | |
| JPS58195895A (ja) | 単語音声認識装置 | |
| JPH0552509B2 (ja) | ||
| JPS6011898A (ja) | 音声認識装置 | |
| JPS6126099A (ja) | 音声基本周波数抽出方法 | |
| JPS58154900A (ja) | 文章音声変換装置 | |
| JPH02226300A (ja) | 音韻区間情報形成装置 | |
| JPS61118800A (ja) | 音声分析装置 | |
| JPS59219799A (ja) | 音声認識装置 | |
| JPS61149997A (ja) | 音声認識装置 | |
| JPS62174798A (ja) | 音声分析装置 | |
| JPS5936759B2 (ja) | 音声認識方法 | |
| JPS5859498A (ja) | 音声認識装置 | |
| JPS63191199A (ja) | 有声破裂子音識別装置 |