JPH02103600A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH02103600A
JPH02103600A JP63258265A JP25826588A JPH02103600A JP H02103600 A JPH02103600 A JP H02103600A JP 63258265 A JP63258265 A JP 63258265A JP 25826588 A JP25826588 A JP 25826588A JP H02103600 A JPH02103600 A JP H02103600A
Authority
JP
Japan
Prior art keywords
feature
voice
pattern
microphone
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63258265A
Other languages
English (en)
Inventor
Takashi Ariyoshi
有吉 敬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63258265A priority Critical patent/JPH02103600A/ja
Publication of JPH02103600A publication Critical patent/JPH02103600A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 圧術豆互 本発明は、音声認識装置、より詳細には騒音下の音声認
識、例えば、工場内、オフィス内、自動車内での音声認
識に適用して有効な音声認識装置に関する。
丈末挟催 従来の音声工3識装置における大きな欠点の1つは、騒
音の大きな環境で発声された音声の認識率か悪いことで
ある。
騒音下でマイクから入力された信号には、音声に9!音
が重畳している。この周囲騒音成分を除去する方法とし
て、スペクトルサブトラクト法がある。騒音が重畳した
音声のスペクトルから、騒音のスペクトルを減じ、音声
のスペクトルとするものである。実際には、音声収音用
のマイクと騒音収音用マイクの2本のマイクを用いる方
法がある。
しかしながら、2本のマイクを用いるために、通常の1
本のマイクによる認識に比へ、マイクや特ILnt抽出
回路のコストが上がるという欠点がある。
また、音声認識装置には、1本のマイク、2本のマイク
両方の方式に対応するものはないので、1本のマイクを
用いた従来の音声認識装置を使用しているユーザが、騒
音に強い2本のマイクを用いた方式に変えようとすると
、装置全体を交換せざるを得ないという問題がある。
l−一攻 本発明は、上述のごとき実情に鑑みてなされたもので5
特に、騒音の大きな環境での音声認識をコストを上げる
ことなく、より正確に行うことを目的としてなされたも
のである。
盪−一底 本発明は、上記目的を達成するために、1つ、又は、2
つのマイクから入力された音声、かつ。
または、周囲騒音の特徴量を抽出する1つ、又は、2つ
の特微量抽出部と、上記特徴抽出部が1つの場合には、
該特徴抽出部で抽出された特徴量を音声の特徴量とし、
上記特徴抽出部が2つの場合には、一方の特徴抽出部で
抽出された特徴量から、他方の特徴抽出部で抽出された
特徴量で表現される成分を予め定められた手法により除
去したものを音声の特徴量として、該特徴量から入力音
声のパターンを作成する音声パターン作成部と、予め’
l 録された音声の標準パターンを記憶する標準パター
ン記憶部と、上記入力音声のパターンと」二記標準パタ
ーンとでパターンマツチングを行うパターンマツチング
部とを具備して成ること、或いは、1つ、又は、2つの
マイクから人力された音声、かつ、または、周囲騒音の
特徴量を抽出する1つ、又は、2つの特微量抽出部と、
上記マイク入力の数が1つか、或は、2つかを選択する
マイク入力選択手段と、上記マイク入力が1つの場合に
は、該マイク入力に対応する特徴抽出部で抽出された特
徴量を音声の特徴量とし、上記マイク入力が2つの場合
には、一方のマイク入力に対応する特徴抽出部で抽出さ
れた特徴量から、他方のマイク入力に対応する特徴抽出
部で抽出された特徴量で表現される成分を予め定められ
た手法により除去したものを音声の特徴量として、該特
徴量から入力音声のパターンを作成する音声パターン作
成部と、予め登録された音声の標準パターンを記憶する
標準パターン記憶部と、上記入力音声のパターンと上記
標準パターンとでパターンマツチングを行うパターンマ
ツチング部とを具備して成ることを特徴としたものであ
る。以下、本発明の実施例に基づいて説明する。
第1図は、請求項第1項の発明の一実施例を説明するた
めの構成図で、図中、lはマイクロフォン、2は特徴抽
出部、3は標準パターンメモリ、4はマイク入力選択回
路、5はプログラムメモリ56はCPU、7は認識結果
出力部、8はバスで、同図は1つのマイク入力で用いる
場合の構成を示し、図示のように、特徴抽出部2と、I
準パターンメモリ3と、マイク入力選択回路4と、プロ
グラムメモリ5と、CPU6と、認識結果出力部7とか
ら成っており、各部はCPUのバス8を介して接続され
ている。
特徴抽出部2は、15チヤンネルのBPFバンクを用い
てマイクロフォン1から入力された(i号のスペクトル
を求め、特徴量とする。a準パターンメモリ3は、予め
登録された音声の標準パターンを記憶するメモリである
。マイク入力選択回路4は、使用されるマイク入力が1
系統か、2系統かを選択する。この場合、外部接続すべ
き端子がオープンになっていて、マイク人力1系統が選
択されている。プログラムメモリ5には、音声区間検出
、音声パターン作成、パターンマツチング、認識結果出
力などのプログラムが格納されている。
音声区間検出、音声パターン作成については、マイク人
力1系統用とマイク人力2系統用の2通りのプログラム
があり、マイク入力選択回路4の信号によって使い分け
られるが、この場合、マイク人力1系統が選択されてい
るので、上記特徴抽出部で抽出された特徴量をそのまま
音声の特徴量として、音声区間検出、音声パターン作成
を行う。
ここで、音声区間検出、音声パターン作成、パターンマ
ツチングは、従来のB T S P (13inary
Time Spectrum pattern)音声認
識方式の手法が用いられる。CPU6は、上記のプログ
ラムを実行する。認識結果出力部7は、パターンマツチ
ングの結果を他の装置に出力する回路である。
第2図は、請求項第2項に記載された発明の一実施例を
説明するための構成図で、図中、第1図に示した実施例
と同様の作用をする部分には、第1図の場合と同一の参
照番号が付しである。而して、この実施例は、2つのマ
イクを用いる場合の例を示している。この実施例が、第
1図に示した実施例と異なるところは、第1図の実施例
に更にもう1つのマイクロフォン9及び特徴抽出部10
が加わり、上記CPUのバス8を介して接続されており
、又、マイク入力選択回g4の外部接続すべき端子にマ
イク2系統を表す信号が接続されることである。
従って、この場合、音声区間検出、音声パターン作成の
プログラムは、マイク人力2系統用のプログラムが実行
される。即ち、一方の特徴抽出部2で抽出される特徴量
を騒音の重畳した音声の特徴量とし、他方の特徴抽出部
10で抽出される特徴量を騒音の特徴量として、この2
つの特徴量から、例えば昭和63年電子情報通4i学会
秋期全国大会A−1−1Or音声認識システムにおける
騒音抑制の一方法」 (東京電機大・黒用)に発表され
ているような手法によって、音声区1tJJ検出、音声
の特′fi量の作成が行われ、この音声の特徴量からB
TSP音声認識方式の手法によって、音声パターンが作
成される。
ここでは、マイク人力選択回路は、特徴抽出部が2つ有
れば、マイク2系統の処理を選択するが、マイクジャッ
クに2つのマイクが挿入されているかどうかを検出して
処理を選択する方法も実現できる。
また、本実施例ではプログラムメモリの中にマイク人力
1系統用、マイク人力2系統用のプログラムの両方が格
納されていて、マイク入力選択回路で切り替えているが
、これらの代わりに、マイク人力1系統用のプログラム
メモリと、マイク人力2系統用のプログラムメモリを差
し替える方法を用いても実現できる。
効果 以上の説明から明らかなように、請求項第1−項の発明
によれば、騒音の小さい環境では、マイクを1本用いて
音声認識を行い、騒音の大きい環境では、1本のマイク
と一部の部品を追加、変更することで同一の音声認識装
置を用いて音声認識を行うことが出来る。即ち、 ・初め、騒音の小さい環境で用いていたが、環境が変わ
り騒音が大きくなった場合。
・初め、比較的コストの安いマイク1本の方式で使用し
ていたが、騒音のため誤認識が多く、騒音下の認識率の
良いマイク2本の方式に変えたい場合。
などにおいて、簡単な追加手続きと、安価なコストで変
更が出来るという利点がある。
又、許容される認識率というものは、ユーザの主観やア
プリケーションによっても異なるので、1本マイク方式
と2本マイク方式をユーザが選択できる、即ち、経済性
と性能を選択できることも大きな利点である。
また、請求項第2項の発明によると、請求項第1−項に
対応する作用効果に加え、マイク1本の方式か、マイク
2本の方式かの判断が、追加回路の有無、マイクの有無
などによって自動的にシステムでおこなわれるので、両
方式間の変更作業が更に容易となる。
【図面の簡単な説明】
第1図及び第2図は、それぞれ本発明の詳細な説明する
ための構成図である。 1・・マイクロフォン、2・特徴抽出部、3・・・標準
パターンメモリ、4・・・マイク人力選択回路、5プロ
グラムメモリ、6・・・CPU、7・・・認識結果出力
部、8・・CPUのバス、9 ・マイクロフォン。 10・・・特徴抽出部。 特許出願人  株式会化 リコー 第 図 第 図

Claims (1)

  1. 【特許請求の範囲】 1、1つ、又は、2つのマイクから入力された音声、か
    つ、または、周囲騒音の特徴量を抽出する1つ、又は、
    2つの特徴量抽出部と、上記特徴抽出部が1つの場合に
    は、該特徴抽出部で抽出された特徴量を音声の特徴量と
    し、上記特徴抽出部が2つの場合には、一方の特徴抽出
    部で抽出された特徴量から、他方の特徴抽出部で抽出さ
    れた特徴量で表現される成分を予め定められた手法によ
    り除去したものを音声の特徴量として、該特徴量から入
    力音声のパターンを作成する音声パターン作成部と、予
    め登録された音声の標準パターンを記憶する標準パター
    ン記憶部と、上記入力音声のパターンと上記標準パター
    ンとでパターンマッチングを行うパターンマッチング部
    とを具備して成ることを特徴とする音声認識装置。 2、1つ、又は、2つのマイクから入力された音声、か
    つ、または、周囲騒音の特徴量を抽出する1つ、又は、
    2つの特徴量抽出部と、上記マイク入力の数が1つか、
    或は、2つかを選択するマイク入力選択手段と、上記マ
    イク入力が1つの場合には、該マイク入力に対応する特
    徴抽出部で抽出された特徴量を音声の特徴量とし、上記
    マイク入力が2つの場合には、一方のマイク入力に対応
    する特徴抽出部で抽出された特徴量から、他方のマイク
    入力に対応する特徴抽出部で抽出された特徴量で表現さ
    れる成分を予め定められた手法により除去したものを音
    声の特徴量として、該特徴量から入力音声のパターンを
    作成する音声パターン作成部と、予め登録された音声の
    標準パターンを記憶する標準パターン記憶部と、上記入
    力音声のパターンと上記標準パターンとでパターンマッ
    チングを行うパターンマッチング部とを具備して成るこ
    とを特徴とする音声認識装置。
JP63258265A 1988-10-13 1988-10-13 音声認識装置 Pending JPH02103600A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63258265A JPH02103600A (ja) 1988-10-13 1988-10-13 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63258265A JPH02103600A (ja) 1988-10-13 1988-10-13 音声認識装置

Publications (1)

Publication Number Publication Date
JPH02103600A true JPH02103600A (ja) 1990-04-16

Family

ID=17317837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63258265A Pending JPH02103600A (ja) 1988-10-13 1988-10-13 音声認識装置

Country Status (1)

Country Link
JP (1) JPH02103600A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111179969A (zh) * 2019-12-26 2020-05-19 数海信息技术有限公司 一种基于音频信息的报警方法、装置、系统及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111179969A (zh) * 2019-12-26 2020-05-19 数海信息技术有限公司 一种基于音频信息的报警方法、装置、系统及存储介质

Similar Documents

Publication Publication Date Title
US7672844B2 (en) Voice processing apparatus
JP3163109B2 (ja) 多方向同時収音式音声認識方法
JP2000330587A (ja) 音声認識方法および装置
JPH02103600A (ja) 音声認識装置
JP2992324B2 (ja) 音声区間検出方法
JPS584198A (ja) 音声認識装置における標準パタ−ン登録方式
JPH04324499A (ja) 音声認識装置
JPS6367197B2 (ja)
JP3114757B2 (ja) 音声認識装置
JP3450972B2 (ja) パターン認識装置
JP2989219B2 (ja) 音声区間検出方式
JPH01321499A (ja) 音声認識装置
JPH04276799A (ja) 音声認識システム
JP3091244B2 (ja) 雑音除去装置及び音声認識装置
JPS6237280Y2 (ja)
JP2000125397A (ja) 話者識別型ディジタル補聴器
JPH04163597A (ja) 車載用音声認識装置
JPH03147000A (ja) 音声入力装置
JPS6193499A (ja) 音声パタ−ン照合方式
JPS63184799A (ja) 音声認識装置の入力装置
JPH06318099A (ja) 話者認識装置
JPS5876892A (ja) 音声認識装置
JPS5886598A (ja) 音声認識装置
JPH0316038B2 (ja)
JPH07210186A (ja) 音声登録装置