JPH0298000A - 男女声の識別方法 - Google Patents

男女声の識別方法

Info

Publication number
JPH0298000A
JPH0298000A JP63251416A JP25141688A JPH0298000A JP H0298000 A JPH0298000 A JP H0298000A JP 63251416 A JP63251416 A JP 63251416A JP 25141688 A JP25141688 A JP 25141688A JP H0298000 A JPH0298000 A JP H0298000A
Authority
JP
Japan
Prior art keywords
male
value
female
waveform
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63251416A
Other languages
English (en)
Other versions
JP2557497B2 (ja
Inventor
Masayuki Unno
海野 雅幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sekisui Chemical Co Ltd
Original Assignee
Sekisui Chemical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sekisui Chemical Co Ltd filed Critical Sekisui Chemical Co Ltd
Priority to JP63251416A priority Critical patent/JP2557497B2/ja
Publication of JPH0298000A publication Critical patent/JPH0298000A/ja
Application granted granted Critical
Publication of JP2557497B2 publication Critical patent/JP2557497B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、男女声の識別方法に関する。
[従来の技術] 従来、男女声を識別する方法としては、特開昭61−2
7600号公報に記載される如くのピッチ周波数の男女
差を用いるもの、あるいは特開昭60−l[12298
号公報に移載される如くの第1および第2ホルマント周
波数の男女差を用いるもの等がある。
[発明か解決しようとする課U] しかしながら、上記のいずれの方法も、複雑で演算時間
が長く、さらに男女声の周波数軸上ての重なりの部分か
大きいために識別能力が高いとは言えず一般用途への展
開に困難がある。
また、ホルマント周波数による識別方法にあっては、専
用のハードウェア(複数のバンドパスフィルタ)を用い
てホルマン1〜周波数を検出することにより演算時間を
短縮てきるが、ホルマントではない極をホルマントの極
として誤検出することがあり、高い識別能力を期待でき
ない。
本発明は、男女声を識別するに際し、簡易な方法で高い
識別能ツノを達成することを目的とする。
〔5Bを解決するだめの手段] 請求項1に記載の本発明は、入力信号の参照軸交差数と
波形の振幅分布に関する値とを特徴パラメータとして算
出し、この算出結果を、男女の有声音の辞書データと比
較し、入力信号が男女いずれの発声によるものかをFl
定するようにしたものである。
請求項2に記載の本発明は、前記波形の振幅分布に関す
る値として、例えば次式て表わされる波高値Pを用いる
ようにしたものである。
P = 20x Iog+o(Vp/Vr+w*)たた
し、 V p ニ一定時間間隔内の振幅の絶対値の最大
値 V 1BB +同一定時間間隔内の振幅の実効値 請求項3に記載の本発明は、前記波形の振幅分布に関す
る値として、例えば次式て表わされる波高値Pを用いる
ようにしたものである。
P = 20x log+o(Vp/Va)たたし、v
P;一定時間間隔内の振幅の絶対値の最大値 v4:同一定時間間隔内の振幅の 絶対値の平均値 請求項4に記載の本発明は、前記波形の振幅分布に関す
る値として振幅か一定時間間隔内に実効値を目安とする
しきい値を越える時間(超基準振幅時間と呼ぶ)を用い
るようにしたものである。
[作用コ 請求項1に記載の本発明にあっては、男女声を以下の如
く識別する。なお、本発明にあっては、有声音(母音、
半母音、鼻音等の声帯の振動をともなう音てあり、人間
が発声する殆どすべての音声には有声音が含まれ“Cい
る)をもって音声とする。
(1)男声と女声について、それらの信号の一定時間間
隔内における参照軸交差数(零レベル等、予め定めた参
!IC(レベルを横切る回数)と波形の振幅分布に関す
る値とを特徴パラメータとする辞Mデータを用意する。
なお、上記辞書データは、音響データを特徴パラメータ
化した数値データ、数値データを統計処理した平均値、
分散等の統計的データ、もしくは統計的データに基づい
て定まる境界方程式等の判別式データ等の各種態様にて
川、0てきる。
(2)入力信号を採取し、この入力信号の一定時間間隔
内における参照軸交差数と波形の振幅分布に関する値と
を特徴パラメータとして算出する。
(3)上記(2)で算出した特徴パラメータと、上記(
11で定めた辞書データが規定する標準パターンとを、
パラメータ空間上で比較し、入力信号か男声か女声かを
パターン認識により判定する。
すなわち、辞書データて規定されるカテゴリー「男声」
とカテゴリー「女声」とてパラメーター空間は2分され
、−f役的なパターン認識方法を用いて、人力音声の特
徴パラメータがどちらのカテゴリーに屈するかを判定す
ることによって男声が女声かを判定する。なお、辞書デ
ータは代表的な有声音についての十分な数の特徴パラメ
ータの組である。
しかし゛C,請求項1に記載の本発明にあっては、特徴
パラメータとして参照軸交差数と波形の振幅分布に関す
る値の2つのパラメータを用いたから、カテゴリー「男
声」とカテゴリー「女声」とをパラメータ空間において
明瞭に分離できる。
したかって、男声と女声とを高い識別率で簡易に識別で
きる。
請求項2に記載の本発明によれば、波形の振幅分布に関
する値として、前述した如くの波高値を用いたから、波
形の先鋭度において男女間で顕著な差を呈するパラメー
タ値を用いることとなり、男女声の識別性が向上すると
いうメリットかある。
請求項3に記載の本発明によれば、波形の振幅分布に関
する値として、前述した如くの波高値を用いたから、請
求項2に記載の本発明に比して演算量を少なくてき、か
つ波形の先鋭度において男女間て顕著な差を呈するパラ
メータ値を用いることとなり、男女声の識別性が向上す
るというメリットかある。なお、演算量か少ないという
ことは応答速度か速いことを特徴する 請求項4に記載の本発明によれば、波形の振幅分布に関
する値として、前述した如くの超基準振幅時間を用いた
から、請求項2または3に記載の本発明に比して演算量
をより少なくできるというメリッ1−かある。
[実施例] 第1図は本発明の実施に用いられる男女意識別装置の一
例を示すブロック図、第2図は本発明の特徴パラメータ
によって形成されるパラメータ空間を示す模式図である
第1図において、11はマイク、12は増幅器、13は
ローパスフィルタ、14はA/Dコンバータ、15はパ
ラメータ計算部、16は辞書データ記憶部、17は判定
部、18は結果出力部である。この実施例にあっては、
男女声を以下の如く検出する。
(1)男女の代表的な有声音[ア]について、それらの
信号の20m5間における参照軸交差数×1と、波形の
振幅分布に関する値×2とを特徴パラメータとする辞書
データを用意し、これを辞書データ記憶部16に記憶せ
しめる。
ここて、波形の振幅分布に関する値×2としては、下記
■、■、■のいずれかを用いることができる。
■下式て表わされる波高値P。
P = 20x log+o(Vp/vt、sslたた
し、vpコニ−時間間隔内の振幅の絶対値の最大値 vr□ ;同一定時間間隔内の振幅の 実効値 ■下式て表わされる波高値P。
p = 20 x log+o (Vp/v、またたし
、vPコニ−時間間隔内の振幅の絶対値の最大値 v6:同一定時間間隔内の振幅の 絶対値の平均値 ■振幅か一定時間間隔内に実効値を目安どするしきい値
を越える時間(超基檗振幅時間)。
上記■の波高値を用いる場合には、波形の先鋭度におい
て男女間て顕著な差を呈するパラメータ値を用いること
となり、男女声の識別性か向上するというメリットがあ
る。
ト記■の波高値を用いる場合には、上記■の波高値に比
して演算量を少なくでき、かつ波形の先鋭度において男
女間で顕著な差を呈するパラメータ値を用いることとな
り、男女声の識別性が向上するというメリットがある。
上記■の波高値を用いる場合には、上記■、■の波高値
に比して演算量をより少なくできるというメリットがあ
る。
(2)マイク11にて人力口F)を採取し、この人力信
号を、増幅器12て増幅し、ローパスフィルタ13を通
すことによっ°r4.2KIIz以上の成分はカットし
、A/Dコンバータ14によって標本化周波数10KI
Iz 、変換ビット数16bitのデジタル信号に変換
し、パラメータ計算部15に送り込む。
パラメータ計算部15は、上記人力信号のZ O+n 
S l!flにおける参照軸交差数×1と、波形の振幅
分布に関する値×2とを特徴パラメータとして算出する
(3)上記(2)て算出した特徴パラメータと、上記(
11て定めた辞書データか規定する標準パターンとを、
判定部17において比較し、人力信号が男声か女声かを
判定し、この判定結果を結果出力部18から出力する。
ここて、前述の辞書データを用いたパターン認。
識は、例えば第2図のパラメータ空間上て以下の如くな
される。
すなわち、第2図は零交差数(参照軸レベルを零レベル
に設定したもの)と波高値の2つの特徴パラメータをそ
れぞれXl軸と×2軸にとったものである。第2図にお
いて、μlx  I++ σ12はσ それぞれ男声の辞書パラメータの平均値、xtN成分の
標準偏差、×22成分の標準偏差を表わし、μ2、σ、
1、σ22はそれぞれ女声の辞書パラメータについての
同様の値を表わす。
破線Aはμとσで規定されるカテゴリー「男声」の概念
を表わし、破線Bは同カテゴリー「女声」の概念を表わ
す。
また、境界Cは特徴パラメータ空間をカテゴリー「ソ(
声」とカテゴリー「女声Jに2分する境界であり、男声
のMnデータの平均値μmを含む側がカテゴリー「男声
」となる。境界Cはカテゴリー「男声」とカテゴリー「
女声」に対する尤度か等しい点の集まりである。この実
施例の場合には、男声辞9データの標準偏差か、女声辞
書データの標準偏差より小さいのて、カテゴリー「男声
」が閉した空間になっている。計算部15に取り込まれ
た入力音声か□ら算出された特徴パラメータか特徴パラ
メータ空間上で上記の境界Cのμm側に属した時、入力
音声が男声であると判定する。
しかして、上記実施例にあっては、特徴パラメータとし
て参照軸交差数と波形の振幅分布に関する値の2つのパ
ラメータを用いたから、カテゴリー「男声」とカテゴリ
ー「女声」とをパラメータ空間において明瞭に分離でき
る。したがって、男声と女声とを高い識別率で簡易に識
別できる。
さらに、上記特徴パラメータは、特別なハードウェアを
用いることなく短い演算時間で算出でき、一般用途への
展開が容易である。
なお、上記実施例においては、特徴パラメータ空間上で
標準パターンを規定する境界線として2つのカテゴリー
に対する尤度か等しくなる点の集まりを用いたが、本発
明の実施においては、もちろん他の一般的なパターン認
識の手法を用いることがてきる0例えば、カテゴリー「
男声」とカテゴリー「女声」に対する尤度が等しくなる
点の集まりの代わりに、Maharanobis距離や
Euclid距離か等しくなる点の集まり等を用いるこ
とができる。
[発明の効果] 以]二のように本発明によれば、男女声を識別するに際
し、短い演算時間かつ特別のハードウェアを用いないa
!2な方法て、高い識別能力を達成することかてきる。
【図面の簡単な説明】
第1図は本発明の実施に用いられる男女声識別装:rt
の一例を示すブロック図、第2図は本発明の特徴パラメ
ータによって形成されるパラメータ空間を示す模式図で
ある。 11・・・マイク、 15・・・パラメータ計算部、 16・・・辞Mデータ記憶部、 17・・・↑−リ定部、 18・・・結果出力部。 第1図 第2図 特許出願人 積水化学工業株式会社 代表者  廣1)馨

Claims (4)

    【特許請求の範囲】
  1. (1)入力信号の参照軸交差数と波形の振幅分布に関す
    る値とを特徴パラメータとして算出し、この算出結果を
    、男女の有声音の辞書データと比較し、入力信号が男女
    いずれの発声によるものかを判定する男女声の識別方法
  2. (2)前記波形の振幅分布に関する値として一定時間間
    隔内の振幅の絶対値の最大値に対する該一定時間間隔内
    の振幅の実効値の比で表わされる波高値を用いる請求項
    1記載の男女声の識別方法。
  3. (3)前記波形の振幅分布に関する値として一定時間間
    隔内の振幅の絶対値の最大値に対する該一定時間間隔内
    の振幅の絶対値の平均値の比で表わされる波高値を用い
    る請求項1記載の男女声の識別方法。
  4. (4)前記波形の振幅分布に関する値として振幅が一定
    時間間隔内に実効値を目安とするしきい値を越える時間
    を用いる請求項1記載の男女声の識別方法
JP63251416A 1988-10-05 1988-10-05 男女声の識別方法 Expired - Lifetime JP2557497B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63251416A JP2557497B2 (ja) 1988-10-05 1988-10-05 男女声の識別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63251416A JP2557497B2 (ja) 1988-10-05 1988-10-05 男女声の識別方法

Publications (2)

Publication Number Publication Date
JPH0298000A true JPH0298000A (ja) 1990-04-10
JP2557497B2 JP2557497B2 (ja) 1996-11-27

Family

ID=17222521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63251416A Expired - Lifetime JP2557497B2 (ja) 1988-10-05 1988-10-05 男女声の識別方法

Country Status (1)

Country Link
JP (1) JP2557497B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058191A (ja) * 2001-08-10 2003-02-28 Dainippon Printing Co Ltd 周波数解析方法および音響信号の符号化方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5852696A (ja) * 1981-09-25 1983-03-28 大日本印刷株式会社 音声認識装置
JPS6127600A (ja) * 1984-07-17 1986-02-07 日本電気株式会社 音声識別回路
JPS6280960U (ja) * 1985-11-12 1987-05-23

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5852696A (ja) * 1981-09-25 1983-03-28 大日本印刷株式会社 音声認識装置
JPS6127600A (ja) * 1984-07-17 1986-02-07 日本電気株式会社 音声識別回路
JPS6280960U (ja) * 1985-11-12 1987-05-23

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058191A (ja) * 2001-08-10 2003-02-28 Dainippon Printing Co Ltd 周波数解析方法および音響信号の符号化方法

Also Published As

Publication number Publication date
JP2557497B2 (ja) 1996-11-27

Similar Documents

Publication Publication Date Title
JP6758890B2 (ja) 音声判別装置、音声判別方法、コンピュータプログラム
KR101008022B1 (ko) 유성음 및 무성음 검출방법 및 장치
GB2388947A (en) Method of voice authentication
JPS60200300A (ja) 音声の始端・終端検出装置
JPH0298000A (ja) 男女声の識別方法
JPS60114900A (ja) 有音・無音判定法
JPH04324499A (ja) 音声認識装置
JP2968976B2 (ja) 音声認識装置
JPH0285898A (ja) 音声検出方式
JPH0285897A (ja) 音声検出方式
JP2658104B2 (ja) 音声認識装置
JPH0316038B2 (ja)
JPS61260299A (ja) 音声認識装置
JPH0285896A (ja) 音声検出方式
JP2599974B2 (ja) 音声検出方式
JP2891259B2 (ja) 音声区間検出装置
JPS58190999A (ja) 音声認識装置
JPS6193499A (ja) 音声パタ−ン照合方式
JPS6335995B2 (ja)
JPS61273599A (ja) 音声認識装置
JPS59124392A (ja) 音声認識方式
JPS63235999A (ja) 音声始端検出装置
JPS59205680A (ja) 音声パターン比較方法
JPS6336679B2 (ja)
JPS6069694A (ja) 語頭子音のセグメンテ−ション法