JPH10207455A - 音信号分析装置及び方法 - Google Patents

音信号分析装置及び方法

Info

Publication number
JPH10207455A
JPH10207455A JP9336328A JP33632897A JPH10207455A JP H10207455 A JPH10207455 A JP H10207455A JP 9336328 A JP9336328 A JP 9336328A JP 33632897 A JP33632897 A JP 33632897A JP H10207455 A JPH10207455 A JP H10207455A
Authority
JP
Japan
Prior art keywords
section
sound signal
pitch
detecting
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9336328A
Other languages
English (en)
Other versions
JP3669129B2 (ja
Inventor
Tomoyuki Funaki
知之 船木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP33632897A priority Critical patent/JP3669129B2/ja
Publication of JPH10207455A publication Critical patent/JPH10207455A/ja
Application granted granted Critical
Publication of JP3669129B2 publication Critical patent/JP3669129B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【課題】 マイク等からの入力音のピッチ又はレベルが
微妙にゆれた場合でも、そのゆれた部分以外の音楽的な
音の定常部分すなわち1つの音符に相当する部分を分析
できるようにする。 【解決手段】 入力した音信号のサンプル振幅値の所定
サンプル数にわたる平均値をそれぞれ求め、時系列的な
平均レベル情報を得て、これから音楽的な音が存在する
と思われる有効区間を検出する。この有効区間内におけ
る平均レベル情報に基づいて安定区間を検出する。この
安定区間内の音信号に基づいて1つの音符に相当する定
常区間を検出する。時変動するフィルタ処理を音信号に
施した上で、周期基準となる候補位置の複数を検出し、
各候補位置で区切られる各区間毎の波形の一致度を演算
し、その一致度の高いもの同士を接続して同波形区間を
検出する。同波形区間をさらにレベルの安定性などを考
慮して細かく分割して定常区間すなわち1つの音符に相
当する区間を検出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、マイクロフォン
等によって入力した音声信号や楽音信号等、そのピッチ
またはノートが未確定の音信号に基づいて、音楽的な音
が存在する区間(有効区間)やその音楽的な音の定常部
分を分析し、そのノート(音階の音名)や音符長を自動
的に分析することができるようにした音信号分析装置及
び方法に関し、更に、そのためのプログラムを記憶した
記録媒体に関する。この発明に従う分析結果は、必要に
応じてMIDI情報等の形態の電子的楽譜情報として出
力することができるものであり、従って、この発明は人
間の音声等で入力した可聴的なメロディを自動的に楽譜
化することができる技術に関するものである。
【0002】
【従来の技術】最近、コンピュータ等を用いて、MID
I情報等の演奏情報を発生し、その演奏情報に基づいて
演奏音を再生するコンピュータ演奏システムが新たな楽
音演奏装置として注目されている。この種のコンピュー
タ演奏システムでは、演奏情報を発生するためのデータ
を入力する方式として、リアルタイム入力方式、ステッ
プ入力方式、数値入力方式、楽譜入力方式等がある。リ
アルタイム入力方式は、テープレコーダのように演奏者
が実際に演奏した鍵盤等の演奏操作子の操作情報をリア
ルタイムに演奏情報に変換する方式である。数値入力方
式は、音高(ピッチ)、音の長さ、音の強弱等の演奏情
報をコンピュータのキーボードから直接数値データとし
て入力する方式である。楽譜入力方式は、コンピュータ
のファンクションキーやマウス等を用いてディスプレイ
上の楽譜(5線譜)に単純化した音譜記号等を配置して
いく方式である。ステップ入力方式は、音譜をMIDI
鍵盤やソフトウェア鍵盤で入力し、音の長さをコンピュ
ータのファンクションキーやマウス等を用いて入力する
方式である。
【0003】上述の各入力方式のうち、リアルタイム入
力方式は、実際の演奏操作状態をそのまま演奏情報とし
て記憶することができるので、人間的な微妙な演奏上の
ニュアンスを表現し易く、また短時間入力が可能である
という利点を有する。しかし、この方式は演奏者自身に
高度の楽器演奏能力が必要であり、初心者等には不向き
な入力方式である。そこで、リアルタイム入力方式の利
点を生かし、初心者でも短時間で簡単に演奏情報を入力
できるようにした演奏情報発生装置として、人声音又は
自然楽器の楽音をマイクを介して直接入力し、その入力
音に応じて演奏情報を発生するものがある。すなわち、
これは、人声音やギター等の音(単音)をマイクから入
力するだけで、簡単にMIDI信号を発生することがで
き、MIDIキーボード等を使用しなくてもMIDI機
器を制御できる。
【0004】
【発明が解決しようとする課題】従来の演奏情報発生装
置では、マイクからの入力音のピッチ変化に対して、次
のような処理を行ってMIDI情報を発生している。す
なわち、第1の方法はピッチ変化を半音単位で検出し、
そのピッチのノート情報のみを発生する。第2の方法は
ピッチ変化を半音単位で検出し、そのピッチのノート情
報と、その間のピッチ変化に関するピッチベンド情報
(音高変化情報)とを発生する。第3の方法はノート検
出することなく、入力信号のピッチを上下1オクターブ
の範囲で変化し得るピッチベンド情報として発生する。
また、ノート情報(ノートオン又はノートオフ)を発生
するのに、入力音のレベルを所定の基準値と比較し、そ
の基準値よりも入力音のレベルが大きくなった時点でノ
ートオンを、小さくなった時点でノートオフを発生して
いる。しかしながら、上記第1及び第2の方法のように
ピッチ変化を半音単位で検出する場合において、入力音
のピッチが微妙にゆれると意図しないノート情報(ノー
トオン又はノートオフ)が多数発生するという問題があ
る。また、第3の方法のようにピッチ変化をピッチベン
ド情報で発生する場合は、ピッチ変化をピッチベンド情
報で忠実に追従させることができるが、採譜のような目
的には適さない。さらに、入力レベルに応じてノート情
報を発生すると、入力音のレベルのゆれに応じて意図し
ないノート情報が多数発生するという問題がある。
【0005】ところで、リアルタイム入力方式において
は、複数の音が任意の時間間隔で時系列的にマイクに入
力されるので、音の存在する部分に対して効率的な分析
を行うことが要求される。すなわち、マイク入力された
信号に対してピッチ等の分析を絶えず行うようにしてい
たのでは、実際には音が入力されていない時間において
も無駄な分析処理をすることになるので好ましくない。
そこで、マイク入力された信号から実際に音が存在して
いる区間(有効区間)を抽出し、抽出された有効区間に
ついてのみピッチ分析等の複雑な分析処理を施すように
するのが効率的である。そのための従来の有効区間の抽
出法は、単純に所定基準レベルと入力信号レベルを比較
して有効区間の抽出を行っていたので、入力音のレベル
が微妙に変動するような場合、特に基準レベル付近で変
動した場合には有効区間の抽出が不正確になると問題が
あった。
【0006】この発明は、マイク等からの入力音のピッ
チ又はレベルが微妙にゆれた場合でも、そのゆれた部分
以外の音楽的な音の定常部分すなわち1つの音符に相当
する部分を分析することのできる音信号分析装置及び方
法を提供することを目的とする。詳しくは、入力された
音信号からその定常部分を有効に分析し、これに基づき
音のピッチを正確に分析できるようにするものである。
しかして、この分析結果を必要に応じてMIDI情報等
の形態の電子的楽譜情報として出力することができるよ
うにし、人間の音声や実際の楽器演奏等で入力した可聴
的なメロディを自動的に楽譜化することを正確に行うこ
とができるようにした技術を提供しようとするものであ
る。
【0007】
【課題を解決するための手段】出願時の請求項1に記載
の本発明に係る音信号分析装置は、任意の音信号を入力
するための入力手段と、前記入力手段から入力された音
信号のサンプル振幅値の所定サンプル数にわたる平均値
をそれぞれ求め、その結果を時系列的な平均レベル情報
として出力する演算手段と、前記演算手段によって求め
られた平均レベル情報に基づいて前記音信号の中から音
楽的な音が存在すると思われる第1の区間を検出する第
1区間検出手段と、前記第1の区間内における前記音信
号のサンプル振幅値に基づいて音信号分析用の第2の区
間を、該第1の区間の中から検出する第2区間検出手段
とを具えたものである。入力手段から入力される音信号
の各サンプル振幅値の所定サンプル数にわたる平均値を
それぞれ求めているので、入力された音信号のレベル変
動に応答して滑らかに変化する平均レベル情報を得るこ
とができ、音楽的な音が存在すると思われる区間、いわ
ば有効な区間、を第1の区間として適切に検出すること
ができる。そして、かかる有効な第1の区間を対象にし
て、その中から更に第2の区間を検出するようにしてい
るので、音信号分析に適した区間を、該第2の区間とし
て適切に検出することができる。このような2段階の区
間分析によって音信号分析用の第2の区間を検出するよ
うにしたので、音信号分析に適した区間、例えばピッチ
検出に適した安定した区間、を適切に検出することがで
き、音分析、特にピッチ検出、の精度を向上させること
ができる。なお、このような第2の区間は、1つの第1
の区間内において1に限らず複数存在し得る。
【0008】上記請求項1に記載の音信号分析装置の一
実施態様として、前記第2区間検出手段は、前記平均レ
ベル情報の傾斜度数が所定値以下である区間を求め、求
められた区間の長さが所定長以上の部分をレベル安定区
間として判定し、このレベル安定区間に基づき前記第2
の区間を検出するものとしてよい。平均レベル情報の傾
斜度数が小さいほど音信号の振幅レベルの変動が少な
い、つまり安定していることを意味しており、また安定
しているというからには時間的にも或る程度以上の長さ
にわたっている必要がある。すなわち、平均レベル情報
の傾斜度数が所定値以下であっても、その区間長が短い
場合には安定した区間とは言えないので、それを除外す
る。よって、この傾斜度数が所定値以下である区間の時
間的長さが所定長以上である部分をレベル安定区間とし
て判定することが適切である。
【0009】出願時の請求項2に記載の本発明に係る音
信号分析装置は、任意の音信号を入力するための入力手
段と、前記入力手段から入力された音信号のサンプル振
幅値の所定サンプル数毎にその最大値を検出し、検出さ
れた最大値を補間することによって補助波形を作成する
波形作成手段と、前記波形作成手段によって作成された
補助波形に基づいて前記音信号の中から音楽的な音が存
在すると思われる第1の区間を検出する第1区間検出手
段と、前記第1の区間内における前記音信号のサンプル
振幅値に基づいて音信号分析用の第2の区間を、該第1
の区間の中から検出する第2区間検出手段とを具えたも
のである。この場合、前記と同様の第1及び第2の区間
を検出するために、波形作成手段で作成した補間波形を
使用することが特徴である。例えば、この補間波形は音
信号波形の各ピークレベル間を結ぶ振幅エンベロープ波
形に類似した波形として得られるもので、音信号の振幅
レベルの傾向を示している。このような補間波形の算出
は、平均レベル情報の演算よりも素早く行えるので、処
理速度を早くすることができ、各区間の検出速度を向上
することができ、音信号の分析時間を短縮し、かつその
ための演算装置の負担を軽減することができる。
【0010】上記請求項2に記載の音信号分析装置の一
実施態様として、前記第2区間検出手段は、前記音信号
のサンプル振幅値に対して両方向からエンベロープ検出
を行うことによって最大値を検出し、検出された最大値
を補間することによって最大値補間曲線を求め、求めら
れた最大値補間曲線に基づいて各サンプルポイントにお
ける合計傾斜を求め、求められた合計傾斜が所定値以下
の部分をレベル安定区間として判定し、このレベル安定
区間に基づき前記第2の区間を検出するようにしてもよ
い。このように、両方からエンベロープ検出を行うこと
によって、徐々にレベルの上がる波形において、倍音ピ
ークをピッチのピークとして誤って検出しないようにす
ることができる。
【0011】出願時の請求項3に記載の本発明に係る音
信号分析装置は、任意の音信号を入力するための入力手
段と、前記音信号に所定の周波数特性のフィルタ処理を
施すフィルタ手段と、前記フィルタ処理後の音信号にお
ける連続するサンプル振幅値に基づいて各隣接する波形
同士の一致度合いを分析する分析手段と、前記分析手段
により所定の条件に従う範囲内で一致していると分析さ
れた連続する複数の波形からなる区間を同波形区間とし
て検出する区間検出手段と、前記区間検出手段によって
検出された同波形区間における前記音信号のピッチを検
出するピッチ検出手段とを具えたものである。所定の周
波数特性のフィルタ処理によって入力音信号の波形を適
切にシェーピングすることにより、分析手段による波形
一致度の分析処理を容易にしかつ正確にすることができ
る。区間検出手段によって検出される同波形区間はほぼ
同波形とみなせる複数の波形が連続している区間であ
り、波形形状が安定している区間である。よって、この
ような同波形区間においては、入力音信号のピッチも安
定しており、ピッチ検出処理の対象区間とするのに適し
ているので、入力音信号の適切なピッチ検出を正確かつ
容易に行うことができる。また、このような同波形区間
に基づく入力音信号のピッチ検出/分析処理は、振幅レ
ベルの変動からは音符の区切りが見い出せないような入
力音信号、例えば、振幅レベルはあまり変化せずにピッ
チや波形が変化するスラー効果音など、から音符として
のかたまりを区別し、そのピッチ等を分析する場合にき
わめて有益である。
【0012】出願時の請求項4に記載の本発明に係る音
信号分析装置は、任意の音信号を入力するための入力手
段と、前記入力手段から入力する前記音信号に関して所
定区間毎に前記音信号のピッチをそれぞれ検出し、検出
したピッチのデータ列を生成する第1のピッチ検出手段
と、前記ピッチデータ列における各ピッチに対応する周
波数に応じて通過帯域が可変制御されるフィルタ処理
を、前記入力された音信号に施すフィルタ処理手段と、
前記フィルタ処理手段から出力される前記音信号のサン
プル振幅値に基づいて該音信号のより正確なピッチを検
出する第2のピッチ検出手段とを具えたものである。第
1のピッチ検出手段によるピッチ検出は、入力音信号の
おおまかなピッチに対応しているものであってよく、入
力音信号のラフな波形周期測定を行い、それに基づくピ
ッチデータ列を時系列的に得る。フィルタ処理手段で
は、このピッチデータ列における各ピッチに対応する周
波数に応じて通過帯域が可変制御される時変動フィルタ
処理を入力音信号に対して施す。これにより、入力音信
号の時々刻々のピッチに応じて該音信号のできるだけ基
本波波形成分が取り出されるようにできるだけ正弦波に
近い形に波形整形することができ、このフィルタ処理済
み音信号波形を対象とする第2のピッチ検出手段による
ピッチ検出処理が容易にかつ正確に行えるようになる。
【0013】出願時の請求項5に記載の本発明に係る音
信号分析装置は、任意の音信号を入力するための入力手
段と、前記入力手段から入力する前記音信号に関して所
定区間毎に前記音信号のピッチをそれぞれ検出し、検出
したピッチのデータ列を生成する第1のピッチ検出手段
と、前記ピッチデータ列における各ピッチに対応する周
波数に応じて通過帯域が可変制御されるフィルタ処理
を、前記入力された音信号に施すフィルタ処理手段と、
前記フィルタ処理後の音信号における連続するサンプル
振幅値に基づいて各隣接する波形同士の一致度合いを分
析する分析手段と、前記分析手段により所定の条件に従
う範囲内で一致していると分析された連続する複数の波
形からなる区間を同波形区間として検出する区間検出手
段と、前記区間検出手段によって検出された同波形区間
における前記音信号のピッチを検出する第2のピッチ検
出手段とを具えたものである。第1のピッチ検出手段と
フィルタ処理手段とによって、上記と同様に、入力音信
号のピッチ傾向に応じた時変動フィルタ処理を該音信号
に対して施し、これにより、該音信号のできるだけ基本
波波形成分が取り出されるようにできるだけ正弦波に近
い形に波形整形することができる。従って、このフィル
タ処理済み音信号波形を対象とする分析手段と区間検出
手段による同波形区間を検出する処理する処理が容易か
つ正確に行うことができ、この同波形区間を対象とする
第2のピッチ検出手段によるピッチ検出処理も容易にか
つ正確に行えるようになる。
【0014】出願時の請求項6に記載の本発明に係る音
信号分析装置は、任意の音信号を入力するための入力手
段と、前記入力手段から入力する前記音信号に関して所
定区間毎に前記音信号のピッチをそれぞれ検出し、検出
したピッチのデータ列を生成する第1のピッチ検出手段
と、前記ピッチデータ列における各ピッチに対応する周
波数に応じて通過帯域が時変動制御されるフィルタ処理
を、前記入力された音信号に施すフィルタ処理手段と、
前記フィルタ処理後の音信号における連続するサンプル
振幅値に基づいて各隣接する波形同士の一致度合いを分
析する分析手段と、前記分析手段により所定の条件に従
う範囲内で一致していると分析された連続する複数の波
形からなる第1の区間を検出する第1区間検出手段と、
前記第1区間検出手段によって検出された第1の区間内
の一致度のより高い波形を基準にその前後における複数
の各波形との間で一致度合い判定し、一致度のより高い
第2の区間を検出する第2区間検出手段と、前記第2区
間検出手段によって検出された第2の区間における前記
音信号のピッチを検出する第2のピッチ検出手段とを具
えたものである。第1のピッチ検出手段とフィルタ処理
手段とによって、上記と同様に、入力音信号のピッチ傾
向に応じた時変動フィルタ処理を該音信号に対して施
し、これにより、該音信号のできるだけ基本波波形成分
が取り出されるようにできるだけ正弦波に近い形に波形
整形することができる。従って、このフィルタ処理済み
音信号波形を対象とする分析手段と第1区間検出手段に
よる第1の区間、つまり波形一致度の比較的高い区間、
を検出する処理する処理が容易かつ正確に行うことがで
きる。また、第2区間検出手段では、第1区間検出手段
によって検出された第1の区間内の一致度のより高い波
形を基準にして、その前後における複数の各波形との間
で一致度合い判定し、一致度のより高い第2の区間を検
出し、第2のピッチ検出手段では、この第2の区間を対
象としてピッチ検出処理を行うので、より安定した区間
を第2の区間として抽出してその区間を対象にしてピッ
チ検出を行うことにより、ピッチ検出処理をより容易か
つ正確に行えるようになる。
【0015】上記請求項4乃至6のいずれかに記載の音
信号分析装置の一実施態様として、前記第1のピッチ検
出手段は、前記入力手段により入力された前記音信号に
関して周期基準となる仮候補位置の複数を検出する仮周
期基準検出手段と、検出された前記仮候補位置に基づい
て前記仮候補位置毎に前記音信号のピッチをそれぞれ検
出し、検出したピッチのデータ列を生成するピッチデー
タ列生成手段とを含んでおり、前記仮周期基準検出手段
は、前記音信号の振幅のプラス側又はマイナス側で強く
ピークの表れるいずれか一方側の波形に注目してピーク
位置の検出を行い、そのピーク位置を仮周期基準として
検出するものであってよい。このような仮候補位置毎の
ピッチ検出(仮周期測定)によって、入力音信号のラフ
な波形周期測定を行うことができ、それに基づくピッチ
データ列を時系列的に得ることを容易に行えるので、有
利である。また、入力音信号の振幅のプラス側又はマイ
ナス側で強くピークの表れるいずれか一方側の波形に注
目してピーク位置の検出を行い、そのピーク位置を仮周
期基準として検出するようにしたことにより、音信号の
振幅の正負レベルに片寄りがあるような場合でも、すな
わち、音信号の振れ方がその振幅のプラス側又はマイナ
ス側のいずれか一方に強く現れた場合でも、それに対応
して適切な仮周期検出を行うことができる。
【0016】上記請求項4乃至6のいずれかに記載の音
信号分析装置の一実施態様として、前記第1のピッチ検
出手段は、前記入力手段により入力された前記音信号に
関して周期基準となる仮候補位置の複数を検出する仮周
期基準検出手段と、検出された前記仮候補位置に基づい
て前記仮候補位置毎に前記音信号のピッチをそれぞれ検
出し、検出したピッチのデータ列を生成するピッチデー
タ列生成手段とを含んでおり、前記ピッチデータ列生成
手段は、前記仮候補位置毎に求められる前記音信号のピ
ッチデータを補間処理することによって、前記ピッチデ
ータ列を生成するようになっていてよい。この場合も、
このような仮候補位置毎のピッチ検出(仮周期測定)に
よって、入力音信号のラフな波形周期測定を行うことが
でき、それに基づくピッチデータ列を時系列的に得るこ
とを容易に行えるので、有利である。また、ピッチデー
タ列生成手段では、前記仮候補位置毎に求められる前記
音信号のピッチデータを補間処理することによってより
細かなピッチデータ列を生成するので、これに基づき、
仮候補位置と仮候補位置との間でより細かく時変動する
フィルタ処理を施すことができ、分析精度を向上させる
ことができる。
【0017】上記請求項5又は6に記載の音信号分析装
置の一実施態様として、前記分析手段は、前記フィルタ
処理後の音信号に関してその周期基準となる候補位置の
複数を検出する周期基準位置検出手段と、前記検出され
た複数の候補位置に対応して区切られる該音信号の複数
の区間について、各隣接する区間同士の波形の一致度合
いを判定する手段とを含んでおり、前記周期基準検出手
段は、前記音信号の振幅のプラス側又はマイナス側で強
くピークの表れるいずれか一方側の波形に注目してピー
ク位置の検出を行い、そのピーク位置を周期基準として
検出するようにしたものであってよい。これにより、分
析手段では、波形周期に対応する候補位置毎に区切られ
た区間同士で波形比較を行うことができるので、波形一
致度合いの判定処理を容易かつ正確に行うことができる
ものとなるので、有利である。また、音信号の振幅のプ
ラス側又はマイナス側で強くピークの表れるいずれか一
方側の波形に注目してピーク位置の検出を行い、そのピ
ーク位置を周期基準として検出するようにしたことによ
り、音信号の振幅の正負レベルに片寄りがあるような場
合でも、すなわち、音信号の振れ方がその振幅のプラス
側又はマイナス側のいずれか一方に強く現れた場合で
も、それに対応して適切な周期検出を行うことができ
る。
【0018】上記請求項5又は6に記載の音信号分析装
置の一実施態様として、前記分析手段は、前記フィルタ
処理後の音信号に関してその周期基準となる候補位置の
複数を検出する周期基準位置検出手段と、前記検出され
た複数の候補位置に対応して区切られる該音信号の複数
の区間について、各隣接する区間同士の波形の一致度合
いを判定する手段とを含んでおり、前記周期基準検出手
段は、前記フィルタ処理手段による時変動フィルタ処理
後の音信号波形の振幅のプラス側又はマイナス側で強く
ピークの表れるいずれか一方側の波形に注目し、前記時
変動フィルタ処理に用いられたカットオフ周波数に対応
する周期で前記音信号波形を区切り、その区切られた区
間内で最大となるピーク位置を周期基準として検出する
ようにしたものであってよい。この場合も、分析手段で
は、波形周期に対応する候補位置毎に区切られた区間同
士で波形比較を行うことができるので、波形一致度合い
の判定処理を容易かつ正確に行うことができるものとな
るので、有利である。また、前記フィルタ処理手段によ
る時変動フィルタ処理後の音信号波形の振幅のプラス側
又はマイナス側で強くピークの表れるいずれか一方側の
波形に注目し、前記時変動フィルタ処理に用いられたカ
ットオフ周波数の周期で前記音信号波形を区切り、その
区切られた区間内で最大となるピーク位置を周期基準と
して検出するようにしているので、区切り、その中でピ
ーク位置を検出しているので、短い周期で発生するよう
なピークを誤って検出するようなことがなくり、ピーク
位置の検出精度が向上し、結果的に音信号の分析精度が
向上する。
【0019】上記請求項4乃至6のいずれかに記載の音
信号分析装置の一実施態様として、前記入力手段から入
力した前記音信号の中から該信号の状態が安定している
区間を検出する安定区間検出手段を更に具え、前記第1
ピッチ検出手段では、前記安定区間検出手段によって検
出された安定区間における前記音信号に関してピッチの
検出を行うようにしてもよい。このように、入力音信号
から安定区間を検出し、この安定区間を対象として前記
第1ピッチ検出手段によるピッチ検出処理を行うことに
より、第1ピッチ検出手段によるピッチ検出処理を迅速
に行うことができ、全体として音信号の分析処理を高速
かつ正確に行うことができるようになる。
【0020】上記請求項6に記載の音信号分析装置の一
実施態様として、前記第2区間検出手段は、前記第1の
区間内において前記第1区間検出手段によって検出され
た一致度の最も高い波形を基準にその前後における複数
の各波形との間で順次比較誤差を演算し、その比較誤差
が所定値以下となる連続する複数波形からなる部分を音
色区間として検出し、前記第1の区間内の前記音色区間
以外の残りの部分の長さが所定長以上の場合には、その
残りの部分についても同様にして前記音色区間を検出
し、こうして検出された各音色区間以外の残りの前記第
1の区間の部分の長さが所定長以下になるまで、前記音
色区間の検出を行い、検出された1又は複数の音色区間
を前記第2の区間とするようにしてもよい。第1の区間
内に複数の音色区間が存在する場合、最初に検出された
音色区間以外の残りの第1の区間の長さが所定長以上で
ある場合には、その残りの第1の区間内に別の音色区間
が存在するものとして、音色区間の更なる検出を行い、
こうして検出したすべての音色区間を、波形形状の安定
した第2の区間として検出することにより、正確な検出
が行える。
【0021】出願時の請求項7に記載の本発明に係る音
信号分析装置は、任意の音信号を入力するための入力手
段と、所定のカットオフ周波数を最大周波数及び最小周
波数とするバンドパスフィルタ処理を前記入力手段から
入力する前記音信号に施す第1フィルタ処理手段と、前
記第1フィルタ処理手段から出力される前記音信号に対
して周期基準となる第1候補位置の複数を検出する第1
周期基準検出手段と前記第1周期基準検出手段によって
検出された前記第1候補位置に基づいて前記音信号の最
大周波数及び最小周波数を検出する周波数帯検出手段
と、この周波数帯検出手段によって検出された最大周波
数及び最小周波数をカットオフ周波数とするバンドフィ
ルタ処理を、前記入力手段から入力する前記音信号に施
す第2フィルタ処理手段と、前記第2フィルタ処理手段
から出力される前記音信号に対して周期基準となる候補
位置の複数を検出する第2周期基準検出手段と、前記第
2周期基準検出手段によって検出された前記候補位置毎
に前記音信号のピッチをそれぞれ検出するピッチ検出手
段とを具えたものである。これによれば、フィルタ処理
を2度行ってから周期候補位置を検出するので、正確な
ピッチ検出が行える。
【0022】出願時の請求項8に記載の本発明に係る音
信号分析装置は、任意の音信号を入力するための入力手
段と、前記音信号に所定の周波数帯域のフィルタ処理を
施すフィルタ手段と、前記フィルタ手段によるフィルタ
リング処理後の前記音信号のピーク位置をそれぞれ検出
するピーク位置検出手段と、このピーク位置検出手段に
よって検出された任意の2つのピーク位置間で前記音信
号の波形を区切ることにより得られる多様な区間のう
ち、前記フィルタの通過帯域による制限に見合った時間
長の区間について、隣合う2つの区間の対を可能な数だ
け選定し、選定された各対における2区間の波形の一致
度をそれぞれ判定し、その一致度の最も高い1つの対を
同波形区間として検出する区間検出手段と、前記区間検
出手段によって検出された同波形区間に基づいて音信号
分析用の定常区間を検出する定常区間検出手段とを具え
たものである。音信号における波形のピーク位置の出方
は多様であり、隣接するピーク位置の間隔が必ずしも波
形周期に対応しているとは限らない。従って、どのピー
ク位置の対が波形周期に対応しているのかを区間検出手
段によって適切に判定する必要がある。そのために、音
信号をフィルタに通すことにより、その通過帯域に対応
する周期よりも長い時間間隔のピーク位置の対は、波形
周期に対応しているピーク位置の対の候補から除外する
ことができる。そのような除外によって、区間検出手段
では、波形周期に対応しているピーク位置の対、つまり
同波形区間、を効率的に検出することができる。従っ
て、音信号分析処理の効率化に貢献する。
【0023】出願時の請求項9に記載の本発明に係る音
信号分析装置は、任意の音信号を入力するための入力手
段と、前記入力された音信号のピーク位置をそれぞれ検
出するピーク位置検出手段と、このピーク位置検出手段
によって検出された任意の2つのピーク位置間で前記音
信号の波形を区切ることにより得られる多様な区間のう
ち、隣合う任意の2つの区間の波形の一致度をそれぞれ
判定し、その一致度の高い区間同士を接続して第1の同
波形区間群を検出する第1区間検出手段と、前記第1の
同波形区間群の中の開始区間と最終区間を比較の対象区
間として、前記第1の同波形区間群の前後に隣接する区
間のそれぞれについて波形の一致度を算出し、算出され
た一致度に基づいて前記第1の同波形区間群をその前後
に拡張し、これを第2の同波形区間群として検出する第
2区間検出手段と、前記第2区間検出手段によって検出
された第2の同波形区間群に基づいて音信号分析用の定
常区間を検出する定常区間検出手段とを具えたものであ
る。この構成は、第1区間検出手段によって検出された
第1の同波形区間群を第2区間検出手段によってその前
後に拡張することにより、音信号分析用の定常区間を検
出するようにしたことを特徴としている。すなわち、一
致度を低く設定すると同波形区間が広くなりすぎて定常
区間の検出が困難となる。かといって、一致度を高く設
定すると同波形区間がまばらになってしまう。そこで、
第1区間検出手段の一致度を高めに設定しておいて、一
旦、第1の同波形区間群を検出し、そして、第2区間検
出手段でその第1の同波形区間群の前後に区間を拡張す
ることによって、同波形区間の検出を効率的に行えるよ
うにしたものである。
【0024】上記請求項9に記載の音信号分析装置の一
実施態様として、前記第2区間検出手段によって検出さ
れた第2の同波形区間群の中の隣接するもの同士の間に
いずれにも属さないすき間区間が存在する場合に、前側
の第2の同波形区間群の最終区間とそれに隣接する前記
すき間区間との一致度及び後側の第2の同波形区間群の
開始区間とそれに隣接する前記すき間区間との一致度を
それぞれ求めて、その一致度の高い方を前側又は後側の
第2の同波形区間群に組み込むようにしてもよい。第2
区間検出手段によって拡張された結果、第2の同波形区
間群の間にいずれにも属さない区間が存在する場合に
は、それをいずれか一方の同波形区間群に組み込むよう
にしている。なお、組み込み方法にはいろいろあり、前
側の第2の同波形区間群の最終区間及び後側の第2の同
波形区間群の開始区間を基準に順番に一致度を比較して
組み込んでもよいし、組み込まれた区間を最終区間又は
開始区間として同様の処理を行ってもよい。また、一致
度に限界値を設け、あまり一致度があまりにも低すぎる
場合にはその区間はどちらにも組み込まないようにして
もよい。
【0025】出願時の請求項12に記載の本発明に係る
音信号分析装置は、任意の音信号を入力するための入力
手段と、前記入力手段から入力する前記音信号に関して
所定区間毎に前記音信号のピッチをそれぞれ検出し、検
出したピッチのデータ列を生成するピッチ検出手段と、
前記ピッチデータ列における各ピッチに対応する周波数
に応じて通過帯域が時変動制御されるフィルタ処理を、
前記入力された音信号に施す第1フィルタ処理手段と、
前記第1フィルタ処理手段から出力される前記音信号に
関して周期基準となる候補位置の複数を検出する周期基
準位置検出手段と、前記ピッチデータ列における各ピッ
チに対応する周波数及びその所定整数倍の周波数に応じ
て通過帯域が時変動制御されるフィルタ処理を前記入力
された前記音信号に施す第2フィルタ処理手段と、検出
された前記候補位置に対応して前記第2フィルタ処理手
段から出力される前記音信号を区切ることにより得られ
る複数の区間の波形の一致度を判定し、一致度の高い区
間を同波形区間として検出する区間検出手段と、前記区
間検出手段によって検出された同波形区間に基づいて前
記音信号のピッチを分析するピッチ分析手段とを具えた
ものである。
【0026】ピッチ検出手段と第1フィルタ処理手段と
によって、入力音信号のピッチ傾向に応じた時変動フィ
ルタ処理を該音信号に対して施し、これにより、該音信
号のできるだけ基本波波形成分が取り出されるようにで
きるだけ正弦波に近い形に波形整形することができる。
従って、この第1フィルタ処理済み音信号波形を対象と
して、周期基準位置検出手段によって行われる、入力音
信号に関する周期基準となる候補位置の検出処理は、該
入力音信号の波形周期にできるだけ正確に対応して行わ
れることとなる。よって、区間検出手段における区間の
区切りが正確に行える。一方、第2フィルタ処理手段で
は、前記ピッチデータ列における各ピッチに対応する周
波数及びその所定整数倍の周波数に応じて通過帯域が時
変動制御されるフィルタ処理を、前記入力された前記音
信号に施すので、この第2フィルタ処理済みの音信号波
形は、基本波成分のみならず、適度な倍音成分をも含ん
でおり、入力音信号の時変動する波形形状の特徴を適度
に維持している(しかし複雑な成分はフィルタリングに
よって除去しているので、比較処理に適した比較的シン
プルな波形となっている)ものである。よって、区間検
出手段では、比較的正確な波形周期に対応する区間で区
切られたところの、比較的正確な波形形状を維持した、
しかし、比較処理に適した比較的シンプルに整形された
音信号波形を、各区間毎に比較し、その一致度を判定す
るので、波形一致度の判定処理がし易くしかも精度がよ
い、という優れた効果を奏する。すなわち、ピッチ分析
の対象とする区間(同波形区間)の検出をより高精度に
行えるようになり、音信号分析の精度が向上する。
【0027】出願時の請求項13に記載の本発明に係る
音信号分析装置は、任意の音信号の連続するサンプル振
幅値を提供する提供手段と、前記提供された連続するサ
ンプル振幅値に対して所定の特性の第1のフィルタ処理
を施す第1フィルタ処理手段と、前記第1のフィルタ処
理が施された前記連続するサンプル振幅値に基づいて第
2のフィルタ処理用の制御周波数データを作成する制御
データ作成手段と、前記作成された制御周波数データに
基づく特性の第2のフィルタ処理を、前記提供手段によ
って提供される前記連続するサンプル振幅値に対して施
す第2フィルタ処理手段と、前記第2のフィルタ処理が
施された前記連続するサンプル振幅値に基づいて前記音
信号のピッチを検出するピッチ検出手段とを具えたもの
である。このように、2段構成のフィルタ処理手段によ
って入力音信号を整形することにより、ピッチ検出を行
い易い状態とすることができ、分析の精度を向上させる
ことができる。
【0028】出願時の請求項10に記載の本発明に係る
音信号分析装置は、任意の音信号を入力するための入力
手段と、前記入力手段から入力する前記音信号に関して
所定区間毎に前記音信号のピッチをそれぞれ検出し、検
出したピッチのデータ列を生成するピッチ検出手段と、
前記ピッチデータ列における相前後するピッチ同士の差
分を、音程のセント値に基づく相対値にそれぞれ変換す
る相対値変換手段と、前記相対値変換手段によって得ら
れた相対値の動的平均を基にして、動的基準値を算出す
る動的基準算出手段と、前記相対値変換手段によって得
られた相対値と前記動的基準算出手段によって算出され
た動的基準値とを比較して、音信号分析用の定常区間を
検出する定常区間検出手段とを具えたものである。
【0029】ピッチデータ列における相前後するピッチ
同士の差分を、音程のセント値に基づく相対値にそれぞ
れ変換し、この相対値の動的平均に基づいて動的基準値
(動的ボーダ)を算出し、動的基準値と該相対値とを比
較して、定常区間を検出するようにしている。動的平均
とは、所定の平均開始時点から現時点までの前記各ピッ
チの相対値の累計平均であり、いわば現時点までのピッ
チの相対値の積分的平均値である。この動的平均が動的
基準値すなわち動的ボーダとして使用される。動的ボー
ダは、動的な(つまり時変動する)境界値若しくは基準
値のことである。このように、セント値に基づく相対値
の動的平均によって動的基準値(動的ボーダ)を作成す
ることにより、ピッチ安定区間検出のためのノーマライ
ズされた比較基準データ(つまり動的ボーダ)を得るこ
とができ、検出精度を向上させることができる。例えば
隣接するピッチの音程差つまり相対値が「0」であれ
ば、それらのピッチは同一ピッチであり、同じピッチの
音が連続していることがわかる。また、例えば、相対値
の「1」が半音の音程に対応するものと条件設定した場
合、例えば隣接するピッチの音程差つまり相対値が
「1」であれば、それらのピッチは半音相違しているの
で、完全に別の音であることがわかる。実際には、それ
ほど単純ではなく、同じ音が連続している場合であって
も、ピッチが適宜変動する。動的ボーダは、そのように
適宜時変動する音のピッチにおいて安定している部分を
検出するための判定基準値として用いられる。これによ
って、ピッチが安定な部分から急に不安定になった場合
には、その部分を定常区間の区切りだと検出することが
でき、一方、ピッチが不安定な部分でピッチが多少変動
した場合でも、その変動した箇所を定常区間の区切りで
はないと判断することができ、より人間の耳に近い感覚
で定常区間の検出を行うことができるようになる。
【0030】入力された音信号の前記第2の区間または
前記定常区間を、上述した様々な手法のいずれか1また
はそれらの複数の組合せを用いて、検出したら、それら
の検出した第2の区間または定常区間を対象にしてノー
ト分析処理を行う。すなわち、本発明に係る音信号分析
装置は、前記検出された音信号分析用の前記第2の区間
又は前記定常区間において、前記音信号のピッチを分析
し、該音信号のノートを決定するノート分析手段を更に
具えていてよい。
【0031】出願時の請求項14に記載の本発明に係る
音信号分析装置は、任意の音信号を入力するための入力
手段と、前記入力手段から入力する前記音信号に関して
所定区間毎に前記音信号のピッチをそれぞれ検出し、検
出したピッチのデータ列を生成するピッチ検出手段と、
前記ピッチデータ列における相前後するピッチ同士の差
分を、音程のセント値に基づく相対値にそれぞれ変換す
る相対値変換手段と、前記相対値変換手段によって得ら
れた相対値の動的平均を基にして、動的基準値を算出す
る動的基準算出手段と、前記相対値変換手段によって得
られた相対値と前記動的基準算出手段によって算出され
た動的基準値とを比較して、ピッチ分析用の定常区間を
検出する定常区間決定手段と、前記定常区間内における
前記相対値の静的平均に基づき、静的基準値を算出する
静的基準算出手段と、前記静的基準値と前記定常区間内
における前記相対値とを比較して、前記定常区間の代表
周波数を算出するための音高決定区間を検出する音高決
定区間検出手段と、前記検出された音高決定区間内にお
ける前記ピッチデータ列に基づいて前記定常区間の代表
周波数を算出する周波数算出手段とを具えたものであ
る。
【0032】静的平均は、1つの定常区間内における前
記相対値の全ての単純な相加平均値であり、その定常区
間に関して一定の値である。この静的平均が静的基準値
(静的ボーダ)として使用される。静的基準値(静的ボ
ーダ)は、その定常区間については時変動しない、静的
な境界値(つまり比較基準値)である。音高決定区間検
出手段では、例えば、前記相対値が静的ボーダ以下であ
れば、その相対値に関わるピッチが最も安定した区間に
属しているものと判定し、この最も安定した区間を音高
決定区間とする。このように、この発明では、定常区間
の代表周波数すなわちピッチを算出する場合に、定常区
間内の全ての波形に基づいて算出するのではなく、静的
ボーダに応じて定常区間の中で最も安定した区間すなわ
ち音高決定区間内におけるピッチデータに基づいてその
定常区間の代表周波数を算出するようにしている。これ
によって、その定常区間の代表周波数を高精度に算出す
ることができる。
【0033】上記動的基準値算出手段は、前記相対値の
動的平均に対して、所定値を乗算した値、または所定値
を加算した値、又は所定値を乗算しかつその積に所定値
を加算した値、のいずれかを、前記動的ボーダとして算
出するようにしたものであってよい。
【0034】上述した各手法によって検出された定常区
間が、全て有効な音符に相当しているとは限らず、その
中には、無効なものもあり得る。無効な定常区間を判定
するために、本発明によれば、所定の音符長(例えば許
容される最小音符長)に対応する時間間隔で分割された
グリッドを、有利に使用することができる。すなわち、
本発明の音信号分析装置は、前記決定された前記各定常
区間を、その時系列に従って、所定の音符長に対応する
時間間隔で分割されたグリッド上にそれぞれ配置し、各
定常区間の開始端部に最も近い1つのグリッド位置を各
定常区間に対してそれぞれ割り当て、その結果同じグリ
ッド位置に複数の定常区間が割り当てられた場合には最
も時間長の長い1つの定常区間を有効なものとして選択
する手段を更に具えていてよい。同様に、出願時の請求
項15に記載の本発明の音信号分析装置は、1又は複数
の音符の時系列的連なりからなる任意の音信号を入力す
るための入力手段と、前記入力された音信号の中から1
つ1つの音符に相当すると推量される区間をそれぞれ検
出する区間検出手段と、前記検出された区間を、その時
系列に従って、所定の音符長に対応する時間間隔で分割
されたグリッド上にそれぞれ配置し、各定常区間の開始
又は終了端部のうち所定の一方の端部に最も近い1つの
グリッド位置を各定常区間に対してそれぞれ割り当て、
その結果同じグリッド位置に複数の定常区間が割り当て
られた場合には最も時間長の長い1つの定常区間を有効
な音符として選択する手段とを具備したものである。
【0035】更に、本発明によれば、隣接する区間同士
の波形の一致度を演算し、この一致度が所定値よりも大
きい部分を有声区間として検出し、検出された有声区間
内の一致度の高い区間の波形を基準にして、その両側の
区間の波形との間で順次一致度を演算し、その一致度に
基づいて定常区間を検出し、この定常区間について音信
号のピッチ等を分析/検出するようにしてもよい。有声
区間内で一致度の高い区間は音声の母音の基準となるの
で、それを基準に求められた一致度によって母音の変化
を検出できる。このように検出された定常区間を母音、
すなわち1つの音符として認識するとよい。すでに説明
した本発明の各構成において、波形の一致度の高い区
間、すなわち、同波形区間として判定された区間は、母
音区間つまり、1つの音符のかたまりとして認識し、分
析処理すことができる。
【0036】更に、本発明においては、上述した各構成
すなわち発明は、音声分析装置の装置発明として構成す
ることができるのみならず、音声分析方法の方法発明と
して構成することができる。また、本発明の実施は、コ
ンピュータプログラムの形態で実施することができ、そ
のようなコンピュータプログラムを記憶した記録媒体の
形態で本発明を実施することもできるし、それも本出願
における本発明の範囲に含まれる。
【0037】
【発明の実施の形態】以下、この発明の実施の形態を添
付図面に従って詳細に説明する。図2はこの発明に係る
楽音情報分析装置及び演奏情報発生装置を内蔵した電子
楽器の構成を示すハードブロック図である。電子楽器
は、マイクロプロセッサユニット(CPU)1、プログ
ラムメモリ2及びワーキングメモリ3からなるマイクロ
コンピュータによって制御される。CPU1は、この電
子楽器全体の動作を制御するものである。このCPU1
に対して、データ及びアドレスバス1Eを介してプログ
ラムメモリ2、ワーキングメモリ3、演奏データメモリ
4、押鍵検出回路5、マイクインターフェイス6、スイ
ッチ検出回路7、表示回路8及び音源回路9がそれぞれ
接続されている。
【0038】プログラムメモリ2はCPU1の各種プロ
グラム(システムプログラムや動作プログラムなど)、
各種データ等を格納するものであり、リードオンリーメ
モリ(ROM)で構成されている。ワーキングメモリ3
は、演奏情報やCPU1がプログラムを実行する際に発
生する各種データを一時的に記憶するものであり、ラン
ダムアクセスメモリ(RAM)の所定のアドレス領域が
それぞれ割り当てられ、レジスタ、フラグ、バッファ、
テーブル等などとして利用される。演奏データメモリ4
は、マイク等からの入力音に基づいて発生された演奏情
報(MIDIデータ)などを記憶するものである。ま
た、CPU1には、ハードディスク装置1Hなどを接続
して、そこに自動演奏データやコード進行データ等の各
種データを記憶していてもよく、更に、前記動作プログ
ラムを記憶するようにしてもよい。また、前記ROM2
に動作プログラムを記憶せずに、ハードディスク装置1
Hにこれらの動作プログラムを記憶させておき、それを
RAM3に読み込むことにより、ROM2に動作プログ
ラムを記憶したときと同様の動作をCPU1に行わせる
ことができる。このようにすると、動作プログラムの追
加やバージョンアップ等が容易に行える。また、着脱自
在な外部記憶媒体1G、例えばCD−ROM等、を設け
てもよい。この外部記憶媒体1G例えばCD−ROMに
は、各種データ及び任意の動作プログラムを記憶してい
てもよい。このCD−ROMに記憶されている動作プロ
グラムや各種データは、CD−ROMドライブ(図示せ
ず)によって、読み出され、ハードディスク装置1Hに
転送記憶させることができる。これにより、動作プログ
ラムの新規のインストールやバージョンアップを容易に
行うことができる。
【0039】なお、通信インターフェイス1Fをデータ
及びアドレスバス1Eに接続し、この通信インターフェ
イス1Fを介してLAN(ローカルエリアネットワー
ク)やインターネットなどの種々の通信ネットワーク上
に接続可能とし、他のサーバコンピュータとの間でデー
タのやりとりを行うようにしてもよい。これにより、ハ
ードディスク装置1H内に動作プログラムや各種データ
が記憶されていないような場合には、サーバコンピュー
タからその動作プログラムや各種データをダウンロード
することができる。この場合、クライアントとなる楽音
生成装置である電子楽器から、通信インターフェイス及
び通信ネットワークを介してサーバコンピュータに動作
プログラムや各種データのダウンロードを要求するコマ
ンドを送信する。サーバコンピュータは、このコマンド
に応じて、所定の動作プログラムやデータを、通信ネッ
トワークを介して電子楽器1に送信する。電子楽器で
は、通信インターフェイスを介してこれらの動作プログ
ラムやデータを受信して、ハードディスク装置にこれら
を蓄積する。これによって、動作プログラム及び各種デ
ータのダウンロードが完了する。
【0040】鍵盤10は、発音すべき楽音の音高を選択
するための複数の鍵を備えており、各鍵に対応してキー
スイッチを有しており、また必要に応じて押鍵速度検出
装置や押圧力検出装置等のタッチ検出手段を有してい
る。押鍵検出回路5は、発生すべき楽音の音高を指定す
る鍵盤10のそれぞれの鍵に対応して設けられた複数の
キースイッチからなる回路を含んで構成されており、新
たな鍵が押圧されたときはキーオンイベントを出力し、
鍵が新たに離鍵されたときはキーオフイベントを出力す
る。また、鍵押し下げ時の押鍵操作速度又は押圧力等を
判別してタッチデータを生成する処理を行い、生成した
タッチデータをベロシティデータとして出力する。この
ようにキーオン、キーオフイベント及びベロシティなど
のデータはMIDI規格に準拠したデータ(以下「MI
DIデータ」とする)で表現されておりキーコードと割
当てチャンネルを示すデータも含んでいる。マイクロフ
ォン1Aは、音声信号や楽器音を電圧信号に変換して、
マイクインターフェイス6に出力する。マイクインター
フェイス6は、マイクロフォン1Aからのアナログの電
圧信号をディジタル信号に変換してデータ及びアドレス
バス1Eを介してCPU1に出力する。
【0041】テンキー&各種スイッチ1Bは、数値デー
タ入力用のテンキーや文字データ入力用のキーボード、
音符化処理(音信号分析処理及び演奏情報発生処理)の
スタート/ストップスイッチなどの各種の操作子を含ん
で構成される。なお、この他にも音高、音色、効果等を
選択・設定・制御するための各種操作子を含むが、その
詳細については公知なので説明を省略する。スイッチ検
出回路7は、テンキー&各種スイッチ1Bの各操作子の
操作状態を検出し、その操作状態に応じたスイッチ情報
をデータ及びアドレスバス1Eを介してCPU1に出力
する。表示回路8はCPU1の制御状態、設定データの
内容等の各種の情報をディスプレイ1Cに表示するもの
である。ディスプレイ1Cは液晶表示パネル(LCD)
やCRT等から構成され、表示回路8によってその表示
動作を制御されるようになっている。このテンキー&各
種スイッチ1B、並びにディスプレイ1CによってGU
I(Graphical User Interfac
e)が構成される。
【0042】音源回路9は、複数チャンネルで楽音信号
の同時発生が可能であり、データ及びアドレスバス1E
を経由して与えられた楽音トラック上のMIDIデータ
を入力し、このデータに基づいた楽音信号を生成し、そ
れをサウンドシステム1Dに出力する。音源回路9にお
いて複数チャンネルで楽音信号を同時に発音させる構成
としては、1つの回路を時分割で使用することによって
複数の発音チャンネルを形成するようなものや、1つの
発音チャンネルが1つの回路で構成されるような形式の
ものであってもよい。また、音源回路9における楽音信
号発生方式はいかなるものを用いてもよい。例えば、発
生すべき楽音の音高に対応して変化するアドレスデータ
に応じて波形メモリに記憶した楽音波形サンプル値デー
タを順次読み出すメモリ読み出し方式(波形メモリ方
式)、又は上記アドレスデータを位相角パラメータデー
タとして所定の周波数変調演算を実行して楽音波形サン
プル値データを求めるFM方式、あるいは上記アドレス
データを位相角パラメータデータとして所定の振幅変調
演算を実行して楽音波形サンプル値データを求めるAM
方式等の公知の方式を適宜採用してもよい。また、これ
らの方式以外にも、自然楽器の発音原理を模したアルゴ
リズムにより楽音波形を合成する物理モデル方式、基本
波に複数の高調波を加算することで楽音波形を合成する
高調波合成方式、特定のスペクトル分布を有するフォル
マント波形を用いて楽音波形を合成するフォルマント合
成方式、VCO、VCF及びVCAを用いたアナログシ
ンセサイザ方式等を採用してもよい。また、専用のハー
ドウェアを用いて音源回路を構成するものに限らず、D
SPとマイクロプログラムを用いて音源回路を構成する
ようにしてもよいし、CPUとソフトウェアのプログラ
ムで音源回路を構成するようにしてもよい。音源回路9
から発生された楽音信号は、アンプ及びスピーカからな
るサウンドシステム1Dを介して発音される。
【0043】次に、この発明に係る電子楽器が音信号分
析装置及び演奏情報発生装置として動作する場合の一例
を説明する。図1は図2の電子楽器が演奏情報発生装置
として動作する際のメインフローを示す図である。メイ
ンフローは次のようなステップで順番に実行される。 ステップ11:まず、初期設定処理を行い、図2のワー
キングメモリ3内の各レジスタ及びフラグなどに初期値
を設定したりする。このとき、テンキー&各種スイッチ
1B上の音符化処理スタートスイッチがオン操作された
場合に、ステップ12〜ステップ18までの一連の処理
を行う。
【0044】ステップ12:このステップは音符化処理
スタートスイッチのオン操作有りと判定された場合に行
われるものであり、ここでは、そのオン操作に対応し
て、マイクインターフェイス6を介してマイクロフォン
1Aから入力される音声信号や楽器音の電圧波形を所定
周期(例えば44.1kHz)でサンプリング処理し、
それをディジタルサンプル信号としてワーキングメモリ
3内の所定領域に記憶する。このサンプリング処理は従
来の公知の方法で行うので、ここでは詳細は省略する。
ステップ13からステップ16までが音符化処理スター
トスイッチのオン操作に対応した音符化処理である。こ
の音符化処理ではサンプリングされた音声信号や楽器音
のディジタルサンプル信号を種々分析してそれを音高列
すなわち楽譜表示可能なMIDIデータに変換する。 ステップ13:ステップ12の音声サンプリング処理の
結果得られたディジタルサンプル信号に基づいて音楽的
な音が存在する区間すなわち有効区間がどこにあるのか
を検出するための有効区間検出処理を行う。この有効区
間検出処理の詳細については後述する。 ステップ14:ステップ13の有効区間検出処理の結
果、検出された各有効区間をさらにレベルの安定してい
る安定区間に細分化するための安定区間検出処理を行
う。この安定区間検出処理の詳細についは後述する。 ステップ15:ステップ14の安定区間検出処理の結
果、検出された各安定区間内に存在する音楽的な音の定
常部分(1つの音符に相当する部分)を検出する定常区
間検出処理を行う。この定常区間検出処理の詳細につい
は後述する。 ステップ16:ステップ13〜ステップ15の処理の結
果、得られた各定常区間毎に最も最適な音符を割り当て
る音高列決定処理を行う。すなわち、このステップでは
MIDIデータを発生する。この音高列決定処理の詳細
については後述する。 ステップ17:ステップ16の処理によって発生された
MIDIデータに基づいて楽譜を作成する楽譜作成処理
を行う。この楽譜作成処理は従来の技術によって容易に
実現可能なので詳細は省略する。 ステップ18:ステップ16の処理によって発生された
MIDIデータに基づいた自動演奏処理を行う。この自
動演奏処理についても従来の技術によって容易に実現可
能なので詳細は省略する。
【0045】図3は図1のステップ13の有効区間検出
処理の詳細を示す図である。以下、ステップ12によっ
て求められたディジタルサンプル信号からどのようにし
て有効区間が検出されるのか、この有効区間検出処理の
動作を図7及び図8を用いて説明する。 ステップ31:ステップ12によって求められたディジ
タルサンプル信号に基づいて平均音圧レベルを算出す
る。図7は、サンプリング周波数44.1kHzでサン
プリングされた音声信号すなわちディジタルサンプル信
号の波形値の一例を示す図である。図7では、約20ポ
イント分の波形値が示されている。ステップ31では、
所定のサンプル数(例えば、10msec相当の時間に
対応するサンプル数)にわたるサンプル振幅値の平均を
求め、それを平均音圧レベルとする。従って、サンプリ
ング周期44.1kHzの場合においては、この所定サ
ンプル数は『441個』であり、あるサンプルポイント
の平均値は、そのポイントを最終ポイントとする10m
sec分前の各ポイントの合計値、すなわち最終ポイン
トから441ポイント分前の波形値の合計を441で除
した値となる。なお、0ポイントから440ポイントま
では、441ポイント分の波形値が存在しないので、0
ポイントからその該当ポイントまでの波形値の平均をそ
のポイントの平均値とする。こうして、時系列的な平均
音圧レベル情報が各サンプルタイミング毎に得られる。
【0046】図7では、説明の便宜上15ポイント分の
波形値の平均値を平均音圧レベルとして算出する場合を
図示している。従って、最初の15ポイントまではそれ
までの波形値の合計値をそのポイント数で除する形にな
っている。また、波形値の合計は、その絶対値を合計す
ることによって求める。図8(A)はこのようにして求
められた平均音圧レベルの値を、サンプリングポイント
を横軸とした場合をグラフ化して示したものである。以
下、図8(A)の平均音圧レベルによって形成される曲
線を平均音圧レベルカーブと称する。なお、図7のよう
に15ポイント毎に平均音圧レベルを求める場合には、
カットオフ周波数10Hz程度のローパスフィルタを掛
けて、レベル変動を滑らかにしている。従って、実際に
441ポイント分の波形値の平均を取る場合には、カッ
トオフ周波数80〜100Hz程度のローパスフィルタ
を掛けて、そのレベル変動を滑らかにするのが望まし
い。また、ここでは、あるサンプリングポイントの平均
値を求めるのに、そのポイントより前の所定数のポイン
トの波形値を合計して平均音圧レベルを求める場合につ
いて説明したが、あるサンプリングポイントを中心とし
て前後に所定数のポイントの波形値を合計してもよい
し、サンプリングポイントから後に所定数のポイントの
波形値を合計してもよい。
【0047】ステップ32:前記ステップ31で求めら
れた図8(A)のような平均音圧レベルカーブを、所定
のしきい値に基づいて有効区間又は無効区間にそれぞれ
分類する。この処理では、しきい値として、その平均音
圧レベルカーブの中の最大波形値の20パーセントの値
をしきい値とする。これ以外の値をしいき値としてもよ
いことは言うまでもない。例えば、平均音圧レベルカー
ブの平均値をしきい値としたり、又はその平均値の80
パーセントをしきい値としたり、平均音圧レベルカーブ
の最大値の半分の値をしきい値としたりしてもよい。し
きい値は図8(B)のような点線で示される。従って、
この点線(しきい値)と平均音圧レベルカーブとの交点
位置が有効区間及び無効区間の境界となり、この点線
(しきい値)よりも大きい区間が有効区間となり、小さ
い区間が無効区間となる。図8(B)では、有効区間を
○印で示し、無効区間を×印で示す。
【0048】ステップ33:人間が音高を認知できる必
要な最低長を0.05msecとした場合に、前記ステ
ップ32で決定された無効区間の中からこの最低長より
も小さな無効区間を有効区間に変更する。例えば、サン
プリング周期が44.1kHzの場合にはサンプリング
数で2205個以下の無効区間を有効区間に変更する。
図8(B)においては、左側から第3番目及び第5番目
の無効区間がこの短い無効区間に相当する。従って、ス
テップ33の処理の結果、図8(B)は図8(C)のよ
うになり、有効区間が拡張される。なお、この処理にお
いて、全区間内の始まりと終わりの部分に存在する無効
区間は、短い無効区間に相当するが、短いからといって
有効区間に変更しない特別な領域として△印を用いて表
現している。
【0049】ステップ34:前記ステップ33の処理の
結果、得られた有効区間及び無効区間のパターンの中か
ら0.05msec以下の短い有効区間を無効区間に変
更する処理を行う。この処理は前記ステップ33と同様
の処理にて行う。図8(C)においては、右端の有効区
間がこの短い有効区間に該当する。従って、ステップ3
4の処理の結果、図8(C)は図8(D)のようにな
る。図8(D)から明らかなように、有効区間は第1区
間から第4区間までの全部の4つの区間となる。なお、
区間の終わりの部分の△印は第4の有効区間とみなされ
る。 ステップ35:ステップ34で特定された有効区間の平
均音圧レベルカーブの平均値を求め、それが所定値より
も小さい場合にその部分を無効区間とする最終的な有効
区間のチェックを行う。この平均値はその有効区間に存
在する各ポイントの平均音圧レベル値の合計をその有効
区間長で除することによって得られる。このようにして
得られた平均音圧レベルの平均値が図8(D)の各区間
の下側に示してある。第1区間は60、第2区間は2
5、第3区間は45、第4区間は15である。この平均
音圧レベルの平均値がその区間の最大波形値の30パー
セントを下回った場合は、その区間を無効区間とする。
ここでは、第2区間及び第4区間が該当するので、それ
ぞれの区間が無効区間になる。図8(E)はこのステッ
プ35の有効区間チェック処理によって特定された有効
区間と無効区間を示す図である。
【0050】ステップ36:ステップ31〜ステップ3
5までの処理によって特定された有効区間を拡張する処
理を行う。例えば、図8(F)に示すように最大波形値
の15パーセントを拡張許可レベルとして、そこの部分
に線を引き、有効区間を特定する境界線をその拡張許可
レベルの線のところまで拡張する。すなわち、各有効区
間の端から外側に向かって平均音圧レベルカーブの上昇
下降をチェックしながら、そのカーブが拡張許可レベル
を下回ったかどうかのチェックを行いながら拡張処理を
行う。このとき、下降が上昇に反転した場合や拡張許可
レベルを下回った場合には、そこまでを有効区間とす
る。また、図8(G)は、この有効区間拡張処理の別の
例を示す図である。拡張許可レベルを最大波形値の5パ
ーセントとし、平均音圧レベルカーブの下降が終了した
位置を有効区間の末端とする。又は、上昇が始まった位
置を末端としてもいい。この拡張処理によれば、図8
(F)の場合よりも第1区間及び第3区間の拡張幅が大
きくなる。このようにして、人間が音高として認知する
ことの可能な有効区間が最終的に決定することになる。
なお、拡張許可レベルが低く、かつ、有効区間が近い距
離にある場合には、ある有効区間の末尾側の拡張位置と
次の有効区間の先頭側の拡張位置とが接近することもあ
れば、また同じ位置になることもある。また、下降が終
わる部分と上昇が始まる部分のいずれを区切りにするか
によっても境界位置が変わる。この拡張処理の結果、有
効区間同士が重複した場合には、両方の中間位置を境界
位置とすればよい。なお、図8(F)及び(G)では、
有効区間の拡張を前後に行う場合について説明したが、
前方向又は後方向のみにしてもよい。また、前後に拡張
する場合に、前方向と後方向とで拡張許可レベルを異な
らせるようにしてもよい。
【0051】図4は図1のステップ14の安定区間検出
処理の詳細を示す図である。以下、ステップ13によっ
て求められた有効区間内の平均音圧レベルカーブに対し
て、レベルの安定した領域を検出するための安定区間検
出処理を行う。この安定区間検出処理の動作を図9を用
いて説明する。図9は、図8のA点からB点までの第1
の有効区間について、安定区間を検出する場合について
示してある。 ステップ41:図3で検出された有効区間内の平均音圧
レベルカーブに基づいて、その傾斜度数を算出する。こ
の処理では、図9(B)に示すように、傾斜を算出する
ための算出幅を例えば100ポイントとし、その算出幅
のシフト量を例えば50ポイントとして、A点からB点
に向かって順次シフトしながら、その傾斜度数を算出す
る。A点がサンプルポイント『000』だとすると、サ
ンプルポイント『000』と『100』との間の傾斜を
求め、次にそれをそれぞれ50ポイントずつシフトした
サンプルポイント『050』と『150』との間の傾斜
度数を求める。例えば、サンプルポイント『000』の
平均音圧レベルが『325』で、サンプルポイント『1
00』の平均音圧レベルが『1576』である場合、そ
の傾斜度数は(1576−325)/100=12.5
1となる。以後、サンプルポイント『100』と『20
0』との間、『150』と『250』との間、『20
0』と『300』との間のように、順番にその傾斜度数
を算出する。算出された傾斜度数の一例を図9(B)に
示す。図から明らかなように、サンプルポイント『00
0』,『100』間の傾斜度数は12.51、サンプル
ポイント『050』,『150』間の傾斜度数は32.
42、サンプルポイント『100』,『200』間の傾
斜度数は20.12、サンプルポイント『150』,
『250』間の傾斜度数は11.84、サンプルポイン
ト『200』,『300』間の傾斜度数は5.24、サ
ンプルポイント『250』,『350』間の傾斜度数は
4.82、サンプルポイント『300』,『400』間
の傾斜度数は2.34、サンプルポイント『350』,
『450』間の傾斜度数は3.89、サンプルポイント
『400』,『500』間の傾斜度数は5.36とな
る。これらの傾斜度数は前者のサンプルポイントにおけ
る傾斜度数として記憶されることになる。すなわち、サ
ンプルポイント『000』の傾斜度数は12.51、サ
ンプルポイント『050』の傾斜度数は32.42とし
て、それぞれのサンプルポイント毎に傾斜度数が記憶さ
れる。このようにしてA点からB点までの全区間におけ
る傾斜度数を算出し、次のステップ42の安定区間抽出
処理を行う。
【0052】ステップ42:前記ステップ41で算出さ
れた傾斜度数に基づいて今度は安定区間の抽出を行う。
すなわち、各サンプルポイントにおける傾斜度数の中か
ら所定値(例えば10)以下のものを安定部分とみな
し、この安定部分とみなされたサンプルポイントの数が
所定数以上すなわち所定時間だけ継続している場合にそ
の連続した安定部分を安定区間とする。この所定時間
は、テンポも考慮に入れて、例えば、約2000サンプ
ルポイント程度とする。図9(A)のような平均音圧レ
ベルカーブの場合は、図9(C)のようなa,b,cの
3ヵ所が安定区間として探索されることになる。 ステップ43:前記ステップ42によって抽出された安
定区間の存在に基づいて人間は初めてその安定区間の開
始点付近に音符のトリガである音の開始点があることに
気付く。ここでは、その音符の開始点付近を決定するた
めに、前記ステップ42で抽出された安定区間を拡張す
る。この安定区間を拡張する場合、すなわち音符の開始
点を決定する場合、最初の安定区間aについては、必然
的にA点がその安定区間aの音符の開始点となり、最後
の安定区間cについては、必然的にB点がその安定区間
cの音符の終了点となる。ところが、安定区間aの音符
終了点、安定区間bの音符開始点は容易に求めることが
できない。そこで、安定区間の終了点から次の安定区間
の開始点までの間における傾斜度数の最も大きいサンプ
ルポイントをその安定区間の音符終了点及び次の安定区
間の音符開始点とすることにした。各安定区間aの音符
終了点及び安定区間bの音符開始点は図9(D)のよう
にC点となり、安定区間bの音符終了点及び安定区間c
の音符開始点はD点となる。なお、上述の説明では、傾
斜度数の最も大きいサンプルポイントを安定区間の音符
開始点及び次の安定区間の音符終了点とする場合につい
て説明したが、これに限らず、安定区間の終了点から次
の安定区間の開始点までの間で安定度数が所定の値(し
きい値)を最初に越えた場合のサンプルポイントを音符
終了点(音符開始点)としてもよいし、安定区間の開始
点の直前で所定の値(しいき値)を下回った場合のサン
プルポイントを音符終了点(音符開始点)としてもよい
し、以上の3つの方法で求められたサンプルポイントを
複合的に計算して新たに音符終了点(音符開始点)を求
めるようにしてもよい。このようにして求められた区間
AC,CD,DBがそれぞれのレベルに対応した安定区
間になる。すなわち、図9の場合、安定区間aのレベル
に対応した安定区間はACとなり、安定区間bのレベル
の対応した安定区間はCDとなり、安定区間cのレベル
に対応した安定区間はDBとなる。
【0053】図5は図1のステップ15の定常区間検出
処理の詳細を示す図である。ステップ14によって求め
られた安定区間の中から定常区間がどのようにして検出
されるのか、その定常区間検出処理の詳細を図10から
図17までの図面を用いて説明する。音声や楽音などの
音楽的なオーディオ信号を分析する場合、定常部がどこ
にあるかを知ることは重要なことである。リズム系以外
の音色では、定常部の周期性によって音高が決定され、
定常部を骨格として音価が決定されるからである。この
実施の形態では、定常部は、楽譜として表した時に一つ
の音符に相当する区間のことであり、音色、音高、ベロ
シティという音の3大要素の変化に注目し、人間が一つ
の音として認識する区間を時間軸上で検出しようとする
ことをいう。以下、図5のステップに従って、この定常
区間検出処理について説明する。
【0054】定常区間を検出するためには、まず音信号
波形の周期の基準位置を検出することが必要である。こ
の基準位置の検出方法には大きく分けて、0クロス位置
検出法とピーク位置検出法のいずれか一方を用いるのが
一般的である。0クロス位置検出法によって周期の基準
位置を検出するためには、フィルタ等で倍音をできるだ
け取り除かないと検出は困難であり、それに帯域分割も
必要である。ピーク位置検出法の場合も倍音をできるだ
け取り除くことが望ましいが、0クロス位置検出ほどは
シビアでないため、音声や楽器の発音可能周波数帯をカ
ットオフ周波数としてバンドパスフィルタを掛けるだけ
でよく、帯域分割などの処理を特に行う必要はない。従
って、ピーク位置検出法の方が手順が簡単で、そこそこ
の結果が得られる方法であり、望ましい。従って、この
実施の形態では、ピーク位置検出法のよって周期の基準
位置を検出する場合について説明する。
【0055】ステップ51:第1次バンドパスフィルタ
(第1次BPF)を通過させて、所定の倍音を削除す
る。これは、発音可能な帯域をカットオフ周波数とし
て、バンドパスフィルタを掛けることである。音声の場
合、人間の発音可能な帯域は80〜1000Hz程度で
あり、ユーザを限定せずに、オールマイティに分析する
にはこれくらいが必要である。但し、ユーザが限定され
ている場合には、発音可能な帯域をある程度絞ることに
よって、倍音による間違いを減少させて、検出精度を向
上させることができる。ギターなら、80〜700Hz
程度であるが、これも予め音高枠を決めておくと精度が
上がる。楽器ごとの違いなども予め設定しておくと精度
が向上する。図10(A)は、第1次BPF処理後の音
声波形の一部を示すものである。 ステップ52:ステップ51の第1次BPF処理によっ
て得られた楽音波形信号に対してピーク位置検出法を用
いて1周期の基準となるピーク基準位置検出処理を行
う。このピーク位置検出方法は公知の手法によって行
う。楽音波形のピークレベルを検知して、これを所定の
時定数回路で保持し、その保持されている値をスレッシ
ュルドホールド電圧として次にこのスレッシュルドホー
ルド電圧以上になった場合を次のピークレベルとして保
持し、それを順次繰り返すことによって、図10(A)
のようなピーク位置を検出することができる。図10
(A)はこのピーク位置を検出する際のスレッシュルド
ホールド電圧の様子を示す図である。図10(A)の音
声波形からは、図10(B)のようなピーク位置が検出
されることになる。図10(B)ではピーク基準位置P
1,P2,P3,P6は共に規則正しく所定の位置で現
れているが、ピーク基準位置P4,P5については、音
声波形の若干の乱れによって誤差を含む位置にピークが
現れている。これは、ステップ51の第1次BPF処理
のカットオフ周波数の帯域が広い範囲を網羅しているた
め、図10(A)のようにピーク位置が連続して表れた
からである。
【0056】ステップ53:前記ステップ52で検出さ
れたピーク基準位置に基づいて、あるピーク基準位置か
ら始まる基本区間と、その基本区間の直後の次のピーク
基準位置までの区間(以下、移動区間とする)との間の
2つの区間の波形について波形が同じであるか否かの比
較を行う。図10(B)に示されるピーク基準位置につ
いて考察すると、ピーク基準位置P1からピーク基準位
置P2までが区間d、ピーク基準位置P2からピーク基
準位置P3までが区間eとなる。このとき、両区間d,
eは帯域最低長よりも大きく、帯域最高長よりも小さい
ので、区間dが基本区間となり、区間eが移動区間とな
り、後述する波形比較処理の対象となる。次に、区間e
が基本区間となり、ピーク基準位置P3からピーク基準
位置P4までが区間fとなる。このとき、両区間e,f
は帯域最低長よりも大きく、帯域最高長よりも小さいの
で、今度は区間eが基本区間となり、区間fが移動区間
となり、後述する波形比較処理の対象となる。ところ
が、ピーク基準位置P4からピーク基準位置P5までの
区間は帯域最低長よりも小さいので、比較対象の区間と
はならずに、次のピーク基準位置P5からピーク基準位
置P6までの区間gが区間fとの波形比較対象となる。
なお、波形比較処理の結果、区間f及び区間gは他の区
間dや区間eとは異なった波形として認識されることに
なる。まず、ワーキングメモリ(RAM)には、ピーク
基準位置情報をアドレスとして、そこに一致フラグ又は
不一致フラグがそれぞれ書き込まれるデータ領域が設け
られる。そして、図10(B)のような場合には、区間
dと区間eとは一致すると判定されるので、区間eに対
応するピーク基準位置情報P2に関するデータ領域には
一致フラグが書き込まれる。一方、区間eと区間fとは
一致しないと判定されるので、区間fに対応するピーク
基準位置情報P3に関するデータ領域には不一致フラグ
が書き込まれる。ピーク基準位置P4からピーク基準位
置P5までの区間は帯域最低長よりも小さいので、ピー
ク基準位置情報P4及びP5に関するデータ領域には不
一致フラグが書き込まれる。なお、ピーク基準位置情報
P1及びP6に関するデータ領域には一致フラグが書き
込まれているものとする。このようにして順次ピーク基
準位置情報と共に書き込まれた一致フラグ及び不一致フ
ラグの様子が図10(C)に示されている。
【0057】波形比較処理は後述する誤差率を算出する
方法によって行われる。図13はこの波形比較処理の中
で行われる誤差率の算出方法を説明するための図であ
る。まず、誤差率の算出対象となる2つの波形が図12
の示すような比較波1Xと比較波2Xであるとする。こ
の波形は図10のピーク基準位置によって区切られた範
囲となる。まず、比較波1X及び比較波2Xについて、
最大振幅値が100パーセントとなるようにその振幅値
の正規化を行う。まず、比較波1Xは比較波1Yとな
り、比較波2Xは比較波2Yとなる。ここで、比較波2
Xは比較波1Xに比べて時間軸(横軸)方向の長さが短
いので、比較波2Xを比較波1Xと同じ時間幅となるよ
うに伸長する。すなわち、比較波2Yの時間軸を伸長し
て比較波2Zにする。この比較波1Yと比較波2Zとの
間で誤差率の計算が行われる。図13は、比較波1Yと
比較波2Zとの間の誤差率を算出する場合の具体的な値
を示す図である。図では、比較波1Yと比較波2Zの最
初の1周期の波形すなわちサンプリング数で24個分に
ついて誤差率を算出する場合について説明する。比較波
1Yと比較波2Zの同じサンプリング位置についてその
差分を算出し、その差分の絶対値の合計を求める。図1
3の場合には絶対値の合計値は122である。これをサ
ンプリング数24で除することによって、誤差率が求ま
る。この場合には誤差率は5となる。そこで、同じ波形
がどうかのしいき値を10とすれば、図13の場合の誤
差率5は10以下なので、同じ波形として処理されるこ
とになる。なお、図13において、各波形は1000を
最大レベルとして正規化されている。
【0058】ステップ54:ステップ53の波形比較処
理の結果を利用して、誤差率が所定値(例えば10)よ
りも小さな区間同士を繋げて、それを疑似的な一致区間
とし、各一致区間から抽出されるピッチの最大値と最小
値を検出し、それに基づいてカットオフ周波数帯を決定
する。例えば、波形比較処理の結果得られた複数の一致
区間の中のピッチの最小値が235ポイントで、最大値
が365ポイントだとする。この一致区間にやや余裕を
持たせるために、最小値を1割減とし、最大値を1割増
しとすると、一致区間は約212ポイントから約402
ポイントになる。これは、サンプリング周波数が44.
1kHzだと、110Hzから208Hzのオーディオ
信号の周波数帯に相当する。従って、この110Hzか
ら208Hzをカットオフ周波数帯とする。 ステップ55:ステップ54で決定された新たなカット
オフ周波数帯を用いて、第2次バンドパスフィルタ(第
2次BPF)を通過させて、不要な倍音を除去する。例
えば、前述の場合には、カットオフ周波数帯は110H
zから208Hzの範囲となる。これによって、倍音に
よる間違いを減少させて、検出精度を向上させることが
できる。 ステップ56:ステップ52のピーク基準位置検出処理
と同じ処理を行う。 ステップ57:ステップ53の波形比較処理と同じ処理
を行う。 ステップ55からステップ57までの一連の処理によっ
て、誤差の原因となる低周波や高調波がカットされてよ
り精度の高いピーク基準位置検出処理及び波形比較処理
が可能となり、前回よりも精度の高い一致区間が得られ
る。ステップ57の波形比較処理によって、図10
(C)のように一致フラグ及び不一致フラグによって特
徴付けられた有効区間の波形は、図10(D)のような
三つの定常区間X,Y,Zのようなピッチ列が求められ
る。
【0059】ステップ58:ステップ57までの処理に
よって得られた図10(D)のようなピッチ列を用いて
も良いが、さらに精度を高めるために、各ピーク基準位
置におけるピッチデータを補間して、1サンプルポイン
ト毎に1ピッチデータとなるように補間する。この場合
に、図10(A)から明らかなように最初のピーク基準
位置より前のサンプルポイント及び最後のピーク基準位
置より後のサンプルポイントについては、補間するため
のピッチデータが存在しないためピッチの補間を行うこ
とができない。そこで、最初のピーク基準位置より前の
サンプルポイントについては最初のピーク位置における
ピッチデータを、最後のピーク基準位置より後のサンプ
ルポイントについては最後のピーク位置におけるピッチ
データをそのまま適用することにした。そして、それぞ
れのピーク基準位置間においては、両者のピッチデータ
の値を直線補間して適用する。例えば、図10(B)に
おいて、ピーク基準位置P1のピッチデータがPD1、
ピーク基準位置P2のピッチデータがPD2であるとす
れば、ピーク基準位置P1とP2との間の任意のサンプ
ルポイントPVにおけるピッチデータは、次式によって
求められる。 (PD2−PD1)×(PV−PA)/(P2−P1)
【0060】ステップ59:ステップ58の処理によっ
て求められた各サンプルポイント毎のピッチデータを用
いてバンドパスフィルタ処理を行う。すなわち、ピッチ
データは時間経過と共に変化するので、カットオフ周波
数帯も時間的に変動する、いわやる時変動バンドパスフ
ィルタ(BPF)処理を行う。これによって、楽音波形
信号はサイン波形に近い波形に変形されるので、このよ
うな波形に対してピーク位置検出処理を行うことによっ
て、理想的なピーク位置検出を行うことができる。ま
た、これを基準に比較処理を行えるので、誤差が最小限
に抑えられるようになるため、高精度で同波形(同母
音)区間を見つけることが可能となる。 ステップ5A:ステップ59の時変動BPF処理を経た
楽音波形に対して、ステップ52のピーク基準位置検出
処理と同じ処理を行う。 ステップ5B:ステップ59の時変動BPF処理を経た
楽音波形に対して、ステップ53の波形比較処理と同じ
処理を行う。
【0061】上述の説明では、図5の定常区間検出処理
のステップ52、56及び5Aでは、楽音波形のプラス
側だけに注目してピーク基準位置を検出する場合につい
て説明したが、音声音や楽器音などのようにピッチを有
する楽音波形は、プラス側、マイナス側、又はプラス側
マイナス側の両側に強いピークが現れることがある。従
って、前述のようにプラス側にピークが強く現れている
場合にはプラス側に注目してピーク基準位置を検出する
ことによって、ピッチの検出が可能である。この場合、
鋭いピークが両側に現れている場合も問題ないが、マイ
ナス側に偏って強く現れる場合がある。このような場合
には、その強く現れる側に注目してピーク基準位置の検
出を行う方が良いことは言うまでもない。仮に、ピーク
基準位置の検出をピークが弱く現れる方向に注目して行
ったとすると、ピーク基準位置の検出自体が曖昧にな
り、思ったようにピッチを検出することができなくなる
というおそれが生じる。ピークがプラス側マイナス側の
どちらかに偏って現れるという現象は、発音する人間や
楽器のその時々の条件に応じて種々変化するものなの
で、一概にどちら側に注目してピーク基準位置を検出し
たらよいかということは言えないのが現状である。そこ
で、強いピークがどちら側に現れてもよいように、予め
楽音波形をチェックして、ピークがプラス側又はマイナ
ス側のどちらに強く現れているかを検出し、検出された
側の楽音波形に基づいてピーク基準位置の検出及びピッ
チ検出を行うようにすればよい。例えば、図5のステッ
プ51の第1次BPF処理後における安定区間の楽音波
形が図11のようであったとする。この楽音波形の場
合、強いピークはマイナス側に現れ、弱いピークがプラ
ス側に現れている。この楽音波形の両側についてピーク
基準位置の検出処理を施した場合、ピークの強さは異な
るがどちら側にも安定したピークが現れているので、プ
ラス側でもマイナス側でもほぼ変わりなく規則的なピー
ク基準位置を検出することは可能である。従って、この
楽音波形の場合には、プラス側に注目して図5の定常区
間検出処理を行ってもなんら支障はないことになる。し
かしながら、楽音波形によっては、周期が比較的短かく
て、長く繰り返す波形などの場合には、徐々にそのピー
クが鈍ることもあり、プラス側だけに注目して定常区間
処理を行った場合に、正確なピーク基準位置を検出でき
なくなることがある。従って、図11のような波形の場
合でも、できるだけ強いピークの現れるマイナス側に注
目することが望ましい。そこで、図4の安定区間検出処
理によって検出された安定区間毎に、その区間全体で楽
音波形の絶対値の最大がプラス側又はマイナス側のどち
らに存在するかを検出し、検出する側に注目してピーク
基準位置の検出を行うようにすればよい。図11の場合
にはマイナス側に絶対値の最大が存在するので、マイナ
ス側に注目してピーク基準位置の検出が行うことが望ま
しいことになる。これによって、倍音などに惑わされる
ことなくピーク基準位置を検出することができる。
【0062】なお、上述の実施の形態では、楽音波形の
ピークレベルを検知して、これを所定の時定数回路で保
持し、その保持されている値をスレッシュルドホールド
電圧として次にこのスレッシュルドホールド電圧以上に
なった場合を次のピークレベルとして保持し、それを順
次繰り返すことによって、ピーク位置を検出していた。
しかしながら、この方法だと、時定数をどの程度に設定
するかによって、所望のピーク基準位置を検出すること
ができるか否かが決定していたので、倍音を相当な帯域
で含む音声音や楽器音の場合には、整然としたピークが
なかなか出現しない場合が多いという問題を有してい
た。そこで、上述の実施の形態では、検出されたピーク
基準位置が後の周波数帯決定処理に用いることのできる
正確なものであるか否かの判定を、検出されたピーク位
置に基づいた波形比較処理によって行っていた。このこ
とは、前述のピーク基準位置検出処理によって検出され
たピーク位置がさほど正確なものでもなくてもよいとい
うことを意味するものである。そこで、楽音波形のピー
クレベルを検知する場合に、時定数をある程度小さめに
設定しておき、楽音波形からピーク基準位置として可能
性のあるものを多数抽出し、抽出されたピーク基準位置
に基づいて波形比較処理を行って、ピーク基準位置を順
次決定していくようにしてもよい。この場合、図14の
ような楽音波形のプラス側に注目してピーク位置を検出
すれば、各ピーク位置は1周期内で3箇所抽出される。
この1周期当たり3箇所のピーク位置に基づいてそれぞ
れ波形比較処理を行うと、その処理に要する時間は大変
なものとなる。故に、ここでは、まず、同波形であると
認定された区間に基づいて、これ以降の同波形区間の検
出処理を効率的に行うようにした。例えば、図14のよ
うな楽音波形の場合、ピーク位置としてPa〜Poが検
出されることになる。従って、最初に波形比較処理され
るのは、ピーク位置Paを起点とした以下の16通りの
組み合わせについてである。(Pa−Pb)と(Pb−
Pc)、(Pa−Pb)と(Pb−Pd)、(Pa−P
b)と(Pb−Pe)、(Pa−Pb)と(Pb−P
f)、(Pa−Pc)と(Pc−Pd)、(Pa−P
c)と(Pc−Pe)、(Pa−Pc)と(Pc−P
f)、(Pa−Pc)と(Pc−Pg)、(Pa−P
d)と(Pd−Pe)、(Pa−Pd)と(Pd−P
f)、(Pa−Pd)と(Pd−Pg)、(Pa−P
d)と(Pd−Ph)、(Pa−Pe)と(Pe−P
f)、(Pa−Pe)と(Pe−Pg)、(Pa−P
e)と(Pe−Ph)、(Pa−Pe)と(Pe−P
i)この結果、区間(Pa−Pd)と区間(Pd−P
g)の波形が一致すると判定される。この結果、ピーク
位置Paはピッチ基準位置PPaとなり、他のピーク位
置Pb,Pcは候補から除外される。そして、次はピー
ク位置Pdを起点として同じようして16通りの組み合
わせについて波形比較処理を行い、ピーク位置Pdがピ
ッチ基準位置PPdとなる。以下、同様にして、ピッチ
基準位置が次々と検出されることになる。なお、16通
りの中から同波形区間を検出する場合には、16通り全
ての誤差率を算出し、その中で所定値(例えば10)以
下の誤差率で最小のものを同波形区間としてもよいし、
順次算出された誤差率の中で所定値(例えば10)以下
のものが現れた時点でそれを同波形区間としてもよい。
【0063】このように同波形区間を抽出するのに多数
の組み合わせについて誤差率の算出処理を行っている
と、相当の時間を要することになるので、ここでは、前
述のように同波形であると認定された区間に基づいて、
これ以降の同波形区間の検出処理を行う。すなわち、前
述の16通りの組み合わせの中でも、(Pa−Pb)と
(Pb−Pd)、(Pa−Pb)と(Pb−Pe)、
(Pa−Pb)と(Pb−Pf)、(Pa−Pc)と
(Pc−Pd)、(Pa−Pc)と(Pc−Pg)、
(Pa−Pd)と(Pd−Pe)、(Pa−Pd)と
(Pd−Pf)、(Pa−Pe)と(Pe−Pf)、
(Pa−Pe)と(Pe−Pg)の9通りについては比
較処理を行わない。これは比較対象の波形区間長の比が
2倍近いので、比較するまでもなく同波形とはなりえな
いので、事前にそれらの比較を行わないようにするため
である。従って、ここでは、次の7通りの組み合わせに
ついて波形比較処理を行う。(Pa−Pb)と(Pb−
Pc)、(Pa−Pc)と(Pc−Pe)、(Pa−P
c)と(Pc−Pf)、(Pa−Pd)と(Pd−P
g)、(Pa−Pd)と(Pd−Ph)、(Pa−P
e)と(Pe−Ph)、(Pa−Pe)と(Pe−P
i) すると、前述の場合と同じく区間(Pa−Pd)と区間
(Pd−Pg)の波形が一致すると判定される。この結
果、ピーク位置Paはピッチ基準位置PPaとなり、他
のピーク位置Pb,Pcは候補から除外される。そし
て、次はピーク位置Pdを起点として同じようして7通
りの組み合わせについて波形比較処理を行うことになる
が、ここでは、区間(Pd−Pg)に基づいて、次の比
較対象となる区間を限定する。すなわち、区間(Pd−
Pg)の区間長に±αとなるような区間(Pg−P
i)、(Pg−Pj)、(Pg−Pk)に対して波形比
較処理を行う。ここで、αとして、例えば、区間(Pa
−Pd)の約4分の1の長さを用いる。なお、αにはこ
れ以外の適当な値を用いてもよいことはいうまでもな
い。この波形比較処理の結果、区間(Pd−Pg)と区
間(Pg−Pj)が同波形区間と判定される。従って、
これ以降は3通りの組み合わせについて波形比較処理を
行えばよいので、演算処理が非常に楽になる。
【0064】ステップ5C:ステップ51からステップ
5Bまでの処理によって得られた定常区間を拡張する。
すなわち、ステップ51からステップ5Bまでの処理を
行った結果、各定常区間X,Y,Zが図10(D)のよ
うに1個の不一致区間によって区切られている場合はよ
いが、図10(C)のように定常区間が複数の不一致区
間によって区切られている場合には、各不一致区間を定
常区間に接続して、定常区間を拡張しなければならな
い。このステップ5Cはこの定常区間の拡張処理を行う
ものである。例えば、ステップ51からステップ5Bま
での処理によって、1つの安定区間が図15のように第
1同母音部XXと第2同母音部YYという同波形区間す
なわち定常区間が決定された場合、その安定区間の先頭
部分に接する第1同母音部XXの先頭周期区間S1と、
安定区間の末尾部分に接する第2同母音部YYの最終周
期区間E2とは、その安定区間に沿って拡張すればよ
い。ところが、第1同母音部XXと第2同母音部YYと
の間の不一致区間N1〜N6については単純に拡張する
ことはできないので、次のように拡張する。まず、前記
ステップ53、57及び5Bの波形比較処理よりも誤差
率の許容度の大きい拡張用誤差率に基づいて、第1同母
音部XXの最終周期区間E1と不一致区間N1、N2、
N3、N4、N5、N6の順に比較し、拡張用誤差率よ
りも小さいと判断された不一致区間を第1同母音部XX
に組み込んで拡張する。同じく第2同母音部YYの先頭
周期区間S2と不一致区間N6、N5、N4、N3、N
2、N1の順に比較し、拡張用誤差率よりも小さいと判
断された不一致区間を両方の同母音部XX、YYに組み
込んで拡張する。図15(A)の場合は、不一致区間N
1,N2が第1同母音部XXに組み込まれ、不一致区間
N6が第2同母音部YYに組み込まれ、結果として、図
15(B)のようになったとする。なお、各同母音区間
に組み込まれずに残った不一致区間N3,N4,N5は
次のようにして、いずれかの同母音区間に組み込むよう
にする。不一致区間N3と、第1同母音部XXに組み込
まれた不一致区間N2との間の波形比較処理を行って誤
差率を求め、不一致区間N5と、第2同母音区間YYに
組み込まれた不一致区間N6との波形比較処理を行って
誤差率を求め、両方の誤差率を比較して、誤差率の小さ
い方(一致する度合いの高い方)をその同母音部として
組み込み、拡張する。この結果、不一致区間N2と不一
致区間N3との誤差率の方が小さいので、図15(C)
のように、不一致区間N3が第1同母音部XXに組み込
まれる。今度は、不一致区間N2と不一致区間N4との
誤差率を求め、不一致区間N6と不一致区間N5との誤
差率と比べ、同じく誤差率の小さい方を組み込む。この
ようにして、図15(C)のように不一致区間N3,N
4が第1同母音部XXに組み込まれ、不一致区間N5は
第2同母音部YYに組み込まれる。なお、前述のように
不一致区間N3が第1同母音区間に組み込まれた時点
で、図15(D)のように、この不一致区間N3を第1
同母音区間とみなして、次の誤差率算出の際の不一致区
間N4と不一致区間N3とを比較対象区間としてもよい
ことはいうまでもない。また、この誤差率の小さいほう
をいずれかの同母音区間に組み込む際に、誤差率に上限
値を設け、誤差率がその上限値を越えた場合には、その
不一致区間は同母音区間に組み込まないようにしてもよ
い。以上のようにして、すき間区間を両側の同母音区間
に組み込み、定常区間の拡張処理を終了する。
【0065】なお、前述の波形比較処理では、ステップ
59の時変動BPF処理の施された楽音波形に対して、
ステップ5Bの波形比較処理を行う場合について説明し
たが、この場合だと、BPF処理後のサイン波形に近い
波形に対して比較処理を行うことになるので、母音毎の
特徴までもがフィルタリングされてしまい同母音区間を
抽出するという意義が薄れてしまう恐れがある。そこ
で、ピーク位置検出用と波形比較処理用の波形を別途用
意して、それに基づいてそれぞれピーク位置検出及び波
形比較処理を行うようにしてもよい。すなわち、ピーク
位置検出用の波形としては時変動BPF処理後の波形を
そのまま用い、波形比較処理用としてはその時変動BP
F処理に用いた周波数成分の数倍周期の周波数帯波形を
残すようなBPF処理を行った波形を用いるようにす
る。例えば、ステップ5Aのピーク基準位置検出処理に
よって検出されたピーク基準位置に基づいてそれぞれの
波形区間長の周波数を求めた場合、次のような周波数列
になったとする。134.6Hz、135.2Hz、1
45.7Hz、135.7Hz、・・・従って、この周
波数列を基本周波数列として、その整数倍の周波数帯を
今度はカットオフ周波数とする時変動BPF処理をそれ
ぞれの周波数帯毎に行い、それによって得られた波形を
合成する。すなわち、上記のような周波数列の場合に
は、基本周波数列の2倍の周波数列として、269.2
Hz、270.4Hz、291.4Hz、271.4H
z、・・・3倍の周波数列として、403.8Hz、4
05.6Hz、437.1Hz、407.1Hz、・・
・4倍の周波数列として、538.4Hz、540.8
Hz、582.8Hz、542.8Hz、・・・のよう
に、それぞれ基本周波数列の整数倍の周波数列をカット
オフ周波数とする時変動BPF処理をそれぞれ別々に行
う。このようにして得られた各周波数列に対応したBP
F処理後の波形を合成して得られた合成波形をステップ
5Bの波形比較処理の対象波形として使用する。これに
よって、同母音区間の検出時には、音色(母音)の変化
に従った正確な同母音区間の検出を行うことができるよ
うになる。なお、基本周波数を最低周波数とし、基本周
波数の整数倍を最高周波数とするバンドパスフィルタ処
理を行い、それを波形比較処理の対象波形として使用し
てもよいことはいうまでもない。
【0066】ステップ5D:ステップ51からステップ
5Cまでの処理によって得られた定常区間について今度
は音高の変化や安定性を考慮して細分化処理を行い、最
終的な定常区間を決定する。ステップ5Cまでの定常区
間検出処理では、波形を引き延ばして比較しているた
め、『ああ』などのような連続母音による音声波形の音
高変化であっても、それを1つの同じ音としてとらえる
ような仕組みになっている。従って、楽器音の楽音波形
の場合には、持続系の楽器音の音高変化を見つけ出せな
いような事態も起こる。そこで、この実施の形態では、
ステップ5Cまでの処理によって得られた定常部区間ご
とに音高変化の状態を調べて、その状態に応じてさらに
分割する必要があるかどうかの判定を行い。必要がある
と判定された場合には、定常部区間をさらに細かな定常
区間に分割する。すなわち、ある定常区間の中における
ピーク基準位置間の長さ(周期長)を計算し、それでサ
ンプリング周波数を割ることによってそのピーク基準位
置における周波数が算出される。各定常区間を構成する
各波形の周波数の値に基づいて、その波形区間の周波数
1と前波形区間の周波数f0との差分(すなわち比)
を、ノートに対応したリニア軸で数値化した値すなわち
「音程のセント値」に基づいた相対値xで表わすと、下
記式のようになる。 f1/f0 = 2(x/12) これを対数で表わして、xを解くと、 x = log(f1/f0)/log(12√2) なる式によって求められる。なお、「12√2」は、2の
12乗根である。周知のように、これは、2つの周波数
の差すなわち比(すなわち音程)をセント値に変換する
公式に対応している。ただし、一般的なセント値の表現
では半音の音程が100セントで表現されるが、上記式
に従うxは数値「1」が半音の音程に相当しており、半
音の音程を「1」とする、小数点以下の値を含む値であ
る。しかし、これは小数点の位取りの仕方の問題でしか
ないので、上記相対値xは、実質的にセント値に相当す
るものであると考えてもよく、要するに、相対的な音程
情報のことである。上記式では、この相対値xは、f1
とf0のどちらが大きいかによってプラス又はマイナス
の符号を持つことになるが、ピッチ安定区間の検出のた
めにはこの正負符号は不要であるから、これを除去した
絶対値表現|x|で表わしたものを「ノート距離」とい
うことにする。図16(A)は、このようにして求めら
れる「ノート距離」の時間的変化の関数(以下、ノート
距離変動曲線という)の一例を示すもので、縦軸が「ノ
ート距離」、横軸が時間である。このノート距離変動曲
線がフラットである区間が、ピッチが安定している区間
に相当する。
【0067】図16(A)のようなノート距離変動曲線
を微分してその立下り又は立上りの大きい部分を区切り
とすれば、2箇所のピッチ安定区間PS1及びPS2が
検出される。なお、このようにしてピッチ安定区間を求
めてもよいが、この実施の形態では、動的ボーダ曲線を
算出し、それに基づいてピッチ安定区間を検出するよう
にした。ここで、動的ボーダ曲線は、ノート距離変動曲
線に基づいて算出されるものであり、例えば、あるサン
プルポイントPXにおける動的ボーダは、開始位置から
サンプルポイントPXまでのノート距離変動曲線の平均
値を求め、それに所定の定数を乗じたものである。な
お、これにオフセット値を加算してもよい。図16
(A)の場合は、動的ボーダ曲線は曲線AC1のように
なる。この動的ボーダ曲線AC1とノート距離変動曲線
NC1とを比較して、ノート距離変動曲線NC1が動的
ボーダ曲線AC1よりも小さな区間をピッチ安定区間と
する。なお、このとき、動的ボーダ曲線AC1がノート
距離変動曲線NC1よりも小さくなった時点で、動的ボ
ーダ曲線AC1の演算を停止し、その値を保持し続け
て、ノート距離変動曲線NC1とその保持していた値と
が等しくなった時点で前回までの動的ボーダ曲線AC1
の値をリセットして、再び最初から同じように動的ボー
ダ曲線AC1の演算を開始する。このようすが図16
(B)に示されている。すると、図16(B)のような
ピッチ安定区間PS3及びPS4が求まることになる。
図16のようなノート距離変動曲線NC1の場合は、微
分処理によって検出されたピッチ安定区間も、動的ボー
ダ曲線によって検出されたピッチ安定区間もさほど変わ
りはない。しかしながら、図17のようにノート距離変
動曲線NC2の場合には、明確な違いが現れる。
【0068】図17のノート距離変動曲線NC2の場合
は、同母音区間の後半部分でピッチが不安定になってい
るため、曲線NC2の傾きでピッチ安定区間を検出する
と、図17(A)のようにピッチ安定区間PS5,PS
6,PS7,PS8が多数現れてしまう。しかしなが
ら、図17のノート距離変動曲線の場合、人間の耳はピ
ッチが不安定な部分でそのピッチ変化に対して鈍く(疎
く)反応するようになるので、実際には図17(A)の
ような多数のピッチ安定区間を感じとることはなく、図
16(B)のような大まかな2つのピッチ安定区間を感
じ取ることになる。一方、前述の動的ボーダ曲線によっ
てピッチ安定区間を検出すれば、人間の耳と同じような
反応を行わせることが可能となる。すなわち、図17の
ノート距離変動曲線NC2の動的ボーダ曲線を求める
と、図17(B)のような曲線AC2になる。従って、
この動的ボーダ曲線AC2よりも小さなノート距離変動
曲線NC2の部分がピッチ安定区間PS9及びPSAと
なり、図16のような大まかな2区間として把握される
ようになる。すなわち、音程が安定している区間(図1
7の安定区間PS9)では、その後にそれなりの音程変
化が発生すると音の区割りが変わったこと、つまり新し
い音が始まったということを人間は感じる。逆に、音程
が不安定な区間(図17の安定区間PSA)では多少の
音程の変化は人間の耳にはあまり感じ取られなくなり、
新しい音すなわち区間として認識しない。従って、音程
が不安定な区間ではそれなりの大きな音程の変化でない
と、音程の変化として認められなくなる。このような人
間の耳に近いピッチ安定区間の検出を可能とするため
に、上述のような動的ボーダを曲線を用い、一連の処理
で安定区間又は不安定区間を動的に検出し、区間分けを
行っている。このようにして検出されたピッチ安定区間
が図5の定常区間検出処理によって最終的に検出された
定常区間すなわち楽譜として表した時に一つの音符に相
当する区間になる。
【0069】図6は図1のステップ16の音高列決定処
理の詳細を示す図である。音高列決定処理は、ステップ
15によって検出された各定常区間に対して最適な音高
列を決定するための処理である。以下、この音高列決定
処理について図18及び図19を用いて説明する。音声
や楽音などを最終的に音符情報に変換する場合、ある特
定周波数をどの音高に丸めるかによってメロディが大幅
に変わってしまい、思ったような検出ができない場合が
多い。そこで、この実施の形態では、相対音を主体とし
て音高を決定し、さらにそれに調を利用して一番ふさわ
しい音高遷移を選択することによって音高列を決定する
ようにした。この音高列決定処理の一例を図6のフロー
チャートに従って説明する。 ステップ61:ステップ15(図5)の定常区間検出処
理によって得られた各定常区間に対してその区間の代表
周波数を決定する。図19(A)は、最終的に得られた
定常区間の一例を示す図である。ここでは全部で12個
の区間が検出されたものとして、各区間に括弧記号で囲
まれた
〔0〕〜〔12〕の区間番号を割り当ててある。
各定常区間の代表周波数を決定する場合に重要なこと
は、各定常区間の周期位置から周波数の動向を洗い出し
て、その区間固有の周波数を1つに決定することであ
る。そのための方法として、第1の方法は定常区間全体
の平均周波数をその区間の代表周波数とする。第2の方
法は定常区間の丁度中間付近の周期(周波数)をその区
間の代表周波数とする。第3の方法はピッチが安定して
いる部分の平均周波数をその区間の代表周波数とする。
なお、この実施の形態では、図5のステップ5Dのノー
ト距離による細分化処理の際に使用したノート距離変動
曲線、及びその時に検出されたピッチ安定区間を用いて
代表周波数を算出する。すなわち、図5のステップ5D
の細分化処理によって細分化された区間すなわちピッチ
安定区間におけるノート距離変動曲線の平均値を求め
る。この平均値を静的ボーダとする。例えば、図17の
ようなノート距離変動曲線NC2の場合には、ピッチ区
間PS9における静的ボーダはSB1となり、ピッチ区
間PSAにおける静的ボーダはSB2となる。そして、
各ピッチ区間PS9及びPSAにおけるノート距離変動
曲線NC2がこの静的ボーダSB1及びSB2よりも小
さい区間を代表周波数検出区間F1及びF2として、そ
の代表周波数検出区間F1及びF2に存在する各波形の
ピッチに基づいてその定常区間(ピッチ安定区間)PS
9及びPSAの代表周波数を決定する。例えば、図18
の代表周波数検出区間F1を構成する波形区間が図19
(B)のような12個であり、各波形区間の周期長は図
示の通りとする。この場合、この代表周波数検出区間F
1における周期長の平均値は、255.833となる。
ここで、周期長はサンプリング数で表されているので、
サンプリング周波数が44.1kHzだから、この代表
周波数検出区間F1の代表周波数は、その周期長の平均
値でサンプリング周波数を除することによって得られる
ので、図19(B)の場合には172.38Hzとな
る。この場合、代表周波数の値は小数点2桁を有効とし
て扱う。図19(C)はこのようにして図19(A)の
ような各定常区間の代表周波数を算出した結果を示す図
である。
【0070】ステップ62:ステップ61の処理によっ
て各定常区間の代表周波数が決定されると、今度はその
代表周波数に基づいて各定常区間の相前後する定常区間
番号同士のノート距離を決定する。ノート距離の決定は
図5のステップ5Dで用いた演算式と同様にして求め
る。図19(C)にはこのようにして算出されたノート
距離の一例が示されている。 ステップ63:算出されたノート距離の小数点以下一桁
を四捨五入して、ノート距離を12音階上の各音高へ丸
め込む。例えば、図19(C)の場合には、各ノート距
離は四捨五入されて、右欄の整数のようになる。この整
数は、前音高からのノート番号上の差を示すことになる
ので、最初の音高を決定することによって、音高列デー
タを完成することが可能となる。図19(C)の最右欄
に示す音高列データが最初の音高を0とした場合の音高
遷移のようすを示すデータである。すなわち、図19
(C)の場合には0−2−4−5−2−3・・・とな
る。 ステップ64:第1音の音高を決定する。まず、最も簡
単な方法は、第1音にデフォルト値として60のノート
ナンバ(ノートネームC4)音を割り当てる。すなわ
ち、MIDI規格の場合、ノートナンバの限界は0〜1
27なので、第1音の音高として、ノートナンバ60
(ノートネームC4)の音を割り当てる。これによっ
て、高音側(プラス側)には67半音分、低音側(マイ
ナス側)には60半音分だけ音高を振ることができる。
このようにすると図19(C)の最右欄の音高列を示す
データは、60(C4)−62(D4)−64(E4)
−65(F4)−62(D4)−63(D♯4)・・・
・となる。
【0071】ステップ65:ステップ64で決定された
音高列データを修正する。すなわち、ステップ64で決
定された音高列データの振れ幅を検出し、それが低音側
(マイナス側)に−60以下に振れている場合には、そ
の最小振れ幅に合わせてデフォルト値60を修正する。
この修正は、最小振れ幅のノートが0以上となるように
デフォルト値を上側にシフトすることによって行う。例
えば、最小振れ幅が−64の場合には、計算式−60−
(−64)=4の結果に従って、デフォルト値60を4
ノート分上側にシフトして、第1音として64を割当て
る。高音側(プラス側)に+67以上振れている場合に
も同様に最大振れ幅に合わせてデフォルト値60を修正
すればよい。なお、低音側(マイナス側)及び高音(プ
ラス側)の両方において振れ幅がオーバーすることは人
間の発声帯域から判断してあり得ないので、そのような
場合は除外する。なお、このようなことが起こり得るよ
うな場合には、特別に音域を0〜256の範囲で設定す
るようにしてもよい。なお、ステップ64では、第1音
の音高をデフォルト値(例えば60)として決定し、音
高列データを作成する場合について説明したが、これに
限らず、最初の定常区間の代表周波数に最も近い純正率
音階の周波数を検出し、その音階に当てはめるようにし
てもよい。例えば、図19(C)の場合には、区間番号
〔0〕の代表周波数は172.38Hzなので、第1音
の音高をそれに最も近いノートナンバ53(ノートネー
ムF3)に決定する。これによって、図19(C)の音
高列を示すデータは、53(F3)−55(G3)−5
7(A3)−58(A♯3)−55(G3)−56(G
♯3)・・・・となる。なお、これ以外にも種々の方法
で音程列を割り当ててもよいことは言うまでもない。
【0072】次に、この発明に係る電子楽器が音信号分
析装置及び演奏情報発生装置として動作する場合の第2
の実施の形態について説明する。この第2の実施の形態
に係る電子楽器が音信号分析装置及び演奏情報発生装置
として動作する際のメインフローは図1と同じなので、
その説明は省略する。ただし、メインフローの中のステ
ップ13〜ステップ15の各処理の内容が前述の第1の
実施の形態のものとは異なるので、以下その異なる点に
ついて詳細に説明する。
【0073】図20は図1のステップ13の有効区間検
出処理の詳細を示す図であり、図3に対応したものであ
る。有効区間検出処理は、ステップ12の音声サンプリ
ング処理の結果得られたディジタルサンプル信号に基づ
いて音楽的な音が存在する区間すなわち有効区間を検出
するための処理である。以下、この有効区間検出処理の
詳細を図23を用いて説明する。 ステップ201:ステップ12によって求められたディ
ジタルサンプル信号を所定のサンプル数毎に区切る処理
を行う。図23(A)は、サンプリング周波数44.1
kHzでサンプリングされた音声信号すなわちディジタ
ルサンプル信号の波形値の一例を示す図である。図23
(A)には、約4408ポイント分の波形値が示されて
いる。図23(D)には、その2倍の約8816ポイン
ト分の波形値が示されている。ステップ201では、所
定のサンプル数(例えば、音声の最低周波数を80Hz
とした場合におけるその最大周期に対応するサンプル
数)でディジタルサンプル信号を区切る。従って、サン
プリング周期44.1kHzの場合には、この所定サン
プル数は『551=44100/80』である。図23
(B)は図23(A)の波形値に対応しており、この波
形値が551サンプル数毎に区切られた場合の各波形区
間S1〜S8の様子を示す図である。
【0074】ステップ202:ステップ201によって
区切られた区間毎に、その区間内に存在するディジタル
サンプル信号波形の最大値を抽出する。図23(C)に
は、図23(A)のディジタルサンプル信号波形が点線
で示され、その各区間S1〜S8内における各波形の最
大値が黒点で示されている。 ステップ203:ステップ202で求められた各区間の
最大値を補間(例えば直線補間)し、補助波形を作成す
る。図23(D)は、図23(A)〜(C)の約2倍の
区間に相当する補助波形を示すものであり、各区間の最
大値を直線補間することによって得られた補助波形を示
している。なお、図23(A)のディジタルサンプル信
号波形は点線で示されている。次のステップ204〜ス
テップ206では、このようにして得られた補助波形に
基づいて有効区間の抽出処理が行われる。
【0075】ステップ204:前記ステップ203で求
められた図23(D)のような補助波形を、所定のしき
い値Thに基づいて有効区間又は無効区間にそれぞれ分
類する。この処理では、しきい値Thとして、最大波形
値の約3分の1の値をしきい値とする。これ以外の値を
しきい値Thとしてもよいことは言うまでもない。例え
ば、図23(D)の実線波形の平均値をしきい値Thと
したり、又はその平均値の80パーセントをしきい値T
hとしたりしてもよい。従って、このしきい値Thと補
助波形との交点位置が有効区間及び無効区間の境界とな
り、このしきい値Thよりも大きい区間が有効区間とな
り、小さい区間が無効区間となる。
【0076】ステップ205:人間が音高を認知できる
必要な最低長を0.05msecとした場合に、前記ス
テップ202で決定された無効区間の中からこの最低長
よりも小さな無効区間を有効区間に変更する。例えば、
サンプリング周期が44.1kHzの場合にはサンプリ
ング数で2205個以下のの無効区間が、人間が音高を
認知できる必要な最低長である0.05msec以下の
無効期間に対応するので、そのような無効区間を有効区
間に変更する。図23(D)の無効区間は、波形区間で
3個分(サンプリング数で約1653個分)なので、こ
の最低長よりも小さな無効区間に相当するので、このス
テップ205の処理によって有効区間に変更される。 ステップ206:前記ステップ205の処理の結果、得
られた有効区間及び無効区間のパターンの中から0.0
5msec以下の短い有効区間を無効区間に変更する処
理を行う。この処理は前記ステップ205と同様の処理
にて行う。
【0077】図21は図1のステップ14の安定区間検
出処理の詳細を示す図であり、図4に対応したものであ
る。以下、図20の有効区間検出処理によって求められ
た有効区間内のディジタルサンプリング信号に対して、
レベルの安定した領域を検出するための安定区間検出処
理を行う。この安定区間検出処理の動作を図24〜図2
6を用いて説明する。 ステップ211:図20の有効区間検出処理によって検
出された有効区間内のディジタルサンプリング信号に基
づいて、波形のピークが強く出ているサイドを検出す
る。すなわち、図24(A)のように有効区間内のディ
ジタルサンプリング信号のプラス(+)側の波形のピー
ク値maxとマイナス(−)側の波形のピーク値min
のそれぞれの絶対値を取り、どちらの絶対値が大きいか
によって、ピークの強く出ているサイドを決定する。な
お、これ以外の方法でピークの強く出ているサイドを決
定するようにしてもよい。例えば、上位3〜5個のピー
ク値の絶対値の合計を比較して決定するようにしてもよ
い。 ステップ212:ステップ211でピークの検出された
サイドにおいて、前方(時間経過方向)に向けてエンベ
ロープを取り、そのピーク部を検出する。すなわち、図
24(B)のように、プラス側の波形に対して前方にエ
ンベロープを取り、そのピーク部を検出する。この結
果、図24(B)の場合、ピーク部としてP1〜P4の
4点が検出される。 ステップ213:今度はステップ212とは逆の方向
(時間経過とは逆方向)に向けてエンベロープを取り、
そのピーク部を検出する。すると、図24(C)のよう
に、同じ位置にピーク部P1〜P4が検出されるが、波
形によってはこれ以外にもピーク部PPが検出される。
このことは、徐々にレベルが上がっている波形において
は、いずれか一方向だけでエンベロープ検出を行った場
合には、倍音ピークをピッチのピークとして取り間違
え、実際にピークでない箇所(ピーク部PPなどのよう
なもの)を誤ってピークとして検出してしまうことがあ
る。従って、ステップ212及びステップ213のよう
に、異なる方向でエベロープを取り、ピーク部を検出す
ることによって、ピーク部の検出精度を向上することが
できる。
【0078】ステップ214:ステップ212及びステ
ップ213の処理によって検出されたピーク部を直線補
間し、新たな波形を生成する。図24(D)は、ステッ
プ212及びステップ213によって検出されたピーク
部P1〜P4を直線補間することによって生成された新
たなピーク値補間曲線を示している。なお、図24
(D)において図24(A)のディジタルサンプル信号
波形は点線で示されている。 ステップ215:以上の処理によって生成されたピーク
値補間曲線に基づいて、ピーク間の合計傾斜を算出す
る。この処理では、図24(D)に示すように、傾斜を
算出するための算出幅を例えば200ポイントとし、そ
の算出幅のシフト量を例えば100ポイントとして、こ
のシフト量に相当するポイントを順次シフトしながら、
その傾斜を算出する。有効区間の最初のサンプルポイン
トa1が『100』だとすると、そのサンプルポイント
『100』と『300』との間の傾斜b1は、算式:
(a3 −a1)/200によって求められる。次にそれ
ぞれのポイントを100ポイントずつシフトしたサンプ
ルポイント『200』と『400』との間の傾斜b2を
求める。
【0079】このようにして算出された傾斜の一例を図
25に示す。図から明らかなように、サンプルポイント
『100』−『300』間の傾斜b1は0.03、サン
プルポイント『200』−『400』間の傾斜b2は
0.15、サンプルポイント『300』−『500』間
の傾斜b3は0.25、サンプルポイント『400』−
『600』間の傾斜b4は0.50、サンプルポイント
『500』−『700』間の傾斜b5は0.90、サン
プルポイント『600』−『800』間の傾斜b6は
1.80、サンプルポイント『700』−『900』間
の傾斜b7は1.90、サンプルポイント『800』−
『1000』間の傾斜b8は2.00、サンプルポイン
ト『900』−『1100』間の傾斜b9は1.70、
『1000』−『1200』間の傾斜b10は1.2
0、『1100』−『1300』間の傾斜b11は0.
70となる。これらの傾斜b1〜b11は前者のサンプ
ルポイントa1〜a11における傾斜として記憶され
る。すなわち、サンプルポイントa1の傾斜b1が0.
03、サンプルポイントa2の傾斜b2が0.15とし
て、それぞれのサンプルポイント毎に傾斜が記憶され
る。
【0080】次に、このようにして求められた傾斜b1
〜b11の値に基づいて、合計傾斜を求める。合計傾斜
はそのサンプルポイントを基準に後ろ5つの傾斜を合計
することによって得られるものであり、そのサンプルポ
イント付近の傾斜の度合いを示すものである。例えば、
サンプルポイントa1の合計傾斜c1は、そのサンプル
ポイントa1の傾斜b1と、それから4つ後ろの傾斜b
2〜b5とを合計することによって算出される。すなわ
ち、c1=b1+b2+b3+b4+b5によって算出
される。図25の場合には、サンプルポイントa1の合
計傾斜c1は1.83、サンプルポイントa2の合計傾
斜は3.60、サンプルポイントa3の合計傾斜c3は
5.35、サンプルポイントa4の合計傾斜は7.1
0、サンプルポイントa5の合計傾斜は8.30、サン
プルポイントa6の合計傾斜c6は8.60、サンプル
ポイントa7の合計傾斜は7.50である。
【0081】このようにして全区間における合計傾斜を
算出し、次のステップ216の処理を行う。なお、ここ
では、5ポイントの合計をその先頭の合計傾斜とする場
合について説明したが、これに限らず、5ポイントの中
間の合計傾斜としてもよい。すなわち、合計傾斜c1を
サンプルポイントa1〜a5の中間すなわちサンプルポ
イントa3の値としてもよい。また、これ以外に5ポイ
ントにおける位置が明確であれば、合計傾斜をどのポイ
ントの値としてもよいことは言うまでもない。また、5
ポイントに限らず、それ以上でもそれ以下でもよいこと
は言うまでもない。このように合計傾斜を用いること
で、一時的な傾きにだまされることなく、適切な傾斜部
分が見つけ出せるので、適切な安定箇所を発見すること
ができるようになる。
【0082】ステップ216:前記ステップ215で算
出された合計傾斜に基づいて今度は安定区間の抽出を行
う。すなわち、各サンプルポイントにおける合計傾斜を
直線補間又はその他の補間によって結ぶことによって形
成された合計傾斜曲線の中で所定値(例えば、合計傾斜
値5)以下の箇所を安定区間とし、それ以外の箇所は不
安定区間とする。 ステップ217:ステップ216の処理によって安定区
間とみなされた区間毎に波形の最大値すなわちピーク値
補間曲線の最大値を検出し、その最大値が所定値以下の
場合にはその安定区間は削除し、不安定区間に変更す
る。 ステップ218:このようにして抽出された安定区間の
存在に基づいて人間は初めてその安定区間の開始点付近
に音符のトリガである音の開始点があることに気付く。
そこで、その音符の開始点付近を決定するために、ステ
ップ216及びステップ217で安定区間と認定された
部分の音符開始点を検出し、それに応じて安定区間の拡
張を行う。
【0083】図26はステップ216からステップ21
8までの処理の概念を示すものである。有効区間内の合
計傾斜曲線が図26に示すような場合、それを所定値で
区切ることによって3つの安定区間d1〜d3が検出さ
れる。なお、安定区間d2についてはステップ217の
処理の結果、ピーク値補間曲線の最大値が所定値以下で
あるために削除される。従って、図26の有効区間の場
合には2つの安定区間d1,d3が存在することにな
り、2つの安定区間d1,d3の間には削除された安定
区間d2を含む不安定区間が存在することになる。この
不安定区間を安定区間d1,d3に接続して、それぞれ
の安定区間d1,d3の拡張処理を行う必要がある。
【0084】安定区間d1については、必然的に有効区
間の開始点がその安定区間d1の音符の開始点となり、
安定区間d3については、必然的に有効区間の最終点が
その安定区間d3の音符の終了点となる。そして、安定
区間d3の音符開始点及び安定区間d1の最終点は次の
ようにして求められる。すなわち、ステップ216で検
出された不安定区間の中から、音符開始点の検出対象と
なる安定区間に近い方の不安定区間を決定し、その不安
定区間内の合計傾斜曲線のピーク値に相当するサンプル
ポイントをその安定区間の音符開始点とするようにし
た。従って、図26のように安定区間d2が削除されて
不安定区間が2箇所存在する場合には、音符開始点の検
出対象となる安定区間d3に近い方の不安定区間におい
て、合計傾斜のピーク値に相当するサンプルポイントf
2が安定区間d3の音符開始点となる。従って、安定区
間d1の音符終了点はサンプルポイントf2となるの
で、最終的に、安定区間d1は拡張安定区間e1とな
り、安定区間d2は拡張安定区間e3となる。なお、図
26の場合に、安定区間d2がステップ217の処理で
削除されなかった場合には、サンプルポイントf1が安
定区間d1の音符終了点及び安定区間d2の音符開始点
となり、サンプルポイントf2が安定区間d2の音符終
了点及び安定区間d3の音符開始点となる。
【0085】図22は図1のステップ15の定常区間検
出処理の詳細を示す図であり、図5に対応したものであ
る。図21の安定区間検出処理によって求められた安定
区間の中から定常区間がどのようにして検出されるの
か、その定常区間検出処理の詳細を説明する。なお、図
22の定常区間処理の内、ステップ221〜ステップ2
29は図5に示したステップ51〜ステップ59とほと
んど同じなので、その部分については簡単に説明し、こ
れ以外について詳細に説明する。
【0086】ステップ221:第1次バンドパスフィル
タ(第1次BPF)を通過させて、所定の倍音を削除す
る。 ステップ222:ステップ221の第1次BPF処理に
よって得られた楽音波形信号に対してピーク位置検出法
を用いて1周期の基準となるピーク基準位置検出処理を
行う。 ステップ223:前記ステップ222で検出されたピー
ク基準位置に基づいて、あるピーク基準位置から始まる
基本区間と、その基本区間の直後の次のピーク基準位置
までの区間(以下、移動区間とする)との間の2つの区
間の波形について波形が同じであるか否かの比較を図1
3に示すような誤差率算出方法によって行う。 ステップ224:ステップ223の波形比較処理の結果
を利用して、誤差率が所定値(例えば10)よりも小さ
な区間同士を繋げて、それを疑似的な一致区間とし、各
一致区間から抽出されるピッチの最大値と最小値を検出
し、それに基づいてカットオフ周波数帯を決定する。 ステップ225:ステップ224で決定された新たなカ
ットオフ周波数帯を用いて、第2次バンドパスフィルタ
(第2次BPF)を通過させて、不要な倍音を除去す
る。 ステップ226:ステップ222のピーク基準位置検出
処理と同じ処理を行う。 ステップ227:ステップ223の波形比較処理と同じ
処理を行う。ステップ225からステップ227までの
一連の処理によって、誤差の原因となる低周波や高調波
がカットされて、より精度の高いピーク基準位置検出処
理及び波形比較処理が可能となり、前回よりも精度の高
い一致区間が得られる。 ステップ228:ステップ227までの処理によって得
られた各ピーク基準位置におけるピッチデータを補間し
て、1サンプルポイント毎に1ピッチデータとなるよう
に直線補間する。
【0087】ステップ229:ステップ228の処理に
よって求められた各サンプルポイント毎のピッチデータ
を用いて時変動バンドパスフィルタ(BPF)処理を行
う。 ステップ22A:ステップ229の時変動バンドパスフ
ィルタ処理を経た楽音波形に対して、ピークが強く出て
いるサイドを決定し、ステップ228で得られた周波数
変化に基づいて決定されるピリオド区間によって楽音波
形を区切り、各区切り区間内で最大となる位置を検出
し、そこをピーク基準位置とする。すなわち、ステップ
229の時変動バンドパスフィルタ処理によって得られ
た楽音波形が図27に示すようなものである場合、その
周波数変化に基づいて決定されるピリオド区間PR1〜
PR5によって各楽音波形を区切る。この区切られた区
間PR1〜PR5における最大値P1〜P6がピーク基
準位置となる。ステップ222(ステップ52)やステ
ップ226(ステップ56)のようなピーク基準位置検
出処理によってピーク基準位置を検出すると、図10
(A)に示すような波形の場合、明らかに誤った位置に
ピーク基準位置P4,P5が出現してしまうという問題
があるが、このステップ22Aのようにピリオド区間に
よって楽音波形を区切り、その中でピーク基準位置を検
出する場合だと、そのような明らかに誤ったピーク基準
位置が検出されることはなくなり、ピーク基準位置検出
精度が向上する。
【0088】ステップ22B:ステップ22Aのピーク
基準位置検出処理によって検出されたピーク基準位置に
基づいて波形の有声区間検出処理を行う。すなわち、こ
の有声区間検出処理では、ステップ223と同様に、ス
テップ22Aで検出されたピーク基準位置に基づいて、
あるピーク基準位置から始まる基本区間と、その基本区
間の直後の次のピーク基準位置までの区間(以下、移動
区間とする)との間の2つの区間の波形について波形が
同じであるか否かの比較を図13に示すような誤差率算
出方法によって行う。そのために、この有声区間検出処
理では、基本区間と移動区間とが不一致と判定された場
合、その部分を直ちに有声区間の区切りとしないで、不
一致が所定回数以上連続して発生した場合に有声区間の
区切りとする。これによって、「あ〜い〜う〜」や「あ
〜あ〜あ〜」等のように「母音が連続する部分」を有声
区間として検出することができる。
【0089】例えば、図28の場合、ピーク基準位置P
1からピーク基準位置P2までを基本区間P12とする
と、ピーク基準位置P2からピーク基準位置P3までが
移動区間P23となる。この場合、基本区間P12と移
動区間23は一致すると判定されたとする。区間P23
と区間P34についても同様に一致と判定されたとす
る。次の区間P34と区間P45が不一致と判定された
場合、その区間P34と、区間P45の次の区間P56
との間で波形比較処理を行う。その結果、区間P34と
区間P56が一致と判定された場合には、区間P45と
区間56が不一致であっても、区間P34、区間P4
5、区間P56は一致するものとして次の区間P56と
区間P67(図示せず)の判定に進む。このとき、区間
P34と区間P45、区間P34と区間P56、区間P
34と区間P67(図示せず)、区間P34と区間P7
8(図示せず)、区間P34と区間P89(図示せず)
がそれぞれ不一致と判定された場合、すなわち所定回数
(例えば5回)以上不一致が連続して発生した場合に
は、その区間P34を有声区間の区切りとし、次の区間
P45と区間P56について同様の判定を行う。区間P
45と区間P56が不一致の場合には、区間P45と区
間P67(図示へせず)について判定を行う。なお、区
間45と区間P56が不一致の場合、不一致が連続する
がどうかの処理を行わずに、次の区間P56と区間P6
7について判定を行い、隣合う区間が一致したときに始
めて前述と同様の一致処理を行うようにしてもよい。こ
のようにして、有声区間が決定したら、今度はその有声
区間の中で所定長以下のもの(短い有声区間)を削除す
る。
【0090】以上の処理によって、安定区間は、図29
に示すように不安定区間によって分離された有声区間V
1〜V3のように分類される。なお、この有声区間V1
〜V3は隣接比較誤差曲線の値の低い安定した部分に対
応し、隣接比較誤差曲線の値の高い部分が不安定区間に
対応している。従って、この隣接比較誤差曲線に基づい
て、安定区間V1〜V3の拡張処理を行う。この拡張処
理は、安定区間の開始点及び終了点に接する有効区間に
ついては無条件にその安定区間の開始点及び終了点まで
拡張し、二つの有声区間に挟まれた不安定区間について
は隣接比較誤差の最大値を区切り点として、有効区間の
拡張を行う。従って、図29に示すような隣接比較誤差
曲線の場合には、各有声区間V1〜V3は拡張処理によ
って拡張有声区間V1E〜V3Eのようになる。なお、
図29では、拡張有声区間内の隣接比較誤差の傾きが0
となる部分(底辺部分)が一か所の場合のみが示されて
いるが、実際には隣接比較誤差の傾きが0となる部分
(底辺部分)は複数箇所存在する場合があることは言う
までもない。
【0091】ステップ22C:ステップ221からステ
ップ22Bまでの処理によって得られた各拡張有声区間
について、隣合う区間の誤差すなわち隣接比較誤差の傾
きが0となる部分(底辺部分)を検出し、そこを母音の
基準位置とし、その母音の発音に対応した区間を音色区
間として検出する処理を行う。この音色区間を検出する
処理では、底辺部分に相当する波形区間を基本区間とし
て固定し、その前後に存在する複数の波形区間を移動区
間として順次波形比較処理を行い、その比較誤差を求め
る。このようにして求めた比較誤差を基準比較誤差と呼
ぶ。すなわち、図30(A)に示すように隣接比較誤差
の底辺部分に相当する波形区間m0を基本区間とし、こ
の基本区間とその両側に存在する複数の移動区間m1,
m−1,m2,m−2,m3,m−3,m4,m−4・
・・との間で波形比較処理を行う。基本区間は隣接比較
誤差の最低値に相当するもの、すなわち、波形比較処理
の結果、一致度が高いと認定された波形区間のことであ
る。このようにして得られた比較誤差が図30(B)の
ような基準比較誤差曲線となる。この基準比較誤差曲線
は波形区間m0を基準にして波形比較処理を行っている
関係上、波形区間m0の近傍では隣接比較誤差曲線と同
じような傾向を示すが、比較的離れた部分では誤差率は
大きくなり、誤差率最大に収束する。そして、この基準
比較誤差曲線の値(誤差率)が所定値以下の部分の波形
区間が音色区間TS1となる。なお、基準比較誤差曲線
を求める場合にも、ステップ22Bの有声区間検出処理
のように、基準比較誤差曲線の値が所定値よりも大きく
なった場合にそこを直ちに音色区間の区切りとしない
で、所定値よりも大きい値が所定回数以上連続して発生
した場合に音色区間の区切りとする。
【0092】このようにして音色区間が決定した場合
に、拡張有声区間内でこの音色区間以外の未決定区間長
が所定長以上の場合には、決定した音色区間以外の拡張
音声区間について同様の処理を行う。すなわち、図30
の場合には、図30(B)のような音色区間TS1が決
定した場合、この音色区間TS1以外の拡張有声区間す
なわち未決定区間長が所定長以上なので、この未決定区
間長についても同様に、図30(C)に示すような隣接
比較誤差の底辺部分に相当する波形区間n0を基本区間
とし、この基本区間とその前後に存在する複数の移動区
間n1,n−1,n2,n−2,n3,n−3,n4,
n−4・・・との間で波形比較処理を行う。このように
して得られた比較誤差が図30(D)のような基準比較
誤差曲線となる。この基準比較誤差曲線の値(誤差率)
が所定値以下の部分の波形区間が今度は音色区間TS2
となる。従って、図30の拡張有声区間の場合には2つ
の音色区間TS1,TS2が検出されることになる。
【0093】ステップ22D:ステップ22Cの処理に
よって得られた音色区間をステップ5Cの定常区間拡張
処理と同じようにして拡張する。すなわち、ステップ2
21からステップ22Cまでの処理を行った結果、検出
された音色区間ST1と音声区間ST2との間が1個の
波形区間によって区切られている場合にはそのままその
波形区間を音色区間ST1及びST2の区切りとすれば
よいが、隣合う音色区間同士が複数の波形区間によって
区切られている場合には、これらの波形区間を前後の音
色区間に接続して、音色区間を拡張しなければならな
い。この音色区間を拡張する処理は、図15と同様の処
理によって行われる。なお、この場合もBPF処理後の
サイン波形に近い波形に対して比較処理を行うことにな
るので、母音毎の特徴までもがフィルタリングされてし
まい同母音区間すなわち同じ音色を抽出するという意義
が薄れてしまう恐れがある。そこで、ピーク位置検出用
と波形比較処理用の波形を別途用意して、それに基づい
てそれぞれピーク位置検出及び波形比較処理を行うよう
にしてもよい。すなわち、ピーク位置検出用の波形とし
ては時変動BPF処理後の波形をそのまま用い、波形比
較処理用としてはその時変動BPF処理に用いた周波数
成分の数倍周期の周波数帯波形を残すようなBPF処理
を行った波形を用いるようにする。なお、基本周波数を
最低周波数とし、基本周波数の整数倍を最高周波数とす
るバンドパスフィルタ処理を行い、それを波形比較処理
の対象波形として使用してもよいことはいうまでもな
い。
【0094】このようにした拡張された音色区間につい
て今度は音高の変化や安定性を考慮して細分化処理を行
い、最終的な音程区間を決定する。ステップ22Cまで
の音色区間検出処理では、波形を引き延ばして比較して
いるため、『ああ』などのような連続母音による音声波
形の音高変化であっても、それを1つの同じ音としてと
らえるような仕組みになっている。従って、楽器音の楽
音波形の場合には、持続系の楽器音の音高変化を見つけ
出せないような事態も起こる。そこで、この実施の形態
では、ステップ22Cまでの処理によって得られた音色
区間ごとに音高変化の状態を調べて、その状態に応じて
さらに分割する必要があるかどうかの判定を行い。必要
があると判定された場合には、音色区間をさらに細かな
音程区間に分割する。この音色区間を音程区間に分割す
る処理は、図16に示すようなノート距離変動曲線を用
いて行う。
【0095】ステップ22E:ステップ22Dの処理に
よって検出された音程区間の中には、音符として存在し
えないほど短いものが含まれていたりする場合がある。
故に、このステップでは1小節を所定の音符長(例えば
8分音符長)を単位としたグリッドに均等に分割し、こ
のグリッドに前述の音程区間を当てはめて、音価を決定
するようにしている。各音程区間の先頭が最も近いグリ
ッドにその音程区間を当てはめるようにしているが、1
つのグリッドに対して2つ以上の音程区間が最も近いと
いう場合には、それらの音程区間の中で音長の長いもの
をそのグリッドに当てはめるようにした。例えば、図3
1は8分音符長で分割された1小節分に該当する音程区
間の一例を示す図である。図において、ステップ22D
によって最終的に決定された音程区間はPT1〜PT5
のようになったとする。この場合、音程区間PT1はグ
リッドG2に、音程区間PT2はグリッドG4に、音程
区間PT3はグリッドG5に当てはまる。しかしなが
ら、グリッドG6に関しては、音程区間PT4と音程区
間PT5の2つがグリッドG6に最も近い音程区間であ
る。従って、この場合には、音程区間PT4と音程区間
PT5の音長の長い方、すなわち音程区間PT5がグリ
ッグG6に当てはめられることになる。なお、グリッド
G5に音程区間PT3が当てはめられている関係上、音
程区間PT2の音長はクリッドG4からグリッドG5ま
でとなるが、このときに、音程区間PT3が存在しない
場合には、その音程区間PT2の音長の最終位置をその
まま採用してもよいし、音程区間PT2の末尾が最も近
いグリッドにその音程区間を当てはめるようにしてもよ
い。この場合、音程区間の存在しない部分にノートオフ
(休符)を当てはめるようにしてもよい。また、音程区
間PT3が存在しない場合には、その音程区間PT2の
音長の最終位置を次の音程区間PT5の開始位置である
グリッドG6までとしてもよい。この場合には、ノート
オフ(休符)などは存在しないことになる。このように
図22の定常区間検出処理によって音価が決定された後
は、図1のステップ16の音高列決定処理によって、各
音価に最適な音高列が割り当てられる。この音高列決定
処理は第1の実施の形態と同じなので説明は省略する。
【0096】
【発明の効果】この発明に係る音信号分析装置によれ
ば、マイク等からの入力音のピッチ又はレベルが微妙に
ゆれた場合でも、そのゆれた部分以外の音楽的な音の定
常部分すなわち1つの音符に相当する部分を分析するこ
とのできる音信号分析装置を提供することができる。
【図面の簡単な説明】
【図1】 図2の電子楽器が演奏情報発生装置として動
作する際のメインフローを示す図である。
【図2】 この発明に係る楽音情報分析装置及び演奏情
報発生装置を内蔵した電子楽器の構成を示すハードブロ
ック図である。
【図3】 図1のステップ13の有効区間検出処理の詳
細を示す図である。
【図4】 図1のステップ14の安定区間検出処理の詳
細を示す図である。
【図5】 図1のステップ15の定常区間検出処理の詳
細を示す図である。
【図6】 図1のステップ16の音高列決定処理の詳細
を示す図である。
【図7】 サンプリング周波数44.1kHzでサンプ
リングされた音声信号すなわちディジタルサンプル信号
の波形値の一例を示す図である。
【図8】 図3の有効区間検出処理の動作例の概念を示
す図である。
【図9】 図4の安定区間検出処理の動作例の概念を示
す図である。
【図10】 図5の第1次及び第2次BPF処理並びに
波形比較処理による動作例の概念を示す図である。
【図11】 図5のステップ51の第1次BPF処理後
における安定区間の楽音波形の強いピークがマイナス側
に現れ、弱いピークがプラス側に現れる場合の波形例を
示す図である。
【図12】 図5の波形比較処理の中で行われる誤差率
の算出方法がどのように行われるのか、その具体例を2
個の比較波を用いて示した図である。
【図13】 図5の波形比較処理によって、図11の2
個の比較波からどのようにして誤差率が算出されるの
か、具体的な数値を示す図である。
【図14】 時定数を小さめに設定した場合に図5のピ
ーク基準位置検出処理によってピーク基準位置がどのよ
うに抽出されるか、その具体例を示す図である。
【図15】 図5のステップ5Cの定常区間拡張処理の
動作例を示す図である。
【図16】 図5のステップ5Dのノート距離による細
分化処理の動作例を示す図である。
【図17】 図5のステップ5Dのノート距離による細
分化処理の別の動作例を示す図である。
【図18】 図6のステップ61の各定常区間の代表周
波数決定処理を行う場合に、定常区間のどの部分から代
表周波数を検出するのかその動作例を示す図である。
【図19】 図6のステップ61の各定常区間からどの
ようにして代表周波数が検出されるのかその動作例を示
す図である。
【図20】 図1のステップ13の有効区間検出処理の
別の実施の形態に係るものの詳細を示す図である。
【図21】 図1のステップ14の安定区間検出処理の
別の実施の形態に係るものの詳細を示す図である。
【図22】 図1のステップ15の定常区間検出処理の
別の実施の形態に係るものの詳細を示す図である。
【図23】 図20の有効区間検出処理の動作例の概念
を示す図である。
【図24】 図21のステップ211からステップ21
5までの処理の動作例の概念を示す図である。
【図25】 図21のステップ215の合計傾斜の算出
例を示す図である。
【図26】 図21のステップ216及びステップ21
8の処理の動作例の概念を示す図である。
【図27】 図22のステップ22Aのピーク基準位置
検出処理の動作例の概念を示す図である。
【図28】 図22のステップ22Bの有声区間検出処
理における動作例の概念の前半部分を示す図である。
【図29】 図22のステップ22Bの有声区間検出処
理における動作例の概念の後半部分を示す図である。
【図30】 図22のステップ22Cの音色区間検出処
理における動作例の概念を示す図である。
【図31】 図22のステップ22Eの音価決定処理に
おける動作例の概念を示す図である。
【符号の説明】
1…CPU、2…プログラムメモリ、3…ワーキングメ
モリ、4…演奏データメモリ、5…押鍵検出回路、6…
マイクインターフェイス、7…スイッチ検出回路、8…
表示回路、9…音源回路、10…鍵盤、1A…マイクロ
フォン、1B…テンキー&各種スイッチ、1C…ディス
プレイ、1D…サウンドシステム、1E…データ及びア
ドレスバス

Claims (39)

    【特許請求の範囲】
  1. 【請求項1】 任意の音信号を入力するための入力手段
    と、 前記入力手段から入力された音信号のサンプル振幅値の
    所定サンプル数にわたる平均値をそれぞれ求め、その結
    果を時系列的な平均レベル情報として出力する演算手段
    と、 前記演算手段によって求められた平均レベル情報に基づ
    いて前記音信号の中から音楽的な音が存在すると思われ
    る第1の区間を検出する第1区間検出手段と、 前記第1の区間内における前記音信号のサンプル振幅値
    に基づいて音信号分析用の第2の区間を、該第1の区間
    の中から検出する第2区間検出手段とを具えたことを特
    徴とする音信号分析装置。
  2. 【請求項2】 任意の音信号を入力するための入力手段
    と、 前記入力手段から入力された音信号のサンプル振幅値の
    所定サンプル数毎にその最大値を検出し、検出された最
    大値を補間することによって補助波形を作成する波形作
    成手段と、 前記波形作成手段によって作成された補助波形に基づい
    て前記音信号の中から音楽的な音が存在すると思われる
    第1の区間を検出する第1区間検出手段と、 前記第1の区間内における前記音信号のサンプル振幅値
    に基づいて音信号分析用の第2の区間を、該第1の区間
    の中から検出する第2区間検出手段とを具えたことを特
    徴とする音信号分析装置。
  3. 【請求項3】 任意の音信号を入力するための入力手段
    と、 前記音信号に所定の周波数特性のフィルタ処理を施すフ
    ィルタ手段と、 前記フィルタ処理後の音信号における連続するサンプル
    振幅値に基づいて各隣接する波形同士の一致度合いを分
    析する分析手段と、 前記分析手段により所定の条件に従う範囲内で一致して
    いると分析された連続する複数の波形からなる区間を同
    波形区間として検出する区間検出手段と、 前記区間検出手段によって検出された同波形区間におけ
    る前記音信号のピッチを検出するピッチ検出手段とを具
    えたことを特徴とする音信号分析装置。
  4. 【請求項4】 任意の音信号を入力するための入力手段
    と、 前記入力手段から入力する前記音信号に関して所定区間
    毎に前記音信号のピッチをそれぞれ検出し、検出したピ
    ッチのデータ列を生成する第1のピッチ検出手段と、 前記ピッチデータ列における各ピッチに対応する周波数
    に応じて通過帯域が可変制御されるフィルタ処理を、前
    記入力された音信号に施すフィルタ処理手段と、 前記フィルタ処理手段から出力される前記音信号のサン
    プル振幅値に基づいて該音信号のより正確なピッチを検
    出する第2のピッチ検出手段とを具えたことを特徴とす
    る音信号分析装置。
  5. 【請求項5】 任意の音信号を入力するための入力手段
    と、 前記入力手段から入力する前記音信号に関して所定区間
    毎に前記音信号のピッチをそれぞれ検出し、検出したピ
    ッチのデータ列を生成する第1のピッチ検出手段と、 前記ピッチデータ列における各ピッチに対応する周波数
    に応じて通過帯域が可変制御されるフィルタ処理を、前
    記入力された音信号に施すフィルタ処理手段と、 前記フィルタ処理後の音信号における連続するサンプル
    振幅値に基づいて各隣接する波形同士の一致度合いを分
    析する分析手段と、 前記分析手段により所定の条件に従う範囲内で一致して
    いると分析された連続する複数の波形からなる区間を同
    波形区間として検出する区間検出手段と、 前記区間検出手段によって検出された同波形区間におけ
    る前記音信号のピッチを検出する第2のピッチ検出手段
    とを具えたことを特徴とする音信号分析装置。
  6. 【請求項6】 任意の音信号を入力するための入力手段
    と、 前記入力手段から入力する前記音信号に関して所定区間
    毎に前記音信号のピッチをそれぞれ検出し、検出したピ
    ッチのデータ列を生成する第1のピッチ検出手段と、 前記ピッチデータ列における各ピッチに対応する周波数
    に応じて通過帯域が時変動制御されるフィルタ処理を、
    前記入力された音信号に施すフィルタ処理手段と、 前記フィルタ処理後の音信号における連続するサンプル
    振幅値に基づいて各隣接する波形同士の一致度合いを分
    析する分析手段と、 前記分析手段により所定の条件に従う範囲内で一致して
    いると分析された連続する複数の波形からなる第1の区
    間を検出する第1区間検出手段と、 前記第1区間検出手段によって検出された第1の区間内
    の一致度のより高い波形を基準にその前後における複数
    の各波形との間で一致度合いを判定し、一致度のより高
    い第2の区間を検出する第2区間検出手段と、 前記第2区間検出手段によって検出された第2の区間に
    おける前記音信号のピッチを検出する第2のピッチ検出
    手段とを具えたことを特徴とする音信号分析装置。
  7. 【請求項7】 任意の音信号を入力するための入力手段
    と、 所定のカットオフ周波数を最大周波数及び最小周波数と
    するバンドパスフィルタ処理を前記入力手段から入力す
    る前記音信号に施す第1フィルタ処理手段と、 前記第1フィルタ処理手段から出力される前記音信号に
    対して周期基準となる第1候補位置の複数を検出する第
    1周期基準検出手段と、 前記第1周期基準検出手段によって検出された前記第1
    候補位置に基づいて前記音信号の最大周波数及び最小周
    波数を検出する周波数帯検出手段と、 この周波数帯検出手段によって検出された最大周波数及
    び最小周波数をカットオフ周波数とするバンドフィルタ
    処理を、前記入力手段から入力する前記音信号に施す第
    2フィルタ処理手段と、 前記第2フィルタ処理手段から出力される前記音信号に
    対して周期基準となる候補位置の複数を検出する第2周
    期基準検出手段と、 前記第2周期基準検出手段によって検出された前記候補
    位置毎に前記音信号のピッチをそれぞれ検出するピッチ
    検出手段とを具えた音信号分析装置。
  8. 【請求項8】 任意の音信号を入力するための入力手段
    と、 前記音信号に所定の周波数帯域のフィルタ処理を施すフ
    ィルタ手段と、 前記フィルタ手段によるフィルタリング処理後の前記音
    信号のピーク位置をそれぞれ検出するピーク位置検出手
    段と、 このピーク位置検出手段によって検出された任意の2つ
    のピーク位置間で前記音信号の波形を区切ることにより
    得られる多様な区間のうち、前記フィルタの通過帯域に
    よる制限に見合った時間長の区間について、隣合う2つ
    の区間の対を可能な数だけ選定し、選定された各対にお
    ける2区間の波形の一致度をそれぞれ判定し、その一致
    度の最も高い1つの対を同波形区間として検出する区間
    検出手段と、 前記区間検出手段によって検出された同波形区間に基づ
    いて音信号分析用の定常区間を検出する定常区間検出手
    段とを具えたことを特徴とする音信号分析装置。
  9. 【請求項9】 任意の音信号を入力するための入力手段
    と、 前記入力された音信号のピーク位置をそれぞれ検出する
    ピーク位置検出手段と、 このピーク位置検出手段によって検出された任意の2つ
    のピーク位置間で前記音信号の波形を区切ることにより
    得られる多様な区間のうち、隣合う任意の2つの区間の
    波形の一致度をそれぞれ判定し、その一致度の高い区間
    同士を接続して第1の同波形区間群を検出する第1区間
    検出手段と、 前記第1の同波形区間群の中の開始区間と最終区間を比
    較の対象区間として、前記第1の同波形区間群の前後に
    隣接する区間のそれぞれについて波形の一致度を算出
    し、算出された一致度に基づいて前記第1の同波形区間
    群をその前後に拡張し、これを第2の同波形区間群とし
    て検出する第2区間検出手段と、 前記第2区間検出手段によって検出された第2の同波形
    区間群に基づいて音信号分析用の定常区間を検出する定
    常区間検出手段とを具えたことを特徴とする音信号分析
    装置。
  10. 【請求項10】 任意の音信号を入力するための入力手
    段と、 前記入力手段から入力する前記音信号に関して所定区間
    毎に前記音信号のピッチをそれぞれ検出し、検出したピ
    ッチのデータ列を生成するピッチ検出手段と、 前記ピッチデータ列における相前後するピッチ同士の差
    分を、音程のセント値に基づく相対値にそれぞれ変換す
    る相対値変換手段と、 前記相対値変換手段によって得られた相対値の動的平均
    を基にして、動的基準値を算出する動的基準算出手段
    と、 前記相対値変換手段によって得られた相対値と前記動的
    基準算出手段によって算出された動的基準値とを比較し
    て、音信号分析用の定常区間を検出する定常区間検出手
    段とを具えたことを特徴とする音信号分析装置。
  11. 【請求項11】 前記検出された音信号分析用の前記第
    2の区間又は前記定常区間において、前記音信号のピッ
    チを分析し、該音信号のノートを決定するノート分析手
    段を更に具えたことを特徴とする請求項1,2,8,9
    及び10のいずれか1つに記載の音信号分析装置。
  12. 【請求項12】 任意の音信号を入力するための入力手
    段と、 前記入力手段から入力する前記音信号に関して所定区間
    毎に前記音信号のピッチをそれぞれ検出し、検出したピ
    ッチのデータ列を生成するピッチ検出手段と、 前記ピッチデータ列における各ピッチに対応する周波数
    に応じて通過帯域が時変動制御されるフィルタ処理を、
    前記入力された音信号に施す第1フィルタ処理手段と、 前記第1フィルタ処理手段から出力される前記音信号に
    関して周期基準となる候補位置の複数を検出する周期基
    準位置検出手段と、 前記ピッチデータ列における各ピッチに対応する周波数
    及びその所定整数倍の周波数に応じて通過帯域が時変動
    制御されるフィルタ処理を前記入力された前記音信号に
    施す第2フィルタ処理手段と、 検出された前記候補位置に対応して前記第2フィルタ処
    理手段から出力される前記音信号を区切ることにより得
    られる複数の区間の波形の一致度を判定し、一致度の高
    い区間を同波形区間として検出する区間検出手段と、 前記区間検出手段によって検出された同波形区間に基づ
    いて前記音信号のピッチを分析するピッチ分析手段とを
    具えたことを特徴とする音信号分析装置。
  13. 【請求項13】 任意の音信号の連続するサンプル振幅
    値を提供する提供手段と、 前記提供された連続するサンプル振幅値に対して所定の
    特性の第1のフィルタ処理を施す第1フィルタ処理手段
    と、 前記第1のフィルタ処理が施された前記連続するサンプ
    ル振幅値に基づいて第2のフィルタ処理用の制御周波数
    データを作成する制御データ作成手段と、 前記作成された制御周波数データに基づく特性の第2の
    フィルタ処理を、前記提供手段によって提供される前記
    連続するサンプル振幅値に対して施す第2フィルタ処理
    手段と、 前記第2のフィルタ処理が施された前記連続するサンプ
    ル振幅値に基づいて前記音信号のピッチを検出するピッ
    チ検出手段とを具えたことを特徴とする音信号分析装
    置。
  14. 【請求項14】 任意の音信号を入力するための入力手
    段と、 前記入力手段から入力する前記音信号に関して所定区間
    毎に前記音信号のピッチをそれぞれ検出し、検出したピ
    ッチのデータ列を生成するピッチ検出手段と、 前記ピッチデータ列における相前後するピッチ同士の差
    分を、音程のセント値に基づく相対値にそれぞれ変換す
    る相対値変換手段と、 前記相対値変換手段によって得られた相対値の動的平均
    を基にして、動的基準値を算出する動的基準算出手段
    と、 前記相対値変換手段によって得られた相対値と前記動的
    基準算出手段によって算出された動的基準値とを比較し
    て、ピッチ分析用の定常区間を検出する定常区間決定手
    段と、 前記定常区間内における前記相対値の静的平均に基づ
    き、静的基準値を算出する静的基準算出手段と、 前記静的基準値と前記定常区間内における前記相対値と
    を比較して、前記定常区間の代表周波数を算出するため
    の音高決定区間を検出する音高決定区間検出手段と、 前記検出された音高決定区間内における前記ピッチデー
    タ列に基づいて前記定常区間の代表周波数を算出する周
    波数算出手段とを具えたことを特徴とする音信号分析装
    置。
  15. 【請求項15】 1又は複数の音符の時系列的連なりか
    らなる任意の音信号を入力するための入力手段と、 前記入力された音信号の中から1つ1つの音符に相当す
    ると推量される区間をそれぞれ検出する区間検出手段
    と、 前記検出された区間を、その時系列に従って、所定の音
    符長に対応する時間間隔で分割されたグリッド上にそれ
    ぞれ配置し、各定常区間の開始又は終了端部のうち所定
    の一方の端部に最も近い1つのグリッド位置を各定常区
    間に対してそれぞれ割り当て、その結果同じグリッド位
    置に複数の定常区間が割り当てられた場合には最も時間
    長の長い1つの定常区間を有効な音符として選択する手
    段とを具備した音信号分析装置。
  16. 【請求項16】 分析すべき音信号を入力するステッ
    プと、 入力された音信号のサンプル振幅値の所定サンプル数に
    わたる平均値をそれぞれ求め、その結果を時系列的な平
    均レベル情報として出力するステップと、 前記平均レベル情報に基づいて前記音信号の中から音楽
    的な音が存在すると思われる第1の区間を検出するステ
    ップと、 前記第1の区間内における前記音信号のサンプル振幅値
    に基づいて音信号分析用の第2の区間を、該第1の区間
    の中から検出するステップとを具備する音信号を分析す
    るための方法。
  17. 【請求項17】 分析すべき音信号を入力するステップ
    と、 入力された音信号のサンプル振幅値の所定サンプル数毎
    にその最大値を検出し、検出された最大値を補間するこ
    とによって補助波形を作成するステップと、 前記作成された補助波形に基づいて前記音信号の中から
    音楽的な音が存在すると思われる第1の区間を検出する
    ステップと、 前記第1の区間内における前記音信号のサンプル振幅値
    に基づいて音信号分析用の第2の区間を、該第1の区間
    の中から検出するステップとを具備する音信号を分析す
    るための方法。
  18. 【請求項18】 分析すべき音信号を入力するステップ
    と、 前記入力された音信号に対して所定の周波数特性のフィ
    ルタ処理を施すステップと、 前記フィルタ処理後の音信号における連続するサンプル
    振幅値に基づいて各隣接する波形同士の一致度合いを分
    析するステップと、 前記ステップにより所定の条件に従う範囲内で一致して
    いると分析された連続する複数の波形からなる区間を同
    波形区間として検出するステップと、 前記検出された同波形区間における前記音信号のピッチ
    を検出するステップとを具備する音信号を分析するため
    の方法。
  19. 【請求項19】 分析すべき音信号を入力するステップ
    と、 前記入力された音信号に関して所定区間毎に前記音信号
    のピッチをそれぞれ検出し、検出したピッチのデータ列
    を生成するステップと、 前記ピッチデータ列における各ピッチに対応する周波数
    に応じて通過帯域が可変制御されるフィルタ処理を、前
    記入力された音信号に施すステップと、 前記フィルタ処理された音信号のサンプル振幅値に基づ
    いて該音信号のより正確なピッチを検出するステップと
    を具備する音信号を分析するための方法。
  20. 【請求項20】 分析すべき音信号を入力するステップ
    と、 前記入力された音信号に関して所定区間毎に前記音信号
    のピッチをそれぞれ検出し、検出したピッチのデータ列
    を生成するステップと、 前記ピッチデータ列における各ピッチに対応する周波数
    に応じて通過帯域が可変制御されるフィルタ処理を、前
    記入力された音信号に施すステップと、 前記フィルタ処理後の音信号における連続するサンプル
    振幅値に基づいて各隣接する波形同士の一致度合いを分
    析するステップと、 前記ステップにより所定の条件に従う範囲内で一致して
    いると分析された連続する複数の波形からなる区間を同
    波形区間として検出するステップと、 前記検出された同波形区間における前記音信号のピッチ
    を検出するステップとを具備する音信号を分析するため
    の方法。
  21. 【請求項21】 分析すべき音信号を入力するステップ
    と、 前記入力された音信号に関して所定区間毎に前記音信号
    のピッチをそれぞれ検出し、検出したピッチのデータ列
    を生成するステップと、 前記ピッチデータ列における各ピッチに対応する周波数
    に応じて通過帯域が時変動制御されるフィルタ処理を、
    前記入力された音信号に施すステップと、 前記フィルタ処理後の音信号における連続するサンプル
    振幅値に基づいて各隣接する波形同士の一致度合いを分
    析するステップと、 前記ステップにより所定の条件に従う範囲内で一致して
    いると分析された連続する複数の波形からなる第1の区
    間を検出するステップと、 前記検出された第1の区間内の一致度のより高い波形を
    基準にその前後における複数の各波形との間で一致度合
    いを判定し、一致度のより高い第2の区間を検出するス
    テップと、 前記検出された第2の区間における前記音信号のピッチ
    を検出するステップとを具備する音信号を分析するため
    の方法。
  22. 【請求項22】 分析すべき音信号を入力するステップ
    と、 前記入力された音信号に所定の周波数帯域のフィルタ処
    理を施すステップと、 前記フィルタリング処理後の前記音信号のピーク位置を
    それぞれ検出するステップと、 検出された任意の2つの前記ピーク位置間で前記音信号
    の波形を区切ることにより得られる多様な区間のうち、
    前記フィルタの通過帯域による制限に見合った時間長の
    区間について、隣合う2つの区間の対を可能な数だけ選
    定し、選定された各対における2区間の波形の一致度を
    それぞれ判定し、その一致度の最も高い1つの対を同波
    形区間として検出するステップと、 前記検出された同波形区間に基づいて音信号分析用の定
    常区間を検出するステップとを具備する音信号を分析す
    るための方法。
  23. 【請求項23】 分析すべき音信号を入力するステップ
    と、 前記入力された音信号のピーク位置をそれぞれ検出する
    ステップと、 任意の2つのピーク位置間で前記音信号の波形を区切る
    ことにより得られる多様な区間のうち、隣合う任意の2
    つの区間の波形の一致度をそれぞれ判定し、その一致度
    の高い区間同士を接続して第1の同波形区間群を検出す
    るステップと、 前記第1の同波形区間群の中の開始区間と最終区間を比
    較の対象区間として、前記第1の同波形区間群の前後に
    隣接する区間のそれぞれについて波形の一致度を算出
    し、算出された一致度に基づいて前記第1の同波形区間
    群をその前後に拡張し、これを第2の同波形区間群とし
    て検出するステップと、 前記検出された第2の同波形区間群に基づいて音信号分
    析用の定常区間を検出するステップとを具備する音信号
    を分析するための方法。
  24. 【請求項24】 分析すべき音信号を入力するステップ
    と、 前記入力された音信号に関して所定区間毎に前記音信号
    のピッチをそれぞれ検出し、検出したピッチのデータ列
    を生成するステップと、 前記ピッチデータ列における各ピッチに対応する周波数
    に応じて通過帯域が時変動制御される第1のフィルタ処
    理を、前記入力された音信号に施すステップと、 前記第1のフィルタ処理の施された音信号に関して周期
    基準となる候補位置の複数を検出するステップと、 前記ピッチデータ列における各ピッチに対応する周波数
    及びその所定整数倍の周波数に応じて通過帯域が時変動
    制御される第2のフィルタ処理を前記入力された前記音
    信号に施すステップと、 前記検出された各候補位置に対応して前記第2のフィル
    タ処理の施された音信号を区切ることにより得られる複
    数の区間の波形の一致度を判定し、一致度の高い区間を
    同波形区間として検出するステップと、 前記検出された同波形区間に基づいて前記音信号のピッ
    チを分析するステップとを具備する音信号を分析するた
    めの方法。
  25. 【請求項25】 分析すべき音信号を入力するステップ
    と、 前記入力された音信号に関して所定区間毎に前記音信号
    のピッチをそれぞれ検出し、検出したピッチのデータ列
    を生成するステップと、 前記ピッチデータ列における相前後するピッチ同士の差
    分を、音程のセント値に基づく相対値にそれぞれ変換す
    るステップと、 前記変換された相対値の動的平均を基にして、動的基準
    値を算出するステップと、 前記変換された相対値と前記動的基準値とを比較して、
    音信号分析用の定常区間を検出するステップとを具備す
    る音信号を分析するための方法。
  26. 【請求項26】 任意の音信号の連続するサンプル振幅
    値を提供するステップと、 前記提供された連続するサンプル振幅値に対して所定の
    特性の第1のフィルタ処理を施すステップと、 前記第1のフィルタ処理が施された前記連続するサンプ
    ル振幅値に基づいて第2のフィルタ処理用の制御周波数
    データを作成するステップと、 前記作成された制御周波数データに基づく特性の第2の
    フィルタ処理を、前記提供された前記連続するサンプル
    振幅値に対して施すステップと、 前記第2のフィルタ処理が施された前記連続するサンプ
    ル振幅値に基づいて前記音信号のピッチを検出するステ
    ップとを具備する音信号を分析するための方法。
  27. 【請求項27】 分析すべき音信号を入力するステップ
    と、 前記入力された音信号に関して所定区間毎に前記音信号
    のピッチをそれぞれ検出し、検出したピッチのデータ列
    を生成するステップと、 前記ピッチデータ列における相前後するピッチ同士の差
    分を、音程のセント値に基づく相対値にそれぞれ変換す
    るステップと、 前記変換された相対値の動的平均を基にして、動的基準
    値を算出するステップと、 前記変換された相対値と前記動的基準値とを比較して、
    ピッチ分析用の安定している定常区間を検出するステッ
    プと、 前記定常区間内における前記相対値の静的平均に基づ
    き、静的基準値を算出するステップと、 前記静的基準値と前記定常区間内における前記相対値と
    を比較して、前記定常区間の代表周波数を算出するため
    の音高決定区間を検出するステップと、 前記検出された音高決定区間内における前記ピッチデー
    タ列に基づいて前記定常区間の代表周波数を算出するス
    テップとを具備する音信号を分析するための方法。
  28. 【請求項28】 機械によって読み取り可能な記録媒体
    であって、コンピュータによって実行される音信号を分
    析するためのプログラムについての命令群をその記憶内
    容として有しており、前記音信号を分析するためのプロ
    グラムは、 分析すべき音信号を入力するステップと、 入力された音信号のサンプル振幅値の所定サンプル数に
    わたる平均値をそれぞれ求め、その結果を時系列的な平
    均レベル情報として出力するステップと、 前記平均レベル情報に基づいて前記音信号の中から音楽
    的な音が存在すると思われる第1の区間を検出するステ
    ップと、 前記第1の区間内における前記音信号のサンプル振幅値
    に基づいて音信号分析用の第2の区間を、該第1の区間
    の中から検出するステップとを含んでいることを特徴と
    する記録媒体。
  29. 【請求項29】 機械によって読み取り可能な記録媒体
    であって、コンピュータによって実行される音信号を分
    析するためのプログラムについての命令群をその記憶内
    容として有しており、前記音信号を分析するためのプロ
    グラムは、 分析すべき音信号を入力するステップと、 入力された音信号のサンプル振幅値の所定サンプル数毎
    にその最大値を検出し、検出された最大値を補間するこ
    とによって補助波形を作成するステップと、 前記作成された補助波形に基づいて前記音信号の中から
    音楽的な音が存在すると思われる第1の区間を検出する
    ステップと、 前記第1の区間内における前記音信号のサンプル振幅値
    に基づいて音信号分析用の第2の区間を、該第1の区間
    の中から検出するステップとを含んでいることを特徴と
    する記録媒体。
  30. 【請求項30】 機械によって読み取り可能な記録媒体
    であって、コンピュータによって実行される音信号を分
    析するためのプログラムについての命令群をその記憶内
    容として有しており、前記音信号を分析するためのプロ
    グラムは、 分析すべき音信号を入力するステップと、 前記入力された音信号に対して所定の周波数特性のフィ
    ルタ処理を施すステップと、 前記フィルタ処理後の音信号における連続するサンプル
    振幅値に基づいて各隣接する波形同士の一致度合いを分
    析するステップと、 前記ステップにより所定の条件に従う範囲内で一致して
    いると分析された連続する複数の波形からなる区間を同
    波形区間として検出するステップと、 前記検出された同波形区間における前記音信号のピッチ
    を検出するステップとを含んでいることを特徴とする記
    録媒体。
  31. 【請求項31】 機械によって読み取り可能な記録媒体
    であって、コンピュータによって実行される音信号を分
    析するためのプログラムについての命令群をその記憶内
    容として有しており、前記音信号を分析するためのプロ
    グラムは、 分析すべき音信号を入力するステップと、 前記入力された音信号に関して所定区間毎に前記音信号
    のピッチをそれぞれ検出し、検出したピッチのデータ列
    を生成するステップと、 前記ピッチデータ列における各ピッチに対応する周波数
    に応じて通過帯域が可変制御されるフィルタ処理を、前
    記入力された音信号に施すステップと、 前記フィルタ処理された音信号のサンプル振幅値に基づ
    いて該音信号のより正確なピッチを検出するステップと
    を含んでいることを特徴とする記録媒体。
  32. 【請求項32】 機械によって読み取り可能な記録媒体
    であって、コンピュータによって実行される音信号を分
    析するためのプログラムについての命令群をその記憶内
    容として有しており、前記音信号を分析するためのプロ
    グラムは、 分析すべき音信号を入力するステップと、 前記入力された音信号に関して所定区間毎に前記音信号
    のピッチをそれぞれ検出し、検出したピッチのデータ列
    を生成するステップと、 前記ピッチデータ列における各ピッチに対応する周波数
    に応じて通過帯域が可変制御されるフィルタ処理を、前
    記入力された音信号に施すステップと、 前記フィルタ処理後の音信号における連続するサンプル
    振幅値に基づいて各隣接する波形同士の一致度合いを分
    析するステップと、 前記ステップにより所定の条件に従う範囲内で一致して
    いると分析された連続する複数の波形からなる区間を同
    波形区間として検出するステップと、 前記検出された同波形区間における前記音信号のピッチ
    を検出するステップとを含んでいることを特徴とする記
    録媒体。
  33. 【請求項33】 機械によって読み取り可能な記録媒体
    であって、コンピュータによって実行される音信号を分
    析するためのプログラムについての命令群をその記憶内
    容として有しており、前記音信号を分析するためのプロ
    グラムは、 分析すべき音信号を入力するステップと、 前記入力された音信号に関して所定区間毎に前記音信号
    のピッチをそれぞれ検出し、検出したピッチのデータ列
    を生成するステップと、 前記ピッチデータ列における各ピッチに対応する周波数
    に応じて通過帯域が時変動制御されるフィルタ処理を、
    前記入力された音信号に施すステップと、 前記フィルタ処理後の音信号における連続するサンプル
    振幅値に基づいて各隣接する波形同士の一致度合いを分
    析するステップと、 前記ステップにより所定の条件に従う範囲内で一致して
    いると分析された連続する複数の波形からなる第1の区
    間を検出するステップと、 前記検出された第1の区間内の一致度のより高い波形を
    基準にその前後における複数の各波形との間で一致度合
    いを判定し、一致度のより高い第2の区間を検出するス
    テップと、 前記検出された第2の区間における前記音信号のピッチ
    を検出するステップとを含んでいることを特徴とする記
    録媒体。
  34. 【請求項34】 機械によって読み取り可能な記録媒体
    であって、コンピュータによって実行される音信号を分
    析するためのプログラムについての命令群をその記憶内
    容として有しており、前記音信号を分析するためのプロ
    グラムは、 分析すべき音信号を入力するステップと、 前記入力された音信号に所定の周波数帯域のフィルタ処
    理を施すステップと、 前記フィルタリング処理後の前記音信号のピーク位置を
    それぞれ検出するステップと、 検出された任意の2つの前記ピーク位置間で前記音信号
    の波形を区切ることにより得られる多様な区間のうち、
    前記フィルタの通過帯域による制限に見合った時間長の
    区間について、隣合う2つの区間の対を可能な数だけ選
    定し、選定された各対における2区間の波形の一致度を
    それぞれ判定し、その一致度の最も高い1つの対を同波
    形区間として検出するステップと、 前記検出された同波形区間に基づいて音信号分析用の定
    常区間を検出するステップとを含んでいることを特徴と
    する記録媒体。
  35. 【請求項35】 機械によって読み取り可能な記録媒体
    であって、コンピュータによって実行される音信号を分
    析するためのプログラムについての命令群をその記憶内
    容として有しており、前記音信号を分析するためのプロ
    グラムは、 分析すべき音信号を入力するステップと、 前記入力された音信号のピーク位置をそれぞれ検出する
    ステップと、 任意の2つのピーク位置間で前記音信号の波形を区切る
    ことにより得られる多様な区間のうち、隣合う任意の2
    つの区間の波形の一致度をそれぞれ判定し、その一致度
    の高い区間同士を接続して第1の同波形区間群を検出す
    るステップと、 前記第1の同波形区間群の中の開始区間と最終区間を比
    較の対象区間として、前記第1の同波形区間群の前後に
    隣接する区間のそれぞれについて波形の一致度を算出
    し、算出された一致度に基づいて前記第1の同波形区間
    群をその前後に拡張し、これを第2の同波形区間群とし
    て検出するステップと、 前記検出された第2の同波形区間群に基づいて音信号分
    析用の定常区間を検出するステップとを含んでいること
    を特徴とする記録媒体。
  36. 【請求項36】 機械によって読み取り可能な記録媒体
    であって、コンピュータによって実行される音信号を分
    析するためのプログラムについての命令群をその記憶内
    容として有しており、前記音信号を分析するためのプロ
    グラムは、 分析すべき音信号を入力するステップと、 前記入力された音信号に関して所定区間毎に前記音信号
    のピッチをそれぞれ検出し、検出したピッチのデータ列
    を生成するステップと、 前記ピッチデータ列における各ピッチに対応する周波数
    に応じて通過帯域が時変動制御される第1のフィルタ処
    理を、前記入力された音信号に施すステップと、 前記第1のフィルタ処理の施された音信号に関して周期
    基準となる候補位置の複数を検出するステップと、 前記ピッチデータ列における各ピッチに対応する周波数
    及びその所定整数倍の周波数に応じて通過帯域が時変動
    制御される第2のフィルタ処理を前記入力された前記音
    信号に施すステップと、 前記検出された各候補位置に対応して前記第2のフィル
    タ処理の施された音信号を区切ることにより得られる複
    数の区間の波形の一致度を判定し、一致度の高い区間を
    同波形区間として検出するステップと、 前記検出された同波形区間に基づいて前記音信号のピッ
    チを分析するステップとを含んでいることを特徴とする
    記録媒体。
  37. 【請求項37】 機械によって読み取り可能な記録媒体
    であって、コンピュータによって実行される音信号を分
    析するためのプログラムについての命令群をその記憶内
    容として有しており、前記音信号を分析するためのプロ
    グラムは、 分析すべき音信号を入力するステップと、 前記入力された音信号に関して所定区間毎に前記音信号
    のピッチをそれぞれ検出し、検出したピッチのデータ列
    を生成するステップと、 前記ピッチデータ列における相前後するピッチ同士の差
    分を、音程のセント値に基づく相対値にそれぞれ変換す
    るステップと、 前記変換された相対値の動的平均を基にして、動的基準
    値を算出するステップと、 前記変換された相対値と前記動的基準値とを比較して、
    音信号分析用の定常区間を検出するステップとを含んで
    いることを特徴とする記録媒体。
  38. 【請求項38】 機械によって読み取り可能な記録媒体
    であって、コンピュータによって実行される音信号を分
    析するためのプログラムについての命令群をその記憶内
    容として有しており、前記音信号を分析するためのプロ
    グラムは、 任意の音信号の連続するサンプル振幅値を提供するステ
    ップと、 前記提供された連続するサンプル振幅値に対して所定の
    特性の第1のフィルタ処理を施すステップと、 前記第1のフィルタ処理が施された前記連続するサンプ
    ル振幅値に基づいて第2のフィルタ処理用の制御周波数
    データを作成するステップと、 前記作成された制御周波数データに基づく特性の第2の
    フィルタ処理を、前記提供された前記連続するサンプル
    振幅値に対して施すステップと、 前記第2のフィルタ処理が施された前記連続するサンプ
    ル振幅値に基づいて前記音信号のピッチを検出するステ
    ップとを含んでいることを特徴とする記録媒体。
  39. 【請求項39】 機械によって読み取り可能な記録媒体
    であって、コンピュータによって実行される音信号を分
    析するためのプログラムについての命令群をその記憶内
    容として有しており、前記音信号を分析するためのプロ
    グラムは、 分析すべき音信号を入力するステップと、 前記入力された音信号に関して所定区間毎に前記音信号
    のピッチをそれぞれ検出し、検出したピッチのデータ列
    を生成するステップと、 前記ピッチデータ列における相前後するピッチ同士の差
    分を、音程のセント値に基づく相対値にそれぞれ変換す
    るステップと、 前記変換された相対値の動的平均を基にして、動的基準
    値を算出するステップと、 前記変換された相対値と前記動的基準値とを比較して、
    ピッチ分析用の安定している定常区間を検出するステッ
    プと、 前記定常区間内における前記相対値の静的平均に基づ
    き、静的基準値を算出するステップと、 前記静的基準値と前記定常区間内における前記相対値と
    を比較して、前記定常区間の代表周波数を算出するため
    の音高決定区間を検出するステップと、 前記検出された音高決定区間内における前記ピッチデー
    タ列に基づいて前記定常区間の代表周波数を算出するス
    テップとを含んでいることを特徴とする記録媒体。
JP33632897A 1996-11-20 1997-11-20 音信号分析装置及び方法 Expired - Fee Related JP3669129B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33632897A JP3669129B2 (ja) 1996-11-20 1997-11-20 音信号分析装置及び方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP32477596 1996-11-20
JP8-324775 1996-11-20
JP33632897A JP3669129B2 (ja) 1996-11-20 1997-11-20 音信号分析装置及び方法

Related Child Applications (4)

Application Number Title Priority Date Filing Date
JP2004217684A Division JP3888370B2 (ja) 1996-11-20 2004-07-26 音信号分析装置及び方法
JP2004217686A Division JP3888372B2 (ja) 1996-11-20 2004-07-26 音信号分析装置及び方法
JP2004217683A Division JP4134961B2 (ja) 1996-11-20 2004-07-26 音信号分析装置及び方法
JP2004217685A Division JP3888371B2 (ja) 1996-11-20 2004-07-26 音信号分析装置及び方法

Publications (2)

Publication Number Publication Date
JPH10207455A true JPH10207455A (ja) 1998-08-07
JP3669129B2 JP3669129B2 (ja) 2005-07-06

Family

ID=26571605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33632897A Expired - Fee Related JP3669129B2 (ja) 1996-11-20 1997-11-20 音信号分析装置及び方法

Country Status (1)

Country Link
JP (1) JP3669129B2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002049001A1 (en) * 2000-12-14 2002-06-20 Sony Corporation Information extracting device
WO2003005342A1 (en) * 2001-07-02 2003-01-16 Kabushiki Kaisha Kenwood Signal coupling method and apparatus
JP2005346078A (ja) * 2004-06-04 2005-12-15 Honda Research Inst Europe Gmbh 2つの調波信号の共通源の判定方法
JP2006030610A (ja) * 2004-07-16 2006-02-02 Yamaha Corp 音声合成用スクリプト生成装置、音声合成装置、音声合成用スクリプト生成プログラム及び音声合成プログラム
WO2006106946A1 (ja) * 2005-04-01 2006-10-12 National Institute Of Advanced Industrial Science And Technology 音高推定方法及び装置並びに音高推定用プログラム
JP2007064819A (ja) * 2005-08-31 2007-03-15 Ho Jinyama 信号検査方法および信号検査モジュール
JP2007133090A (ja) * 2005-11-09 2007-05-31 Yamaha Corp 音声特徴量算出装置
WO2007074755A1 (ja) * 2005-12-27 2007-07-05 Mitsubishi Electric Corporation 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置
JP2011102978A (ja) * 2009-10-15 2011-05-26 Yamaha Corp 楽音信号処理装置及びプログラム
JP2012013915A (ja) * 2010-06-30 2012-01-19 Humminglish Academy Llc 学習用教材および教材情報出力装置
US8682132B2 (en) 2006-05-11 2014-03-25 Mitsubishi Electric Corporation Method and device for detecting music segment, and method and device for recording data
JP2020064177A (ja) * 2018-10-17 2020-04-23 株式会社Nttドコモ 情報処理装置及びプログラム

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6083983A (ja) * 1983-10-15 1985-05-13 日本ビクター株式会社 音符表示装置
JPS60262197A (ja) * 1984-06-08 1985-12-25 シャープ株式会社 周期的信号の基本周波数および位相検出回路
JPS61123897A (ja) * 1984-11-20 1986-06-11 ブラザー工業株式会社 音声の始端決定装置
JPH01219636A (ja) * 1988-02-29 1989-09-01 Nec Home Electron Ltd 自動採譜方法及び装置
JPH01219635A (ja) * 1988-02-29 1989-09-01 Nec Home Electron Ltd 自動採譜方法及び装置
JPH01219627A (ja) * 1988-02-29 1989-09-01 Nec Home Electron Ltd 自動採譜方法及び装置
JPH0535296A (ja) * 1991-07-26 1993-02-12 Casio Comput Co Ltd ピツチ抽出装置及びそれを用いた電子楽器
JPH05241597A (ja) * 1992-02-27 1993-09-21 Kawai Musical Instr Mfg Co Ltd ピッチ周期抽出方法
JPH06186973A (ja) * 1992-12-21 1994-07-08 Yamaha Corp ピッチ検出装置
JPH0728486A (ja) * 1993-07-13 1995-01-31 Nec Corp 音声圧縮装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6083983A (ja) * 1983-10-15 1985-05-13 日本ビクター株式会社 音符表示装置
JPS60262197A (ja) * 1984-06-08 1985-12-25 シャープ株式会社 周期的信号の基本周波数および位相検出回路
JPS61123897A (ja) * 1984-11-20 1986-06-11 ブラザー工業株式会社 音声の始端決定装置
JPH01219636A (ja) * 1988-02-29 1989-09-01 Nec Home Electron Ltd 自動採譜方法及び装置
JPH01219635A (ja) * 1988-02-29 1989-09-01 Nec Home Electron Ltd 自動採譜方法及び装置
JPH01219627A (ja) * 1988-02-29 1989-09-01 Nec Home Electron Ltd 自動採譜方法及び装置
JPH0535296A (ja) * 1991-07-26 1993-02-12 Casio Comput Co Ltd ピツチ抽出装置及びそれを用いた電子楽器
JPH05241597A (ja) * 1992-02-27 1993-09-21 Kawai Musical Instr Mfg Co Ltd ピッチ周期抽出方法
JPH06186973A (ja) * 1992-12-21 1994-07-08 Yamaha Corp ピッチ検出装置
JPH0728486A (ja) * 1993-07-13 1995-01-31 Nec Corp 音声圧縮装置

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002049001A1 (en) * 2000-12-14 2002-06-20 Sony Corporation Information extracting device
WO2003005342A1 (en) * 2001-07-02 2003-01-16 Kabushiki Kaisha Kenwood Signal coupling method and apparatus
US7739112B2 (en) 2001-07-02 2010-06-15 Kabushiki Kaisha Kenwood Signal coupling method and apparatus
JP2005346078A (ja) * 2004-06-04 2005-12-15 Honda Research Inst Europe Gmbh 2つの調波信号の共通源の判定方法
JP2006030610A (ja) * 2004-07-16 2006-02-02 Yamaha Corp 音声合成用スクリプト生成装置、音声合成装置、音声合成用スクリプト生成プログラム及び音声合成プログラム
GB2440079A (en) * 2005-04-01 2008-01-16 Nat Inst Of Advanced Ind Scien Pitch estimating method and device and pitch estimating program
GB2440079B (en) * 2005-04-01 2009-07-29 Nat Inst Of Advanced Ind Scien Pitch estimating method and device and pitch estimating program
WO2006106946A1 (ja) * 2005-04-01 2006-10-12 National Institute Of Advanced Industrial Science And Technology 音高推定方法及び装置並びに音高推定用プログラム
US7885808B2 (en) 2005-04-01 2011-02-08 National Institute Of Advanced Industrial Science And Technology Pitch-estimation method and system, and pitch-estimation program
JP2007064819A (ja) * 2005-08-31 2007-03-15 Ho Jinyama 信号検査方法および信号検査モジュール
JP2007133090A (ja) * 2005-11-09 2007-05-31 Yamaha Corp 音声特徴量算出装置
WO2007074755A1 (ja) * 2005-12-27 2007-07-05 Mitsubishi Electric Corporation 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置
KR100962803B1 (ko) 2005-12-27 2010-06-10 미쓰비시덴키 가부시키가이샤 악곡 구간 검출 방법 및 그 장치, 및 데이터 기록 방법 및그 장치
US8855796B2 (en) 2005-12-27 2014-10-07 Mitsubishi Electric Corporation Method and device for detecting music segment, and method and device for recording data
US8682132B2 (en) 2006-05-11 2014-03-25 Mitsubishi Electric Corporation Method and device for detecting music segment, and method and device for recording data
JP2011102978A (ja) * 2009-10-15 2011-05-26 Yamaha Corp 楽音信号処理装置及びプログラム
JP2012013915A (ja) * 2010-06-30 2012-01-19 Humminglish Academy Llc 学習用教材および教材情報出力装置
JP2020064177A (ja) * 2018-10-17 2020-04-23 株式会社Nttドコモ 情報処理装置及びプログラム

Also Published As

Publication number Publication date
JP3669129B2 (ja) 2005-07-06

Similar Documents

Publication Publication Date Title
JP3812328B2 (ja) 自動伴奏パターン発生装置及び方法
JP5113307B2 (ja) 複合波形の倍音内容を変える方法
US8735709B2 (en) Generation of harmony tone
WO2002047064A1 (en) Method for analyzing music using sounds of instruments
JPH08500452A (ja) 音声和音発生方法及び装置
JP2002529773A5 (ja)
US6525255B1 (en) Sound signal analyzing device
US11417312B2 (en) Keyboard instrument and method performed by computer of keyboard instrument
WO2017082061A1 (ja) 調律推定装置、評価装置、およびデータ処理装置
JP3669129B2 (ja) 音信号分析装置及び方法
JP2806351B2 (ja) 演奏情報分析装置及びそれを用いた自動編曲装置
JP5229998B2 (ja) コード名検出装置及びコード名検出用プログラム
Lerch Software-based extraction of objective parameters from music performances
JP3279204B2 (ja) 音信号分析装置及び演奏情報発生装置
JP4134961B2 (ja) 音信号分析装置及び方法
JP2017173655A (ja) 音評価装置および音評価方法
JP3888371B2 (ja) 音信号分析装置及び方法
JP3888372B2 (ja) 音信号分析装置及び方法
JP3888370B2 (ja) 音信号分析装置及び方法
JP5618743B2 (ja) 歌唱音声評価装置
JP5585320B2 (ja) 歌唱音声評価装置
JP5776205B2 (ja) 音信号生成装置及びプログラム
JPH01288900A (ja) 歌声伴奏装置
JP4695781B2 (ja) 音響信号の符号化方法
JP4480650B2 (ja) ピッチ制御装置及びピッチ制御プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050404

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100422

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110422

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130422

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140422

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees