JPH103549A - 発音体識別支援装置 - Google Patents

発音体識別支援装置

Info

Publication number
JPH103549A
JPH103549A JP8155203A JP15520396A JPH103549A JP H103549 A JPH103549 A JP H103549A JP 8155203 A JP8155203 A JP 8155203A JP 15520396 A JP15520396 A JP 15520396A JP H103549 A JPH103549 A JP H103549A
Authority
JP
Japan
Prior art keywords
frequency
coordinate
ratio
coordinate system
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8155203A
Other languages
English (en)
Inventor
Nobuo Makimoto
伸生 牧本
Yasushi Iwamura
康史 岩村
Akira Maeda
章 前田
Hiroshi Takahashi
廣 高橋
Masaharu Yoshida
正治 吉田
Kazuhiko Hino
一彦 日野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8155203A priority Critical patent/JPH103549A/ja
Publication of JPH103549A publication Critical patent/JPH103549A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Image Generation (AREA)

Abstract

(57)【要約】 本発明は発音体識別の重要な一過程である倍音の検出・
確認を支援するためのオペレータインタフェースを提供
する。これにより発音体識別システムのオペレータは倍
音の確認を正確かつ迅速に行なうことができ、その結果
更に発音体識別をより正確かつ迅速に行なうことができ
る。 【課題】倍音の存在等を確認するためのオペレータイン
タフェースを提供し、それにより正確かつ迅速な発音体
識別に寄与する。 【解決手段】本発明による音源識別支援装置は被識別デ
ータ表示用ウインドウと入力装置からなる。倍音系列を
指定するデータを入力装置が取得すると、それに応じた
パターンがウインドウ上に描画される。入力装置として
ポインティングデバイスを用いれば、半自動的に随時デ
ータ入力を行なうことができ、パターンを自由に動かせ
る。このような構成によって、従来と比較して倍音の確
認を容易に行なえるようになる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はパターン認識の分野
に属する。
【0002】
【従来の技術】まず発音体識別の方法について簡単に説
明する。被識別データとしては、観測された音の周波数
成分(スペクトル)を時間ごとに濃淡表示した画像(図
2)がよく用いられる。図2の横軸は周波数、縦軸は時
刻、紙面と垂直方向の軸は濃淡表示されたスペクトルで
ある。この画像の座標系としては、ウインドウ端からの
ドット数を表すx−y座標系と本来の周波数−時刻を表
すf−t座標系の2通りがある。
【0003】一つの発音体が発する音は時間的にほぼ一
定もしくは連続的に変化する周波数成分とその整数倍の
周波数成分(倍音)の系列からなる。したがって、この
画像上には、倍音系列にあたる位置にほぼ縦の線状のパ
ターンが現れる。一方、発音体が発する音の周波数成分
は、発音体の種類ごとに異なった特徴(例えば100H
zの位置に線状のパターンがある、3倍音が比較的強
い、など)を持つ。したがって(1)線状のパターンを
画像から検出、(2)線状のパターンを調べて既知の発
音体のパターンと照合、を行えば、発音体を識別するこ
とができる。これらを行なうための一つの重要な操作と
して、互いに倍音の関係にあるパターンの系列を見つけ
ることがある。このことができれば、倍音同士で互いに
足りない部分を補間することにより線状の各パターンを
より正確に検出でき、また特定の倍音の存在を確認する
ことにより発音体の種類を限定できる場合がある。
【0004】水中音響情報処理の分野における従来の典
型的な発音体識別システムには、上記のパターンの系列
を見つけることを支援するためのインタフェースが備わ
っている(図3)。以下その例を説明する。従来システ
ムはディスプレイ、トラックボール、タッチパネルから
なる。その操作手順は例えば次の通りである。
【0005】1.タッチパネル上の「倍音確認」用ボタ
ンを押し、操作開始。
【0006】2.トラックボールのポインタを画像上の
一つのパターンに合わせる。
【0007】3.タッチパネル上の「周波数決定」用ボ
タンを押し、周波数f1決定。
【0008】4.トラックボールのポインタを画像上の
別のパターンに合わせる。
【0009】5.タッチパネル上の「周波数決定」用ボ
タンを押し、周波数f2決定。
【0010】6.周波数 m(f2−f1)+f1(m
=0,±1,…)にあたる位置に縦の直線を描画。
【0011】7.「倍音確認」用ボタンが押された場
合、操作終了。
【0012】「倍音確認」用ボタン以外が押された場
合、2へ。
【0013】
【発明が解決しようとする課題】互いに倍音の関係にあ
るパターンの系列を見つけることを上述した従来技術で
のインタフェースで行なう場合、以下の(a)〜(e)
のような課題が生ずる。
【0014】(a)同時刻における各パターンの周波数
が比較しにくい。
【0015】周波数が時間的に大きく変動するパターン
系列に関しては、異なる時刻で周波数を比較することは
あまり意味がない。
【0016】しかし従来例ではウインドウ上で横軸(周
波数)方向に離れた点が同時刻のものかどうかを目視で
判定するための目印がない。
【0017】(b)片手での操作が困難である。
【0018】従来例では入力デバイスとしてトラックボ
ールとタッチパネルの両方を用いる必要があるため、片
手で素早く操作することが難しい。
【0019】(c)複数の周波数、時刻、倍音番号につ
いてパターンの系列を見つけるには、手間がかかる。
【0020】従来例ではタッチパネルで周波数等を確定
しなければ直線群が描画されない。このため例えば周波
数が時間的に大きく変動するような2パターンを比較す
るには、各時刻ごとに周波数等の確定操作をする手間が
必要である。
【0021】(d)「準倍音」の取り扱いに難点があ
る。
【0022】本来の意味での倍音ではないが、周波数が
変動しても常にその比が保たれるような関係の系列があ
る。それをここでは仮に「準倍音」と呼ぶことにする。
【0023】ギアで連結された2個の回転軸を持つ発音
体が発する音がその例である。
【0024】この発音体が発する音は2本の回転軸に対
応する2個の倍音系列を含み、基本音の周波数比は常に
ギア比に等しく保たれる。
【0025】例えば70Hzと50Hzをそれぞれ基本
音とする2個の準倍音系列があるとする。
【0026】このとき正しい倍音の系列は70,14
0,…と50,100,…である。しかし従来例により
50Hzと70Hzを倍音系列の候補として選んだ場
合、20Hz間隔で10,30,50,70…Hzに相
当する位置に垂直な直線群が表示される。この中には1
00,200…等の正しい倍音は含まれておらず、逆に
10,30,90…等の誤った倍音が含まれている。
【0027】また従来例では2個の周波数とそれらの差
から表示する直線群の系列を決め、表示しているが、こ
れを準倍音系列が3個以上ある場合に自然に拡張するの
は難しい。
【0028】(e)準倍音系列の基本音の周波数比を自
動的に算出する手段がない。
【0029】(d)の例では、基本音の周波数比が7:
5であることがたちどころには分からない。
【0030】本発明の目的はこれらの課題を解決するこ
とである。
【0031】
【課題を解決するための手段】請求項または図で用いて
いる記号等はこの節以下でも断りなく用いることにす
る。
【0032】上記の課題を解決するための手段は次の各
点からなる。
【0033】(A)ウインドウ上の指定した位置に水平
線を描画する。
【0034】水平線近辺の点は目視で同時刻性が容易に
判定できるので、課題(a)が解決できる。
【0035】(B)入力インタフェースとして、ユーザ
入力可能なスイッチ類を持ったポインティングデバイス
を用いる。
【0036】本節以下このようなポインティングデバイ
スの例としてマウスを、ユーザ入力可能なスイッチ類と
してマウスボタンをそれぞれ用いて説明を行なう。単に
タッチパネルの代わりにマウスボタンを用いれば片手で
も容易に操作可能となり、課題(b)が解決できる。
【0037】(C)座標値X,Yの指定をマウスカーソ
ル位置により自動的に行なう。正の整数(倍音番号)n
の指定は、初期値はデフォルト値により、その後はマウ
スボタン操作により増減させる(請求項2、4参照)。
またこのように指定されたn,X,Yに対し、随時請求
項1、2で述べた直線群を表示し直す。
【0038】これにより、従来例のように周波数、倍音
番号を明示的に決定する操作なしに、マウスの移動また
はマウスのボタン操作だけでいろいろな周波数、時刻、
倍音番号について(#)を行なうことができ、課題
(c)が解決できる。
【0039】(C’)特定の倍音のパターンを予め記憶
しておく。
【0040】これにより、パターンが複雑な形状をして
いる場合でも、一度に複数の時刻における倍音関係を確
認できる。
【0041】(D)周波数と倍音番号を入力パラメター
とする。
【0042】表示する直線群は単に各倍音系列を単独で
指定した場合に表示する直線群の和集合とする。
【0043】これにより、従来例のように2個の周波数
を入力パラメターとしたときに生じる、課題(d)で述
べた不都合が解決できることが容易に分かる。
【0044】(E)与えられた周波数比に近い整数比を
表示する。
【0045】与えられた実数に近い整数比を求めるに
は、例えばユークリッドの互除法(2整数の最大公約数
を求めるアルゴリズム)を逆向きに行なうようなアルゴ
リズムを用いれば良い。
【0046】これにより課題(e)が解決できる。
【0047】
【発明の実施の形態】まず、本発明の第1の実施例につ
いて説明する。
【0048】図1は、本実施例である発音体識別支援装
置(100)の構成図である。これは画像表示用ウイン
ドウ、倍音確認ボタン、ポインティングデバイス(以下
の例ではマウス)からなり、次のように動作する。
【0049】○ 倍音確認ボタンはトグルボタンであ
り、これをクリックすることにより倍音確認の操作を開
始・終了する。
【0050】○ マウスが画像表示用ウインドウから出
た場合、水平線と垂直線を消去する。
【0051】○ マウスカーソルが画像表示用ウインド
ウ内にある場合、n,X,Yの入力モードとなる。
【0052】○ マウスカーソルが画像表示用ウインド
ウ内にある場合、(X,Y)はマウスカーソル位置座標
とする。(図4) ○ nの初期値は2とする。
【0053】○ マウス左ボタンをクリックした場合、
n>1であればnから1を引く。マウス右ボタンをクリ
ックした場合、nに1を加える。(図5) ○ n,X,Yのいずれかが更新された場合、前回描画
された水平線・垂直線があればそれを消去し、マウスカ
ーソルの位置(f−t座標系で(F,T)とする)に水
平な直線t=Tを描画し、マウスカーソル位置をn倍音
とするような倍音系列に当たる位置に直線群f=mF/
n(m=1,2,…)を描画する(図4、5)。
【0054】なお倍音確認したい周波数以外では同時刻
性を見る必要がないので、水平な直線t=Tの表示を垂
直な各直線f=mF/Nの近傍だけに限っても良い。
【0055】倍音同士のものである2個のパターンがあ
るとき、マウスカーソルを一方のパターン上の一点に合
わせてマウス左右ボタンを適当にクリックしてnを調節
すれば、他方のパターンとある垂直な直線f=mF/n
が水平な直線t=T上で重なるようなnを発見できる。
このとき前者のパターンはn倍音、後者のパターンはm
倍音のものであることの裏付けが得られる。ここで更に
前者のパターンに沿ってマウス位置(F,T)を動かせ
ば、f=mF/nとt=Tの交点は後者のパターンに沿
って動く。このようにして、2個のパターンが倍音同士
のものであることを確認できる。
【0056】次に第2の実施例について説明する。構成
は第1の例に出力装置(610)として整数比表示用ウ
インドウを加えたものとする。整数比表示用ウインドウ
には、実数F’/Fを整数比に直したものをカーソルの
移動に従って随時表示する(図6)。
【0057】実数xを整数比b/aに変換するアルゴリ
ズム例はおよそ以下の通りである。
【0058】1.X(0)=x X(n+1)=1/(X(n)−[X(n)]) 2.X(N)が整数になるようなNに対し A(N)=1,B(N)=X(N) 3.A(n−1)=B(n) B(n−1)=B(n)×[X(n−1)]+A(n) 4.a=A(0),b=B(0) 但し[]は整数部分を表す記号。このようにして、倍音
または「準倍音」の系列の周波数比を整数比として知る
ことができる。これにより例えば発音体が含むギアのギ
ア比が分かれば、識別に大きく寄与する。
【0059】第3の例として、請求項4の実施形態を説
明する。
【0060】請求項5における表示装置は画像表示用ウ
インドウとポインティングデバイス(以下の例ではマウ
ス)と記憶装置(710)からなる。図7はその動作イ
メージ図である。まず初期状態では記憶装置には何も記
憶されていない(図7左)。次にウインドウ上でマウス
ボタンを押しながらパターンをドラッグするとマウスの
軌跡が記憶装置に記憶され、マウスボタンを放すと記憶
が完了する(図7中)。最後にマウスカーソルを移動す
ると、記憶したパターン(730)が横方向に拡大され
たパターン(740)がポインティングデバイスの位置
に表示される。ここで拡大の中心及び倍率は、請求項5
で述べた通りとする。
【0061】このように、パターンを事前に記憶してお
くことで、複雑な形状のパターン間の多くの時刻での倍
音性を一度に確認できる。
【0062】第4の例として、請求項5の実施形態を説
明する。
【0063】構成は第3の例に出力装置として整数比表
示用ウインドウを加えたものとする。整数比表示用ウイ
ンドウには、実数F’/Fを整数比に直したものを、カ
ーソル移動に従って随時表示する。但しF、F’は請求
項4で述べられているもの。実数xを整数比b/aに変
換するアルゴリズム例は第2の例と同じ。
【0064】第5の例として、請求項6の実施形態を説
明する。
【0065】図8はその構成を示す図である。周波数比
出力装置は、ここでは周波数比を実数及び整数比の形で
出力し、また周波数自体をも出力するものとする。発音
体データベースは、発音体の名称、基本音の典型的な周
波数、基本音が複数ある場合はそれらの周波数比(実
数、整数比)を1単位として種々の発音体のデータを保
持しているとする。
【0066】データベース照合装置は、周波数比出力装
置から周波数比a:b及び周波数fを受けとり、それを
発音体データベースと照合して、「適合」する発音体の
名称を出力する。
【0067】「適合」の判定は例えば次のようにする。
データベース内のデータの周波数比エントリーがa’:
b’、それに対応する周波数がfa,fbであるとき、 ○ aがa’を、bがb’を素因数とし、f/aとfa
の比が1±5%以内 ○ 上の条件でaをbで、faをfbで置き換えたもの
のいずれかが成立すれば適合、それ以外の場合は不適
合。
【0068】fが基本音ではなく基本音の適当な倍音で
ある場合が考えられる。そこでa,b等の条件に素因数
を用ると良い(=倍数であれば等しくなくても良い)。
一般にギア等で外部の負荷が加わる回転軸は、負荷の変
化により周波数が変動し易いと考えられる。そこでf/
aとfaの比の条件に幅を持たせると良い。この例では
基本音が3個以上ある場合(複数のギアで3個以上の回
転軸が連結されているような発音体のケース)は考えて
いない。
【0069】発音体の発する音を観測した場合、その周
波数自体はドップラー効果や発音体自体の回転ムラなど
により揺らぎため、必ずしも安定しない。しかし倍音同
士の周波数比や、ギアで連結された2軸の音の周波数比
(いずれも整数比)は周波数の揺らぎによらず一定に保
たれる。このため識別対象の発音体がギアを含み回転ム
ラが大きいものであるような場合、周波数自体を用いる
よりも周波数比を用いる方が対象を正確に識別できる。
【0070】
【発明の効果】本発明は発音体識別の重要な一過程であ
る倍音の確認を支援するためのオペレータインタフェー
スを提供する。これにより発音体識別システムのオペレ
ータは倍音の確認を正確かつ迅速に行なうことができ、
その結果更に発音体識別をより正確かつ迅速に行なうこ
とができる。
【図面の簡単な説明】
【図1】本発明請求項1による発音体識別支援装置の構
成例を示す図である。
【図2】発音体の被識別データとして用いられる画像を
説明する図である。
【図3】従来の発音体識別支援装置の構成例を示す図で
ある。
【図4】本発明請求項2におけるポインティングデバイ
スの動きと表示の変化の関係を示す図である。
【図5】本発明請求項2におけるスイッチ類の操作と表
示の変化の関係を示す図である。
【図6】発音体が複数の倍音系列を持つ場合の、本発明
請求項3による発音体識別支援装置の処理画面イメージ
を示す図である。
【図7】本発明請求項4、5における表示装置の動作イ
メージを示す図である。
【図8】本発明請求項6における半自動発音体識別装置
の構成を示す図である。
【符号の説明】
100…発音体識別支援装置、 110…倍音確
認開始/終了ボタン、120…被識別データとしての画
像表示用ウインドウ、130…入力装置、
140…水平直線l(1)、150…垂直直線群
l(m,1)、160…ポインティングデバイスのカー
ソル、200…被識別データの画像イメージ、310…
タッチパネル、320…被識別データとしての画像表示
用ウインドウ、330…トラックボール、 350…倍
音系列の候補を示す垂直な直線群、360…トラックボ
ールカーソル、610…周波数比を整数比表示する出力
ウインドウ、700… 請求項5における表示装置、7
10…記憶装置、720… 記憶すべきパターン、
730…記憶されたパターン、740… 生成・表示
されたパターン、810…データベース照合装置、82
0… 発音体データベース。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 高橋 廣 神奈川県横浜市戸塚区戸塚町216番地株式 会社日立製作所情報通信事業部内 (72)発明者 吉田 正治 神奈川県横浜市戸塚区戸塚町216番地株式 会社日立製作所情報通信事業部内 (72)発明者 日野 一彦 神奈川県横浜市戸塚区戸塚町216番地株式 会社日立製作所情報通信事業部内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】表示用のウインドウと入力装置からなり、
    ウインドウは2個の直交座標系(仮にx−y座標系及び
    f−t座標系とする)を持ち、入力装置にx−y座標系
    での座標値(X,Y)と正の整数nが与えられたとき、
    (X,Y)のf−t座標系での表現を(F,T)として
    直線t=T及び直線群f=mF/n(m=1,2,…)
    をウインドウ上に予め指定した色で描画する表示方式及
    び装置(100)。
  2. 【請求項2】請求項1において、入力装置としてユーザ
    入力可能なスイッチ類を持ったポインティングデバイス
    を備え、スイッチ類の特定の操作があった場合正の整数
    nの値を更新し、ポインティングデバイスのカーソル移
    動に伴い随時x−y座標値(X,Y)を新しいカーソル
    位置座標で更新し、n,X,Yのいずれかの値が上記に
    より更新された場合(X,Y)のf−t座標系での表現
    を(F,T)として直線t=T、直線群f=mF/n
    (m=1,2,…)を描画する表示方式及び装置。
  3. 【請求項3】請求項2において、周波数比出力装置(4
    10)を備え、スイッチ類の別の特定の操作があった場
    合、正の整数n,x−y座標値X,Yを固定し、n,
    X,Yの固定完了後は、f−t座標系による表現でポイ
    ンティングデバイスのカーソルが(F’,T’)にあり
    (X,Y)のf−t座標系での表現が(F,T)である
    場合、直線t=T’を描画しf座標の比F’/Fを整数
    比に変換して出力装置に出力する表示方式及び装置。
  4. 【請求項4】ウインドウとポインティングデバイスと記
    憶装置(710)からなり、ポインティングデバイスで
    ウインドウ上のパターン(720)をトレースすること
    によりその軌跡を記憶装置に記憶し、軌跡の記憶完了後
    は、f−t座標系による表現でポインティングデバイス
    のカーソルが(F’,T’)にあり記憶したパターンが
    (F,T’)を含む場合、直線t=T’を描画し記憶し
    た軌跡(730)及びそのf座標をF’/F倍して得ら
    れるパターン(740)を描画する表示方式及び装置
    (700)。
  5. 【請求項5】請求項4において、周波数比出力装置(4
    10)を備え、カーソル位置と記憶したパターンのf座
    標の比F/F’を整数比に変換して随時出力装置に出力
    する表示方式及び装置。
  6. 【請求項6】請求項3、5において、及びデータベース
    照合装置(810)及び発音体データベース(820)
    を備え、周波数比出力装置とデータベース照合装置、デ
    ータベース照合装置と発音体データベースがそれぞれ接
    続され、周波数比出力装置は周波数比を出力し、発音体
    データベースには発音体ID、その倍音系列の周波数、
    倍音系列が複数ある場合はそれらの周波数比の組のデー
    タが格納され、データベース照合装置はその周波数比に
    適合する発音体IDを探索して出力する半自動発音体識
    別装置(800)。
JP8155203A 1996-06-17 1996-06-17 発音体識別支援装置 Pending JPH103549A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8155203A JPH103549A (ja) 1996-06-17 1996-06-17 発音体識別支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8155203A JPH103549A (ja) 1996-06-17 1996-06-17 発音体識別支援装置

Publications (1)

Publication Number Publication Date
JPH103549A true JPH103549A (ja) 1998-01-06

Family

ID=15600762

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8155203A Pending JPH103549A (ja) 1996-06-17 1996-06-17 発音体識別支援装置

Country Status (1)

Country Link
JP (1) JPH103549A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111524076A (zh) * 2020-04-07 2020-08-11 咪咕文化科技有限公司 图像处理方法、电子设备和计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111524076A (zh) * 2020-04-07 2020-08-11 咪咕文化科技有限公司 图像处理方法、电子设备和计算机可读存储介质
CN111524076B (zh) * 2020-04-07 2023-07-21 咪咕文化科技有限公司 图像处理方法、电子设备和计算机可读存储介质

Similar Documents

Publication Publication Date Title
EP0764898A2 (en) Page turning apparatus for use with computer system
Wilson et al. Combining dynamic geometry, automated geometry theorem proving and diagrammatic proofs
JP6239694B1 (ja) 画像処理装置、画像処理方法、およびプログラム
JPH103549A (ja) 発音体識別支援装置
JPH0523439B2 (ja)
JPH08249353A (ja) 画像検索方法及び装置
JP2893786B2 (ja) 図形選択方式
JPS59145970A (ja) スペクトルの表示方法
JP4012949B2 (ja) 波形編集方法
JP2656484B2 (ja) 図面管理方法および装置
JP2754533B2 (ja) 流れ図作成装置
JP2560092B2 (ja) 中心線検出装置
JP4012950B2 (ja) 波形編集方法
JPS585784A (ja) グラフ表示装置
JP4089806B2 (ja) 曲線生成装置およびその方法ならびに記憶媒体
JP2753226B2 (ja) 図面管理方法および装置
JP2536948B2 (ja) 3点指定円弧検出方法及び装置
JP2753227B2 (ja) 図面管理方法および装置
JP2686607B2 (ja) 画像処理方法
Schorn Evolution of a software system: interaction, interfaces and applications in the XYZ GeoBench
JPH02143325A (ja) ウィンドウ表示方式
JPH04130571A (ja) 数値演算方式
JPH11232087A (ja) ユーザインタフェース作成支援装置
Krivograd et al. A determination of topological relationships in GIS applications
JPH06176123A (ja) 画像作成装置