WO2016152715A1

WO2016152715A1 - 音制御装置、音制御方法、および音制御プログラム

Info

Publication number: WO2016152715A1
Application number: PCT/JP2016/058490
Authority: WO
Inventors: 桂三濱野; 良朋太田; 一輝柏瀬
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2015-03-20
Filing date: 2016-03-17
Publication date: 2016-09-29
Anticipated expiration: 2017-09-20
Also published as: CN107430849A; JP6728754B2; CN107430849B; EP3273441A1; US20180005617A1; JP2016177276A; EP3273441B1; EP3273441A4; US10354629B2

Abstract

音制御装置は、音の出力の開始を示す開始指示を受け付ける受付部と、前記開始指示が受け付けられたことに応答して、前記音の出力態様を決定する制御パラメータを読み出す読出部と、前記読み出された制御パラメータに従った態様で前記音を出力させる制御部と、を備える。

Description

音制御装置、音制御方法、および音制御プログラム

　この発明は、簡単に、表情豊かな音の演奏を行える音制御装置、音制御方法、および音制御プログラムに関する。
　本願は、２０１５年３月２０日に日本国に出願された特願２０１５－０５７９４６号に基づいて優先権を主張し、その内容をここに援用する。

　特許文献１には、リアルタイムに入力される演奏データに基づいて、歌唱合成を行う歌唱音合成装置が開示されている。この歌唱音合成装置は、ＭＩＤＩ（musical instrument digital interface）機器から受信した演奏データに基づき歌唱合成スコアを形成し、このスコアに基づいて歌唱を合成する。歌唱合成スコアは、音韻トラック、遷移トラック、ビブラートトラックを含んでいる。ＭＩＤＩ機器の操作に応じて音量制御やビブラート制御が行われる。
　非特許文献１には、ノートと歌詞を入力して、ノートの音高にそって歌詞を歌わせるボーカルトラック作成ソフトウェアが開示されている。非特許文献１には、声の表情や抑揚、声質や音色の変化を調整するためのパラメータが多数装備して、歌声に細かなニュアンスや抑揚をつけられることが記載されている。

日本国特開２００２－２０２７８８号公報

VOCALOID使いこなしマニュアル「VOCALOID EDITOR活用法」［online］, ［平成２７年　２月２７日検索］，インターネット<http://www.crypton.co.jp/mp/pages/download/pdf/vocaloid_master_01.pdf>

　リアルタイム演奏により歌唱音合成を行う場合には、演奏中に操作できるパラメータ数に限界がある。このため、事前に入力した情報を再生することで歌わせる非特許文献１記載のボーカルトラック作成ソフトウェアのように多数のパラメータを制御するのは困難であるという問題点があった。

　本発明の目的の一例は、簡単に、表情豊かな音の演奏を行える音制御装置、音制御方法、および音制御プログラムを提供することである。

　本発明の実施態様にかかる音制御装置は、音の出力の開始を示す開始指示を受け付ける受付部と、前記開始指示が受け付けられたことに応答して、前記音の出力態様を決定する制御パラメータを読み出す読出部と、前記読み出された制御パラメータに従った態様で前記音を出力させる制御部と、を備える。
　本発明の実施態様にかかる音制御方法は、音の出力の開始を示す開始指示を受け付け、前記開始指示が受け付けられたことに応答して、前記音の出力態様を決定する制御パラメータを読み出し、前記読み出された制御パラメータに従った態様で前記音を出力させる、ことを含む。
　本発明の実施態様にかかる音制御プログラムは、コンピュータに、音の出力の開始を示す開始指示を受け付け、前記開始指示が受け付けられたことに応答して、前記音の出力態様を決定する制御パラメータを読み出し、前記読み出された制御パラメータに従った態様で前記音を出力させる、ことを実行させる。

　本発明の実施形態にかかる発音装置では、開始指示に応じて、読み出した制御パラメータに従った発音態様で音を出力させる。このため、簡単に、表情豊かな音の演奏を行えるようになる。

本発明の実施形態にかかる発音装置のハードウェア構成を示す機能ブロック図である。本発明の第１実施形態にかかる発音装置が実行するキーオン処理のフローチャートである。本発明の第１実施形態にかかる発音装置が実行する音節情報取得処理のフローチャートである。本発明の第１実施形態にかかる発音装置が処理する発音指示受付処理を説明する図である。本発明の第１実施形態にかかる発音装置が処理する音節情報取得処理を説明する図である。本発明の第１実施形態にかかる発音装置が処理する音声素片データ選択処理を説明する図である。本発明の第１実施形態にかかる発音装置の動作を示すタイミング図である。本発明の第１実施形態にかかる発音装置が実行するキーオフ処理のフローチャートである。本発明の第１実施形態にかかる発音装置が実行するキーオフ処理の他の動作例を説明する図である。本発明の第１実施形態にかかる発音装置が実行するキーオフ処理の他の動作例を説明する図である。本発明の第１実施形態にかかる発音装置が実行するキーオフ処理の他の動作例を説明する図である。本発明の第２実施形態にかかる発音装置の動作例を説明する図である。本発明の第３実施形態にかかる発音装置が実行する音節情報取得処理のフローチャートである。本発明の第３実施形態にかかる発音装置が実行する発音指示受付処理を説明する図である。本発明の第３実施形態にかかる発音装置が実行する音節情報取得処理を説明する図である。本発明の第３実施形態にかかる発音装置における歌詞情報テーブルの値を示す図である。本発明の第３実施形態にかかる発音装置の動作例を説明する図である。本発明の第３実施形態にかかる歌詞情報テーブルの変形例を示す図である。本発明の第３実施形態にかかる歌詞情報テーブルの変形例を示す図である。本発明の第３実施形態にかかるテキストデータの変形例を示す図である。本発明の第３実施形態にかかる歌詞情報テーブルの変形例を示す図である。

　図１は、本発明の実施形態にかかる発音装置のハードウェア構成を示す機能ブロック図を示す。
　図１に示す本発明の実施形態にかかる発音装置１は、ＣＰＵ（Central Processing Unit）１０と、ＲＯＭ（Read Only Memory）１１と、ＲＡＭ（Random Access Memory）１２と、音源１３と、サウンドシステム１４と、表示部（表示器）１５と、演奏操作子１６と、設定操作子１７と、データメモリ１８と、バス１９とを備える。
　音制御装置は、発音装置１（１００、２００）に相当してもよい。この音制御装置の受付部、読出部、制御部、記憶部、操作子は各々、発音装置１のこれらの構成の少なくとも一つに相当してもよい。例えば、受付部は、ＣＰＵ１０および演奏操作子１６の少なくとも一つに相当してもよい。読出部は、ＣＰＵ１０に相当してもよい。制御部は、ＣＰＵ１０、音源１３およびサウンドシステム１４の少なくとも一つに相当してもよい。記憶部は、データメモリ１８に相当してもよい。操作子は、演奏操作子１６に相当してもよい。
　ＣＰＵ１０は、本発明の実施形態にかかる発音装置１全体の制御を行う中央処理装置である。ＲＯＭ（Read Only Memory）１１は制御プログラムおよび各種のデータなどが格納されている不揮発性のメモリである。ＲＡＭ１２はＣＰＵ１０のワーク領域および各種のバッファなどとして使用される揮発性のメモリである。データメモリ１８は歌詞を音節に区切ったテキストデータを含む音節情報および歌唱音の音声素片データが格納されている音韻データベースなどが格納されている。表示部１５は、動作状態および各種設定画面やユーザーに対するメッセージなどが表示される液晶表示器等からなる表示部である。演奏操作子１６は、それぞれ異なる音高に対応する複数の鍵を有する鍵盤（図７の部分（ｃ）参照）などからなる演奏操作子である。演奏操作子１６は、キーオン、キーオフ、音高、ベロシティなどの演奏情報を発生する。以下において、演奏操作子を鍵と称する場合がある。この演奏情報は、ＭＩＤＩメッセージの演奏情報であってもよい。設定操作子１７は、発音装置１を設定する操作つまみや操作ボタンなどの各種設定操作子である。

　音源１３は、複数の発音チャンネルを有する。音源１３には、ＣＰＵ１０の制御の基で、ユーザーの演奏操作子１６を使用するリアルタイム演奏に応じて１つの発音チャンネルが割り当てられる。音源１３は、割り当てられた発音チャンネルにおいて、データメモリ１８から演奏に対応する音声素片データを読み出して歌唱音データを生成する。サウンドシステム１４は、音源１３で生成された歌唱音データをデジタル／アナログ変換器によりアナログ信号に変換して、アナログ信号とされた歌唱音を増幅してスピーカ等へ出力している。バス１９は発音装置１における各部の間のデータ転送を行うためのバスである。

　本発明の第１実施形態にかかる発音装置１について以下に説明する。第１実施形態の発音装置１では、演奏操作子１６をキーオンした際に図２Ａに示すフローチャートのキーオン処理が実行される。図２Ｂは、このキーオン処理における音節情報取得処理のフローチャートを示す。図３Ａは、キーオン処理における発音受付処理の説明図を示す。図３Ｂは、音節情報取得処理の説明図を示す。図３Ｃは、音声素片データ選択処理の説明図を示す。図４は、第１実施形態の発音装置１の動作を示すタイミング図を示す。図５は、第１実施形態の発音装置１において、演奏操作子１６をキーオフした際に実行されるキーオフ処理のフローチャートを示す。
　第１実施形態の発音装置１において、ユーザーがリアルタイム演奏を行う場合は、演奏操作子１６を操作して演奏を行う。演奏操作子１６は鍵盤等であってもよい。演奏の進行に伴い演奏操作子１６がキーオンされたことをＣＰＵ１０が検出すると、図２Ａに示すキーオン処理をスタートする。キーオン処理におけるステップＳ１０の発音指示受付処理およびステップＳ１１の音節情報取得処理はＣＰＵ１０が実行する。ステップＳ１２の音声素片データ選択処理およびステップＳ１３の発音処理はＣＰＵ１０の制御の基で音源１３が実行する。

　キーオン処理のステップＳ１０では、操作された演奏操作子１６のキーオンに基づく発音指示（開始指示の一例）を受け付ける。この場合、ＣＰＵ１０はキーオンのタイミング、操作された演奏操作子１６の音高情報およびベロシティなどの演奏情報を受け取るようになる。図３Ａに示す楽譜の通りユーザーがリアルタイム演奏した場合は、最初のキーオンｎ１の発音指示を受け付けた時に、ＣＰＵ１０はＥ５の音高を示す音高情報と鍵速度に応じたベロシティ情報を受け取る。

　次いで、ステップＳ１１にて、キーオンに対応する音節情報を取得する音節情報取得処理を行う。図２Ｂは、音節情報取得処理の詳細を示すフローチャートである。音節情報取得処理はＣＰＵ１０で実行される。ＣＰＵ１０は、ステップＳ２０においてカーソル位置の音節を取得する。この場合、ユーザーの演奏に先立って、特定の歌詞が指定されている。特定の歌詞とは、例えば、図３Ａに示す楽譜に対応し、データメモリ１８に格納されている歌詞である。また、テキストデータの先頭の音節にカーソルが置かれている。このテキストデータは、指定された歌詞を音節毎に区切ったデータである。具体例として、テキストデータ３０が、図３Ａに示す楽譜に対応して指定された歌詞に対応するテキストデータである場合について説明する。この場合、テキストデータ３０は、図３Ｂに示す音節ｃ１～ｃ４２、すなわち、「は（ｈａ）」、「る（ｒｕ）」、「よ（ｙｏ）」、「こ（ｋｏ）」、「い（ｉ）」の５つの音節からなるテキストデータである。以下において、「は（ｈａ）」、「る（ｒｕ）」、「よ（ｙｏ）」、「こ（ｋｏ）」、「い（ｉ）」各々は、日本語のひらがなの一文字を示し、音節の一例である。この場合、ｃ１～ｃ３の音節「は（ｈａ）」、「る（ｒｕ）」、「よ（ｙｏ）」はそれぞれ独立している。ｃ４１とｃ４２との音節「こ（ｋｏ）」「い（ｉ）」はグループ化されている。このグループ化されているか否かを示す情報がグループ化情報（設定情報の一例）３１である。グループ化情報３１は、各音節に埋め込まれ、または、各音節に対応付けられている。グループ化情報３１において、記号「×」はグループ化されていないことを表し、記号「○」はグループ化されていることを表している。グループ化情報３１は、データメモリ１８に記憶されていてもよい。図３Ｂに示すように、最初のキーオンｎ１の発音指示を受け付けた際には、ＣＰＵ１０は、指定された歌詞の最初の音節ｃ１である「は（ｈａ）」をデータメモリ１８から読み出す。この際、ＣＰＵ１０は、「は（ｈａ）」に埋め込まれまたは対応付けられているグループ化情報３１もデータメモリ１８から読み出す。次いで、ステップＳ２１にて取得した音節がグループ化されているか否かを、取得された音節のグループ化情報３１からＣＰＵ１０が判断する。ステップＳ２０で取得された音節がｃ１の「は（ｈａ）」の場合は、そのグループ化情報３１が「×」であることからグループ化されていないと判断されて、処理がステップＳ２５に進む。ステップＳ２５では、ＣＰＵ１０がテキストデータ３０の次の音節にカーソルを進められ、２番目の音節ｃ２の「る（ｒｕ）」にカーソルが置かれる。ステップＳ２５の処理が終了すると音節情報取得処理は終了し、キーオン処理のステップＳ１２にリターンする。

　図３Ｃは、ステップＳ１２の音声素片データ選択処理を説明するための図である。このステップＳ１２の音声素片データ選択処理は、ＣＰＵ１０の制御の基で音源１３によって行われる処理である。音源１３は、取得された音節を発音させる音声素片データを音韻データベース３２から選択する。音韻データベース３２には、「音素連鎖データ３２ａ」と「定常部分データ３２ｂ」が記憶されている。音素連鎖データ３２ａは、「無音（＃）から子音」、「子音から母音」、「母音から（次の音節の）子音または母音」などに対応する、発音が変化する際の音素片のデータである。定常部分データ３２ｂは、母音の発音が継続する際の音素片のデータである。最初のキーオンｎ１の発音指示を受け付けることに応じて取得された音節がｃ１の「は（ｈａ）」の場合、音源１３は、音素連鎖データ３２ａから「無音→子音ｈ」に対応する音声素片データ「＃－ｈ」と「子音ｈ→母音ａ」に対応する音声素片データ「ｈ－ａ」を選択すると共に、定常部分データ３２ｂから「母音ａ」に対応する音声素片データ「ａ」を選択する。次いで、ステップＳ１３にて、ステップＳ１２で選択した音声素片データに基づく発音処理をＣＰＵ１０の制御の基で音源１３が行う。上記したように、音声素片データが選択された場合は、ステップＳ１３の発音処理において、『「＃－ｈ」→「ｈ－ａ」→「ａ」』の音声素片データの発音が順次音源１３によって行われる。その結果、音節ｃ１の「は（ｈａ）」の発音が行われる。発音の際には、キーオンｎ１の発音指示の受付の際に受け取ったＥ５の音高で、ベロシティ情報に応じた音量で「は（ｈａ）」の歌唱音が発音される。ステップＳ１３の発音処理が終了するとキーオン処理も終了する。

　図４は、このキーオン処理の動作を示す。図４の部分（ａ）は鍵を押す操作を示す。図４の部分（ｂ）は発音内容を示す。図４の部分（ｃ）は、音声素片を示す。ＣＰＵ１０は、時刻ｔ１で最初のキーオンｎ１の発音指示を受け付ける（ステップＳ１０）。次に、ＣＰＵ１０は、最初の音節ｃ１を取得し、音節ｃ１が別の音節とグループ化されていないと判断する（ステップＳ１１）。次いで、音源１３は、音節ｃ１を発音する音声素片データ「＃－ｈ」，「ｈ－ａ」，「ａ」を選択する（ステップＳ１２）。次に、キーオンｎ１のベロシティ情報に応じた音量のエンベロープＥＮＶ１が開始され、『「＃－ｈ」→「ｈ－ａ」→「ａ」』の音声素片データをＥ５の音高およびエンベロープＥＮＶ１の音量で発音させる（ステップＳ１３）。これにより、「は（ｈａ）」の歌唱音が発音される。エンベロープＥＮＶ１は、キーオンｎ１のキーオフまでサスティンが持続する持続音のエンベロープである。時刻ｔ２でキーオンｎ１の鍵がキーオフされるまで「ａ」の音声素片データが繰り返し再生される。そして、時刻ｔ２でキーオフ（停止指示の一例）されたことがＣＰＵ１０で検出されると、図５に示すキーオフ処理をスタートする。キーオフ処理のステップＳ３０，ステップＳ３３の処理はＣＰＵ１０が実行する。ステップＳ３１，ステップＳ３２の処理はＣＰＵ１０の制御の基で音源１３が実行する。

　キーオフ処理がスタートされると、ステップＳ３０でキーオフ発音フラグがオンか否かが判断される。キーオフ発音フラグは、取得した音節がグループ化されている場合にセットされる。図２Ａに示す音節情報取得処理において、最初の音節ｃ１はグループ化されていない。このため、ＣＰＵ１０は、キーオフ発音フラグが設定されていないと判断し（ステップＳ３０でＮｏ）、処理がステップＳ３４に進む。ステップＳ３４では、ＣＰＵ１０の制御の基で音源１３は、消音処理を行い、その結果、「は（ｈａ）」の歌唱音の発音が停止される。すなわち、エンベロープＥＮＶ１のリリースカーブで「は（ｈａ）」の歌唱音が消音されていく。ステップＳ３４の処理が終了すると、キーオフ処理は終了する。

　リアルタイム演奏の進行に伴い演奏操作子１６が操作されて、２回目のキーオンｎ２が検出されると上述したキーオン処理が再度スタートされて、上述したキーオン処理が行われる。２回目のキーオン処理における、ステップＳ１０の発音指示受付処理について説明する。この処理では、操作された演奏操作子１６のキーオンｎ２に基づく発音指示を受け付ける際に、ＣＰＵ１０はキーオンｎ２のタイミング、Ｅ５の音高を示す音高情報と鍵速度に応じたベロシティ情報を受け取る。ステップＳ１１の音節情報取得処理では、ＣＰＵ１０は、指定された歌詞のカーソルが置かれた２番目の音節ｃ２である「る（ｒｕ）」をデータメモリ１８から読み出す。この取得した音節「る（ｒｕ）」のグループ化情報３１が「×」である。このため、ＣＰＵ１０は、グループ化されていないと判断し、３番目の音節目のｃ３の「よ（ｙｏ）」にカーソルを進める。ステップＳ１２の音声素片データ選択処理では、音源１３は、音素連鎖データ３２ａから「無音→子音ｒ」に対応する音声素片データ「＃－ｒ」と「子音ｒ→母音ｕ」に対応する音声素片データ「ｒ－ｕ」を選択すると共に、定常部分データ３２ｂから「母音ｕ」に対応する音声素片データ「ｕ」を選択する。ステップＳ１３の発音処理では、『「＃－ｒ」→「ｒ－ｕ」→「ｕ」』の音声素片データの発音がＣＰＵ１０の制御の基で順次音源１３において行われる。その結果、ｃ２の「る（ｒｕ）」の音節の発音が行われ、キーオン処理は終了する。

　リアルタイム演奏の進行に伴い演奏操作子１６が操作されて、３回目のキーオンｎ３が検出されると上述したキーオン処理が再度スタートされて、上述したキーオン処理が行われる。この３回目のキーオンｎ３は、２回目のキーオンｎ２がキーオフされる前にキーオンするレガートとされている。３回目のキーオン処理における、ステップＳ１０の発音指示受付処理について説明する。この処理では、操作された演奏操作子１６のキーオンｎ３に基づく発音指示を受け付ける際に、ＣＰＵ１０はキーオンｎ３のタイミング、Ｄ５の音高を示す音高情報と鍵速度に応じたベロシティ情報を受け取る。ステップＳ１１の音節情報取得処理では、ＣＰＵ１０は、指定された歌詞のカーソルが置かれた３番目の音節ｃ３である「よ（ｙｏ）」をデータメモリ１８から読み出す。この取得した音節「よ（ｙｏ）」のグループ化情報３１が「×」である。このため、ＣＰＵ１０は、グループ化されていないと判断し、４番目の音節目のｃ４１の「こ（ｋｏ）」にカーソルを進める。ステップＳ１２の音声素片データ選択処理では、音源１３は、音素連鎖データ３２ａから「母音ｕ→子音ｙ」に対応する音声素片データ「ｕ－ｙ」と「子音ｙ→母音ｏ」に対応する音声素片データ「ｙ－ｏ」を選択すると共に、定常部分データ３２ｂから「母音ｏ」に対応する音声素片データ「ｏ」を選択する。これは、３回目のキーオンｎ３がレガートであって「る（ｒｕ）」から「よ（ｙｏ）」へ滑らかにつなげて発音させるためである。ステップＳ１３の発音処理では、『「ｕ－ｙ」→「ｙ－ｏ」→「ｏ」』の音声素片データの発音がＣＰＵ１０の制御の基で順次音源１３よって行われる。その結果、ｃ２の「る（ｒｕ）」から滑らかにつながるｃ３の「よ（ｙｏ）」の音節の発音が行われ、キーオン処理は終了する。

　図４は、この２，３回目のキーオン処理の動作を示す。ＣＰＵ１０は、時刻ｔ３で２回目のキーオンｎ２の発音指示を受け付ける（ステップＳ１０）。ＣＰＵ１０は、次の音節ｃ２を取得し、音節ｃ２が別の音節とグループ化されていないと判断する（ステップＳ１１）。次いで、音源１３は、音節ｃ２を発音する音声素片データ「＃－ｒ」，「ｒ－ｕ」，「ｕ」を選択する（ステップＳ１２）。音源１３は、キーオンｎ２のベロシティ情報に応じた音量のエンベロープＥＮＶ２を開始し、『「＃－ｒ」→「ｒ－ｕ」→「ｕ」』の音声素片データをＥ５の音高およびエンベロープＥＮＶ２の音量で発音させる（ステップＳ１３）。これにより、「る（ｒｕ）」の歌唱音が発音される。エンベロープＥＮＶ２は、エンベロープＥＮＶ１と同様である。「ｕ」の音声素片データが繰り返し再生される。キーオンｎ２にかかる鍵がキーオフされる前の時刻ｔ４で３回目のキーオンｎ３の発音指示を受け付ける（ステップＳ１０）。その発音指示に応答して、ＣＰＵ１０は、次の音節ｃ３を取得し、音節ｃ３が別の音節とグループ化されていないと判断する（ステップＳ１１）。時刻ｔ４では、３回目のキーオンｎ３がレガートであることから、図５に示すキーオフ処理をＣＰＵ１０がスタートする。キーオフ処理のステップＳ３０では、２番目の音節ｃ２である「る（ｒｕ）」はグループ化されていない。このため、ＣＰＵ１０は、キーオフ発音フラグが設定されていないと判断し（ステップＳ３０でＮｏ）、処理がステップＳ３４に進む。ステップＳ３４では、「る（ｒｕ）」の歌唱音の発音が停止される。ステップＳ３４の処理が終了すると、キーオフ処理は終了する。これは以下の理由による。すなわち、歌唱音用の発音チャンネルには１チャンネルが用意されて２つの歌唱音を同時に発音できない。ゆえに、キーオンｎ２の鍵がキーオフされる時刻ｔ５より前の時刻ｔ４で次のキーオンｎ３が検出された場合（すなわち、レガートの場合）は、時刻ｔ４でキーオンｎ２に基づく歌唱音の発音を停止して、時刻ｔ４からキーオンｎ３に基づく歌唱音の発音を開始させるためである。

　このため、音源１３は、音節ｃ３である「よ（ｙｏ）」を発音する音声素片データ「ｕ－ｙ」，「ｙ－ｏ」，「ｏ」を選択し（ステップＳ１２）、時刻ｔ４から、『「ｕ－ｙ」→「ｙ－ｏ」→「ｏ」』の音声素片データをＤ５の音高およびエンベロープＥＮＶ２のサスティンの音量で発音させる（ステップＳ１３）。これにより、「る（ｒｕ）」から「よ（ｙｏ）」へ歌唱音が滑らかにつながって発音される。なお、時刻ｔ５でキーオンｎ２の鍵がキーオフされても、既にキーオンｎ２に基づく歌唱音の発音は停止されているため、処理は何も行われない。
　ＣＰＵ１０は、時刻ｔ６でキーオンｎ３がキーオフされたことを検出すると、図５に示すキーオフ処理をスタートする。３番目の音節ｃ３である「よ（ｙｏ）」はグループ化されていない。よって、キーオフ処理のステップＳ３０では、ＣＰＵ１０は、キーオフ発音フラグが設定されていないと判断し（ステップＳ３０でＮｏ）、処理がステップＳ３４に進む。ステップＳ３４では、音源１３は、消音処理を行い、「よ（ｙｏ）」の歌唱音の発音が停止される。すなわち、エンベロープＥＮＶ２のリリースカーブで「よ（ｙｏ）」の歌唱音が消音されていく。ステップＳ３４の処理が終了すると、キーオフ処理は終了する。

　リアルタイム演奏の進行に伴い演奏操作子１６が操作されて、４回目のキーオンｎ４が検出されると上述したキーオン処理が再度スタートされて、上述したキーオン処理が行われる。４回目のキーオン処理における、ステップＳ１０の発音指示受付処理について説明する。この処理では、操作された演奏操作子１６の４回目のキーオンｎ４に基づく発音指示を受け付ける際に、ＣＰＵ１０はキーオンｎ４のタイミング、Ｅ５の音高を示す音高情報と鍵速度に応じたベロシティ情報を受け取る。ステップＳ１１の音節情報取得処理では、ＣＰＵ１０は、指定された歌詞のカーソルが置かれた４番目の音節ｃ４１である「こ（ｋｏ）」をデータメモリ１８から読み出す（ステップＳ２０）。この取得した音節「こ（ｋｏ）」のグループ化情報３１が「○」である。このため、ＣＰＵ１０は、音節ｃ４１が別の音節とグループ化されていると判断し（ステップＳ２１）、ステップＳ２２に進む。ステップＳ２２では、同じグループに属する音節（グループ内の音節）が取得される。この場合は「こ（ｋｏ）」と「い（ｉ）」がグループ化されていることから、ＣＰＵ１０は、音節ｃ４１と同じグループに属する音節である音節ｃ４２「い（ｉ）」をデータメモリ１８から読み出す。次いで、ＣＰＵ１０は、ステップＳ２３でキーオフ発音フラグをセットして、キーオフされた際に同じグループに属する次の音節「い（ｉ）」を発音させる準備をする。次のステップＳ２４では、ＣＰＵ１０は、テキストデータ３０は、カーソルを、「こ（ｋｏ）」と「い（ｉ）」が属するグループを越えて次の音節に進める。ただし、図示例の場合は次の音節がないことから、この処理はスキップされる。ステップＳ２４の処理が終了すると音節情報取得処理は終了し、キーオン処理のステップＳ１２にリターンする。

　ステップＳ１２の音声素片データ選択処理では、音源１３は、同じグループに属する音節「こ（ｋｏ）」および「い（ｉ）」に対応する音声素片データを選択する。すなわち、音源１３は、音節「こ（ｋｏ）」に対応する音声素片データとして、音素連鎖データ３２ａから「無音→子音ｋ」に対応する音声素片データ「＃－ｋ」と「子音ｋ→母音ｏ」に対応する音声素片データ「ｋ－ｏ」を選択すると共に、定常部分データ３２ｂから「母音ｏ」に対応する音声素片データ「ｏ」を選択する。また、音源１３は、音節「い（ｉ）」に対応する音声素片データとして、音素連鎖データ３２ａから「母音ｏ→母音ｉ」に対応する音声素片データ「ｏ－ｉ」を選択すると共に、定常部分データ３２ｂから「母音ｉ」に対応する音声素片データ「ｉ」を選択する。ステップＳ１３の発音処理では、同じグループに属する音節のうち、先頭の音節の発音が行われる。すなわち、音源１３は、ＣＰＵ１０の制御の基で、『「＃－ｋ」→「ｋ－ｏ」→「ｏ」』の音声素片データを順次発音する。その結果、音節ｃ４１である「こ（ｋｏ）」が発音される。発音の際には、キーオンｎ４の発音指示の受け付けの際に受け取ったＥ５の音高で、ベロシティ情報に応じた音量で「こ（ｋｏ）」の歌唱音が発音される。ステップＳ１３の発音処理が終了するとキーオン処理も終了する。

　図４は、このキーオン処理の動作を示す。ＣＰＵ１０は、時刻ｔ７で４番目のキーオンｎ４の発音指示を受け付ける（ステップＳ１０）。ＣＰＵ１０は、４番目の音節ｃ４１（および音節ｃ４１に埋め込まれまたは対応付けられているグループ化情報３１）を取得する。ＣＰＵ１０は、そのグループ化情報３１に基づいて、音節ｃ４１が別の音節とグループ化されていると判断する。ＣＰＵ１０は、音節ｃ４１と同じグループに属する音節ｃ４２を取得すると共にキーオフ発音フラグをセットする（ステップＳ１１）。次いで、音源１３は、音節ｃ４１，ｃ４２を発音する音声素片データ「＃－ｋ」，「ｋ－ｏ」，「ｏ」および音声素片データ「ｏ－ｉ」，「ｉ」を選択する（ステップＳ１２）。そして、音源１３は、キーオンｎ４のベロシティ情報に応じた音量のエンベロープＥＮＶ３を開始し、『「＃－ｋ」→「ｋ－ｏ」→「ｏ」』の音声素片データをＥ５の音高およびエンベロープＥＮＶ３の音量で発音させる（ステップＳ１３）。これにより、「こ（ｋｏ）」の歌唱音が発音される。エンベロープＥＮＶ３は、エンベロープＥＮＶ１と同様である。時刻ｔ８でキーオンｎ４にかかる鍵がキーオフされるまで「ｏ」の音声素片データが繰り返し再生される。そして、時刻ｔ８でキーオンｎ４がキーオフされたことがＣＰＵ１０で検出されると、図５に示すキーオフ処理をＣＰＵ１０がスタートする。

　音節ｃ４１，ｃ４２である「こ（ｋｏ）」および「い（ｉ）」がグループ化されていて、キーオフ発音フラグがセットされている。このため、キーオフ処理のステップＳ３０では、ＣＰＵ１０は、キーオフ発音フラグが設定されていると判断し（ステップＳ３０でＹｅｓ）、処理がステップＳ３１に進む。ステップＳ３１では、先に発音された音節と同じグループに属する次の音節の発音処理が行われる。すなわち、音源１３は、先に行ったステップＳ１２の音節情報取得処理において、音節「い（ｉ）」に対応する音声素片データとして選択された『「ｏ－ｉ」→「ｉ」』の音声素片データをＥ５の音高およびエンベロープＥＮＶ３のリリースカーブの音量で発音させる。これにより、ｃ４１の「こ（ｋｏ）」と同じ音高Ｅ５で音節ｃ４２である「い（ｉ）」の歌唱音が発音される。次いで、ステップＳ３２で消音処理が行われて、「い（ｉ）」の歌唱音の発音が停止される。すなわち、エンベロープＥＮＶ３のリリースカーブで「い（ｉ）」の歌唱音が消音されていく。なお、「こ（ｋｏ）」の発音は、発音が「い（ｉ）」に移行した時点において、停止されている。次いで、ステップＳ３３でキーオフ発音フラグをリセットしてキーオフ処理は終了する。

　以上説明したように、第１実施形態の発音装置１では、ユーザーのリアルタイム演奏に応じた歌唱音である歌声が発音されるようになると共に、リアルタイム演奏時に鍵を１回の押す操作を行うこと（すなわち、鍵を押してから離すまでの連続する１回の操作を行うこと、以下同様）により複数の歌声を発音することができる。すなわち、第１実施形態の発音装置１において、グループ化された音節は、鍵を１回押す操作で発音される音節の集合とされる。例えばグループ化されたｃ４１とｃ４２の音節は鍵を１回の押す操作で発音される。この場合、１音節目の音は鍵を押すことに応答して出力され、２音節目以降の音は鍵から離れることに応答して出力される。グループ化の情報は、キーオフにより次の音節を発音するか否かを決定する情報なので、「キーオフ発音情報（設定情報）」ということができる。キーオンｎ４にかかる鍵がキーオフされる前に、演奏操作子１６の他の鍵にかかるキーオン（キーオンｎ５とする）が行われた場合について説明する。この場合は、キーオンｎ４のキーオフ処理が行われたあとにキーオンｎ５の発音が行われる。すなわち、キーオンｎ４のキーオフ処理としてｃ４２の音節が発音された後に、キーオンｎ５に対応するｃ４２の次の音節が発音されるようになる。別法として、キーオンｎ５に対応する音節をすぐに発音させるために、キーオンｎ５の操作に応答して実行されるキーオンｎ４のキーオフ処理においては、ステップＳ３１の処理を省略してもよい。この場合、ｃ４２の音節は発音されず、キーオンｎ５に応じてすぐにｃ４２の次の音節の発音が行われるようになる。

　上記したように、先の音節ｃ４１と同じグループに属する次の音節ｃ４２の「い（ｉ）」の発音は、キーオンｎ４にかかる鍵がキーオフされたタイミングで発音される。このため、キーオフで発音指示された音節の発音長が短すぎて不明瞭になるおそれがある。図６Ａ～６Ｃは、同じグループに属する次の音節の発音を十分長くすることができるキーオフ処理の他の動作例を示す。
　図６Ａに示す例では、キーオンｎ４の発音指示により開始されるエンベロープＥＮＶ３において、減衰開始を、キーオフから所定時間ｔｄだけ遅らせるようにしている。すなわち、リリースカーブＲ１を一点鎖線で示すリリースカーブＲ２のように時間ｔｄだけ遅らせることで、同じグループに属する次の音節の発音長を十分長くすることができる。サスティンペダル等の操作によって、同じグループに属する次の音節の発音長を十分長くすることもできる。すなわち、図６Ａに示す例では、音源１３は、エンベロープＥＮＶ３の後半において、音節ｃ４１の音を一定の音量で出力させる。次に、音源１３は、音節ｃ４１の音の出力の停止に連続して音節ｃ４２の音の出力を開始させる。その際、音節ｃ４２の音の音量は、音節ｃ４１の消音直前の音量と同じである。音源１３は、所定時間ｔｄだけ音量を維持した後に、音節ｃ４２の音の音量の低下を開始する。
　図６Ｂに示す例では、エンベロープＥＮＶ３において、ゆっくり減衰させるようにしている。すなわち、リリースカーブを一点鎖線で示す傾斜を緩くしたリリースカーブＲ３を発生することで、同じグループに属する次の音節の発音長を十分長くすることができる。すなわち、図６Ｂに示す例では、音源１３は、音節ｃ４２の音を出力させない場合（音節ｃ４１が他の音節とグループ化されていない場合）における音節ｃ４１の音の音量の減衰速度よりも遅い減衰速度で音節ｃ４２の音の音量を低下させながら音節ｃ４２の音を出力させる。
　図６Ｃに示す例では、キーオフを新たなノートオン指示とみなし、同じ音高の新たなノートで次の音節を発音させる。すなわち、エンベロープＥＮＶ１０を、キーオフの時刻ｔ１３において開始して、同じグループに属する次の音節の発音を行う。これにより、同じグループに属する次の音節の発音長を十分長くすることができる。すなわち、図６Ｃに示す例では、音源１３は、音節ｃ４１の音の音量の低下を開始させることと同時に、音節ｃ４２の音の出力を開始させる。この際、音源１３は、音節ｃ４２の音の音量を増加させながら音節ｃ４２の音を出力させる。
　以上説明した本発明の第１実施形態の発音装置１では、歌詞が日本語の場合を例示している。日本語では、ほぼ１文字が１音節である。一方で、他の言語においては１文字が１音節とならない場合が多い。具体例として、英語の歌詞が「september」の場合について説明する。「september」は、「sep」、「tem」、「ber」の３音節からなる。よって、演奏操作子１６をユーザーが鍵を押す毎にその３の音節が、その鍵の音高で順次発音されていくようになる。この場合、「sep」および「tem」の２音節をグループ化することにより、１回の鍵を押す操作に応じて「sep」および「tem」の２音節が発音される。すなわち、鍵を押す操作に応じてその鍵の音高で「sep」の音節の音が出力される。また、鍵から離れる操作に応じて「tem」の音節がその鍵の音高で発音される。歌詞は日本語に限らず他の言語とされていても良い。

　次に、本発明の第２実施形態にかかる発音装置を説明する。第２実施形態の発音装置は、ハミング音や、スキャット、コーラスなどの歌唱音、または、通常の楽器音あるいは鳥のさえずりや電話のベルなどの効果音などの歌詞のない所定の音を発音する。第２実施形態の発音装置を発音装置１００と称する。第２実施形態の発音装置１００の構成は第１実施形態の発音装置１とほぼ同様である。しかしながら、第２実施形態は、音源１３の構成が第１実施形態と相違する。すなわち、第２実施形態の音源１３は上記した歌詞のない所定の音の音色を備えており、指定された音色に応じて歌詞のない所定の音を発音することができる。図７は、第２実施形態の発音装置１００の動作例を説明するための図である。
　第２実施形態の発音装置１００において、テキストデータ３０とグループ化情報３１からなる音節情報に替えてキーオフ発音情報４０がデータメモリ１８に格納されている。また、第２実施形態の発音装置１００は、ユーザーが演奏操作子１６を利用してリアルタイム演奏を行った際に歌詞のない所定の音を発音させる。第２実施形態の発音装置１００では、図２Ａに示すキーオン処理のステップＳ１１で、図２Ｂに示す音節情報取得処理に替えてキーオフ発音情報処理が行われる。また、ステップＳ１２の音声素片データ選択処理では、予め定められた音や音声を発音させる音源波形や音声素片データが選択される。以下にその動作を説明する。

　ＣＰＵ１０は、ユーザーがリアルタイム演奏を行うことによって演奏操作子１６がキーオンされたことを検出すると、図２Ａに示すキーオン処理をスタートする。図７の部分（ａ）に示す楽譜の楽曲の通りユーザーが演奏する場合について説明する。この場合、ＣＰＵ１０は、ステップＳ１０で最初のキーオンｎ１の発音指示を受け付け、Ｅ５の音高を示す音高情報と鍵速度に応じたベロシティ情報を受け取る。そして、ＣＰＵ１０は、図７の部分（ｂ）に示すキーオフ発音情報４０を参照して最初のキーオンｎ１に対応するキーオフ発音情報を取得する。この場合、ユーザーの演奏に先立って、特定のキーオフ発音情報４０が指定されている。この特定のキーオフ発音情報４０は、図７の部分（ａ）に示す楽譜に対応し、データメモリ１８に格納されている。また、指定されたキーオフ発音情報４０の最初のキーオフ発音情報が参照される。最初のキーオフ発音情報が「×」とされていることから、キーオンｎ１に対してはキーオフ発音フラグはセットされない。次いで、ステップＳ１２で音声素片データ選択処理を音源１３が行う。すなわち、音源１３は、予め定められた音声を発音させる音声素片データを選択する。具体例として、「ナ（ｎａ）」の音声を発音させる場合について説明する。以下において、「ナ（ｎａ）」は、日本語のカタカナの一文字を示す。音源１３は、音素連鎖データ３２ａから「＃－ｎ」と「ｎ－ａ」の音声素片データを選択すると共に、定常部分データ３２ｂから音声素片データ「ａ」を選択する。そして、ステップＳ１３でキーオンｎ１に対応する発音処理が行われる。この発音処理では、図７の部分（ｃ）に示すピアノロール譜４１で示すように、音源１３は、キーオンｎ１の検出の際に受け取ったＥ５の音高で、『「＃－ｎ」→「ｎ－ａ」→「ａ」』の音声素片データの発音が行われる。その結果、「ナ（ｎａ）」の歌唱音が発音される。この発音はキーオンｎ１がキーオフされるまで持続され、キーオフされると消音処理されて停止される。

　リアルタイム演奏の進行に伴いキーオンｎ２をＣＰＵ１０が検出すると、上記と同様の処理が行われる。キーオンｎ２に対応する２番目のキーオフ発音情報が「×」とされていることから、キーオンｎ２に対するキーオフ発音フラグはセットされない。図７の部分（ｃ）に示すようにＥ５の音高で予め定められた音声、例えば「ナ（ｎａ）」の歌唱音が発音される。キーオンｎ２の鍵がキーオフされる前にキーオンｎ３が検出されると、上記と同様の処理が行われる。キーオンｎ３に対応する３番目のキーオフ発音情報が「×」とされていることから、キーオンｎ３に対するキーオフ発音フラグはセットされない。図７の部分（ｃ）に示すようにＤ５の音高で予め定められた音声、例えば「ナ（ｎａ）」の歌唱音が発音される。この場合、キーオンｎ３に対応する発音は、キーオンｎ２に対応する発音に滑らかにつながるレガートとなる。また、キーオンｎ３に対応する発音の開始と同時にキーオンｎ２に対応する発音が停止される。さらに、キーオンｎ３の鍵がキーオフされると、キーオンｎ３に対応する発音は消音処理されて停止される。

　さらなる演奏の進行に伴いキーオンｎ４をＣＰＵ１０が検出すると、上記と同様の処理が行われる。キーオンｎ４に対応する４番目のキーオフ発音情報が「○」とされていることから、キーオンｎ４に対するキーオフ発音フラグがセットされる。図７の部分（ｃ）に示すようにＥ５の音高で予め定められた音声、例えば「ナ（ｎａ）」の歌唱音が発音される。キーオンｎ４がキーオフされると、キーオンｎ２に対応する発音は消音処理されて停止される。しかしながら、キーオフ発音フラグがセットされていることから、ＣＰＵ１０が図７の部分（ｃ）に示すキーオンｎ４’が新たに行われたと判断し、音源１３がキーオンｎ４’に対応する発音をキーオンｎ４と同じ音高で行う。すなわち、Ｅ５の音高で予め定められた音声、例えば「ナ（ｎａ）」の歌唱音が、キーオンｎ４の鍵がキーオフされた時に発音される。この場合、キーオンｎ４’に対応する発音長は、予め決められた長さとされる。

　上記した第１実施形態にかかる発音装置１では、ユーザーが鍵盤等の演奏操作子１６を利用してリアルタイム演奏した際に、演奏操作子１６を押す操作を行う毎にテキストデータ３０の音節が、その演奏操作子１６の音高で発音される。テキストデータ３０は、指定された歌詞を音節に区切ったテキストデータである。これにより、リアルタイム演奏時に指定された歌詞が歌われる。歌唱される歌詞の音節をグループ化することにより、演奏操作子１６に対する１回の連続する操作により、１音節目と２音節目とを演奏操作子１６の音高で発音させることができる。すなわち、演奏操作子１６を押すことに応じて１音節目を演奏操作子１６にかかる音高で発音させる。また、演奏操作子１６から離れる操作に応じて２音節目を演奏操作子１６にかかる音高で発音させる。
　上記した第２実施形態にかかる発音装置１００では、歌詞による歌唱音に替えて上記した歌詞のない所定の音を押鍵された鍵の音高で発音することができる。よって、第２実施形態にかかる発音装置１００は、カラオケのガイドなどに適用することができる。この場合も、演奏操作子１６に対する１回の連続する操作に含まれる、演奏操作子１６を押す操作と、演奏操作子１６をから離れる操作とのにそれぞれに応じて、歌詞のない所定の音を発音させることができる。

　次に、本発明にかかる第３実施形態の発音装置２００について説明する。第３実施形態の発音装置２００では、ユーザーが鍵盤等の演奏操作子１６を利用してリアルタイム演奏した際に、表情豊かな歌声の演奏を行うことができる。第３実施形態の発音装置２００のハードウェア構成は図１に示す構成と同じである。第３実施形態では、第１実施形態と同様に、図２Ａに示すキーオン処理が実行される。ただし、第３実施形態では、このキーオン処理におけるステップＳ１１の音節情報取得処理の内容が、第１実施形態とは異なる。具体的には、第３実施形態では、ステップＳ１１の音節情報取得処理として図８に示すフローチャートが実行される。図９Ａは、第３実施形態の発音装置２００によって実行される発音指示受付処理を説明するための図である。図９Ｂは、第３実施形態の発音装置２００によって実行される音節情報取得処理を説明するための図である。図１０は、歌詞情報テーブルの「値ｖ１」～「値ｖ３」を示す。図１１は、第３実施形態の発音装置２００の動作例を示す。これらの図を参照しながら第３実施形態の発音装置２００を説明する。
　第３実施形態の発音装置２００において、ユーザーがリアルタイム演奏を行う場合、演奏操作子１６を操作して演奏を行う。演奏操作子１６は鍵盤等である。演奏の進行に伴い演奏操作子１６がキーオンされたことをＣＰＵ１０が検出すると、図２Ａに示すキーオン処理をスタートする。キーオン処理のステップＳ１０の発音指示受付処理およびステップＳ１１の音節情報取得処理はＣＰＵ１０が実行する。ステップＳ１２の音声素片データ選択処理およびステップＳ１３の発音処理はＣＰＵ１０の制御の基で音源１３が実行する。

　キーオン処理のステップＳ１０では、操作された演奏操作子１６のキーオンに基づく発音指示を受け付ける。この場合、ＣＰＵ１０はキーオンのタイミング、操作された演奏操作子１６の音高情報およびベロシティなどの演奏情報を受け取る。図９Ａに示す楽譜の楽曲の通りユーザーが演奏した場合は、最初のキーオンｎ１のタイミングを受け付ける時に、ＣＰＵ１０はＥ５の音高を示す音高情報と鍵速度に応じたベロシティ情報を受け取る。次いで、ステップＳ１１にて、キーオンｎ１に対応する音節情報を取得する音節情報取得処理を行う。図８は、この音節情報取得処理のフローチャートを示す。図８に示す音節情報取得処理がスタートされると、ＣＰＵ１０はステップＳ４０においてカーソル位置の音節を取得する。この場合、ユーザーの演奏に先立って、歌詞情報テーブル５０が指定されている。歌詞情報テーブル５０は、データメモリ１８に格納されている。歌詞情報テーブル５０は、演奏に対応する楽譜に対応する歌詞を音節に区切ったテキストデータを含む。この歌詞は、図９Ａに示す楽譜に対応する歌詞である。また、指定された歌詞情報テーブル５０のテキストデータの先頭の音節にカーソルが置かれている。次いで、ＣＰＵ１０は、ステップＳ４１において、取得した先頭のテキストデータの音節に対応付けられた発音制御パラメータ（制御パラメータの一例）を歌詞情報テーブル５０を参照して取得する。図９Ｂは、図９Ａに示す楽譜に対応する歌詞情報テーブル５０を示す。

　第３実施形態の発音装置２００においては、歌詞情報テーブル５０が特徴的な構成である。図９Ｂに示すように歌詞情報テーブル５０は、音節情報５０ａと、発音制御パラメータタイプ５０ｂと、発音制御パラメータの値情報５０ｃとから構成されている。音節情報５０ａは、歌詞を音節に区切ったテキストデータを含む。発音制御パラメータタイプ５０ｂは、各種パラメータタイプのいずれかを指定する。発音制御パラメータは、発音制御パラメータタイプ５０ｂと発音制御パラメータの値情報５０ｃとを含む。図９Ｂに示す例では、音節情報５０ａは、図３Ｂに示すテキストデータ３０と同様のｃ１，ｃ２，ｃ３，ｃ４１の歌詞を区切った音節からなる。発音制御パラメータタイプ５０ｂとして、一音節ごとに、パラメータａ，ｂ，ｃ，ｄの何れか一つあるいは複数が設定されている。この発音制御パラメータタイプの具体例は、「Harmonics」、「Brightness」、「Resonance」および「GenderFactor」である。「Harmonics」は、声に含まれる倍音成分のバランスを変化させるタイプのパラメータである。「Brightness」は、声の明暗を演出してトーン変化を与えるタイプのパラメータである。「Resonance」は、有声音の音色や強弱を演出するタイプのパラメータである。「GenderFactor」は、フォルマントを変化させることにより、女性的なあるいは男性的な声の太さや質感を変化させるタイプのパラメータである。値情報５０ｃは、発音制御パラメータの値を設定するための情報であり、「値ｖ１」と「値ｖ２」と「値ｖ３」と含む。「値ｖ１」は発音制御パラメータの時間上の変化のしかたを設定し、グラフ形状（波形）で表すことができる。図１０の部分（ａ）は、グラフ形状で表した「値ｖ１」の例を示す。図１０の部分（ａ）は、「値ｖ１」として、グラフ形状ｗ１～ｗ６を示している。グラフ形状ｗ１～ｗ６は、それぞれ異なる時間上の変化をしている。「値ｖ１」は、グラフ形状ｗ１～ｗ６に限られない。「値ｖ１」として、種々の時間上の変化をするグラフ形状（値）を設定することができる。「値ｖ２」は、図１０の部分（ｂ）に示すようにグラフ形状で示す「値ｖ１」の横軸の時間を設定するための値である。「値ｖ２」を設定することにより、効果のかかり始めからかかり終わりまでの時間となる変化の速度を設定できる。「値ｖ３」は、図１０の部分（ｂ）に示すようにグラフ形状で示す「値ｖ１」の縦軸の振幅を設定するための値である。「値ｖ３」を設定することにより、効果のかかる度合いを示す変化の深さを設定できる。値情報５０ｃで設定される発音制御パラメータの値の設定可能範囲は、発音制御パラメータタイプにより異なっている。ただし、音節情報５０ａで指定される音節は、発音制御パラメータタイプ５０ｂおよびその値情報５０ｃが設定されていない音節を含んでもよい。例えば、図１１に示す音節ｃ３には発音制御パラメータタイプ５０ｂおよびその値情報５０ｃが設定されていない。この歌詞情報テーブル５０の音節情報５０ａ、発音制御パラメータタイプ５０ｂ、値情報５０ｃは、ユーザーの演奏に先立って作成およびまたは編集されて、データメモリ１８に格納されている。

　説明をステップＳ４１に戻す。なお、最初のキーオンｎ１の時には、ＣＰＵ１０は、ステップＳ４０でｃ１の音節を取得する。よって、ステップＳ４１では、ＣＰＵ１０は、歌詞情報テーブル５０から音節ｃ１に対応付けられた発音制御パラメータタイプと値情報５０ｃとを取得する。すなわち、ＣＰＵ１０は、音節情報５０ａのｃ１の横の段に設定されているパラメータａ，パラメータｂを発音制御パラメータタイプ５０ｂとして取得し、詳細情報の図示が省略されている「値ｖ１」～「値ｖ３」を値情報５０ｃとして取得する。ステップＳ４１の処理が終了すると処理がステップＳ４２に進む。ステップＳ４２では、ＣＰＵ１０がテキストデータの次の音節にカーソルを進めることにより、２音節目のｃ２にカーソルが置かれる。ステップＳ４２の処理が終了すると音節情報取得処理は終了し、キーオン処理のステップＳ１２にリターンする。ステップＳ１２の音節情報取得処理では、上記したように、取得された音節ｃ１を発音させる音声素片データが音韻データベース３２から選択される。次に、ステップＳ１３の発音処理において、選択された音声素片データの発音が順次音源１３によって行われる。その結果、ｃ１の音節の発音が行われる。発音の際には、キーオンｎ１の受付の際に受け取ったＥ５の音高およびベロシティ情報に応じた音量で音節ｃ１の歌唱音が発音される。ステップＳ１３の発音処理が終了するとキーオン処理も終了する。

　図１１の部分（ｃ）は、ピアノロール譜５２を示す。このステップＳ１３の発音処理では、ピアノロール譜５２に示すように、音源１３は、キーオンｎ１の検出の際に受け取ったＥ５の音高で、選択された音声素片データの発音を行う。その結果、音節ｃ１の歌唱音が発音される。この発音の際に、「値ｖ１」、「値ｖ２」、「値ｖ３」で設定されたパラメータａと、「値ｖ１」、「値ｖ２」、「値ｖ３」で設定されたパラメータｂの異なる２つの発音制御パラメータタイプ、すなわち、２つの異なる態様により、歌唱音の発音制御が行われる。よって、歌唱される歌声の表情や抑揚、声質や音色に変化を与えることができ、歌声に細かなニュアンスや抑揚をつけられるようになる。

　そして、リアルタイム演奏の進行に伴いキーオンｎ２をＣＰＵ１０が検出すると、上記と同様の処理が行われて、キーオンｎ２に対応する２番目の音節ｃ２がＥ５の音高で発音される。音節ｃ２には図９の部分（ｂ）で示すように、発音制御パラメータタイプ５０ｂとしてパラメータｂとパラメータｃとパラメータｄの３つの発音制御パラメータタイプが対応付けられていると共に、それぞれの発音制御パラメータタイプはそれぞれの「値ｖ１」、「値ｖ２」、「値ｖ３」で設定されている。このため、音節ｃ２の発音の際に、図１１の部分（ｃ）にピアノロール譜５２で示すように、パラメータｂとパラメータｃとパラメータｄの異なる３つの発音制御パラメータタイプにより、歌唱音の発音制御が行われる。これにより、歌唱される歌声の表情や抑揚、声質や音色に変化を与えられる。
　リアルタイム演奏の進行に伴いキーオンｎ３をＣＰＵ１０が検出すると、上記と同様の処理が行われて、キーオンｎ３に対応する３番目の音節ｃ３がＤ５の音高で発音される。音節ｃ３には図９Ｂに示すように、発音制御パラメータタイプ５０ｂが設定されていない。このため、音節ｃ３の発音の際には、図１１の部分（ｃ）にピアノロール譜５２で示すように、発音制御パラメータによる歌唱音の発音制御が行われない。

　リアルタイム演奏の進行に伴いキーオンｎ４をＣＰＵ１０が検出すると、上記と同様の処理が行われて、キーオンｎ４に対応する４番目の音節ｃ４１がＥ５の音高で発音される。図９Ｂで示すように、音節ｃ４１の発音の際には、音節ｃ４１に対応付けられている発音制御パラメータタイプ５０ｂ（図示略）および値情報５０ｃ（図示略）に応じた発音制御が行われる。
　上記した第３実施形態にかかる発音装置２００では、ユーザーが鍵盤等の演奏操作子１６を利用してリアルタイム演奏した際に、演奏操作子１６を押す操作を行う毎に指定されたテキストデータの音節が、その演奏操作子１６の音高で発音される。テキストデータを歌詞とすることで歌声が発音される。この際に、音節毎に対応付けられた発音制御パラメータにより発音制御が行われる。このため、歌唱される歌声の表情や抑揚、声質や音色に変化を与えることができ、歌声に細かなニュアンスや抑揚をつけられるようになる。
　第３実施形態にかかる発音装置２００における歌詞情報テーブル５０の音節情報５０ａを、図３Ｂに示すように歌詞を区切った音節のテキストデータ３０とそのグループ化情報３１とからなるようにする場合について説明する。この場合、グループ化された音節を演奏操作子１６に対する１回の連続する操作により、演奏操作子１６の音高で発音させることができる。すなわち、演奏操作子１６を押すことに応じて１音節目を演奏操作子１６の音高で発音させる。また、演奏操作子１６から離れる操作に応じて２音節目を演奏操作子１６の音高で発音させる。この際に、音節毎に対応付けられた発音制御パラメータにより発音制御が行われる。このため、歌唱される歌声の表情や抑揚、声質や音色に変化を与えることができ、歌声に細かなニュアンスや抑揚をつけられるようになる。
　第３実施形態の発音装置２００は、第２実施形態の発音装置１００で発音される上記した歌詞のない所定の音を発音することができる。第３実施形態の発音装置２００で上記した歌詞のない所定の音を発音する場合には、音節情報に応じて、取得する発音制御パラメータを決定するのではなく、何回目の押鍵操作であるかに応じて取得する発音制御パラメータを決定するようにすればよい。
　第３実施形態において、音高は、操作された演奏操作子１６（押された鍵）に応じて指定されている。別法として、音高は、演奏操作子１６が操作された順番に応じて指定されてもよい。
　第３実施形態の第１の変形例について説明する。この変形例では、データメモリ１８が、図１２に示す歌詞情報テーブル５０を格納している。歌詞情報テーブル５０は、複数の制御パラメータ情報（制御パラメータの一例）、すなわち、第１から第ｎ制御パラメータ情報を含む。例えば、第１制御パラメータ情報は、パラメータａと値ｖ１～ｖ３の組み合わせ、および、パラメータｂと値ｖ１～ｖ３の組み合わせを含む。複数の制御パラメータ情報はそれぞれ異なる順番に対応付けられている。例えば、第１制御パラメータ情報は、第１の順番に対応づけられている。第２制御パラメータ情報は、第２の順番に対応づけられている。ＣＰＵ１０は、第１番目（１回目）のキーオンを検出した場合、歌詞情報テーブル５０から、第１の順番に対応付けられた第１制御パラメータ情報を読み出す。音源１３は、読み出された第１制御パラメータ情報に従った態様で音を出力する。同様に、ＣＰＵ１０は、第ｎ番目（ｎ回目）のキーオンを検出した場合、歌詞情報テーブル５０から、第ｎの順番に対応付けられた第ｎ制御パラメータ情報に関連付けられた発音制御パラメータ情報を読み出す。音源１３は、読み出された第ｎ制御パラメータ情報に従った態様で音を出力する。
　第３実施形態の第２の変形例について説明する。この変形例では、データメモリ１８が、図１３に示す歌詞情報テーブル５０を格納している。歌詞情報テーブル５０は、複数の制御パラメータ情報を含む。複数の制御パラメータ情報はそれぞれ異なる音高に対応付けられている。例えば、第１制御パラメータ情報は、音高Ａ５に対応づけられている。第２制御パラメータ情報は、音高Ｂ５に対応づけられている。ＣＰＵ１０は、音高Ａ５にかかる鍵のキーオンを検出した場合、データメモリ１８から、音高Ａ５に対応付けられた第１パラメータ情報を読み出す。音源１３は、読み出された第１制御パラメータ情報に従った態様かつ音高Ａ５で音を出力する。同様に、ＣＰＵ１０は、音高Ｂ５にかかる鍵のキーオンを検出した場合、データメモリ１８から、音高Ｂ５に対応付けられた第２制御パラメータ情報を読み出す。音源１３は、読み出された第２制御パラメータ情報に従った態様かつ音高Ｂ５で音を出力する。
　第３実施形態の第３の変形例について説明する。この変形例では、データメモリ１８が、図１４に示すテキストデータ３０を格納している。テキストデータ３０は、複数の音節、すなわち、第１の音節「い（ｉ）」、第２の音節「ろ（ｒｏ）」および第３の音節「は（ｈａ）」を含む。以下において、「い（ｉ）」、「ろ（ｒｏ）」および「は（ｈａ）」各々は、日本語のひらがなの一文字を示し、音節の一例である。第１の音節である「い（ｉ）」は、第１の順番に対応づけられている。第２の音節である「ろ（ｒｏ）」は、第２の順番に対応づけられている。第３の音節である「は（ｈａ）」は、第３の順番に対応づけられている。データメモリ１８は、さらに、図１５に示す歌詞情報テーブル５０を格納している。歌詞情報テーブル５０は、複数の制御パラメータ情報を含む。複数の制御パラメータ情報は、それぞれ異なる音節に対応付けられている。例えば、第２制御パラメータ情報は、音節「い（ｉ）」に対応づけられている。第２６制御パラメータ情報(不図示)は、音節「は（ｈａ）」に対応づけられている。第４５制御パラメータ情報は、「ろ（ｒｏ）」に対応づけられている。ＣＰＵ１０は、第１番目（１回目）のキーオンを検出した場合、テキストデータ３０から、第１の順番に対応付けられた「い（ｉ）」を読み出す。また、ＣＰＵ１０は、歌詞情報テーブル５０から、「い（ｉ）」に対応付けられた第２制御パラメータ情報を読み出す。音源１３は、読み出された第２制御パラメータ情報に従った態様で「い（ｉ）」を示す歌唱音を出力する。同様に、ＣＰＵ１０は、第２番目（２回目）キーオンを検出した場合、テキストデータ３０から、第２の順番に対応付けられた「ろ（ｒｏ）」を読み出す。また、ＣＰＵ１０は、歌詞情報テーブル５０から、「ろ（ｒｏ）」に対応付けられた第４５制御パラメータ情報を読み出す。音源１３は、第４５制御パラメータ情報に従った態様で「ろ（ｒｏ）」を示す歌唱音を出力する。

　以上説明した本発明の実施形態にかかるキーオフ発音情報は、音節情報の中に含むことに替えて、音節情報とは別に記憶されていてもよい。この場合、キーオフ発音情報は、何回目に鍵が押された場合にキーオフ発音を実行するかを記述したデータであってもよい。キーオフ発音情報は、演奏時にリアルタイムでユーザーの指示により発生される情報であってもよい。例えば、ユーザーが鍵を押している間にペダルを踏んだときのみ、そのノートに対してキーオフ発音を実行してもよい。鍵が押されている時間が所定長を超えたときにキーオフ発音を実行してもよい。また、押鍵ベロシティが所定値を超えたときにキーオフ発音を実行してもよい。
　以上説明した本発明の実施形態にかかる発音装置は、歌詞または歌詞のない歌唱音を発音すること、および、楽器音や効果音などの歌詞のない所定の音を発音することができる。また、本発明の実施形態にかかる発音装置は、歌唱音を含む所定の音を発音することができる。
　以上説明した本発明の実施形態にかかる発音装置において歌詞を発音させる際に、歌詞をほぼ１文字１音節となる日本語を例に上げて説明した。しかしながら、本発明の実施形態はこのような場合に限定されない。１文字が１音節とならない他の言語の歌詞を音節毎に区切って、本発明の実施形態にかかる発音装置で上記したように発音させることにより、他の言語の歌詞を歌唱させるようにしても良い。
　また、以上説明した本発明の実施形態にかかる発音装置において、演奏操作子に替えて、演奏データ発生装置を用意し、演奏データ発生装置から演奏情報を発音装置に順次与えるようにしても良い。

　以上に示した実施形態に係る歌唱音発音装置１、１００、２００の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、処理を行ってもよい。

　ここでいう「コンピュータシステム」は、オペレーティング・システム（ＯＳ：Ｏｐｅｒａｔｉｎｇ　Ｓｙｓｔｅｍ）や周辺機器等のハードウェアを含んでもよい。
　「コンピュータ読み取り可能な記録媒体」は、フレキシブルディスク、光磁気ディスク、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、フラッシュメモリ等の書き込み可能な不揮発性メモリ、ＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｋ）等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置を含む。

　「コンピュータ読み取り可能な記録媒体」は、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ（例えばＤＲＡＭ（Ｄｙｎａｍｉｃ　Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ））のように、一定時間プログラムを保持しているものも含む。
　上記のプログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク（通信網）や電話回線等の通信回線（通信線）のように情報を伝送する機能を有する媒体のことをいう。
　上記のプログラムは、前述した機能の一部を実現するためのものであってもよい。
　上記のプログラムは、前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル（差分プログラム）であってもよい。

１，１００，２００　発音装置
１０　ＣＰＵ
１１　ＲＯＭ
１２　ＲＡＭ
１３　音源
１４　サウンドシステム
１５　表示部
１６　演奏操作子
１７　設定操作子
１８　データメモリ
１９　バス
３０　テキストデータ
３１　グループ化情報
３２　音韻データベース
３２ａ　音素連鎖データ
３２ｂ　定常部分データ
４０　キーオフ発音情報
４１　ピアノロール譜
５０　歌詞情報テーブル
５０ａ　音節情報
５０ｂ　発音制御パラメータタイプ
５０ｃ　値情報
５２　ピアノロール譜

Claims

　音の出力の開始を示す開始指示を受け付ける受付部と、
　前記開始指示が受け付けられたことに応答して、前記音の出力態様を決定する制御パラメータを読み出す読出部と、
　前記読み出された制御パラメータに従った態様で前記音を出力させる制御部と、
　を備える音制御装置。
　音節を示す音節情報、および前記音節情報に対応付けられた前記制御パラメータを記憶する記憶部をさらに備え、
　前記読出部は、前記記憶部から、前記音節情報および前記制御パラメータを読み出し、
　前記制御部は、前記読み出された制御パラメータに従った態様で、前記音節を示す歌唱音を前記音として出力させる
　請求項１に記載の音制御装置。
　前記制御部は、前記制御パラメータに従った態様かつある音高で前記歌唱音を出力させる
　請求項２に記載の音制御装置。
　前記音節は、一つ以上の文字である
　請求項２に記載の音制御装置。
　前記一以上の文字は、日本語の仮名である
　請求項４に記載の音制御装置。
　互いに異なる複数の順番にそれぞれ対応付けられた複数の制御パラメータを記憶する記憶部をさらに備え、
　前記受付部は、前記開始指示を含む複数の開始指示を順番に受け付け、
　前記読出部は、前記記憶部から、前記制御パラメータとして、前記複数の制御パラメータのうち、前記開始指示が受け付けられた順番に対応付けられた制御パラメータを読み出す、
　請求項１に記載の音制御装置。
　互いに異なる複数の音高にそれぞれ対応付けられた複数の制御パラメータを記憶する記憶部をさらに備え、
　前記開始指示は、音高を示す音高情報を含み、
　前記読出部は、前記記憶部から、前記制御パラメータとして、前記複数の制御パラメータのうち、前記音高情報によって示される音高に対応付けられた制御パラメータを読み出し、
　前記制御部は、前記制御パラメータに従った態様かつ前記音高で前記音を出力させる
　請求項１に記載の音制御装置。
　ユーザからの操作を受け付けるとともに互いに異なる複数の音高にそれぞれ対応付けられた複数の操作子をさらに備え、
　前記受付部は、前記複数の操作子のうちの任意の一つの操作子に対するユーザからの操作を受け付けた場合に、前記開始指示を受け付けたと判断し、
　前記制御部は、前記読み出された制御パラメータに従った態様かつ前記一つの操作子に対応付けられている音高で前記音を出力させる
　請求項１に記載の音制御装置。
　互いに異なる複数の音にそれぞれ対応付けられた複数の制御パラメータを記憶する記憶部をさらに備え、
　前記読出部は、前記記憶部から、前記制御パラメータとして、前記複数の制御パラメータのうち、前記音に対応付けられた制御パラメータを読み出す、
　請求項１に記載の音制御装置。
　互いに異なる複数の音、および前記複数の音にそれぞれ対応付けられた複数の制御パラメータを記憶する記憶部をさらに備え、
　前記読出部は、前記記憶部から、前記制御パラメータとして、前記複数の制御パラメータのうち、前記音に対応付けられた制御パラメータを読み出す、
　請求項１に記載の音制御装置。
　互いに異なる複数の順番に対応付けられた複数の音、および前記複数の音にそれぞれ対応付けられた複数の制御パラメータを記憶する記憶部をさらに備え、
　前記受付部は、前記開始指示を含む複数の開始指示を順番に受け付け、
　前記読出部は、前記記憶部から、前記音として、前記複数の音のうち、前記開始指示が受け付けられた順番に対応付けられた音を読み出し、
　前記読出部は、前記記憶部から、前記制御パラメータとして、前記複数の制御パラメータのうち、前記音に対応付けられた制御パラメータを読み出す、
　請求項１に記載の音制御装置。
　前記制御部は、前記音として、音節、文字、または日本語の仮名を示す歌唱音を出力させる
　請求項９から１１のいずれか一項に記載の音制御装置。
　前記制御パラメータは、編集可能である
　請求項１に記載の音制御装置。
　前記制御パラメータは、それぞれ種類の異なる第１および第２制御パラメータを含み、
　前記制御部は、前記１の制御パラメータに従った第１態様で前記音を出力させることと同時に前記２制御パラメータに従った第２態様で前記音を出力させ、
　前記第１態様と前記第２態様とは互いに異なる
　請求項１に記載の音制御装置。
　前記制御パラメータは、音の変化のタイプを示す情報を含む
　請求項１に記載の音制御装置。
　前記音の変化のタイプは、
　声に含まれる倍音成分のバランスを変化させるタイプと、
　声の明暗を演出してトーン変化を与えるタイプと、
　有声音の音色および強弱を演出するタイプと、
　フォルマントを変化させることにより、女性的なあるいは男性的な声の太さおよび質感を変化させるタイプと、
　のうちの一つである
　請求項１５に記載の音制御装置。
　前記制御パラメータは、前記音の変化のしかたを示す値、前記音の変化の大きさを示す値、前記および音の変化の深さを示す値をさらに含む
　請求項１５または１６に記載の音制御装置。
　音の出力の開始を示す開始指示を受け付け、
　前記開始指示が受け付けられたことに応答して、前記音の出力態様を決定する制御パラメータを読み出し、
　前記読み出された制御パラメータに従った態様で前記音を出力させる、
　ことを含む音制御方法。
　コンピュータに、
　音の出力の開始を示す開始指示を受け付け、
　前記開始指示が受け付けられたことに応答して、前記音の出力態様を決定する制御パラメータを読み出し、
　前記読み出された制御パラメータに従った態様で前記音を出力させる、
　ことを実行させる音制御プログラム。